Por qué es importante: La carrera armamentista de CPU se está calentando, y la empresa estadounidense de semiconductores sin fábrica Ampere Computing también se está lanzando al ruedo. La compañía ha anunciado su hoja de ruta para el próximo año y en el centro de todo está la presentación de un monstruoso procesador de 256 núcleos, el AmpereOne.
AmpereOne es un chip compatible con Arm diseñado para cargas de trabajo nativas de la nube, inferencia de IA, bases de datos, servidores web y entrega de medios. Su objetivo es lograr un equilibrio entre alto rendimiento y eficiencia energética.
La compañía ya comenzó a distribuir sus procesadores AmpereOne de 192 núcleos, que cuentan con un subsistema de memoria DDR5 de 8 canales presentado hace un año. A finales de este año, la compañía planea presentar una CPU AmpereOne actualizada de 192 núcleos con memoria DDR5 de 12 canales más potente. Esta mejora requerirá el lanzamiento de una plataforma completamente nueva, sentando las bases para la eventual transición a una variante de 256 núcleos el próximo año.
Ampere afirma que el chip de 256 núcleos será fabricado en la vanguardia de TSMC proceso de 3 nm nodo y ofrece un aumento de rendimiento del 40 por ciento en comparación con cualquier otra CPU actualmente en el mercado. La compañía ha diseñado varias características nuevas para un rendimiento eficiente, administración de memoria, almacenamiento en caché y capacidades informáticas de IA.
Curiosamente, la unidad de 256 núcleos utilizará la misma solución de refrigeración que las ofertas existentes de Ampere, lo que implica un TDP de alrededor de 350 vatios. Es una hazaña impresionante, considerando la gran cantidad de núcleos incluidos en el chip.
La adopción de las CPU AmpereOne ha sido fenomenal. Ampere afirma que superan a Genoa de AMD en un 50 por ciento y a Bérgamo en un 15 por ciento en términos de rendimiento por vatio. Por lo tanto, para los centros de datos que buscan consolidar y actualizar una infraestructura antigua, AmpereOne promete hasta un 34 por ciento más de rendimiento por rack.
Ampere también está desarrollando servidores de inferencia de IA impulsados por los aceleradores Cloud AI 100 del gigante de los semiconductores Qualcomm. La asociación tiene como objetivo abordar las exigentes cargas de trabajo de grandes modelos de lenguaje y aplicaciones de inteligencia artificial generativa.
Las pruebas han demostrado que el modelo de lenguaje Llama 3 de Meta se ejecuta en CPU Ampere en Oracle Cloud. Curiosamente, los datos de rendimiento muestran que ejecutar Llama 3 en una CPU Ampere Altra de 128 núcleos, sin una GPU dedicada, ofrece el mismo rendimiento que una GPU Nvidia A10 emparejada con una CPU x86, todo ello consumiendo un tercio de la energía.
Finalmente, Ampere formó el grupo de trabajo UCIe (Universal Chiplet Interconnect Express) como parte de AI Platform Alliance. Este movimiento tiene como objetivo aprovechar la flexibilidad de las CPU de Ampere al permitir la integración de la IP del cliente en futuros procesadores utilizando la interfaz abierta UCIe.