Computación de amperios es una startup que está causando sensación en la industria tecnológica al desafiar el dominio de gigantes tecnológicos como AMD, NVIDIAy Intel. Con el auge de la IA, la demanda de potencia informática se ha disparado, junto con los costos de la energía y la demanda de las redes eléctricas. Ampere pretende solucionar este problema con una solución de bajo consumo y alto rendimiento.
A pesar de ser el perdedor, la oferta de Ampere ha sido adoptada por casi todos los principales hiperescaladores del mundo. Ha superado el muro de escalamiento varias veces con sus CPU y la compañía planea continuar escalando de maneras que las arquitecturas heredadas no pueden. Hablamos con el CPO de Ampere, Jeff Wittich, sobre el éxito de su empresa y sus planes futuros.
A veces siento que las nuevas empresas desafiantes, como Ampere Computing, están atrapadas entre la espada y la pared. Por un lado, tenemos empresas multimillonarias como AMD, Nvidia e Intel y, por el otro, hiperescaladores como Microsoft, Google y Amazon que tienen sus propias ofertas. ¿Qué se siente ser el pequeño mamífero en la tierra de los dinosaurios?
Es realmente un momento emocionante para Ampere. Puede que solo tengamos seis años, pero como predijimos cuando iniciamos la empresa, la necesidad de una nueva solución informática para la nube nunca ha sido tan fuerte. La industria no necesita más dinosaurios: necesita algo nuevo.
Las necesidades de la nube han cambiado. La cantidad de potencia informática necesaria para el mundo conectado de hoy es mucho mayor de lo que nadie podría haber imaginado y seguirá creciendo con el auge de la IA. Al mismo tiempo, los costos de la energía se han disparado, la demanda en las redes eléctricas del mundo está superando la oferta y la construcción de nuevos centros de datos se está deteniendo por diversas razones. La convergencia de estos factores ha creado la oportunidad perfecta para que Ampere proporcione una solución muy necesaria de bajo consumo y alto rendimiento que no ha sido ofrecida por los grandes actores tradicionales.
Gracias a nuestra capacidad para ofrecer esto, hemos crecido rápidamente y hemos sido adoptados por casi todos los grandes hiperescaladores del mundo. También estamos viendo una mayor adopción en la empresa, ya que las empresas buscan aprovechar al máximo el espacio de su centro de datos existente. El aumento de la demanda que seguimos viendo de productos Ampere nos hace confiar en que la industria reconoce nuestro valor.
Ampere ha sido líder en alto número de núcleos en el mercado de CPU para servidores durante algunos años. Sin embargo, otros (AMD e Intel) se han ido poniendo al día; Dadas las leyes inmutables de la física, ¿cuándo prevé chocar contra un muro en lo que respecta a los núcleos físicos y cómo planea atravesarlo?
Como mencionó, Ampere ha sido líder en computación densa, eficiente y con un alto número de núcleos durante los últimos años. Desde el principio, identificamos dónde surgirían los desafíos clave para el crecimiento de la nube y hoy estamos abordando esos desafíos exactos con nuestras CPU Ampere. Nuestras CPU Ampere son perfectas para casos de uso de la nube de todo tipo y en una amplia gama de cargas de trabajo.
Hemos superado el muro de escalamiento varias veces, siendo los primeros en 128 núcleos y ahora en 192 núcleos. Una innovación como esta requiere un nuevo enfoque que rompa las limitaciones heredadas. El nuevo enfoque de Ampere para el diseño de CPU, desde la microarquitectura hasta el conjunto de funciones, nos permitirá continuar escalando de maneras que las arquitecturas heredadas no pueden.
Otra amenaza creíble que se vislumbra en el horizonte es el surgimiento de RISC-V, con China poniendo su peso detrás de la microarquitectura. ¿Cuáles son sus puntos de vista personales en ese frente? ¿Podría Ampere unirse al equipo RISC algún día?
La estrategia central de Ampere es desarrollar procesadores sustentables para impulsar la computación tanto hoy como en el futuro. Construiremos nuestras CPU utilizando las mejores tecnologías disponibles para ofrecer rendimiento, eficiencia y escalabilidad líderes, siempre que nuestros clientes puedan utilizar esas tecnologías fácilmente para ejecutar el rendimiento deseado. sistemas operativossoftware de infraestructura y aplicaciones de usuario.
¿Qué puedes decirnos sobre la continuación de Ampere One? ¿Seguirá la misma trayectoria que Altra > One? ¿Más núcleos? ¿Misma frecuencia, más caché L2 por núcleo? ¿Se llamará Ampere 2 y seguirá siendo de un solo subproceso?
Durante los próximos años, continuaremos enfocándonos en lanzar CPU que sean más eficientes y que brinden un mayor número de núcleos, así como más ancho de banda de memoria y capacidades de E/S. Esto nos brindará un rendimiento cada vez mayor para cargas de trabajo cada vez más importantes, como la inferencia de IA, y al mismo tiempo cumplirá de manera única los objetivos de sostenibilidad de los proveedores y usuarios de la nube.
Nuestros productos también seguirán enfocándose en ofrecer un rendimiento predecible a los usuarios de la nube, eliminando problemas de vecinos ruidosos y permitiendo a los proveedores ejecutar CPU Ampere con una alta utilización. Introduciremos características adicionales que brinden mayores grados de flexibilidad para que los proveedores de la nube satisfagan el conjunto diverso de aplicaciones de los clientes. Estos son fundamentales para el rendimiento de la carga de trabajo nativa de la nube ahora y en el futuro.
Dado el enfoque centrado de Ampere Computing, ¿puede darnos una breve descripción de cuál es su cliente promedio y qué tipo de cargas de trabajo suele manejar?
Debido a que nuestras CPU son de uso general, sirven para un amplio espectro de aplicaciones. Construimos nuestras CPU desde cero como procesadores nativos de la nube, por lo que funcionan muy bien en casi todas las cargas de trabajo de la nube: la inferencia de IA, los servicios web, las bases de datos y el procesamiento de video son solo algunos ejemplos. En muchos casos, podemos ofrecer el doble de rendimiento para estas cargas de trabajo con la mitad de potencia que los procesadores x86 heredados.
En términos de clientes, estamos trabajando con casi todos los grandes hiperescaladores de EE. UU., Europa y China. En EE. UU., por ejemplo, puede encontrar instancias de Ampere en Oracle Cloud, Google Nube, microsoft Azul y más. Las CPU Ampere también están disponibles en toda Europa a través de varios proveedores de nube.
Más allá de los grandes proveedores de nube, estamos viendo mucha tracción en la empresa a través de nuestras ofertas con fabricantes de equipos originales como HPE y Supermicro. Esto se debe en gran medida a la mayor eficiencia y densidad de rack que estas empresas pueden lograr mediante la implementación de servidores Ampere. Las empresas quieren ahorrar energía y no quieren construir centros de datos adicionales que no sean fundamentales para su negocio.
Con el auge de la IA, los dispositivos que alguna vez fueron “simples” se están volviendo cada vez más inteligentes, lo que genera una mayor demanda de computación en la nube en áreas superlocales. Estas implementaciones de borde tienen requisitos estrictos de espacio y energía y, debido a la capacidad de Ampere para proporcionar una cantidad tan alta de núcleos en una envolvente de bajo consumo, también vemos mucha demanda para estas cargas de trabajo.
La IA se ha convertido en el principal tema de conversación este año en la industria de los semiconductores y más allá. ¿Esto cambiará en 2024, en su opinión? ¿Cómo ve este mercado?
Creemos firmemente que la IA seguirá siendo el principal tema de conversación. Pero sí creemos que la conversación cambiará… y ya está empezando a hacerlo.
En 2024, muchas empresas que trabajan en soluciones de IA pasarán del entrenamiento inicial de redes neuronales a su implementación, lo que también se conoce como inferencia de IA. Dado que la inferencia de IA puede requerir 10 veces más potencia informática agregada que el entrenamiento, la capacidad de implementar IA a escala será cada vez más importante. Lograr esta escala requerida estará limitado por el rendimiento, el costo y la disponibilidad, por lo que las organizaciones buscarán alternativas a las GPU a medida que ingresen a esta siguiente fase. Las CPU, y en particular las CPU de bajo consumo y alto rendimiento como las que ofrece Ampere, se convertirán en una opción cada vez más atractiva dada su capacidad para permitir una ejecución más eficiente y rentable de modelos de inferencia de IA. Las GPU seguirán siendo importantes para ciertos aspectos de la IA, pero esperamos que el entusiasmo comience a calmarse.
En segundo lugar, la sostenibilidad y la eficiencia energética serán aún más importantes el próximo año en el contexto de la IA. Hoy en día, los centros de datos suelen tener dificultades para cubrir sus necesidades energéticas. El mayor uso de la IA generará una demanda aún mayor de potencia informática en 2024 y, para algunas cargas de trabajo de IA, eso puede requerir hasta 20 veces más potencia. Debido a esto, la sostenibilidad y la eficiencia se convertirán en desafíos para la expansión. Los operadores de centros de datos darán gran prioridad a la eficiencia en el nuevo año para evitar poner en peligro el crecimiento.
¿Cómo aborda Ampere esta nueva oportunidad del mercado de la IA con sus productos?
Para muchas aplicaciones de IA, las GPU son excesivas y consumen mucha más energía y dinero de lo necesario. Esto es especialmente cierto para la mayoría de las inferencias, especialmente cuando se ejecutan cargas de trabajo de IA junto con otras cargas de trabajo como bases de datos o servicios web. En estos casos, reemplazar la GPU por una CPU ahorra energía, espacio y costo.
Ya estamos viendo que esto se hace realidad para cargas de trabajo del mundo real, y el beneficio de usar procesadores Ampere es importante. Por ejemplo, si ejecuta el popular modelo de IA generativa Whisper en nuestra CPU Altra de 128 núcleos en comparación con la tarjeta GPU A10 de Nvidia, consumimos 3,6 veces menos energía por inferencia. En comparación con las tarjetas Nvidia Tesla T4, consumimos 5,6 veces menos.
Debido a esto, hemos observado un aumento sustancial en la demanda de procesadores Ampere para inferencia de IA y esperamos que se convierta en un mercado enorme para nuestros productos. Hace apenas unas semanas, Scaleway, uno de los proveedores de nube líderes en Europa, anunció la próxima disponibilidad general de nuevas instancias de inferencia de IA impulsadas por Ampere. Además, en los últimos seis meses, hemos visto un aumento de siete veces en el uso de nuestra biblioteca de software de IA. Todo esto habla de la creciente adopción de nuestros productos como una alternativa de alto rendimiento y bajo consumo de energía para la inferencia de IA.