Meta presenta un chip de inferencia y entrenamiento de IA de segunda generación

MTIA v2 de Meta duplica la cantidad de memoria en el chip para triplicar el rendimiento en tareas de IA.

Meta

Meta ha desvelado su chip «acelerador de entrenamiento e inferencia» de segunda generación, o «MTIA», casi un año después de la primera versióny la compañía dice que su nueva pieza trae mejoras sustanciales de rendimiento.

Meta, al igual que otros gigantes tecnológicos, como Microsoft, Google y Tesla, está invirtiendo en productos personalizados. inteligencia artificial (IA) hardware para protegerse contra el poder de monopolio del principal proveedor de GPU, Nvidia. La inversión también es una forma de garantizar el suministro de informática, dado que Nvidia no ha podido producir suficientes chips para satisfacer la demanda durante el repentino aumento del interés por la IA generativa.

También: Cinco formas de prepararse para el impacto de la IA generativa en la profesión de TI

Al igual que la primera parte, el chip MTIA versión 2 consta de una malla de bloques de circuitos que operan en paralelo, una «cuadrícula de elementos de procesamiento (PE) de 8×8». El chip funciona 3,5 veces más rápido que MTIA v1, dijo Meta. Es siete veces más rápido en tareas de IA que implican cálculos «escasos», aquellas en las que las variables tienen un valor cero.

Meta dijo que los beneficios provienen de cambios en la arquitectura del chip y de memoria y almacenamiento mejorados. «Hemos triplicado el tamaño del almacenamiento PE local, duplicado la SRAM en el chip y aumentado su ancho de banda en 3,5 veces, y duplicado la capacidad de LPDDR5», dijo el gigante tecnológico.

El chip está construido con una tecnología de proceso de 5 nanómetros desarrollada por el gigante de fabricación de chips por contrato Taiwan Semiconductor Manufacturing.

También: ¿Quieres trabajar en IA? Cómo dar un giro a tu carrera en 5 pasos

El chip más grande, que mide 421 milímetros cuadrados frente a los 373 del v1, tiene 2.400 millones de puertas, dijo Meta, y realiza 103 millones de operaciones matemáticas de punto flotante por segundo. Ese rendimiento se compara con los 1.100 millones de puertas y 65 millones de operaciones del modelo anterior.

meta-entrenamiento-e-acelerador-de-inferencia-2-2024-jpeg.png — Comparando generaciones MTIA.

Meta

Al igual que MTIA v1, el nuevo chip ejecuta software que optimiza los programas utilizando el marco de desarrollo de código abierto PyTorch de Meta. Dos compiladores de software colaboran: uno en el front-end compila el gráfico de cálculo de un programa y otro en el back-end está escrito en el lenguaje compilador Triton de código abierto para generar un código de máquina óptimo para el chip.

Meta dijo que el trabajo de desarrollo de software para MTIA v1 permitió a la compañía hacer realidad rápidamente el nuevo chip, «pasando del primer silicio a los modelos de producción que se ejecutan en 16 regiones en menos de nueve meses». La compañía de tecnología dijo que el chip se está implementando para respaldar modelos publicitarios de clasificación y recomendación.

También: El CEO de Nvidia, Jensen Huang, presenta la familia de chips ‘Blackwell’ de próxima generación en el GTC

Meta dijo que ha diseñado un sistema informático de montaje en bastidor que ejecuta 72 MTIA v2 en paralelo. «Nuestro diseño garantiza que proporcionemos capacidades más densas con mayor cómputo, ancho de banda de memoria y capacidad de memoria», dijo Meta. «Esta densidad nos permite adaptarnos más fácilmente a una amplia gama de complejidades y tamaños de modelos».

La empresa de tecnología planea seguir invirtiendo en diseño de hardware personalizado. «Actualmente tenemos varios programas en marcha destinados a ampliar el alcance de MTIA, incluido el soporte para cargas de trabajo GenAI», dijo Meta. «Estamos diseñando nuestro silicio personalizado para que funcione en cooperación con nuestra infraestructura existente, así como con hardware nuevo y más avanzado (incluidas las GPU de próxima generación) que podemos aprovechar en el futuro».

Enlace fuente