La supercomputadora Venado con tecnología Nvidia de Los Alamos intercambia precisión por eficiencia con cargas de trabajo de IA

En una palabra: El rendimiento de los superordenadores incluidos en la lista TOP500 se mide en operaciones de punto flotante por segundo (FLOPS) con un nivel de precisión específico. Al reducir los requisitos del formato de punto flotante de doble precisión (FP64) de 64 bits de TOP500, las supercomputadoras aparentemente pueden alcanzar niveles de rendimiento aún más altos en cargas de trabajo específicas basadas en IA.

El Laboratorio Nacional de Los Álamos tiene un nuevo sistema de computación de alto rendimiento (HPC) llamado Venado, una supercomputadora diseñada específicamente para acelerar algoritmos de IA y programas de investigación basados en IA. Venado está lejos de ser la supercomputadora más rápida del mundo, pero incluye suficientes chips Nvidia para la aceleración de la IA para proporcionar al laboratorio del Departamento de Energía un medio poderoso para integrar la inteligencia artificial en la investigación básica y la «seguridad nacional avanzada» de Estados Unidos.

Venado se construyó en asociación con Hewlett Packard Enterprise (HPE) y Nvidia, dijo Los Alamos en su anuncio oficial. El nuevo superordenador basado en HPE Cray EX cuenta con una capacidad de alojamiento para 2.560 unidades refrigeradas por líquido Superchips Grace Hopper GH200, la última solución de Nvidia para sistemas HPC. Además, la supercomputadora incluye 920 superchips de CPU Nvidia Grace.

Venado es el primer sistema a gran escala con superchips de CPU Nvidia Grace implementados en EE. UU. Cada Grace SoC incluye 144 núcleos informáticos Arm, que según el laboratorio del DOE son lo suficientemente buenos como para ofrecer un aumento de rendimiento «inmediato» a diferentes tipos de aplicaciones HPC.

La supercomputadora Venado es aparentemente capaz de proporcionar diez exaFLOPS de potencia para cargas de trabajo de IA, un logro realmente espectacular si tenemos en cuenta que Frontier, la primera supercomputadora a exaescala del mundo, está actualmente encabezando el ranking TOP500 con «sólo» 1.194 petaFLOPS de destreza informática. Sin embargo, las capacidades informáticas de Venado están clasificadas en una cuarta parte de la precisión de punto flotante requerida para la lista TOP500 (FP8 vs FP64).

A pesar de intercambiar precisión por eficiencia, Venado debería ser perfecto para ejecutar modelos de lenguaje grandes (LLM) y otras aplicaciones basadas en aprendizaje automático. Los superchips de Nvidia pueden ejecutar «millones más de instrucciones» por segundo en comparación con la tecnología de chip anterior, dijo Los Alamos, al tiempo que tienen costos y niveles de consumo de energía mucho más bajos.

Venado ha sido descrito como una supercomputadora «compacta» basada en la plataforma Cray EX de HPE. El sistema está conectado en red con las interconexiones Slingshot 11 de «extremadamente alta velocidad» de HPE, mientras que el software adicional HPE Cray proporciona cargas de trabajo de modelado y simulación optimizadas.

Según Ian Buck, vicepresidente de hiperescala y HPC de Nvidia, Venado explota la arquitectura Grace Hopper de la empresa para ofrecer un «rendimiento innovador» y eficiencia energética en investigaciones científicas de vanguardia. Se espera que la supercomputadora proporcione importantes descubrimientos en ciencia de materiales, energías renovables, astrofísica y otros campos.

Enlace fuente