NVIDIA presentó recientemente su supercomputadora en rack DGX GB200 NVL72 en Nvidia GTC 2024 y Patrick Kennedy en Servir al hogar tomó una selección de excelentes fotografías que muestran a la impresionante bestia.
El nombre del DGX GB200 NVL72 le dice mucho de lo que necesita saber. El GB200 representa la estructura informática Grace Blackwell GB200, mientras que el NVL72 indica que hay 72 GPU Blackwell conectadas mediante NVLink.
La plataforma Blackwell contiene 208 mil millones de transistores en sus dos matrices de GPU. Estos están conectados mediante un enlace de chip a chip de 10 TB/segundo en una única GPU unificada. Blackwell, que se lanzará a finales de este año, ofrecerá hasta 20 petaflops de potencia FP4 y será hasta 30 veces más rápido que Hopper para tareas de inferencia de IA.
Carga de potencia de 120kW
El sistema de escalado en rack consta de diez nodos de computación en la pila superior, cada uno con dos puertos Infiniband, cuatro bandejas de unidades E1.S y puertos de administración. Cada nodo funciona con dos Grace Brazo CPU conectadas a dos GPU Blackwell. Debajo de estos nodos hay nueve estantes NVSwitch, con asas doradas para facilitar su extracción.
La parte posterior del bastidor revela el sistema de entrega de energía diseñado para alimentación ciega a través de la barra colectora, boquillas de refrigeración líquida y conexiones NVLink para cada componente. Esta configuración permite un ligero movimiento para garantizar un acoplamiento ciego adecuado.
DGX GB200 NVL72 pesa 1,36 toneladas métricas (3000 libras) y consume 120 kW, una carga de energía que Servir al hogar Como señala, no todos los centros de datos podrán manejarlo. Como muchos sólo pueden admitir un máximo de racks de 60 kW, un futuro sistema de media pila parece una posibilidad. El bastidor utiliza 3,2 km (2 millas) de cableado de cobre en lugar de ópticas para reducir el consumo de energía del sistema en 20 kW.
Puedes ver el resto de fotografías tomadas por Kennedy en el GTC 2024 aquí.