Mirando hacia adelante: Ultra Ethernet significa ofrecer una arquitectura integral que optimiza Ethernet para un alto rendimiento en redes de IA y HPC, superando las capacidades de las tecnologías especializadas actuales.
A medida que los centros de datos continúan evolucionando y el impulso por la IA se vuelve universal, las empresas de tecnología han estado acudiendo en masa para unirse al Consorcio Ultra Ethernet, que se lanzó el verano pasado y fue patrocinado por la Fundación Linux. UEC se centra en mejorar Ethernet para satisfacer los requisitos de baja latencia y alto ancho de banda de las aplicaciones avanzadas de IA y HPC (Computación de alto rendimiento), lo que la convierte en una alternativa competitiva a otras tecnologías de redes de alto rendimiento.
Cuarenta y cinco nuevos miembros han unido el Consorcio Ultra Ethernet desde noviembre de 2023, cuando la organización comenzó a aceptar nuevos miembros, lo que subraya la demanda de la industria de una arquitectura de pila de comunicación completa basada en Ethernet para redes de alto rendimiento. El interés de todas estas empresas tecnológicas pone de relieve una necesidad que la UEC está satisfaciendo en la industria, afirma J. Metz, presidente del Comité Directivo de la UEC.
La membresía de la UEC originalmente estaba compuesta por 10 miembros directivos, lo que eleva el número total de miembros hoy a 55 luego de su crecimiento cinco veces mayor en los últimos meses. Sus miembros fundadores son AMD, Arista, Broadcom, Cisco, Eviden, HPE, Intel, Meta y Microsoft. Los recién llegados al grupo incluyen a Baidu, Dell, Huawei, IBM, Nokia, Lenovo, Supermicro y Tencent.
Desde su establecimiento El año pasado, el Consorcio Ultra Ethernet ha creado una base de talentos considerablemente amplia. Hay un total de 715 expertos de la industria involucrados en ocho grupos de trabajo: capa física, capa de enlace, capa de transporte, capa de software, almacenamiento, cumplimiento, gestión y rendimiento y depuración.
UEC señala que muchos clústeres grandes, incluidas implementaciones a hiperescala de GPU utilizadas para el entrenamiento de IA, están ya operando en redes IP basadas en Ethernet, debido a sus importantes ventajas, que incluyen un amplio ecosistema de múltiples proveedores de conmutadores Ethernet, NIC, cables, transceptores, ópticas, herramientas de gestión y software interoperables y un historial comprobado de la escala de enrutamiento de redes IP. , así como los estándares Ethernet IEEE establecidos.
«Esperamos que estas ventajas se conviertan en requisitos fundamentales y que las redes Ethernet dominen cada vez más las cargas de trabajo de IA y HPC de todos los tamaños en el futuro».
La UEC quiere minimizar los cambios en la pila de comunicaciones y al mismo tiempo mantener y promover la interoperabilidad de Ethernet. Con ese fin, está desarrollando especificaciones, interfaces API y código fuente para definir protocolos, características de señalización eléctrica y óptica, protocolos de transporte de red de nivel de enlace y de extremo a extremo y mecanismos de gestión, software, almacenamiento y estructuras de seguridad.
En resumen, quiere optimizar las cargas de trabajo de IA y HPC modernizando la operación de acceso remoto directo a la memoria (RDMA) a través de Ethernet. Está presionando para reemplazar el protocolo RoCE heredado con Ultra Ethernet Transport, una especificación de protocolo abierto diseñada para ejecutarse sobre IP y Ethernet.
La industria pronto verá exactamente lo que la UEC ha estado desarrollando. El trabajo en la especificación ha seguido un cronograma muy agresivo, y el lanzamiento de la versión 1.0 está previsto para el tercer trimestre de 2024.