¿Lo que acaba de suceder? La NASA es la principal agencia de investigación espacial del mundo y tiene acceso a la última y mejor tecnología con la que la mayoría de las organizaciones sólo pueden soñar. Sin embargo, una auditoría realizada por la Oficina del Inspector General de la NASA descubrió que las supercomputadoras obsoletas y sobrecargadas de la agencia están creando enormes cuellos de botella en la infraestructura, lo que provoca graves retrasos en las misiones.
en un mordaz informe (a través de El registro), la OIG afirmó que las tecnologías de computación de alta gama (HEC) de la NASA necesitan una revisión completa si quiere competir con los programas de investigación espacial de otras naciones y mantener su posición de liderazgo. Sin cambios masivos, los recursos de supercomputación de la agencia «probablemente limitarán las prioridades y objetivos de las misiones futuras».
Al describir los recursos HEC de la agencia como «sobresuscritos y sobrecargados», el informe afirmó que las Direcciones de la Misión están solicitando más tiempo de computación del que la capacidad existente puede proporcionar, lo que a menudo genera retrasos en los cronogramas.
La situación es tan grave que varios equipos de la NASA se ven obligados a utilizar parte del presupuesto asignado para comprar sus propios recursos HEC y cumplir con los plazos. Como ejemplo, el informe destacó que el equipo del Sistema de Lanzamiento Espacial invierte alrededor de $250,000 anualmente para comprar y administrar sus propios sistemas HEC en lugar de esperar la disponibilidad de recursos HEC existentes. Según la OIG, casi todos los centros de la NASA utilizan sus propios sistemas HEC, excepto el Centro de vuelos espaciales Goddard y el Centro espacial Stennis.
La auditoría también destacó que la NASA no está a la altura de las tendencias modernas en supercomputación, en parte debido a limitaciones organizativas y de financiación. Por ejemplo, las instalaciones de Supercomputación Avanzada de la NASA tienen solo 48 GPU junto con 18.000 CPU, mientras que los sistemas HEC del Centro de Simulación Climática de la NASA tienen aún más CPU. Se dice que la incapacidad de modernizar los sistemas se debe a múltiples factores, como «preocupaciones por la cadena de suministro, requisitos de lenguaje informático (codificación) moderno y la escasez de personal calificado necesario para implementar las nuevas tecnologías».
En junio de 2023, la NASA tenía cinco supercomputadoras en las instalaciones de Supercomputación Avanzada (NAS) de la NASA en Ames, California, y en el Centro de Simulación Climática (NCCS) de la NASA en Goddard, Maryland. La lista incluye Endeavour (154,8 TFLOPS), Aitken (13,12 PFLOPS), Electra (8,32 PFLOPS), Discover (8,1 PFLOPS) y Pleiades (7,09 PFLOPS).
El informe critica a la NASA por carecer de «una estrategia integral sobre cuándo utilizar los activos de HEC en las instalaciones versus cuándo utilizar las opciones de computación en la nube». La gestión desordenada de HEC también es una amenaza clara y presente a la ciberseguridad, y debe abordarse lo antes posible.
Para mitigar los desafíos, la OIG recomienda que la NASA nombre «liderazgo ejecutivo para determinar la definición, el alcance, la propiedad, la ubicación organizacional y la estructura adecuados para el HEC de la NASA». Además, el informe dice que la agencia debería establecer «un equipo tigre para colaborar y elaborar estrategias en cuestiones de HEC», incluida la identificación y subsanación de brechas tecnológicas de misión crítica.
También se alienta a la agencia a desarrollar una estrategia concreta para mejorar la priorización y asignación de los activos de HEC, mitigar las preocupaciones de ciberseguridad y abordar varios otros problemas que le impiden alcanzar su máximo potencial.