El ingeniero eléctrico Gilbert Herrera fue nombrado director de investigaciones de la Agencia de Seguridad Nacional de EE.UU. a finales de 2021, justo cuando un La revolución de la IA se estaba gestando dentro de la industria tecnológica estadounidense.
La NSA, de la que a veces se dice en broma que representa No Such Agency, ha contratado durante mucho tiempo a los mejores talentos en matemáticas e informática. Sus líderes técnicos han sido los primeros y ávidos usuarios de la informática avanzada y la inteligencia artificial. Y, sin embargo, cuando Herrera habló conmigo por teléfono sobre las implicaciones del último auge de la IA desde la sede de la NSA en Fort Meade, Maryland, parecía que, como muchos otros, la agencia había quedado atónita por el reciente éxito de los grandes modelos lingüísticos detrás. ChatGPT y otros productos de IA de éxito. La conversación ha sido ligeramente editada para mayor claridad y extensión.
¿Qué tan grande fue la sorpresa para la NSA el momento ChatGPT?
Oh, pensé que tu primera pregunta iba a ser «¿qué aprendió la NSA del Arca de la Alianza?» Esto ha sido recurrente desde aproximadamente 1939. Me encantaría decírtelo, pero no puedo.
Lo que creo que todos aprendieron del momento ChatGPT es que si arrojas suficientes datos y suficientes recursos informáticos a la IA, aparecen estas propiedades emergentes.
La NSA realmente considera que la inteligencia artificial está en la frontera de una larga historia de uso de la automatización para realizar nuestras misiones con la informática. Durante mucho tiempo se ha considerado que la IA es una forma de operar de manera más inteligente, más rápida y a escala. Y por eso hemos estado involucrados en la investigación que condujo a este momento durante más de 20 años.
Los modelos de lenguajes grandes han existido mucho antes que los modelos generativos preentrenados (GPT). Pero este “momento ChatGPT” (una vez que puedes pedirle que escriba un chiste o una vez que puedes entablar una conversación) realmente lo diferencia de otros trabajos que nosotros y otros hemos realizado.
La NSA y sus homólogos entre los aliados de Estados Unidos han desarrollado en ocasiones tecnologías importantes antes que nadie, pero lo han mantenido en secreto, como criptografía de clave pública en la década de 1970. ¿Quizás sucedió lo mismo con los modelos de lenguaje grandes?
En la NSA no podríamos haber creado estos grandes modelos de transformadores porque no podíamos utilizar los datos. No podemos utilizar datos de ciudadanos estadounidenses. Otra cosa es el presupuesto. Escuché un podcast en el que alguien compartió una llamada sobre las ganancias de Microsoft y dijo que estaban gastando 10 mil millones de dólares al trimestre en costos de plataforma. [The total US intelligence budget in 2023 was $100 billion.]
Realmente tiene que haber gente que tenga suficiente dinero para una inversión de capital de decenas de miles de millones y [who] tener acceso al tipo de datos que pueden producir estas propiedades emergentes. Y así son realmente los hiperescaladores. [largest cloud companies] y potencialmente gobiernos a los que no les importa la privacidad personal, no tienen que seguir las leyes de privacidad personal y no tienen problemas con el robo de datos. Y dejaré a tu imaginación quién puede ser.
¿No pone eso a la NSA (y a Estados Unidos) en desventaja en la recopilación y el procesamiento de inteligencia?
Retrocederé un poco: eso no nos pone en gran desventaja. Necesitamos solucionarlo y ya llegaré a eso.
No es una gran desventaja para nuestra responsabilidad, que es lidiar con objetivos de estados-nación. Si nos fijamos en otras aplicaciones, puede que a algunos de nuestros colegas que se ocupan de la inteligencia nacional les resulte más difícil. Pero la comunidad de inteligencia necesitará encontrar una manera de utilizar modelos de lenguaje comercial y respetar la privacidad y las libertades personales. [The NSA is prohibited from collecting domestic intelligence, although multiple whistleblowers have warned that it does scoop up US data.]