Un directivo de Microsoft afirma DALL-E 3 de OpenAI tiene vulnerabilidades de seguridad que podrían permitir a los usuarios generar imágenes violentas o explícitas (similares a las que recientemente apuntado a Taylor Swift). GeekWire reportado El martes, el equipo legal de la compañía bloqueó los intentos del líder de ingeniería de Microsoft, Shane Jones, de alertar al público sobre el exploit. El autodenominado denunciante ahora está llevando su mensaje al Capitolio.
«Llegué a la conclusión de que DALL·E 3 representaba un riesgo para la seguridad pública y debería retirarse del uso público hasta que OpenAI pudiera abordar los riesgos asociados con este modelo», escribió Jones a las senadoras estadounidenses Patty Murray (D-WA) y Maria Cantwell ( D-WA), el representante Adam Smith (D-WA, noveno distrito) y el fiscal general del estado de Washington, Bob Ferguson (D). GeekWire publicado La carta completa de Jones.
Jones afirma que descubrió un exploit que le permitió eludir las barreras de seguridad de DALL-E 3 a principios de diciembre. Dice que informó del problema a sus superiores en Microsoft, quienes le ordenaron que «informara personalmente el problema directamente a OpenAI». Luego de hacerlo, afirma haber aprendido que la falla podría permitir la generación de “imágenes dañinas violentas y perturbadoras”.
Luego, Jones intentó hacer pública su causa en una publicación de LinkedIn. “En la mañana del 14 de diciembre de 2023 publiqué públicamente una carta en LinkedIn dirigida a la junta directiva de la organización sin fines de lucro OpenAI instándola a suspender la disponibilidad de DALL·E 3)”, escribió Jones. «Debido a que Microsoft es observador de la junta directiva de OpenAI y anteriormente había compartido mis inquietudes con mi equipo de liderazgo, rápidamente informé a Microsoft sobre la carta que había publicado».
La respuesta de Microsoft supuestamente fue exigirle que eliminara su publicación. «Poco después de revelar la carta a mi equipo de liderazgo, mi gerente se puso en contacto conmigo y me dijo que el departamento legal de Microsoft había exigido que eliminara la publicación», escribió en su carta. «Me dijo que el departamento legal de Microsoft haría un seguimiento con su justificación específica para la solicitud de eliminación por correo electrónico muy pronto, y que necesitaba eliminarlo inmediatamente sin esperar el correo electrónico del departamento legal».
Jones cumplió, pero dice que la respuesta más detallada del equipo legal de Microsoft nunca llegó. “Nunca recibí una explicación o justificación de su parte”, escribió. Dice que se ignoraron otros intentos de obtener más información del departamento legal de la empresa. «El departamento legal de Microsoft aún no ha respondido ni se ha comunicado directamente conmigo», escribió.
Engadget contactó a Microsoft y OpenAI, pero ninguna de las empresas respondió de inmediato. Actualizaremos este artículo si recibimos una respuesta.
El denunciante dice que los deepfakes pornográficos de Taylor Swift que circularon en X la semana pasada son un ejemplo de lo que podrían producir vulnerabilidades similares si no se controlan. 404 Medios reportado lunes que Microsoft Designer, que utiliza DALL-E 3 como backend, fue parte del conjunto de herramientas de los deepfakers que hicieron el video. La publicación afirma que Microsoft, después de ser notificado, solucionó esa laguna en particular.
«Microsoft era consciente de estas vulnerabilidades y del potencial de abuso», concluyó Jones. No está claro si los exploits utilizados para hacer el deepfake de Swift estaban directamente relacionados con los que Jones informó en diciembre.
Jones insta a sus representantes en Washington, DC a tomar medidas. Sugiere que el gobierno de EE. UU. cree un sistema para informar y rastrear vulnerabilidades específicas de la IA, y al mismo tiempo proteger a los empleados como él que hablan. «Necesitamos responsabilizar a las empresas por la seguridad de sus productos y su responsabilidad de revelar al público los riesgos conocidos», escribió. «Los empleados preocupados, como yo, no deberían dejarse intimidar para que guarden silencio».