microsoft supuestamente ha bloqueado varias palabras clave de su inteligencia artificial (IA) Copilot Designer que podría usarse para generar imágenes explícitas de naturaleza violenta y sexual. El gigante tecnológico llevó a cabo un ejercicio de bloqueo de palabras clave después de que uno de sus ingenieros escribiera a la Comisión Federal de Comercio de EE. UU. (FTC) y a la junta directiva de Microsoft expresando su preocupación por la herramienta de inteligencia artificial. En particular, en enero de 2024, surgieron en línea deepfakes explícitos del músico Taylor Swift generados por IA y se decía que fueron creados usando Copiloto.
Primero manchado Según CNBC, Copilot bloquea términos como “Pro Choice”, “Pro Choce” (con un error tipográfico intencional para engañar a la IA) y “Four Twenty”, que anteriormente mostraban resultados. El uso de estas u otras palabras clave prohibidas similares también activa una advertencia de la herramienta de inteligencia artificial que dice: “Este mensaje ha sido bloqueado. Nuestro sistema marcó automáticamente este mensaje porque puede entrar en conflicto con nuestra política de contenido. Más violaciones de la política pueden dar lugar a la suspensión automática de su acceso. Si cree que se trata de un error, infórmenos para ayudarnos a mejorar”. Nosotros, en Gadgets 360, también pudimos confirmarlo.
Un portavoz de Microsoft dijo a CNBC: «Estamos monitoreando continuamente, haciendo ajustes e implementando controles adicionales para fortalecer aún más nuestros filtros de seguridad y mitigar el uso indebido del sistema». Esta solución ha impedido que la herramienta de inteligencia artificial acepte ciertas indicaciones; sin embargo, los ingenieros sociales, los piratas informáticos y los malos actores podrían encontrar lagunas para generar otras palabras clave similares.
Según una CNBC separada informetodas estas indicaciones destacadas fueron mostradas por Shane Jones, un ingeniero de Microsoft, quien escribió una carta tanto a la FTC como a la junta directiva de la compañía expresando sus preocupaciones con el DARLE 3 herramienta de inteligencia artificial la semana pasada. Según se informa, Jones ha estado compartiendo activamente sus preocupaciones y hallazgos sobre la IA que genera imágenes inapropiadas desde diciembre de 2023 con la empresa a través de canales internos.
Más tarde, incluso hizo una publicación pública en LinkedIn para pedirle a OpenAI que retirara la última versión de DALL-E para investigarla. Sin embargo, supuestamente Microsoft le pidió que eliminara la publicación. El ingeniero también se acercó a los senadores estadounidenses y se reunió con ellos para tratar el tema.