Los usuarios de 4chan que han creado un juego aprovechando los populares generadores de imágenes de IA parecen ser, al menos en parte, responsables del Inundación de imágenes falsas sexualizando a Taylor Swift eso se volvió viral el mes pasado.
Los investigadores de Graphika, que estudian cómo se manipulan las comunidades en línea, rastrearon las imágenes falsas de Swift hasta un foro de mensajes de 4chan que se dedica «cada vez más» a publicar contenido «ofensivo» generado por IA, The New York Times reportado. Los fanáticos del foro de mensajes participan en desafíos diarios, informó Graphika, compartiendo consejos para evitar los filtros del generador de imágenes de IA y sin mostrar signos de detener su juego en el corto plazo.
«Algunos usuarios de 4chan expresaron el objetivo declarado de intentar derrotar las salvaguardias de los principales generadores de imágenes de IA en lugar de crear contenido sexual realista con generadores de imágenes alternativos de código abierto», informó Graphika. «También compartieron múltiples técnicas de comportamiento para crear mensajes de imágenes, intentar evitar prohibiciones y crear con éxito imágenes de celebridades sexualmente explícitas».
Ars revisó un hilo marcado por Graphika donde los usuarios fueron desafiados específicamente a usar herramientas de Microsoft como Bing Image Creator y Microsoft Designer, así como DALL-E de OpenAI.
«Buena suerte», escribió el cartel original, mientras animaba a otros usuarios a «ser creativos».
OpenAI ha negado que alguna de las imágenes de Swift haya sido creada usando DALL-E, mientras que Microsoft ha seguido afirmando que está investigando si se utilizó alguna de sus herramientas de inteligencia artificial.
Cristina López G., analista senior de Graphika, señaló que Swift no es la única celebridad a la que se dirige el hilo de 4chan.
“Si bien las imágenes pornográficas virales de Taylor Swift han llamado la atención generalizada sobre el tema de las imágenes íntimas no consensuales generadas por IA, ella está lejos de ser la única víctima”, dijo López G. “En la comunidad de 4chan donde se originaron estas imágenes, ella Ni siquiera es la figura pública más atacada. Esto demuestra que cualquiera puede ser blanco de este tipo de ataques, desde celebridades mundiales hasta escolares”.
Originalmente, 404 Medios reportado que las imágenes dañinas de Swift parecían originarse en los canales 4chan y Telegram antes de difundirse en X (anteriormente Twitter) y otras redes sociales. Intentando detener la propagación, X tomó la drástica medida de bloquear todas las búsquedas de «Taylor Swift» por dos días.
Pero López G. dijo que los hallazgos de Graphika sugieren que las plataformas seguirán corriendo el riesgo de verse inundadas de contenido ofensivo mientras los usuarios de 4chan estén decididos a seguir desafiándose unos a otros para subvertir los filtros del generador de imágenes. En lugar de esperar que las plataformas persigan el contenido dañino, López G. recomendó que las empresas de inteligencia artificial se adelanten al problema, asumiendo la responsabilidad de los resultados prestando atención a las tácticas en evolución de las comunidades tóxicas en línea que informan con precisión cómo eluden las salvaguardas.
«Estas imágenes provienen de una comunidad de personas motivadas por el ‘desafío’ de eludir las salvaguardas de los productos de IA generativa, y las nuevas restricciones son vistas como un obstáculo más para la ‘derrota'», afirmó López G. «Es importante comprender la naturaleza gamificada de esta actividad maliciosa para evitar mayores abusos en la fuente».
Los expertos dijeron a The Times que los usuarios de 4chan probablemente estaban motivados a participar en estos desafíos para presumir y «sentirse conectados con una comunidad más amplia».