tumblr y WordPress Los usuarios pronto descubrirán que sus datos se están utilizando para entrenar modelos de inteligencia artificial (IA), según un informe. La empresa matriz de los sitios de blogs, Automattic, habría llegado a acuerdos con AbiertoAI y Midjourney para vender contenido generado por el usuario que, según se informa, se utilizará para ayudar a entrenar la IA. Si bien los detalles de los acuerdos y las prácticas de intercambio de datos siguen sin estar claros por el momento, esto ha planteado una pregunta sobre la privacidad de los datos y la ética de las empresas que comparten los datos de sus usuarios con terceros.
Las comunicaciones internas de los empleados de Automattic, vistas por 404 Media, confirmaron el acuerdo con empresas de inteligencia artificial y revelaron detalles sobre estas prácticas. En su informe, la publicación confirmó que el acuerdo de Automattic con OpenAI y Midjourney podría anunciarse pronto. Además, parece que la recopilación de datos para las empresas de IA ya ha comenzado. Mientras tanto, una publicación interna realizada por el gerente de producto Cyle Gage sugirió que se compiló todo el contenido de las publicaciones públicas de Tumblr entre 2014 y 2023.
El informe también destaca un mensaje específico que sugiere que el contenido privado y eliminado del usuario también se recopiló automáticamente, junto con los datos públicos. No estaba claro si ese conjunto de datos ya se había compartido con el AI empresas o no. Además, dado que un accidente de este tipo pone en peligro toda la información privada de su base de usuarios, también plantea una cuestión sobre la política ética de la empresa y la infraestructura de seguridad de los datos.
Automattic emitió el martes un declaración afirmando: “La IA está transformando rápidamente casi todos los aspectos de nuestro mundo, incluida la forma en que creamos y consumimos contenido. En Automattic siempre hemos creído en una web libre y abierta y en la elección individual. Al igual que otras empresas de tecnología, seguimos de cerca estos avances, incluida la forma de trabajar con empresas de inteligencia artificial de una manera que respete las preferencias de nuestros usuarios”.
La publicación detalla varias cosas que la compañía está haciendo por sus usuarios, incluido el bloqueo de rastreadores de plataformas de inteligencia artificial, una configuración para disuadir a los motores de búsqueda de indexar un sitio en WordPress y Tumblr, y la garantía de una configuración de exclusión voluntaria para los usuarios que no deseen compartir. datos con el tercero. «Actualmente, no existe ninguna ley que exija que los rastreadores sigan estas preferencias», decía la publicación.
El mecanismo para optar por no compartir datos tampoco está claro. Si bien la compañía afirmó en la publicación que las empresas de inteligencia artificial respetarán la configuración de exclusión voluntaria e incluso eliminarán el contenido anterior de los usuarios que recientemente optaron por no participar, el informe afirma que la realidad es más complicada.
El informe encontró un documento interno del 23 de febrero en el que un empleado preguntó si la empresa tenía alguna garantía de que el socio de datos respetaría la decisión de exclusión voluntaria tomada por los usuarios. Andrew Spittle, jefe de IA de Automattic, supuestamente respondió: “Pediremos que se elimine el contenido de cualquier ejecución futura de capacitación. Creo que los socios respetarán esto basándose en nuestras conversaciones con ellos hasta este momento. No creo que ganen mucho en general manteniéndolo”.
Se consideró que la respuesta era vaga y no confirma si Automattic tenía un acuerdo al respecto, según el informe. Además, parece que toda la línea de razonamiento se basa en el supuesto de que las empresas de IA no ganarán mucho reteniendo los datos de los usuarios. Cabe señalar que la práctica de compartir datos con terceros no es nueva y que la mayoría de las plataformas de redes sociales tienen los derechos sobre el contenido público generado por los usuarios en la plataforma. Sin embargo, hacer tales acuerdos sin revelarlos a los usuarios podría exponer información privada a empresas que utilizan los mismos datos para entrenar sistemas de inteligencia artificial.
Para conocer detalles de los últimos lanzamientos y novedades de Samsung, Xiaomi, Realme, OnePlus, Oppo y otras compañías en el Mobile World Congress de Barcelona, visita nuestro Centro del CMM 2024.