¡¿Qué carajo?! La demanda de derechos de autor del New York Times contra OpenAI dio un giro inesperado después de que la compañía de tecnología acusó al periódico de contratar a alguien para «piratear» ChatGPT y otros productos para generar evidencia engañosa que respalde su afirmación. Sin embargo, el uso que hace OpenAI del término «hackear» puede ser exagerado.
El NYT demandó a OpenAI y Microsoft en diciembre por utilizar millones de sus artículos para entrenar sus sistemas sin permiso ni compensación. El traje estados que millones de noticias protegidas por derechos de autor, investigaciones en profundidad, artículos de opinión, reseñas, guías prácticas y más del Times se utilizaron para entrenar a los chatbots, que ahora compiten con el medio de comunicación como fuente de información.
En una presentación presentada ante el tribunal federal de Manhattan el lunes, OpenAI alegó que el Times «pagó a alguien para que hackeara» sus productos y generara 100 ejemplos de infracción de derechos de autor.
OpenAI afirma que el Times necesitó decenas de miles de intentos para generar «resultados altamente anómalos» y que lo logró utilizando «indicaciones engañosas que violan descaradamente los términos de uso de OpenAI».
«Solo pudieron hacerlo atacando y explotando un error (que OpenAI se ha comprometido a solucionar) mediante el uso de indicaciones engañosas que violan descaradamente los términos de uso de OpenAI», escribió el abogado de OpenAI. «E incluso entonces, tuvieron que alimentar la herramienta con partes de los mismos artículos de los que buscaban obtener pasajes textuales, prácticamente todos los cuales ya aparecen en múltiples sitios web públicos».
«La gente normal no utiliza los productos de OpenAI de esta manera […] En el curso normal, no se puede usar ChatGPT para publicar artículos del Times a voluntad», continuó OpenAI.
OpenAI no nombra al «arma contratada» que, según afirma, el Times contrató para manipular la producción de ChatGPT, ni acusa al periódico de piratería real. Esto suena más a ingeniería de avisos estándar, y el Times está de acuerdo.
«Lo que OpenAI caracteriza extrañamente erróneamente como ‘hacking’ es simplemente usar los productos de OpenAI para buscar evidencia de que robaron y reprodujeron las obras protegidas por derechos de autor del Times. Y eso es exactamente lo que encontramos. De hecho, la escala de copia de OpenAI es mucho mayor que la Más de 100 ejemplos expuestos en la demanda», dijo Ian Crosby, socio de Susman Godfrey y abogado principal de la publicación. «En esta presentación, OpenAI no cuestiona, ni puede hacerlo, que copiaron millones de trabajos del Times para construir y potenciar sus productos comerciales sin nuestro permiso».
El uso de trabajos protegidos por derechos de autor en el entrenamiento de IA generativas ha dado lugar a numerosas demandas por parte de autores, artistas y creadores. OpenAI dijo en la presentación que cree que las empresas de inteligencia artificial ganarán casos como estos basándose en el uso legítimo. Señala que The Times «no puede impedir que los modelos de IA adquieran conocimiento sobre los hechos».
En agosto se informó que el Times había estado en «negociaciones tensas» sobre llegar a un acuerdo de licencia con OpenAI y Microsoft que permitiría al primero entrenar legalmente su modelo GPT a partir del material publicado por el Times, algo que el periódico decidió prohibir previamente. Pero las conversaciones fracasaron, lo que llevó a la demanda actual. OpenAI ya tiene un acuerdo con Reuters y Axel Springer para utilizar su contenido con fines de capacitación, y se dice que está en conversaciones con CNN, Fox Corp. y Time para asegurar acuerdos de licencia.