OpenAI dijo el lunes que The New York Times (NYT) no cuenta la historia completa sobre el demanda judicial presentó una demanda contra la empresa dirigida por Sam Altman y Microsoft el 27 de diciembre.
“Curiosamente, las regurgitaciones que provocó el New York Times parecen provenir de artículos de hace años que han proliferado en múltiple tercero–fiesta sitios web. Parece que manipularon intencionalmente las indicaciones, que a menudo incluyen extensos extractos de artículos, para que nuestro modelo regurgite”, escribió OpenAI en un entrada en el blog.
Como parte de la demanda, el NYT presentó aproximadamente 100 ejemplos de violaciones de derechos de autor que muestran que ChatGPT o su modelo subyacente devuelven fragmentos de texto que son casi idénticos a párrafos publicados como parte de artículos o contenido editorial del NYT.
Sin embargo, OpenAI ha afirmado que incluso cuando se utilizan indicaciones «manipuladas», sus modelos «no suelen comportarse de la forma en que insinúa el New York Times, lo que sugiere que o le ordenaron al modelo que regurgitara o seleccionaron sus ejemplos de muchos intentos». «
OpenAI dijo que los ejemplos presentados por el NYT no son ejemplos típicos de mal uso o actividad permitida del usuario. Señaló que los textos generados no sustituyen al prestigioso periódico.
OpenAI trabaja para resolver el problema de la regurgitación
La compañía dirigida por Sam Altman dijo que ha identificado y está trabajando para resolver el problema de «regurgitación» de ChatGPT, que denomina «memorización» y dijo que es una falla del proceso de capacitación del modelo.
La memorización, según la compañía, tiende a ocurrir más comúnmente cuando un contenido particular aparece más de una vez en los datos de entrenamiento, en este caso, los artículos del NYT que también aparecen en otros sitios web.
“Por eso contamos con medidas para limitar la memorización involuntaria y evitar la regurgitación en los resultados del modelo. También esperamos que nuestros usuarios actúen de manera responsable; Manipular intencionalmente nuestros modelos para regurgitar no es un uso apropiado de nuestra tecnología y va en contra de nuestros términos de uso”, escribió la compañía en la publicación del blog.
Los expertos discuten sobre las reclamaciones de derechos de autor
Si bien ha habido muchos comentarios sobre la demanda del NYT contra OpenAI, varios innovadores tecnológicos parecen simpatizar con la lógica de OpenAI.
“Después de leer el @Los Tiempos de la Ciudad Nueva York demanda contra @OpenAI y @Microsoft«Siento más simpatía por OpenAI y Microsoft que por el NYT», Andrew Ng, uno de los principales científicos en el campo de la IA. escribió en Xanteriormente Twitter.
Ng afirmó que así como a los humanos se les permite leer documentos en la Internet abierta, aprender de ellos y sintetizar ideas completamente nuevas, a la IA también se le debería permitir hacerlo.
«Me gustaría que la formación en la Internet pública estuviera cubierta por el uso legítimo (la sociedad estaría mejor de esta manera), aunque en última instancia dependerá de los legisladores y los tribunales si realmente lo está», explicó el científico de IA en Boletín semanal de DeepLearning.AI.
En cierto modo apoyando las afirmaciones de OpenAI, Ng dijo además que los ejemplos de violaciones presentados por el NYT se produjeron debido a un mecanismo similar a RAG en el que el mensaje del usuario hace que el sistema navegue por la web, recupere un artículo específico y luego lo imprima.
El arquitecto de sistemas Daniel Jeffries también recurrió a Twitter para explicar por qué el caso del Times tiene una probabilidad casi nula de ganar y de alguna manera apoyó las afirmaciones de OpenAI.
Jeffries estaba reaccionando a Publicación de Jason Klint en Twitter, que argumentó que era más probable que ganara el caso del Times. Klint es el director ejecutivo de Digital Content Next, una asociación comercial para empresas de contenidos.
El arquitecto de sistemas también señaló que el caso del Times puede seguir el mismo camino que el caso de Sarah Silverman. en el que un juez de distrito estadounidense había dictaminado que determinar si las imágenes generadas pueden violar directamente las leyes de derechos de autor “no era plausible” en este momento.
OpenAI ya ha declarado que cree entrenar modelos de IA utilizando materiales de Internet disponibles públicamente es un uso legítimo. Esta práctica, según la empresa, está respaldada por precedentes de larga data y ampliamente aceptados.
Antes de que el NYT presentara la demanda, OpenAI dijo que estaba manteniendo negociaciones sobre un acuerdo con el NYT hasta el 19 de diciembre.
“Las negociaciones se centraron en una asociación de alto valor en torno a la visualización en tiempo real con atribución en ChatGPT, en la que The New York Times obtendría una nueva forma de conectarse con sus lectores nuevos y existentes, y nuestros usuarios obtendrían acceso a sus informes. «, escribió en la publicación del blog, y agregó que ya le había explicado al Times que su contenido no contribuía significativamente a la capacitación de sus modelos existentes y tampoco tendría suficiente impacto para la capacitación futura.
Copyright © 2024 IDG Communications, Inc.