En medio de una avalancha de demandas sobre los datos de entrenamiento de los modelos de IA, el representante estadounidense Adam Schiff (D-Calif.) ha introducido una factura Eso requeriría que las empresas de IA revelen exactamente qué obras protegidas por derechos de autor están incluidas en los conjuntos de datos que entrenan a los sistemas de IA.
La Ley de Divulgación de IA Generativa «requeriría que se envíe un aviso al Registro de Derechos de Autor antes del lanzamiento de un nuevo sistema de IA generativa con respecto a todos los trabajos protegidos por derechos de autor utilizados en la construcción o alteración del conjunto de datos de entrenamiento para ese sistema», dijo Schiff en a presione soltar.
El proyecto de ley es retroactivo y se aplicaría a todos los sistemas de IA disponibles actualmente, así como a todos los sistemas de IA futuros. Entraría en vigor 180 días después de su promulgación, y exigiría que cualquier persona que cree o modifique un conjunto de entrenamiento no solo enumere los trabajos a los que hace referencia el conjunto de datos, sino que también proporcione una URL al conjunto de datos dentro de los 30 días antes de que el sistema de IA se lance al público. . Presumiblemente, esa URL brindaría a los creadores una forma de verificar si sus materiales se han utilizado y buscar algún crédito o compensación disponible antes de que las herramientas de inteligencia artificial estén en uso.
Todos los avisos se mantendrían en una base de datos en línea disponible públicamente.
Schiff describió la ley como una defensa de «la innovación y al mismo tiempo salvaguarda los derechos y contribuciones de los creadores, asegurando que sepan cuándo su trabajo contribuye a los conjuntos de datos de entrenamiento de IA».
«Se trata de respetar la creatividad en la era de la IA y combinar el progreso tecnológico con la justicia», afirmó Schiff.
Actualmente, los creadores que no tienen acceso a conjuntos de datos de entrenamiento dependen de los resultados de los modelos de IA para determinar si sus obras protegidas por derechos de autor pueden haber sido incluidas en el entrenamiento de varios sistemas de IA. El New York Times, por ejemplo, incitó a ChatGPT a escupir extractos de sus artículos, basándose en una táctica para identificar datos de entrenamiento pidiendo a ChatGPT que produzca líneas de artículos específicos, que OpenAI lo ha descrito curiosamente como «hacking».
Según la ley de Schiff, The New York Times necesitaría consultar la base de datos para identificar todos los artículos utilizados para entrenar ChatGPT o cualquier otro sistema de inteligencia artificial.
Cualquier fabricante de IA que viole la ley se arriesgaría a recibir una «multa civil por una cantidad no inferior a 5.000 dólares», según el proyecto de ley propuesto.
En una audiencia sobre inteligencia artificial y propiedad intelectual, el representante Darrell Issa (republicano por California), que preside el Subcomité Judicial de la Cámara de Representantes sobre Tribunales, Propiedad Intelectual e Internet, le dijo a Schiff que su subcomité consideraría el proyecto de ley «reflexivo».
Schiff dijo al subcomité que el proyecto de ley es «sólo un primer paso» para «garantizar que, como mínimo», los creadores sean «conscientes de cuándo su trabajo contribuye a los conjuntos de datos de entrenamiento de IA», y dijo que «agradecería la oportunidad de trabajar con miembros de subcomité» sobre el avance del proyecto de ley.
«El rápido desarrollo de las tecnologías de IA generativa ha superado las leyes de derechos de autor existentes, lo que ha llevado a un uso generalizado de contenido creativo para entrenar modelos de IA generativa sin consentimiento ni compensación», advirtió Schiff en la audiencia.
En el comunicado de prensa de Schiff, Meredith Stiehm, presidenta del Writers Guild of America West, se unió a líderes de otros grupos creativos que celebraron el proyecto de ley como un «primer paso importante» para los titulares de derechos.
«Es necesaria una mayor transparencia y barreras de seguridad en torno a la IA para proteger a los escritores y otros creadores» y abordar «el uso sin precedentes y no autorizado de materiales protegidos por derechos de autor para entrenar sistemas generativos de IA», dijo Stiehm.
Hasta el Las preguntas más espinosas sobre derechos de autor de la IA se resuelven, Ken Doroshow, director jurídico de la Recording Industry Association of America, sugirió que el proyecto de ley de Schiff llenó un vacío importante al introducir un «mantenimiento de registros integral y transparente» que proporcionaría «uno de los pilares más fundamentales para la aplicación efectiva de las leyes de los creadores». ‘ derechos.»
Un asesor principal de Human Artistry Campaign, Moiya McTier, fue más allá y celebró que el proyecto de ley impidiera que las empresas de inteligencia artificial «explotaran» a los artistas y creadores.
«Las empresas de IA deberían dejar de esconder la pelota cuando copian trabajos creativos en sistemas de IA y adoptar reglas claras para el mantenimiento de registros que creen un campo de juego nivelado y transparente para el desarrollo y la concesión de licencias de aplicaciones y herramientas genuinamente innovadoras», dijo McTier.
Próximamente orientación sobre derechos de autor de IA
Mientras los tribunales evalúan las cuestiones de derechos de autor planteadas por artistas, autores de libros y periódicos, la Oficina de Derechos de Autor de EE. UU. Anunciado en marzo que publicaría directrices a finales de este año, pero la oficina no parece estar dando prioridad a las cuestiones sobre la formación en IA.
En cambio, la Oficina de Derechos de Autor se centrará primero en emitir orientación sobre deepfakes y resultados de IA. Esta primavera, la oficina publicará un informe que «analizará el impacto de la IA en los derechos de autor» de «réplicas digitales o el uso de la IA para replicar digitalmente las apariencias, voces u otros aspectos de las identidades de los individuos». Durante el verano, otro informe se centrará en «la protección de los derechos de autor de las obras que incorporan material generado por IA».
Con respecto al «tema de entrenar modelos de IA en obras protegidas por derechos de autor, así como cualquier consideración de licencia y cuestiones de responsabilidad», la Oficina de Derechos de Autor no proporcionó un cronograma para publicar orientación, solo confirmó que su «objetivo es finalizar el informe completo para finales de el ejercicio fiscal.»
Una vez que la orientación esté disponible, podría influir en las opiniones de los tribunales, aunque los tribunales no necesariamente tienen que aplicar las directrices de la Oficina de Derechos de Autor al sopesar los casos.
El cronograma de aspiraciones de la Oficina de Derechos de Autor parece estar adelantado a cuando se puede esperar que al menos algunos tribunales decidan sobre algunas de las cuestiones de derechos de autor más importantes para algunos creadores. La demanda colectiva planteada por autores de libros contra OpenAI, por ejemplo, no se espera que se resuelva hasta febrero de 2025, y es probable que la demanda del New York Times se produzca en un cronograma similar. Sin embargo, Artistas demandando a Stability AI enfrentará una audiencia sobre la moción de desestimación de esa compañía de IA en mayo.