Los derechos de autor son una especie de campo minado en estos momentos cuando se trata de AIy hay un nuevo informe que afirma que ManzanaLa IA generativa, específicamente su ‘Ájax’ Large Language Model (LLM): puede ser uno de los únicos que ha recibido formación tanto jurídica como ética. Se afirma que Manzana está tratando de respetar los estándares de privacidad y legalidad mediante la adopción de métodos de formación innovadores.
La ley de derechos de autor en la era de IA generativa Es difícil de navegar y se está volviendo cada vez más importante a medida que las herramientas de inteligencia artificial se vuelven más comunes. Una de las cuestiones más evidentes que surge, una y otra vez, es que muchas empresas entrenan sus modelos de lenguajes grandes (LLM) utilizando obras protegidas por derechos de autor y, por lo general, no revelan si tienen licencia para ese material de capacitación. A veces, los resultados de estos modelos incluyen secciones enteras de obras protegidas por derechos de autor.
La justificación actual de por qué el material protegido por derechos de autor se utiliza tan ampliamente en algunas de estas empresas para capacitar a sus LLM es que, al igual que los humanos, estos modelos necesitan una cantidad sustancial de información (llamada datos de capacitación para LLM) para aprender y generar información coherente. y respuestas convincentes, y en lo que respecta a estas empresas, los materiales protegidos por derechos de autor son presa fácil.
Muchos críticos de la IA generativa consideran una infracción de los derechos de autor si las empresas de tecnología utilizan trabajos en la formación y producción de LLM sin acuerdos explícitos con los titulares de los derechos de autor o sus representantes. Aún así, esta crítica no ha disuadido a las empresas de tecnología de hacer exactamente eso, y se supone que es el caso de la mayoría de las herramientas de IA, generando un creciente resentimiento hacia las empresas en el espacio de la IA generativa.
El bosque de batallas legales y dilemas éticos en la IA generativa
Incluso ha habido un número creciente de desafíos legales en dirección a estas empresas de tecnología. AbiertoAI y microsoft en realidad han sido demandado por el New York Times por infracción de derechos de autor en diciembre de 2023, y el editor acusó a las dos empresas de capacitar a sus LLM en millones de artículos del New York Times. En septiembre de 2023, OpenAI y Microsoft también fueron demandados por varios autores destacados, incluidos George RR Martin, Michael Connelly y Jonathan Franzen. En julio de 2023, más de 15.000 autores firmó una carta abierta dirigido a empresas como microsoft, AbiertoAImeta, Alfabetoy otros, pidiendo a los líderes de la industria tecnológica que protejan a los escritores, pidiendo a estas empresas que den crédito y compensen adecuadamente a los autores por sus trabajos cuando los utilicen para entrenar modelos de IA generativa.
En abril de este año, El Registro informó eso Amazonas fue demandada por un ex empleado alegando que enfrentó maltrato, discriminación y acoso, y en el proceso, testificó sobre su experiencia en lo que respecta a cuestiones de infracción de derechos de autor. Esta empleada alega que le dijeron que ignorara y violara deliberadamente la ley de derechos de autor para mejorar Amazonaspara hacerlos más competitivos, y que su supervisor le dijo que «todos los demás lo están haciendo» cuando se trataba de violaciones de derechos de autor. Apple Insider se hace eco de esta afirmaciónafirmando que este parece ser un estándar aceptado en la industria.
Como hemos visto con muchas otras tecnologías novedosas, la legislación y los marcos éticos siempre llegan después de un retraso inicial, pero parece que esto se está convirtiendo en un aspecto más problemático de los modelos de IA generativa al que las empresas responsables de ellos tendrán que responder.
El enfoque de Apple para el entrenamiento ético en IA (que conocemos hasta ahora)
Parece que al menos uno de los principales actores tecnológicos podría estar intentando tomar el camino más cuidadoso y considerado para evitar tantos desafíos legales (¡y morales!) como sea posible; y, sorprendentemente, es Apple. Según información privilegiada de Apple, Apple ha estado buscando diligentemente la concesión de licencias para los trabajos de las principales publicaciones de noticias cuando buscaba material de capacitación en inteligencia artificial. En diciembre, Apple solicitó la licencia de los archivos de varias editoriales importantes utilizarlos como material de formación para su propio LLM, conocido internamente como Ajax.
Se especula que Ajax será el software para la funcionalidad básica del dispositivo para futuros productos Apple y, en su lugar, podría otorgar licencias de software como Géminis de Google para funciones más avanzadas, como aquellas que requieren una conexión a Internet. Apple Insider escribe que esto permite a Apple evitar ciertas responsabilidades por infracción de derechos de autor, ya que Apple no sería responsable de la infracción de derechos de autor por, por ejemplo, Google Geminis.
Un artículo publicado en marzo. detalló cómo Apple pretende entrenar su LLM interno: una selección cuidadosamente elegida de imágenes, imagen-texto y entrada basada en texto. En sus métodos, Apple priorizó simultáneamente mejores subtítulos de imágenes y razonamiento de varios pasos, al mismo tiempo que prestaba atención a preservar la privacidad. El último de estos factores se hace aún más posible para Ajax LLM al estar completamente en el dispositivo y, por lo tanto, no requiere una conexión a Internet. Hay una compensación, ya que esto significa que Ajax no podrá comprobar si hay contenido protegido por derechos de autor y plagio en sí, ya que no podrá conectarse a bases de datos en línea que almacenen material protegido por derechos de autor.
Hay otra advertencia que Apple Insider revela sobre esto cuando habla con fuentes que están familiarizadas con los entornos de prueba de inteligencia artificial de Apple: actualmente no parece haber muchas restricciones, si es que hay alguna, para que los usuarios utilicen material protegido por derechos de autor como entrada para entornos de prueba de dispositivos. También vale la pena señalar que Apple no es técnicamente la única empresa que adopta un enfoque que prioriza los derechos: la herramienta de inteligencia artificial del arte. Adobe luciérnaga También se afirma que cumple completamente con los derechos de autor, por lo que es de esperar que más empresas emergentes de IA sean lo suficientemente inteligentes como para seguir a Apple y AdobeEl plomo.
Personalmente, doy la bienvenida a este enfoque de Apple porque creo que la creatividad humana es una de las capacidades más increíbles que tenemos, y creo que debería ser recompensada y celebrada, no alimentada a una IA. Tendremos que esperar para saber más sobre cómo son las regulaciones de Apple con respecto a los derechos de autor y el entrenamiento de su IA, pero estoy de acuerdo con Evaluación de Apple Insider que esto definitivamente suena como una mejora, especialmente porque se ha documentado que algunas IA regurgitan palabra por palabra material protegido por derechos de autor. Podemos esperar aprender más sobre los esfuerzos de IA generativa de Apple muy pronto, que se espera que sea un impulsor clave para su conferencia de software centrada en desarrolladores. WWDC 2024.