Inteligencia artificial generativa Los creadores de imágenes (IA) son cada vez más populares, pero su uso también ha provocado debates sobre el material protegido por derechos de autor en los conjuntos de datos de entrenamiento. Ahora nueva información sobre Adobe. Luciérnagala respuesta de la empresa a herramientas de IA generativa como A mitad del viaje y DARLEcomplica aún más la conversación.
Al igual que otros generadores de imágenes, Firefly crea contenido visual, imágenes vectoriales, efectos de texto y más a partir de indicaciones de texto ingresadas por el usuario. Pero Adobe ha posicionado a Firefly como el caso atípico en el espacio debido a su conjunto de datos, que la compañía promociona como un control de calidad.
También: Los mejores generadores de imágenes con IA para probar ahora mismo
Los grandes modelos de lenguaje (LLM) que sustentan los generadores de imágenes ingieren miles de millones de imágenes para funcionar. Licenciar adecuadamente esa cantidad de contenido es costoso, y la informática a esta escala ya es caro, lo que significa que las empresas están incentivadas a extraer contenido gratuito de Internet sin acreditar ni compensar a los creadores. Los generadores de texto populares, incluido ChatGPT, también se entrenan de esta manera, con muestras de lenguaje extraídas de la web.
Las empresas de IA están cada vez más bajo escrutinio por recopilar datos de esta manera. Difusión estable y Midjourney han sido demandado por artistas y organizaciones como Getty sobre licencias inadecuadas. En diciembre, The New York Times demandado OpenAI y Microsoft por utilizar su trabajo para entrenar ChatGPT.
Adobe sitio web dice que Firefly es «comercialmente seguro» en comparación con los productos de la competencia porque fue entrenado en «contenido con licencia, como Adobe Stock, y contenido de dominio público cuyos derechos de autor han expirado». Adobe incluso tiene un plan de compensación para ciertos contribuyentes de Stock cuyo contenido se utilizó para entrenar la primera iteración de la herramienta.
Sin embargo, Bloomberg reportado Viernes que alrededor del 5% de los datos de entrenamiento de Firefly son generados por IA, creada por competidores como Midjourney. El contenido ingresó al conjunto de datos de Firefly porque los creadores podían enviar imágenes generadas por IA al mercado Stock de Adobe, por lo que fueron compensados como parte del programa de Adobe.
Que Adobe utilice contenido sintético después de elogiar su conjunto de datos como más estricto que el de sus competidores parece contradictorio. Aunque no es un requisito legal para publicar datos de capacitación, este detalle arroja dudas sobre la validez de las afirmaciones de calidad de Adobe, especialmente considerando que esas imágenes fueron creadas utilizando herramientas que ahora están bajo fuego por derechos de autor.
A pesar de la revelación, Adobe sostiene que controla la calidad de su conjunto de datos. «Cada imagen enviada a Adobe Stock, incluido un subconjunto muy pequeño de imágenes generadas con IA, pasa por un riguroso proceso de moderación para garantizar que no incluya propiedad intelectual, marcas comerciales, personajes o logotipos reconocibles, ni nombres de artistas de referencia», dijo un portavoz de Adobe. dijo a Bloomberg.
El descubrimiento apunta a una discrepancia entre los mensajes públicos y las comunicaciones internas. Bloomberg descubrió que un gerente de relaciones con artistas de Adobe Stock publicó en una comunidad de Discord que Firefly usaría una nueva base de datos de capacitación libre de IA generativa una vez que saliera de la versión beta. Pero después del lanzamiento público de la herramienta, otro empleado de Adobe dijo en Discord que las imágenes generadas por IA «mejoran nuestro modelo de entrenamiento de conjunto de datos, y decidimos incluir este contenido para la versión comercial de Firefly».
La empresa parece estar trazando una línea entre el contenido sintético en general y los elementos específicos que necesitan licencia, pero el territorio es turbio. Queda por ver si los usuarios de Firefly encontrarán problemas de derechos de autor en el futuro. Dada la naturaleza incipiente de la generación de imágenes generativas, es seguro decir que existe un cierto nivel de riesgo legal al crear contenido con cualquiera de estas herramientas.