“Actualmente se utiliza un proceso llamado aprendizaje por refuerzo a partir de la retroalimentación humana en todos los modelos de última generación” para afinar sus respuestas, dice Baum. La mayoría de las empresas de IA tienen como objetivo crear sistemas que parezcan neutrales. Si los humanos que dirigen la IA ven un aumento en el contenido de derecha pero lo consideran inseguro o incorrecto, podrían deshacer cualquier intento de alimentar a la máquina con una determinada perspectiva.
La portavoz de OpenAI, Kayla Wood, dice que en la búsqueda de modelos de IA que «representen profundamente todas las culturas, industrias, ideologías e idiomas», la empresa utiliza amplias colecciones de datos de capacitación. «Cualquier sector (incluidas las noticias) y cualquier sitio de noticias es una pequeña porción de los datos de capacitación generales y no tiene un efecto mensurable en el aprendizaje y el resultado previstos del modelo», afirma.
Luchas por los derechos
La desconexión entre los sitios de noticias que bloquean los rastreadores de IA también podría reflejar una división ideológica en materia de derechos de autor. El New York Times es actualmente demandando OpenAI por infracción de derechos de autor, argumentando que la recopilación de datos de la empresa emergente de IA es ilegal. Otros líderes de los principales medios de comunicación también ven este raspado como un robo. Roger Lynch, director ejecutivo de Condé Nast, recientemente dijo en una audiencia en el Senado que muchas herramientas de inteligencia artificial se han construido con «bienes robados». (WIRED es propiedad de Condé Nast). Los jefes de los medios de comunicación de derecha han estado en gran medida ausentes del debate. ¿Quizás permiten silenciosamente la extracción de datos porque respaldan el argumento de que la extracción de datos para crear herramientas de inteligencia artificial está protegida por la doctrina del uso legítimo?
Para un par de los nueve medios de derecha contactados por WIRED para preguntar por qué permitían raspadores de IA, sus respuestas apuntaron a una razón diferente y menos ideológica. El Examinador de Washington no respondió a las preguntas sobre sus intenciones, pero comenzó a bloquear el GPTBot de OpenAI dentro de las 48 horas posteriores a la solicitud de WIRED, lo que sugiere que es posible que no haya conocido previamente ni haya priorizado la opción de bloquear los rastreadores web.
Mientras tanto, el Daily Caller admitió que su permisividad hacia los rastreadores de IA había sido un simple error. “No respaldamos que los robots roben nuestra propiedad. Esto debe haber sido un descuido, pero ya se está solucionando”, dice el cofundador y editor de Daily Caller, Neil Patel.
Los medios de derecha son influyentes y notablemente hábiles a la hora de aprovechar plataformas de redes sociales como Facebook para compartir artículos. Pero medios como el Examinador de Washington y el Daily Caller son pequeños y delgados en comparación con los gigantes de los medios del establishment como Los New York Timesque cuentan con amplios equipos técnicos.
El periodista de datos Ben Welsh mantiene un recuento actualizado de los sitios web de noticias que bloquean los rastreadores de IA de OpenAI, Google y el proyecto sin fines de lucro Common Crawl cuyos datos se utilizan ampliamente en IA. Sus resultados encontraron que aproximadamente el 53 por ciento de los 1.156 editores de medios encuestados bloquean uno de esos tres bots. El tamaño de su muestra es mucho mayor que el de Originality AI e incluye sitios de noticias más pequeños y menos populares, lo que sugiere que los medios con mayor personal y mayor tráfico tienen más probabilidades de bloquear los robots de IA, tal vez debido a mejores recursos o conocimientos técnicos.
Al menos un sitio de noticias de tendencia derechista está considerando cómo podría aprovechar la forma en que sus principales competidores están tratando de obstaculizar los proyectos de inteligencia artificial para contrarrestar los sesgos políticos percibidos. “Nuestros términos legales prohíben el scraping y estamos explorando nuevas herramientas para proteger nuestra propiedad intelectual. Dicho esto, también estamos explorando formas de ayudar a garantizar que la IA no termine con los mismos prejuicios que la prensa del establishment”, dice la portavoz del Daily Wire, Jen Smith. A día de hoy, GPTBot y otros robots de IA todavía podían extraer contenido del Daily Wire.