El año pasado, Stack Overflow se convirtió en uno de los primeros sitios web en anunciar que cobraría a los gigantes de la IA por el acceso al contenido utilizado para entrenar chatbots. Ahora el popular servicio de preguntas y respuestas para programadores ha contratado a su primer cliente, Google, en lo que el director ejecutivo Prashanth Chandrasekar dice que es el comienzo de una nueva corriente de ingresos “significativa”.
El acuerdo es importante porque aún no está claro en qué medida pagarán Google y otros desarrolladores de IA por el contenido necesario para los proyectos de IA. Millones de libros y sitios web han impulsado el desarrollo de sistemas de inteligencia artificial, pero la mayoría de los editores no han recibido compensación y algunos están demandando por lo que alegan es un mal uso. Muchos editores, incluido Stack Overflow, parecen amenazados por ChatGPT y otros productos de inteligencia artificial generativa, que pueden responder consultas que anteriormente les habrían enviado los codificadores.
El acuerdo permitirá que la división de nube de Google utilice preguntas y respuestas de Stack Overflow sobre los servicios de Google Cloud para brindar asistencia de codificación y soporte técnico a través de una versión del chatbot Gemini de Google. Los clientes de computación en la nube de Google también podrán hacer preguntas a través de la interfaz de línea de comandos de Google Cloud. «Es posible que su IA no tenga todas las respuestas, por lo que tenemos una enorme capacidad para ayudar a completar ese ciclo», afirma Chandrasekar. «Somos el lugar más grande donde se cura y valida el conocimiento de la comunidad».
Gemini resumirá las respuestas extraídas de Stack Overflow en sus propias palabras, pero incluirá el logotipo de la empresa, un enlace al material original y el nombre de usuario del colaborador del sitio que lo proporcionó. Las empresas planean hacer una demostración del sistema en Google Cloud Next, la conferencia anual sobre la nube de la empresa de búsqueda en abril, y lanzarlo poco después.
Chandrasekar dice que no existen restricciones significativas sobre cómo Google Cloud puede usar los datos de Stack Overflow, lo que significa que se puede usar para entrenar modelos de lenguaje grandes y otros sistemas de inteligencia artificial. “Donde queremos mantenernos firmes es—cosas no negociables para nosotros— confianza, precisión, calidad y atribución a las fuentes de estos resultados de IA”, afirma.
Se negó a decir cuánto le paga Google a Stack Overflow por los datos. «Esta será una oferta comercial significativa para nosotros a corto, mediano y largo plazo», afirma Chandrasekar.
Raspado encubierto
Google y otros desarrolladores de inteligencia artificial han recopilado datos de Stack Overflow y otros sitios web sin previo aviso. A medida que la demanda de tecnologías de IA generativa ha aumentado (y las valoraciones de las empresas que las desarrollan se han disparado), los sitios web que suministran el texto fundacional han comenzado a exigir lo que consideran que les corresponde. Afortunadamente para Stack Overflow, los clientes potenciales han prestado atención al mensaje, dice Chandrasekar. «No tenemos que perseguir a la gente», afirma.
Los datos de Stack Overflow son particularmente beneficiosos para Sistemas de IA que generan código informáticoque han demostrado ser popular entre los ingenieros de software y una importante fuente de ingresos para Microsoft y OpenAI.
El nuevo acuerdo de Stack Overflow llega apenas una semana después Google llegó a un acuerdo de licencia para recoger datos de Reddit, el operador de foros de discusión, cuyo contenido ha ayudado a la capacidad de los chatbots para conversar. Reddit había revelado planes para comenzar a cobrar por el acceso a los datos justo antes de que Stack Overflow lo hiciera el año pasado.