Cómo RAG mejora aún más las herramientas de IA generativa

A medida que más organizaciones recurren a herramientas de inteligencia artificial generativa (genAI) para transformar cantidades masivas de datos no estructurados y otros activos en información utilizable, es fundamental poder encontrar el contenido más relevante durante el proceso de generación de IA.

Recuperación de generación aumentada o «RAG» para abreviar, es una tecnología que puede hacer precisamente eso mediante la creación de un modelo genAI más personalizado que permite respuestas más precisas y específicas a las consultas.

Grandes modelos de lenguaje (LLM), también llamados modelos de aprendizaje profundo, son la base de la tecnología genAI; están previamente entrenados en grandes cantidades de datos no etiquetados o no estructurados que, cuando un modelo está disponible para su uso, pueden estar desactualizados y no ser específicos de una tarea.

Los LLM pueden consistir en una red neuronal con miles de millones o incluso un billón o más de parámetros. RAG optimiza el resultado de un LLM al hacer referencia (acceder) a una base de conocimientos externa fuera de la información sobre la cual fue entrenado. En otras palabras, RAG permite a genAI encontrar y utilizar información externa relevante, a menudo de fuentes de datos patentadas de una organización u otro contenido al que está dirigida.

No sólo amplifica la base de conocimientos de un LLM «sino que también mejora significativamente la precisión y contextualidad de sus resultados». Microsoft explicó en un blog.

RAG es esencialmente un patrón de diseño que utiliza la funcionalidad de búsqueda para recuperar datos pertinentes y agregarlos al mensaje de un modelo genAI para fundamentar mejor la salida generativa con información nueva y objetiva.

«RAG se puede utilizar tanto para recuperar datos públicos de Internet como para recuperar datos de bases de conocimiento privadas», según Gartner Research.

Patrick Lewis, científico investigador del procesamiento del lenguaje natural de puesta en marcha cohereacuñó originalmente el término RAG en un artículo publicado en 2020. Lewis señaló que los LLM no pueden expandir o revisar fácilmente su memoria y no pueden proporcionar información directa sobre sus predicciones, lo que provoca «alucinaciones».

La semana pasada, Slack presentó herramientas basadas en inteligencia artificial para empresas y citó a RAG como una forma en que la compañía espera reducir las alucinaciones en los resultados de genAI.

Además de Cohere, más de media docena de vendedores Proporcionar soluciones nativas o independientes para que los desarrolladores creen aplicaciones basadas en RAG para un LLM. Incluyen Vectara, AbiertoAI, Búsqueda de Microsoft Azure, IA de vértice de Google, LangChain, LlamaIndex y Ladrillos de datos.

«Cada vez más, las soluciones en torno a RAG (y permitir que las personas las utilicen de manera más efectiva) se centrarán en vincular los datos correctos que tengan valor comercial en lugar de solo las mejoras brutas de productividad», dijo Rick Villars, vicepresidente del grupo IDC. de la investigación mundial.

Con RAG, las organizaciones pueden maximizar las posibilidades de producir resultados precisos basados en datos factuales, dijo Avivah Litan, distinguido vicepresidente analista de Gartner. También minimiza las posibilidades de sufrir alucinaciones, ya que las salidas se basan en los datos recuperados.

RAG también permite a los trabajadores encontrar, resumir y utilizar la información que buscan más rápido utilizando el poder de los LLM de terceros aplicados a los datos propios de una organización. También ayuda a proteger a la organización de la responsabilidad incurrida cuando se incorporan materiales con derechos de autor u otros materiales protegidos por propiedad intelectual en las respuestas de LLM.

«Esta posibilidad se reduce considerablemente porque las respuestas rápidas pueden basarse en datos empresariales», dijo Litan.

Una forma de obtener un mejor acceso a la información empresarial utilizando RAG es con una base de datos vectorial y tecnologías de gráficos que puedan aprovechar datos patentados y permitir que una organización profundice verdaderamente en el valor empresarial, dijo Villars.

Una base de datos vectorial almacena, indexa y gestiona cantidades masivas de datos vectoriales de alta dimensión de manera eficiente; Como resultado, las empresas están gastando dinero para desarrollarlos o agregar capacidades de búsqueda vectorial a sus bases de datos SQL o NoSQL existentes y casos de uso y aplicaciones genAI.

Según Gartner Research, para 2026, se espera que más del 30% de las empresas adopten bases de datos vectoriales para fundamentar sus modelos básicos con datos comerciales relevantes. Gartner enumera las bases de datos vectoriales como tecnología empresarial “facilitadora crítica” para 2024.

Los usos populares de las bases de datos vectoriales incluyen recomendaciones de productos, búsqueda de similitudes, detección de fraude y aplicaciones de preguntas y respuestas impulsadas por IA generativa, según Gartner.

Las bases de datos vectoriales pueden y a menudo lo hacen Servir como columna vertebral de los sistemas RAG.. Las bases de datos almacenan y gestionan datos normalmente derivados de texto, imágenes o sonidos, que se convierten en vectores matemáticos.

^“La otra parte tiene que ver con la modernización de las aplicaciones”, dijo Villars. “Una de las bases de instalación heredadas más importantes que tienen las empresas en la actualidad son las antiguas aplicaciones cliente-servidor e incluso las primeras aplicaciones móviles y en la nube creadas en Java. Tenemos que modernizarlos para que formen parte de esta historia de la IA”.

Enlace fuente