Gradient de Google respalda Send AI para ayudar a las empresas a extraer datos de documentos complejos

Una incipiente startup holandesa quiere ayudar a las empresas a obtener datos adicionales de grandes volúmenes de documentos complejos donde la precisión y la seguridad son primordiales, y acaba de conseguir el respaldo de Gradient Ventures de Google para hacerlo.

Enviar IAcomo se llama la startup, está asumiendo a los titulares establecidos en el espacio de procesamiento de documentos. como UiPath, Abby, Rossumy cofaxcon una plataforma personalizable que permite a las empresas ajustar los modelos de IA para sus propias necesidades individuales de extracción de datos.

Por ejemplo, una empresa que opera en una industria altamente regulada como la de seguros probablemente tendrá que procesar innumerables formatos, desde archivos PDF y archivos en papel hasta fotografías de teléfonos inteligentes tomadas con todo tipo de orientaciones y “ruido” de fondo. Estos tipos de datos “no estructurados” no estándar pueden ser bastante complicados de analizar para los humanos, pero un enfoque completamente dirigido por máquinas puede generar rechazos o reembolsos erróneos de reclamaciones y dolores de cabeza administrativos en el futuro.

De hecho, el software de procesamiento de documentos típico y disponible a menudo está diseñado para tipos de documentos más comunes que se cruzan con múltiples industrias, lo que los hace inadecuados para ciertos casos de uso. Con Send AI, por otro lado, las empresas pueden entrenar un modelo de visión por computadora para reconocer documentos específicos y un modelo de lenguaje separado para extraer y validar los datos relevantes, con humanos conectados si hay alguna duda, para controlar y revisar cada uno. paso a través de una interfaz web.

«Esta validación puede ser tan simple como verificar si un número esperado es realmente un número, o una búsqueda más sofisticada de un número de registro en una base de datos para ver si hay una coincidencia», dijo el fundador y director ejecutivo de Send AI. Thomas Trentelman dijo a TechCrunch. «Cualquier inseguridad será reportada para revisión humana».

Fundada en Ámsterdam en 2021 inicialmente como Autopilot, Send AI recaudó anteriormente una pequeña inversión de 100.000 dólares de un fondo de exalumnos universitarios, pero a medida que comienza a acelerar las cosas, ahora ha recaudado otros 2,2 millones de euros (2,4 millones de dólares) en un presupuesto previo. -Ronda inicial de financiación codirigida por Gradient Ventures de Google y Keen Venture Partners, con la participación de varios ángeles procedentes de empresas como DeepMind.

Cómo funciona

Las empresas pueden acceder al software basado en la nube de Send AI a través de API que canalizan datos de documentos enviados por correo electrónico. Al recibirlos, Send AI mejora visualmente los documentos antes de enviarlos a sus modelos de lenguaje para su clasificación y extracción.

En términos de mercado objetivo, Trentelman dice que la empresa se dirige principalmente a empresas más grandes, ya que son las que «luchan más con los documentos», aunque en realidad cualquier empresa que procese grandes volúmenes de documentos podría encontrar un uso para la tecnología.

Créditos de imagen Enviar IA: extracción de datos

Quizás no hace falta decir que, además de la gran cantidad de herramientas de procesamiento de documentos existentes que ya están en el mercado, Send AI se enfrenta a una nueva generación de nuevas empresas que venden servicios basados en nuevos y potentes modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés) como lo está haciendo OpenAI con GPT-X (que impulsa ChatGPT). Pero si bien Trentelman admite que dichos productos funcionan muy bien para situaciones que requieren una puntuación “subjetivamente buena”, como resúmenes o respuestas a preguntas, donde se necesita un alto grado de precisión en grandes volúmenes de documentos, es una historia diferente.

“Estas tecnologías se toparán con obstáculos más temprano que tarde: los LLM grandes y genéricos siguen siendo impredecibles, lentos y costosos”, dijo Trentelman. «En Send AI, permitimos que el cliente cree su propia solución».

En su interior, Send AI se basa en modelos más pequeños y de código abierto que el cliente entrena primero procesando un pequeño conjunto de documentos a mano, después de lo cual enjuaga y repite documentos nuevos con humanos disponibles para realizar las correcciones.

En términos de precios, Send AI cobra sobre una base básica basada en crédito, por lo que los clientes pagan por paso de procesamiento. «De esta manera, podemos diferenciar entre procesar un PDF de 50 páginas o simplemente un fragmento de texto», dijo Trentelman. “Nuestros modelos son baratos, rápidos y confiables, por lo que podemos implementarlos por cliente. De esta manera, los clientes tienen el control de sus datos y su rendimiento, razón por la cual nos va bien en industrias reguladas como las de seguros médicos y el gobierno”.

Control

Send AI afirma que su tecnología atraerá a industrias altamente reguladas debido al control que brinda a los clientes sobre sus datos, lo que puede parecer contradictorio dado que todo está basado en la nube. Sin embargo, Trentelman señala cómo funciona un LLM típico de OpenAI. cara a cara la forma en que podría combinar datos de entrenamiento de varios clientes diferentes en un solo modelo, lo que aumenta el potencial de fuga de datos confidenciales. Esta es precisamente la razón por la que hemos visto una gran cantidad de nuevas empresas surgir con el promesa de proteger datos privados dentro del software impulsado por LLM.

Send AI intenta abordar estas preocupaciones mediante la implementación de modelos de transformadores de código abierto pequeños y aislados para cada cliente.

«Utilizamos una variedad de ellos para realizar el trabajo; desde el primer momento no impresionan mucho, pero una vez entrenados con datos de alta calidad, se vuelven poderosos y precisos», dijo Trentelman.

Entonces, si bien los modelos y los datos de entrenamiento asociados aún se encuentran en la nube de Send AI, el uso de modelos aislados significa que puede identificar exactamente dónde se encuentran los datos y, por lo tanto, eliminarlos cuando se solicite. Esto, según Trentelman, es suficiente para convertirlo en un «candidato preferido» sobre otros proveedores, y contribuye en cierta medida a convencer a las empresas centradas en la privacidad de los datos de que las implementaciones locales no son su única opción.

«Hoy en día, más empresas reguladas permiten a los proveedores utilizar la nube pública, siempre que cumplan con una extensa lista de regulaciones», dijo Trentelman. «Desde el principio siempre nos preguntamos si podríamos implementar en las instalaciones, pero finalmente todas las empresas, excepto una, optaron por nuestra oferta de nube pública».

Por ahora, Send AI está funcionando en modo beta privado, aunque ya cuenta con algunos clientes impresionantes, incluido el gigante de seguros Axa. Con un equipo de siete personas en la actualidad, la compañía planea utilizar su nueva inyección de efectivo para duplicar su plantilla a lo largo del año antes de un lanzamiento comercial completo.

Enlace fuente