Zilliz, con sede en San Francisco, ha lanzado una nueva versión de su Base de datos como servicio (DBaaS) oferta, Zilliz Cloud. La compañía afirma que la nueva versión ofrece un mejor rendimiento y reduce el costo de propiedad en comparación con su versión anterior.
Zilliz Cloud está construido sobre código abierto Sistema de gestión de bases de datos vectoriales Milvus. Zilliz fue fundada por ingenieros que ayudaron a desarrollar la base de datos de vectores Milvus.
La nueva versión de Zilliz Cloud, según la empresa, ofrece un rendimiento 10 veces mejor que la base de datos vectorial Milvus original. Esto se logra utilizando el índice gráfico Hierarchical Navigable Small World (HNSW) en combinación con una búsqueda filtrada mejorada.
HNSW, sin embargo, es algo en juego para la mayoría bases de datos vectoriales, incluidos los de sus rivales Weaviate y Pinecone. Es uno de los índices gráficos más populares para crear bases de datos vectoriales.
«HNSW es cada vez más una capacidad imprescindible, por lo que Zilliz estaría en desventaja sin el respaldo de su DBMS», dijo Doug Henschen, analista principal de Constellation Research.
La razón detrás de la popularidad de los índices basados en gráficos se puede atribuir a su cualidad fundamental de poder encontrar los vecinos más cercanos aproximados en datos de alta dimensión y al mismo tiempo ser eficientes en cuanto a memoria. Esta cualidad da como resultado un aumento del rendimiento y una reducción del coste de propiedad.
Otro ejemplo de índice basado en gráficos es Vamana. Otros tipos de índices utilizados en bases de datos vectoriales incluyen el índice de archivos invertidos (IVF).
Las características adicionales de la actualización de Zilliz Cloud incluyen la métrica de similitud de coseno, búsqueda de rango y upsert.
La métrica de similitud del coseno se utiliza a menudo para el procesamiento de texto, donde la dirección de los vectores de incrustación es importante pero la distancia entre ellos no.
Se utiliza una búsqueda de rango en una base de datos de vectores para limitar los resultados de la búsqueda en función de la distancia entre un vector de consulta y los vectores de la base de datos.
La función upsert, en una base de datos de vectores, se utiliza para agregar un nuevo vector al índice o actualizar uno si existe un vector con el mismo ID.
Además de proporcionar un cliente Milvus unificado que, según Zilliz, mejorará la experiencia del desarrollador, la nueva versión de Zilliz Cloud se puede integrar con análisis de datos. aprendizaje automáticoy plataformas de streaming como chispa apache, Apache Kafkay Airbyte.
A pesar de las ventajas de la nueva versión, Henschen de Constellation Research cree que muchas empresas recurrirán a las bases de datos convencionales que ya utilizan para capacidades tales como incrustaciones de vectores y búsqueda vectorial.
«El desafío para proveedores como Zilliz es que normalmente no tienen consigo los datos transaccionales de la empresa», dijo Holger Mueller, otro analista principal de Constellation Research.
“O tienen que ofrecer la facilidad de uso para obtener datos transaccionales en ellos o necesitan tener una solución que ayude a las empresas a actualizar los vectores de su sistema de registro. No hacerlo obligará a las empresas a mirar sus bases de datos existentes, como las de Oracle, AWS, IBM y Microsoft”, añadió Mueller.
La competencia es aún más dura para Zilliz, ya que rivales como Piña También ofrecen sus productos como servicios basados en la nube, añadió Henschen.
Sin embargo, el analista dijo que los equipos y desarrolladores de IA dedicados pueden encontrar ventajas de rendimiento y costos al utilizar un producto o servicio de base de datos vectorial dedicado, suponiendo que proporcione todas las características que necesitan para respaldar sus casos de uso.
Copyright © 2024 IDG Communications, Inc.