Microsoft ha actualizado su servicio Azure AI Search para aumentar la capacidad de almacenamiento y vector tamaño del índice sin costo adicional, una medida que, según dijo, hará que sea más económico para las empresas ejecutar aplicaciones generativas basadas en IA.
Anteriormente conocido como Búsqueda cognitiva de Azure, el servicio Azure AI Search conecta almacenes de datos externos que contienen datos no indexados con una aplicación que envía consultas o solicitudes a un índice de búsqueda. Consta de tres componentes (un motor de consultas, índices y el motor de indexación) y se utiliza principalmente para recuperar información para mejorar el rendimiento de IA generativaun proceso conocido como generación aumentada de recuperación (RAG).
Los límites ampliados gratuitos solo se aplicarán a los nuevos servicios desarrollados después del 3 de abril de 2024, dijo la compañía, y agregó que no hay forma de actualizar los servicios existentes, por lo que las empresas deberán crear otros nuevos para beneficiarse del aumento de capacidades.
A diferencia de los servicios desarrollados antes de esa fecha, los nuevos servicios obtendrán un aumento de 3 a 6 veces en el almacenamiento total por partición, un aumento de 5 a 11 veces en el tamaño del índice vectorial por partición y el respaldo informático adicional del servicio admite más vectores con alto rendimiento y Mejora de hasta el doble en indexación y rendimiento de consultas.
La actualización, en promedio, reduce el costo por vector en un 85% y ahorra hasta un 75% en los costos totales de almacenamiento, escribió en un artículo Pablo Castro, ingeniero de Azure AI. entrada en el blog.
El nivel básico del servicio, según Castro, obtendrá 13 GB de almacenamiento adicional por partición después de la actualización, en comparación con solo 2 GB por partición antes.
Los niveles S1, S2 y S3 del servicio obtendrán 135 GB, 250 GB y 500 GB de almacenamiento adicionales por partición, respectivamente.
Los niveles L1 y L2 no verán cambios, dijo la compañía.
En el tamaño del índice vectorial, los niveles básico, S1, S2 y S3 tendrán una capacidad de tamaño adicional de 4 GB, 32 GB, 88 GB y 164 GB por partición, respectivamente. Nuevamente, los niveles L1 y L2 no verán cambios.
La oferta actualizada estará disponible en la mayoría de las regiones de EE. UU. y el Reino Unido, junto con otras regiones como Suiza Oeste, Suecia Central, Polonia Central, Noruega Este, Corea del Sur, Corea Central, Japón Este, Japón Oeste, Italia Norte, India Central, Jio India. Oeste, Centro de Francia, Norte de Europa, Centro de Canadá, Este de Canadá, Sur de Brasil, Asia Oriental y Sudeste Asiático.
Más funciones para optimizar el almacenamiento de vectores
Además de actualizar los tamaños de almacenamiento y de índice de vectores, la empresa está trabajando para ofrecer más funciones para optimizar el almacenamiento de vectores.
Estas funciones, que actualmente se encuentran en versión preliminar, incluyen cuantificación y tipos numéricos estrechos para vectores, entre otros ajustes.
Microsoft está utilizando la cuantificación y el sobremuestreo para comprimir y optimizar el almacenamiento de datos vectoriales, dijo Castro, y agregó que esto reduce el tamaño del índice vectorial en un 75% y el almacenamiento vectorial en disco hasta en un 25%.
Además, el ingeniero dijo que las empresas podrían utilizar tipos primitivos de campo vectorial estrecho, como int8, int16 o float16, para reducir el tamaño del índice vectorial y el almacenamiento de vectores en disco hasta en un 75%.
Otras técnicas para una mayor optimización incluyen configurar la propiedad almacenada en campos vectoriales para reducir la sobrecarga de almacenamiento.
Copyright © 2024 IDG Communications, Inc.