Google está organizando una versión de su conferencia Cloud Next en Tokio esta semana y está poniendo el foco directamente en ajustar sus bases de datos para cargas de trabajo de IA (porque en este punto en 2024, la IA es lo único de lo que estas grandes empresas tecnológicas quieren hablar). Esto incluye actualizaciones a su base de datos Spanner SQL, que ahora cuenta con soporte de búsqueda de gráficos y vectores, así como capacidades extendidas de búsqueda de texto completo.
Este no sería un anuncio de Google sin algunos Geminis-Funciones potenciadas. Estas incluyen Gemini en BigQuery y Looker para ayudar a los usuarios con la ingeniería y el análisis de datos, así como con las tareas de gobernanza y seguridad.
Google sostiene que, si bien la gran mayoría de las empresas piensan que la IA generativa será fundamental para el éxito de su negocio, también saben que gran parte de sus datos permanecen sin gestionar, lo que los deja fuera del alcance de sus iniciativas de análisis e IA.
“Tienen que salir realmente de todos sus silos e islas de datos existentes y llegar a una plataforma de datos multimodal consolidada, que abarque datos estructurados y no estructurados. [because] «GenAI es fantástico para analizar datos no estructurados y combinar datos en reposo con su movimiento, lo que permite procesar datos en reposo y en tiempo real», explicó Gerrit Kazmaier, vicepresidente y director general de bases de datos, análisis de datos y Looker de Google. Según él, muchas de estas nuevas funciones se basan en activar este flujo de datos empresariales.
Spanner obtiene capacidades gráficas y vectoriales
Spanner es el motor de la mayoría de los productos de Google, como Search, Gmail y YouTube, y su lista de clientes incluye empresas como Home Depot, Uber, Walmart y otras. Y si bien Spanner puede manejar un volumen masivo de datos, las bases de datos vectoriales y gráficas son una necesidad para incorporar datos empresariales a las aplicaciones GenAI y enriquecer los modelos de base existentes.
“Lo que estamos pensando es qué se necesitaría realmente para que tomáramos la disponibilidad, la escala y el modelo relacional de Spanner y realmente lo ampliáramos para convertirlo en la mejor plataforma de datos para aplicaciones GenAI operativas”, dijo Andi Gutmans, vicepresidente y gerente general de bases de datos de Google. Al igual que muchos proveedores de bases de datos, el primer paso para Google es agregar capacidades gráficas a Spanner, utilizando el estándar emergente GraphQL. Las empresas pueden luego usar este gráfico para aumentar sus aplicaciones GenAI (y los modelos básicos que las impulsan) utilizando la generación aumentada de recuperación (RAG), que actualmente es el estándar de facto para este caso de uso.
Otra novedad de Spanner es la búsqueda de texto completo y la búsqueda vectorial, con las capacidades de búsqueda vectorial respaldadas por el algoritmo ScaNN de Google. “Con Spanner Graph, la búsqueda de texto completo y la búsqueda vectorial, hemos evolucionado Spanner de ser la base de datos más disponible, globalmente consistente y escalable, a una base de datos multimodelo con capacidades inteligentes que interoperan sin problemas para permitirle ofrecer una nueva clase de aplicaciones habilitadas para IA”, afirma Google.
Además de estas actualizaciones centradas en la IA, Spanner contará con una nueva estructura de precios opcional. La idea, denominada “ediciones Spanner”, es ofrecer un modelo de precios por niveles que les brinde más flexibilidad. En la actualidad, los clientes de Google Cloud tenían que elegir entre una oferta para una sola región y una versión para varias regiones, que también ofrecía un paquete de funciones adicionales, como la replicación.
Bigtable se pasa a SQL
Google también anunció el jueves una importante actualización de Bigtable, la base de datos NoSQL de Google para datos no estructurados y cargas de trabajo sensibles a la latencia. Bigtable ahora cuenta con compatibilidad con SQL (o, más precisamente, compatibilidad con GoogleSQL, el dialecto SQL propio de la empresa), lo que facilita considerablemente el uso del servicio para prácticamente cualquier desarrollador.
Anteriormente, los desarrolladores tenían que usar la API de Bigtable para consultar sus bases de datos. Actualmente, Bigtable admite aproximadamente 100 funciones SQL.
Oracle en Google Cloud
Para los fanáticos de las bases de datos Oracle, Google ahora les permitirá alojar sus servicios de bases de datos Oracle Exadata y Autonomous directamente en los centros de datos de Google Cloud, y podrán vincular sus aplicaciones entre Google Cloud y Oracle Cloud. Para Google, eso significa más cargas de trabajo en su nube y, al menos para Oracle, significa que estos usuarios siguen pagando sus tarifas de licencia, incluso si no están usando la nube de Oracle.
Otra novedad de Google Cloud es el soporte de Apache Spark y Kafka de código abierto para la transmisión y procesamiento de datos, así como la transmisión en tiempo real desde Analytics Hub (el servicio de Google para compartir datos de forma segura entre organizaciones).