Teradata está agregando soporte para dos formatos de tablas abiertas, Iceberg apache y la Fundación Linux lago deltaa su plataforma de análisis multinube VantageCloud Lago y su motor de inteligencia artificial y aprendizaje automático Unlimited AI.
Normalmente, los formatos de tablas abiertas están diseñados para generar rendimiento para lagos de datos utilizando almacenamiento de objetos basado en la nube. El rendimiento se logra creando una capa de abstracción sobre un lago de datos mediante el uso de almacenamiento en columnas y administración de metadatos que permite a las empresas administrar y actualizar datos de manera más eficiente.
La ventaja fundamental de utilizar un formato de tabla abierta es que las empresas pueden modificar sus datos. esquema o estrategia de partición sin tener que reprocesar todo el conjunto de datos.
Varios rivales de Teradata, incluidos proveedores de software y análisis basados en la nube, como Copo de nieveestallido estelar, DracmaCloudera y Clickhouse ya son compatibles con Apache Iceberg.
El formato de tablas Delta Live de la Fundación Linux es compatible con empresas como Google Cloud, AWS y Databricks.
La adición de soporte para los formatos de tabla abierta, según Teradata, dará como resultado que sus clientes puedan permitir lectura cruzada y escritura cruzada de datos almacenados en múltiples formatos de tabla abierta.
Esta interoperabilidad se extiende a los catálogos de AWS Glue, Unity y Apache Hive y funciona en entornos de múltiples nubes y lagos de datos múltiples, dijo la compañía, y agregó que el soporte para los formatos de tabla abierta estará disponible para VantageCloud Lake y AI Unlimited en AWS y Azure en junio de 2024.
AI Unlimited estará disponible para su compra en versión preliminar pública en AWS y Azure Marketplaces en el segundo trimestre del año.
Teradata también está integrando herramientas de terceros como Airbyte Cloud, Apache Airflow y dbt.
La integración de Airbyte Cloud ayudará a agilizar la ingesta de datos en VantageCloud con un servicio totalmente administrado y alojado que elimina la necesidad de una configuración y administración de infraestructura que requiere mucho tiempo, mientras que la integración de Apache Airflow permitirá a los equipos empresariales crear, programar y monitorear flujos de trabajo mediante programación.
La integración de la herramienta dbt, por otro lado, ayuda a gestionar la parte de transformación del extraer, cargar y transformar (ETL) proceso. Se puede utilizar como herramienta para la transformación de datos en bases de datos, lagos de datos y almacenes de datosdijo la compañía, y agregó que todas las integraciones ya están disponibles de forma generalizada.
Copyright © 2024 IDG Communications, Inc.