Google lanzó una nueva familia liviana de modelos de inteligencia artificial (IA) de código abierto llamada Gemma el miércoles 21 de febrero. Se han puesto a disposición de desarrolladores e investigadores dos variantes de Gemma, Gemma 2B y Gemma 7B. El gigante tecnológico dijo que utilizó la misma tecnología e investigación para Gemma que utilizó para crear. Geminis Modelos de IA. Curiosamente, el modelo Gemini 1.5 fue desvelado la semana pasada. Estos modelos de lenguaje más pequeños se pueden utilizar para crear herramientas de inteligencia artificial para tareas específicas, y la empresa permite el uso y la distribución comercial responsable.
El anuncio fue hecho por el CEO de Google, Sundar Pichai, en un correo en X (anteriormente conocido como Twitter). Dijo: “Gemma, que demuestra un sólido rendimiento en los puntos de referencia para la comprensión y el razonamiento del lenguaje, está disponible en todo el mundo a partir de hoy en dos tamaños (2B y 7B), admite una amplia gama de herramientas y sistemas y se ejecuta en una computadora portátil, estación de trabajo o @GoogleCloud para desarrolladores. .” La empresa también ha creado una página de inicio centrada en los desarrolladores para el modelo de IA, donde las personas pueden encontrar enlaces de inicio rápido y ejemplos de código en su página Kaggle Models, implementar rápidamente herramientas de IA a través de Vertex AI (la plataforma de Google para que los desarrolladores creen herramientas de IA/ML), o jugar con el modelo y adjuntarlo a un dominio separado usando Collab (requerirá Keras 3.0).
Al destacar algunas de las características de los modelos Gemma AI, Google dijo que ambas variantes están previamente entrenadas y ajustadas a las instrucciones. Está integrado con repositorios de datos populares como Hugging Face, MaxText, NVIDIA NeMo y TensorRT-LLM. Los modelos de lenguaje pueden ejecutarse en computadoras portátiles, estaciones de trabajo o Google Clouds a través de Vertex AI y Google Kubernetes Engine (GKE). El gigante tecnológico también lanzó un nuevo kit de herramientas de IA generativa responsable para ayudar a los desarrolladores a crear herramientas de IA seguras y responsables.
Según los informes compartidos por Google, Gemma ha superado al modelo de lenguaje Llama-2 de Meta en múltiples puntos de referencia importantes, como Massive Multitask Language Understanding (MMLU), HumanEval, HellaSwag y BIG-Bench Hard (BBH). Notablemente, Meta ya ha comenzado a trabajar en Llama-3, según diversos informes.
Lanzar modelos de lenguaje más pequeños de código abierto para desarrolladores e investigadores es algo que se ha convertido en una tendencia en el espacio de la IA. Stability, Meta, MosaicML e incluso Google con sus modelos Flan-T5 ya existen en código abierto. Por un lado, ayuda a construir un ecosistema, ya que todos los desarrolladores y científicos de datos que no trabajan con empresas de inteligencia artificial pueden probar la tecnología y crear herramientas únicas. Por otro lado, también beneficia a la empresa, ya que la mayoría de las veces las propias empresas ofrecen plataformas de implementación que vienen con una tarifa de suscripción. Además, la adopción por parte de los desarrolladores a menudo resalta fallas en los datos de entrenamiento o en el algoritmo que podrían haber escapado a la detección antes del lanzamiento, lo que permite a las empresas mejorar sus modelos.