Mishaal Rahman / Autoridad de Android
TL;DR
- El modelo Gemini Nano de Google pronto podría incluir resúmenes de artículos en el dispositivo.
- Gemini Nano es la versión optimizada para dispositivos móviles del modelo de lenguaje grande Google Gemini.
- Las series Pixel 8 Pro y Galaxy S24 tienen acceso a Gemini Nano y permite realizar resúmenes en la aplicación de grabación de Pixel.
Las grandes empresas tecnológicas compiten para crear lo mejor IA generativa herramientas para usuarios, desarrolladores y otras empresas. Google, por ejemplo, ofrece Geminis, que es tanto la marca de su chatbot de IA como el modelo de lenguaje grande (LLM) subyacente que lo impulsa. Gemini LLM viene en tres tamaños de modelo: Nano, Pro y Ultra. Sólo el modelo Nano es lo suficientemente pequeño como para ejecutarse localmente en dispositivos Android de alta gama como el Pixel 8 Pro y la serie Galaxy S24, mientras que los otros dos modelos se ejecutan en los servidores en la nube de Google. El pequeño tamaño de Nano en comparación con Pro y Ultra significa que sus capacidades son limitadas, pero nueva evidencia sugiere que este modelo podría obtener otra característica interesante.
Gemini Nano sólo es realmente útil para analizar o crear pequeños bloques de texto. Por ejemplo, el modelo Nano actualmente solo incluye tres funciones de IA en el Píxel 8 Pro: resúmenes de IA de grabaciones breves en la aplicación Pixel Recorder, respuestas inteligentes de IA de Gboard al chatear en WhatsApp y sugerencias de reescritura de mensajes de IA en la aplicación Mensajes de Google. El modelo Gemini Nano de Google también impulsa varios Funciones de IA de Galaxy que están disponibles en el Serie Galaxy S24como Magic Compose.
Debido a que las aplicaciones pueden aprovechar Gemini Nano a través de una API, es fácil agregar nuevas funciones de IA que dependen de ella. De hecho, la evidencia vista por Autoridad de Android sugiere que Gemini Nano pronto permitirá resúmenes de artículos basados en inteligencia artificial. En agosto, Google añadió una nueva función a su experimento Experiencia generativa de búsqueda (SGE) suite que puede generar puntos clave para cualquier página web que haya abierto en la aplicación de Google. Esta función está disponible en cualquier dispositivo Android siempre que el usuario active «SGE mientras navega» en el menú Search Labs de la aplicación de Google.
Mishaal Rahman / Autoridad de Android
Resúmenes de artículos de IA en la aplicación de Google. Créditos: Mishaal Rahman
Actualmente, esta función de resumen de artículos de IA se ejecuta en la nube, por lo que está disponible en todos los dispositivos. Los teléfonos compatibles con Gemini Nano, como el Pixel 8 Pro y la serie Galaxy S24, pronto podrán ejecutar esta función de resumen de artículos de IA en el dispositivo, si entendemos la evidencia correctamente. Para comprender la evidencia, primero debemos explicar brevemente cómo funciona Gemini Nano en Android.
En lugar de que las aplicaciones incluyan Gemini Nano por sí solas, el nuevo servicio AICore de Android se encarga de la descarga del modelo. Esto reduce los requisitos de almacenamiento y también simplifica la distribución y actualización de modelos. Las aplicaciones pueden aprovechar Gemini Nano para realizar inferencias en el dispositivo mediante el uso de una serie de API proporcionadas por el SDK AI Edge de Google. Una de estas API permite que las aplicaciones proporcionen un bloque LoRA (adaptación de rango bajo) para ajustar el modelo Gemini Nano para una tarea particular.
Mishaal Rahman / Autoridad de Android
La arquitectura de AICore. Fuente: Google.
Debido a que la seguridad de la IP y la IA del aprendizaje automático son tan importantes, Google utiliza API de descarga segura para insertar su modelo Gemini Nano y los bloques de ajuste fino de LoRA en los dispositivos. Estas API son proporcionadas por Private Compute Services de Android. Private Compute Services es una aplicación de código abierto que proporciona API para descargar modelos de aprendizaje automático desde la nube. Es parte del Private Compute Core de Android y fue creado para aislar el Inteligencia del sistema Android aplicación, que es responsable de muchas funciones impulsadas por IA, de Internet.
Mishaal Rahman / Autoridad de Android
La arquitectura del Private Compute Core de Android. Fuente: Google.
La API que utiliza AICore se llama Descarga protegida. Descarga protegida es una API que «permite la descarga de recursos al dispositivo con soporte para una verificación basada en registros de transparencia binaria, asegurando que estos sean los recursos oficiales proporcionados por Google». AICore parece utilizar la API de descarga protegida para descargar el modelo Gemini Nano, así como algunos bloques de ajuste fino de LoRA. La aplicación AICore comprende varios «clientes» de la API de descarga protegida y, recientemente, se agregó un nuevo «cliente AICore» llamado «AI_CORE_CHROME_SUMMARIZATION_OUTPUT».
Mishaal Rahman / Autoridad de Android
Si bien el parche que agregó este cliente “AI_CORE_CHROME_SUMMARIZATION_OUTPUT” no tiene una descripción que explique su propósito, suponemos, según el nombre y el propósito de la API, que la aplicación AICore pronto descargará un bloque de ajuste fino de LoRA que optimiza Resúmenes de artículos de Gemini Nano para IA. Podríamos estar equivocados, aunque tendría mucho sentido que Gemini Nano manejara resúmenes de artículos de IA en el dispositivo. Después de todo, la mayoría de los artículos en la web deberían ser lo suficientemente breves para que el modelo Gemini Nano los procese. Como referencia, Gemini Nano es capaz de resumir transcripciones de Pixel Recorder de hasta 15 minutos de duración.
Si estamos en lo cierto, esperamos que Google anuncie esta función pronto, ya que la lista de funciones de IA en el dispositivo que maneja Gemini Nano es bastante corta en este momento. Dado que esta función de resumen de artículos de IA es parte de la aplicación de Google, también esperamos que Google la habilite en la serie Galaxy S24 y no solo en el Pixel 8 Pro.