La IA Géminis de Google Solo ha existido durante dos meses al momento de escribir este artículo y ya la compañía está lanzando su modelo de próxima generación denominado Gemini 1.5.
El publicación de anuncio entra en el meollo de la cuestión explicando en detalle todas las mejoras de la IA. Todo es bastante técnico, pero lo principal es que Gemini 1.5 ofrecerá un «rendimiento dramáticamente mejorado». Esto se logró con la implementación de una «arquitectura de mezcla de expertos» (o MoE para abreviar) que ve múltiples modelos de IA trabajando juntos. al unísono La implementación de esta estructura hizo que Gemini fuera más fácil de entrenar y más rápido en el aprendizaje de tareas complicadas que antes.
Hay planes para implementar la actualización en las tres versiones principales de la IA, pero la única que se lanza hoy para pruebas tempranas es Gemini 1.5 Pro.
Lo que es único es que el modelo tiene «una ventana de contexto de hasta 1 millón de tokens». Fichas, en lo que se refiere a la IA generativa, son los datos más pequeños que los LLM (grandes modelos de lenguaje) utilizan «para procesar y generar texto». Las ventanas de contexto más grandes permiten que la IA maneje más información a la vez. Y un millón de tokens es una cifra enorme, que supera con creces lo que puede hacer el GPT-4 Turbo. OpenAI El motor, a modo de comparación, tiene un límite de ventana de contexto de 128.000 tokens.
Géminis Pro en acción
Con todos estos números, la pregunta es ¿cómo se ve Gemini 1.5 Pro en acción? Google Hizo varios videos que muestran las habilidades de la IA. Es cierto que es algo bastante interesante, ya que revela cómo el modelo actualizado puede analizar y resumir grandes cantidades de texto según un mensaje.
en un ejemplo, le dieron a Gemini 1.5 Pro la transcripción de más de 400 páginas de la misión lunar del Apolo 11. Mostró que la IA podía «comprender, razonar e identificar» ciertos detalles en el documento. El apuntador le pide a la IA que localice «momentos cómicos» durante la misión. Después de 30 segundos, Gemini 1.5 Pro logró encontrar algunos chistes que los astronautas hicieron mientras estaban en el espacio, incluido quién los contó y explicó las referencias hechas.
Estas habilidades de análisis se pueden utilizar para otras modalidades. En otra demostración, el equipo de desarrollo le dio a la IA una película de Buster Keaton de 44 minutos. Subieron un boceto de una torre de agua que brotaba y luego pidieron la marca de tiempo de una escena que involucraba una torre de agua. Efectivamente, encontró la parte exacta diez minutos después de la película. Tenga en cuenta que esto se hizo sin ninguna explicación sobre el dibujo en sí ni ningún otro texto además de la pregunta. Gemini 1.5 Pro entendió que era una torre de agua sin ayuda adicional.
tecnología experimental
El modelo no está disponible para el público en general por el momento. Actualmente, se ofrece como una vista previa temprana a «desarrolladores y clientes empresariales» a través de Google. Estudio de IA y IA de vértice plataformas de forma gratuita. La compañía advierte a los probadores que pueden experimentar largos tiempos de latencia ya que aún es experimental. Sin embargo, hay planes para mejorar las velocidades en el futuro.
Nos comunicamos con Google para pedirle información sobre cuándo la gente puede esperar el lanzamiento de Gemini 1.5 y Gemini 1.5 Ultra, además del lanzamiento más amplio de estos modelos de IA de próxima generación. Esta historia se actualizará más adelante. Hasta entonces, consulte el resumen de TechRadar sobre Los mejores generadores de contenido de IA para 2024.