Edgar Cervantes / Autoridad Android
TL;DR
- Google ha anunciado que el modelo Gemini 1.5 Pro ya está disponible para su vista previa pública.
- La compañía agregó que el modelo de IA actualizado admite el procesamiento de audio.
- Google dice que esta tecnología se puede utilizar para transcripciones de alta calidad, análisis de llamadas de ganancias y más.
de google Geminis Los modelos de IA generativa se dividen en Nano, Pro y Ultra. La empresa anunció Géminis 1.5 en febrero, y ahora se confirmó que Gemini 1.5 Pro está disponible para vista previa pública y ha adquirido una característica notable.
Google confirmó que Gemini 1.5 Pro ahora admite el procesamiento de audio. El gigante de las búsquedas dice que este soporte incluye audio en archivos de video y voz.
“Esto proporciona a los usuarios un análisis intermodal fluido, brindando información sobre texto, imágenes, videos y audio. También proporciona transcripción de alta calidad y se puede utilizar para buscar contenido de audio y vídeo, por ejemplo para buscar, analizar y responder preguntas en llamadas sobre resultados o reuniones de inversores”, explicó Google.
Una actualización importante para los esfuerzos de inteligencia artificial de Google
La compañía afirmó anteriormente que Gemini 1.5 Pro venció a Gemini 1.0 Pro en el 87% de los puntos de referencia y estaba casi a la par con Gemini 1.0 Ultra. También declaró anteriormente que los clientes podrían procesar una hora de vídeo, 11 horas de audio, bases de código con más de 30.000 líneas de código o más de 700.000 palabras en una sola secuencia.
Vale la pena señalar que Gemini 1.5 Pro es para usuarios de Workspace más que para consumidores. Pero eventualmente será accesible para los consumidores a través del asistente Gemini y otras vías. Sin embargo, la compatibilidad con el procesamiento de audio abre la puerta a muchas otras funciones en el futuro.
Google ya ofrece trucos relacionados con el audio Teléfonos píxeles, como la transcripción en la aplicación Grabadora (con tecnología de inteligencia artificial más antigua) y la herramienta Audio Magic Eraser. Por lo tanto, estamos ansiosos por ver si las capacidades de audio principales de Gemini 1.5 Pro se trasladarán a un futuro modelo de IA en el dispositivo, ya que esto podría permitir funciones de audio más avanzadas en los teléfonos inteligentes en el futuro.