Google compartió un video en sus plataformas de redes sociales el lunes, provocando nuevas capacidades de su chatbot impulsado por inteligencia artificial (IA). Geminis. El video fue lanzado apenas un día antes de la reunión anual de la compañía centrada en los desarrolladores. E/S de Google evento. Se cree que el gigante tecnológico podría hacer varios anuncios sobre la IA y revelar nuevas funciones y posiblemente nuevos modelos de IA. Además, es probable que el protagonismo lo ocupen Androide 15 y Wear OS 5, que podría presentarse durante el evento.
En un breve vídeo publicado en X (anteriormente conocido como Twitter), la cuenta oficial de Google adelantó las nuevas capacidades de su chatbot interno de IA. El video de 50 segundos de duración destacó marcadas mejoras en su discurso, dándole a Gemini una voz más emotiva y modulaciones que le dan una apariencia más humana. Además, el vídeo destacó nuevas capacidades de visión por computadora. La IA podría captar las imágenes de la pantalla y analizarlas.
Gemini también podría acceder a la cámara del teléfono inteligente, una capacidad que no posee actualmente. El usuario movía la cámara por el espacio y le pedía a la IA que describiera lo que veía. Casi sin demora, el chatbot podía describir el escenario como un escenario y, cuando se le pedía, podía incluso reconocer el Google Logotipo de E/S y compartir información a su alrededor.
El video no compartió más detalles sobre la IA y, en cambio, pidió a las personas que vieran el evento para saber más. Hay algunas preguntas que podrían responderse durante el evento, como si Google está utilizando un nuevo modelo de lenguaje grande (LLM) para visión por computadora o si es una versión mejorada de Gemini 1.5 Pro. Además, Google también puede revelar qué más puede hacer la IA con su visión por computadora. En particular, hay rumores de que el gigante tecnológico podría introducir Gems, que se consideran agentes de chatbot que pueden diseñarse para tareas particulares, similares a OpenAI GPT.
Si bien se espera que el evento de Google presente nuevas funciones para Gemini, OpenAI celebró su evento Spring Update el lunes y presentó su último modelo de IA GPT-4o que agregó funciones a ChatGPT, similar al vídeo compartido por Google. El nuevo modelo de IA le permite tener voz conversacional, visión por computadora, traducción de idiomas en tiempo real y más.