Google está ampliando sus ofertas de IA generativa con un próximo generador de imágenes para Google Bard, como reveló en un registro de cambios inédito con fecha del 18 de enero.
Siguiendo los pasos de herramientas como Search Generative Experience (SGE) y Diapositivas, los usuarios podrán crear imágenes ingresando algunas palabras que describan la imagen. Se espera que esta nueva capacidad sea impulsada por la familia de modelos Imagen de Google. Imagen es conocida por su capacidad para producir imágenes fotorrealistas de alta calidad.
En diciembre, Google presentó Imagen 2, con una calidad de imagen significativamente mejorada. La tecnología apunta a casos de uso empresarial, como la generación de logotipos o la creación de imágenes con superposiciones de texto.
Se espera que el generador de imágenes de Google Bard siga características de seguridad similares a las de SGE. Este último, introducido en octubre, permite a los usuarios «dibujar» o «dibujar» mensajes directamente en el campo de búsqueda, generando cuatro imágenes a la vez.
Al igual que SGE, Google Bard también bloqueará resultados con personas destacadas y contenido explícito.
SGE garantiza la seguridad bloqueando la generación de contenidos nocivos, engañosos o explícitos. Bard también restringirá las indicaciones que presenten personas notables o rostros fotorrealistas, informes 9to5Google. Además, cada imagen generada obtendrá un etiquetado de metadatos y una marca de agua invisible utilizando la herramienta de Google. SynthID.
Google Slides y Meet, este último para fondos personalizados, ya incorporan generación de imágenes de cara al usuario a través de Duet AI. La próxima incorporación de un generador de imágenes a Bard amplía la accesibilidad del contenido generado por IA en varios servicios de Google.
Al agregar más descripciones a los títulos de las imágenes en el conjunto de datos de entrenamiento de Imagen 2, Google está mejorando la comprensión de los títulos de las imágenes. Permitirá una generación de imágenes más precisa y matizada contextualmente.
Además, Imagen 2 aborda los desafíos comunes que enfrentan las herramientas de conversión de texto a imagen, como la representación de manos y rostros humanos realistas. La tecnología incorpora un modelo estético de imagen especializado. Se basa en las preferencias humanas, lo que garantiza que las imágenes generadas se alineen con las cualidades preferidas de los usuarios. Estos avances contribuyen colectivamente a Habilidad mejorada de Imagen 2 para generar imágenes realistas y de alta calidad.
La medida se alinea con la estrategia más amplia de Google de integrar tecnologías avanzadas tecnologías de inteligencia artificial en todo su conjunto de servicios.