Con su primer cumpleaños Al doblar la esquinaBard, la herramienta de inteligencia artificial conversacional de Google, está recibiendo otra actualización.
Primeras revisiones encontró Bard se quedó atrás de los chatbots de la competencia en parte porque sus respuestas eran menos humanas. Desde entonces, Google ha integrado su modelo de IA Gemini, que ayudó a Bard ampliar su formación más allá texto a video, audio y fotos, y ahora está intentando avanzar más en su utilidad como IA generativa sigue siendo un tema candente.
en un entrada en el blog El jueves, el líder de producto de Bard, Jack Krawczyk, dijo que la herramienta ahora permite a los usuarios generar imágenes de forma gratuita.
Cuando alguien escribe un mensaje como «crea una imagen de un globo aerostático volando sobre las montañas al atardecer», Bard genera lo que Google describe como «imágenes visuales personalizadas y de amplio alcance para ayudar a darle vida a tu idea».
Sin embargo, lleva algo de tiempo: unos 13 segundos para ser exactos.
Y aunque la mayoría de las consultas que probamos generaron imágenes y/o respuestas relevantes, no tienen una tasa de precisión del 100%.
Por ejemplo, cuando le pedí a Bard que creara una imagen para una noticia sobre las actualizaciones más recientes de la herramienta, se negó a generar la imagen solicitada. Y cuando le pedí que simplemente creara una imagen sobre Google Bard, creó este cyborg rubio:
Durante el último año, el mercado se ha visto inundado de chatbots como ChatGPT de OpenAI, Bing AI de Microsoft, Claude de Anthropic y, sí, Bard de Google, a medida que las grandes tecnológicas buscan reclamar su lugar en la próxima ola de búsquedas. Estos chatbots acceden a enormes conjuntos de datos y utilizan grandes modelos de lenguaje para entregar texto y ahora imágenes o incluso video, respuestas a consultas de los consumidores. Es un campo en rápida evolución que ya se ha acercado a la conversación humana. Sin embargo, si bien los robots pueden brindar respuestas con confianza, no siempre son precisas y siguen siendo vulnerables al abuso.
La publicación de Google señaló que Bard incluye una distinción entre imágenes creadas con Bard y obras de arte humanas originales, e incorpora marcas de agua en los píxeles de las imágenes generadas. Para probar esto, le pedí que creara una imagen del Nacimiento de Venus de Botticelli. Ofreció una réplica, pero más descuidada. ¡Esas caras! ¡Esas manos! Sin embargo, existe la opción de informar un problema legal y aprobar cada imagen con el visto bueno o el pulgar hacia abajo.
A raíz de Falsificaciones profundas de Taylor Swift, Google dijo que busca limitar «contenido violento, ofensivo o sexualmente explícito» y aplica filtros para evitar la generación de imágenes de personas nombradas. De hecho, se negó a crear una imagen de los mariscales de campo del Super Bowl Patrick Mahomes y Brock Purdy haciendo un picnic o una de Beyoncé en el banco.
«Continuaremos invirtiendo en nuevas técnicas para mejorar la seguridad y la protección de la privacidad de nuestros modelos», escribió Krawczyk.
Cuando le pedí a Bard que generara una imagen de Lisa Lacy en el trabajo, Bard dijo que no tenía suficiente información sobre esa persona para ayudar. Sin embargo, pudo crear una imagen para la consulta más genérica de un periodista en el trabajo, con no uno sino dos sándwiches en su escritorio.
Se negó a crear una imagen de un hombre lanzando una moneda desde la presa Hoover porque «está prohibido arrojar objetos a la presa Hoover». (En su lugar, ofreció crear una imagen de una vista panorámica o una representación histórica).
Y Bard estaba feliz de crear imágenes de momentos históricos como la firma de la Declaración de Independencia.
Además de agregar la herramienta de generación de imágenes, Google está ampliando la disponibilidad de Gemini Pro en Bard del inglés a más de 40 idiomas. Eso incluye su función de doble verificación, que permite a los usuarios verificar las respuestas de Bard con contenido web.
Esto ayudará a que la herramienta se expanda a más de 230 países y territorios, según la publicación.
Google agregó Gemini Pro a Bard por primera vez en diciembre de 2023, para darle «capacidades de comprensión, razonamiento, resumen y codificación más avanzadas».
Nota del editor: CNET utiliza un motor de inteligencia artificial para ayudar a crear algunas historias. Para más, ver esta publicación.