Cómo la IA de Google Lookout puede describir imágenes para personas con discapacidad visual

Captura de pantalla de David Grober/ZDNET

Incluso antes del IA generativa auge, el puesto de observación de google La aplicación aprovechó la IA para ayudar a la comunidad ciega y con discapacidad visual a explorar su entorno utilizando las cámaras de sus teléfonos. Lanzada en marzo de 2019, la aplicación agregó recientemente una práctica función impulsada por IA: Image Q+A.

También: ¿Qué es Google Bardo? Aquí tienes todo lo que necesitas saber

La función Image Q+A permite a los usuarios hacer preguntas sobre una imagen cargando la foto y usando su voz o ingresando texto. Luego, el usuario recibirá una descripción detallada de la imagen que aborda sus inquietudes.

Por ejemplo, puede hacer preguntas sobre el color de un sujeto en la imagen, detalles específicos sobre un sujeto, como su expresión facial, e incluso pedirle a la aplicación que lea el texto dentro de la imagen, como lo que dice un letrero.

Aunque la función se lanzó en otoño, Google compartió esta semana más información sobre la función a través de una publicación en X, anteriormente Twitter, que también muestra cómo los usuarios se han beneficiado de la tecnología.

Detrás de la tecnología se encuentra el modelo de inteligencia artificial de Google, que fue entrenado para comprender y dar descripciones específicas de videos según Google.

Puede acceder a la función en la aplicación, que se puede descargar gratis. Sin embargo, la función sólo está disponible en inglés en EE. UU., Reino Unido y Canadá.

También: Acabo de probar el generador de imágenes ImageFX AI de Google y estoy sorprendido de lo bueno que es

La aplicación también incluye otras características innovadoras, incluido un modo de texto, que permite a los usuarios hojear el texto y escucharlo leído en voz alta; un modo de Etiqueta de Alimentos, que puede identificar los alimentos envasados por su etiqueta; un modo de moneda, que puede identificar rápidamente dólares, euros y rupias indias; y más.

Enlace fuente