Escuche claramente entre una multitud con una sola mirada

Es difícil escuchar lo que dice una persona en un espacio abarrotado y ruidoso donde hablan muchas otras personas. Esto es especialmente cierto para las personas con problemas de audición. Si bien los audífonos modernos utilizan tecnología de cancelación de ruido, no pueden eliminar el ruido de fondo por completo.

Investigadores de la Universidad de Washington (UW) han ideado una solución para oír mejor en un ambiente ruidoso. Utilizando auriculares comunes y corrientes con cancelación de ruido equipados con inteligencia artificial, desarrollaron un sistema que puede distinguir la voz de un hablante con solo mirarlo una vez.

«Ahora tendemos a pensar en la IA como chatbots basados en la web que responden preguntas», dijo Shyam Gollakota, profesor de la Escuela de Ciencias de la Computación e Ingeniería Paul G. Allen de la Universidad de Washington y autor principal del estudio. “Pero en este proyecto desarrollamos IA para modificar la percepción auditiva de cualquier persona que use auriculares, según sus preferencias. Con nuestros dispositivos ahora puedes escuchar claramente a un solo orador incluso si estás en un ambiente ruidoso con muchas otras personas hablando”.

Los auriculares disponibles en el mercado están equipados con micrófonos y un botón.

El sistema de «audición del habla objetivo» (THS) desarrollado por los investigadores es simple pero eficaz. Los auriculares disponibles en el mercado están equipados con dos micrófonos, uno en cada auricular. Mientras mira a la persona que quiere escuchar, el usuario presiona un botón en el costado de los auriculares una vez, durante tres a cinco segundos. Las ondas sonoras de la voz de ese hablante llegan a ambos micrófonos simultáneamente (hay un margen de error de 16 grados) y se envían a una computadora a bordo, donde el software de aprendizaje automático aprende los patrones vocales del hablante. La voz del hablante se aísla y se canaliza a través de los auriculares, incluso cuando se mueve, y se filtran los ruidos extraños.

El siguiente vídeo muestra lo efectivos que son los auriculares. Filtran rápidamente el ruido ambiental para centrarse en el hablante, eliminando el ruido generado por una persona que habla por teléfono cerca (en el interior) y una fuente exterior muy ruidosa.

Los auriculares con IA filtran el ruido para que escuches una voz entre la multitud

¿Qué tan rápido puede la IA procesar la voz del hablante y eliminar sonidos no deseados? Cuando lo probaron, los investigadores descubrieron que su sistema tenía una latencia de extremo a extremo de 18,24 milisegundos. En comparación, un parpadeo dura entre 300 y 400 milisegundos. Eso significa que prácticamente no hay ningún retraso entre mirar a alguien que quieres escuchar y escuchar solo su voz en tus auriculares; todo sucede en tiempo real.

Le entregaron su sistema THS a 21 sujetos, quienes calificaron la supresión de ruido proporcionada por los auriculares en entornos interiores y exteriores del mundo real. En promedio, los sujetos calificaron la claridad de la voz del hablante casi el doble que cuando no fue procesada.

Su sistema THS se basa en ‘audiencia semántica‘ tecnología que los investigadores de la Universidad de Washington habían desarrollado previamente. Al igual que THS, esa tecnología utilizaba un algoritmo de IA que se ejecutaba en un teléfono inteligente conectado de forma inalámbrica a unos auriculares con cancelación de ruido. El sistema de audición semántica podría identificar ruidos como cantos de pájaros, sirenas y alarmas.

Actualmente, el nuevo sistema sólo puede filtrar un hablante objetivo a la vez y sólo cuando no hay otra voz fuerte proveniente de la misma dirección que el hablante. Pero si el usuario de los auriculares no está satisfecho con la calidad del sonido, puede volver a muestrear la voz del hablante para mejorar la claridad. Los investigadores están trabajando para ampliar su sistema a auriculares y audífonos. Y han creado su código THS. disponible públicamente en GitHub para que otros puedan aprovecharlo. El sistema no está disponible comercialmente.

Los investigadores presentaron su trabajo a principios de este mes en la conferencia de Interacción Computadora-Humana (CHI) de la Association of Computing Machinery (ACM) sobre factores humanos en sistemas informáticos celebrada en Honolulu, Hawai’i, donde recibieron una Mención de Honor. El trabajo de investigación inédito está disponible. aquí.

Fuente: universidad

Enlace fuente