Ahora, este es el tipo de aplicación de IA que realmente me intriga. Los investigadores han desarrollado Dolphingemma, el primer modelo de lenguaje grande (LLM) para comprender el lenguaje de los delfines. Podría ayudarnos a traducir lo que dicen estas increíbles criaturas, potencialmente mucho más rápido de lo que pudimos con los enfoques manuales utilizados durante varias décadas.
«El objetivo sería hablar algún día de delfín», dice la Dra. Denise Herzing. Su organización de investigación, El proyecto Wild Dolphin (WDP)estudia exclusivamente una cápsula específica de delfines manchados del Atlántico libre que residen en la costa de las Bahamas.
Ella ha estado recolectando y organizando sonidos de delfines durante los últimos 40 años, y ha estado trabajando con el Dr. Thad Starner, un científico investigador de Google Deepmind, una subsidiaria de IA del gigante tecnológico.
Con sus poderes combinados, han entrenado un modelo de IA en una vasta biblioteca de sonidos de delfines; También puede expandirse para acomodar más datos, y estar ajustado para representar con mayor precisión lo que esos sonidos podrían significar. «… alimentar los sonidos de delfines en un modelo de IA como Dolphin Gemma nos dará una muy buena vista si hay sutilezas de patrones que los humanos no pueden elegir», señaló Herzing.

Los delfines generalmente se comunican entre sí utilizando una gama de silbatos (algunos de los cuales son nombres), ecolocando clics para ayudarlos a cazar y sonidos de bombas de explosión en contextos sociales.
Desde la década de 1980, los investigadores han grabado estos sonidos usando hidrófonos (micrófonos submarinos), los analizaron para encontrar patrones similares con espectrogramas (representaciones visuales de sonido que muestran cómo el contenido de frecuencia de una señal cambia con el tiempo), y luego experimentó con los delfines reproduciendo esos sonidos para observar sus comportamientos. Ese es mucho trabajo manual para desarrollar un catálogo de sonidos de delfines.

El LLM del equipo, que se basa en la tecnología fundamental que impulsa los modelos Gemini de Google y su popular chatbot, utiliza tecnología de audio sofisticada para representar los sonidos de Dolphin como tokens. Está entrenado ampliamente en la base de datos acústica de WDP de delfines manchados del Atlántico salvaje, y procesa secuencias de los sonidos que han producido para identificar patrones y estructuras.
Dolphingemma: Cómo Google AI está ayudando a decodificar la comunicación de los delfines
Google señala que prácticamente puede predecir los posibles sonidos posteriores en una secuencia, similar a la forma en que obtiene sugerencias cuando busca algo en línea o componiendo un correo electrónico y necesita ayuda para completar una oración.
Creando un lenguaje secreto
¿Qué pasaría si quisiéramos ir más allá de simplemente observar a los delfines hablar entre ellos y ver si podíamos comunicarnos con ellos en un idioma compartido? Eso es lo que WDP ha estado explorando en paralelo durante los últimos años con la ayuda de Starner. No es solo un genio de IA, sino también uno de los pioneros detrás del patán Guesan Glass Glass.
Los sistemas rudimentarios anteriores para comunicarse con estos animales involucraron un gran teclado del tamaño de la nariz del delfín montada al costado del bote en la década de 1990. La idea era que los investigadores interactuarían con los delfines mientras pasaban juguetes atractivos, y jugarían silbatos de delfines artificiales vinculados a cada llave grande con un símbolo. Se imaginaron que los delfines podrían señalar esas claves para solicitar juguetes. Así es como se veía (comienza a las 6:43 en la charla TED de Herzing de 2013):
¿Podríamos hablar el idioma de los delfines? | Denise Herzing
Dado que eso no era tan interactivo como esperaban los investigadores, cambiaron a un teclado submarino con el que podían nadar. Si bien no resultó exactamente en un verdadero de ida y vuelta, sí mostró que los Dolphins estaban lo suficientemente atentos y enfocados como para participar en aprender a conversar. Entonces, en 2010, WDP comenzó a colaborar con el Instituto de Tecnología de Georgia, donde Starner es profesor, para desarrollar una nueva tecnología para la comunicación bidireccional.
Junto con Herzing, Starner creó Dispositivos de chat (audiencia y telemetría de cetáceos) para habilitar la comunicación bidireccional con delfines. Estos grandes wearables, construidos alrededor de una computadora submarina, presentaban hidrófonos para detectar y grabar vocalizaciones de delfines, altavoces para reproducir silbidos artificiales en el agua y una interfaz especializada que los buzos podrían usar bajo el agua.
El sistema trabajó detectando silbidos de delfines específicos y asociándolos con objetos o conceptos. Los investigadores también podrían desencadenar silbatos artificiales utilizando la interfaz, esencialmente «hablar» a los delfines usando sonidos que podrían aprender a asociarse con objetos específicos.
Desde esos primeros días, el equipo ha estado actualizando el hardware e incorporando IA en él. Utilizando los teléfonos de Google Pixel en sus wearables, los investigadores han llevado a cabo una rutina similar a la del sistema de chat anterior:
- Demuestre una acción a los delfines, como entregar un juguete, y reproducir un sonido sobre el altavoz submarino para asociarse con él.
- Use equipo portátil para identificar el sonido imitado realizado por los delfines que observaron esto.
- Informe al investigador (a través de auriculares que conducen ósea que funcionan bajo el agua) que objetan el delfín «solicitado».
- Permita que el investigador responda rápidamente ofreciendo el juguete asociado, reforzando la conexión.
Con un modelo de IA con capacidad de predicción en el corazón, este sistema está diseñado para ayudar a los investigadores a reaccionar a los delfines de manera más rápida y natural. El uso de teléfonos inteligentes estándar significa que el chat ahora usa mucha menos potencia, se puede mantener más fácilmente y es más pequeño que la versión anterior.

La organización de Herzing implementará Dolphingemma en esta temporada de campo, y este nuevo modelo debería acelerar los esfuerzos del equipo para estudiar y documentar el comportamiento de los delfines manchados de Atlantic. Google dice que hará de Dolphingemma un modelo abierto a mediados de año, lo que significa que estará más ampliamente disponible para los investigadores en otras partes del mundo. La compañía dice que debería ser posible adaptarlo para su uso con otras especies de cetáceos, como la nariz de botella o los delfines giratorios, con un poco de ajuste.
«Si los delfines tienen idioma, entonces probablemente también tengan cultura», señaló Starner. «Vas a entender qué prioridades tienen, de qué hablan?» Eso podría darnos una perspectiva completamente nueva sobre cómo se comunican las especies inteligentes en el reino animal y cómo funcionan sus sociedades.
Fuente: La palabra clave (Google)