La última IA de Google promete acercarnos al eterno sueño de hablar con animales. El objetivo: traducir a delfines

Google se ha unido a un grupo de investigadores expertos en delfines para crear una IA que permita entender lo que los delfines se comunican entre sí

Dolphingemma Keyword1 Rd3 V02 Width 1000 Format Webp 1
1 comentario Facebook Twitter Flipboard E-mail
barbara-becares

Bárbara Bécares

Editor

Google ha anunciado su nueva creación: DolphinGemma, un modelo de lenguaje (LLM o grandes modelos lingüísticos), que tiene el objetivo de ayudar a los científicos a estudiar cómo se comunican los delfines y, "con suerte" (palabras literales de la empresa), a descubrir también qué dicen.

La firma explica que "durante décadas, comprender los chasquidos, silbidos y pulsos de los delfines ha sido una frontera científica" y esa es la barrera que quiera ahora superar la empresa: no solo escuchar a los delfines, sino también comprender los patrones de su compleja comunicación con la suficiente precisión como para generar respuestas realistas.

El nuevo modelo de IA ha sido entrenado para aprender la estructura de las vocalizaciones de los delfines y generar nuevas secuencias de sonidos similares a las de los delfines. La empresa dice que este es un paso importante "en la búsqueda de la comunicación interespecies" y "amplía los límites de la IA".

El sueño de poder comprender a los animales no es nada nuevo. Y es curioso recordar aquí la historia de cuando le pusieron un micrófono a un delfín que llevaba años solo frente a Dinamarca le pusieron un  micro y la conversación registrada sorprendió mucho porque parecía estar hablando consigo mismo. 

Cómo funciona la nueva IA del DeepMind de Google

Desde 1985, el Wild Dolphin Project o WDP lleva a cabo un proyecto de investigación submarina, estudiando una comunidad específica de delfines moteados del Atlántico (Stenella frontalis) salvajes en las Bahamas a lo largo de generaciones y con un enfoque que afirman que es "no invasivo". Con eso cuentan con décadas de video y audio submarinos, "meticulosamente emparejados con las identidades individuales de los delfines, sus historias de vida y sus comportamientos observados".

WDP ha querido así observar y analizar la comunicación natural y las interacciones sociales de los delfines. Trabajar bajo el agua permite a los investigadores vincular directamente los sonidos con comportamientos específicos, algo que la observación en superficie no puede lograr.

Durante décadas, han correlacionado los tipos de sonido con sus conductas. Así saben que hay unos silbidos característicos que las madres y sus crías usan para reunirse; o se reconocen ciertos zumbidos a menudo utilizados durante el cortejo o la persecución de tiburones.

"Este análisis a largo plazo de la comunicación natural constituye la base de la investigación de WDP y proporciona un contexto esencial para cualquier análisis de IA", explica Google.

Cómo funciona DolphinGemma

Captura De Pantalla 2025 04 15 222243

Ahora, basándose en esta valiosa información, Google presenta DolphinGemma, creado para analizar la comunicación natural y compleja de los delfines, algo que definen como "una tarea monumental".

Este modelo de IA utiliza tecnologías de audio específicas de Google: el tokenizador SoundStream representa eficientemente los sonidos de los delfines, que luego son procesados ​​por una arquitectura de modelo adaptada a secuencias complejas.

Este modelo de aproximadamente 400 millones de parámetros tiene el tamaño óptimo para ejecutarse directamente en los teléfonos Pixel que WDP utiliza en sus investigaciones. Como recoge The Verge, Google afirma haber diseñado DolphinGemma para aprovechar la tecnología de audio específica de la empresa lo que significa que usar teléfonos Pixel reduce la necesidad de hardware personalizado, mejora la capacidad de mantener el sistema en funcionamiento, reduce el consumo de energía y los costos.

Basado en los conocimientos de Gemma

Este modelo se basa en los conocimientos de Gemma, la colección de modelos abiertos ligeros de Google, creados a partir de la misma investigación y tecnología que impulsa nuestros modelos Gemini. Ha sido ahora entrenada con la base de datos acústica de delfines del Atlántico salvajes que posee WDP. Tal y como explican desde Google:

DolphinGemma funciona como un modelo de entrada y salida de audio que procesa secuencias de sonidos naturales de delfines para identificar patrones, estructurar y, en última instancia, predecir los probables sonidos posteriores en una secuencia, de forma similar a cómo los grandes modelos lingüísticos para el lenguaje humano predicen la siguiente palabra o fragmento en una oración.

Ahora WDP está comenzando a implementar DolphinGemma. Según explican, el modelo puede ayudar a los investigadores a descubrir estructuras ocultas y posibles significados en la comunicación natural de los delfines, una tarea que anteriormente requería un inmenso esfuerzo humano.

Además de analizar la comunicación natural, WDP también sigue un camino paralelo distinto: explorar la posible interacción bidireccional mediante tecnología en el océano.

Imágenes | Google y WDP

En Genbeta | 250 euros para adoptar una mascota que nunca recibirás: alerta por el crecimiento de las estafas, y todas tienen esto en común

Inicio