Et si l’IA comprenait enfin les dauphins ? Google relève le défi

De la science-fiction à la réalité : une IA plonge au cœur du langage des dauphins.

L'intelligence artificielle de Google décode le langage des dauphins
| Pixabay
⇧ [VIDÉO]   Vous pourriez aussi aimer ce contenu partenaire

Google a dévoilé un nouveau modèle d’intelligence artificielle, baptisé DolphinGemma, destiné à décrypter les subtilités de la communication des dauphins, ces mammifères marins souvent cités parmi les plus intelligents du règne animal. Capables de coopération, d’apprentissage et dotés d’une conscience de soi (suggérée par leur reconnaissance dans un miroir), les dauphins disposent d’un langage parmi les plus élaborés du règne animal. La technologie ambitionne désormais de l’élucider.

Parmi les créatures emblématiques de l’intelligence animale, les chimpanzés occupent une place de choix. Ils ont démontré des aptitudes cognitives avancées, telles que l’utilisation d’outils pour résoudre des problèmes complexes, une conscience de soi manifeste et des structures sociales d’une grande sophistication.

Récemment, des chercheurs des universités de Zurich et Harvard ont mis en lumière des capacités de communication chez les bonobos jusqu’ici insoupçonnées. Leurs travaux révèlent que ces primates sont capables d’agencer leurs cris de façon à produire des structures possédant des caractéristiques fondamentales du langage humain.

Une découverte qui éclaire sous un jour nouveau l’évolution du langage et de la richesse des échanges vocaux dans le monde animal. Les dauphins, pour leur part, continuent de fasciner les scientifiques par leur intelligence sociale, leur capacité d’apprentissage rapide et leur système de communication complexe.

Quarante ans d’observations sous-marines

Depuis 1985, le Wild Dolphin Project (WDP) mène aux Bahamas le plus long programme de recherche sous-marine dédié aux dauphins. L’équipe s’intéresse à une population de dauphins tachetés de l’Atlantique, étudiée sur plusieurs générations selon une approche respectueuse, résumée par leur devise : « Dans leur monde, selon leurs conditions ».

Grâce à cette méthode non intrusive, les chercheurs ont accumulé des décennies d’enregistrements audio et vidéo minutieusement indexés en fonction des individus et de leurs comportements. Un travail de longue haleine qui a permis d’établir des corrélations précises entre certains sons et des actions spécifiques : les dauphins, par exemple, émettent des sifflements distinctifs servant à s’identifier mutuellement – une forme de « prénom » – ou encore des cris spécifiques lors de confrontations.

Si le WDP s’attache à décrypter les formes naturelles de communication de ces cétacés, il nourrit une ambition plus audacieuse : parvenir, un jour, à « parler dauphin », si tant est qu’une telle langue puisse exister. Cette quête a donné naissance à une base de données particulièrement riche, jugée idéale par Google pour une analyse par IA générative. C’est ainsi qu’est né, en collaboration avec les chercheurs de Georgia Tech et du WDP, le modèle DolphinGemma.

Vers un langage prédictif des vocalisations

À l’instar des modèles de langage (LLM) capables de prédire des séquences de mots, DolphinGemma anticipe les motifs sonores propres aux dauphins. Toutefois, à la différence du langage humain, les vocalisations animales ne reposent pas nécessairement sur des structures syntaxiques explicites. Le modèle cherche ainsi à identifier des régularités acoustiques pouvant révéler une logique propre aux échanges interindividuels.

Développé à partir de la famille de modèles ouverts Gemma de Google et doté d’environ 400 millions de paramètres, DolphinGemma fonctionne comme « un ChatGPT pour dauphins ».

Le système s’appuie sur SoundStream, une technologie audio développée par Google, qui permet de « tokeniser » les vocalisations des cétacés – autrement dit, de les convertir en unités exploitables par l’algorithme en temps réel. L’objectif : détecter des structures sonores récurrentes et, peut-être, bâtir un lexique commun, tâche fastidieuse pour un humain mais accélérée par la puissance de calcul du modèle, selon Google.

spectogrammes des clics
(À gauche) Spectrogrammes des clics et impulsions analysés par DolphinGemma. (À droite) Appel unique émis par une mère à son petit. © Google

Un dispositif embarqué dans un smartphone

Conçu pour être utilisé sur le terrain, DolphinGemma a été optimisé pour fonctionner sur des téléphones Pixel, utilisés en milieu sous-marin par l’équipe de recherche, précise Google. Depuis plusieurs années, le WDP s’appuie déjà sur un dispositif baptisé CHAT (Cetacean Hearing Augmentation Telemetry), mis au point par le Georgia Institute of Technology à partir du Pixel 6. Ce système permet de générer des vocalisations synthétiques associées à des objets, et d’écouter les réponses des dauphins.

Sans prétendre traduire le langage naturel des cétacés, CHAT vise plutôt à établir un vocabulaire partagé, même rudimentaire : il enseigne aux dauphins des sifflements synthétiques correspondant à certains objets familiers – herbiers, sargasses ou encore foulards portés par les chercheurs.

Pour la saison de recherche 2025, un nouveau dispositif, basé sur le Pixel 9, sera déployé. Il permettra l’exécution simultanée de modèles d’apprentissage profond et d’algorithmes de reconnaissance de motifs. Dans un esprit d’ouverture, Google a annoncé que DolphinGemma serait mis à disposition des chercheurs du monde entier dès l’été prochain. Bien que le modèle ait été entraîné spécifiquement sur les dauphins tachetés de l’Atlantique, il pourrait être adapté à d’autres espèces de cétacés, esquissant les contours d’une nouvelle ère dans l’étude de la communication animale.

Laisser un commentaire

Vous voulez éliminer les publicités tout en continuant de nous soutenir ?


Il suffit de s'abonner !


JE M'ABONNE