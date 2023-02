⇧ [VIDÉO] Vous pourriez aussi aimer ce contenu partenaire (après la pub)



Marier un implant cérébral à une IA pour permettre à des personnes paralysées de s’exprimer… C’est le défi relevé par une équipe de scientifiques de la Stanford University. Leur dispositif est capable de convertir de simples pensées en textes et en audio intelligible en un temps record.

160 mots par minute… c’est la vitesse moyenne à laquelle nous parlons. De vrais moulins à parole ! Des dispositifs cérébraux existent depuis plusieurs décennies pour « redonner la parole » aux personnes paralysées. Ils ont pour objectif, en quelque sorte, de traduire leurs pensées. Pour cela, ces dispositifs utilisent de minuscules réseaux d’électrodes insérés dans le cerveau, qui permettent de mesurer et d’interpréter l’activité neuronale. Toutefois, atteindre un tel débit de parole s’avère être un vrai défi technologique. La traduction est donc beaucoup plus lente que pour notre parler habituel, ce qui peut s’avérer éminemment frustrant pour les personnes qui tentent de communiquer.

C’est donc la vitesse, principalement, qui constitue l’atout des recherches menées par une équipe de la Stanford University. Ils ont adopté une approche innovante, tout en bâtissant sur les dispositifs existants. En effet, ils ont combiné un implant cérébral avec une intelligence artificielle. Leurs recherches ont été publiées dans bioRxiv, ce qui, il faut le souligner, signifie qu’elles n’ont pas encore été validées par des pairs.

Les expérimentations n’ont été menées que sur une seule personne pour le moment. Les chercheurs admettent d’ailleurs bien volontiers que leur « démonstration est une ‘preuve de concept’ qui montre que le décodage des tentatives de mouvements de parole à partir d’enregistrements intracorticaux est une approche prometteuse, mais qu’il ne s’agit pas encore d’un système complet et cliniquement viable ».

Et en effet, une fois toutes ces précautions posées, leurs recherches ont tout de même de quoi impressionner. La personne sur laquelle les scientifiques ont mené leur étude est une femme de 67 ans, atteinte d’une sclérose latérale amyotrophique. Cette affection prive progressivement le cerveau de sa capacité à activer les muscles, menant à une paralysie.

En l’occurrence, le sujet, nommé « T12 » dans l’étude, était encore capable d’émettre des sons en essayant de parler. Toutefois, son discours était totalement inintelligible. Grâce à l’implant posé par les chercheurs, elle peut désormais s’exprimer à une vitesse de 62 mots par minute. Pas encore aussi rapidement qu’une personne qui s’exprime naturellement, donc, mais bien plus rapidement que sur des dispositifs similaires. C’est trois fois plus rapide que les précédents records, précisent les scientifiques.

Les pensées de T12 sont retranscrites sur un écran, et les mots sont prononcés par une voix de synthèse en même temps. Au-delà de la vitesse, c’est aussi l’étendue du vocabulaire utilisable qui marque les esprits. Le dispositif puise en effet dans une bibliothèque de 125 000 mots, ce qui constitue une base de vocabulaire étendue.

Comment ça marche ?

Pour parvenir à ce résultat, l’équipe a allié deux technologies de pointe : l’implant neuronal et l’intelligence artificielle. Côté matériel, les scientifiques ont placé quatre microréseaux d’électrodes à des endroits stratégiques de la couche externe du cerveau. Deux zones ont été précisément ciblées. La première est celle qui contrôle les mouvements des muscles faciaux entourant la bouche. L’autre est connue pour être le « centre du langage » du cerveau. Cette zone est aussi appelée « Aire de Broca ».

L’idée est de détecter au niveau du cerveau les mouvements qu’aurait faits la personne atteinte de paralysie si elle avait pu bouger ses muscles pour parler. Les scientifiques voulaient donc capter à la fois ce que la personne souhaite dire, mais aussi l’exécution de la parole par les mouvements musculaires. Une proposition audacieuse, souligne SingularityHub dans un article : « nous ne savons pas encore si la parole est limitée à une petite zone du cerveau qui contrôle les muscles de la bouche et du visage, ou si le langage est codé à une échelle plus globale dans le cerveau », rappelle en effet le média. Toutefois, les scientifiques ne se sont pas basés uniquement sur les informations fournies par les implants pour reconstituer les phrases.

Ils ont ajouté une touche « d’intelligence artificielle ». « Nous avons entraîné un décodeur à réseau neuronal récurrent (RNN) à émettre, à chaque pas de temps de 80 ms, la probabilité que chaque phonème soit prononcé à ce moment-là. Ces probabilités ont ensuite été traitées par un modèle de langage pour déduire la séquence de mots sous-jacente la plus probable, compte tenu des probabilités des phonèmes et des statistiques de la langue anglaise », décrivent les scientifiques.

En effet, les scientifiques se sont aperçus que les RNN existants étaient capables de différencier avec une précision de 92% les types de mouvements faciaux adoptés en fonction des phonèmes prononcés : froncer les sourcils, plisser les lèvres, faire claquer la langue… Et ce, sur la seule base des signaux neuronaux. Un phonème est la plus petite unité articulatoire distinctive que l’on puisse isoler dans un langage : en français par exemple, il en existe 36.

Ils ont ainsi constaté que, même paralysée depuis longtemps, une personne garde toute cette panoplie articulatoire en mémoire, et envoie les signaux neuronaux correspondants. En résumé, l’IA capte les phonèmes prononcés grâce aux implants, et déduit les suites logiques des phonèmes. Même si elle ne s’applique pour le moment qu’à une seule personne, cette recherche pourrait donc bénéficier à de nombreux patients. Elle aura toutefois besoin d’améliorations : pour le moment, le système montre un taux d’erreur de 10% environ sur une bibliothèque de 50 mots, et de près de 24% pour celle de 250 000 mots.

Source : bioRxiv