L’IA s’impose comme une lueur d’espoir pour celles et ceux qui ont perdu la capacité de parler. Deux études récentes, l’une axée sur un implant cérébral et l’autre sur l’électrocorticographie, mettent en lumière des avancées significatives dans ce domaine. Ces recherches visent à redonner aux patients la capacité de communiquer, en transformant leurs pensées en paroles.
De nombreux patients souffrant de sclérose latérale amyotrophique (SLA), de lésions cérébrales résultant d’un accident ou d’une maladie ou ayant subi un accident vasculaire cérébral (AVC) sont confrontés à une perte de la parole. Pour ces individus, la communication devient un rêve lointain et rend chaque interaction quotidienne difficile et frustrante. Face à cette réalité, des chercheurs se sont engagés à redonner à ces patients la capacité de communiquer de manière fluide et naturelle. Au cœur de ces efforts se trouvent les interfaces cerveau-ordinateur assistées par l’IA.
Récemment, deux études sur ce sujet ont été publiées dans la revue Nature. Bien que chaque étude utilise une approche technologique distincte, elles partagent des étapes fondamentales dans leur processus. Au commencement, les chercheurs se concentrent sur la capture des signaux électriques du cerveau. Ensuite, grâce à la puissance de l’IA, ces signaux sont interprétés, décryptés et traduits en texte. Enfin, ce texte devient la voix du patient, lui permettant de « parler » de façon plus ou moins fluide.
Un implant cérébral assisté par IA
Cette première étude a été menée par une équipe de l’Université de Stanford, dirigée par Jaimie Henderson. Les chercheurs ont mené leur expérience sur un individu souffrant de SLA. L’implant a été soigneusement positionné dans le cortex sensorimoteur du patient, une région clé du cerveau qui orchestre les mouvements des muscles faciaux nécessaires à la parole. Malgré la paralysie musculaire induite par la SLA, le cerveau du patient continuait d’émettre des signaux électriques associés à la parole, qui étaient alors capturés par l’implant.
Avec l’aide d’une d’IA, l’équipe a pu décrypter ces signaux. L’algorithme utilisait pour cela des méthodes probabilistes pour estimer les mots que le patient voulait prononcer. Ces interprétations étaient ensuite transmises à un modèle linguistique avancé, qui tentait de déduire les mots spécifiques basés sur les phonèmes détectés. Cela permettait de traduire les pensées du patient en texte à une cadence impressionnante de 62 mots par minute. Le taux d’erreur était de seulement 11,7%, alors que le système a été mis au défi avec un lexique élargi de 125 000 mots.
Redonner la parole avec l’électrocorticographie
Sous la houlette du neurochirurgien Edward Chang, une autre équipe de l’Université de Californie à San Francisco (UCSF) a exploré une autre voie. Les scientifiques ont mené leur expérience sur une personne ayant subi un accident vasculaire cérébral il y a plus d’une décennie, le privant de la parole.
Plutôt que d’utiliser des implants invasifs, l’équipe de l’UCSF a opté pour l’électrocorticographie (ECoG). Cette technique capte les signaux électriques à la surface du cerveau sans nécessiter d’insertion d’électrodes, offrant une approche moins invasive. En se concentrant également sur les régions du cerveau qui orchestrent les mouvements des muscles faciaux pour la parole, ils ont pu saisir les signaux associés à la communication.
À l’aide d’une méthode d’apprentissage axée sur les phonèmes (comme pour la première étude), l’équipe a mis au point un système performant pour transformer ces signaux en texte. Ce système a démontré une vitesse de traduction des pensées en mots de 78 mots par minute, bien que confronté à un taux d’erreur de 25,5% pour un vocabulaire de seulement 1000 mots.
L’équipe a exploité une séquence vidéo du patient lorsqu’il parlait encore afin de recréer une voix qui rappelait fidèlement celle du patient avant son tragique accident. Cette avancée signifie non seulement que les patients peuvent communiquer, mais qu’ils peuvent parfois le faire avec une voix qui leur est familière. Les chercheurs ont également créé un avatar personnalisé ; ce dernier reproduit les mouvements faciaux que le patient aurait effectués avant l’accident. Cette initiative vise à redonner une dimension émotionnelle et personnelle à la communication. Le patient peut ainsi s’exprimer non seulement par des mots, mais aussi par des expressions faciales.