Les barrières linguistiques limitent la communication et les échanges d’information dans le monde. Si aujourd’hui certaines langues occidentales sont considérées comme étant « universelles », d’autres sont mises de côté. Pourtant, elles font partie intégrante de la richesse de notre patrimoine culturel. Permettre l’accessibilité à ces langues ainsi qu’aux milliards de personnes qui les parlent, permettrait ainsi un important désenclavement informationnel et intellectuel. Dans la constante croissance de ses ambitions, Meta prévoit de développer un traducteur vocal basé sur une IA capable de traduire n’importe quelle langue en temps réel, permettant de tenir une conversation sans se soucier de parler la même.

L’apprentissage des langues couramment parlées dans le monde, ou langues dites « universelles » comme l’anglais, a contribué à diminuer, au fil des siècles, les barrières linguistiques à travers le monde. Cette « standardisation » a donc permis de véhiculer des informations et de communiquer plus facilement, facilitant tout type d’échange.

Mais face à cette évolution, beaucoup de langues « se perdent »… Véritable paradoxe, beaucoup de natifs ne maîtrisent même plus leurs langues maternelles. Ce phénomène est peut-être la cause des « langues mortes », comme l’hébreu par exemple. Aujourd’hui, même internet est dominé par ces langues universelles, car plus de données et d’informations ont pu être synthétisées.

Qu’advient-il alors de celles et ceux qui n’ont pas eu la chance d’apprendre ces langues ? Les dernières générations d’outils de traduction automatique se perfectionnent chaque année pour permettre au plus grand nombre de se comprendre. Mais les traductions sont parfois loin d’être satisfaisantes, surtout pour les langues à « faibles ressources ». Ce qui constitue encore en soi une barrière linguistique non anodine. De plus, plus de 20% de la population dans le monde ne bénéficie pas de ces technologies modernes de traduction, selon un communiqué de Meta AI.

Le nouveau projet d’intelligence artificielle (IA) de Meta ambitionne alors de briser progressivement cette barrière. « La capacité de communiquer avec n’importe qui dans n’importe quelle langue – c’est une superpuissance dont les gens ont rêvé depuis toujours, et l’IA va le fournir de notre vivant », explique le PDG de Meta, Mark Zuckerberg, dans une présentation en ligne, d’après un article d’Inceptive Mind. À terme, la technologie devrait être accessible à n’importe qui dans le monde.

Un projet à deux composantes

Le nouveau projet de Meta aura deux principales composantes : No Language Left Behind et Universal Speech Translator. La première sera dotée d’une IA capable d’apprendre des langues avec peu de données pour « s’entraîner ». Elle pourra ainsi produire des traductions expertes de documents en des centaines de langues, qui vont de l’asturien au luganda ou encore à l’ourdou. La seconde composante, quant à elle, pourra traduire « le parler » d’une langue à une autre, et cela en temps réel afin de pouvoir prendre en charge les langues sans système d’écriture standard, ainsi que celles qui sont à la fois écrites et parlées.

« Les progrès de la traduction automatique n’aideront pas seulement les personnes qui ne parlent pas l’une des langues qui dominent internet aujourd’hui, ils changeront également fondamentalement la façon dont les gens dans le monde se connectent et partagent des idées », peut-on lire dans le communiqué.

Trois grands défis à surmonter

Pour atteindre ses objectifs et pouvoir satisfaire tous ses utilisateurs, Meta devra surmonter trois grands défis. Le premier consistera à solutionner le manque de données, qui empêche la plupart des traducteurs automatiques d’être efficaces. Pour traduire des textes, ces systèmes se reposent en effet sur l’apprentissage à partir de millions de phrases. C’est pour cette raison qu’ils ne produisent des traductions de bonne qualité que pour les langues qui dominent le web (peu nombreuses).

La difficulté est encore plus grande pour la traduction vocale directe. La plupart des systèmes de traduction vocale utilisent des textes comme étapes intermédiaires. Ce qui les rend dépendants des textes et difficiles à adapter aux langues qui sont principalement orales. Des modèles de traduction directe peuvent alors permettre des traductions pour des langues qui n’ont pas de systèmes d’écriture standards. Cette approche, basée sur la parole uniquement, pourrait également conduire à des traducteurs beaucoup plus rapides et plus efficaces, en éliminant l’étape textuelle.

Par ailleurs, les systèmes de traduction automatique actuels ne sont pas adaptés aux besoins de tout le monde. La plupart sont bilingues, ce qui signifie qu’il existe un modèle spécifique pour chaque paire de langues. Cette approche est extrêmement difficile à adapter à des dizaines de paires de langues, sans parler de toutes les langues utilisées dans le monde.

Les traducteurs vocaux doivent également contrecarrer le temps de latence imposé par le calcul de la traduction, ce qui n’est pas idéal pour établir une véritable conversation. Le principal défi vient du fait qu’une même phrase peut être structurée de façon très différente selon chaque langue. Même les professionnels en traduction simultanée montrent un retard d’environ trois secondes sur le discours original, selon Meta AI.

Le troisième défi est qu’à mesure que le monde évolue au niveau linguistique, il faut développer de nouvelles façons d’évaluer le travail fourni par les modèles de traduction automatique. Il est donc nécessaire de maintenir et contrôler constamment la qualité des traductions.

Pour pouvoir relever tous ces défis, Meta travaillera avec une vingtaine de linguistes. Ces derniers permettront d’optimiser la précision des traductions. Ils permettront aussi d’évaluer quelles fonctionnalités sont les plus utiles pour les utilisateurs de différents horizons, et comment ces derniers utiliseront les traductions produites par l’IA. Il est aussi important de noter que même dans un même pays, la langue comporte d’innombrables variations. Les accents diffèrent pour chaque région par exemple, ou encore, certains termes diffèrent en signification d’une région à l’autre. La tâche s’annonce donc très difficile.