Cela fait des siècles que le manuscrit de Voynich est un livre qu’aucun humain n’a réussi à comprendre. Mais à présent, nous pourrions enfin réussir à le décrypter, et ce grâce à une intelligence artificielle (IA), une machine inventée un demi-millénaire après l’écriture du manuscrit.
Le manuscrit de Voynich est un livre mystérieux qui se compose de quelques 240 pages de texte énigmatique écrites à la main, dans une langue complexe et inconnue, accompagnée de diagrammes et d’illustrations étranges et variés. Certaines pages sont même dépliantes, ce qui est très intéressant et inhabituel pour un ouvrage médiéval, daté du début du XVe siècle.
La nature exacte de ce document anonyme, son but ainsi que l’origine de son auteur restent encore aujourd’hui un mystère. Au fil du temps, le manuscrit a été possédé par des alchimistes et des empereurs, avant de faire surface dans les temps modernes au début du 20ème siècle, lorsqu’un marchand de livres polonais appelé Wilfrid Voynich est tombé dessus en 1912, prêtant involontairement son nom au livre énigmatique.
Dès lors, de nombreux cryptographes et linguistes ont tenté de percer les secrets du manuscrit de Voynich, mais le code obscur contenu dans ses pages (notamment des dessins représentant des plantes inconnues ainsi que de nombreux symboles), a défié toutes explications.
À présent, et grâce à des informaticiens canadiens, il semble que nous ayons une nouvelle piste dans cette affaire : en effet, des chercheurs de l’Université d’Alberta ont fait appel à une intelligence artificielle pour décoder des sections de l’ancien manuscrit, en utilisant une technique appelée déchiffrement algorithmique pour révéler le langage crypté du manuscrit.
Et ce n’est pas une chose aisée à effectuer, explique l’équipe dans son article, compte tenu du nombre d’inconnues impliquées : « Le manuscrit de Voynich est écrit dans un script inconnu qui code un langage inconnu. Ce qui est le type de déchiffrement algorithmique le plus complexe qui soit », expliquent les chercheurs.
Les chercheurs ont testé leur algorithme sur quelques 380 traductions différentes tirées de la Déclaration universelle des droits de l’homme et l’IA a été capable d’identifier le langage d’origine dans le 97% des cas.
Ensuite, ils ont focalisé l’IA sur les pages du manuscrit de Voynich, que l’équipe soupçonnait d’être écrites en arabe. Cependant, l’IA n’était pas d’accord avec la suggestion des chercheurs, indiquant que l’hébreu était la source la plus probable, supplantant d’autres correspondances potentielles qui n’étaient pas communément utilisées pour l’écriture durant le Moyen-Âge. Les chercheurs ont alors émis l’hypothèse que le chiffrement agissant sur la langue hébraïque pourrait être un exemple d’anagrammes ordonnés alphabétiquement (appelés alphagrammes), réarrangeant l’ordre des lettres dans les mots, tout en laissant tomber les voyelles.
La tentative de déchiffrer les 10 premières pages du manuscrit avec l’IA a généré des résultats mitigés : « Il s’est avéré que plus de 80% des mots étaient dans un dictionnaire hébreu, mais nous ne savions pas s’ils avaient un sens ensemble », explique l’un des membres de l’équipe, le linguiste informaticien Greg Kondrak.
À défaut de trouver des experts en hébreu qui pourraient aider à valider leurs découvertes, les chercheurs ont finalement eu recours à Google Traduction, et même s’ils reconnaissent qu’il y a des zones d’ombre, il semble bien y avoir une correspondance avec le texte.
Dans la section d’ouverture du chapitre « Herbal » du manuscrit de Voynich, qui contient le dessin de plusieurs sortes de plantes inconnues, de nombreux termes apparentés à la botanique apparaissent, y compris les mots agriculteur, lumière, air et feu.
Et qu’en est-il du début du livre le plus mystérieux au monde ? « Elle a fait des recommandations au prêtre, à l’homme de la maison, à moi et aux gens », sont les premiers mots du manuscrit de Voynich, selon l’IA. Un début d’ouvrage pour le moins ambigu. Des recommandations concernant la botanique peut-être ? Les membres de l’équipe de recherche expliquent que nous ne pouvons pas en être certains : « L’IA suggère une phrase grammaticale, que vous pouvez interpréter de différentes manières. C’est une façon étrange de commencer un manuscrit, mais c’est clairement logique », explique Kondrak.
Cela étant dit, l’équipe reconnaît avoir besoin de l’aide d’historiens spécialisés en hébreu antique afin de pouvoir poursuivre le décodage, ainsi que pour confirmer qu’il ne s’agit pas là d’interprétations erronées des algorithmes de l’IA. « Les résultats présentés pourraient être interprétés soit comme des indices indiquant que l’hébreu est la langue source du [manuscrit de Voynich], soit simplement comme des artefacts du pouvoir combinatoire des modèles d’anagrammes et de langage », écrivent les chercheurs. « Dans tous les cas, le résultat d’un déchiffrement algorithmique d’une contribution déjà confuse, ne peut être qu’un point de départ pour les chercheurs qui connaissent bien la langue et la période historique », ajoutent-ils.
Compte tenu de tout ce que nous ignorons encore concernant cet intriguant manuscrit, il s’agit là d’une nouvelle piste intéressante, bien que les avis ne soient pas forcément unanimes concernant les suggestions de l’IA, au sein de la communauté qui souhaite le déchiffrer. « Je ne pense pas qu’ils soient tous favorables à ce type de recherche », a déclaré Kondrak. Ce dernier souligne tout de même qu’il existe une réelle opportunité de faire d’autres découvertes, si l’hypothèse hébraïque se révèlait correcte après tout : « Quelqu’un ayant une très bonne connaissance de l’hébreu et qui est également historien pourrait suivre ces éléments et ces indices. Pouvons-nous regarder ces textes de près et effectuer une sorte de travail de détective pour déchiffrer ce qui pourrait en être le message ? ».