Si vous souhaitez absolument savoir ce qui se passe après l’épisode final de la saison 7 de Game of Thrones qui est sorti le weekend dernier… vous n’êtes pas seul.
À présent que la série télévisée a dépassé l’œuvre littéraire, les enthousiastes de cette dernière devront patienter jusqu’en 2019 avant de savoir comment la saga épique de George R.R. Martin se terminera.
Donc en attendant, pour avoir du nouveau matériel à sur-analyser, un algorithme a commencé à écrire le sixième livre pour nous, et certaines de ses prédictions s’accordent avec des théories de fans.
Le type d’intelligence artificielle (IA) utilisée pour cet exercice est connue sous le nom de recurrent neural network – RNN, soit réseau de neurones récurrents : il s’agit d’un ensemble d’algorithmes dont la conception est à l’origine très schématiquement inspirée du fonctionnement des neurones biologiques, et qui par la suite, s’est rapprochée des méthodes statistiques. Ce type d’IA est notamment utilisé pour les traductions automatiques.
Pour que l’algorithme puisse prédire ce qui se passera dans le prochain roman, l’ingénieur logiciel Zack Thoutt, a alimenté l’IA avec les quelques 5300 pages écrites par GRR Martin des 5 livres publiés à ce jour. Actuellement, personne ne sait encore quand Martin lui-même publiera le volume final, intitulé The Winds of Winter.
ATTENTION : Spoilers de la saison 7 et autres prédictions de l’IA ci-dessous !
Selon les prédictions de l’IA, qui a déjà généré 5 chapitres, certains éléments de l’intrigue sont assez incongrus et nous sommes presque certains qu’ils ne risquent pas de se révéler corrects par la suite. Il faut garder à l’esprit que ces spéculations sont émises par une IA qui a analysé les cinq premiers livres. Par exemple, dans le premier chapitre de l’algorithme dédié à Tyrion, nous apprenons que Sansa est en réalité une Baratheon. Il y a également l’introduction d’un nouveau personnage relativement étrange, de type pirate, qui s’appelle Greenbeard (Barbeverte).
Mais tout n’est pas aussi improbable. L’IA prédit également plusieurs événements qui rejoignent certaines théories de fans, notamment :
- Jaime finira par tuer Cersei
- Jon Snow (ou devrions-nous employer son véritable nom, Aegon Targaryen ?) va monter un dragon (donc Drogon ou Rhaegal)
- Varys empoisonnera Daenerys
Les cinq chapitres peuvent être entièrement lus sur la page GitHub du projet. Chaque chapitre commence avec le prénom d’un personnage, comme dans les livres de Martin.
« Ce n’est évidemment pas parfait », a déclaré Thoutt. « Il ne s’agit pas de construire une histoire à long terme et la grammaire n’est pas parfaite. Mais le réseau est capable d’apprendre les bases de la langue anglaise et de la structure du style de George R. R. Martin », explique-t-il.
Les réseaux de neurones sont un type d’algorithme d’apprentissage automatique (littéralement « apprentissage machine » de l’anglais machine learning) qui s’inspire de la capacité du cerveau humain à ne pas simplement mémoriser et suivre des instructions, mais également de tirer des leçons des expériences passées. Ce champ d’étude de l’intelligence artificielle concerne la conception, l’analyse, le développement et l’implémentation de méthodes permettant à une machine (au sens large) d’évoluer par un processus systématique, et ainsi de remplir des tâches difficiles ou problématiques par des moyens algorithmiques plus classiques.
Un réseau neuronal récurrent est une sous-classe spécifique, qui fonctionne mieux lorsqu’il s’agit de traiter de longues séquences de données, comme dans ce cas, le long texte des cinq livres précédents écrits par Martin.
En théorie, l’algorithme de Thoutt devrait être capable de créer une véritable suite à l’œuvre existante de Martin, en se basant sur tous les éléments qui se sont déjà produits dans les romans. Mais en pratique, l’écriture est maladroite et, la plupart du temps, absurde.
L’IA fait également référence à certains personnages qui sont déjà morts : « Cela a empêché Ned jusqu’à ce que le feu tombe, debout sous l’arche d’un champ (…) encore éloigné où la tour des ombres a payé le camp derrière ». D’autres phrases sont quant à elles plus poétiques : « Arya a vu John tenir les lances. « Votre grâce », a-t-il dit, effrayé. « L’œil du corbeau souhaiterait se joindre à vous »».
« Un modèle parfait prendrait en compte tout ce qui s’est passé dans les livres et n’écrirait pas sur des personnages s’ils sont morts il y a deux livres de cela », a déclaré Thoutt. « Mais en réalité, le modèle n’est pas assez avancé pour faire cela. Si l’IA était si douée alors les véritables auteurs pourraient la craindre… elle fait beaucoup de fautes car la technologie pour générer un texte parfait grammaticalement, qui prenne en compte et se souvienne d’éléments complexes d’une histoire sur plusieurs millions de mots différents, n’existe pas encore », a-t-il ajouté.
En effet, l’une des limitations principales ici, est le fait que le livre ne contienne pas assez de données pour nourrir correctement un algorithme. Si vous avez déjà lu les livres de Martin, vous savez qu’ils sont très, très longs et ces derniers ne fournissent qu’un petit ensemble de données exploitables pour qu’un réseau de neurones puisse en tirer des conclusions quant à la suite des événements.
Les cinq livres contiennent également beaucoup de mots uniques, de noms ainsi que d’adjectifs qui ne sont pas réutilisés, ce qui rend très compliqué le développement du réseau neuronal. Thoutt explique que, par exemple, un livre 100 fois plus long mais avec un vocabulaire utilisé pour des livres pour enfants, serait une bien meilleure source de données pour les IA actuelles.
Finalement, il nous reste vraiment que deux options : attendre que Martin termine et publie finalement The Winds of Winter, ou alors attendre la saison finale de Game of Thrones, prévue pour 2019 par HBO.