Des chercheurs ont utilisé l’intelligence artificielle pour analyser huit modèles majeurs d’origine et d’évolution humaines, et le programme a identifié des preuves dans le génome humain d’une « population fantôme » d’ancêtres humains. L’analyse suggère qu’un groupe d’hominines, jusque-là inconnu et éteint depuis longtemps, s’est croisé avec l’Homo sapiens en Asie et en Océanie, ne laissant que des traces fragmentées de l’ADN humain moderne.
L’étude, publiée dans la revue Nature Communications, est l’un des premiers exemples de la façon dont l’apprentissage automatique peut aider à révéler des indices sur nos propres origines. En examinant de vastes quantités de données génomiques laissées dans des os fossilisés, et en les comparant à l’ADN de l’Homme moderne, les scientifiques peuvent commencer à combler certaines des lacunes de l’histoire évolutive de notre espèce.
Dans ce cas, les résultats semblent correspondre aux théories de la paléoanthropologie, qui ont été développées à partir de l’étude de fossiles d’ancêtres humains trouvés dans le sol. Les nouvelles données suggèrent que l’hominine mystérieuse est probablement issue d’un mélange de Néandertaliens et de Dénisoviens (qui ont été identifiés comme une espèce unique sur l’arbre généalogique de la famille humaine en 2010).
Une telle espèce de notre passé évolutif ressemblerait beaucoup au squelette d’une adolescente de 90’000 ans de la grotte de Denisova, en Sibérie. Ses restes ont été décrits l’été dernier comme le seul exemple connu d’hybride de première génération entre les deux espèces, avec une mère Néandertal et un père Dénisovien.
« C’est exactement le genre d’individu que nous espérons trouver à l’origine de cette population, mais il ne devrait pas s’agir d’un seul individu mais de toute une population » déclare le co-auteur de l’étude, Jaume Bertranpetit, biologiste de l’évolution à l’Université Pompeu Fabra de Barcelone.
Introgressions, liaisons interespèces et espèces « fantômes »
Des études antérieures sur le génome humain ont révélé qu’après leur départ de l’Afrique, il y a peut-être 180’000 ans, les humains modernes se sont mêlés à des espèces telles que Néandertal et les Dénisoviens, qui ont coexisté avec les premiers humains modernes avant de s’éteindre.
Mais redessiner notre arbre généalogique pour inclure ces branches divergentes a été difficile. Les preuves concernant les espèces « fantômes » peuvent être rares, et de nombreuses théories concurrentes existent pour expliquer quand, où et combien de fois Homo sapiens aurait pu se croiser avec d’autres espèces.
Les traces de ces anciennes liaisons interspécifiques, appelées introgressions, peuvent être identifiées comme des lieux de divergence dans le génome humain. Les scientifiques observent plus de séparation entre deux chromosomes que ce à quoi on pourrait s’attendre si les deux chromosomes provenaient de la même espèce humaine.
Sur le même sujet : Des « mini-cerveaux » de Néandertal cultivés in vitro pour comprendre sa disparition
Lorsque les scientifiques ont séquencé le génome de Néandertal en 2010, ils ont compris que certaines de ces divergences représentaient des fractions de notre génome provenant de Néandertal. Des études ont également révélé que certains êtres humains vivant actuellement pouvaient posséder jusqu’à 5% du génome de Dénisoviens.
« Nous avons donc pensé essayer de trouver ces endroits de forte divergence dans le génome, voir quels sont ceux de Néandertal et ceux de Dénisovien, et ensuite déterminer si ceux-ci expliquent la situation dans son ensemble », explique Bertranpetit. « En l’occurrence, si vous soustrayez les parties Néandertal et Dénisovien, il reste encore quelque chose dans le génome qui est très divergent ».
Identifier et analyser les nombreux endroits différents dans le génome, et calculer les innombrables combinaisons génétiques qui auraient pu les produire, est un travail trop lourd pour les humains, mais c’est une tâche qui peut être conçue sur mesure pour les algorithmes de deep learning.
Le deep learning pour reconstituer l’évolution de l’Homme
Le deep learning est un type d’intelligence artificielle dans lequel les algorithmes sont conçus pour fonctionner comme un réseau de neurones artificiels. Ces systèmes d’apprentissage automatique peuvent détecter des modèles et prendre en compte les informations précédentes pour « apprendre », leur permettant d’exécuter de nouvelles tâches ou de rechercher de nouvelles informations après avoir analysé d’énormes quantités de données.
Dans ce cas, des machines ont été mises au travail pour analyser le génome humain et prédire les données démographiques humaines en simulant l’évolution de notre ADN sur plusieurs milliers de scénarios possibles d’évolution ancienne. Le programme a pris en compte la structure et l’évolution de l’ADN ainsi que des modèles de migration humaine et de métissage pour tenter de réunir certaines des pièces d’un puzzle incroyablement complexe.
Les chercheurs ont formé l’ordinateur à l’analyse de huit modèles différents des théories les plus plausibles de l’évolution humaine précoce en Eurasie. Les modèles sont issus d’études précédentes qui tentaient de créer un scénario qui donnerait l’image actuelle du génome humain, y compris ses composants connus de Néandertal et de Dénisovien.
« Il pourrait y avoir d’autres modèles, bien sûr, mais ce sont des modèles que d’autres ont proposés dans la littérature scientifique », explique Bertranpetit. Chaque modèle commence par l’événement accepté hors de l’Afrique, puis présente un ensemble différent des fractionnements les plus probables entre lignages humains, y compris divers croisements avec des espèces connues et des espèces « fantômes » possibles.
« Chaque fois que nous effectuons une simulation, il s’agit d’une simulation d’un chemin possible de l’évolution humaine. Nous avons exécuté ces simulations des milliers de fois, et les algorithmes de deep learning permettent de reconnaître le modèle le mieux adapté aux données ».
La conclusion de l’algorithme ? Une espèce ancêtre que nous n’avons pas encore identifiée est présente dans notre lignée. « De loin, les seuls modèles que nous avons testés et qui s’appuient vraiment sur les données sont ceux qui montrent cette introgression de la population fantôme » déclare Bertranpetit.
À mesure que de nouvelles découvertes de fossiles sont effectuées sur le terrain, des modèles mis à jour peuvent maintenant être testés sur le génome humain à l’aide de ce type de programmes. Schraiber explique que la force du deep learning pour étudier les origines humaines réside précisément dans sa capacité à analyser des modèles complexes.
« Si vous voulez créer un modèle extrêmement détaillé parce que vous êtes anthropologue et que vous voulez savoir si cette introgression a eu lieu il y a 80’000 ou 40’000 ans, c’est le pouvoir d’une approche de deep learning comme celle-ci ».
« Ce type de méthode d’analyse produira de nombreux nouveaux résultats. Je suis sûr que les personnes travaillant en Afrique trouveront des groupes éteints qui ne sont pas encore reconnus. Nul doute que l’Afrique va nous montrer des choses surprenantes à l’avenir » conclut Bertranpetit.
Une version préliminaire plus ancienne et moins exhaustive de l’article concernant les résultats de l’analyse a été publiée en janvier 2019.