Même si à ce jour des milliers de génomes humains modernes et anciens ont été générés, les différences de méthodes et de qualité des données pouvaient complexifier leurs comparaisons. Des chercheurs de l’Université d’Oxford ont réussi à générer une généalogie humaine unifiée qui tient compte des données manquantes et erronées. En permettant de déterminer comment nos génomes ont changé au fil du temps et entre les populations, l’arbre donne un aperçu de 2 millions d’années de préhistoire et d’évolution.
La caractérisation des séquences des génomes humains modernes et anciens en révèle toujours un peu plus sur l’histoire de notre passé évolutif. La génération de données génomiques continue de s’accélérer — grâce au séquençage de biobanques à l’échelle de la population et d’échantillons anciens provenant du monde entier —, et avec elle, nous avons une compréhension de plus en plus détaillée de l’évolution des populations.
Cependant, ces ensembles de données génomiques sont très hétérogènes : des échantillons provenant de divers lieux géographiques, époques et populations, sont traités, séquencés et analysés à l’aide de diverses techniques. Les ensembles de données qui en résultent contiennent de véritables variations, mais aussi des schémas complexes de manques et d’erreurs qui empêchent d’obtenir la vision la plus complète possible des variations génomiques humaines.
« Réaliser comment la séquence génétique de chaque personne est liée à toutes les autres »
D’où l’intérêt d’introduire de nouvelles méthodes de représentation des données, statistiques et informatiques. Le Dr Yan Wong, généticien évolutionniste au Big Data Institute, est l’un des principaux auteurs de l’étude. Il explique dans un communiqué : « Nous avons essentiellement construit un immense arbre généalogique pour l’ensemble de l’humanité, qui modélise aussi exactement que possible l’histoire qui a généré toutes les variations génétiques que nous trouvons aujourd’hui chez les humains. Cette généalogie nous permet de comprendre comment la séquence génétique de chaque personne est liée à toutes les autres, sur tous les points du génome ».
À partir de huit ensembles de données, l’étude a intégré un total de 3601 séquences du génome humain moderne et de huit séquences anciennes à couverture élevée, provenant de 215 populations. Les génomes anciens comprenaient des échantillons trouvés dans le monde entier, dont l’âge variait de quelques milliers à plus de 100 000 ans.
L’équipe s’est concentrée sur les fragments d’ADN qui varient d’une personne à l’autre pour identifier 6 412 717 variantes. Pour expliquer les modèles de variation génétique, les algorithmes ont prédit où les ancêtres communs devaient être présents dans les arbres évolutifs, et le réseau contenait près de 27 millions d’ancêtres !
Nos racines les plus anciennes se trouvent dans le nord-est de l’Afrique
L’analyse permet de retrouver des événements clés de l’histoire de l’évolution humaine, comme la migration hors d’Afrique. « Nous observons des signaux de lignées ancestrales très profondes en Afrique, l’événement Out of Africa, et l’introgression [transfert naturel de gènes d’une espèce à une autre] archaïque en Océanie. Cette méthode motive des techniques d’inférence spatio-temporelle améliorées qui permettront de mieux élucider les chemins et les moments des migrations historiques », écrivent les chercheurs.
D’après le nouvel arbre généalogique, nos racines les plus anciennes se trouvent dans le nord-est de l’Afrique. En effet, les plus anciens fossiles d’Homo sapiens proviennent du nord et de l’est de l’Afrique, même si l’aire de répartition initiale de notre espèce est encore incertaine. Les plus anciens spécimens connus proviennent de Jebel Irhoud au Maroc, peut-être âgés de 315 000 ans. Il est également possible qu’il existait autrefois plusieurs populations réparties sur le continent africain, avec des divergences très anciennes.
L’arbre modifie également nos connaissances acquises sur les premiers voyages. Alors que de nombreux archéologues avaient fixé l’entrée la plus ancienne sur le continent américain à 18 000 ans, l’arbre semble indiquer que cette date se situerait plutôt il y a 56 000 ans. Une étude de septembre 2021 avait d’ailleurs décrit des empreintes de pas provenant du parc national de White Sands au Nouveau-Mexique, suggérant une présence humaine sur le continent américain il y a 21 000 à 23 000 ans. Il en est de même pour la Papouasie-Nouvelle-Guinée, où des personnes y auraient habité il y a 140 000 ans, au lieu d’environ 40 000 ans.
Une avancée majeure
Malgré la carte déjà riche, l’équipe de recherche prévoit d’intégrer davantage de données génétiques, probablement des millions de génomes supplémentaires. « Cette étude jette les bases de la prochaine génération de séquençage de l’ADN », a déclaré Wong. « Au fur et à mesure que la qualité des séquences génomiques provenant d’échantillons d’ADN modernes et anciens s’améliorera, les arbres deviendront encore plus précis et nous serons finalement en mesure de générer une carte unique et unifiée expliquant l’origine de toutes les variations génétiques humaines que nous observons aujourd’hui ».
En outre, la méthode pourrait s’appliquer à d’autres êtres vivants, des bactéries aux orangs-outans. Elle pourrait également présenter de nombreuses applications dans la recherche médicale, par exemple pour identifier les prédicteurs génétiques du risque de maladies.