Vingt ans après l’élaboration du premier génome de référence humain, une nouvelle avancée majeure dans le domaine de la génétique : le premier « pangénome » voit le jour, compilant les génomes de 47 individus, offrant ainsi un aperçu inédit de notre extraordinaire diversité génétique. Cette percée significative inaugure une nouvelle ère dans la biologie humaine et pourrait élucider certains mystères de la médecine de précision.
Le génome constitue le support biologique renfermant l’intégralité de notre matériel génétique, constitué d’ADN situé sur chacune des 23 paires de chromosomes, hérités de nos parents. Ce matériel génétique est omniprésent dans chaque cellule de notre organisme, dont le noyau renferme entre 20 000 et 25 000 gènes composés de 3 milliards de paires de bases d’acides aminés.
Il y a environ deux décennies, le premier génome de référence humain a été séquencé. Constitué à partir de l’ADN prélevé sur plus de 60 individus, il a été progressivement complété au fil des ans. Ce génome de référence, qui compile tous les gènes communs à notre espèce, est considéré comme une référence malgré ses nombreuses lacunes. Mais il ne peut représenter parfaitement le véritable génome humain. Ce génome de référence a finalement été entièrement séquencé l’an dernier, lorsque les scientifiques ont comblé les 8% manquants.
Le pangénome se situe à l’échelon supérieur, regroupant plusieurs génomes tout en contenant le même nombre de gènes qu’un génome individuel. Cette structure inclut notamment le génome de référence (qui regroupe les gènes communs à toutes les souches d’une même espèce) et le génome « accessoire », qui se compose de gènes spécifiques à l’environnement et de gènes uniques caractérisant les souches uniques.
Le pangénome offre ainsi un aperçu plus précis de la diversité génétique au sein d’une même espèce. Pour l’analogie, le génome pourrait être comparé à une carte géographique large, où l’on peut distinguer les continents et les grandes villes. En revanche, le pangénome serait comparable à une carte plus détaillée, révélant les plus petits villages et les routes, même dans des régions plus reculées.
Intégration des variations génétiques interindividus
Bien que nous appartenions à une même espèce, nous présentons des différences génétiques significatives : la séquence d’un génome individuel n’est jamais retrouvée chez une autre personne (sauf chez les jumeaux). Sur les 3 milliards de paires de bases qui composent l’ADN dans un génome, on estime qu’il y a environ 10 millions de différences entre chaque individu, soit un écart de 0,1%.
Guillaume Bourque, professeur au département de génétique humaine et directeur de la bio-informatique au Centre de génomique de l’Université McGill (au Canada), mène des recherches sur ce sujet. Il explique : « à chaque fois qu’on séquence un génome humain, on trouve de nouvelles séquences qui n’étaient pas présentes dans le génome de référence ou chez un autre individu. Ainsi, chaque individu a des petits bouts de génome qui lui sont uniques. Et le pangénome intègre [presque] tous ces nouveaux morceaux ».
La nouvelle étude, publiée dans la revue Nature, rapporte que le premier pangénome de référence — séquencé par un consortium scientifique éponyme — regroupe le génome complet de 47 personnes différentes, provenant de diverses régions du monde. Il comprend 119 millions de paires de bases de plus que le génome de référence. La majorité de cet ADN supplémentaire se situe dans des régions inédites du génome et contient de nombreuses copies de gènes dupliqués.
Selon les chercheurs du consortium, les mutations survenant dans ces gènes dupliqués sont fondamentalement différentes de celles du reste du génome. Ces régions dupliquées joueraient notamment un rôle dans la différence de taille de notre cerveau par rapport aux autres primates, ainsi que dans d’autres caractéristiques liées à l’évolution de notre espèce, dont certains traits physiques ou vulnérabilités aux maladies.
Des populations sous-représentées
Il est cependant important de souligner que ce pangénome ne représente pas encore pleinement la diversité de notre espèce, n’étant pour l’instant qu’une ébauche. Les génomes compilés concernent uniquement des individus d’origine européenne, résultant ainsi en un pangénome qui exclut les variations génétiques issues de populations spécifiques. Timothy O’Connor, chercheur à la faculté de médecine de l’Université du Maryland à Baltimore et qui ne fait pas partie du consortium, note que « il manque encore des groupes clés dans le monde. Il sous-représente toujours les Latino-Américains et les Autochtones, et il n’y a personne d’Océanie ».
Cependant, les membres du consortium envisagent de compléter bientôt ce pangénome en compilant un total de 350 génomes d’ici 2024. Pour ce faire, des discussions sont en cours auprès de populations autochtones et de scientifiques du monde entier. L’intégration des génomes de populations d’autres pays et continents, dont les génomes accessoires diffèrent grandement de ceux des Européens, serait en effet une avancée majeure.
Améliorer la médecine de précision
La séquence du pangénome représente une percée significative en sciences biologiques humaines. Elle pourrait potentiellement révéler les fondements génétiques de maladies cardiaques, neurologiques, de troubles mentaux, de certains cancers, etc. De plus, elle pourrait permettre d’améliorer la médecine de précision grâce au développement de traitements personnalisés. En effet, il est fréquent que certains traitements soient efficaces pour certaines personnes, mais pas pour d’autres. Le pangénome pourrait offrir les outils nécessaires pour comprendre et résoudre ce problème persistant.
Cependant, l’avènement du pangénome constitue également une nouvelle réalité à laquelle les scientifiques doivent s’adapter. Tandis qu’ils comparent le génome de référence à un outil linéaire, le pangénome est davantage assimilé à un graphique et requiert une révision complète des protocoles des travaux liés à la génétique. Bourque souligne : « On a changé la représentation du génome. Dans nos analyses qui utilisent le génome, il faut adapter nos outils à cette nouvelle réalité qui offre de nouvelles possibilités. C’est encore plus complexe, mais l’analyse des données est encore plus riche ».