Les simulations numériques qui permettent de modéliser l’évolution temporelle de la matière à l’échelle atomique sont essentielles pour la recherche en chimie, en sciences de la vie et en sciences des matériaux. Pour la première fois, une équipe de Harvard est parvenue à simuler le comportement d’une structure composée de 44 millions d’atomes grâce à l’un des meilleurs superordinateurs au monde et l’intelligence artificielle.
Les chercheurs utilisent depuis longtemps des simulations numériques pour étudier le comportement et l’évolution des atomes, dans le but de mettre au point de nouveaux traitements médicamenteux ou des matériaux aux propriétés spécifiques. Les dimensions des systèmes moléculaires étudiés sont néanmoins limitées par les capacités de calcul des ordinateurs. Certaines techniques permettent de réaliser des simulations atomistiques beaucoup plus complexes, mais manquent de précision, car elles nécessitent de simplifier certaines interactions interatomiques — ce qui impacte nécessairement la fiabilité des résultats obtenus.
Pour permettre des simulations plus précises et tout aussi rapides de systèmes composés d’un très grand nombre d’atomes, des chercheurs de l’Université de Harvard ont mis au point une nouvelle architecture, baptisée Allegro, qu’ils ont récemment mise à l’épreuve sur le supercalculateur Perlmutter, du National Energy Research Scientific Computing Center du Département américain de l’Énergie (classé 8e dans le dernier Top500 des superordinateurs). « Ce travail apporte la précision, l’efficacité de l’échantillonnage et la robustesse des réseaux neuronaux équivariants profonds à l’échelle de calcul extrême », résument les chercheurs dans leur article de pré-impression.
Des simulations rapides, précises et évolutives
Bien que la mécanique quantique régisse les interactions atome-électron, de nombreux phénomènes physiques et chimiques se produisent à des échelles de longueur et de temps plus grandes que le mouvement atomique, explique l’équipe. Atteindre ces échelles nécessite des approches de calcul innovantes, capables de capturer rapidement et avec précision les interactions quantiques, ainsi que des architectures parallélisables qui peuvent fonctionner sur des ordinateurs exaflopiques.
Les systèmes physiques et chimiques réalistes ont cependant une structure beaucoup plus complexe que ce que les méthodes de calcul sont capables d’étudier, et leur évolution observable dépasse les échelles de temps des simulations atomistiques. « Ce fossé entre les questions fondamentales essentielles et les phénomènes qui peuvent être modélisés efficacement persiste depuis des décennies », soulignent les chercheurs.
Dans certains cas, notamment en sciences des matériaux, il est possible de simplifier les simulations en décomposant le système en plusieurs modèles plus petits. Ceci n’est cependant pas envisageable en sciences du vivant, où certaines structures virales sont composées de millions d’atomes, en plus d’un grand nombre de molécules d’eau (indispensables pour simuler l’environnement physiologique).
Pour réussir à simuler un très grand nombre d’atomes, Boris Kozinsky et ses collaborateurs ont utilisé un réseau neuronal dit « équivariant », capable de calculer les interactions entre les atomes en prenant en compte toutes les formes de symétrie possibles (translations, rotations, réflexions), afin d’obtenir une représentation plus fidèle de la géométrie atomistique. L’architecture résultante, baptisée Allegro, allie rapidité, précision, stabilité et évolutivité. « En tant que tel, il établit un nouvel état de l’art pour la dynamique moléculaire et ouvre des portes à la simulation de systèmes précédemment inaccessibles », résument les chercheurs.
Une dimension maximale de 126,4 millions d’atomes
Pour démontrer l’évolutivité d’Allegro, l’équipe a commencé par effectuer des simulations stables de la dynamique des protéines, d’une durée de quelques nanosecondes, puis est passée à une structure de 44 millions d’atomes solvatée dans de l’eau (correspondant à la capside du VIH complète), à l’aide du supercalculateur Perlmutter. Ils ont également simulé l’évolution d’autres molécules courantes, telles que le facteur IX — une protéine sanguine impliquée dans la coagulation, dont le gène est muté dans le cas de l’hémophilie de type B — la cellulose ou encore un virus du tabac.
Cette nouvelle approche permet de simuler n’importe quelle structure composée d’un très grand nombre d’atomes, avec une très grande précision. L’équipe rapporte une performance de 100 timesteps par seconde et une dimension maximale de 126,4 millions d’atomes. « Nous démontrons une excellente mise à l’échelle jusqu’à 100 millions d’atomes et une mise à l’échelle faible de 70% jusqu’à 5120 GPU A100 », précisent les auteurs de l’étude. Bien entendu, l’approche n’est pas limitée aux molécules biologiques ; elle peut être utilisée dans le domaine des sciences des matériaux.
Les simulations de dynamique moléculaire sont un pilier de la science computationnelle, car elles permettent de comprendre la dynamique des molécules et des matériaux à l’échelle atomique. Elles offrent un niveau de résolution, de compréhension et de contrôle que les expériences ne peuvent souvent pas fournir, ce qui en fait un outil extrêmement puissant pour étayer les connaissances des scientifiques et les aider à concevoir de nouveaux produits.
L’architecture Allegro présentée ici est capable de simuler la dynamique de toute structure atomistique, y compris les composites polycristallins et multiphases, la diffusion dans les verres, la polymérisation ou encore les réactions catalytiques. Il a été démontré qu’Allegro était capable d’apprendre avec précision les forces atomiques via l’ensemble de données SPICE, qui comporte plus d’un million de structures moléculaires et de peptides. Elle a donc le potentiel de faciliter des percées dans l’étude de molécules complexes.
À l’avenir, cette architecture devrait être déployée sur des ressources informatiques encore plus importantes, ce qui lui permettra d’atteindre une plus grande évolutivité que celle démontrée dans cette étude.