Grâce à sa capacité à traiter d’immenses quantités de données, l’intelligence artificielle (IA) pourrait permettre de cartographier en un temps record toutes les configurations moléculaires possibles, suggèrent des chercheurs. Il s’agirait en quelques sortes de l’équivalent d’un « Google Maps » dédié à la chimie — un projet titanesque qui permettrait d’accélérer le développement de nouveaux médicaments et de matériaux ultraperformants.
Depuis quelques années, les scientifiques disposent d’environnements numériques chimiques leur permettant de visualiser de grands ensembles de données englobant des milliards de molécules. Appelés « espaces chimiques », il s’agit de cartes interactives offrant un aperçu sur des composés projetés en deux ou trois dimensions, un peu comme une carte du ciel ponctué d’étoiles. Les distances relatives entre chaque composé sont définies en fonction de leurs similitudes. Par exemple, ceux réagissant de la même manière à la chaleur ou la lumière ont des propriétés similaires et sont donc placés plus près les uns des autres.
La création de ces espaces promet de larges perspectives en permettant par exemple la découverte de nouveaux médicaments de façon accélérée. Des composés analogues peuvent être identifiés et le principe actif peut être optimisé en évaluant quelles combinaisons sont les plus efficaces. ChemMaps (indisponible au moment où nous écrivons ces lignes), l’un de ces espaces, permet par exemple de naviguer à travers plus de 166,4 milliards de molécules organiques projetées en trois dimensions et comprenant 17 atomes au maximum. L’outil — inspiré de Google Maps et accessible au public — permet de visualiser la composition et les propriétés physicochimiques de près de 1 million de médicaments et de produits toxiques pour l’environnement. Il comprend également un vaste ensemble de données d’essais in vitro, révélant les interactions entre des milliers de cibles cellulaires et des molécules toxiques ou médicamenteuses.
Cependant, malgré leurs performances, ces espaces ne traitent que d’ensembles de données relativement limités. En effet, établir une cartographie exacte de toutes les configurations moléculaires possibles, y compris leur niveau de stabilité et leurs propriétés, est un défi de taille. Lors de la dernière conférence de l’American Chemical Society à San Francisco, des chercheurs ont suggéré que les IA actuelles pourraient contribuer à atteindre cet objectif, en vue de leur puissance de calcul. À terme, ce projet de carte permettrait d’accélérer la découverte de nouvelles molécules actives, de nouveaux matériaux, de composés neutralisant les produits chimiques toxiques dans l’environnement, etc.
Un outil pour accélérer le développement de médicaments
Le développement d’un nouveau médicament comprend de laborieuses étapes, incluant : la reconnaissance de la cible et son authentification, l’identification de la composition chimique optimale, les évaluations précliniques et cliniques, … L’ensemble de ces processus implique qu’environ 10 à 15 ans soient nécessaires avant qu’un médicament arrive sur le marché. L’assistance informatique a permis d’accélérer et d’anticiper les propriétés des composés actifs, en prédisant leurs propriétés physicochimiques, la sélectivité, les effets secondaires et les paramètres pharmacocinétiques.
Cependant, ces approches comportent des limites, car elles se basent généralement sur des données préétablies. En revanche, l’IA ne s’appuie pas sur des principes physicochimiques prédéfinis et se base davantage sur la synthèse d’un très grand ensemble de données biomédicales. De plus, l’identification d’un principe actif nécessite de brasser et de comparer jusqu’à 1060 molécules différentes, chacune possédant des propriétés spécifiques, mais potentiellement pertinentes pour la cible médicamenteuse. En vue de ses performances actuelles, la technologie pourrait établir un espace chimique beaucoup plus vaste. L’identification d’une nouvelle molécule active ne prendrait que quelques jours ou semaines au lieu d’une décennie ou plus.
Un outil basé sur l’IA plus ou moins similaire — AlphaFold — est actuellement disponible pour prédire la structure de toutes les protéines de la planète. Cependant, la création d’un espace chimique est beaucoup plus laborieuse, car de nombreuses données sont encore inaccessibles. Les données sur les procédures ou les composés jugés non pertinents sont par exemple rarement publiées.
Néanmoins, des recherches sont en ce moment en cours au Massachusetts Institute of Technology (MIT) pour développer un vaste espace chimique basé sur l’IA. L’outil vise à identifier une molécule en tant que catalyseur puis de demander à l’IA d’explorer la stabilité de chaque configuration, en déplaçant ses atomes ou en les échangeant par d’autres. Cette technique permet de remplir l’espace environnant cette molécule avec ses analogues qui lui sont plus ou moins similaires. Les propriétés spécifiques correspondent également à différents sous-espaces. Les composés toxiques sont par exemple rassemblés au niveau du même sous-espace. L’outil a pu être testé pour la recherche de matériaux de stockage d’énergie solaire ou la conversion de gaz à effet de serre en liquides moins polluants, avec des résultats prometteurs.