OptoGPT, un nouvel outil d’IA basé sur l’architecture sous-jacente aux grands modèles de langage, permet de prédire presque instantanément les structures de films optiques multicouches pour une large gamme d’utilisations. En temps normal, la conception de ce type de structures nécessite une expertise approfondie et des mois de recherche. Les films multicouches optimisés à l’aide de l’IA permettraient par exemple d’améliorer significativement les propriétés optiques des cellules solaires et des télescopes.
Les films optiques multicouches (des structures composées de couches minces de différents matériaux empilées les unes sur les autres) sont des structures photoniques essentielles dans de larges domaines d’application, tels que les télescopes, les semi-conducteurs, les fenêtres intelligentes, les cellules solaires, les microscopes, etc.
Afin d’optimiser leurs propriétés optiques, les scientifiques s’appuient sur une technique appelée « conception inverse ». Cela consiste à identifier la disposition optimale des différentes couches de matériaux et les meilleures combinaisons d’épaisseur pour obtenir les propriétés optiques souhaitées.
Parmi les méthodes de conception inverse les plus utilisées figurent celles basées sur les simulations numériques et les recherches itératives et celles utilisant l’apprentissage profond. Cependant, ces méthodes comportent des limites concernant les types de structures à concevoir ou les types d’application ciblés.
Les techniques de simulation numérique nécessitent par exemple d’exécuter un algorithme à partir de zéro lorsque l’application ciblée est différente, ce qui peut impliquer beaucoup de temps et de ressources. D’un autre côté, l’apprentissage profond ne permet actuellement pas de concevoir certains types de structures, par exemple composées de matériaux différents à chaque couche.
Ces méthodes tiennent également rarement compte de certains paramètres essentiels, tels que la diversité et la flexibilité. La diversité concerne la capacité à proposer plusieurs conceptions en fonction de matériaux disponibles, tandis que la flexibilité permet de choisir de manière arbitraire la gamme de matériaux (ainsi que leur épaisseur) composant les différentes couches.
En outre, « la conception de ces structures nécessite généralement une formation et une expertise approfondies, car identifier la meilleure combinaison de matériaux et l’épaisseur de chaque couche n’est pas une tâche facile », explique dans un article de blog de l’Université du Michigan, L. Jay Guo, professeur de génie électrique et informatique. Selon lui, il est parfois difficile de savoir par où commencer, surtout pour un novice dans le domaine.
Guo et ses collègues visent à surmonter la plupart de ces défis à l’aide d’OptoGPT (Opto Generative Pretrained Transformer). Il s’agit d’un nouvel outil polyvalent permettant d’effectuer des conceptions inverses de manière plus flexible.
Des conceptions optimisées en seulement 0,1 seconde
Pour développer leur nouvel outil, les chercheurs de la nouvelle étude — détaillée dans la revue Opto-Electronic Advances — ont adapté un transformeur pour traiter les données optiques. Il s’agit d’une architecture informatique conçue initialement pour le traitement automatique du langage naturel et servant de base aux grands modèles de langage (LLM).
De manière analogique, le modèle traite l’épaisseur de matériaux comme des mots et code leurs propriétés optiques comme des entrées. Une donnée d’entrée est utilisée pour l’automatisation ou la prise de décision du système d’IA. En cherchant les corrélations entre les « mots », le modèle prédit les mots suivants pour former une « phrase » ou dans le cas présent, une conception de film optique multicouche. « Dans un sens, nous avons créé des phrases artificielles pour l’adapter à la structure du modèle existant », explique Guo.
Il a été constaté qu’OptoGPT produisait des conceptions de films multicouches optimisés en seulement 0,1 seconde, soit presque instantanément. En outre, les conceptions contiennent en moyenne six couches de moins que celles produites par le biais des précédents modèles. Cela signifie qu’elles sont plus faciles et moins coûteuses à fabriquer.
Afin d’évaluer les performances du modèle, les chercheurs ont comparé ses conceptions avec un ensemble de 1000 structures connues de films multicouche. Les données de comparaison incluaient la composition des matériaux, leur épaisseur pour chaque couche, ainsi que leurs propriétés optiques. Résultat : la différence entre les deux ensembles de données n’était que de 2,58 %. Les propriétés optiques des films générés par le modèle étaient inférieures de seulement 2,96 % par rapport à ceux de la base de données de comparaison.
Si le modèle se concentre sur une seule tâche, par exemple la conception d’un revêtement à haute efficacité pour le refroidissement radiatif, il peut utiliser une optimisation locale consistant à ajuster les variables pour obtenir le meilleur résultat possible pour une tâche. Cela permet d’affiner davantage l’épaisseur des couches et améliorer la précision du modèle. Au cours des tests, les chercheurs ont constaté que cette option permettait un gain de précision de 24 % et réduisait la différence avec les données de validation (utilisées précédemment) à 1,92 %.
Par ailleurs, les chercheurs ont utilisé une technique statistique pour cartographier la manière dont le modèle associe plusieurs données à la fois. Ils ont constaté que lorsqu’ils sont cartographiés dans un espace bidimensionnel, les matériaux se regroupent par type. Les matériaux diélectriques (y compris les semi-conducteurs) se rassemblent par exemple au niveau d’un point central lorsque leur épaisseur avoisine les 10 nanomètres.
Ces résultats suggèrent que l’outil est suffisamment précis et polyvalent pour concevoir des structures de films optiques multicouches pour un large éventail d’applications. Cela permettrait par exemple d’améliorer l’absorption de la lumière des cellules solaires ou la réflexion des lentilles des télescopes. Les fenêtres intelligentes pourraient aussi être optimisées pour être plus réfléchissantes ou plus transparentes en fonction de la température des bâtiments, etc.