Des ingénieurs ont développé une puce informatique exploitant les ondes électromagnétiques (au lieu des signaux électriques) pour effectuer les calculs complexes essentiels à la formation et au fonctionnement des modèles d’IA. Cette puce silicium-photonique (SiPh) permettrait entre autres aux réseaux neuronaux de réagir à une vitesse proche de celle de la lumière tout en réduisant considérablement leur consommation énergétique.
Malgré des décennies d’avancées technologiques, les puces informatiques actuelles dépendent toujours de l’électricité pour effectuer des calculs complexes — un mode de fonctionnement qui n’a pas évolué depuis les années 1960. Or, les calculs essentiels à la formation et à l’exécution des modèles d’IA dépendent de ces puces, ce qui limite leur vitesse et leur efficacité et consomme énormément d’énergie.
En plus d’être limitées en matière de performances de calcul, les puces informatiques actuelles sont très sensibles aux défauts de fabrication. Cela suggère qu’elles risquent bientôt de devenir obsolètes, à mesure que les modèles d’IA se développent. D’un autre côté, de récentes études ont révélé que la consommation énergétique quotidienne des grands modèles d’IA se chiffre actuellement en mégawattheures. En vue de la croissance du secteur, cette consommation équivaudra bientôt selon les estimations à celle d’un pays entier (pour l’ensemble des serveurs d’IA), les besoins énergétiques augmentant à mesure que les modèles deviennent plus avancés et nécessitent davantage de puissance de calcul.
De nouvelles puces exploitant l’interaction de la lumière avec la matière pourraient surmonter les limites des technologies actuelles tout en réduisant considérablement les coûts énergétiques liés à leur exploitation. Dans cette vision, des chercheurs de l’Université de Pennsylvanie ont mis au point la puce SiPh, à base de silicium — un matériau bon marché utilisé pour les puces actuelles —, permettant de manipuler la lumière à l’échelle nanométrique pour effectuer des calculs.
Il s’agit notamment du premier dispositif combinant les recherches de Nader Engheta, lauréat de la médaille Benjamin Franklin (l’une des plus anciennes récompenses scientifiques et technologiques au monde) et de Firooz Aflatouni, pionnier des dispositifs en silicium à l’échelle nanométrique. « Nous avons décidé d’unir nos forces », déclare Engheta dans un communiqué de l’Université de Pennsylvanie.
Des systèmes pratiquement impossibles à pirater
L’objectif de l’équipe de l’Université de Pennsylvanie consistait à développer une plateforme permettant d’effectuer, par le biais d’une puce photonique, ce que l’on appelle une « multiplication vecteur-matrice », une opération mathématique de base, essentielle au développement et au fonctionnement des réseaux neuronaux — l’architecture soutenant les grands modèles d’IA. « Plus précisément, les réseaux neuronaux peuvent bénéficier de la multiplication vectorielle matricielle rendue sous forme de modules de calcul analogique optiques avec une consommation d’énergie améliorée par opération arithmétique, tout en atteignant des vitesses significativement plus élevées », ont expliqué les chercheurs dans leur document, publié dans la revue Nature Photonics.
La multiplication vecteur-matrice consiste à multiplier une rangée de nombres (formant un vecteur) par une grille d’autres nombres (formant une matrice) afin de produire une autre rangée de nombres. Cette opération est répétée des millions de fois pour entraîner les réseaux neuronaux à traiter les données correspondant aux tâches auxquelles ils sont dédiés, telles que la reconnaissance d’images ou le traitement du langage.
Afin d’effectuer des multiplications vectorielles matricielles à l’aide d’ondes électromagnétiques, les chercheurs ont exploité les propriétés du silicium, qui permettent de diffuser la lumière de différentes manières, en fonction de son épaisseur. Au lieu d’utiliser une surface uniforme, ils ont réduit l’épaisseur de la puce à environ 150 nanomètres au niveau de certaines zones. Cela a permis de contrôler la diffusion de la lumière à travers la plateforme selon des motifs spécifiques, pour effectuer des calculs.
Les résultats montrent que la puce peut effectuer simultanément plusieurs multiplications vecteur-matrice à la fois à une vitesse proche de celle de la lumière — et ce, en ne consommant que très peu d’énergie. Mis à part ces avantages, la puce SiPh pourrait améliorer la protection des données. En effet, les ondes électromagnétiques n’ont pas besoin d’être stockées dans une mémoire de travail, ce qui rendrait les ordinateurs équipés de ce type de puce techniquement inviolables. « Personne ne peut pirater une mémoire inexistante pour accéder à vos informations », explique Aflatouni.
Les experts affirment que la puce SiPh est d’ores et déjà prête pour des applications commerciales et pourrait potentiellement compléter les dispositifs actuels, dont les unités de traitement graphique (GPU) — largement utilisées pour les systèmes d’IA. Cela permettrait d’améliorer leur capacité et leur vitesse de classification.