Produire des neurones artificiels plus efficaces que les neurones humains… l’idée n’est pas nouvelle. Des chercheurs du MIT viennent cependant de l’emmener à un tout autre niveau. Ils affirment avoir créé un réseau de neurones artificiel capable de fonctionner un million de fois plus vite que chez l’Homme.
Cet exploit aurait été réalisé en utilisant un réseau neuronal « analogique ». Mais quel est l’intérêt de créer des neurones artificiels ? Pour le comprendre, il faut déjà revenir sur la notion de « réseau neuronal ». Si on reprend la définition de la Fédération de la recherche pour le cerveau, les neurones peuvent être vus comme « l’unité de travail de base » du cerveau. Ce sont des cellules spécialisées. Elles transmettent des informations à d’autres cellules nerveuses, selon leur domaine de spécialisation. Elles sont globalement constituées de :
- la dendrite, qui reçoit un signal nerveux
- un soma, corps cellulaire qui le décode
- un axone, qui le transmet
Ces neurones sont connectés entre eux par des synapses, qui relient l’axone et la dendrite. Ils communiquent via des signaux électriques, appelés « potentiels d’action » : c’est cela qui libère les neurotransmetteurs. Ces derniers sont des « messagers chimiques » chargés de passer à travers les synapses pour transmettre l’information. On a donc là un réseau neuronal naturel.
Un réseau neuronal artificiel est lié au domaine que l’on nomme communément « l’intelligence artificielle ». Il s’agit en fait d’un système qui est « nourri » d’une grande quantité de données pour « apprendre » et extraire des connexions logiques en vue d’un objectif donné. Ces méthodes d’apprentissage sont inspirées du fonctionnement des neurones biologiques, et c’est la raison pour laquelle on parle de « réseau neuronal artificiel ».
Un système d’apprentissage inspiré des neurones biologiques
En effet, les données envoyées circulent dans une « grille » artificielle de neurones, généralement virtuels. Ce sont en réalité des points dans le réseau reliés entre eux par du code informatique (les synapses, en quelque sorte). Ce réseau reçoit donc une information entrante, les données d’apprentissage, et émet une information sortante.
Dans les deux cas, on retrouve un phénomène « d’apprentissage » qui passe par le traitement de données. Dans notre cerveau (biologique), les connexions entre les neurones, les synapses, sont renforcées ou affaiblies par l’expérience et l’apprentissage. Dans un réseau neuronal artificiel, le principe est un peu similaire : les liens entre les points du réseau sont pondérés selon le traitement de très nombreuses données. C’est pour cela que l’on parle d’apprentissage profond, ou « deep learning ».
La nouveauté présentée ici par les scientifiques est un réseau neuronal qui effectue ces calculs extrêmement rapidement, et avec peu de besoins en énergie. Pour cela, ils expliquent s’être basés non pas sur un réseau neuronal numérique, mais analogique. Revenons donc sur la différence entre analogique et numérique.
L’analogique et le numérique sont deux procédés différents. Ils permettent tous deux de transporter et de stocker des données. Par exemple, de l’audio, une image, une vidéo… Le système analogique est apparu dès les débuts de l’électricité. En revanche, le numérique est apparu avec l’informatique. Dans un système analogique, le principe de base est de reproduire le signal à enregistrer sous une forme similaire.
Numérique et analogique
Par exemple, la télévision analogique fonctionnait sur ce principe. L’image à retransmettre était convertie en signaux électriques, qu’on appelait « signal vidéo », caractérisé par sa fréquence, c’est-à-dire le nombre d’oscillations en une seconde. Ces signaux électriques étaient retransmis via une onde électromagnétique à laquelle on fait suivre les mêmes amplitudes que le signal d’origine. Le signal transmis est donc une sorte de « reproduction » du signal originel.
En numérique, le signal à enregistrer est converti en une suite de 0 et de 1. Les amplitudes ne sont donc plus reproduites, mais plutôt encodées, et décodées à l’arrivée. C’est ce qui a changé lors du passage à la télévision numérique, comme l’explique bien la vidéo ci-dessous.
En numérique, on obtient donc un signal à deux amplitudes au lieu d’une infinité en analogique. Jusqu’ici, les réseaux neuronaux artificiels fonctionnent la plupart du temps sur le principe du numérique. Les pondérations du réseau sont donc programmées à l’aide d’algorithmes d’apprentissage, et les calculs se font grâce à des suites de 0 et de 1. C’est pourtant en appliquant un système analogique que les scientifiques du MIT sont parvenus à créer, selon eux, un réseau neuronal bien plus rapide et efficace que chez l’humain. Un million de fois plus rapide, pour être exact.
Dans un système de deep learning analogique, ce n’est donc pas la transmission de données sous forme de 0 et 1 qui joue, mais « l’augmentation et la diminution de la conductance électrique des résistances protoniques » qui permettent l’apprentissage automatique, peut-on lire dans le communiqué du MIT. La conductance se définit par la capacité à laisser passer le courant (l’inverse de la résistance). « La conductance est contrôlée par le mouvement des protons. Pour augmenter la conductance, plus de protons sont poussés dans un canal de la résistance, tandis que pour diminuer la conductance, des protons sont retirés. Ceci est accompli en utilisant un électrolyte (similaire à celui d’une batterie) qui conduit les protons, mais bloque les électrons ».
La résistance électrique est une propriété physique d’un matériau qui limite le passage du courant électrique dans un circuit. Un composant qui possède cette propriété sert donc à limiter le passage des électrons dans le circuit. Dans le cas présent, elle représente donc un élément clef, puisque c’est elle qui régule le mouvement des protons.
Une forte résistance aux impulsions électriques
Pourquoi ce procédé permet-il un fonctionnement plus rapide du réseau neuronal ? « Tout d’abord, le calcul est effectué en mémoire, de sorte que d’énormes charges de données ne sont pas transférées de la mémoire vers un processeur », expliquent les scientifiques. « Les processeurs analogiques effectuent également des opérations en parallèle. Si la taille de la matrice augmente, un processeur analogique n’a pas besoin de plus de temps pour effectuer de nouvelles opérations, car tous les calculs se produisent simultanément ».
La vitesse atteinte se compte ainsi en nanosecondes. Si cela a été possible, c’est aussi parce que les scientifiques ont utilisé un matériau particulier : le verre de phosphosilicate inorganique (PSG), un matériau proche de ce que l’on trouve dans les sachets dessiccants. Ce matériau est un très bon conducteur, car il présente de très nombreux pores nanométriques qui permettent le passage des protons, tout en pouvant supporter des tensions électriques pulsées élevées. Cette qualité était essentielle selon les scientifiques, puisque c’est cette robustesse qui leur permet d’appliquer de plus grandes tensions électriques, et donc d’obtenir cette vitesse si élevée.
« Le potentiel d’action dans les cellules biologiques augmente et diminue avec une échelle de temps de quelques millisecondes, car la différence de tension d’environ 0,1 volt est limitée par la stabilité de l’eau », explique l’auteur principal Ju Li, professeur de science et d’ingénierie nucléaire de la Battelle Energy Alliance et professeur de science et d’ingénierie des matériaux, « Ici, nous appliquons jusqu’à 10 volts à travers un film de verre solide spécial d’une épaisseur nanométrique qui conduit les protons, sans l’endommager de façon permanente. Et plus le champ est fort, plus les dispositifs ioniques sont rapides ».
Les scientifiques espèrent pouvoir repenser ce système pour l’adapter à une fabrication en grand volume. Ils placent de grands espoirs dans cette avancée : « Une fois un processeur analogique développé, il n’est plus nécessaire d’entrainer les réseaux sur lesquels tout le monde travaille, mais des réseaux avec des complexités sans précédent, que personne d’autre ne peut se permettre, surpassant tout ce qui était possible auparavant. En d’autres termes, ce n’est pas une voiture plus rapide, c’est un vaisseau spatial », ajoute Murat Onen, auteur principal et postdoctorant au MIT.