Grâce à une expérience menée sur des souris, des
neuroscientifiques du MIT sont parvenus à identifier les neurones
chargés de coder le résultat des actions. Ces neurones, localisés
dans le striatum — une zone du cerveau qui régule notamment la
motivation et l’impulsivité — semblent impliqués dans l’évaluation
des risques et des bénéfices d’une action, contribuant ainsi à la
prise de décision. Cette découverte pourrait mener à une nouvelle
forme de traitement de certains troubles
neuropsychiatriques.
L’apprentissage des résultats positifs et négatifs des actions, qui influe nécessairement sur le comportement, est crucial pour la survie des individus. Les scientifiques savent que le striatum est impliqué dans ces mécanismes d’apprentissage, qui permettent aux individus d’adapter leur comportement dans des environnements changeants. Comment ? Des neurones spécifiques, appelés neurones striataux de projection, codent les différentes associations entre actions et résultats. La façon dont ces associations sont formées n’est cependant pas entièrement comprise, en particulier lorsque les résultats ont des caractéristiques à la fois positives et négatives (ce qui rend la prise de décision plus difficile).
Une équipe du MIT s’est intéressée au sujet. En confrontant des souris à une tâche de recherche de nourriture, basée sur le problème du bandit manchot (les souris devant maximiser leur gain de nourriture tout en minimisant la punition), ils ont mis en lumière les cellules cérébrales qui participaient à cette prise de décision : un groupe de neurones du striatum encodait les résultats potentiels de chacune des décisions ; ils ont notamment remarqué que ces neurones s’activaient d’autant plus lorsque le résultat était différent de celui attendu par les rongeurs — ce qui confirme que le cerveau est capable de s’adapter à différentes circonstances.
Des neurones codant à la fois pour la récompense et la punition
Il arrive que nous nous trouvions dans des situations nécessitant une prise de décision complexe : il nous faut alors estimer le risque attribué à chacun des choix possibles, ce qui revient à faire une rapide analyse des balances bénéfice-risque. Les personnes souffrant de certains troubles neuropsychiatriques, tels que l’anxiété et la dépression, deviennent incapables de prendre de telles décisions. Grâce aux recherches du MIT, on sait désormais quels sont les neurones qui nous permettent de faire ce genre d’analyse : selon les chercheurs, des perturbations de l’activité de ces neurones pourraient être à l’origine de décisions impulsives ou au contraire d’un blocage dû à une indécision.
L’équipe s’est intéressée en particulier à la façon dont le cerveau prend des décisions, lorsque celles-ci ont des conséquences à la fois positives et négatives. Pour ce faire, ils ont entraîné des souris à faire tourner une roue vers la gauche ou vers la droite. À chaque tour, les animaux recevaient une combinaison de récompense (eau sucrée) et de « punition » (une petite bouffée d’air) parmi quatre possibilités : récompense+pas de punition, punition+pas de récompense, récompense+punition et pas de récompense+pas de pas de punition. À mesure que les souris effectuaient la tâche, elles apprenaient à maximiser les récompenses et à minimiser les punitions.
À noter qu’au cours de l’expérience, les chercheurs modifiaient fréquemment les probabilités d’obtenir chaque résultat, les souris devaient ainsi ajuster leur comportement en permanence. En parallèle, l’équipe a enregistré l’activité cérébrale des striosomes — les groupes de neurones du striatum. Des travaux antérieurs ont montré que les striosomes envoient des informations à de nombreuses autres parties du cerveau, y compris les régions productrices de dopamine — un neurotransmetteur largement impliqué dans le plaisir, la motivation et la prise de risque — et les régions impliquées dans la planification des mouvements ; ces informations sont liées à la prise de décision et aux récompenses ultérieures.
Une activité accrue pour enregistrer les erreurs
Les chercheurs ont pu constater, comme attendu, que l’activité neuronale variait selon les résultats obtenus par les souris suite à l’exécution de leur tâche : les neurones encodaient les informations sur les résultats potentiels des différentes décisions, ce qui a permis aux animaux de savoir quelle action considérée comme bénéfique devait être répétée, et quelle action devait au contraire ne pas être reproduite.
Mais ils ont surtout observé que de nombreux neurones codaient aussi la relation entre les actions (tourner la roue à droite ou à gauche) et les deux types de résultats. « Nous avons constaté que les associations action-résultat pour la récompense et la punition étaient codées en parallèle dans des populations se chevauchant partiellement. Des neurones uniques pouvaient, pour une action, coder des résultats de valence opposée », expliquent les chercheurs dans Nature Communications.
L’équipe a également relevé que l’activité de ces neurones était la plus intense lorsque les souris étaient surprises par le résultat — ce qui est somme toute logique, un résultat attendu n’induisant pas d’apprentissage. « Ce que nous voyons, c’est qu’il y a un fort encodage à la fois des récompenses inattendues et des résultats négatifs inattendus », explique Bernard Bloem, ancien postdoctorant au MIT et l’un des principaux auteurs de l’étude. Les scientifiques évoquent ainsi un « multiplexage des contingences action-résultat par les neurones ». Ce phénomène semble pousser le cerveau à changer de stratégie dès que nécessaire.
Dans un cerveau humain « normal », le striatum sait pourquoi telles décisions sont bénéfiques et quelles sont les conséquences plus ou moins néfastes de chacune. Ainsi, l’activité des neurones striataux reflète davantage le résultat potentiel d’une décision que la probabilité qu’on la prenne, explique Bloem. Chez les individus souffrant de troubles mentaux (dépression, schizophrénie, stress post-traumatique, etc.), le problème est que cette distinction entre bonne et mauvaise décision ne fonctionne plus correctement, ce qui entraîne une altération du jugement et des comportements impulsifs. « Une thérapie comportementale ciblant le stade où les informations sur les résultats potentiels sont encodées dans le cerveau pourrait aider les personnes qui souffrent de ces troubles », concluent les chercheurs.