Notre société est profondément marquée, depuis des siècles, par les inégalités sociales. Malgré les efforts d’ajustements de la gouvernance entamés par de nombreux pays, les écarts de richesses ne cessent de se creuser dans le monde, engendrant de véritables explosions sociales dans les régions les plus vulnérables. Les avancées récentes de l’intelligence artificielle pourraient aider à atteindre des objectifs socioéconomiques plus équitables, en aidant dans les prises de décisions. Dans cette optique, la société DeepMind de Google a récemment développé une IA dite « démocratique », qui aide à répartir les richesses plus équitablement. Testé dans le cadre d’exercices d’investissement, le modèle d’apprentissage renforcé est parvenu à corriger les déséquilibres de richesses, sanctionner les resquilleurs et remporter le vote sur la meilleure méthode pour les répartitions financières les plus « justes ».
Dans tout groupe social où les biens et les ressources doivent être répartis, il existe presque toujours des inégalités, où certains se retrouvent peu favorisés par rapport aux autres. La notion d’inégalité sociale peut en effet découler de nombreux facteurs en amont, tels que les milieux sociaux où l’individu grandit, l’environnement scolaire, les moeurs propres à certaines communautés, etc. Les personnes issues d’un milieu donné sont comme « étiquetées » et ont tendance à être traitées différemment et inégalement lorsqu’elles tentent d’intégrer d’autres groupes.
Des notions de valeurs morales ont alors été instaurées pour tenter d’atténuer ces inégalités. Cependant, dans tout régime sociopolitique et de gestion économique, il existe toujours des divergences d’opinions sur les meilleures façons de gérer les choses. Les politiciens, les économistes et les écologistes sont par exemple très souvent en désaccord sur l’efficacité et l’équité des modèles sociaux.
Les problèmes d’inégalités minent alors de nombreuses facettes de la société, telles que la répartition des richesses. Même si des efforts ont été entamés, l’on peut encore observer de grands écarts de richesses dans le monde. Dans les pays les plus pauvres, où la corruption est quasi incontrôlable, des fossés se creusent entre les classes les plus vulnérables et les plus aisées.
Dans la recherche de solutions pour atténuer ce genre de situation, la nouvelle IA de DeepMind tente d’intégrer objectivement des valeurs morales dans les décisions concernant la répartition des richesses. Selon l’étude, décrite dans la revue Nature Human Behaviour, des résultats bénéfiques sur ce que la société souhaite réellement peuvent être obtenus grâce à une méthodologie appelée « alignement des valeurs ».
Cependant, la tâche reste compliquée du fait que la société comporte une pluralité de points de vues. « L’IA démocrate » risque ainsi encore de ne pas savoir sur lesquels (de points de vue) se baser. DeepMind a ainsi opté pour une solution de vote par popularité.
La méthodologie la plus populaire
Bien que les technologies d’apprentissage automatique réalisent des percées majeures ces dernières années, elles sont tout de même limitées par le simple fait qu’elles peuvent produire des résultats biaisés par le manque de supervision (notamment des données en entrée). De récentes recherches ont notamment montré que les systèmes d’IA basés sur l’apprentissage automatique peuvent présenter des défauts et prendre des décisions politiquement incorrectes.
Pour optimiser la compréhension de la répartition des richesses, les chercheurs ont alors aidé leur nouvelle IA en intégrant des interactions humaines dans son système d’algorithmes. La rétroaction humaine se chargeait alors d’orienter l’IA vers les résultats « préférés », ou supposés plus « justes » et compatibles avec nos valeurs morales.
Pour tester la technologie, les chercheurs ont invité des milliers de volontaires à effectuer un exercice d’investissement sur des biens publics. Dans la simulation, des sommes variables étaient distribuées à chaque joueur, qui obtenaient ensuite des rendements correspondants aux montants investis. Les participants avaient également le choix de conserver leurs gains ou de les partager — pour ensuite obtenir des bénéfices collectifs.
Par ailleurs, la distribution des revenus a également suivi les trois paradigmes d’équité traditionnels (égalitaire strict, libertaire et égalitaire libéral), ainsi que deux mécanismes différents, dont l’un conçu par l’homme et l’autre par l’IA démocrate. Ce dernier, appelé Human Centered Redistribution Mechanism (HCRM), a été développé grâce à un apprentissage renforcé, en utilisant des données de rétroaction provenant à la fois de participants humains et d’agents virtuels conçus pour imiter le comportement humain.
Les résultats des expériences ont montré que le système de répartition utilisé par l’IA était plus apprécié que toutes les autres méthodes. La technologie aurait également réussi à recadrer les resquilleurs et à rééquilibrer la répartition des richesses initiales.
Bien que les possibilités d’utilisation d’une telle technologie sont multiples, les chercheurs soulignent qu’elle peut comporter certaines limites, telle que la confiance en une entité virtuelle. De plus, l’IA ne serait pas destinée à destituer un système économique déjà établi, mais pourrait plutôt contribuer à la prise de décisions meilleures pour la société.