Des chercheurs du Dartmouth College (États-Unis) développent une intelligence artificielle (IA) qui serait capable de détecter certains troubles mentaux en analysant les messages postés sur les réseaux sociaux. Pour entraîner et tester leur système, ils se sont focalisés sur le réseau social Reddit.
Leurs travaux, présentés dans un article d’étude en prépublication sur le serveur arXiv, ont été initialement révélés lors de la vingtième conférence internationale sur l’intelligence web et la technologie des agents intelligents. Les chercheurs y expliquent la façon dont ils ont entraîné une intelligence artificielle à détecter trois types de troubles mentaux grâce aux messages écrits par des utilisateurs de réseaux sociaux. Il s’agit, plus précisément, de troubles émotionnels très répandus : la dépression majeure, la bipolarité et les troubles anxieux.
Ces expérimentations ont été faites sur le réseau social Reddit, pour plusieurs raisons. D’abord, parce qu’il s’agit d’un réseau où l’on peut échanger par écrit qui comporte de nombreux utilisateurs actifs (plus de 430 millions selon l’étude), qui discutent d’une grande variété de sujets. Les utilisateurs y sont également anonymes, et les chercheurs ont pu remonter jusqu’à des conversations de 2011, ce qui leur procure un grand nombre de données. « Les réseaux sociaux offrent un moyen facile d’accéder aux comportements des gens », explique Xiaobo Guo, co-auteur de l’étude, dans un communiqué du Dartmouth College. « Les données sont volontaires et publiques, publiées pour que d’autres puissent les lire », ajoute-t-il.
Pour rappel, le domaine de l’intelligence artificielle est un « ensemble de théories et de techniques mises en œuvre en vue de réaliser des machines capables de simuler l’intelligence humaine », si l’on s’en réfère au Larousse. Dans le cas de ces chercheurs, il s’agissait d’entraîner un algorithme en le « nourrissant » avec un grand nombre de données pour en arriver à lui permettre de détecter des marqueurs d’émotion.
Cet « entraînement » s’est fait en plusieurs étapes. Les chercheurs ne sont pas les premiers à s’intéresser à l’analyse des émotions sur les réseaux sociaux. Ils ont donc commencé par se baser sur des sets de données existants, avant de « nourrir » eux-mêmes leur IA avec des publications Reddit. Ils ont cherché, pour chaque catégorie de trouble, 1997 utilisateurs qui avaient affirmé avoir été diagnostiqués. Ils ont aussi attribué 1997 autres utilisateurs n’ayant rien déclaré et n’ayant jamais abordé ces sujets à un groupe test, afin de pouvoir comparer.
Étiqueter des émotions
70% des publications de ces utilisateurs ont été utilisés pour entraîner l’IA, 15% servaient pour des procédures de validation, et 15% pour tester réellement le modèle. « Le modèle en question a été formé pour ‘étiqueter’ les émotions exprimées dans les messages des utilisateurs et cartographier les transitions émotionnelles entre les différents messages, afin qu’un message puisse être étiqueté ‘joie’, ‘colère’, ‘tristesse’, ‘peur’, ‘pas d’émotion’ ou une combinaison de ceux-ci », explique le communiqué.
En effet, les troubles émotionnels en question (la dépression majeure, la bipolarité et l’anxiété) présentent différents « schémas émotionnels ». Les caractéristiques liées aux humeurs sont d’ores et déjà des traits essentiels pris en compte pour caractériser ce type de troubles. Par exemple, l’anxiété est associée à des peurs et angoisses excessives, la dépression à une perte d’intérêt ou de plaisir pour la plupart des activités…
À partir de ces « étiquettes » émotionnelles, les chercheurs ont voulu établir une sorte de « carte » qui montre la façon dont les utilisateurs passent d’un état émotionnel à un autre, par exemple de la colère à la neutralité, dans la façon dont ils échangent. En effet, il existerait, selon eux, différents schémas de transition entre ces émotions, qui correspondent aux troubles qui les intéressent. Grossièrement, on pourrait donner comme exemple le fait que les personnes atteintes de troubles bipolaires ont tendance à passer rapidement d’une humeur à une autre. Au contraire, les personnes en dépression ont tendance à exprimer une tristesse persistante.
Le modèle qu’ils ont développé se focalise donc sur les transitions, créant ainsi une « empreinte émotionnelle » associée à un utilisateur, et qui peut être comparée à des signatures « types » identifiées comme celles correspondant à des troubles émotionnels. En testant ce modèle sur des publications non utilisées au préalable pour l’entraînement de l’IA, les chercheurs ont alors constaté que celle-ci parvenait à estimer avec précision quels utilisateurs pouvaient ou non présenter ces troubles.
Cette recherche s’inscrit parmi de nombreuses autres, expliquent les scientifiques, qui se sont intéressées à l’analyse des messages sur les réseaux sociaux via des systèmes de « scan » de ce type. En revanche, ce qui différencie leur modèle, c’est cette focalisation sur les émotions, et non sur le contenu.
La fiabilité du facteur émotionnel
Selon eux, l’aspect abstrait des émotions permet de mieux faire perdurer la pertinence de l’intelligence artificielle dans le temps, car elles sont indépendantes des sujets abordés. « Cette approche évite un problème important appelé ‘fuite d’informations’ que rencontrent les outils de dépistage typiques », explique Soroush Vosoughi, professeur adjoint d’informatique et co-auteur de l’étude. Les outils dont il parle reposent en effet davantage sur le contenu des messages.
Cette approche peut montrer une certaine fiabilité, mais a aussi des failles. Par exemple, Soroush Vosoughi donne l’exemple du sujet COVID-19. Il serait possible dans de nombreux cas de l’associer à de la tristesse, ou de l’anxiété. Cela fonctionnerait dans beaucoup de cas, mais peut aussi mener à des mésinterprétations.
L’analyse psycholinguistique est une autre approche évoquée par les scientifiques : par exemple, la façon qu’a une personne de formuler ses phrases, en utilisant des façons d’écrire particulières. Dans ce cas-ci, le problème peut venir du fait que ces manières peuvent persister même en cas d’une « résolution » d’un trouble.
Au-delà de la façon de le faire, quel est l’intérêt de « scanner » ainsi les réseaux sociaux à la recherche de personnes atteintes de troubles émotionnels ? Selon les scientifiques, cette technologie permettrait de déceler les personnes qui ne vont pas spontanément « se faire diagnostiquer », ou chercher de l’aide. Beaucoup d’individus qui souffrent de troubles mentaux ne demandent en effet pas d’aide, pour diverses raisons. Traumatismes, coûts trop élevés, manque d’accès aux services, ou minimisation… En revanche, espèrent les chercheurs, ils pourraient être amenés à chercher de l’aide si on les y incite.
Les recherches sur ce sujet ne font que commencer, selon les scientifiques. Ces derniers comptent tester leur modèle sur d’autres réseaux sociaux, afin de déterminer s’il est suffisamment « solide » pour être appliqué sur toutes les plateformes. Ils souhaitent également affiner le modèle de classement des émotions, ou encore s’essayer à l’analyse d’autres types de contenus, tels que des images ou des vidéos. Ils comptent également creuser la question de l’influence des heures de publication, ou le nombre de posts rédigés par un même utilisateur.