C’est indéniable : l’intelligence artificielle ChatGPT a fait des progrès fulgurants depuis des débuts. Assez pour commencer à se rapprocher d’un niveau d’intelligence humain ? C’est ce que pense une équipe de scientifiques spécialisée en IA qui travaille pour Microsoft. Elle s’est penchée sur le cas de GPT-4, la toute dernière version du programme développé par OpenAI.

« Compte tenu de l’étendue et de la profondeur des capacités de GPT-4, nous pensons qu’il peut raisonnablement être considéré comme une première version (encore incomplète) d’une intelligence générale artificielle (IGA) », annonce l’équipe de recherche. L’assertion est de taille, et il faut souligner d’emblée le fait que ces scientifiques ne sont sans doute pas les mieux placés pour faire preuve d’une objectivité totale en la matière. En effet, ils sont employés par Microsoft : une entreprise qui a conclu récemment un partenariat à plusieurs milliards de dollars avec OpenAI, l’entreprise mère de ChatGPT. Microsoft vient également d’intégrer BingChat à son moteur de recherche : une IA basée sur les programmes d’OpenAI. Leurs travaux ont été publiés sur arXiv, ce qui signifie qu’ils n’ont pas encore été revus par des pairs.

Ceci étant posé, quels sont les arguments avancés par les chercheurs pour dire que ChatGPT-4 se rapproche de « l’intelligence générale artificielle » ? Tout d’abord, revenons sur ce concept un peu nébuleux. Selon l’ouvrage intitulé « Intelligence artificielle générale », de Vasil Teigens, il s’agit de « l’intelligence d’une machine qui peut comprendre ou apprendre n’importe quelle tâche intellectuelle qu’un être humain peut réaliser ». Il s’agit donc d’un concept finalement très général, aux contours assez mal définis, comme en conviennent d’ailleurs les chercheurs de Microsoft. L’ouvrage précise d’ailleurs qu’il s’agit « d’un objectif majeur de certaines recherches sur l’intelligence artificielle », mais également « d’un sujet commun dans la science-fiction ».

En fait, il s’agit presque de réfléchir à la définition même de « l’intelligence » en général. Seulement voilà : là encore, il s’agit d’une notion assez mouvante. Tellement, en fait, que pas moins de 52 psychologues ont entrepris de se pencher sur la question en 1994. Ensemble, ils ont défini l’intelligence comme « une capacité mentale très générale qui, entre autres, implique la capacité de raisonner, de planifier, de résoudre des problèmes, de penser de manière abstraite, de comprendre des idées complexes, d’apprendre rapidement et de tirer des leçons de l’expérience ». C’est cette définition que les chercheurs de Microsoft ont décidé d’adopter pour voir si ChatGPT-4 en possédait ou non les caractéristiques. « Cette définition implique que l’intelligence ne se limite pas à un domaine ou à une tâche spécifique, mais qu’elle englobe plutôt un large éventail de compétences et d’aptitudes cognitives », expliquent les scientifiques.

On pourrait donc résumer assez simplement l’argument majeur exposé dans leur étude sur ChatGPT-4 : à la suite de nombreux tests, ils soutiennent que cette IA est plus performante que les autres modèles OpenAI qui l’ont précédé. Elle montre une capacité d’adaptation par ses interactions avec le monde, et ses capacités sont très polyvalentes. Autrement dit, nous quittons l’ère où l’IA se résumait à un programme hyperspécialisé, pour aller vers une IA capable de s’adapter à la demande de l’utilisateur et de « réfléchir » de manière globale à son problème. De ce point de vue, il est certain que ChatGPT, et plus particulièrement ChatGPT-4, a de quoi impressionner.

Une IA dotée de bon sens

« Nous démontrons qu’au-delà de sa maîtrise du langage, ChatGPT-4 peut résoudre des tâches nouvelles et difficiles qui touchent aux mathématiques, au codage, à la vision, à la médecine, au droit, à la psychologie, aux mathématiques et bien d’autres choses encore, sans avoir besoin d’aucune incitation particulière », décrivent les scientifiques. Depuis quelques mois déjà, ChatGPT fait parler de lui pour ses capacités à écrire des articles, passer des examens, ou encore écrire du code informatique. Avec l’arrivée de sa dernière mise à jour, il s’est encore amélioré. « Dans toutes ces tâches, les performances de GPT-4 sont étonnamment proches de celles d’un être humain et dépassent souvent largement les modèles antérieurs tels que GPT-3 », affirment les chercheurs.

En outre, ChatGPT aurait progressé côté « bon sens ». « L’un des défis du développement de l’IGA est de doter le système de la capacité de raisonner avec des connaissances de bon sens sur le monde que nous, les humains, considérons comme allant de soi », expliquent les chercheurs. Pour analyser l’évolution de cette capacité, ils ont donc posé à ChatGPT, et à ChatGPT-4, des devinettes qui font appel au bon sens.

Connaissez-vous cette ritournelle célèbre ? « Un chasseur parcourt un kilomètre au sud, un kilomètre à l’est et un kilomètre au nord et se retrouve à son point de départ. Il voit un ours et l’abat. De quelle couleur est l’ours ? ». La réponse est blanc, car le seul endroit où ce scénario est possible est le pôle nord, où vivent les ours polaires. Toutefois, trouver cette réponse demande une certaine gymnastique mentale. La où la première version de ChatGPT répondait qu’aucune information sur la couleur n’avait été donnée, ChatGPT-4 est capable de faire la déduction.

Les chercheurs ont également refait avec ChatGPT-4 les tests de la « théorie de l’esprit », que nous avions évoqué récemment dans un article. « Nos résultats suggèrent que GPT-4 possède un niveau très avancé de théorie de l’esprit. Bien que GPT-3 obtient également de bons résultats aux tests de base, il semble que GPT-4 ait plus de nuances et soit capable de mieux raisonner à propos de multiples acteurs et de la façon dont diverses actions peuvent avoir un impact sur leurs états mentaux, en particulier dans des scénarios plus réalistes », soulignent-ils. Il s’agit là de la capacité de comprendre les émotions et les réactions de quelqu’un d’autre que soi. Ils précisent toutefois ne pas avoir encore titillé ChatGPT-4 en faisant usage de l’ironie, ou du second degré.

Une IA loin d’être « parfaite »

La question du « pourquoi » ChatGPT est capable d’évoluer de cette manière n’est pas complètement tranchée. « Une hypothèse générale est que la grande quantité de données (en particulier la diversité du contenu) oblige les réseaux neuronaux à apprendre des « circuits neuronaux » génériques et utiles (…) tandis que la grande taille des modèles fournit suffisamment de redondance et de diversité pour que les circuits neuronaux se spécialisent et s’adaptent avec précision à des tâches spécifiques », avancent les scientifiques.

Toutefois, ils ont aussi largement nuancé leurs propos. « Notre affirmation selon laquelle GPT-4 représente un progrès vers l’IGA ne signifie pas qu’elle est parfaite dans ce qu’elle fait, ni qu’elle est proche de pouvoir faire tout ce qu’un humain peut faire (ce qui est l’une des définitions habituelles de l’IGA), ni qu’elle a une motivation intérieure et des objectifs (un autre aspect clé dans certaines définitions de l’IGA) », peut-on ainsi lire dans l’article.

Pour le moment, il sera en tout cas difficile de nous assurer par nous-mêmes des progrès de ChatGPT-4 : en effet, les scientifiques précisent bien que leurs recherches portent sur une première version de la nouvelle IA, telle qu’elle était lorsqu’elle était encore activement développée par OpenAI. Il ne s’agit donc pas, très probablement, de celle maintenant accessible publiquement.

