OpenAI a enfin lancé GPT-5, jeudi dernier, son nouveau modèle d’IA très attendu qui alimentera la prochaine génération de ChatGPT. Ce modèle disposerait des capacités d’un expert de niveau doctorat pour certaines tâches, notamment grâce à un système « unifié » combinant la capacité de raisonnement de la série GPT-4o et o3, et la réactivité des modèles GPT. Son arrivée sur le marché marque une nouvelle étape importante à la fois pour l’entreprise et pour le domaine de l’IA en général.
Lors du lancement de son dernier modèle, Sam Altman, le PDG d’OpenAI, a affirmé que GPT-5 constitue, selon l’entreprise, le meilleur modèle d’IA actuellement disponible et représente une étape clé vers l’IA générale. En effet, si GPT-4 permettait aux chatbots d’IA de fournir des réponses construites et intelligentes à un large éventail de questions, GPT-5 permet d’effectuer une grande variété de tâches pour le compte des utilisateurs telles que la programmation de logiciels, l’écriture créative, la gestion d’agenda, etc.
Le modèle aurait la capacité de répondre à des questions pointues en disposant de compétences d’un expert de niveau doctorat sur certains sujets. À titre de comparaison, GPT-3 est souvent présenté par certains médias comme ayant un niveau équivalent à celui d’un lycéen, notamment en ne fournissant les bonnes réponses qu’une fois sur deux. GPT-4 serait en revanche plus avancé, disposant de capacités de niveau étudiant, mais pas encore de niveau expert.
Et plutôt que de demander à l’utilisateur d’affiner ses questions, le modèle est équipé d’un routeur en temps réel lui permettant de choisir la meilleure réponse, qu’il s’agisse de répondre rapidement ou de prendre le temps de « réfléchir » à sa réponse. « GPT-5 surpasse non seulement les modèles précédents lors des benchmarks et répond plus rapidement aux questions, mais surtout, il est plus utile pour les requêtes concrètes », explique l’entreprise dans un communiqué.
GPT-5 est disponible pour les utilisateurs inscrits au forfait gratuit pour une utilisation par défaut, tandis que les abonnés Plus et Pro auront accès à une version plus avancée, dotée d’un niveau de raisonnement plus étendu pour des réponses plus complètes et plus précises. Selon Nick Turley, vice-président de ChatGPT chez OpenAI, cette initiative s’inscrit dans le cadre des efforts d’OpenAI visant à offrir aux utilisateurs gratuits un accès inédit à un modèle de raisonnement IA, conformément à leur vision initiale d’entreprise à but non lucratif. Auparavant, l’entreprise n’offrait l’accès à ses modèles avancés qu’aux utilisateurs payants.
Le modèle le plus puissant du marché ?
Les performances de GPT-5 reposent sur son aspect « unifié », combinant des modèles de raisonnement approfondis pour les problèmes complexes et un modèle d’efficacité qui répond à la plupart des questions. Le routeur en temps réel décide lequel utiliser en fonction des demandes de l’utilisateur, de leur complexité et des intentions explicites (en indiquant par exemple « réfléchis bien à ceci » dans l’invite).
D’après OpenAI, le routeur est continuellement entraîné sur des signaux réels issus d’utilisations répétées, des taux de préférence des réponses et des mesures de correction. Autrement dit, il permet au modèle de s’améliorer au fil du temps.

Cependant, si OpenAI affirme qu’il constitue actuellement le modèle le plus performant du marché, ses performances réelles ne sont pas si éloignées — voire un peu moins bonnes — que celles des derniers grands modèles concurrents. Par exemple, pour le SWE-bench Verified, un test de codage réel tiré de GitHub, GPT-5 obtient un score de 74,9 % dès sa première tentative. Il surpasse donc de peu Claude Opus 4.1, le dernier modèle d’Anthropic, qui a obtenu un score de 74,5 %. Gemini 2.5 Pro de Google DeepMind a en revanche obtenu un score de 59,6 %.
Cependant, lors d’un test appelé « Dernier examen de l’humanité », visant à évaluer les performances des modèles d’IA en mathématiques, en sciences humaines et en sciences naturelles, GPT-5 Pro a obtenu un score de 42 %, tandis que Grok 4 Heavy, le dernier modèle de xAI, a obtenu un score de 44,4 %. OpenAI affirme néanmoins que GPT-5 est plus efficace pour répondre aux questions liées à la santé, en n’affichant que 1,6 % d’hallucinations au test HealthBench Hard Hallucinations (contre 12,9 % pour GPT-4o et 15,8 % pour o3).



Un modèle plus sûr contre les hallucinations et les utilisations nuisibles
Un autre point fort de GPT-5 par rapport aux modèles concurrents est qu’il est conçu pour être significativement moins sujet aux hallucinations. « Avec la recherche Web activée sur des invites anonymisées représentatives du trafic de production de ChatGPT, les réponses de GPT-5 sont environ 45 % moins susceptibles de contenir une erreur factuelle que celles de GPT-4o, et en réflexion, elles sont environ 80 % moins susceptibles de contenir une erreur factuelle que celles d’OpenAI o3 », indique l’entreprise.
En outre, le modèle serait plus efficace pour distinguer les requêtes dangereuses de celles inoffensives. Il serait donc en mesure de refuser certaines demandes considérées comme nuisibles, tout en réduisant le nombre de refus injustifiés pour des requêtes sans risque. « Nous avons élaboré des évaluations pour mesurer la prévalence de la tromperie et avons formé le modèle à être honnête », explique Alex Beutel, responsable de la recherche sur la sécurité d’OpenAI, à l’Agence France-Presse.
Toutefois, bien que le modèle dispose de certaines capacités attendues pour l’IAG, il reste encore beaucoup de chemin à parcourir avant d’atteindre cet objectif, a précisé Altman. Selon lui, OpenAI prévoit de gagner des ordres de grandeur supplémentaires à cet effet en matière de puissance. « Évidemment… il faut investir dans la puissance de calcul à un rythme effréné pour y parvenir, mais nous avons l’intention de continuer à le faire », conclut-il.