L’intelligence artificielle est un outil technologique impliqué dans des domaines toujours plus nombreux et divers. C’est notamment le cas de la médecine et de la chirurgie, où l’IA apporte déjà une aide à la prise de décision et une simplification des procédures chirurgicales. L’intelligence artificielle médicale Babylon vient de franchir une nouvelle étape en obtenant de meilleurs résultats que des médecins humains lors d’un examen final de compétences.
Hier, la société Babylon Health a annoncé depuis le Royal College de Médecine à Londres, que son intelligence artificielle Babylon, après avoir passé une série de tests rigoureux et complets, a montré sa capacité à fournir des conseils médicaux à la hauteur de ceux délivrés par des médecins cliniciens humains.
Babylon est une IA accessible en ligne sous forme de chat-bot permettant de fournir des conseils médicaux et d’établir des diagnostics sur la base d’un questionnement clinique complet et rigoureux. Lorsque le diagnostic est incertain ou que la pathologie diagnostiquée semble importante, l’IA lance d’emblée une vidéoconférence avec un véritable médecin pour poursuivre l’entretien.
Le MRCGP (Membership of the Royal College of General Practitioners) est un examen final destiné aux médecins praticiens hospitaliers organisé par le Royal College of General Practitioners (RCGP). Les candidats qui réussissent cet examen ont prouvé qu’ils possèdent un niveau de compétences et connaissances suffisant pour pratiquer de manière indépendante, sans supervision hiérarchique. Le MRCGP se divise en trois composantes : le Test de Connaissance Appliquée (AKT), l’Évaluation des Compétences Cliniques (CSA) et l’Évaluation sur le Lieu de Travail (WBA).
Babylon ne s’est penché que sur le CSA, c’est-à-dire sur l’épreuve évaluant les connaissances médicales et les capacités de diagnostic des médecins. L’IA est allée chercher elle-même un échantillon représentatif des questions testant les compétences diagnostiques depuis les annales du RCGP, ainsi qu’un ensemble d’autres questions publiées par des organismes de formation médicale indépendants, qu’elle a ensuite comparée aux standards du RCGP pour s’assurer de leur validité et conformité.
Depuis les cinq dernières années, la moyenne obtenue par les docteurs au CSA est de 73%. En passant l’examen pour la première fois, Babylon a obtenu un score de 81%. Puisque l’IA continue d’apprendre et d’accumuler des connaissances, la note obtenues lors des examens ultérieurs devrait être encore meilleure.
Cependant, comme le rappelle le Royal College, ces résultats doivent être considérés avec du recul ; en effet, le diagnostic ne repose pas que sur des listes de symptômes, il y a un important aspect humain, psychologique et social à prendre en compte.
Bien que les examens soient importants, ils ne couvrent pas la grande variété de pathologies et de cas que les médecins traitent dans leur pratique quotidienne. Pour confronter l’IA à ce genre de situation, l’équipe de Babylon (ingénieurs, médecins, scientifiques) en collaboration avec le docteur Megan Mahoney, directrice de la Division des Soins Généraux à l’université de Stanford et avec le docteur Arnold DoRosario, directeur de l’Office pour les Soins à la Population à l’hôpital de New Haven, ont confronté Babylon à sept médecins hautement expérimentés à l’aide d’un ensemble de 100 symptômes différents.
Lors de cette épreuve diagnostique, l’IA a obtenu un score de 80%, tandis que les sept médecins ont obtenu des scores allant de 64% à 94%. Le score de Babylon est monté à 98% concernant des cas plus courants rencontrés en médecine générale. Les médecins ont quant à eux obtenu des scores compris entre 52% et 99%.
Babylon a obtenu un score de 97% concernant la fiabilité et la sécurité du diagnostic, contre une moyenne de 93.1% pour les médecins humains.
Lors de son discours, le fondateur de Babylon AI, le docteur Ali Parsa, a annoncé que « selon l’OMS, il y a un manque global de plus de 5 millions de médecins, laissant la moitié de la population sans accès aux soins médicaux de base. Même dans les pays les plus développés, l’accès à la médecine générale devient complexe et chère, avec des temps d’attente parfois très longs. Les résultats de Babylon démontrent qu’il est possible pour n’importe qui, peu importe sa situation géographique, d’obtenir gratuitement des conseils médicaux de même qualité que ceux des médecins les plus expérimentés ».
« Les résultats de ce soir montrent clairement comment l’IA médicale peut décharger une partie du fardeau pesant sur les systèmes de soins à travers le monde. Notre mission est de mettre entre les mains de chaque personne sur Terre, des services médicaux accessibles et abordables. Ces incroyables résultats permettent à l’humanité de franchir une nouvelle étape vers un monde où personne ne serait privé de conseils médicaux précis et rigoureux » conclut-il.