Un nouvel algorithme d’apprentissage automatique conçu par des astronomes et des informaticiens de l’Université de Warwick vient de confirmer l’existence d’une cinquantaine de nouvelles exoplanètes. C’est la première fois que des astronomes font appel à ce type d’intelligence artificielle pour les assister dans leurs explorations.
Les données collectées à l’aide des télescopes ne sont pas toujours fiables à 100% : si certaines révèlent effectivement la présence d’une planète, d’autres ne sont que de simples « faux positifs ». Toute la difficulté est donc de séparer le bon grain de l’ivraie. Cet algorithme a justement été conçu pour faire cette distinction…
Une méthode plus fiable et rapide
Un échantillon de planètes potentielles a été soumis à ce nouvel algorithme pour déterminer lesquelles étaient réelles. Les résultats viennent d’être publiés dans la revue Monthly Notices of the Royal Astronomical Society. Dans cet article, les chercheurs comparent plusieurs techniques de validation des données, dont leur algorithme, afin de faciliter les futures découvertes d’exoplanètes. Près de 30 % des 4000 exoplanètes connues à ce jour ont été validées via une seule méthode (l’algorithme VESPA), ce qui n’est pas idéal selon David Armstrong, du Département de physique de l’Université de Warwick. Le développement de nouvelles méthodes est donc vivement souhaité.
La recherche d’exoplanètes nécessite d’analyser d’énormes quantités de données : il s’agit de repérer certains signes caractéristiques dans les signaux émis par leurs étoiles, notamment au moment où la planète vient se positionner entre le télescope et son étoile ; c’est ce que l’on appelle un transit, une sorte d’éclipse en quelque sorte. L’événement se traduit par la détection d’une baisse de la lumière provenant de ladite étoile. Cependant, cette baisse de luminosité peut aussi être causée par un système binaire d’étoiles, par l’interférence d’un objet situé en arrière-plan ou même par une erreur de l’appareil d’observation !
Pour lever toute incertitude, des chercheurs de l’Université de Warwick et de l’Institut Alan Turing ont développé un algorithme d’apprentissage automatique capable de faire la différence entre les vraies planètes et les « faux » signaux parmi des milliers de planètes candidates repérées par les télescopes spatiaux.
Le programme a tout d’abord été entraîné à reconnaître de vraies planètes à l’aide de deux grands échantillons de planètes détectées lors de la mission Kepler (2009-2018), dont certaines avaient été confirmées et d’autres reconnues comme faux positifs. Les chercheurs ont ensuite utilisé l’algorithme sur un nouvel ensemble de données issues de Kepler, de potentielles nouvelles planètes encore non confirmées. Résultat : le programme a confirmé l’existence de cinquante nouvelles planètes, une première dans l’histoire de l’astronomie !
Ces cinquante planètes sont très diverses : des objets aussi grands que Neptune ou plus petits que la Terre, avec des orbites d’une durée d’un à deux cents jours. Désormais certains que ces planètes sont bel et bien réelles, les astronomes peuvent les ajouter à la liste des priorités pour de futures observations. Armstrong se réjouit de cette avancée, qui facilitera grandement le travail des astronomes : « Nous espérons appliquer cette technique à de larges échantillons de candidats issus de missions actuelles et futures comme TESS et PLATO [ndlr : dont le lancement est prévu pour 2026] ».
Un programme « à utiliser collectivement »
C’est la première fois qu’une technique d’apprentissage automatique est utilisée pour la validation proprement dite. Auparavant, ce type d’algorithme était utilisé pour classer les planètes candidates, mais jamais il n’a été question d’établir une probabilité d’existence pour chacune. « Plutôt que de dire quels objets sont les plus susceptibles d’être des planètes, nous pouvons maintenant dire quelle est la probabilité statistique précise », explique Armstrong. Ainsi, lorsqu’il y a moins de 1% de chance qu’un objet soit un faux positif, il est considéré comme une vraie planète.
Une fois bien entraîné, l’algorithme s’avère plus rapide que les techniques existantes et peut être complètement automatisé. Il permet de valider et de hiérarchiser les candidats en quelques secondes ; il peut en outre être amélioré à chaque nouvelle découverte. Ainsi, c’est la méthode idéale pour analyser les milliers de candidats planétaires observés dans les missions actuelles dédiées à la recherche d’exoplanètes, telles que TESS (Transiting Exoplanet Survey Satellite) ; celle-ci a déjà repéré 66 nouvelles exoplanètes et 2100 candidats potentiels. La phase d’apprentissage est certes chronophage, mais les chercheurs soutiennent que ce programme devrait désormais être l’un des outils à utiliser collectivement pour valider les planètes.
Sur le même sujet : Comment l’intelligence artificielle peut-elle aider à quantifier la matière noire ?
Le Dr Theo Damoulas du département d’informatique de l’Université de Warwick, et directeur adjoint du programme Data Centric Engineering de l’Institut Alan Turing, se félicite de cette collaboration entre astrophysiciens et statisticiens. Selon lui, les approches probabilistes de l’apprentissage automatique statistique sont particulièrement adaptées aux problèmes d’astrophysique nécessitant de quantifier l’incertitude des données.
Toutefois, Armstrong et Damoulas évoquent dans l’article qu’ils ont co-écrit que leur algorithme, à l’instar des autres méthodes de validation étudiées, affiche quelques écarts avec la méthode VESPA. Toutefois, la résolution de ces anomalies évolue généralement en faveur du nouvel algorithme. Ils rappellent de ce fait que la validation de planètes via une seule et unique méthode, quelle qu’elle soit, ne devrait jamais être pratiquée, du moins jusqu’à ce que l’origine des écarts observés soit entièrement élucidée.