GenCast, le nouveau modèle d’IA de Google DeepMind dédié aux prévisions météorologiques, a montré de meilleurs résultats en matière de prédiction que le système ENS du Centre européen pour les prévisions météorologiques à moyen terme (CEPMMT) – considéré comme le plus performant au monde. Le modèle aurait été plus précis dans les prévisions météorologiques quotidiennes et d’événements extrêmes (comme les cyclones) dans 97,2 % des cas. Le système pourrait être utilisé pour appuyer les systèmes de prédiction traditionnels.
Les conditions météorologiques peuvent avoir un impact considérable sur notre quotidien, en influençant notamment nos décisions, notre sécurité et de nombreux autres aspects de nos vies. Les décisions des gouvernements et des institutions s’appuient sur les prévisions météorologiques, par exemple pour les stratégies d’évacuation en cas de tempête ou de prévention en cas de vague de chaleur. Ces prévisions peuvent aussi appuyer les acteurs de l’énergie éolienne, en les aidant à calculer quand ils doivent allumer ou éteindre leurs turbines.
Cependant, les prévisions comportent toujours des incertitudes à mesure qu’elles s’étendent dans le temps, même pour les systèmes les plus performants. Or, la nature hautement non linéaire du temps signifie que de petites incertitudes peuvent rapidement se transformer en de grandes incertitudes.
Afin d’atténuer au mieux ces incertitudes, les chercheurs et les stations météorologiques ont recours à des prévisions probabilistes d’ensemble. En d’autres termes, les modèles prévoient une série de scénarios probables, fournissant ainsi un profil presque complet des conditions météorologiques possibles dans les jours et les semaines à venir et de la probabilité de chaque scénario.
Google DeepMind a réalisé une percée majeure en matière de précision avec GenCast, son nouveau modèle d’IA de prévisions météorologiques à haute résolution (0,25°). « GenCast fournit de meilleures prévisions de la météo quotidienne et des événements extrêmes que le système opérationnel le plus performant, l’ENS du Centre européen pour les prévisions météorologiques à moyen terme (ECMWF), jusqu’à 15 jours à l’avance », ont déclaré dans un communiqué de l’entreprise, Ilan Price et Matthew Wilson, les co-développeurs du modèle.
Une précision de prédiction supérieure dans 97,2 % des cas
GenCast est en partie basé sur NeuralGCM, un précédent modèle de prévisions météorologiques développé par Google DeepMind, mais qui est déterministe et ne fourni donc qu’une seule estimation à la fois. En revanche, le nouveau modèle génère un ensemble de plus de 50 prévisions, chacune représentant une probabilité de condition météorologique.
Il s’agit également d’un modèle de diffusion, le type d’algorithme sous-tendant les modèles d’IA générative standards. « Cependant, GenCast diffère de ces derniers, car il est adapté à la géométrie sphérique de la Terre et apprend à générer avec précision la distribution de probabilité complexe des scénarios météorologiques futurs lorsqu’on lui donne l’état météorologique le plus récent en entrée », indiquent Price et Wilson. Au cours de son entraînement, il commence d’abord par générer des paramètres aléatoires et compare ensuite ses prédictions avec des données météorologiques réelles de sorte à s’aligner progressivement sur ces dernières.
GenCast a été entraîné sur 40 ans de données météorologiques (de 1979 à 2018) provenant des archives ERA5 du CEPMMT. Cela inclut par exemple des variables telles que la température, la vitesse du vent et la pression à différentes altitudes. Il a ensuite été testé et comparé au système ENS pour la génération de prévisions de conditions météorologiques quotidiennes et d’événements extrêmes (tempêtes, cyclones tropicaux, etc.) pour l’année 2019. Le modèle s’est avéré plus précis que l’ENS dans 97,2 % des cas. Ce chiffre est passé à 99,8 % lorsque les délais d’exécution étaient supérieurs à 36 heures, d’après le rapport publié dans la revue Nature.
D’autre part, un modèle standard de prévision d’ensemble traite l’incertitude en effectuant plusieurs prédictions représentant différents scénarios possibles. Si la majorité des prévisions indiquent par exemple qu’un cyclone frappera une zone spécifique, l’incertitude est faible et vice versa. Selon les chercheurs, GenCast trouverait le bon équilibre en évitant à la fois de surestimer et de sous-estimer la probabilité de ses prévisions.
Il faut en moyenne 8 minutes à un seul TPU v5 Google Cloud, le processeur d’IA sur lequel s’appuie GenCast, pour générer des prévisions sur une période de 15 jours. En comparaison, le traitement d’une quantité de données équivalente nécessiterait plusieurs heures aux supercalculateurs utilisés par les systèmes comme ENS, qui, eux, s’appuient sur des dizaines de milliers de processeurs.
Des outils visant à appuyer les systèmes actuels
Il faut toutefois garder à l’esprit que ces résultats, bien que prometteurs, ne signifient pas que l’IA remplacera du jour au lendemain les systèmes de prévision météorologiques conventionnels. En effet, étant donné que les modèles comme GenCast sont entraînés à partir de données passées, leur application aux conditions futures comportera tout de même des lacunes, sans compter l’incertitude croissante caractérisant le climat actuel.
Cela signifie que les modèles devront régulièrement être mis à jour et formés avec de nouvelles données provenant de systèmes traditionnels pour maintenir leur performance. Même s’ils sont efficaces pour prédire par exemple la trajectoire d’un cyclone, ils pourraient sous-estimer son intensité s’il n’y a pas eu suffisamment de données concernant cet aspect lors de leur formation.
Néanmoins, ces outils offrent la possibilité aux services météorologiques locaux de produire des ensembles de prévisions beaucoup plus vastes et des estimations plus fiables, en particulier pour les événements extrêmes. Ces outils viseraient ainsi davantage à appuyer les systèmes actuels plutôt que de les remplacer. « Nous publierons le code, les pondérations et les prévisions de notre modèle, afin de soutenir la communauté plus large des prévisions météorologiques », affirment les deux experts. L’équipe de Google DeepMind prévoit prochainement de tester directement GenCast en utilisant des relevés tels que la force du vent ou l’humidité, afin de déterminer dans quelle mesure ses prédictions sont précises en se basant uniquement sur des données observationnelles.