L’intelligence artificielle dynamise la météorologie
doctorant en intelligence artificielle au LIP6, à l’université Pierre-et-Marie-Curie, Paris
Lorsque je rencontrerai Dieu, je lui poserai deux questions. Comment fonctionne la relativité ? Comment fonctionne la turbulence ? Je crois vraiment qu’il aura une réponse à la première question. » Cette citation, attribuée aux physiciens Werner Heisenberg ou Horace Lamb, souligne la difficulté extrême de la prédiction météorologique, qui consiste à utiliser les équations de la thermodynamique et de la mécanique des fluides pour simuler l’évolution du comportement de l’atmosphère à l’aide de supercalculateurs. Or c’est justement la turbulence, phénomène complexe et incompris, qui limite l’horizon prédictif de ces simulations. Une alternative à cette approche classique consiste à utiliser l’intelligence artificielle. En particulier, des algorithmes d’appren- tissage appelés réseaux de neurones profonds, capables d’apprendre à prédire certaines quantités physiques à partir de données météorologiques du passé (lire p. 42). Ils découvrent par eux-mêmes des structures cachées dans de gros volumes de données, sans que l’on ait besoin de leur fournir des connaissances théoriques préalables sur le phénomène météorologique. Cette approche commence à porter ses fruits, notamment aux États-Unis, où l’US National Weather Service l’utilise pour prévoir la durée d’événements climatiques sévères (1). Les algorithmes d’apprentissage profonds consistent en
un « empilement » de couches d’estimateurs statistiques simples qui transforment peu à peu les données brutes, jusqu’à réaliser une prédiction. Cette architecture permet un traitement hiérarchique des données. Dans le cas de données spatiales, les couches les plus proches des données permettent de saisir les dynamiques locales, tandis que les couches les plus profondes permettent de mieux appréhender des dynamiques à une échelle globale.
Gestion de l’incertitude
La spécificité de la météorologie est que l’on cherche à modéliser une dynamique plutôt qu’une information spatiale. Cette dimension spatio-temporelle rapproche la prédiction météo de la prédiction vidéo, consistant à déduire la suite d’une séquence vidéo, par exemple la trajectoire d’une voiture. L’une des principales difficultés de ce genre de problème est la gestion de l’incertitude : la voiture va-t-elle tourner à gauche ou à droite ? Un remède à cette incertitude: les réseaux adversariaux. Il s’agit de réseaux de neurones entraînés à se tromper l’un l’autre. Le premier réseau (générateur) génère des échantillons issus d’observations réelles et le second réseau (discriminateur) compare ces échantillons aux observations. En entraînant ces réseaux simultanément, le réseau discriminateur finit par ne plus faire la différence entre les échantillons proposés par le réseau générateur et les observations réelles. Le réseau générateur a donc appris une distribution représentative des « vraies » observations. À partir de cet échantillon, on peut ainsi effectuer des prédictions en limitant l’incertitude. Même si elle ne permet pas de restituer la complexité des modèles météorologiques globaux, cette approche est prometteuse pour les tâches de prédiction de phénomènes locaux. (1) A. McGovern et al., B. Am. Meteorol. Soc., doi:10:1175/BAMS-D-16-0123.1, 2017.