Wilfried SEGRETIER : Approche évolutionnaire et agrégation de variables: application à la prévision de risques hydrologiques
Résumé :
Les travaux de recherche présentés dans ce mémoire s’inscrivent dans la lignée des approches de modélisation hydrologiques prédictives dirigées par les données. Nous avons particulièrement développé leur application sur le contexte difficile des phénomènes de crue éclairs caractéristiques des bassins versants de la région Caraïbe qui pose un défi sécuritaire.
Les premiers modèles de prévision hydrologique physiques utilisaient des équations différentielles et des représentations détaillées du terrain pour représenter la relation pluie-débit dans un bassin versant en tenant compte de nombreux paramètres initiaux. S’ils sont théoriquement valables, la complexité de leur mise en oeuvre rend difficile leur utilisation opérationnelle.
Par la suite, des approches moins complexes, dites conceptuelles, faisant intervenir des relations plus simples entre les quantités d’eau en jeu dans les processus hydrologique ont été proposées. Elles utilisent par exemple le concept de réservoirs qui se vident et se remplissent.
Ainsi, elle permettent d’obtenir de meilleurs performances de prévision que les approches physiques. Cependant, elle restent dépendantes des aspects physiques des cas d’études considérés et sont souvent développées pour des types de bassins versants particuliers tel que ceux que l’ont retrouve en Europe.
Au contraire, les approches dites dirigées par les données, plus récentes, ne prennent pas en considération les lois de la physique, mais établissent une corrélation entre des données collectées sur le phénomène. Elles font appel aux techniques d’intelligence artificielle d’apprentissage à partir des données. Elles offrent notamment les avantages de ne nécessiter que peu de connaissances sur la nature physique du phénomène modélisé et de permettre d’extraire des relations inattendues cachées dans des volumes importants de données. Elles ont été mis en oeuvre avec succès sur de nombreux cas d’études et constituent de plus en plus souvent une bonne alternative aux approches classiques physiques et conceptuelles dirigées par la connaissance.
Les modèles de prévision hydrologiques modulaires ont été proposés à partir du début des années 2000. Ils consistent, lorsqu’un phénomène est trop complexe pour être considéré dans sa totalité, comme un processus global, à le diviser en un ensemble de sous-processus pour lesquels des modèles spécifiques sont définis et combinés à travers différentes stratégies.
Ainsi, ils permettent souvent d’améliorer les résultats obtenus avec les modèles non modulaires dits globaux.
En envisageant le problème de la prévision de crues comme un problème d’optimisation combinatoire difficile, nous proposons d’utiliser la notion de métaheuristiques, à travers les algorithmes évolutionnaires, notamment pour leur capacité à parcourir efficacement de grands espaces de recherche et à fournir des solutions de bonne qualité en des temps d’exécution raisonnables.
Nous avons présenté l’approche de prédiction AV2D : Aggregate Variable Data Driven dont le concept central est la notion de variable agrégée. L’idée sous-jacente à ce concept est de considérer le pouvoir prédictif de nouvelles variables définies comme le résultat de fonctions statistiques, dites d’agrégation, calculées sur des données correspondant à des périodes de temps précédent un événement à prédire. Ces variables sont caractérisées par des ensembles de paramètres correspondant à leur propriétés. Nous avons introduit les variables agrégées hydro-météorologiques permettant de répondre au problème de la classification d’événements hydrologiques. La complexité du parcours de l’espace de recherche engendré par les paramètres définissant ces variables a été prise en compte grâce à la mise en oeuvre d’un algorithme évolutionnaire particulier dont les composants ont été spécifiquement définis pour ce problème.
Nous avons montré, à travers une étude comparative avec d’autres approches de modélisation dirigées par les données, menée sur deux cas d’études de bassins versant caribéens, que l’approche AV2D est particulièrement bien adaptée à leur contexte. Deux types d’estimation des performances obtenues ont pour cela été considérées : d’une part la moyenne des taux de vrais positifs et de faux négatifs pondérée par le nombre d’exemples de chaque classe, correspondant au pourcentage d’exemples bien classifiés par rapport au nombre total d’exemples disponibles, et d’autre part la notion d’aire sous la courbe ROC afin de mettre en avant les résultats obtenus sur la classe "crue", dont la bonne anticipation se révèle nettement plus importante d’un point de vue logistique.
Nous étudions par la suite les bénéfices offerts par les approches de modélisation hydrologiques modulaires dirigées par les données, en définissant un procédé de division en sous-processus prenant en compte les caractéristiques particulières des bassins versants auxquels nous nous intéressons.
Nous avons proposé une extension des travaux précédents à travers la définition d’une approche de modélisation modulaire, SM2D: Spatial Modular Data Driven, consistant à considérer des sous-processus en divisant l’ensemble des exemples à classifier en sousensembles correspondant à des comportements hydrologiques homogènes. Pour cela, nous avons considéré des critères hydro-météorologiques (H), spatiaux (S) et liés à la connaissance du domaine (K), à travers la définition de combinaisons de conditions d’activités pluviométriques ou limnimétriques observés un certain temps avant un événement sur des sous-bassins versants correspondant à des zones homogènes d’un point de vue topographique et contenant un certain nombre de stations de mesure. Nous avons montré à travers une étude comparative avec d’autres approches dirigées par les données mises en oeuvre sur les mêmes sous-ensembles de données, que cette approche permet d’améliorer les résultats de prédiction particulièrement à court terme.
Nous avons enfin proposé la modélisation d’un outil de pilotage de système de modélisation hydrologique H2FCT : Hydro-meteorological Flood Forecast Control Tool. Les exigences fonctionnelles et opérationnelles exprimées par le maître d’oeuvre ont été présentées et les choix d’architectures relatifs à leur mise en oeuvre ont été détaillés. Nous avons mis en oeuvre une méthode de modélisation de type agile qui nous a permis de répondre de manière efficace aux exigences opérationnelles.