Constellation, le dépôt institutionnel de l'Université du Québec à Chicoutimi

Développement de modèles d'apprentissage automatique guidés par la théorie en hydrogéologie

Adombi Adoubi Vincent de Paul. (2024). Développement de modèles d'apprentissage automatique guidés par la théorie en hydrogéologie. Thèse de doctorat, Université du Québec à Chicoutimi.

[thumbnail of Adombi_uqac_0862D_11130.pdf] PDF
9MB

Résumé

La modélisation est l’approche couramment utilisée pour résoudre les problèmes d’hydrogéologie compte tenu de la nécessité de conceptualiser un monde souterrain invisible. Cependant, les approches traditionnelles de modélisation en hydrogéologie, c'est-à-dire la modélisation basée sur la physique, semi-empirique ou empirique, ont montré leurs limites dans la résolution des problèmes hydrogéologiques, soit parce qu'elles sont trop complexes à mettre en oeuvre, qu'elles nécessitent beaucoup de données, qu'elles fournissent des modèles dont la justesse n'est pas toujours satisfaisante, soit parce que leur capacité à aider à comprendre les systèmes d'eaux souterraines ainsi que leur capacité d'aide à la prise de décision sont limitées. Récemment, l'exploration du continuum entre les différentes approches traditionnelles de modélisation a récemment été initiée, donnant lieu à un nouveau paradigme appelé apprentissage automatique guidé par la théorie. L'apprentissage automatique guidé par la théorie (ou theory-guided machine learning, TgML en anglais) est un domaine de recherche qui se concentre sur le développement d'algorithmes d'apprentissage qui intègrent des éléments de connaissance scientifique (par exemple les lois de conservation de masse) dans leur architecture ou pendant leur entraînement. Cette thèse a cherché à tester l'hypothèse selon laquelle les modèles d'apprentissage automatique guidés par la théorie peuvent bénéficier des forces combinées des approches traditionnelles de modélisation. Pour ce faire, des modèles d'apprentissage automatique guidés par la théorie ont été développés et testés sur des problèmes hydrogéologiques réels, et leurs performances ont été comparées à celles des approches traditionnelles de modélisation. Ceci a eu pour but d'identifier les forces et les faiblesses de l'apprentissage automatique guidé par la théorie et de proposer des solutions pour surmonter ces faiblesses dans le cadre de la modélisation hydrogéologique. La thèse s’est concentrée uniquement sur les problèmes d’écoulements distribués et localisés. Dans le contexte de la modélisation distribuée, un modèle TgML a été développé et ses performances ont été comparées à celles d’un modèle à base physique et un modèle traditionnel d’apprentissage. Le modèle TgML présentait la meilleure justesse de simulation tout en obéissant à la physique qui régit les écoulements d’eau souterraine, ce qui exprime le fait que le modèle TgML est capable de fédérer les atouts individuels des approches traditionnelles de modélisation. En revanche, le modèle TgML a nécessité des coûts de calculs considérablement importants pour son entrainement comparativement à ceux du modèle à base physique et du modèle traditionnel d’apprentissage. Dans le contexte de la modélisation localisée, Jiang et al. (2020) ont proposé la première approche de développement d'algorithmes TgML pour la modélisation localisée en hydrologie. Cette approche a ensuite été adaptée par Cai et al. (2022) à l'hydrogéologie pour la modélisation localisée de l'écoulement des eaux souterraines. Dans ce projet de recherche, les approches de Jiang et al. (2020) et de Cai et al. (2022) sont considérées comme des formulations traditionnelles de modèles TgML pour la modélisation localisée. Cette thèse a permis de montrer que les formulations traditionnelles de Jiang et al. (2020) et de Cai et al. (2022) ne permettent pas de construire des modèles TgML qui satisfont au principe de cause à effet entre les variables d’entrée et de sortie, indispensable à tout modèle. Une nouvelle formulation a ensuite été proposée dans cette thèse pour permettre aux modèles TgML d’apprendre des relations causales. Les modèles dérivés à partir de la nouvelle formulation proposée dans cette thèse présentent des performances plus ou moins similaires à celles des modèles traditionnels d'apprentissage automatique et supérieures à celles de modèle dérivé selon la formulation de Jiang et al. (2020), tout en affichant des propriétés causales. Cependant, les coût requis pour leur entrainement restent supérieurs à ceux modèles des traditionnels d'apprentissage automatique. En résumé, l'hypothèse de recherche selon laquelle l'apprentissage automatique guidé par la théorie peut bénéficier des atouts des approches traditionnelles de modélisation a été vérifiée, à l'exception des coûts de calcul en phase d’entrainement, qui peuvent être beaucoup plus élevés.

Type de document:Thèse ou mémoire de l'UQAC (Thèse de doctorat)
Date:2024
Lieu de publication:Chicoutimi
Programme d'étude:Doctorat en sciences de la terre et de l'atmosphère
Nombre de pages:271
ISBN:Non spécifié
Sujets:Sciences naturelles et génie > Sciences appliquées > Eau et environnement
Sciences naturelles et génie > Sciences mathématiques > Informatique
Sciences naturelles et génie > Sciences naturelles > Sciences de la terre (géologie, géographie)
Département, module, service et unité de recherche:Départements et modules > Département des sciences appliquées > Unité d'enseignement en sciences de la Terre
Directeur(s), Co-directeur(s) et responsable(s):Chesnaux, Romain
Boucher, Marie-Amélie
Mots-clés:artificial intelligence, climate change, groundwater, modeling, principle of causality, theory-guided machine learning, physics-informed machine learning
Déposé le:24 avr. 2024 21:15
Dernière modification:30 avr. 2024 18:45
Afficher les statistiques de telechargements

Éditer le document (administrateurs uniquement)

Creative Commons LicenseSauf indication contraire, les documents archivés dans Constellation sont rendus disponibles selon les termes de la licence Creative Commons "Paternité, pas d'utilisation commerciale, pas de modification" 2.5 Canada.

Bibliothèque Paul-Émile-Boulet, UQAC
555, boulevard de l'Université
Chicoutimi (Québec)  CANADA G7H 2B1
418 545-5011, poste 5630