Constellation, le dépôt institutionnel de l'Université du Québec à Chicoutimi

Review: Theory-guided machine learning applied to hydrogeology—state of the art, opportunities and future challenges

Adombi Adoubi Vincent De Paul, Chesnaux Romain et Boucher Marie-Amélie. (2021). Review: Theory-guided machine learning applied to hydrogeology—state of the art, opportunities and future challenges. Hydrogeology Journal, 29, p. 2671-2683.

[thumbnail of Theory-Guided Machine Learning Applied to Hydrogeology State of the Art Opportunities and Future Challenges.pdf]
Prévisualisation
PDF - Version acceptée
1MB

URL officielle: http://dx.doi.org/doi:10.1007/s10040-021-02403-2

Résumé

Thanks to recent technological advances, hydrogeologists now have access to large amounts of data acquired in real time. Processing these data using traditional modelling tools is difficult and poses a number of challenges especially for tasks such as extracting useful features, uncertainty quantification or identifying links between variables. Artificial intelligence, and more specifically its subset ‘machine learning (ML)’, may represent a way of the future in hydrogeological research and applications. Unfortunately, several aspects of machine-learning methods hamper its adoption as a complementary tool for hydrogeologists, namely the black-box nature of most models, an often-limited generalization ability, a hypothetical convergence, and uncertain transferability. Recently, an entirely novel paradigm in the field of machine learning has been identified—theory-guided machine learning–in which the models integrate some specific theoretical knowledge, laws or principles of the field of study. This review article sets out to examine three theory-guided methods in their ability to overcome the limitations of machine learning for hydrogeological research and applications. These methods are, respectively, theory-guided constrained optimization (TGCO), theory-guided refinement of outputs (TGRO) and theory-guided architecture (TGA). The analyses led to the following conclusions: the opacity of ML models can be reduced by any of the three theory-guided ML methods; convergence and generalizability can be enhanced by TGCO, TGA, or a combination of at least two of the theory-guided ML methods; and no study conducted to date has made it possible to deduce the effectiveness of these methods on the transferability of ML models.

Grâce aux récentes avancées technologiques, les hydrogéologues ont désormais accès à de grandes quantités de données acquises en temps réel. Le traitement de ces données à l’aide d’outils de modélisation traditionnels est difficile et pose un certain nombre de défis, en particulier pour des tâches telles que l’extraction de caractéristiques utiles, la quantification de l’incertitude ou l’identification des liens entre les variables. L’intelligence artificielle et plus particulièrement son sous-ensemble « l’apprentissage automatique (AA) » peut représenter une voie d’avenir dans la recherche et les applications hydrogéologiques. Malheureusement, plusieurs aspects des méthodes d’apprentissage automatique entravent son adoption en tant qu’outil complémentaire pour les hydrogéologues, à savoir la nature boîte noire de la plupart des modèles, une capacité de généralisation souvent limitée, une convergence hypothétique et une transférabilité incertaine. Récemment, un paradigme entièrement nouveau dans le domaine de l’apprentissage automatique a été identifié—l’apprentissage automatique guidé par la théorie—dans lequel les modèles intègrent des connaissances théoriques, des lois ou des principes spécifiques du domaine d’étude. Le présent article de synthèse se propose d’examiner trois méthodes guidées par la théorie sous l’angle de leur capacité à surmonter les limites de l’apprentissage automatique pour la recherche et les applications hydrogéologiques. Ces méthodes sont respectivement l’optimisation contrainte guidée par la théorie (OCGT), le réajustement des sorties de modèle guidé par la théorie (RSGT) et l’architecture guidée par la théorie (AGT). Les analyses conduisent aux conclusions suivantes: l’opacité des modèles d’AA peut être réduite par l’une des trois méthodes d’AA guidé par la théorie; la convergence et la généralisation peuvent être améliorées par l’OCGT, l’AGT ou une combinaison d’au moins deux de ces méthodes d’AA guidé par la théorie; et aucune étude menée à ce jour n’a permis de conclure à l’efficacité de ces méthodes sur la transférabilité des modèles d’AA.

Type de document:Article publié dans une revue avec comité d'évaluation
ISSN:1431-2174
Volume:29
Pages:p. 2671-2683
Version évaluée par les pairs:Oui
Date:2021
Identifiant unique:10.1007/s10040-021-02403-2
Sujets:Sciences naturelles et génie > Génie
Sciences naturelles et génie > Sciences appliquées
Sciences naturelles et génie > Sciences naturelles > Sciences de la terre (géologie, géographie)
Département, module, service et unité de recherche:Départements et modules > Département des sciences appliquées > Unité d'enseignement en sciences de la Terre
Mots-clés:theory-guided machine learning, groundwater, machine learning limitations, statistical modelling, apprentissage automatique guidé par la théorie, eaux souterraines, limites de l'apprentissage automatique, modélisation statistique
Déposé le:26 avr. 2022 23:33
Dernière modification:20 sept. 2022 04:00
Afficher les statistiques de telechargements

Éditer le document (administrateurs uniquement)

Creative Commons LicenseSauf indication contraire, les documents archivés dans Constellation sont rendus disponibles selon les termes de la licence Creative Commons "Paternité, pas d'utilisation commerciale, pas de modification" 2.5 Canada.

Bibliothèque Paul-Émile-Boulet, UQAC
555, boulevard de l'Université
Chicoutimi (Québec)  CANADA G7H 2B1
418 545-5011, poste 5630