Andreetta Fontana Eduardo. (2021). Une approche d’automatisation du déploiement des systèmes de Machine Learning. Mémoire de maîtrise, Université du Québec à Chicoutimi.
PDF
1MB |
Résumé
Au cours des dernières années, le Machine Learning (ML) a gagné en audience dans l’industrie et au milieu académique. Plusieurs études désignent le ML comme une technologie appliquée à une grande variété des besoins d’affaires ainsi qu’aux problèmes inhérents au développement de logiciels. En complément, les outils Automated Machine Learning (AutoML) sont développés pour automatiser le pipeline d’entraînement de modelés de ML. Cependant, ces outils AutoML ne résolvent pas tous les problèmes retrouvés lors de la phase de déploiement du pipeline de ML. Parmi ces défis, nous pouvons citer : les problèmes de compatibilité avec la plate-forme de déploiement, la nécessité d’un redéploiement périodique en raison des mises à jour des modèles et le déploiement qui dépend des efforts manuels. Ils font tous partie du quotidien des développeurs et des scientifiques des données [3, 4]. Par ailleurs, on ne trouve pas encore d’études académiques qui proposent des solutions à ces défis en validant des études de cas dans des entreprises. Cette étude vise à proposer une approche d’automatisation du déploiement de systèmes de ML qui minimise les défis liés au déploiement de modèles de ML. Cette approche comprend des principes de MLOps et ceux de développement Low-code. Pour la mettre en oeuvre, nous avons développé un outil validé à partir de son application dans une étude de cas basée sur un besoin réel d’une entreprise de développement de logiciels. Tout d’abord, nous avons cartographié les principaux défis du déploiement de modèles de ML présents dans la littérature. Ensuite, nous avons analysé les fonctionnalités de déploiement de principaux outils AutoML open-source présents dans l’industrie. En guise de contribution, notre étude présente : (a) : catalogue des défis de déploiement de modèles de ML; (b) : liste des outils AutoML open-source. Les résultats montrent que notre approche de l’automatisation du déploiement de systèmes de ML minimise 72,2 % des défis de déploiement et couvre 84,2 % des problèmes de déploiement des fonctionnalités des outils AutoML open-source. Finalement, l’étude de cas a validé l’effectivité de notre approche, qui attribue un certain degré d’automatisation à l’exécution des phases du pipeline de ML.
Over the past few years, Machine Learning (ML) has gained traction in industry and academy. Several studies identify ML as a technology applied to a wide variety of business needs, as well as problems inherent in software development. In addition, AutoML tools are developed to automate the pipeline of ML model training. However, these AutoML tools do not solve all the problems found during the deployment phase of the ML pipeline. Some of these challenges include : compatibility issues with the deployment platform, the need for periodic redeployment due to model updates, and deployment that depends on manual efforts. They are all part of the everyday life of developers and data scientists. Moreover, there are still no academic studies that offer solutions to these challenges by validating case studies in companies. This study aims to propose an approach for automating the deployment of ML systems that minimizes the challenges related to ML model deployment. This approach includes principles of MLOps and Low-code development. To implement it, we developed a tool that was validated by a case study based on a real need of a software development company. First, we mapped the main challenges of model deployment of ML present in the literature. Next, we analyzed the deployment features of the main open-source AutoML tools used in the industry. As a contribution, our study presents : (a) : a catalog of ML model deployment challenges ; (b) : a list of open-source AutoML tools. The results show that our approach to automating the deployment of ML systems reduces by 72.2% the deployment challenges and covers 84.2% of system deployment feature issues of open-source AutoML tools. Finally, the case study validated the effectiveness of our approach, which attributes a certain degree of automation for the execution of the ML pipeline phases.
Type de document: | Thèse ou mémoire de l'UQAC (Mémoire de maîtrise) |
---|---|
Date: | 2021 |
Lieu de publication: | Chicoutimi |
Programme d'étude: | Maîtrise en informatique |
Nombre de pages: | 64 |
ISBN: | Non spécifié |
Sujets: | Sciences naturelles et génie > Génie > Génie informatique et génie logiciel Sciences naturelles et génie > Sciences mathématiques > Informatique |
Département, module, service et unité de recherche: | Départements et modules > Département d'informatique et de mathématique > Programmes d'études de cycles supérieurs en informatique |
Directeur(s), Co-directeur(s) et responsable(s): | Petrillo, Fabio |
Mots-clés: | AutoML, déploiement, génie logiciel, Low-code, Machine Learning, No-code, apprentissage automatique, deploy, software engineering |
Déposé le: | 20 juill. 2022 08:16 |
---|---|
Dernière modification: | 21 juill. 2022 17:35 |
Éditer le document (administrateurs uniquement)