Constellation, le dépôt institutionnel de l'Université du Québec à Chicoutimi

Comparaisons d’algorithmes d’apprentissage profond pour les ensembles de données fortement bruités

Sene Ndeye Astou. (2024). Comparaisons d’algorithmes d’apprentissage profond pour les ensembles de données fortement bruités. Mémoire de maîtrise, Université du Québec à Chicoutimi.

[thumbnail of Sene_uqac_0862N_11232.pdf] PDF
818kB

Résumé

L’apprentissage profond est devenu une composante essentielle de l’intelligence artificielle, mais son efficacité face à des ensembles de données fortement bruités reste un défi majeur. Ce mémoire se consacre à une analyse rigoureuse et comparative des algorithmes d’apprentissage profond dans le contexte exigeant des ensembles de données souffrant de bruit significatif. Les ensembles de données comportant des étiquettes erronées ou bruitées constituent un défi substantiel pour les méthodes d’apprentissage profond. Notre étude examine plusieurs méthodologies et approches, allant des modèles probabilistes et multitâches à l’apprentissage contrastif et la pondération dynamique des pertes. Cette recherche revêt une importance cruciale, car elle vise à renforcer la robustesse des modèles d’apprentissage profond dans des scénarios réalistes caractérisés par des données bruitées. Les résultats de cette comparaison offriront des indications précieuses pour orienter la sélection d’algorithmes et de techniques les mieux adaptés à ce défi complexe, contribuant ainsi à l’avancement de l’apprentissage profond dans des environnements réels. Ce document exploite les ensembles de données CIFAR-10 et CIFAR-100, qui sont des ressources essentielles dans le domaine de la vision par ordinateur pour la classification d’images. L’ensemble CIFAR-10 comprend 60 000 images de taille 32x32, réparties en 10 classes, tandis que le CIFAR-100 propose une classification plus détaillée avec 100 classes. La décision de limiter la résolution des images à 32x32 présente un défi significatif pour les chercheurs, car elle nécessite le développement de modèles capables de généraliser efficacement à partir de données visuelles de faible résolution. Malgré ces contraintes, les ensembles de données CIFAR restent cruciaux pour l’évaluation des progrès en matière d’algorithmes de classification d’images. Ce mémoire présente également SimCLR et SimSiam, SimCLR un algorithme innovant pour l’apprentissage contrastif des représentations visuelles, qui se distingue par sa simplicité et la non nécessité d’avoir une architecture dite complexe ou de mémoires auxiliaires. SimCLR met en avant l’importance des stratégies d’augmentation des données et présente une transformation non linéaire apprenable entre la représentation et la fonction de perte contrastive, qui améliore notablement la qualité des représentations. De plus, dans les travaux présentant SimCLR, il a été démontré que des lots d’apprentissage plus grands et un nombre accru d’étapes d’entrainement optimisent les résultats par rapport à l’apprentissage supervisé traditionnel. Grâce à ces innovations, SimCLR surpasse les méthodes antérieures d’apprentissage auto-supervisé et semi-supervisé sur des ensembles de données complexes tels que ImageNet, réaffirmant ainsi son potentiel pour faire avancer la vision par ordinateur par le biais de représentations visuelles de haute qualité. SimSiam montre une meilleure robustesse aux variations de résolution et au bruit par rapport à SimCLR, bien que ce dernier soit plus performant dans des conditions optimales. Les modèles ont des performances décroissantes avec des résolutions plus faibles. SimSiam, cependant, conserve une capacité à généraliser malgré les limitations visuelles. SimSiam a démontré des capacités de généralisation intéressantes, même dans des environnements complexes avec des données de faible qualité. Ce mémoire propose des contributions significatives pour améliorer la robustesse des modèles d’apprentissage profond dans des scénarios où la qualité des données est compromise. Ces résultats orienteront les choix futurs d’algorithmes adaptés à des applications dans des contextes réels.

Type de document:Thèse ou mémoire de l'UQAC (Mémoire de maîtrise)
Date:2024
Lieu de publication:Chicoutimi
Programme d'étude:Maîtrise en informatique
Nombre de pages:72
ISBN:Non spécifié
Sujets:Sciences naturelles et génie > Sciences mathématiques > Informatique
Département, module, service et unité de recherche:Départements et modules > Département d'informatique et de mathématique > Programmes d'études de cycles supérieurs en informatique
Directeur(s), Co-directeur(s) et responsable(s):Maître, Julien
Mots-clés:apprentissage contrastif, bruitage de données, intelligence artificielle, SimCLR
Déposé le:18 déc. 2024 20:56
Dernière modification:08 janv. 2025 00:38
Afficher les statistiques de telechargements

Éditer le document (administrateurs uniquement)

Creative Commons LicenseSauf indication contraire, les documents archivés dans Constellation sont rendus disponibles selon les termes de la licence Creative Commons "Paternité, pas d'utilisation commerciale, pas de modification" 2.5 Canada.

Bibliothèque Paul-Émile-Boulet, UQAC
555, boulevard de l'Université
Chicoutimi (Québec)  CANADA G7H 2B1
418 545-5011, poste 5630