Constellation, le dépôt institutionnel de l'Université du Québec à Chicoutimi

Approche hybride pour la segmentation d’objets et la reconstruction 3D en réalité mixte : intégration de modèles profonds et traitement de nuages de points RGB-D

Harouna Tiambou Abdoul-Wahabou. (2025). Approche hybride pour la segmentation d’objets et la reconstruction 3D en réalité mixte : intégration de modèles profonds et traitement de nuages de points RGB-D. Mémoire de maîtrise, Université du Québec à Chicoutimi.

[thumbnail of Harouna Tiambou_Abdoul-Wahabou_2025_memoire.pdf]
Prévisualisation
PDF
3MB

Résumé

La capacité à reconstruire des objets en trois dimensions à partir d’images capturées dans le monde réel constitue un enjeu central pour le développement de systèmes intelligents en environnement de réalité mixte. Ce mémoire présente une approche hybride permettant de détecter, segmenter et reconstruire automatiquement des objets à partir d’images et données de profondeur.

Notre solution repose sur une application développée pour le casque HoloLens 2, qui permet de capturer des scènes sous forme de séquences d’images. Ces données sont ensuite transmises à un serveur distant où un traitement automatisé est effectué. Ce traitement comprend deux étapes principales : la segmentation des objets dans les images, puis la reconstruction de leur forme en trois dimensions.

Trois méthodes d’apprentissage automatique ont été mises en œuvre et comparées pour la segmentation des objets : un modèle fondé sur des détections rapides, un autre basé sur des régions masquées, et une méthode récente conçue pour segmenter tout type d’objet sans entraînement spécifique. Ces méthodes ont été évaluées selon leur capacité à identifier correctement les objets, même dans des situations complexes impliquant des objets de petite taille, des occultations partielles ou des variations de luminosité. Les segments extraits ont ensuite été utilisés pour produire des représentations tridimensionnelles sous forme de maillages, en s’appuyant sur les informations de profondeur et des techniques de regroupement spatial.

Les résultats montrent que cette approche permet de produire des représentations visuelles cohérentes et exploitables, ouvrant la voie à des applications concrètes dans des domaines variés tels que la robotique, l’archivage numérique ou la réalité augmentée. L’IA générative a été utilisée uniquement pour des suggestions ou des corrections mineures (orthographe, grammaire) ainsi que pour l’amélioration d’éléments visuels, tels que l’ajout d’un titre ou d’une légende, ou encore la traduction d’éléments présents dans une image.

Type de document:Thèse ou mémoire de l'UQAC (Mémoire de maîtrise)
Date:2025
Lieu de publication:Chicoutimi
Programme d'étude:3017 - Maitrise en informatique
Nombre de pages:97
ISBN:Non spécifié
Sujets:Sciences naturelles et génie > Génie > Génie informatique et génie logiciel
Sciences naturelles et génie > Sciences mathématiques > Informatique
Département, module, service et unité de recherche:Départements et modules > Département d'informatique et de mathématique
Directeur(s), Co-directeur(s) et responsable(s):Bouchard, Kévin
Mots-clés:3D reconstruction, faster R-CNN, hololens 2, mixed reality, object segmentation, occupancy network, RGB-D, SAM, Yolo
Déposé le:22 oct. 2025 18:53
Dernière modification:22 oct. 2025 18:53
Afficher les statistiques de telechargements

Éditer le document (administrateurs uniquement)

Services de la bibliothèque, UQAC
555, boulevard de l'Université
Chicoutimi (Québec)  CANADA G7H 2B1
418 545-5011, poste 5630