Sedou Fofe Gildas Aimé. (2024). Amélioration de la qualité des images médicales à l’aide des modèles de super-résolution pour un meilleur diagnostic. Mémoire de maîtrise, Université du Québec à Chicoutimi.
Prévisualisation |
PDF
25MB |
Résumé
L’imagerie médicale joue un rôle vital dans les diagnostics et les soins aux patients. Cependant, l’accès à des équipements de haute qualité reste souvent limité en raison de coûts élevés et de contraintes logistiques, en particulier dans des régions éloignées des centres urbains. Face à ces défis, la restauration des images médicales provenant d’équipements moins performants émerge comme une solution prometteuse. Cette recherche s’inscrit dans cette perspective en évaluant divers modèles de restauration d’images. Nous avons commencé par étudier les modèles de super-résolution existants basés sur les GAN tels que SRGAN, BSRGAN, RANK-SRGAN, et SIR-SRGAN, en comparant leurs résultats selon des mesures telles que le PSNR, le SSIM, le LPIPS, le HaarPSI, le Clip-IQA, la taille du fichier généré et le temps d’exécution. Parmi ces modèles, SIR-SRGAN a offert en moyenne les meilleurs résultats. Cependant, les images générées par SIR-SRGAN présentaient des zones floues. Pour pallier cette limitation, nous proposons notre propre architecture, SIRSRGAN- ResNEXT, une amélioration de SIR-SRGAN. SIR-SRGAN-ResNEXT conserve le mécanisme de classement par auto-interpolation proposé par SIR-SRGAN, permettant au générateur de se concentrer sur les différences entre l’image reconstruite et l’image originale pour optimiser la qualité de la reconstruction. En outre, plusieurs modifications ont été apportées, notamment le remplacement du discriminateur basé sur l’architecture du PatchGAN par un discriminateur basé sur l’architecture U-Net. L’architecture du générateur a également été modifiée pour adopter une architecture basée sur ResNeXT, avec l’ajout de couches d’attention pour améliorer l’analyse des caractéristiques des images par le discriminateur. Bien que SIR-SRGAN-ResNEXT offre de meilleurs résultats que SIR-SRGAN, il n’était pas entièrement satisfaisant par rapport à nos attentes de qualité d’image. Nous avons alors exploré des méthodes de restauration d’images basées sur les transformateurs. Les architectures basées sur des transformateurs, telles que SWINIR et SWIN2SR, ont surpassé celles basées sur les GAN en générant des textures d’image plus claires. Ces modèles sont très efficaces pour restaurer les images grâce à leur mécanisme d’attention, qui divise l’image en plusieurs régions afin que le modèle puisse se concentrer sur différentes parties de l’image séparément. Cependant, la complexité de ce mécanisme d’attention est quadratique, ce qui affecte le coût d’utilisation de ces modèles sur des images de grande taille. Dans ce travail, nous présentons le modèle Flatten-SwinIR pour la super-résolution d’images, une version améliorée et optimisée de SwinIR. Nous avons modifié le mécanisme "Window Attention" de SwinIR en le remplaçant par un mécanisme appelé "Flatten Attention", un mécanisme d’attention à complexité linéaire. Ce dernier offre un meilleur temps d’exécution tout en améliorant la qualité des images générées. Les expériences ont été menées sur dix ensembles de données d’images médicales et de référence générale. Cette recherche éclaire la voie vers une utilisation plus répandue et plus efficace de la restauration des images médicales, contribuant ainsi à l’amélioration globale des soins de santé à l’échelle mondiale.
| Type de document: | Thèse ou mémoire de l'UQAC (Mémoire de maîtrise) |
|---|---|
| Date: | 2024 |
| Lieu de publication: | Chicoutimi |
| Programme d'étude: | 3017 - Maîtrise en informatique |
| Nombre de pages: | 113 |
| ISBN: | Non spécifié |
| Sujets: | Sciences naturelles et génie > Génie > Génie informatique et génie logiciel Sciences naturelles et génie > Sciences mathématiques > Informatique |
| Département, module, service et unité de recherche: | Départements et modules > Département d'informatique et de mathématique |
| Directeur(s), Co-directeur(s) et responsable(s): | Nakouri, Haïfa Ménélas, Bob-Antoine-Jerry |
| Mots-clés: | apprentissage automatique, deep-learning, generative adversarial network, image super-resolution, intelligence artificielle, ResNeXt, SRGAN, SWINIR, vision transformer |
| Déposé le: | 19 janv. 2026 15:02 |
|---|---|
| Dernière modification: | 19 janv. 2026 15:02 |
Éditer le document (administrateurs uniquement)
