Constellation, le dépôt institutionnel de l'Université du Québec à Chicoutimi

Exploration d’articles scientifiques sur les maladies rares pour l’extraction d’informations

Cousyn Charles. (2018). Exploration d’articles scientifiques sur les maladies rares pour l’extraction d’informations. Mémoire de maîtrise, Université du Québec à Chicoutimi.

[thumbnail of Cousyn_uqac_0862N_10506.pdf] PDF
1MB

Résumé

Les maladies rares constituent un sujet peu connu du grand public. Néanmoins, malgré leur nom, un grand nombre de personnes sont affligées par une ou plusieurs d'entre elles. La recherche sur près de sept mille maladies rares est insuffisante, et même si certains travaux ont été réalisés pour exploiter les publications scientifiques et extraire des informations pertinentes, les connaissances sont très difficiles à obtenir pour la population en général. Ce document présente un nouveau système qui tente d'aborder l’extraction des connaissances sur les maladies rares dans les publications scientifiques. En particulier, nous nous concentrons sur la tâche d'extraire automatiquement les symptômes de maladies rares à partir de publications avec une nouvelle approche utilisant un algorithme de reconnaissance d'entité nommée (NER) basé sur la statistique numérique Term Frequency - Inverse Document Frequency (TF-IDF). L’approche envisagée permet d’atteindre un F-score de 17.17% avec une évaluation sur près de 3000 maladies rares, ce qui représente un progrès dans le cadre de l’extraction de symptômes de maladies rares à partir de publications scientifiques. Ce mémoire est séparé comme suit. Le premier chapitre introduira le contexte, les motivations, le problème de recherche, les contributions et la méthodologie. Le second chapitre est une revue de littérature qui présentera les travaux pertinents de ce travail de recherche et permettra de définir la direction prise par ce projet par rapport au sujet des maladies rares. Le troisième chapitre introduira les étapes, les concepts ainsi que les termes importants à définir dans le cadre d’un projet de « text mining ». Le quatrième chapitre décrira les différentes contributions du travail de recherche en précisant les éléments extraits, les sources de données et les algorithmes utilisés (TF-IDF modifié), sans oublier la description de l’outil développé et la phase d’expérimentation. Enfin, le dernier chapitre conclura ce travail de recherche par une revue des contributions, les limites du travail de recherche, les travaux futurs envisageables et une conclusion personnelle sur le projet de recherche.

Type de document:Thèse ou mémoire de l'UQAC (Mémoire de maîtrise)
Date:2018
Lieu de publication:Chicoutimi
Programme d'étude:Maîtrise en informatique
Nombre de pages:83
ISBN:Non spécifié
Sujets:Sciences naturelles et génie > Sciences mathématiques > Informatique
Département, module, service et unité de recherche:Départements et modules > Département d'informatique et de mathématique > Programmes d'études de cycles supérieurs en informatique
Directeur(s), Co-directeur(s) et responsable(s):Bouchard, Kévin
Bouchard, Bruno
Gaboury, Sébastien
Mots-clés:exploration d'articles, extraction de symptômes, fouille de texte, intelligence artificielle, maladies rares, publications scientifiques
Déposé le:28 nov. 2018 08:31
Dernière modification:29 nov. 2018 22:20
Afficher les statistiques de telechargements

Éditer le document (administrateurs uniquement)

Creative Commons LicenseSauf indication contraire, les documents archivés dans Constellation sont rendus disponibles selon les termes de la licence Creative Commons "Paternité, pas d'utilisation commerciale, pas de modification" 2.5 Canada.

Bibliothèque Paul-Émile-Boulet, UQAC
555, boulevard de l'Université
Chicoutimi (Québec)  CANADA G7H 2B1
418 545-5011, poste 5630