Cousyn Charles. (2018). Exploration d’articles scientifiques sur les maladies rares pour l’extraction d’informations. Mémoire de maîtrise, Université du Québec à Chicoutimi.
PDF
1MB |
Résumé
Les maladies rares constituent un sujet peu connu du grand public. Néanmoins, malgré leur nom, un grand nombre de personnes sont affligées par une ou plusieurs d'entre elles. La recherche sur près de sept mille maladies rares est insuffisante, et même si certains travaux ont été réalisés pour exploiter les publications scientifiques et extraire des informations pertinentes, les connaissances sont très difficiles à obtenir pour la population en général. Ce document présente un nouveau système qui tente d'aborder l’extraction des connaissances sur les maladies rares dans les publications scientifiques. En particulier, nous nous concentrons sur la tâche d'extraire automatiquement les symptômes de maladies rares à partir de publications avec une nouvelle approche utilisant un algorithme de reconnaissance d'entité nommée (NER) basé sur la statistique numérique Term Frequency - Inverse Document Frequency (TF-IDF). L’approche envisagée permet d’atteindre un F-score de 17.17% avec une évaluation sur près de 3000 maladies rares, ce qui représente un progrès dans le cadre de l’extraction de symptômes de maladies rares à partir de publications scientifiques. Ce mémoire est séparé comme suit. Le premier chapitre introduira le contexte, les motivations, le problème de recherche, les contributions et la méthodologie. Le second chapitre est une revue de littérature qui présentera les travaux pertinents de ce travail de recherche et permettra de définir la direction prise par ce projet par rapport au sujet des maladies rares. Le troisième chapitre introduira les étapes, les concepts ainsi que les termes importants à définir dans le cadre d’un projet de « text mining ». Le quatrième chapitre décrira les différentes contributions du travail de recherche en précisant les éléments extraits, les sources de données et les algorithmes utilisés (TF-IDF modifié), sans oublier la description de l’outil développé et la phase d’expérimentation. Enfin, le dernier chapitre conclura ce travail de recherche par une revue des contributions, les limites du travail de recherche, les travaux futurs envisageables et une conclusion personnelle sur le projet de recherche.
Type de document: | Thèse ou mémoire de l'UQAC (Mémoire de maîtrise) |
---|---|
Date: | 2018 |
Lieu de publication: | Chicoutimi |
Programme d'étude: | Maîtrise en informatique |
Nombre de pages: | 83 |
ISBN: | Non spécifié |
Sujets: | Sciences naturelles et génie > Sciences mathématiques > Informatique |
Département, module, service et unité de recherche: | Départements et modules > Département d'informatique et de mathématique > Programmes d'études de cycles supérieurs en informatique |
Directeur(s), Co-directeur(s) et responsable(s): | Bouchard, Kévin Bouchard, Bruno Gaboury, Sébastien |
Mots-clés: | exploration d'articles, extraction de symptômes, fouille de texte, intelligence artificielle, maladies rares, publications scientifiques |
Déposé le: | 28 nov. 2018 08:31 |
---|---|
Dernière modification: | 29 nov. 2018 22:20 |
Éditer le document (administrateurs uniquement)