Moutik Oumaima, Tigani Smail, Saadane Rachid et Chehri Abdellah. (2021). Hybrid Deep Learning Vision-based Models for Human Object Interaction Detection by Knowledge Distillation. Procedia Computer Science, 192, p. 5093-5103.
Prévisualisation |
PDF
- Version publiée
Disponible sous licence Creative Commons (CC-BY-NC-ND 2.5). 886kB |
URL officielle: http://dx.doi.org/10.1016/j.procs.2021.09.287
Résumé
People hope that computers can be in constant intelligence development. Just like humans, they can ”see” the world and ”recognize” a visual event. We propose an approach based on computer vision methods to recognize Human-Object interaction(HOI). The technique stands on aggregating significant contextual features Human-Object interactions and scene recognition. We design a branch architecture consisting of the main branch for HOI detection and a supplementary branch for scene recognition. We explore the deep learning models through the knowledge distillation method and the Cross Branch Integration mechanism for encoding models into graph neural network architecture. We construct a knowledge graph to merge between high-level context information. When trained collaboratively, those models allow computing efficiency, strong context knowledge.
Type de document: | Article publié dans une revue avec comité d'évaluation |
---|---|
ISSN: | 18770509 |
Volume: | 192 |
Pages: | p. 5093-5103 |
Version évaluée par les pairs: | Oui |
Date: | 2021 |
Identifiant unique: | 10.1016/j.procs.2021.09.287 |
Sujets: | Sciences naturelles et génie > Génie Sciences naturelles et génie > Génie > Génie informatique et génie logiciel Sciences naturelles et génie > Sciences appliquées |
Département, module, service et unité de recherche: | Départements et modules > Département des sciences appliquées > Module d'ingénierie |
Mots-clés: | computer vision, action recognition, human-object interactions (HOI), scene recognition, deep learning, knowledge distillation, cross branch integration, graph neural network, knowledge graph, vision par ordinateur, reconnaissance d'action, interactions homme-objet (IHO), reconnaissance de scène, apprentissage profond, distillation des connaissances, intégration inter-branches, réseau de neurones graphiques, graphique des connaissances |
Déposé le: | 20 avr. 2022 14:37 |
---|---|
Dernière modification: | 20 avr. 2022 14:37 |
Éditer le document (administrateurs uniquement)