Constellation, le dépôt institutionnel de l'Université du Québec à Chicoutimi

Hybrid Deep Learning Vision-based Models for Human Object Interaction Detection by Knowledge Distillation

Moutik Oumaima, Tigani Smail, Saadane Rachid et Chehri Abdellah. (2021). Hybrid Deep Learning Vision-based Models for Human Object Interaction Detection by Knowledge Distillation. Procedia Computer Science, 192, p. 5093-5103.

[img]
Prévisualisation
PDF - Version publiée
Disponible sous licence Creative Commons Attribution - Pas d’utilisation commerciale - Pas de modification (CC-BY-NC-ND 2.5).

886kB

URL officielle: http://dx.doi.org/10.1016/j.procs.2021.09.287

Résumé

People hope that computers can be in constant intelligence development. Just like humans, they can ”see” the world and ”recognize” a visual event. We propose an approach based on computer vision methods to recognize Human-Object interaction(HOI). The technique stands on aggregating significant contextual features Human-Object interactions and scene recognition. We design a branch architecture consisting of the main branch for HOI detection and a supplementary branch for scene recognition. We explore the deep learning models through the knowledge distillation method and the Cross Branch Integration mechanism for encoding models into graph neural network architecture. We construct a knowledge graph to merge between high-level context information. When trained collaboratively, those models allow computing efficiency, strong context knowledge.

Type de document:Article publié dans une revue avec comité d'évaluation
ISSN:18770509
Volume:192
Pages:p. 5093-5103
Version évaluée par les pairs:Oui
Date:2021
Identifiant unique:10.1016/j.procs.2021.09.287
Sujets:Sciences naturelles et génie > Génie
Sciences naturelles et génie > Génie > Génie informatique et génie logiciel
Sciences naturelles et génie > Sciences appliquées
Département, module, service et unité de recherche:Départements et modules > Département des sciences appliquées > Module d'ingénierie
Mots-clés:computer vision, action recognition, human-object interactions (HOI), scene recognition, deep learning, knowledge distillation, cross branch integration, graph neural network, knowledge graph, vision par ordinateur, reconnaissance d'action, interactions homme-objet (IHO), reconnaissance de scène, apprentissage profond, distillation des connaissances, intégration inter-branches, réseau de neurones graphiques, graphique des connaissances
Déposé le:20 avr. 2022 14:37
Dernière modification:20 avr. 2022 14:37
Afficher les statistiques de telechargements

Éditer le document (administrateurs uniquement)

Creative Commons LicenseSauf indication contraire, les documents archivés dans Constellation sont rendus disponibles selon les termes de la licence Creative Commons "Paternité, pas d'utilisation commerciale, pas de modification" 2.5 Canada.

Bibliothèque Paul-Émile-Boulet, UQAC
555, boulevard de l'Université
Chicoutimi (Québec)  CANADA G7H 2B1
418 545-5011, poste 5630