Projet de fin d'étude : Moteur d'analyse spatio-temporelle basé sur le raisonnement et l'apprentissage profond pour la détection et la récupération d'événements visuels

Etudiant : BOUGNABER RIHAM

Filière : Master Big Data Analytics & Smart Systems (BDSaS)

Encadrant : Pr. AZOUGH AHMED

Annèe : 2021

Résumé : A cause de l’augmentation de la criminalité la sécurité dans les lieux publics est devenue une question universelle . Par conséquent, avec l’aide des systèmes de surveillance automatisés, nous pouvons créer un monde plus sûr en détectant, en récupérant et en analysant les événements en tout lieu et à tout moment. Dans ce travail, nous proposons un système intelligent pour détecter et rechercher des actions, des situations et des événements sémantiques à partir d’une séquence vidéo en utilisant des techniques de vision par ordinateur. Au premier niveau, le système proposé vise à détecter, identifier et suivre les objets en utilisant des modèles préformés : nous avons utilisé l’algorithme YOLO pour la détection des objets, puis l’algorithme SIFT pour l’identification des objets afin de faire correspondre des objets similaires dans la vidéo. Ensuite, nous avons utilisé l’algorithme Centroid Tracking pour suivre et marquer les objets identifiés et pour effectuer l’identification dans le temps. Le deuxième niveau du système est atteint en traitant et en analysant la vidéo dans l’espace et dans le temps. Nous avons utilisé différentes méthodes pour analyser efficacement le contenu de la vidéo. Premièrement, sémantiquement, en analysant, par exemple, le squelette humain pour interpréter les comportements humains. Et deuxièmement, en utilisant la segmentation d’instance pour étudier les différentes relations entre les objets. Nous avons mis au point un système efficace de détection des événements basé sur des méthodes fondées sur des règles. Le troisième niveau est une méthode illustrative de recherche et d’indexation des événements. Nous avons utilisé une base de données de graphiques Neo4j pour stocker et modéliser les informations vidéo, et un langage de traversée de graphiques Cypher pour interroger et indexer les données vidéo. cette méthode est passer par une connexion entre les algorithmes basé sur la vision comme celui de la détection des objets et de l’identification des personnes et la base de données graphique . Mots-clés :Vision par ordinateur, YOLO, SIFT, suivi de centroïde, squelette humain, segmentation d’instances, détection d’événements, récupération d’événements, base de données de graphes, Neo4j, Cypher.