Projet de fin d'étude : Détection et Segmentation des personnes dans les images basées sur le Deep Learning

Etudiant : ZIANE AOUATIF

Filière : Master Web Intelligence et Sciences des Données (WISD)

Encadrant : Pr. TAIRI HAMID

Annèe : 2022

Résumé : Le présent rapport constitue une synthèse de mon travail dans le cadre de mon stage de PFE, que j’ai effectué au sein de la société ‘SiliconeSignal Technologies’, pour l’obtention du Master « Web Intelligence et Science des Données » en partenariat avec l’université Sorbonne Paris Nord, Master « Exploration Informatique des Données et Décisionnel ». La segmentation est le processus de la détermination des limites et des zones, des objets dans les images et des séquences vidéo. Nous, les humains, effectuons la segmentation sans effort conscient, mais cela reste un défi majeur pour les systèmes d'apprentissage profond. En plus, la segmentation d'images est l'une des applications clés dans le domaine de la vision par ordinateur. Dans ce projet nous nous sommes basés sur l’apprentissage profond pour effectuer la segmentation des personnes. En effet, nous avons fait appel à des architectures basées sur les régions et d’autres basées sur un réseau d'encodeurs suivi d'un réseau de décodeurs. De plus, on a découvert le mécanisme d’attention pour l’amélioration des performances du modèle d'encodeur-décodeur. Dans ce travail, une synthèse détaillée sur les méthodes existantes de segmentation dans le domaine statique et dynamique est présentée. Pour réussir notre projet, on a réalisé une application de segmentation des personnes dans les images dans laquelle nous avons implémenté trois architectures : le MaskRCNN (Mask Region Based Convolutional Neural Network), le modèle Unet, et Unet avec le mécanisme d’attention, ainsi que nous avons appliqué les techniques du transfer learning sur les modèles. De même, une étude comparative sur les différents modèles adoptés a été effectuée.