Projet de fin d'étude : Reconstruction Tridimensionnelle par Vision Stéréoscopique et Apprentissage profond

Etudiant : ARFA HANAE

Filière : LF Sciences Mathématiques et Informatique

Encadrant : Pr. SATORI KHALID

Annèe : 2025

Résumé : Notre projet vise à dépasser les limites des méthodes géométriques traditionnelles de reconstruction 3D stéréoscopique en adoptant une approche hybride fondée sur l’apprentissage profond. Le système repose sur un pipeline innovant combinant la détection et l’appariement de points d’intérêt avec SuperPoint et SuperGlue, la régression directe de points 3D à l’aide d’un réseau de neurones graphiques (Graph Neural Network - GNN), un fine-tuning différentiable basé sur une supervision par erreur de reprojection, appliqué après une initialisation par un modèle pré entraîné (DROID-SLAM). Le processus commence par l’extraction automatique des caractéristiques visuelles à partir de deux images stéréo, suivie d’un appariement contextuel robuste via SuperGlue. Les correspondances ainsi obtenues sont structurées en graphe, ce qui permet au GNN de prédire directement un nuage de points 3D, sans nécessiter les paramètres intrinsèques et extrinsèques des caméras. Enfin, une étape de fine-tuning géométrique affine simultanément la structure 3D et les paramètres de prise de vue à l’aide d’une fonction de perte fondée sur l’erreur de reprojection. L’ensemble du pipeline peut être entraîné en mode supervisé, semi-supervisé ou auto-supervisé, offrant ainsi une solution flexible, précise et généralisable à divers contextes de vision par ordinateur.