Projet de fin d'étude : Développement d’une application d’assistance visuelle basée sur l’IA générative pour les personnes aveugles

Etudiant : LOTFI FATIMA ZAHRA

Filière : LF Sciences Mathématiques et Informatique

Encadrant : Pr. EL FAZAZY KHALID

Annèe : 2025

Résumé : Ce rapport détaille le développement d'une application mobile visant à fournir de l'assistance aux personnes aveugles ou malvoyantes. Son objectif principal est de permettre à l'utilisateur de 'voir' les environs grâce à des descriptions audiotisées automatiques d'images. Ce système intègre les derniers modèles d'intelligence artificielle : LLaVA –(Large Language and Vision Assistant) qui génère des descriptions contextuelles et élaborées d'images. Speech-To-Text (STT) - Whisper par OpenAI - l'utilisateur peut parler à l'application, et l'application lui répondra sans utiliser de boutons physiques. Traditionnellement, l'interface utilisateur a été conçue en Flutter tandis que la logique serveur a été structurée avec Flask. Elle gère l'imagerie en temps réel, l'invocation de modèles, et le rendu auditif. L'architecture du système promet une faible latence et des interactions réactives pour les appareils mobiles. Le rapport de l'étudiant décrit les aspects fondamentaux de la vision par ordinateur, du traitement du langage naturel et de la reconnaissance vocale, tout en décrivant les problèmes techniques rencontrés et les décisions prises, en plus de décrire les perspectives d'améliorations futures. notamment l’optimisation des performances en environnement mobile