Projet de fin d'étude : Imputation de données tabulaires mixtes dans les dossiers médicaux électroniques Àl’aide de GANs conditionnels

Etudiant : JANATI IDRISSI ABIR

Filière : Machine Learning Avancé et Intelligence Multimédia (MLAIM)

Encadrant : Pr. AHERRAHROU NOURA

Annèe : 2025

Résumé : Les dossiers médicaux électroniques représentent une source de données incontournable pour suivre l’état de santé des patients et alimenter la recherche médicale. Pourtant, ces informations restent souvent incomplètes, ce qui peut fausser les analyses et limiter la performance des modèles prédictifs. Pour améliorer cette situation, une approche d’imputation innovante, nommée MixCGAN, est proposée dans ce travail. Basée sur un réseau génératif conditionnel, elle permet de combler les valeurs manquantes en tenant compte du contexte et de la cohérence des données initiales. Le pipeline mis en place associe un prétraitement automatisé, une pondération adaptée et un apprentissage hybride combinant supervision et adversarial learning. Les expérimentations menées sur des jeux de données mixtes illustrent l’intérêt de cette méthode pour dépasser les limites des techniques classiques et renforcer la qualité des analyses médicales.