Projet de fin d'étude : Intégration des bases de données sur l'extraction de ressources minières avec NLP et modèles de langage

Etudiant : ZOUHAIR AICHA

Filière : Machine Learning Avancé et Intelligence Multimédia (MLAIM)

Encadrant : Pr. ELABDERRAHMANI ABDELLATIF

Annèe : 2025

Résumé : Ce projet vise à automatiser l’extraction d’informations à partir de contrats miniers non structurés collectés dans le cadre de l’initiative Land Matrix. Trois approches ont été comparées : une méthode hybride (apprentissage automatique, regex, heuristiques), un modèle NER (CamemBERT) et un modèle de langage léger (TinyLLaMA). Un corpus annoté a permis d’évaluer les performances et de concevoir un pipeline d’extraction robuste, réutilisable et extensible pour la transparence foncière.