Projet de fin d'étude : : Topic Detection and Identification from Text Data

Etudiant : ESSAID MOHAMMED AMINE

Filière : LF Sciences Mathématiques et Informatique

Encadrant : Pr. NFAOUI EL HABIB

Annèe : 2022

Résumé : De grandes quantités de données sont collectées chaque jour, et comme de plus en plus d’informations sont disponibles, il devient difficile d’accéder à ce que l’on cherche. Nous avons donc besoin d’outils et de techniques pour organiser, rechercher et comprendre de grandes quantités d’informations. Topic modeling nous fournit des méthodes pour organiser, comprendre et résumer de grandes quantités de données textuelles. Elle aide `a : • Découvrir des modèles topiques cachés qui sont présents dans toute la collection. • Annoter les documents en fonction de ces thèmes. • Utiliser ces annotations pour organiser, rechercher et résumer des textes. L’idée derrière ce projet est donc de réaliser une application web développée par le langage python, cette application est basée sur différents algorithmes d’apprentissage automatique non supervisés en utilisant le célèbre cadre de développement Django pour tester et afficher le résultat de notre traitement des données textuelles. Les principales fonctions de l’application sont les suivantes : • Donnez `a l’utilisateur la liberté de télécharger le fichier de son choix pour en extraire les sujets, en déterminant le nombre de sujets et de mots par sujet. • Nettoyer les données dans le fichier et les préparer pour que le modèle puisse les utiliser. • Donnez `a l’utilisateur un résultat visuel en utilisant plusieurs graphiques décrivant le sujet trouvé et la fréquence des mots.