Projet de fin d'étude : Développement d’algorithmes pour la dématérialisation d’un dictionnaire CHAM-Français

Etudiant : EL-KHARROUBI HASSAN

Filière : Master Web Intelligence et Sciences des Données (WISD)

Encadrant : Pr. YAHYAOUYI ALI

Annèe : 2022

Résumé : Dans ce projet nous avons utilisé les algorithmes de l’analyse de structure de document (Document layout Analysis (DLA)) pour la dématérialisation d’un dictionnaire Cham- français dont le but de construire une base de données d’entrée Cham et la transcription de Cham et l’explication Français. Pour l’analyse de structure de document nous avons utilise deux algorithme comme RLSA pour le regroupe de la structure logique et X-Y Cut pour la décomposition de ces composants. Nous avons ressuis a extraire l’entre Cham en basant sur une caractéristique de profile de projection et la base d’écriture pour Cham. Pour l’analyse de structure de documen, nous avons utilisé deux algorithmes qui sont robustes dans notre situation, RLSA pour le regroupement de la structure logique et X-Y Cut utilisé pour la décomposition de composants connexe comme une résultat de l’application de RLSA, puis nous avons extrait l’entrée Cham avec la méthode du profil de projection et la ligne de base de Cham. mots-clés : DLA- RLSA - XY cut - pojection d’histogram - OCR- Pré-traitement - Structure physique - structure logique