Projet de fin d'étude : Création D'une base de données d'un système de reconnaissance automatique de la parole arabe

Etudiant : ALAMI AROUSSI ZINEB

Filière : LF Sciences Mathématiques et Informatique

Encadrant : Pr. SATORI HASSAN

Annèe : 2023

Résumé : Depuis des décennies, la reconnaissance automatique de la parole est un domaine qui a captivé le public ainsi que de nombreux chercheurs. Les projections sur ses applications étaient très optimistes : Quoi de plus naturel que de parler à une machine, sans avoir à s’encombrer d’un clavier ? Malheureusement, malgré l’incroyable évolution des ordinateurs et des connaissances, la reconnaissance automatique de la parole n’en demeure pas moins un sujet de recherche toujours actif et les résultats obtenus sont encore loin de l’idéal. Cependant, si le système de reconnaissance id´eal n’existe pas encore, des applications concrètes émergent petit à petit. La reconnaissance automatique de la parole commence à équiper certains téléphones ou GPS qui, en identifiant certains mots clefs, permettent d’effectuer les tâches demandées. Les systèmes de reconnaissance sont également utilisés pour indexer de grandes bases de donnees audio, pour rechercher des termes dans des flux audio ou encore comme interface de dialogue homme-machine. Ce mémoire étudier la création d’une base de données pour entraîner un système de reconnaissance automatique de la parole. Le document commence par une présentation des principes de la reconnaissance vocale et des différentes techniques utilisées pour analyser le signal vocal. Il d´ecrit ensuite les étapes de conception d’une base de données de parole, notamment la sélection des locuteurs, l’enregistrement de la parole, la segmentation du signal et l’annotation des données. Il souligne l’importance de la qualité des données pour garantir la fiabilité et l’efficacité du système de reconnaissance automatique de la parole. Il présente également les outils et methodologies utilisés pour l’analyse des données, notamment les techniques de modélisation acoustique et linguistique. Le document conclut en présentant les résultats obtenus à partir de la base de données et de l’entraînement du systeme de reconnaissance automatique de la parole.