Projet de fin d'étude : Amélioration de l'analyse discursive à l'aide d'une approche neuronales

Etudiant : BELFATHI ANAS

Filière : Master Web Intelligence et Sciences des Données (WISD)

Encadrant : Pr. EL FAZAZY KHALID

Annèe : 2024

Résumé : Le domaine juridique est vaste et complexe, nécessitant une analyse textuelle approfondie qui englobe les lois, les arguments et les opinions. Les professionnels du droit doivent analyser ces textes afin de comprendre les affaires en question, mener des recherches sur les précédents et rédiger des documents pertinents. Cependant, la taille croissante des opinions constitue un défi pour le développement d’un modèle précis permettant de prédire les rôles rhétoriques de ces dernières, étant donné leur complexité et leur diversité intrinsèques. Cette recherche poursuit un double objectif. En premier lieu, nous avons pour but de constituer un corpus d’opinions de la Cour suprême des États-Unis. Ce corpus constituera la pierre angulaire de mes travaux au cours des trois prochaines années de mon programme de doctorat, avec pour objectif ultime d’apporter une aide aux praticiens du droit du monde entier dans leur compréhension des décisions juridiques américaines, grâce à l’utilisation d’outils d’intelligence artificielle. En second lieu, nous présentons deux architectures de modèles innovantes, à savoir BERT-SentPos et HiBERT-SentPos, qui permettent de prédire automatiquement les rôles rhétoriques. Ces modèles exploitent des modèles de langue pré-entraînés et tirent parti du contexte local tout en prenant en compte la position des phrases au sein d’un document. Grâce à une évaluation approfondie sur les corpus existants, nous démontrons que nos approches nécessitent moins de paramètres, ce qui se traduit par des coûts de calcul réduits par rapport aux architectures complexes qui utilisent un modèle hiérarchique avec vue globale du contexte, tout en offrant d’excellentes performances. À l’avenir, notre objectif est d’utiliser des modèles de langage pré-entraînés spécifiquement formés sur des ensembles de données juridiques. De plus, nous avons l’intention d’améliorer encore les capacités de nos modèles en les enrichissant d’informations externes.