Projet de fin d'étude : Enhancing education system with a Q&A using different chatbot methodologies

Etudiant : OUCHTOUBANE ABDLOUAHD

Filière : Master Big Data Analytics & Smart Systems (BDSaS)

Encadrant : Pr. BENNANI MOHAMED TAJ

Annèe : 2022

Résumé : Obtenir des réponses rapides aux questions est l’une des caractéristiques les plus recherchées au cours du processus d’apprentissage d’un élève. Cependant, cela n’est pas toujours possible étant donné que les professeurs ne sont pas toujours disponibles. Auparavant, les étudiants devaient rechercher la réponse sur Google ou parcourir des pages d’informations pour trouver des réponses. Ce qui n’est pas rentable et ne garantit pas que les réponses obtenues sont correctes. Pour résoudre le problème, nous avons développé un chatbot intelligent capable de compren- dre les questions des étudiants, en particulier dans le domaine IA, et de fournir une réponse instantanée basée sur l’apprentissage d’une question fournie par l’instructeur. L’apprentissage se fait à l’aide de Deep Learning et traitement du langage naturel. Pour la première tâche ‘Retrieval Based chatbot’, nous avons réalisé des modèles de classification pour la détection d’intention basés sur des modèles d’apprentissage en profondeur, à savoir LSTM, GRU, BiLSTM, BiGRU, Bilayer GRU et FNN. Pour traiter ces modèles, l’ensemble de données que nous avons utilisé est sous le fichier Json Machine Learning Questions, Réponses et ses classes, nous avons d’abord augmenté les données en utilisant une approche de ‘BackTranslation’ et différentes représentations des questions utilisées, sac de mots, Word2vec,GLOVE Fasttext pré-entrainé et Embedding Layer. Ensuite après avoir implémenté nos approches, nous avons remarqué que le modèle Bilayer GRU avec la représentation du Fastext donnait une précision de 90.45%, les modèles BiLSTM et Bilayer GRU avec Embedding Layer ont donné de très bons résultats très proches de Bilayer GRU avec Fasttext. Pour la deuxième tâche nommée ’Generative Based Chatbot’, nous avons utilisé les mêmes données de la premier tâche mais seulement avec les questions et ses réponses, nous les avons combinées avec d’autres questions d’apprentissage automatique , ensuite nous avons augmenté nos données en utilisant la même approche que nous avons utilisé dans la première tâche, même nous avons augmenté nos données sont encore petites, ce type de modèle a besoin d’énormes données pour donner de bonnes performances, dans cette tâche, nous avons utilisé Encodeur-Décodeur avec une approche de mécanisme d’attention, la représentation des questions et réponses word2vec-pretrained a été utilisée, ‘Bilingual-Evaluation-Understudy’(BLEU), a été utilisé pour évaluer notre modèle, Enfin,l’accuracy de l’entraînement sans attentionest 94.74%, avec BLEU score1 = 83.34%,BLEU score2 = 81.13%, BLEU score3 = 80.08% and BLEU score4 = 77.53%. l’accuracy de l’entrainement avec attention 98% with BLEU score1 = 86.06%,BLEU score2 = 84.20%,BLEU score3 = 83.15%, and BLEU score4 = 80.29%.