Projet de fin d'étude : Apprentissage par Renforcement Profond pour la Sélection des Itinéraires et de Station de Charge Optimale

Etudiant : BACHIRI KHALIL

Filière : Master Mathématiques Appliquées et Science des données (MASD)

Encadrant : Pr. KIOUACH DRISS

Annèe : 2021

Résumé : Ce rapport propose un algorithme de sélection d’itinéraire et de station de charge (RCS) optimal basé sur l’apprentissage par renforcement profond sans modèle (DRL) pour surmonter les problèmes d’incertitude des conditions de trafic et des demandes de charge à l’arrivée dynamique. L’algorithme RCS proposé, basé sur l’apprentissage par renforcement pro- fond sans modèle, vise à minimiser le temps de trajet total des demandes de charge des véhicules électriques (EV) de l’origine à la destination en utilisant la sélection de l’itinéraire et de la station de charge optimal en tenant compte des conditions de trafic qui changent dynamiquement et des demandes futures inconnues. Dans ce rapport, nous formulons ce problème RCS comme un modèle de processus de décision de Markov avec une probabilité de transition inconnue. Un Deep Q Network a été adopté avec une approximation de fonction pour trouver la politique optimale de sélection de la station de charge de véhicule électrique (EVCS). Pour obtenir les états caractéristiques de chaque EVCS, nous définissons le module de pré-traitement du trafic, le module de pré-traitement de la charge et le module d’extraction des caractéristiques.