Projet de fin d'étude : Reinforcement Learning in Stock Trading

Etudiant : SOW KALIDOU MOUSSA

Filière : Master Informatique Décisionnelle et Vision Intelligente (MIDVI)

Encadrant : Pr. AUTRE

Annèe : 2021

Résumé : Un marché financier est un marché sur lequel des personnes physiques, des sociétés privées et des institutions publiques peuvent négocier des titres fi nanciers,matiéres premiéres et autres actifs,à des prix qui refletent l'offre et la demande. La recherche d'un modéle efficace pour prédire les prix des marchés fi nanciers est au- jourd'hui un sujet de recherche actif malgré le fait que de nombreuses études de recherche sont publiées depuis longtemps. Une approcherelativement nouvelle du trading fi nancier consiste à utiliser l'apprentissage par renforcement approfond ipourprédire la hausse et la baisse des prix des actifs avant qu'elles ne se produisent. Un agent trader optimal acheterait un actif avant que le prix n'augmente et vendrait l'actif avant que sa valeur ne baisse. L'objectif d'un trader,qui est de maximiser ces gains, suit la philosophie de l'apprentissage par renforcement approfondi qui a comme principal objectif d'apprendre à un agent de maximiser sa réecompense totale en interagissant avec un environnement qui, au départ, est inconnu. Cependant pour former un tel agent trader de Deep Reinforcement Learning, qui décide quand "vendre",quand"acheter", implique que l'agent doit savoir faire face à la complexité des données du trading, il doit savoir également choisir la bonne politique à adopter quand il y'a une chute des prix ou bien quand les prix augmentent. Dans cette étude nous utilisons le Deep Q Learning qui s'avére être une stratégie efficace pour atteindre ces objectifs. Pour voir les qualités du model de Deep Q Learning, nous le comparons avec les differentes approches traditionnelles du trading en utilisant un dataset S&P500 de 2016 à 2018 pour la formation et de 2018 à 2020 pour les tests. Et pour obtenir un agent trader plus performent nous proposons dans ce projet l'application d'un algorithme hybride , sur le trading,qui combine le deep Q Learning et la force des algorithmes génétiques à trouver la solution optimale.