Projet de fin d'étude : Migration de Pipelines de Données vers Google Cloud Platform et Détection et Classification des Anomalies dans le Comportement des Véhicules Connectés RENAULT
Etudiant : CHEGUE HICHAM
Filière : Master Web Intelligence et Sciences des Données (WISD)
Encadrant : Pr. BOUMHIDI JAOUAD
Annèe : 2025
Résumé : À l'ère du numérique, la valeur stratégique des données n'a jamais été aussi déterminante. Leur gestion exige désormais des méthodologies spécialisées pour répondre à leur complexité croissante. Cette transformation digitale impacte profondément l'industrie automobile, où des constructeurs comme Renault intègrent massivement des capteurs IoT et des systèmes embarqués générant des téraoctets d'informations quotidiennes. Ces véhicules connectés exploitent ces données en temps réel pour optimiser l'efficacité énergétique, personnaliser l'expérience utilisateur et développer des fonctions ADAS. La performance de ces écosystèmes technologiques repose ainsi impérativement sur des architectures data robustes et évolutives. Durant mon immersion dans le projet Véhicules Connectés de Renault, j'ai piloté la refonte complète des pipelines traitant les données télémétriques issus des boîtiers embarqués. Ma première initiative a concerné un pipeline Beam en utilisant une architecture in-worker qui gère la consommation depuis CosmosDB, facilitant ainsi la récupération des données perdues et la lutte contre la saturation du CPU grâce au principe de parallélisme de GCP Dataflow. J’ai ensuite participe à la migration des pipelines d'une VM Azure vers une solution serverless GCP Dataflow par la modernisation d’un pipeline avec restructuration du workflow en deux jobs tout en séparant la consommation de l’envoi. Après, j'ai conçu une plateforme de supervision unifiée en exploitant les outils GCP afin de surveiller l’état de santé des pipelines et l’état des jobs qui tournent sur l’environnement GCP Dataflow. Enfin, j’ai réalisé une application AI permettant la détection et la classification des anomalies dans le comportement des véhicules connectés Renault par Autoencodeur Variationnel Temporel. Notre démarche prioritaire vise à renforcer l'efficacité des systèmes opérationnels de Renault pour adresser les dysfonctionnements critiques identifiés. Cette approche nécessite un diagnostic précis des vulnérabilités existantes et le déploiement de correctifs innovants afin de valoriser pleinement le potentiel des données métier. L'optimisation ciblera spécifiquement la stabilité des infrastructures, l'accélération des traitements et l’amélioration de l’expérience client.