Projet de fin d'étude : L'analyse en composantes principales des données mixtes

Etudiant : EL-MJIDI EL-MEHDI

Filière : Master Mathématiques Appliquées et Science des données (MASD)

Encadrant : Pr. HAMZAOUI HASSANIA

Annèe : 2023

Résumé : Dans ceprojetdefind’études(PFE),nousnoussommesplongésdansledomainepassion- nantdel’analysededonnées.Aujourd’hui,lesdonnéessontomniprésentes,généréesengrandes quantitéspardesentreprises,desorganisationsetmêmepardesindividus.Maiscommentex- ploiter cetteabondanced’informations?C’estlàquel’analysededonnéesentreenjeu.En utilisantdestechniquesetdesoutilsavancés,nousavonsexplorécommentlesdonnéespeuvent être transforméesenconnaissancesprécieuseseteninformationspertinentes.Nousavonsexa- miné lesdifférentesétapesdel’analysededonnées,delacollecteàlavisualisation,enpassant par lenettoyageetlamodélisation. De plus,nousavonsexplorétroisméthodesd’analysededonnéescruciales:larégression linéaire, larégressionlogistiqueetlesméthodesdeclassification,ainsiquel’analysefactorielle. Chacune decesapprochesprésentedesavantagesspécifiquesetoffredesperspectivesuniques pourl’étudedesdonnées.Larégressionlogistiqueetlarégressionlinéairesontparticulièrement utiles pouranalyserdesdonnéesmixtes. Ces troisméthodes,bienqu’indépendantes,secomplètentmutuellementetfournissentune boîteàoutilspolyvalentepourl’analyseetlacompréhensiondesdonnées.Encombinantces approchesetenadaptantleurstechniquesauxproblèmesspécifiques,lesanalystesdedonnées peuventobtenirdesinformationsprécieusesetprendredesdécisionséclairées. Nous avonségalementexplorél’analysefactorielledesdonnéesmixtesetl’analyseen composantesprincipalesmixtes.Àtraverscesdeuxapproches,nousavonsétudiédifférentes techniquespermettantdemieuxcomprendreetinterpréterlesdonnéesmixtes,quisontcarac- térisées parlaprésencesimultanéedevariablescontinuesetcatégorielles.L’analysefactorielle prend encomptelesvariablesquantitativesenutilisantuneAnalyseenComposantesPrincipales (ACP)normée,tandisquelesvariablesqualitativessontprisesencompteparuneAnalyse des CorrespondancesMultiples(ACM).L’équilibreentrecesdeuxtypesdevariablesestassuré afin demaximiserl’inertieaxialedechaquevariable. En cequiconcernelesapplicationspratiques,nousavonsutilisédifférentstypesetmé- thodesd’analysededonnées