Projet de fin d'étude : Analyse statistique des variables quantitatives et des variables qualitatives
Etudiant : SOULY OUSSAMA
Filière : LF Sciences Mathématiques et Applications
Encadrant : Pr. HAMZAOUI HASSANIA
Annèe : 2023
Résumé : L’objectif des outils de la statistique descriptive élémentaire est de fournir, si possible graphiquement, des résumés synthétiques de séries de valeurs, adaptés à leur type (qualitatives ou quantitatives). Dans ce travail on a représenté les types des variables et les analyses statistiques élémentaires de ces variables. Les variables quantitatives jouent un rôle essentiel dans l'analyse statistique et la recherche scientifique. Elles fournissent des mesures numériques précises et permettent de quantifier des caractéristiques ou des valeurs dans un ensemble de données. L'utilisation de variables quantitatives offre de nombreux avantages, notamment la possibilité de réaliser des calculs mathématiques, d'effectuer des analyses statistiques plus avancées et de faciliter la comparaison et l'interprétation des résultats. Lorsqu'on travaille avec des variables quantitatives, il est important de comprendre les différentes mesures de tendance centrale telles que la moyenne, la médiane et le mode, ainsi que les mesures de dispersion comme l'écart-type et l'étendue. Ces mesures permettent de résumer les données et d'obtenir des informations significatives sur la distribution et la variabilité des valeurs. De plus, les variables quantitatives peuvent être utilisées pour établir des relations entre différentes variables, ce qui permet d'effectuer des analyses de corrélation et de régression. Ces méthodes permettent de déterminer si une relation linéaire ou non linéaire existe entre les variables et d'estimer les valeurs manquantes ou futures. En résumé, les variables quantitatives offrent un moyen précis et puissant de mesurer et d'analyser les phénomènes dans divers domaines, tels que la science, l'économie, la sociologie et bien d'autres. Leur utilisation appropriée permet d'obtenir des informations exploitables et d'éclairer la prise de décision dans de nombreux contextes. D’autre part, les variables qualitatives sont essentielles pour comprendre et analyser les caractéristiques et les attributs des données dans divers domaines. Contrairement aux variables quantitatives qui sont numériques, les variables qualitatives sont catégoriques et fournissent des informations sur des caractéristiques telles que le genre, la couleur, la nationalité, la préférence politique, etc. Les variables qualitatives permettent de regrouper et de classer les individus ou les objets en différentes catégories ou classes. Elles fournissent des informations sur la composition et la répartition des données selon des critères spécifiques. Les types de variables qualitatives peuvent être nominaux, où les catégories n'ont pas d'ordre particulier ou ordinal, où les catégories ont un ordre spécifique. Les variables qualitatives sont souvent utilisées dans des domaines tels que la sociologie, la psychologie, la recherche en sciences sociales et les enquêtes d'opinion. Elles permettent de comprendre les caractéristiques démographiques, les préférences, les attitudes et les opinions des individus, ces variables jouent un rôle important dans l'analyse des données en fournissant des informations sur les catégories, les attributs et les relations entre les variables. Elles permettent de regrouper les données en fonction de caractéristiques spécifiques et sont essentielles pour comprendre les aspects qualitatifs et subjectifs des phénomènes étudiés. L'Analyse en Composantes Principales (ACP) et l'Analyse Factorielle des Correspondances (AFC) sont deux techniques d'analyse de données multivariées puissantes et largement utilisées dans les domaines de la statistique, de la recherche sociale et de l'analyse des données. L'ACP est une méthode de réduction de dimension qui permet de représenter un ensemble de variables corrélées par un nombre réduit de variables non corrélées appelées composantes principales. Cette technique permet de visualiser et d'explorer la structure des données, d'identifier les relations et les patterns sous-jacents et de réduire la complexité en condensant l'information contenue dans les variables d'origine. L'AFC, quant à elle, est utilisée principalement pour analyser des tableaux de contingence, c'est-à-dire des tableaux croisés entre deux variables qualitatives. Elle permet de mettre en évidence des associations entre ces variables et de déterminer les relations entre les différentes catégories. L'AFC permet de visualiser les résultats sous forme de cartes factorielles, où les individus et les catégories sont positionnés en fonction de leurs similarités ou de leurs dissimilarités. Ces deux techniques sont complémentaires et peuvent être utilisées conjointement pour analyser des données multidimensionnelles, en particulier lorsque les données sont à la fois quantitatives et qualitatives. L'ACP et l'AFC permettent de révéler des structures et des relations cachées dans les données, d'identifier les variables les plus influentes, de détecter les outliers et de faciliter l'interprétation des résultats.