image

Lien de la base

I ) Introduction :

Dans notre époque, le corps modelé et le poids idéal sont les caractéristiques de la beauté corporelle.

Dans le cadre d’avoir un corps sculpté et harmonieux , il faut savoir la relation reliant les organes corporelles et le poids ainsi que la différence entre la femme et l’homme au niveau du poids et de la taille selon les organes.

Pour atteindre cet objectif, on dispose d’une base de données à propos ce sujet sur laquelle on fera l’étude et l’analyse statistique.

II ) Description des données :

La base comporte :

data=read.table(file.choose(), sep=";",dec=",", header=TRUE)
View(data)

III ) Analyse multivariée :

1- Analyse en Composantes Principales (ACP) :

On dispose d’une base de données quantitatif, donc, on a choisi l’ACP comme méthode d’analyse multivariée .

  • Les valeurs propres :

On constate qu’uniquement les 2 premières valeurs propres sont relativement importantes . Donc, on va choisir les 2 premiers axes qui représentent 82.52 % de l’inertie totale , donc il suffit de projeter les observations sur ces 2 axes pour obtenir le maximum de l’information disponible.

library(FactoMineR)
res.pca=PCA(data,quanti.sup= c(13,14), quali.sup = 15, graph=F)
res.pca$eig
##         eigenvalue percentage of variance
## comp 1  8.30595278             69.2162732
## comp 2  1.59619031             13.3015859
## comp 3  0.74670321              6.2225268
## comp 4  0.40135443              3.3446203
## comp 5  0.21541370              1.7951142
## comp 6  0.20140009              1.6783341
## comp 7  0.15567313              1.2972760
## comp 8  0.11997567              0.9997972
## comp 9  0.09466722              0.7888935
## comp 10 0.07070883              0.5892402
## comp 11 0.05135614              0.4279678
## comp 12 0.04060449              0.3383707
##         cumulative percentage of variance
## comp 1                           69.21627
## comp 2                           82.51786
## comp 3                           88.74039
## comp 4                           92.08501
## comp 5                           93.88012
## comp 6                           95.55845
## comp 7                           96.85573
## comp 8                           97.85553
## comp 9                           98.64442
## comp 10                          99.23366
## comp 11                          99.66163
## comp 12                         100.00000
barplot(res.pca$eig[,1],main= "Valeurs propres",names.arg=paste("dim",1:nrow(res.pca$eig)))

  • Contributions des variables à la construction des axes principaux :
library(ggplot2)
library(grid)
library(factoextra)
p1=fviz_contrib(res.pca, choice = "var",axes = 1) 
p2=fviz_contrib(res.pca, choice = "var",axes = 2)
library(gridExtra)
grid.arrange(p1,p2,ncol=2,nrow=1)

  • Construction du premier axe principal : On remarque que la majorité des variables ont contribué à la construction de cet axe avec des grandes valeurs. On note parmi ces variables : tour de poitrine, circonférence des biceps, circonférence de l’avant-bras, tour de taille, circonférence de l’épaule, circonférence du poignet. Donc cet axe nous informe sur la partie supérieure du corps humain (les bras et l’abdomen humain).

  • Construction du deuxième axe principal : On remarque que seulement ces 3 variables “circonférence du cuisse”, “circonférence des hanches” et “circonférence du nombril”. Donc cet axe nous informe sur la partie inférieure du corps humain.

  • Corrélation entre les variables :

plot.PCA(res.pca, choix="var")

  • D’après le cercle de corrélation, on déduit que les variables sont bien représentées. La première composante résume 69.22 % de l’inertie totale (cela était prévisible car la majorité des variables ont contribué à la construction de cet axe) alors que la deuxieme présente 13.3 % de la contribution totale.

  • On remarque que les variables “knee.girth” (circonférence du genou) et “calf.girth” (circonférence du mollet) sont trés bien corrélées entre eux car une personne qui a une circonférence importante des genoux, elle a nécessairement une grande circonférence des mollets. Aussi, on constate que les 3 variables “bicep.girth” (circonférence des biceps), “forearm.girth” (circonférence de l’avant-bras) et “wrist.grith” (circonférence du poignet) sont fortement corrélées entre eux (ils forment un angle= 0° entre eux). Ceci est admissible car il y’a une relation forte entre les organes des bras, plus la circonférence des biceps est importante, plus la circonférence de l’avant-bras et le poignet l’est aussi. En revanche, on admet que les 2 variables “chest.girth” (tour de poitrine) et “thigh.girth” (circonférence du cuisse) ne sont pas corrélés entre eux ( ils forment presque un angle=90°) car on peut pas avoir une relation reliant ces 2 variables. Finalement, on remarque l’existence d’une forte corrélation entre les variables “weight” (poids) et “waist.thigh” (tour de taille) donc on peut conclure que ceux qui ont un poids important, ils ont de meme un tour de taille important .

  • Interprétation du graphe des individus :

plot.PCA(res.pca, choix="ind", habillage=15)

Le graphe des individus nous montre un regroupement des individus selon le sexe. On remarque donc :

  • Un regroupement des hommes dans la partie droite inférieure : ce qui explique que les hommes sont caractérisés généralement par la grande circonférence des biceps, de l’avant-bras et du poignet puisque la majorité exercent des activités sportives au niveau des bras. Aussi,le regroupement en bas du graphe nous montre que les hommes sont caractérisés par une grande taille contrairement aux femmes

  • Un regroupement des femmes en haut du graphe et dans la partie gauche du premier axe : ce qui explique que les femmes ont un tour de poitrine important contrairement aux hommes et ceci est prévisible. Aussi ce regroupement nous montre que les femmes sont caractérisés par une circonférence importante des hanches (hip.girth) et des cuisses (thigh.girth).

Ces interprétations peuvent etre affinés à l’aide des résultats numériques.

2- Résultats et discussions :

Dans cette partie, on a utilisé “fviz” pour donner les graphiques issues des résultats de l’Analyse en Composantes Principales.

En utilisant le " cos carré " qui mesure la qualité de projection des individus (ou variables) sur les axes et permettent d’interpréter les proximités entre les individus (ou les variables) .

Prenons l’exemple de “forearm.girth” pour les variables (coloré en bleu clair) qui est bien représentée (très proche de 1).

Pour la fonction “fviz-screeeplot” , elle décrit comment extraire et visualiser les valeurs propres et variances des dimensions à partir des résultats.

Aussi, il est possible de construire des ellipses de confiance autour des modalités d’une variable qualitative (gender) en utilisant “habillage”. Ces ellipses donnent alors des régions de confiance sur la position de chacune des modalités (les ellipses confirment les résultats trouvés par l’ACP .

library(ggplot2)
library(grid)
library(factoextra)

fviz_pca_var(res.pca,col.var="cos2")

p1=fviz_screeplot(res.pca)
p2=fviz_pca_ind(res.pca,habillage=15,label=T,addEllipses=T)

library(gridExtra)
grid.arrange(p1,p2,ncol=2,nrow=1)

IV ) Conclusion :

Cette étude statistique nous montre qu’il existe une forte corrélation entre plusieurs organes corporelles humains. En effet, le tour de taille est la variable qui influe le plus sur le poids de l’individu. Donc, pour perdre du poids, il faut faire des exercices abdominaux. En outre, il existe une différence significative entre le poids et la taille des hommes et des femmes et ceci est dû à la différence des mesures de circonférences des organes. Finalement, avoir le corps sculpté et harmonieux c’est savoir quel organe viser dans les exercices sportifs.