Adresse E-mail: saramadani06@gmail.com
Dans le cadre du projet“Bébé et Maternité” on s’interesse à l’étude de 498 bébés afin de tester leurs morphologies selon celles de leurs mères en tenant compte du mode d’accouchement et d’allaitement .
On aboutit finalement que la taille du bébé est proportionnelle à celle de placenta ainsi que l’age de la mère n’influe pas sur la morphologie de son foetus contrairement à son IMC qui reflète sur son poids et sa taille.
La grossesse étant une periode-clé dans la vie maternelle où le fonctionnement de l’organisme qui était périodique devient continu et entièrement guidé vers la création d’un nouvel etre vivant.En faite ce sont les hormones qui dominent les changements du corps et qui sont à l’origine des nausées et divers malaises connus des femmes enceintes ce qui influent sur le mode d’accouchement et la nature d’allaitement du bébé.
ACP:
Une méthode multidimentionnelle permettant de réduire le nombre de variables en gardant le maximum d’information.
Logiciel utilisé:
Rstudio avec la version 3.2.3 du logiel
packages utilisés:
“FactoMineR”
“ggplot2”
“factoextra”
[source] (http://math.agrocampus-ouest.fr/infoglueDeliverLive/enseignement/support2cours/donnees )
Importation des données:
data=read.table(file=file.choose(),sep=";",header=T)
Baby=data[,-c(7,10,11,12,13,14,15,16,19,20,27)]
Baby=na.omit(Baby)
On dispose d’un jeu de données contenant 16 variables quantitatives où une seule étant supplémentaire et 7 variables qualitatives.
colnames(Baby[c(1,3,4,5,8,9,10,15,16)])
## [1] "Nbsem" "PoidsBB" "TailleBB" "PoidsPlacenta"
## [5] "AgedelaMère" "NbGrossess" "NbEnfants" "DureeTrava"
## [9] "IMCMère"
Nbsem : Le Nombre de semaines de la grossesse.
PoidsBB :Le poids du bébé(g)
TailleBB :La taille du bébé (cm)
PoidsPlacenta :Le poids de placenta (g)
AgedelaMère: Age de la mère
NbGrossess :Le nobre de grossesses précédentes
NbEnfants:Le nombre d’enfants ayant la mère
IMCMère:Indice de Masse Corporelle de la mère(kg/m²)
colnames(Baby[15])
## [1] "DureeTrava"
DureeTrava: Durée du travail pour l’accouchement (en minutes)
colnames(Baby[c(2,6,7,11,12,13,14)])
## [1] "Sexe" "Operant" "SitMat" "TypeAllait" "ModeAccouc"
## [6] "ModeTravai" "Peridurale"
Sexe : Le genre du bébé
Operant:medecin ou sage femme
SitMat:La situation de la mère
TypeAllait:Le type d’allaitement du bébé
ModeAccouc:Le mode d’accouchement
ModeTravai :Le mode du travail
Peridurale :La piqûre anti-douleur
summary(Baby)
## Nbsem Sexe PoidsBB TailleBB PoidsPlacenta
## Min. :34.00 F:177 Min. :1890 Min. :42.00 Min. : 310.0
## 1st Qu.:39.00 M:199 1st Qu.:3050 1st Qu.:48.00 1st Qu.: 505.0
## Median :40.00 Median :3300 Median :50.00 Median : 570.0
## Mean :39.61 Mean :3316 Mean :49.38 Mean : 593.5
## 3rd Qu.:40.25 3rd Qu.:3582 3rd Qu.:51.00 3rd Qu.: 660.0
## Max. :42.00 Max. :5030 Max. :55.00 Max. :1200.0
## Operant SitMat AgedelaMère NbGrossess
## Médecin: 93 céliba: 23 Min. :19.00 Min. :1.000
## SF :283 conc :132 1st Qu.:26.00 1st Qu.:1.000
## Mariée:221 Median :28.00 Median :2.000
## Mean :28.56 Mean :2.191
## 3rd Qu.:31.00 3rd Qu.:3.000
## Max. :44.00 Max. :7.000
## NbEnfants TypeAllait ModeAccouc ModeTravai
## Min. :1.000 Artificiel:229 Autre : 4 arti : 50
## 1st Qu.:1.000 Maternel :147 Césarienne: 47 autre : 4
## Median :2.000 forceps : 31 Césarienne: 19
## Mean :1.819 VBS :294 ocytosine : 41
## 3rd Qu.:2.000 spontané :262
## Max. :6.000
## Peridurale DureeTrava IMCMère
## non:108 Min. : 0.000 Min. :15.24
## oui:268 1st Qu.: 4.000 1st Qu.:19.30
## Median : 5.000 Median :20.90
## Mean : 5.811 Mean :21.70
## 3rd Qu.: 7.000 3rd Qu.:23.05
## Max. :60.000 Max. :48.70
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 3.2.5
ggplot(Baby, aes(x=Baby$Sexe,y=Baby$PoidsBB))+geom_boxplot()
library(FactoMineR)
## Warning: package 'FactoMineR' was built under R version 3.2.4
Baby.pca=PCA(Baby,scale.unit=T,quali.sup=c(2,6,7,11,12,13,14),quanti.sup = 15,graph=F)
Baby.pca=na.omit(Baby.pca)
Baby.pca
## **Results for the Principal Component Analysis (PCA)**
## The analysis was performed on 376 individuals, described by 16 variables
## *The results are available in the following objects:
##
## name
## 1 "$eig"
## 2 "$var"
## 3 "$var$coord"
## 4 "$var$cor"
## 5 "$var$cos2"
## 6 "$var$contrib"
## 7 "$ind"
## 8 "$ind$coord"
## 9 "$ind$cos2"
## 10 "$ind$contrib"
## 11 "$quanti.sup"
## 12 "$quanti.sup$coord"
## 13 "$quanti.sup$cor"
## 14 "$quali.sup"
## 15 "$quali.sup$coord"
## 16 "$quali.sup$v.test"
## 17 "$call"
## 18 "$call$centre"
## 19 "$call$ecart.type"
## 20 "$call$row.w"
## 21 "$call$col.w"
## description
## 1 "eigenvalues"
## 2 "results for the variables"
## 3 "coord. for the variables"
## 4 "correlations variables - dimensions"
## 5 "cos2 for the variables"
## 6 "contributions of the variables"
## 7 "results for the individuals"
## 8 "coord. for the individuals"
## 9 "cos2 for the individuals"
## 10 "contributions of the individuals"
## 11 "results for the supplementary quantitative variables"
## 12 "coord. for the supplementary quantitative variables"
## 13 "correlations suppl. quantitative variables - dimensions"
## 14 "results for the supplementary categorical variables"
## 15 "coord. for the supplementary categories"
## 16 "v-test of the supplementary categories"
## 17 "summary statistics"
## 18 "mean of the variables"
## 19 "standard error of the variables"
## 20 "weights for the individuals"
## 21 "weights for the variables"
Les valeurs propres des individus
Baby.pca$eig
## eigenvalue percentage of variance cumulative percentage of variance
## comp 1 2.3607649 29.509561 29.50956
## comp 2 2.1617370 27.021713 56.53127
## comp 3 1.0530092 13.162615 69.69389
## comp 4 0.8200161 10.250201 79.94409
## comp 5 0.6208639 7.760799 87.70489
## comp 6 0.6027702 7.534627 95.23952
## comp 7 0.2047258 2.559073 97.79859
## comp 8 0.1761130 2.201412 100.00000
Eboulis des valeurs propres
library(factoextra)
library(grid)
library(ggplot2)
fviz_screeplot(Baby.pca, ncp=8)+theme_classic()
Contribution des variables
Baby.pca$var$contrib
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## Nbsem 4.391600 11.2218257 25.8908076 14.0897965 1.88180831
## PoidsBB 25.763079 10.8735687 0.1802185 0.4296232 0.04309779
## TailleBB 19.936161 12.5770264 2.7598911 0.4996024 0.08280936
## PoidsPlacenta 13.119082 1.4580236 20.4177975 28.9003700 5.70466351
## AgedelaMère 6.889033 14.9760384 3.1777768 8.4250890 66.05656698
## NbGrossess 12.834895 22.8038242 1.5329102 0.1096820 16.70229549
## NbEnfants 11.810913 25.9643869 0.5219749 1.3087419 7.36887969
## IMCMère 5.255236 0.1253062 45.5186234 46.2370950 2.15987887
Cercle de corrélation
fviz_pca_var(Baby.pca,col.var="contrib")+scale_color_gradient2(low="blue",mid="purple",high = "red",midpoint = 55)+theme_light()
Graphe des individus
fviz_pca_ind(Baby.pca,label=T,addEllipses=TRUE, ellipse.level=0.95,col.ind="purple",alpha.ind=0.5)+theme_gray()
construction de data frame par les deux composantes principales pour mieux comprendre le graphe
pc1=Baby.pca$ind$coord[,1]
pc2=Baby.pca$ind$coord[,2]
labs=rownames(Baby.pca$var$coord)
pc=data.frame(cbind(pc1,pc2),Baby$ModeTravai)
library(ggplot2)
p1=ggplot(pc,aes(pc1,pc2,label=rownames(pc)))+geom_text(data=pc,aes(x=pc1,y=pc2,colour=Baby$ModeTravai,fill=Baby$ModeTravai))+geom_point(aes(colour=Baby$ModeTravai,size=Baby$ModeTravai))
p1
## Warning: Using size for a discrete variable is not advised.
fviz_pca_var(Baby.pca)+scale_color_gradient2(low="green",mid="blue",high="red",midpoint=0.4)
fviz_pca_biplot(Baby.pca,geom="text",col.ind = "purple")+theme_minimal()
Les deux premieres valeurs propores sont relativement plus importantes que les autres.Elles présentent 56.53 % de l’information totale ce qui justifie la projection des observations sur le premier plan factoriel (1,2) pour avoir le maximum possible d’information .
On trouve que la première composante principale résume 29.51% de l’inertie totale. On remarque aussi que la variable “IMCMère” contribue fortement à la construction du premier axe pricipalalors que la variable “NbSem” contribue négativement et fortement au deuxième axe d’ou on peut considérer ce dernier comme étant l’axe de “NbSem”.< br/> On note aussi que le nombre de grossesse est corrélé avec le nombre d’enfants ce qui indique la minorité des morts nés.
La variable “AgedelaMère” et la variable“tailleBB” ne sont pas corrélées cela signifie que l’age de la mère n’influe pas sur la taille et le poids du bébé . Par contre On remarque une corrélation entre l’indice de masse corporelle de la mère(IMC) et la taille de bébé également à son poids ce qui indique que l’IMC intervient dans chacun de poids et taille du foetus.
On note une indépendance entre l’age de la mère et le poids de placenta .. Donc quel que soit l’age de la mère le poids de placenta est relativement invariable.
Pour la courbe des individus, on peut voir qu’il y a une grande concentration au dessous du premier axe principal. Cette figure nous permet de divser les nouveaux nés essentiellement en 4 groupes:
1 er groupe: Situé au centre du graphe où les individus sont peu condensés.. ces individus subissent un accouchement naturel.
** 2ème groupe:** Situé au dessus de l’axe 1 où l’accouchement se fait d’une manière césarienne.
3ème groupe: Situé dans la partie positive du 2ème axe principal où l’accouchement se fait par le biais de l’ocytosine
4ème groupe: Situé dans la partie négative de chacun des deux axes où les bébés sont nés d’une manière artificielle.
On note un 5ème groupe où on n’a pas précisé le mode du travail d’accouchement ,la variable ainsi notée “autre” et elle concerne seulement 5 bébés..
A partir de cette étude on a pu dégager les conclusions suivantes:
L’age de la mère n’intervient pas dans la morphologie du bébé.
Le poids de placenta et celui du bébé sont fortement dépendants
Lorsque la mère subit une piqure anti-douleur (peridurale) l’aillaitement est généralement artificielle.
Finalement,plus l’IMC de la mère est elevé plus le poids de placenta est aussi elevé et par suite le poids du bébé est important.