#Chargement des données

donnees <- read.csv(file = "Variables excel_RTI.csv", 
                    header = TRUE, 
                    sep = ";", 
                    quote = "\"", 
                    dec = ",", 
                    row.names = 1)
print(donnees)
##                Population A..securisee A..de.base A..limitee A..non.amelioree
## Benin            13759507     2.690868  16.690746  19.866568        11.416881
## Burkina Faso     22509037     9.456732  14.584388  32.338623         8.392673
## Cote dIvoire     30395003     16.97017  19.320868  26.730146        15.149507
## Guinee Bissau     2105537   15.3986435  12.335244  17.648422        46.125084
## Mali             23072639    15.408502  32.978043  17.184368        29.323624
## Niger            25311977    7.8718586   8.009703   9.703013         8.535864
## Senegal          17651099    13.870416  45.272964  16.947517       15.5044775
## Togo              9089742    5.7423005  13.325628   27.32524        13.130565
##                      DAL Pop.sans.A..securisee Pop.sans.A..amelioree
## Benin          49.334938              12647166              60.75182
## Burkina Faso   35.227585              20010680              43.62026
## Cote dIvoire    21.82931              22815142             36.978817
## Guinee Bissau   8.492604               1743398              54.61769
## Mali            5.105463              18529754             34.429085
## Niger           65.87956              23264866              74.41542
## Senegal         8.404625              14535850             23.909103
## Togo            40.47627               8148417             53.606834
##                A..amelioree M.A..insalubre M.eau.insalubre manque.LM Cholera
## Benin              39.24818          2.739           3.196      2.85    1200
## Burkina Faso       56.37974          7.572           8.884     7.367    1500
## Cote dIvoire      63.021183          3.573           4.296     4.768    2300
## Guinee Bissau      45.38231           3.59             4.4      4.05     800
## Mali              65.570915          5.508           6.533     4.865    1700
## Niger             25.584576         10.874          10.075     8.977    2500
## Senegal             76.0909          1.661           1.294      1.89    1000
## Togo              46.393166          1.845           2.298     1.818     900
##                Polio children.stunt
## Benin              6           30.9
## Burkina Faso       4           22.4
## Cote dIvoire       0           20.9
## Guinee Bissau      6           27.9
## Mali               0           24.3
## Niger             36             47
## Senegal           28           17.3
## Togo               0           22.9
summary(donnees)
##    Population       A..securisee        A..de.base         A..limitee       
##  Min.   : 2105537   Length:8           Length:8           Length:8          
##  1st Qu.:12592066   Class :character   Class :character   Class :character  
##  Median :20080068   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :17986818                                                           
##  3rd Qu.:23632474                                                           
##  Max.   :30395003                                                           
##  A..non.amelioree       DAL            Pop.sans.A..securisee
##  Length:8           Length:8           Min.   : 1743398     
##  Class :character   Class :character   1st Qu.:11522479     
##  Mode  :character   Mode  :character   Median :16532802     
##                                        Mean   :15211909     
##                                        3rd Qu.:20711796     
##                                        Max.   :23264866     
##  Pop.sans.A..amelioree A..amelioree       M.A..insalubre     M.eau.insalubre   
##  Length:8              Length:8           Length:8           Length:8          
##  Class :character      Class :character   Class :character   Class :character  
##  Mode  :character      Mode  :character   Mode  :character   Mode  :character  
##                                                                                
##                                                                                
##                                                                                
##   manque.LM            Cholera         Polio      children.stunt    
##  Length:8           Min.   : 800   Min.   : 0.0   Length:8          
##  Class :character   1st Qu.: 975   1st Qu.: 0.0   Class :character  
##  Mode  :character   Median :1350   Median : 5.0   Mode  :character  
##                     Mean   :1488   Mean   :10.0                     
##                     3rd Qu.:1850   3rd Qu.:11.5                     
##                     Max.   :2500   Max.   :36.0

#Retrait de l’élement atypique #Lors de la réalisation de l’acp, nous avons remarquer que le Niger se comportait comme un élément atypique alors pour une bonne interprétation il est necessaire de le retirer.

data=read.csv(file="Variables excel.csv", header = TRUE, sep = ";", quote = "\"",
              dec = ".",row.names = 1)
print(data)
##                Population A..securisee A..de.base A..limitee A..non.amelioree
## Benin            13759507     2.690868   16.69075   19.86657        11.416881
## Burkina Faso     22509037     9.456732   14.58439   32.33862         8.392673
## Cote dIvoire     30395003    16.970170   19.32087   26.73015        15.149507
## Guinee Bissau     2105537    15.398644   12.33524   17.64842        46.125084
## Mali             23072639    15.408502   32.97804   17.18437        29.323624
## Senegal          17651099    13.870416   45.27296   16.94752        15.504478
## Togo              9089742     5.742300   13.32563   27.32524        13.130565
##                      DAL Pop.sans.A..securisee Pop.sans.A..amelioree
## Benin          49.334938              12647166              60.75182
## Burkina Faso   35.227585              20010680              43.62026
## Cote dIvoire   21.829310              22815142              36.97882
## Guinee Bissau   8.492604               1743398              54.61769
## Mali            5.105463              18529754              34.42909
## Senegal         8.404625              14535850              23.90910
## Togo           40.476270               8148417              53.60683
##                A..amelioree M.A..insalubre M.eau.insalubre manque.LM Cholera
## Benin              39.24818          2.739           3.196     2.850    1200
## Burkina Faso       56.37974          7.572           8.884     7.367    1500
## Cote dIvoire       63.02118          3.573           4.296     4.768    2300
## Guinee Bissau      45.38231          3.590           4.400     4.050     800
## Mali               65.57091          5.508           6.533     4.865    1700
## Senegal            76.09090          1.661           1.294     1.890    1000
## Togo               46.39317          1.845           2.298     1.818     900
##                Polio children.stunt
## Benin              6           30.9
## Burkina Faso       4           22.4
## Cote dIvoire       0           20.9
## Guinee Bissau      6           27.9
## Mali               0           24.3
## Senegal           28           17.3
## Togo               0           22.9
summary(data)
##    Population        A..securisee      A..de.base      A..limitee   
##  Min.   : 2105537   Min.   : 2.691   Min.   :12.34   Min.   :16.95  
##  1st Qu.:11424624   1st Qu.: 7.600   1st Qu.:13.96   1st Qu.:17.42  
##  Median :17651099   Median :13.870   Median :16.69   Median :19.87  
##  Mean   :16940366   Mean   :11.363   Mean   :22.07   Mean   :22.58  
##  3rd Qu.:22790838   3rd Qu.:15.404   3rd Qu.:26.15   3rd Qu.:27.03  
##  Max.   :30395003   Max.   :16.970   Max.   :45.27   Max.   :32.34  
##  A..non.amelioree      DAL         Pop.sans.A..securisee Pop.sans.A..amelioree
##  Min.   : 8.393   Min.   : 5.105   Min.   : 1743398      Min.   :23.91        
##  1st Qu.:12.274   1st Qu.: 8.449   1st Qu.:10397792      1st Qu.:35.70        
##  Median :15.150   Median :21.829   Median :14535850      Median :43.62        
##  Mean   :19.863   Mean   :24.124   Mean   :14061487      Mean   :43.99        
##  3rd Qu.:22.414   3rd Qu.:37.852   3rd Qu.:19270217      3rd Qu.:54.11        
##  Max.   :46.125   Max.   :49.335   Max.   :22815142      Max.   :60.75        
##   A..amelioree   M.A..insalubre  M.eau.insalubre   manque.LM        Cholera    
##  Min.   :39.25   Min.   :1.661   Min.   :1.294   Min.   :1.818   Min.   : 800  
##  1st Qu.:45.89   1st Qu.:2.292   1st Qu.:2.747   1st Qu.:2.370   1st Qu.: 950  
##  Median :56.38   Median :3.573   Median :4.296   Median :4.050   Median :1200  
##  Mean   :56.01   Mean   :3.784   Mean   :4.414   Mean   :3.944   Mean   :1343  
##  3rd Qu.:64.30   3rd Qu.:4.549   3rd Qu.:5.466   3rd Qu.:4.816   3rd Qu.:1600  
##  Max.   :76.09   Max.   :7.572   Max.   :8.884   Max.   :7.367   Max.   :2300  
##      Polio        children.stunt 
##  Min.   : 0.000   Min.   :17.30  
##  1st Qu.: 0.000   1st Qu.:21.65  
##  Median : 4.000   Median :22.90  
##  Mean   : 6.286   Mean   :23.80  
##  3rd Qu.: 6.000   3rd Qu.:26.10  
##  Max.   :28.000   Max.   :30.90

ANALYSE DE DONNÉES

Matrice de corrélation linéaire:

Mat_corr <-cor(data[,1:15]) #En s'assurant de retirer la variable qualitative et variables supplémentaires 
Mat_corr
##                        Population A..securisee  A..de.base A..limitee
## Population             1.00000000    0.3298612  0.33243230  0.3349950
## A..securisee           0.32986116    1.0000000  0.38636089 -0.2678588
## A..de.base             0.33243230    0.3863609  1.00000000 -0.5524563
## A..limitee             0.33499504   -0.2678588 -0.55245635  1.0000000
## A..non.amelioree      -0.50227596    0.5456480 -0.05086310 -0.6014180
## DAL                   -0.07274423   -0.8976557 -0.58853097  0.5746304
## Pop.sans.A..securisee  0.98863354    0.2191843  0.31337092  0.3853912
## Pop.sans.A..amelioree -0.60991314   -0.6583600 -0.84777498  0.1646782
## A..amelioree           0.60991311    0.6583600  0.84777500 -0.1646782
## M.A..insalubre         0.40472617    0.1786189 -0.21505201  0.4272493
## M.eau.insalubre        0.37118207    0.1638536 -0.29744906  0.4456183
## manque.LM              0.47215767    0.2862407 -0.28775702  0.4926110
## Cholera                0.91280752    0.4104294  0.05205994  0.3294408
## Polio                 -0.11604004    0.1060135  0.71422758 -0.4467548
## children.stunt        -0.48719083   -0.4588028 -0.59077388 -0.2142976
##                       A..non.amelioree         DAL Pop.sans.A..securisee
## Population               -0.5022759572 -0.07274423             0.9886335
## A..securisee              0.5456479677 -0.89765566             0.2191843
## A..de.base               -0.0508631009 -0.58853097             0.3133709
## A..limitee               -0.6014180203  0.57463036             0.3853912
## A..non.amelioree          1.0000000000 -0.67750410            -0.5823643
## DAL                      -0.6775040965  1.00000000             0.0176602
## Pop.sans.A..securisee    -0.5823643347  0.01766020             1.0000000
## Pop.sans.A..amelioree     0.1021115249  0.66249343            -0.5692068
## A..amelioree             -0.1021115314 -0.66249343             0.5692068
## M.A..insalubre           -0.0006282841 -0.05294731             0.4609539
## M.eau.insalubre           0.0342396064 -0.02340780             0.4223161
## manque.LM                 0.0054361032 -0.06272884             0.5045974
## Cholera                  -0.2702541695 -0.07447481             0.8678892
## Polio                    -0.0765158041 -0.31932067            -0.1036670
## children.stunt            0.3242645316  0.38539832            -0.4558401
##                       Pop.sans.A..amelioree A..amelioree M.A..insalubre
## Population                     -0.609913141  0.609913108   0.4047261745
## A..securisee                   -0.658360002  0.658359981   0.1786188656
## A..de.base                     -0.847774980  0.847775002  -0.2150520137
## A..limitee                      0.164678175 -0.164678200   0.4272492526
## A..non.amelioree                0.102111525 -0.102111531  -0.0006282841
## DAL                             0.662493434 -0.662493429  -0.0529473100
## Pop.sans.A..securisee          -0.569206838  0.569206807   0.4609538612
## Pop.sans.A..amelioree           1.000000000 -1.000000000  -0.0722498831
## A..amelioree                   -1.000000000  1.000000000   0.0722498405
## M.A..insalubre                 -0.072249883  0.072249841   1.0000000000
## M.eau.insalubre                 0.003211813 -0.003211859   0.9945285061
## manque.LM                      -0.079303075  0.079303031   0.9627985269
## Cholera                        -0.375957946  0.375957899   0.4229174636
## Polio                          -0.509799271  0.509799325  -0.4097637577
## children.stunt                  0.851480269 -0.851480274   0.0615380894
##                       M.eau.insalubre    manque.LM     Cholera      Polio
## Population                0.371182068  0.472157670  0.91280752 -0.1160400
## A..securisee              0.163853572  0.286240748  0.41042938  0.1060135
## A..de.base               -0.297449056 -0.287757021  0.05205994  0.7142276
## A..limitee                0.445618268  0.492611042  0.32944084 -0.4467548
## A..non.amelioree          0.034239606  0.005436103 -0.27025417 -0.0765158
## DAL                      -0.023407802 -0.062728841 -0.07447481 -0.3193207
## Pop.sans.A..securisee     0.422316113  0.504597386  0.86788925 -0.1036670
## Pop.sans.A..amelioree     0.003211813 -0.079303075 -0.37595795 -0.5097993
## A..amelioree             -0.003211859  0.079303031  0.37595790  0.5097993
## M.A..insalubre            0.994528506  0.962798527  0.42291746 -0.4097638
## M.eau.insalubre           1.000000000  0.962897910  0.42803754 -0.4971093
## manque.LM                 0.962897910  1.000000000  0.54195083 -0.4233514
## Cholera                   0.428037539  0.541950829  1.00000000 -0.4116455
## Polio                    -0.497109286 -0.423351360 -0.41164552  1.0000000
## children.stunt            0.123717806  0.022857043 -0.23945382 -0.4487438
##                       children.stunt
## Population               -0.48719083
## A..securisee             -0.45880278
## A..de.base               -0.59077388
## A..limitee               -0.21429760
## A..non.amelioree          0.32426453
## DAL                       0.38539832
## Pop.sans.A..securisee    -0.45584014
## Pop.sans.A..amelioree     0.85148027
## A..amelioree             -0.85148027
## M.A..insalubre            0.06153809
## M.eau.insalubre           0.12371781
## manque.LM                 0.02285704
## Cholera                  -0.23945382
## Polio                    -0.44874384
## children.stunt            1.00000000

Analyse de la Matrice de Corrélation La matrice de corrélation montre les coefficients de corrélation entre les différentes variables de notre étude.

Dans le cadre de notre analyse, nous avons constaté les corrélations suivantes : 1. Corrélations Positives Élevées : - Entre les variables Population et Pop.sans.A.securisee. Cela indique que, lorsque la population totale augmente, la proportion de la population sans accès à des installations d’assainissement sécurisées tend également à augmenter. - Une corrélation positive élevée a également été observée entre Population et Pop.sans.A.amelioree. Ce résultat suggère qu’une augmentation de la population totale est associée à une augmentation de la proportion de la population sans accès à des installations d’assainissement améliorées. - De plus, une corrélation positive élevée existe entre A.limitee et A.non.amelioree. Cela signifie que lorsque l’accès limité aux installations d’assainissement augmente, l’accès non amélioré augmente également. 2. Corrélations Négatives Élevées : - Une corrélation négative élevée est observée entre A.securisee et Pop.sans.A.securisee. Ce résultat montre qu’une augmentation de l’accès sécurisé aux installations d’assainissement est associée à une diminution de la proportion de la population sans accès à ces installations. - Une corrélation négative élevée a également été constatée entre A.de.base et A.non.amelioree. Cela indique que l’amélioration de l’accès de base aux installations d’assainissement est liée à une réduction de l’accès non amélioré. Ces corrélations mettent en évidence les relations importantes entre les variables étudiées et nous permettent de mieux comprendre les dynamiques qui influencent l’accès aux installations d’assainissement.###

#Visualisation graphique de la corrélation

pairs(data[,1:15])

#Plot corrélation

plot_correlation(data)

#PCA BI-PLOT

res.pca <- PCA(data)

fviz_pca_biplot(res.pca,col.ind = "red",col.var = "blue",repel = TRUE)

##Le biplot en composantes principales (ACP) montre à la fois les variables et les individus dans le même graphique. Les flèches représentent les variables, indiquant leur importance et leurs relations (positives ou négatives) entre elles. Les points représentent les individus, montrant comment ils se positionnent par rapport aux variables. Cela permet de visualiser les corrélations, d’identifier des tendances et de mieux comprendre les contributions des variables aux composantes principales.

Analyse des composantes principales (ACP) en réduisant nos données dans le plan

Réalisons l’ACP avec notre jeu de données avec le package FactoMineR

resultats2=PCA(X=data, scale.unit = TRUE, ncp = 2, ind.sup = NULL,quanti.sup = NULL , quali.sup = NULL, row.w = NULL, col.w = NULL, graph = TRUE, axes = c(1,2))

## Présentation des Valeurs propres

pander(get_eigenvalue(resultats2))
  eigenvalue variance.percent cumulative.variance.percent
Dim.1 5.682 37.88 37.88
Dim.2 4.726 31.51 69.39
Dim.3 2.624 17.49 86.88
Dim.4 0.9917 6.611 93.49
Dim.5 0.7639 5.093 98.58
Dim.6 0.2125 1.416 100
fviz_eig(resultats2)

##Au regard des resultats obtenus, nous prendrons les deux premières dimensions(Dim.1 et Dim.2) car la somme de leur valeur propre est supérieure à 1. L’ensemble de ces deux dimensions concentrent environ 69,39% de l’information contenue dans notre jeu de données.

Analyse des resultats pour les variables

Coordonnées des variables dans le plan factoriel

pander(resultats2$var$coord[,1:2])
  Dim.1 Dim.2
Population 0.8382 0.3717
A..securisee 0.6724 -0.2512
A..de.base 0.632 -0.6699
A..limitee 0.07576 0.76
A..non.amelioree -0.1816 -0.3304
DAL -0.5397 0.5309
Pop.sans.A..securisee 0.8043 0.4283
Pop.sans.A..amelioree -0.9148 0.3815
A..amelioree 0.9148 -0.3815
M.A..insalubre 0.3755 0.734
M.eau.insalubre 0.3154 0.7748
manque.LM 0.4175 0.7632
Cholera 0.6803 0.5052
Polio 0.2123 -0.7552
children.stunt -0.7443 0.2939
fviz_pca_var(resultats2)

Cosinus carré des variables

pander(resultats2$var$cos2[,1:2])
  Dim.1 Dim.2
Population 0.7026 0.1381
A..securisee 0.4522 0.0631
A..de.base 0.3994 0.4487
A..limitee 0.00574 0.5775
A..non.amelioree 0.03297 0.1091
DAL 0.2913 0.2818
Pop.sans.A..securisee 0.647 0.1835
Pop.sans.A..amelioree 0.8369 0.1456
A..amelioree 0.8369 0.1456
M.A..insalubre 0.141 0.5388
M.eau.insalubre 0.09945 0.6003
manque.LM 0.1743 0.5825
Cholera 0.4629 0.2552
Polio 0.04505 0.5703
children.stunt 0.554 0.0864
fviz_pca_var(resultats2, col.var = "cos2", gradient.cols = c("#00AFBB","#E7B800","#FC4E07"), repel = TRUE)

### Interprétation du Graphe de Corrélation

Ce graphe de corrélation indique la qualité de la représentation de chaque variable sur les composantes principales, allant de 0 à 1, où une valeur plus élevée indique une meilleure représentation.

  • Variables bien représentées : Les variables A.securisee, A.de.base, et A.amelioree sont bien représentées sur la première dimension (Dim 1). Leur forte contribution suggère qu’elles capturent des aspects importants de l’assainissement sécurisé. Les variables Pop.sans.A.securisee et Pop.sans.A.amelioree sont également bien représentées sur Dim 1, indiquant un lien inverse fort avec les mesures d’assainissement sécurisé et amélioré.

  • Variables modérément représentées : La variable Population est modérément représentée, ce qui suggère qu’elle contribue à la fois à la première (Dim 1) et à la deuxième dimension (Dim2), mais avec moins d’impact que les variables d’assainissement.

  • Variables faiblement représentées : Les variables A.non.amelioree et A.limitee sont faiblement représentées, ce qui signifie qu’elles n’ont pas une forte influence sur les deux premières composantes principales.

Qualité de représentation des variables sur les deux axes

fviz_cos2(resultats2,choice = "var", axes = c(1,2), top = 11)

### Contribution des variables

pander(resultats2$var$contrib[,1:2])
  Dim.1 Dim.2
Population 12.37 2.923
A..securisee 7.959 1.335
A..de.base 7.03 9.494
A..limitee 0.101 12.22
A..non.amelioree 0.5802 2.309
DAL 5.127 5.962
Pop.sans.A..securisee 11.39 3.882
Pop.sans.A..amelioree 14.73 3.079
A..amelioree 14.73 3.079
M.A..insalubre 2.482 11.4
M.eau.insalubre 1.75 12.7
manque.LM 3.068 12.32
Cholera 8.147 5.399
Polio 0.793 12.07
children.stunt 9.75 1.828
fviz_pca_var(resultats2, col.var = "contrib", gradient.cols = c("#00AFBB","#E7B800","#FC4E07"), repel = TRUE)

#Sur l'axe 1 (Dim1)
fviz_contrib(resultats2, choice = "var", axes = 1, top = 11)

#Sur l'axe 1 (Dim2)
fviz_contrib(resultats2, choice = "var", axes = 2, top = 11)

#Sur les deux axes (Dim1 & Dim2)
fviz_contrib(resultats2, choice = "var", axes = 1:2, top = 11)

### Interprétation du Graphe de Corrélation de Contribution Ce graphe de corrélation de contribution aide à visualiser les relations entre les différentes variables et à comprendre comment elles se regroupent. Les variables en rouge contribuent le plus aux composantes principales (Dim 1 et Dim 2), indiquant qu’elles ont une forte influence sur l’ACP, tandis que les variables en bleu ont une contribution plus faible. - Observations Clés : - Les variables A.amelioree, A.de.base, et A.securisee sont fortement corrélées entre elles et avec Dim 1, ce qui suggère qu’elles mesurent des aspects similaires de l’assainissement amélioré. - Population et Pop.sans.A.securisee montrent une forte corrélation positive entre elles et également par rapport à Dim 1, indiquant que plus la population est élevée, plus il y a de personnes sans accès à un assainissement sécurisé dans notre zone d’étude. - Les variables Cholera, Pop.sans.A.amelioree, et Children.stunt sont corrélées et contribuent à Dim 1, ce qui montre qu’elles partagent une relation commune avec les problèmes de santé publique. - Oppositions entre Variables : - Les variables A.securisee et A.de.base sont en opposition avec Pop.sans.A.securisee, soulignant une relation inverse entre l’accès sécurisé à l’assainissement et le manque d’assainissement sécurisé. - DAL, Cholera, et Children.stunt s’opposent aux variables liées à l’assainissement amélioré (A.amelioree, A.de.base, et A.securisee), ce qui rend compte de mauvaises conditions de santé.###

Analyse des resultats pour les individus

Coordonnées des individus dans le plan factoriel

pander(resultats2$ind$coord[,1:2])
  Dim.1 Dim.2
Benin -3.051 0.6382
Burkina Faso 1.291 3.514
Cote dIvoire 2.517 1.237
Guinee Bissau -2.486 -1.154
Mali 2.177 0.06968
Senegal 2.169 -4.177
Togo -2.616 -0.1275
fviz_pca_ind(resultats2)

### Cosinus carré des individus

pander(resultats2$ind$cos2[,1:2])
  Dim.1 Dim.2
Benin 0.6606 0.02891
Burkina Faso 0.09781 0.7246
Cote dIvoire 0.5462 0.132
Guinee Bissau 0.3548 0.07653
Mali 0.5069 0.0005195
Senegal 0.1922 0.7132
Togo 0.6193 0.001471
fviz_pca_ind(resultats2, col.ind  = "cos2", gradient.cols = c("#00AFBB","#E7B800","#FC4E07"), repel = TRUE)

### Interprétation des Pays dans l’ACP

Les pays bien représentés sont ceux dont les valeurs de cos2 sont élevées. Cela signifie que leurs caractéristiques sont bien capturées par l’Analyse en Composantes Principales (ACP). Par exemple, le Burkina Faso et le Sénégal possèdent des valeurs de cos2 élevées, indiquant que leurs profils en matière de santé publique et d’assainissement sont distincts et bien représentés dans les résultats de l’ACP.

En revanche, les pays moins bien représentés ont des valeurs de cos2 plus faibles. Parmi eux, on trouve le Mali et la Guinée-Bissau, dont les spécificités ne sont pas pleinement capturées par les deux premières dimensions de l’ACP. Cela suggère la nécessité d’une analyse plus approfondie pour mieux comprendre leurs caractéristiques distinctives.

Contribution des individus

pander(resultats2$ind$contrib[,1:2])
  Dim.1 Dim.2
Benin 23.4 1.231
Burkina Faso 4.19 37.32
Cote dIvoire 15.93 4.626
Guinee Bissau 15.54 4.028
Mali 11.91 0.01467
Senegal 11.82 52.73
Togo 17.21 0.04915
fviz_pca_ind(resultats2, col.ind  = "contrib", gradient.cols = c("#00AFBB","#E7B800","#FC4E07"), repel = TRUE)

#Sur l'axe 1 (Dim1)
fviz_contrib(resultats2, choice = "ind", axes = 1, top = 5)

#Sur l'axe 1 (Dim2)
fviz_contrib(resultats2, choice = "ind", axes = 2, top = 5)

#Sur les deux axes (Dim1 & Dim2)
fviz_contrib(resultats2, choice = "ind", axes = 1:2, top = 5)

### Contribution des Pays dans l’ACP

Les pays avec une contribution élevée aux composantes principales de l’Analyse en Composantes Principales (ACP) sont bien représentés sur les dimensions principales. Par exemple, le Burkina Faso et le Sénégal montrent une contribution significative, indiquant que leurs caractéristiques distinctes en matière d’assainissement et de santé publique sont capturées de manière efficace par l’ACP. Cela signifie que ces pays influencent fortement la formation des dimensions principales, reflétant leurs particularités dans les données analysées.

En revanche, les pays avec une contribution plus faible, tels que le Bénin, la Guinée-Bissau et le Mali, ont une influence moindre sur les dimensions principales de l’ACP. Cela suggère que leurs caractéristiques spécifiques ne sont pas aussi bien capturées par les axes principaux. Par conséquent, ces pays pourraient nécessiter une analyse plus approfondie pour mieux comprendre leurs spécificités et l’impact des variables d’assainissement et de santé publique sur eux.

CLASSIFICATION

Classification avec CAH

res.cah <- HCPC(resultats2, nb.clust = 3, consol=FALSE,graph=FALSE) # L'arbre est coupé automatiquement 

Arbre hiérarchique

plot.HCPC(res.cah,choice='tree',title='Hierarchical tree')

### Interprétation du Dendrogramme

Le dendrogramme ci-dessus nous montre que trois principales classes sont créées suite à la classification réalisée sur les individus :

  • Classe 1 : Cette classe comprend la Guinée-Bissau, le Bénin et le Togo.
  • Classe 2 : Cette classe est constituée uniquement du Sénégal.
  • Classe 3 : Cette classe regroupe le Burkina Faso, le Mali et la Côte d’Ivoire.

Plan factoriel

plot.HCPC(res.cah,choice='map',draw.tree=FALSE,title='Factor map')

### Caractéristiques des Classes

  • Classe 1 :
    • Composée d’individus tels que le Bénin, la Guinée-Bissau et le Togo.
    • Caractérisée par de fortes valeurs pour la variable Pop.sans.A.améliorée et de faibles valeurs pour les variables A.amelioree, Population, et Pop.sans.A.securisee (de la plus extrême à la moins extrême).
  • Classe 2 :
    • Composée d’individus tels que le Burkina Faso et la Côte d’Ivoire.
    • Caractérisée par de fortes valeurs pour les variables Cholera, Population, manque LM, et Pop.sans.A.securisee (de la plus extrême à la moins extrême).
  • Classe 3 :
    • Composée d’individus tels que le Sénégal.
    • Caractérisée par de fortes valeurs pour les variables Polio et A.de.base (de la plus extrême à la moins extrême).

Arbre hiérarchique sur le plan 3D

plot.HCPC(res.cah,choice='3D.map',ind.names=TRUE,centers.plot=FALSE,angle=60,title='Hierarchical tree on the factor map')

pander(res.cah$desc.ind)
## Warning in pander.default(x[[i]], indent = 1): No pander.method for "by",
## reverting to default.
## Warning in pander.default(x[[i]], indent = 1): No pander.method for "by",
## reverting to default.
  • para:

    • 1:

      Togo Benin Guinee Bissau
      0.1336 0.9155 0.968
    • 2:

      Cote dIvoire Mali Burkina Faso
      0.6397 1.548 2.033
    • 3:

      Senegal
      0
  • dist:

    • 1:

      Guinee Bissau Benin Togo
      5.263 5.138 4.926
    • 2:

      Burkina Faso Cote dIvoire Mali
      5.474 5.425 4.247
    • 3:

      Senegal
      5.786

RÉGRESSION LINÉAIRE MULTIPLE

Calcul des coefficients de régressions

reg <- lm(Polio~A..securisee+A..de.base+A..amelioree+Pop.sans.A..amelioree+Pop.sans.A..securisee, data=data)
pander(summary(reg))
  Estimate Std. Error t value Pr(>|t|)
(Intercept) -15.21 28.56 -0.5326 0.6476
A..securisee -0.8336 1.191 -0.7001 0.5563
A..de.base 0.2916 0.7862 0.3709 0.7463
A..amelioree 0.6423 1.08 0.5946 0.6124
Pop.sans.A..securisee -8.139e-07 8.013e-07 -1.016 0.4166
Fitting linear model: Polio ~ A..securisee + A..de.base + A..amelioree + Pop.sans.A..amelioree + Pop.sans.A..securisee ### Graphiques de la régression
Observations Residual Std. Error \(R^2\) Adjusted \(R^2\)
7 9.403 0.703 0.109
plot(reg)

### Prédiction de Polio pour les avec les coefficients obtenu

pander(predict(reg))
Benin Burkina Faso Cote dIvoire Guinee Bissau Mali Senegal Togo
2.329 1.084 -1.815 3.28 8.595 23.47 7.055

Interprétation

  • A..securisee vs Polio :
    • Description : Relation entre “A..securisee” et “Polio”.
    • Interprétation : Faible pente, indiquant que l’augmentation de “A..securisee” n’a pas d’impact significatif sur la diminution des cas de polio. D’autres facteurs non inclus dans ce modèle pourraient être plus influents.
  • A..de.base vs Polio :
    • Description : Relation entre “A..de.base” et les cas de polio.
    • Interprétation : Ligne ascendante, suggérant une corrélation positive. L’amélioration des installations de base est associée à une légère augmentation des cas de polio, nécessitant une investigation plus approfondie.
  • A..amelioree vs Polio :
    • Description : Relation entre “A..amelioree” et les cas de polio.
    • Interprétation : Ligne légèrement ascendante, indiquant une faible corrélation positive. Des facteurs confondants, tels que des variations régionales, pourraient influencer cette relation.
  • Pop.sans.A..amelioree vs Polio :
    • Description : Relation entre “Pop.sans.A..amelioree” et les cas de polio.
    • Interprétation : Ligne descendante, suggérant une corrélation négative. Une plus grande proportion de la population sans accès à des installations améliorées est associée à moins de cas de polio, nécessitant des analyses plus détaillées.
  • Pop.sans.A..securisee vs Polio :
    • Description : Relation entre “Pop.sans.A..securisee” et les cas de polio.
    • Interprétation : Ligne légèrement descendante, indiquant une faible corrélation négative. Cela pourrait être attribué à d’autres facteurs, comme l’immunité collective ou les efforts de vaccination ciblés.

R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.