Afin de réaliser cette classification nous devons prendre nos données qui sont sur PostGreSQL pour cela on utilise les deux packages suivants:

library(DBI)
library(RPostgres)

En utilisant le script suivant on peut récupérer nos données grâce à la connexion établie.

m=RPostgres::Postgres()
c=dbConnect(m,dbname="stid1908")
lieux<-dbGetQuery(c,'SELECT * FROM lieux_2014')
caracteristiques<-dbGetQuery(c,'SELECT * FROM caracteristiques_2014')
usagers<-dbGetQuery(c,'SELECT * FROM usagers_2014')
vehicules<-dbGetQuery(c,'SELECT * FROM vehicules_2014')

On rectifie premièrement quelques variables.

#Ajout de l'âge
age=2014-usagers$an_nais
usagers=cbind(usagers,age)

#Commande pour changer la variable heure de la base de données en données exploitables
heure=as.numeric(substr(caracteristiques$hrmn,0,nchar(caracteristiques$hrmn)-2))
caracteristiques=cbind(caracteristiques,heure)

Puis, on fusionne nos différentes bases de données en une seule afin de nous simplifier le travail. Pour cela on utilise la fonction merge(fusion de tables en supprimant les colonnes en double et en regroupant selon la colonne Num_Acc (clé primaire) ~ “jointures Rstudio” )

Acc=merge(x=lieux,y = usagers, by= "Num_Acc" )
Acc=merge(Acc,caracteristiques, by="Num_Acc")
Acc=merge(Acc,vehicules, by="Num_Acc")

Encore une fois, on se propose de faire une modification sur la variable grav(gravité de l’accident) afin de la transformer en tant qu’échelle de gravité. (avec 0 qui correspond à la catégorie “Indemne”,1 à “Blessure lègéres”,2 à “Blessure grave” et 3 à “Tué”.)

#Echelle de gravité 
Acc$grav[Acc$grav==1]<-6
Acc$grav[Acc$grav==2]<-12
Acc$grav[Acc$grav==3]<-18
Acc$grav[Acc$grav==4]<-24

Acc$grav[Acc$grav==6]<-0
Acc$grav[Acc$grav==12]<-3
Acc$grav[Acc$grav==18]<-2
Acc$grav[Acc$grav==24]<-1

Etant donné que notre jeu de données est très lourd, on se propose de prendre seulement 100 observations afin de ne pas avoir une classif trop importante. De même, on établi un choix de variables afin d’en tirer un meilleur profil final.

dim(Acc)
## [1] 248632     54

Choix des différentes variables :

Acc=Acc[1:100,c(1,2,19,21,22,24,30,32,38)]
Acc
##          Num_Acc catr place grav sexe secu age mois atm
## 1   201400000001    3     1    2    1   21  43    5   1
## 2   201400000001    3     1    2    1   21  43    5   1
## 3   201400000001    3     1    0    1   11  22    5   1
## 4   201400000001    3     1    0    1   11  22    5   1
## 5   201400000002    3     2    2    1   11  24    5   1
## 6   201400000002    3     1    1    1   11  31    5   1
## 7   201400000003    3     1    2    1   21  40    8   1
## 8   201400000003    3     1    2    1   21  40    8   1
## 9   201400000003    3     1    0    2   11  44    8   1
## 10  201400000003    3     1    0    2   11  44    8   1
## 11  201400000004    3     1    2    1   11  43    6   1
## 12  201400000004    3     1    2    1   11  43    6   1
## 13  201400000004    3     1    0    1   11  56    6   1
## 14  201400000004    3     1    0    1   11  56    6   1
## 15  201400000005    3     1    0    1   11  19    6   1
## 16  201400000005    3     1    0    1   11  19    6   1
## 17  201400000005    3     1    1    1   11  47    6   1
## 18  201400000005    3     1    1    1   11  47    6   1
## 19  201400000006    2     1    1    1   11  30   10   2
## 20  201400000006    2     1    1    1   11  30   10   2
## 21  201400000006    2     1    0    1   11  41   10   2
## 22  201400000006    2     1    0    1   11  41   10   2
## 23  201400000007    4     1    2    1   21  43   10   1
## 24  201400000008    3     1    2    2   11  69   10   1
## 25  201400000009    3     1    0    1   11  63   11   1
## 26  201400000009    3     1    0    1   11  63   11   1
## 27  201400000009    3     1    3    1   21  75   11   1
## 28  201400000009    3     1    3    1   21  75   11   1
## 29  201400000010    4     2    0    2   11  16   11   8
## 30  201400000010    4     3    0    1   11  44   11   8
## 31  201400000010    4     1    0    1   11  19   11   8
## 32  201400000010    4     4    2    1   11  45   11   8
## 33  201400000011    3     1    2    1   11  25    5   1
## 34  201400000011    3     1    2    1   11  25    5   1
## 35  201400000011    3     1    0    1   11  42    5   1
## 36  201400000011    3     1    0    1   11  42    5   1
## 37  201400000012    3     1    0    2   11  42    6   1
## 38  201400000012    3     1    0    2   11  42    6   1
## 39  201400000012    3     1    2    1   21  61    6   1
## 40  201400000012    3     1    2    1   21  61    6   1
## 41  201400000013    3     1    1    1   11  28   11   1
## 42  201400000014    3     1    0    1   11  63   12   8
## 43  201400000014    3     1    0    1   11  63   12   8
## 44  201400000014    3     1    2    1   21  26   12   8
## 45  201400000014    3     1    2    1   21  26   12   8
## 46  201400000015    3     1    0    1   11  36   12   2
## 47  201400000015    3     1    0    1   11  36   12   2
## 48  201400000015    3     1    0    1   11  36   12   2
## 49  201400000015    3     1    0    1   11  38   12   2
## 50  201400000015    3     1    0    1   11  38   12   2
## 51  201400000015    3     1    0    1   11  38   12   2
## 52  201400000015    3     1    2    1   11  40   12   2
## 53  201400000015    3     1    2    1   11  40   12   2
## 54  201400000015    3     1    2    1   11  40   12   2
## 55  201400000016    3     1    2    1   11  24    1   9
## 56  201400000017    3     1    0    1   11  33    1   2
## 57  201400000017    3     1    0    1   11  33    1   2
## 58  201400000017    3     3    2    2   11  31    1   2
## 59  201400000017    3     3    2    2   11  31    1   2
## 60  201400000017    3     1    0    1   11  25    1   2
## 61  201400000017    3     1    0    1   11  25    1   2
## 62  201400000018    3     1    2    1   21  55    2   7
## 63  201400000018    3     1    2    1   21  55    2   7
## 64  201400000018    3     1    0    1   11  54    2   7
## 65  201400000018    3     1    0    1   11  54    2   7
## 66  201400000019    4     1    2    1   22  17    3   1
## 67  201400000019    4     1    2    1   22  17    3   1
## 68  201400000019    4     1    0    2   11  50    3   1
## 69  201400000019    4     1    0    2   11  50    3   1
## 70  201400000020    3     1    2    1    1  65    4   1
## 71  201400000021    3     1    0    1    1  45    7   1
## 72  201400000021    3     1    0    1    1  45    7   1
## 73  201400000021    3     1    2    1   21  42    7   1
## 74  201400000021    3     1    2    1   21  42    7   1
## 75  201400000022    3     1    0    2   11  27    7   1
## 76  201400000022    3     1    0    2   11  27    7   1
## 77  201400000022    3     1    2    1   21  35    7   1
## 78  201400000022    3     1    2    1   21  35    7   1
## 79  201400000023    3     1    0    1   11  31    1   1
## 80  201400000023    3     1    0    1   11  31    1   1
## 81  201400000023    3     2    2    2   11  24    1   1
## 82  201400000023    3     2    2    2   11  24    1   1
## 83  201400000023    3     1    0    1   11  78    1   1
## 84  201400000023    3     1    0    1   11  78    1   1
## 85  201400000023    3     2    3    2    1   0    1   1
## 86  201400000023    3     2    3    2    1   0    1   1
## 87  201400000024    3     1    2    1   11  59    3   1
## 88  201400000024    3     1    2    1   11  59    3   1
## 89  201400000024    3     1    1    1   11  19    3   1
## 90  201400000024    3     1    1    1   11  19    3   1
## 91  201400000025    3     1    0    1   13  52    6   1
## 92  201400000025    3     1    0    1   13  52    6   1
## 93  201400000025    3     1    2    1   13  20    6   1
## 94  201400000025    3     1    2    1   13  20    6   1
## 95  201400000026    3     1    2    1   21  48    6   1
## 96  201400000026    3     1    2    1   21  48    6   1
## 97  201400000026    3     1    0    1   11  36    6   1
## 98  201400000026    3     1    0    1   11  36    6   1
## 99  201400000027    3     1    2    1   21  22    6   1
## 100 201400000028    3     2    3    1   11  81    9   1

Cependant, on fait maintenant face à un problème concernant le type des variables, sur nos 8 variables(sans compter Num_Acc) seulement 1 seule est une variable quantitative,l’âge de la victime, on utilise alors le package ade4 afin de transformer nos variables qualitatives en variables quantitatives.

### Mise en disjonctif (... "disjonction")
library(ade4) # charge le package contenant la mise en 'disjonctif'
indices=c(2:6,8:9) # les indices des colonnes-variables qualitatives, étant donné que seulement age est une variable quantitative on 
#choisie donc toutes les autres variables.
X=data.frame(Acc[,-indices],acm.disjonctif(Acc[,indices]))
X
##          Num_Acc age catr.2 catr.3 catr.4 place.1 place.2 place.3 place.4
## 1   201400000001  43      0      1      0       1       0       0       0
## 2   201400000001  43      0      1      0       1       0       0       0
## 3   201400000001  22      0      1      0       1       0       0       0
## 4   201400000001  22      0      1      0       1       0       0       0
## 5   201400000002  24      0      1      0       0       1       0       0
## 6   201400000002  31      0      1      0       1       0       0       0
## 7   201400000003  40      0      1      0       1       0       0       0
## 8   201400000003  40      0      1      0       1       0       0       0
## 9   201400000003  44      0      1      0       1       0       0       0
## 10  201400000003  44      0      1      0       1       0       0       0
## 11  201400000004  43      0      1      0       1       0       0       0
## 12  201400000004  43      0      1      0       1       0       0       0
## 13  201400000004  56      0      1      0       1       0       0       0
## 14  201400000004  56      0      1      0       1       0       0       0
## 15  201400000005  19      0      1      0       1       0       0       0
## 16  201400000005  19      0      1      0       1       0       0       0
## 17  201400000005  47      0      1      0       1       0       0       0
## 18  201400000005  47      0      1      0       1       0       0       0
## 19  201400000006  30      1      0      0       1       0       0       0
## 20  201400000006  30      1      0      0       1       0       0       0
## 21  201400000006  41      1      0      0       1       0       0       0
## 22  201400000006  41      1      0      0       1       0       0       0
## 23  201400000007  43      0      0      1       1       0       0       0
## 24  201400000008  69      0      1      0       1       0       0       0
## 25  201400000009  63      0      1      0       1       0       0       0
## 26  201400000009  63      0      1      0       1       0       0       0
## 27  201400000009  75      0      1      0       1       0       0       0
## 28  201400000009  75      0      1      0       1       0       0       0
## 29  201400000010  16      0      0      1       0       1       0       0
## 30  201400000010  44      0      0      1       0       0       1       0
## 31  201400000010  19      0      0      1       1       0       0       0
## 32  201400000010  45      0      0      1       0       0       0       1
## 33  201400000011  25      0      1      0       1       0       0       0
## 34  201400000011  25      0      1      0       1       0       0       0
## 35  201400000011  42      0      1      0       1       0       0       0
## 36  201400000011  42      0      1      0       1       0       0       0
## 37  201400000012  42      0      1      0       1       0       0       0
## 38  201400000012  42      0      1      0       1       0       0       0
## 39  201400000012  61      0      1      0       1       0       0       0
## 40  201400000012  61      0      1      0       1       0       0       0
## 41  201400000013  28      0      1      0       1       0       0       0
## 42  201400000014  63      0      1      0       1       0       0       0
## 43  201400000014  63      0      1      0       1       0       0       0
## 44  201400000014  26      0      1      0       1       0       0       0
## 45  201400000014  26      0      1      0       1       0       0       0
## 46  201400000015  36      0      1      0       1       0       0       0
## 47  201400000015  36      0      1      0       1       0       0       0
## 48  201400000015  36      0      1      0       1       0       0       0
## 49  201400000015  38      0      1      0       1       0       0       0
## 50  201400000015  38      0      1      0       1       0       0       0
## 51  201400000015  38      0      1      0       1       0       0       0
## 52  201400000015  40      0      1      0       1       0       0       0
## 53  201400000015  40      0      1      0       1       0       0       0
## 54  201400000015  40      0      1      0       1       0       0       0
## 55  201400000016  24      0      1      0       1       0       0       0
## 56  201400000017  33      0      1      0       1       0       0       0
## 57  201400000017  33      0      1      0       1       0       0       0
## 58  201400000017  31      0      1      0       0       0       1       0
## 59  201400000017  31      0      1      0       0       0       1       0
## 60  201400000017  25      0      1      0       1       0       0       0
## 61  201400000017  25      0      1      0       1       0       0       0
## 62  201400000018  55      0      1      0       1       0       0       0
## 63  201400000018  55      0      1      0       1       0       0       0
## 64  201400000018  54      0      1      0       1       0       0       0
## 65  201400000018  54      0      1      0       1       0       0       0
## 66  201400000019  17      0      0      1       1       0       0       0
## 67  201400000019  17      0      0      1       1       0       0       0
## 68  201400000019  50      0      0      1       1       0       0       0
## 69  201400000019  50      0      0      1       1       0       0       0
## 70  201400000020  65      0      1      0       1       0       0       0
## 71  201400000021  45      0      1      0       1       0       0       0
## 72  201400000021  45      0      1      0       1       0       0       0
## 73  201400000021  42      0      1      0       1       0       0       0
## 74  201400000021  42      0      1      0       1       0       0       0
## 75  201400000022  27      0      1      0       1       0       0       0
## 76  201400000022  27      0      1      0       1       0       0       0
## 77  201400000022  35      0      1      0       1       0       0       0
## 78  201400000022  35      0      1      0       1       0       0       0
## 79  201400000023  31      0      1      0       1       0       0       0
## 80  201400000023  31      0      1      0       1       0       0       0
## 81  201400000023  24      0      1      0       0       1       0       0
## 82  201400000023  24      0      1      0       0       1       0       0
## 83  201400000023  78      0      1      0       1       0       0       0
## 84  201400000023  78      0      1      0       1       0       0       0
## 85  201400000023   0      0      1      0       0       1       0       0
## 86  201400000023   0      0      1      0       0       1       0       0
## 87  201400000024  59      0      1      0       1       0       0       0
## 88  201400000024  59      0      1      0       1       0       0       0
## 89  201400000024  19      0      1      0       1       0       0       0
## 90  201400000024  19      0      1      0       1       0       0       0
## 91  201400000025  52      0      1      0       1       0       0       0
## 92  201400000025  52      0      1      0       1       0       0       0
## 93  201400000025  20      0      1      0       1       0       0       0
## 94  201400000025  20      0      1      0       1       0       0       0
## 95  201400000026  48      0      1      0       1       0       0       0
## 96  201400000026  48      0      1      0       1       0       0       0
## 97  201400000026  36      0      1      0       1       0       0       0
## 98  201400000026  36      0      1      0       1       0       0       0
## 99  201400000027  22      0      1      0       1       0       0       0
## 100 201400000028  81      0      1      0       0       1       0       0
##     grav.0 grav.1 grav.2 grav.3 sexe.1 sexe.2 secu.1 secu.11 secu.13 secu.21
## 1        0      0      1      0      1      0      0       0       0       1
## 2        0      0      1      0      1      0      0       0       0       1
## 3        1      0      0      0      1      0      0       1       0       0
## 4        1      0      0      0      1      0      0       1       0       0
## 5        0      0      1      0      1      0      0       1       0       0
## 6        0      1      0      0      1      0      0       1       0       0
## 7        0      0      1      0      1      0      0       0       0       1
## 8        0      0      1      0      1      0      0       0       0       1
## 9        1      0      0      0      0      1      0       1       0       0
## 10       1      0      0      0      0      1      0       1       0       0
## 11       0      0      1      0      1      0      0       1       0       0
## 12       0      0      1      0      1      0      0       1       0       0
## 13       1      0      0      0      1      0      0       1       0       0
## 14       1      0      0      0      1      0      0       1       0       0
## 15       1      0      0      0      1      0      0       1       0       0
## 16       1      0      0      0      1      0      0       1       0       0
## 17       0      1      0      0      1      0      0       1       0       0
## 18       0      1      0      0      1      0      0       1       0       0
## 19       0      1      0      0      1      0      0       1       0       0
## 20       0      1      0      0      1      0      0       1       0       0
## 21       1      0      0      0      1      0      0       1       0       0
## 22       1      0      0      0      1      0      0       1       0       0
## 23       0      0      1      0      1      0      0       0       0       1
## 24       0      0      1      0      0      1      0       1       0       0
## 25       1      0      0      0      1      0      0       1       0       0
## 26       1      0      0      0      1      0      0       1       0       0
## 27       0      0      0      1      1      0      0       0       0       1
## 28       0      0      0      1      1      0      0       0       0       1
## 29       1      0      0      0      0      1      0       1       0       0
## 30       1      0      0      0      1      0      0       1       0       0
## 31       1      0      0      0      1      0      0       1       0       0
## 32       0      0      1      0      1      0      0       1       0       0
## 33       0      0      1      0      1      0      0       1       0       0
## 34       0      0      1      0      1      0      0       1       0       0
## 35       1      0      0      0      1      0      0       1       0       0
## 36       1      0      0      0      1      0      0       1       0       0
## 37       1      0      0      0      0      1      0       1       0       0
## 38       1      0      0      0      0      1      0       1       0       0
## 39       0      0      1      0      1      0      0       0       0       1
## 40       0      0      1      0      1      0      0       0       0       1
## 41       0      1      0      0      1      0      0       1       0       0
## 42       1      0      0      0      1      0      0       1       0       0
## 43       1      0      0      0      1      0      0       1       0       0
## 44       0      0      1      0      1      0      0       0       0       1
## 45       0      0      1      0      1      0      0       0       0       1
## 46       1      0      0      0      1      0      0       1       0       0
## 47       1      0      0      0      1      0      0       1       0       0
## 48       1      0      0      0      1      0      0       1       0       0
## 49       1      0      0      0      1      0      0       1       0       0
## 50       1      0      0      0      1      0      0       1       0       0
## 51       1      0      0      0      1      0      0       1       0       0
## 52       0      0      1      0      1      0      0       1       0       0
## 53       0      0      1      0      1      0      0       1       0       0
## 54       0      0      1      0      1      0      0       1       0       0
## 55       0      0      1      0      1      0      0       1       0       0
## 56       1      0      0      0      1      0      0       1       0       0
## 57       1      0      0      0      1      0      0       1       0       0
## 58       0      0      1      0      0      1      0       1       0       0
## 59       0      0      1      0      0      1      0       1       0       0
## 60       1      0      0      0      1      0      0       1       0       0
## 61       1      0      0      0      1      0      0       1       0       0
## 62       0      0      1      0      1      0      0       0       0       1
## 63       0      0      1      0      1      0      0       0       0       1
## 64       1      0      0      0      1      0      0       1       0       0
## 65       1      0      0      0      1      0      0       1       0       0
## 66       0      0      1      0      1      0      0       0       0       0
## 67       0      0      1      0      1      0      0       0       0       0
## 68       1      0      0      0      0      1      0       1       0       0
## 69       1      0      0      0      0      1      0       1       0       0
## 70       0      0      1      0      1      0      1       0       0       0
## 71       1      0      0      0      1      0      1       0       0       0
## 72       1      0      0      0      1      0      1       0       0       0
## 73       0      0      1      0      1      0      0       0       0       1
## 74       0      0      1      0      1      0      0       0       0       1
## 75       1      0      0      0      0      1      0       1       0       0
## 76       1      0      0      0      0      1      0       1       0       0
## 77       0      0      1      0      1      0      0       0       0       1
## 78       0      0      1      0      1      0      0       0       0       1
## 79       1      0      0      0      1      0      0       1       0       0
## 80       1      0      0      0      1      0      0       1       0       0
## 81       0      0      1      0      0      1      0       1       0       0
## 82       0      0      1      0      0      1      0       1       0       0
## 83       1      0      0      0      1      0      0       1       0       0
## 84       1      0      0      0      1      0      0       1       0       0
## 85       0      0      0      1      0      1      1       0       0       0
## 86       0      0      0      1      0      1      1       0       0       0
## 87       0      0      1      0      1      0      0       1       0       0
## 88       0      0      1      0      1      0      0       1       0       0
## 89       0      1      0      0      1      0      0       1       0       0
## 90       0      1      0      0      1      0      0       1       0       0
## 91       1      0      0      0      1      0      0       0       1       0
## 92       1      0      0      0      1      0      0       0       1       0
## 93       0      0      1      0      1      0      0       0       1       0
## 94       0      0      1      0      1      0      0       0       1       0
## 95       0      0      1      0      1      0      0       0       0       1
## 96       0      0      1      0      1      0      0       0       0       1
## 97       1      0      0      0      1      0      0       1       0       0
## 98       1      0      0      0      1      0      0       1       0       0
## 99       0      0      1      0      1      0      0       0       0       1
## 100      0      0      0      1      1      0      0       1       0       0
##     secu.22 mois.1 mois.2 mois.3 mois.4 mois.5 mois.6 mois.7 mois.8 mois.9
## 1         0      0      0      0      0      1      0      0      0      0
## 2         0      0      0      0      0      1      0      0      0      0
## 3         0      0      0      0      0      1      0      0      0      0
## 4         0      0      0      0      0      1      0      0      0      0
## 5         0      0      0      0      0      1      0      0      0      0
## 6         0      0      0      0      0      1      0      0      0      0
## 7         0      0      0      0      0      0      0      0      1      0
## 8         0      0      0      0      0      0      0      0      1      0
## 9         0      0      0      0      0      0      0      0      1      0
## 10        0      0      0      0      0      0      0      0      1      0
## 11        0      0      0      0      0      0      1      0      0      0
## 12        0      0      0      0      0      0      1      0      0      0
## 13        0      0      0      0      0      0      1      0      0      0
## 14        0      0      0      0      0      0      1      0      0      0
## 15        0      0      0      0      0      0      1      0      0      0
## 16        0      0      0      0      0      0      1      0      0      0
## 17        0      0      0      0      0      0      1      0      0      0
## 18        0      0      0      0      0      0      1      0      0      0
## 19        0      0      0      0      0      0      0      0      0      0
## 20        0      0      0      0      0      0      0      0      0      0
## 21        0      0      0      0      0      0      0      0      0      0
## 22        0      0      0      0      0      0      0      0      0      0
## 23        0      0      0      0      0      0      0      0      0      0
## 24        0      0      0      0      0      0      0      0      0      0
## 25        0      0      0      0      0      0      0      0      0      0
## 26        0      0      0      0      0      0      0      0      0      0
## 27        0      0      0      0      0      0      0      0      0      0
## 28        0      0      0      0      0      0      0      0      0      0
## 29        0      0      0      0      0      0      0      0      0      0
## 30        0      0      0      0      0      0      0      0      0      0
## 31        0      0      0      0      0      0      0      0      0      0
## 32        0      0      0      0      0      0      0      0      0      0
## 33        0      0      0      0      0      1      0      0      0      0
## 34        0      0      0      0      0      1      0      0      0      0
## 35        0      0      0      0      0      1      0      0      0      0
## 36        0      0      0      0      0      1      0      0      0      0
## 37        0      0      0      0      0      0      1      0      0      0
## 38        0      0      0      0      0      0      1      0      0      0
## 39        0      0      0      0      0      0      1      0      0      0
## 40        0      0      0      0      0      0      1      0      0      0
## 41        0      0      0      0      0      0      0      0      0      0
## 42        0      0      0      0      0      0      0      0      0      0
## 43        0      0      0      0      0      0      0      0      0      0
## 44        0      0      0      0      0      0      0      0      0      0
## 45        0      0      0      0      0      0      0      0      0      0
## 46        0      0      0      0      0      0      0      0      0      0
## 47        0      0      0      0      0      0      0      0      0      0
## 48        0      0      0      0      0      0      0      0      0      0
## 49        0      0      0      0      0      0      0      0      0      0
## 50        0      0      0      0      0      0      0      0      0      0
## 51        0      0      0      0      0      0      0      0      0      0
## 52        0      0      0      0      0      0      0      0      0      0
## 53        0      0      0      0      0      0      0      0      0      0
## 54        0      0      0      0      0      0      0      0      0      0
## 55        0      1      0      0      0      0      0      0      0      0
## 56        0      1      0      0      0      0      0      0      0      0
## 57        0      1      0      0      0      0      0      0      0      0
## 58        0      1      0      0      0      0      0      0      0      0
## 59        0      1      0      0      0      0      0      0      0      0
## 60        0      1      0      0      0      0      0      0      0      0
## 61        0      1      0      0      0      0      0      0      0      0
## 62        0      0      1      0      0      0      0      0      0      0
## 63        0      0      1      0      0      0      0      0      0      0
## 64        0      0      1      0      0      0      0      0      0      0
## 65        0      0      1      0      0      0      0      0      0      0
## 66        1      0      0      1      0      0      0      0      0      0
## 67        1      0      0      1      0      0      0      0      0      0
## 68        0      0      0      1      0      0      0      0      0      0
## 69        0      0      0      1      0      0      0      0      0      0
## 70        0      0      0      0      1      0      0      0      0      0
## 71        0      0      0      0      0      0      0      1      0      0
## 72        0      0      0      0      0      0      0      1      0      0
## 73        0      0      0      0      0      0      0      1      0      0
## 74        0      0      0      0      0      0      0      1      0      0
## 75        0      0      0      0      0      0      0      1      0      0
## 76        0      0      0      0      0      0      0      1      0      0
## 77        0      0      0      0      0      0      0      1      0      0
## 78        0      0      0      0      0      0      0      1      0      0
## 79        0      1      0      0      0      0      0      0      0      0
## 80        0      1      0      0      0      0      0      0      0      0
## 81        0      1      0      0      0      0      0      0      0      0
## 82        0      1      0      0      0      0      0      0      0      0
## 83        0      1      0      0      0      0      0      0      0      0
## 84        0      1      0      0      0      0      0      0      0      0
## 85        0      1      0      0      0      0      0      0      0      0
## 86        0      1      0      0      0      0      0      0      0      0
## 87        0      0      0      1      0      0      0      0      0      0
## 88        0      0      0      1      0      0      0      0      0      0
## 89        0      0      0      1      0      0      0      0      0      0
## 90        0      0      0      1      0      0      0      0      0      0
## 91        0      0      0      0      0      0      1      0      0      0
## 92        0      0      0      0      0      0      1      0      0      0
## 93        0      0      0      0      0      0      1      0      0      0
## 94        0      0      0      0      0      0      1      0      0      0
## 95        0      0      0      0      0      0      1      0      0      0
## 96        0      0      0      0      0      0      1      0      0      0
## 97        0      0      0      0      0      0      1      0      0      0
## 98        0      0      0      0      0      0      1      0      0      0
## 99        0      0      0      0      0      0      1      0      0      0
## 100       0      0      0      0      0      0      0      0      0      1
##     mois.10 mois.11 mois.12 atm.1 atm.2 atm.7 atm.8 atm.9
## 1         0       0       0     1     0     0     0     0
## 2         0       0       0     1     0     0     0     0
## 3         0       0       0     1     0     0     0     0
## 4         0       0       0     1     0     0     0     0
## 5         0       0       0     1     0     0     0     0
## 6         0       0       0     1     0     0     0     0
## 7         0       0       0     1     0     0     0     0
## 8         0       0       0     1     0     0     0     0
## 9         0       0       0     1     0     0     0     0
## 10        0       0       0     1     0     0     0     0
## 11        0       0       0     1     0     0     0     0
## 12        0       0       0     1     0     0     0     0
## 13        0       0       0     1     0     0     0     0
## 14        0       0       0     1     0     0     0     0
## 15        0       0       0     1     0     0     0     0
## 16        0       0       0     1     0     0     0     0
## 17        0       0       0     1     0     0     0     0
## 18        0       0       0     1     0     0     0     0
## 19        1       0       0     0     1     0     0     0
## 20        1       0       0     0     1     0     0     0
## 21        1       0       0     0     1     0     0     0
## 22        1       0       0     0     1     0     0     0
## 23        1       0       0     1     0     0     0     0
## 24        1       0       0     1     0     0     0     0
## 25        0       1       0     1     0     0     0     0
## 26        0       1       0     1     0     0     0     0
## 27        0       1       0     1     0     0     0     0
## 28        0       1       0     1     0     0     0     0
## 29        0       1       0     0     0     0     1     0
## 30        0       1       0     0     0     0     1     0
## 31        0       1       0     0     0     0     1     0
## 32        0       1       0     0     0     0     1     0
## 33        0       0       0     1     0     0     0     0
## 34        0       0       0     1     0     0     0     0
## 35        0       0       0     1     0     0     0     0
## 36        0       0       0     1     0     0     0     0
## 37        0       0       0     1     0     0     0     0
## 38        0       0       0     1     0     0     0     0
## 39        0       0       0     1     0     0     0     0
## 40        0       0       0     1     0     0     0     0
## 41        0       1       0     1     0     0     0     0
## 42        0       0       1     0     0     0     1     0
## 43        0       0       1     0     0     0     1     0
## 44        0       0       1     0     0     0     1     0
## 45        0       0       1     0     0     0     1     0
## 46        0       0       1     0     1     0     0     0
## 47        0       0       1     0     1     0     0     0
## 48        0       0       1     0     1     0     0     0
## 49        0       0       1     0     1     0     0     0
## 50        0       0       1     0     1     0     0     0
## 51        0       0       1     0     1     0     0     0
## 52        0       0       1     0     1     0     0     0
## 53        0       0       1     0     1     0     0     0
## 54        0       0       1     0     1     0     0     0
## 55        0       0       0     0     0     0     0     1
## 56        0       0       0     0     1     0     0     0
## 57        0       0       0     0     1     0     0     0
## 58        0       0       0     0     1     0     0     0
## 59        0       0       0     0     1     0     0     0
## 60        0       0       0     0     1     0     0     0
## 61        0       0       0     0     1     0     0     0
## 62        0       0       0     0     0     1     0     0
## 63        0       0       0     0     0     1     0     0
## 64        0       0       0     0     0     1     0     0
## 65        0       0       0     0     0     1     0     0
## 66        0       0       0     1     0     0     0     0
## 67        0       0       0     1     0     0     0     0
## 68        0       0       0     1     0     0     0     0
## 69        0       0       0     1     0     0     0     0
## 70        0       0       0     1     0     0     0     0
## 71        0       0       0     1     0     0     0     0
## 72        0       0       0     1     0     0     0     0
## 73        0       0       0     1     0     0     0     0
## 74        0       0       0     1     0     0     0     0
## 75        0       0       0     1     0     0     0     0
## 76        0       0       0     1     0     0     0     0
## 77        0       0       0     1     0     0     0     0
## 78        0       0       0     1     0     0     0     0
## 79        0       0       0     1     0     0     0     0
## 80        0       0       0     1     0     0     0     0
## 81        0       0       0     1     0     0     0     0
## 82        0       0       0     1     0     0     0     0
## 83        0       0       0     1     0     0     0     0
## 84        0       0       0     1     0     0     0     0
## 85        0       0       0     1     0     0     0     0
## 86        0       0       0     1     0     0     0     0
## 87        0       0       0     1     0     0     0     0
## 88        0       0       0     1     0     0     0     0
## 89        0       0       0     1     0     0     0     0
## 90        0       0       0     1     0     0     0     0
## 91        0       0       0     1     0     0     0     0
## 92        0       0       0     1     0     0     0     0
## 93        0       0       0     1     0     0     0     0
## 94        0       0       0     1     0     0     0     0
## 95        0       0       0     1     0     0     0     0
## 96        0       0       0     1     0     0     0     0
## 97        0       0       0     1     0     0     0     0
## 98        0       0       0     1     0     0     0     0
## 99        0       0       0     1     0     0     0     0
## 100       0       0       0     1     0     0     0     0
dim(X)
## [1] 100  37

Classification

Centrage-Réduction

X=X[,-1]
Xcr=scale(X)

On vérifie bien que les moyennes après le centrage-réduction sont de 0 et que les écarts-types sont de 1

apply(Xcr[,],2,mean)
##           age        catr.2        catr.3        catr.4       place.1 
##  4.296910e-17  1.791996e-17  2.775558e-17  4.920109e-18 -7.996642e-17 
##       place.2       place.3       place.4        grav.0        grav.1 
## -6.824619e-17  8.375191e-18 -5.907682e-18  7.747709e-18  1.104151e-17 
##        grav.2        grav.3        sexe.1        sexe.2        secu.1 
## -4.442789e-17 -4.446096e-17  7.777145e-17  1.550463e-17 -4.450677e-17 
##       secu.11       secu.13       secu.21       secu.22        mois.1 
##  1.155348e-16  1.797201e-17  0.000000e+00 -4.511365e-18 -2.206080e-17 
##        mois.2        mois.3        mois.4        mois.5        mois.6 
##  1.784624e-17  1.106754e-17 -5.907682e-18  2.775558e-17  6.112623e-17 
##        mois.7        mois.8        mois.9       mois.10       mois.11 
##  1.113042e-17  1.797201e-17 -5.889386e-18 -3.343625e-17  4.850721e-18 
##       mois.12         atm.1         atm.2         atm.7         atm.8 
## -2.775558e-17 -1.200645e-16  1.500265e-17  1.784624e-17  1.101766e-17 
##         atm.9 
## -5.907682e-18
apply(Xcr[,],2,sd)  
##     age  catr.2  catr.3  catr.4 place.1 place.2 place.3 place.4  grav.0  grav.1 
##       1       1       1       1       1       1       1       1       1       1 
##  grav.2  grav.3  sexe.1  sexe.2  secu.1 secu.11 secu.13 secu.21 secu.22  mois.1 
##       1       1       1       1       1       1       1       1       1       1 
##  mois.2  mois.3  mois.4  mois.5  mois.6  mois.7  mois.8  mois.9 mois.10 mois.11 
##       1       1       1       1       1       1       1       1       1       1 
## mois.12   atm.1   atm.2   atm.7   atm.8   atm.9 
##       1       1       1       1       1       1

Classification ascendante hiérarchique

Une première classification nous montre:

#Distance utilisé ici ward.D2 car de manière simplifiée, cette méthode cherche à minimiser l’inertie intra-classe et à maximiser l’inertie inter-classe afin d’obtenir des classes les plus homogènes possibles.
cah = hclust(dist(Xcr), method = "ward.D2")

#Arbre
plot(cah, hang = -1,labels = FALSE)

#Les hauteurs (sauts)
cah$height
##  [1]  0.0000000  0.0000000  0.0000000  0.0000000  0.0000000  0.0000000
##  [7]  0.0000000  0.0000000  0.0000000  0.0000000  0.0000000  0.0000000
## [13]  0.0000000  0.0000000  0.0000000  0.0000000  0.0000000  0.0000000
## [19]  0.0000000  0.0000000  0.0000000  0.0000000  0.0000000  0.0000000
## [25]  0.0000000  0.0000000  0.0000000  0.0000000  0.0000000  0.0000000
## [31]  0.0000000  0.0000000  0.0000000  0.0000000  0.0000000  0.0000000
## [37]  0.0000000  0.0000000  0.0000000  0.0000000  0.0000000  0.0000000
## [43]  0.0000000  0.0000000  0.0000000  0.2100865  0.6003723  0.6861397
## [49]  1.1149770  1.4580469  1.7153493  2.4931645  2.8225185  4.0310709
## [55]  4.6988029  4.8084316  4.8714699  4.9694215  5.0726373  5.7034761
## [61]  5.9783670  6.1512302  6.3312699  6.3633472  6.6829982  6.7237032
## [67]  6.8499538  6.9210346  6.9911050  7.3141013  7.8838640  8.1524094
## [73]  8.2104969  9.1174634  9.3690932 10.0829852 10.6182621 11.2786670
## [79] 11.6017247 11.6218372 12.4077384 12.5410624 13.2533698 13.2821971
## [85] 13.7546065 14.2060119 14.4001167 15.0045438 15.2143965 15.4360076
## [91] 15.7840252 16.2319982 17.8803966 18.1650053 20.2228092 20.8540794
## [97] 21.5375791 22.0531462 24.6200561
#Afficher le nombre de classes en abscisse, les sauts en ordonnees
plot(rev(cah$height)[1:60],type="b")

Choix du nombre de classes et classification

# nombre de classes
q=5

# ré-afficher l'arbre, avec les classes choisies
plot(cah, hang = -1,labels=FALSE)
rect.hclust(cah, q)

# classifier (= couper l'arbre)
classif= cutree(cah,q)
classif
##   1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19  20 
##   1   1   1   1   2   1   1   1   1   1   1   1   1   1   1   1   1   1   3   3 
##  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40 
##   3   3   1   1   1   1   1   1   4   4   4   4   1   1   1   1   1   1   1   1 
##  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60 
##   1   5   5   5   5   5   5   5   5   5   5   5   5   5   1   1   1   2   2   1 
##  61  62  63  64  65  66  67  68  69  70  71  72  73  74  75  76  77  78  79  80 
##   1   5   5   5   5   4   4   1   1   1   1   1   1   1   1   1   1   1   1   1 
##  81  82  83  84  85  86  87  88  89  90  91  92  93  94  95  96  97  98  99 100 
##   2   2   1   1   2   2   1   1   1   1   1   1   1   1   1   1   1   1   1   2
# afficher les villes par classe
sort(classif)
##   1   2   3   4   6   7   8   9  10  11  12  13  14  15  16  17  18  23  24  25 
##   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1 
##  26  27  28  33  34  35  36  37  38  39  40  41  55  56  57  60  61  68  69  70 
##   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1 
##  71  72  73  74  75  76  77  78  79  80  83  84  87  88  89  90  91  92  93  94 
##   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1 
##  95  96  97  98  99   5  58  59  81  82  85  86 100  19  20  21  22  29  30  31 
##   1   1   1   1   1   2   2   2   2   2   2   2   2   3   3   3   3   4   4   4 
##  32  66  67  42  43  44  45  46  47  48  49  50  51  52  53  54  62  63  64  65 
##   4   4   4   5   5   5   5   5   5   5   5   5   5   5   5   5   5   5   5   5

Profil classes : Analyse spatiale (dispersion classes)

On peut maintenant avoir une premiere vue des différentes classes et ainsi en tirer un profil.

table(classif)
## classif
##  1  2  3  4  5 
## 65  8  4  6 17
# Variances des Ecarts-type des classes
n=length(classif)
variance_totale=sum(diag(var(Xcr)))*(n-1)/n
variances_classes=rep(0,q)
for (k in 1:q) {
    n=sum(classif==k)
    variances_classes[k] = sum(diag(var(Xcr[classif==k,])))*(n-1)/n
}
round(variances_classes,2)
## [1] 24.64 40.31  4.47 49.86 19.25
round(variance_totale,2)
## [1] 35.64
# et donc écarts-type des classes
n=length(classif)
variance_totale=sum(diag(var(Xcr)))*(n-1)/n
variances_classes=rep(0,q)
for (k in 1:q) {
    n=sum(classif==k)
    variances_classes[k] = sum(diag(var(Xcr[classif==k,])))*(n-1)/n
}
sqrt(round(variances_classes,2))
## [1] 4.963869 6.349016 2.114237 7.061161 4.387482
sqrt(round(variance_totale,2))
## [1] 5.969925

Distances inter-classes (sur centres de gravite)

# i. Calcul des individus moyens (= moyennes, centres de gravite, centroïde)
moyennes = aggregate(Xcr[,],list(classif),mean)[,-1]
round(moyennes,2)
##     age catr.2 catr.3 catr.4 place.1 place.2 place.3 place.4 grav.0 grav.1
## 1  0.13  -0.20   0.25  -0.15    0.35   -0.27   -0.17   -0.10   0.04   0.05
## 2 -0.78  -0.20   0.38  -0.31   -2.83    2.65    1.28   -0.10  -0.94  -0.29
## 3 -0.26   4.87  -2.57  -0.31    0.35   -0.27   -0.17   -0.10   0.06   1.54
## 4 -0.82  -0.20  -2.57   3.16   -1.24    0.38    0.80    1.57   0.06  -0.29
## 5  0.22  -0.20   0.38  -0.31    0.35   -0.27   -0.17   -0.10   0.24  -0.29
##   grav.2 grav.3 sexe.1 sexe.2 secu.1 secu.11 secu.13 secu.21 secu.22 mois.1
## 1  -0.03  -0.09   0.06  -0.06  -0.02   -0.09    0.11    0.11   -0.14  -0.03
## 2   0.46   1.48  -1.60   1.60   0.91    0.13   -0.20   -0.50   -0.14   1.67
## 3  -0.81  -0.23   0.43  -0.43  -0.23    0.67   -0.20   -0.50   -0.14  -0.42
## 4   0.20  -0.23  -0.02   0.02  -0.23   -0.05   -0.20   -0.50    2.23  -0.42
## 5   0.02  -0.23   0.43  -0.43  -0.23    0.16   -0.20    0.09   -0.14  -0.42
##   mois.2 mois.3 mois.4 mois.5 mois.6 mois.7 mois.8 mois.9 mois.10 mois.11
## 1  -0.20   0.05   0.05   0.13   0.28   0.16   0.11  -0.10   -0.12   -0.05
## 2  -0.20  -0.29  -0.10   0.08  -0.51  -0.29  -0.20   1.15   -0.25   -0.31
## 3  -0.20  -0.29  -0.10  -0.33  -0.51  -0.29  -0.20  -0.10    3.94   -0.31
## 4  -0.20   0.93  -0.10  -0.33  -0.51  -0.29  -0.20  -0.10   -0.25    2.00
## 5   0.99  -0.29  -0.10  -0.33  -0.51  -0.29  -0.20  -0.10   -0.25   -0.31
##   mois.12 atm.1 atm.2 atm.7 atm.8 atm.9
## 1   -0.38  0.52 -0.33 -0.20 -0.29  0.05
## 2   -0.38  0.15  0.15 -0.20 -0.29 -0.10
## 3   -0.38 -1.45  2.05 -0.20 -0.29 -0.10
## 4   -0.38 -0.74 -0.48 -0.20  2.15 -0.10
## 5    1.88 -1.45  0.86  0.99  0.57 -0.10
# ii. Matrice des distances entre individus moyens
round(dist(moyennes),2)
##       1     2     3     4
## 2  6.19                  
## 3  8.11 10.21            
## 4  6.84  8.22  9.65      
## 5  4.03  7.36  8.19  7.40

Profil classes : individus moyens

# Graphique général
matplot(t(moyennes), type="b")
abline(h=0)
abline(h=c(-1,1),lty=2)
text(1:ncol(X), max(moyennes)*1.1,colnames(X), xpd= NA, srt = 90)

# Distributions-classes d'une variable (âge)
boxplot(X[,1]~classif,main="Boxplot de l'âge")

#Silouhette des individus
library(cluster)
sil=silhouette(classif,dist(X))
sil
##        cluster neighbor   sil_width
##   [1,]       1        3 -0.35098195
##   [2,]       1        3 -0.35098195
##   [3,]       1        4 -0.46361627
##   [4,]       1        4 -0.46361627
##   [5,]       2        4 -0.33396893
##   [6,]       1        3 -0.58627647
##   [7,]       1        3 -0.48023822
##   [8,]       1        3 -0.48023822
##   [9,]       1        3 -0.31044398
##  [10,]       1        3 -0.31044398
##  [11,]       1        3 -0.36170964
##  [12,]       1        3 -0.36170964
##  [13,]       1        5 -0.21118150
##  [14,]       1        5 -0.21118150
##  [15,]       1        4 -0.53862387
##  [16,]       1        4 -0.53862387
##  [17,]       1        5 -0.20753442
##  [18,]       1        5 -0.20753442
##  [19,]       3        4  0.46044979
##  [20,]       3        4  0.46044979
##  [21,]       3        5  0.23824250
##  [22,]       3        5  0.23824250
##  [23,]       1        3 -0.37279055
##  [24,]       1        5 -0.09728094
##  [25,]       1        5 -0.14993526
##  [26,]       1        5 -0.14993526
##  [27,]       1        5 -0.06380570
##  [28,]       1        5 -0.06380570
##  [29,]       4        2  0.29326783
##  [30,]       4        3 -0.57901025
##  [31,]       4        3  0.26373711
##  [32,]       4        3 -0.55082397
##  [33,]       1        3 -0.41704491
##  [34,]       1        3 -0.41704491
##  [35,]       1        3 -0.42861520
##  [36,]       1        3 -0.42861520
##  [37,]       1        3 -0.41518399
##  [38,]       1        3 -0.41518399
##  [39,]       1        5 -0.16183408
##  [40,]       1        5 -0.16183408
##  [41,]       1        3 -0.52122778
##  [42,]       5        1  0.09971517
##  [43,]       5        1  0.09971517
##  [44,]       5        3 -0.45265485
##  [45,]       5        3 -0.45265485
##  [46,]       5        3 -0.43506950
##  [47,]       5        3 -0.43506950
##  [48,]       5        3 -0.43506950
##  [49,]       5        3 -0.38064283
##  [50,]       5        3 -0.38064283
##  [51,]       5        3 -0.38064283
##  [52,]       5        3 -0.32490150
##  [53,]       5        3 -0.32490150
##  [54,]       5        3 -0.32490150
##  [55,]       1        4 -0.39732583
##  [56,]       1        3 -0.59548176
##  [57,]       1        3 -0.59548176
##  [58,]       2        3 -0.64068268
##  [59,]       2        3 -0.64068268
##  [60,]       1        3 -0.42686235
##  [61,]       1        3 -0.42686235
##  [62,]       5        1  0.18387195
##  [63,]       5        1  0.18387195
##  [64,]       5        1  0.19088736
##  [65,]       5        1  0.19088736
##  [66,]       4        3  0.33596733
##  [67,]       4        3  0.33596733
##  [68,]       1        5 -0.21054025
##  [69,]       1        5 -0.21054025
##  [70,]       1        5 -0.12930654
##  [71,]       1        3 -0.25572848
##  [72,]       1        3 -0.25572848
##  [73,]       1        3 -0.40142147
##  [74,]       1        3 -0.40142147
##  [75,]       1        3 -0.47446743
##  [76,]       1        3 -0.47446743
##  [77,]       1        3 -0.55677730
##  [78,]       1        3 -0.55677730
##  [79,]       1        3 -0.57599723
##  [80,]       1        3 -0.57599723
##  [81,]       2        4 -0.31535362
##  [82,]       2        4 -0.31535362
##  [83,]       1        5 -0.05558045
##  [84,]       1        5 -0.05558045
##  [85,]       2        4 -0.13599999
##  [86,]       2        4 -0.13599999
##  [87,]       1        5 -0.18138754
##  [88,]       1        5 -0.18138754
##  [89,]       1        4 -0.53940287
##  [90,]       1        4 -0.53940287
##  [91,]       1        5 -0.21900072
##  [92,]       1        5 -0.21900072
##  [93,]       1        4 -0.51527691
##  [94,]       1        4 -0.51527691
##  [95,]       1        5 -0.20681632
##  [96,]       1        5 -0.20681632
##  [97,]       1        3 -0.56384246
##  [98,]       1        3 -0.56384246
##  [99,]       1        4 -0.46170359
## [100,]       2        5 -0.39088592
## attr(,"Ordered")
## [1] FALSE
## attr(,"call")
## silhouette.default(x = classif, dist = dist(X))
## attr(,"class")
## [1] "silhouette"
#Affichier un graphique de la silouhette
rownames(sil)=rownames(X)
plot(sil , nmax=101 , cex.names=0.5, col="grey")

Package FactoExtra

Afin d’avoir une meilleur vision de la silhouette, on peut utiliser le package factoextra servant lui aussi a analyser les classes mais cela en plusieurs dimensions.

library(factoextra) # clustering algorithms & visualization
Xtest <- kmeans(scale(X), 5, nstart = 25)
# 3. Visualize
library("factoextra")
fviz_cluster(Xtest, data = Xcr,
             palette = c("#00AFBB","#FF6347", "#E7B800", "#DA70D6","#B6D173"),
             ggtheme = theme_minimal(),
             main = "Partitioning Clustering Plot"
)

Analyse et profil des différentes classes

Premièrement, à l’aide du matplot et du boxplot de l’âge, on peut voir que ces 5 grandes classes possèdent un profil particulier par exemple :

-La classe 1, elle représentant 65 individus à une tendance très proche de la moyenne, on ne peut pas en tirer de vrai conclusion, il faudrait sûrement réaliser une deuxième classification sur cette classe afin de pouvoir apercevoir des meilleurs profils.

-La classe 2 concerne surtout des personnes assez jeunes (une médiane de l’âge d’environ 22 ans), on remarque que ces personnes ne conduisent pas étant donné qu’ils ont une place 1 (conducteur) très significativement inférieure à la moyenne et que ce sont plus des passagers, donc sûrement des jeunes n’ayant pas leurs permis et accompagnant d’autres personnes. On remarque aussi qu’il y a une gravité de l’accident mortel (3) significativement supérieure a la moyenne et que ces accidents ont eu de lieu de manière significative aux alentours de janvier. Ce sont surtout des femmes. Ainsi, de manière globale, cette classe pourrait correspondre aux jeunes n’ayant pas leurs permis et ayant eu un accident pendant le mois de janvier donc au moment des fêtes.

-La classe 3 est plus constitué de personnes ayant un âge homogène entre 20 et 40 avec une médiane notable à 30 ans. On observe principalement que ce sont des personnes ayant eu un accident sur une route nationale avec de légères blessures, et cela, de manière très significative au mois d’octobre, mois ou les premières pluies apparaissent ce qui est en adhésion avec le fait que les conditions atmosphériques soient à 2 ce qui correspond a de la pluie légère. On pourrait ainsi résumer cette classe en disant qu’il s’agit de personnes âgés entre 20 et 40 ans et ayant eu un accident sans grandes conséquences dues a des conditions atmosphériques.

-La classe 4 représente des individus de tout âge ayant eu un accident en ville, catr4, ce sont des individus majoritairement situés à l’arrière a la place 4, et n’ayant aucune sécurité. De plus, ces accidents ont eu lieu au mois de novembre, mois où il fait nuit assez vite et ou le temps est souvent couvert comme l’on peut le voir avec la catégorie atm 8. On résumera cette classe en tant que personnes ayant eu un accident en ville et sans sécurité durant un temps couvert.

-Finalement la classe 5 semble avoir un profil semblable à classe 1, c’est-à-dire une tendance très moyenne, cependant, on peut observer que les accidents dans cette classe se sont plus produit au mois de décembre avec des pluies légères donc une route glissante.

À l’aide de la silhouette, on observe que la classe 1 contient 65 individus et a une valeur égale à -0.36, cela confirme bien notre hypothèse de vouloir appliquer une autre classification sur cette classe étant donné que sa valeur de la silhouette est très faible. À l’aide du dernier plot et de la fonction sil, on peut voir que la plupart des individus de la classe 1 sont voisins de la classe 3 et 5.

Ensuite, cette deuxième classe représentant les jeunes ayant eu un accident durant les fêtes de fin d’années n’est aussi pas très significatif du fait que la valeur de la silhouette est aussi de -0.36. On peut nuancer ce résultat en remarquant que cette classe est très voisine de la classe 4.

Néanmoins, les classes 3 et 4 représentant respectivement les individus âgés entre 20 et 40 ans ayant eu un accident léger dues a de la pluie et les personnes ayant eu accident en ville, sans sécurité et durant un temps couvert ont des valeurs de silhouette positives. Sois 0.35 pour la classe 3 et 0.02 pour la classe 4. On remarque tout de même que la classe 3 semble avoir un profil beaucoup plus propre que la classe 4. Enfin, la dernière classe contenant 17 individus a elle aussi une valeur de silhouette négative, égale à -0.20, ces individus ont tendance à être très voisins avec la classe 1 comme on peut le voir avec le plot finale.

Pour conclure, cette classification n’est pas optimale étant donné qu’on retrouve beaucoup d’outliers qu’on pourrait éviter en faisant une deuxieme classification.