Introduction

Ce notebook propose une introduction au data management avec le langage R et s’appuyant principalement sur le package dplyr.
Nous terminons ce notebook par un exemple d’appel de script R dans SAS et la réalisation d’un modèle de régression logistique.

Chargement de packages/librairies dans R

Pour le data management on va principalement s’appuyer sur la librairie dplyr, on pourrait aussi utiliser data.table. Pour le chargement de tables SAS on utilise la librarie haven. Pour réaliser des graphiques on utilise ggplot2.

library(dplyr)
library(data.table)
library(haven)
library(ggplot2)

Lecture/chargement de données

Pour charger une table SAS en mémoire dans un data.frame on utilise la fonction read_sas.
Pour charger un fichier CSV dans un data.frame on peut utiliser les fonctions read.csv ou read.csv2.
Le format SAS est bien plus lourd à lire que le format csv, pour gagner du temps de lecture on préférera les exports en CSV.
[Facultatif] Pour des questions de simplicité et de performance on préférera souvent la fonction fread (fast read) qui demande moins de paramétrage et est souvent bien plus rapide. Cette fonction provient du package data.table et charge les tables dans un format dérivé des data.frame qui s’appelle les data.table. La syntaxe est différente mais on peut facilement passer de data.frame à data.table et réciproquement pour jongler entre les différentes syntaxes.
Tout comme SAS génère des tables SAS, R peut générer des exports dans un format optimisé pour R, ce format est RData, on sauvegarde/charge ce format avec les fonctions save/load.

data_sas <- haven::read_sas("data/barometre2016_fin.sas7bdat")
data_csv <- data.table::fread("data/barometre2016_fin.csv")
load("data/barometre2016_fin.RData")

Ecriture de données

On peut écrire des fichiers SAS avec la fonction write_sas() pour conserver les formats, mais pour aller au plus vite et au plus standard on préférera écrire des CSV

haven::write_sas(data = data_sas,path = "data/barometre2016_fin_fromR.sas7bdat")
save(list=c("data_sas"),file="data/barometre2016_fin.RData")
data.table::fwrite(x = data_sas,file = "data/barometre2016_fin.csv")

Exploration d’un data.frame

Noms des variables

On peut obtenir le vecteur des noms de chaque variable présente dans le data.frame avec la fonction names.
names(data_sas)
##   [1] "mc26s1"                  "mc26s2"                 
##   [3] "mc26s3"                  "mc26s4"                 
##   [5] "mc26s5"                  "mc26s6"                 
##   [7] "mc27s1"                  "mc27s2"                 
##   [9] "mc27s3"                  "mc27s4"                 
##  [11] "mc27s5"                  "mc27s6"                 
##  [13] "mc27s7"                  "mc27s8"                 
##  [15] "mc27s9"                  "age"                    
##  [17] "pcs7"                    "sexe"                   
##  [19] "sit16"                   "sd_sitprof_6"           
##  [21] "mh5_score"               "DEP"                    
##  [23] "annee"                   "poids_ind"              
##  [25] "poids_ind_metro"         "sit_financiere_percue"  
##  [27] "sit_financiere_percue_3" "sd_diplome3"            
##  [29] "sd_revenus_3K"           "sd_vitseul"             
##  [31] "consult_mg"              "consult_dentiste"       
##  [33] "consult_gyneco"          "Q4_1"                   
##  [35] "Q4_2"                    "Q4_3"                   
##  [37] "Q4_4"                    "Q4_5"                   
##  [39] "Q4_6"                    "Q4_7"                   
##  [41] "Q4_8"                    "Q5_1"                   
##  [43] "Q5_2"                    "Q5_3"                   
##  [45] "Q5_4"                    "Q5_5"                   
##  [47] "Q5_6"                    "Q5_7"                   
##  [49] "Q5_8"                    "Q6_1"                   
##  [51] "Q6_2"                    "Q6_3"                   
##  [53] "Q6_4"                    "Q6_5"                   
##  [55] "Q6_6"                    "Q6_7"                   
##  [57] "Q6_8"                    "Q9"                     
##  [59] "Q22"                     "Q23"                    
##  [61] "Q24"                     "Q25"                    
##  [63] "Q26"                     "Q27"                    
##  [65] "Q28"                     "Q29"                    
##  [67] "Q30"                     "Q31_1"                  
##  [69] "Q31_2"                   "Q31_3"                  
##  [71] "Q31_4"                   "Q31_5"                  
##  [73] "Q31_6"                   "Q31_7"                  
##  [75] "Q31_8"                   "Q31_9"                  
##  [77] "Q31_10"                  "Q32_spec_1"             
##  [79] "Q32_spec_2"              "Q32_spec_3"             
##  [81] "Q32_spec_4"              "Q32_spec_5"             
##  [83] "Q33_1_lieu1"             "Q33_1_lieu2"            
##  [85] "Q33_1_lieu3"             "Q33_2_lieu1"            
##  [87] "Q33_2_lieu2"             "Q33_3_lieu1"            
##  [89] "Q33_3_lieu2"             "Q33_4_lieu1"            
##  [91] "Q33_4_lieu2"             "Q33_5_lieu1"            
##  [93] "Q33_5_lieu2"             "Q33_5_lieu3"            
##  [95] "Q33_6_lieu1"             "Q33_6_lieu2"            
##  [97] "Q33_7_lieu1"             "Q33_7_lieu2"            
##  [99] "Q33_7_lieu3"             "Q33_8_lieu1"            
## [101] "Q33_9_lieu1"             "Q33_10_lieu1"           
## [103] "Q35"                     "Q36"                    
## [105] "Q37"                     "Q38"                    
## [107] "Q39_1"                   "Q39_2"                  
## [109] "Q39_3"                   "Q39_4"                  
## [111] "Q40_1"                   "Q40_2"                  
## [113] "Q40_3"                   "Q41_1"                  
## [115] "Q41_2"                   "Q41_3"                  
## [117] "Q41_4"                   "Q41_5"                  
## [119] "Q41_6"                   "Q41_7"                  
## [121] "Q42_1"                   "Q42_2"                  
## [123] "Q43_1"                   "Q43_2"                  
## [125] "Q43_3"                   "Q43_4"                  
## [127] "Q44"                     "Q45"                    
## [129] "Q46"                     "Q47"                    
## [131] "Q48"                     "Q49_1"                  
## [133] "Q49_2"                   "Q49_3"                  
## [135] "Q49_4"                   "Q49_5"                  
## [137] "pcscdf"                  "pcsind"                 
## [139] "sd_nbhabitant"           "sd_nbhabitant_inf14"    
## [141] "sd_nbhabitant_sup76"     "sd_nbenfants_inf15"     
## [143] "sd_nbenfants_inf14"      "sd_habite_en_couple"    
## [145] "mini1"                   "mini2"                  
## [147] "mini3"                   "Renoncement_1"          
## [149] "Renoncement_2"           "Renoncement_3"          
## [151] "Renoncement_4"           "Renoncement_5"          
## [153] "Renoncement_6"           "Renoncement_7"          
## [155] "rsa"                     "francais_parle"         
## [157] "ne_DOM"                  "complementaire"         
## [159] "cf1"                     "cf4_1"                  
## [161] "cf4_2"                   "cf4_3"                  
## [163] "cf4_4"                   "cf4_5"                  
## [165] "cf4_6"                   "cf4_7"                  
## [167] "cf4_8"                   "cf4_9"                  
## [169] "cf4_10"                  "cf4_11"                 
## [171] "cf4_12"                  "cf5_1"                  
## [173] "cf5_2"                   "cf5_3"                  
## [175] "cf5_4"                   "cf5_5"                  
## [177] "cf5_6"                   "cf5_7"                  
## [179] "cf5_8"                   "cf5_9"                  
## [181] "cf5_10"                  "cf5_11"                 
## [183] "cf5_12"                  "rs5_2r"                 
## [185] "rs5_3r"                  "rs5_4r"                 
## [187] "rs5_5r"                  "rs5_6r"                 
## [189] "rs5_7r"                  "rs5_8r"                 
## [191] "rs5_9r"                  "rs5_10r"                
## [193] "rs5_11r"                 "rs5_12r"                
## [195] "qv20"                    "qv20b"                  
## [197] "qv20b2"                  "qv20c"                  
## [199] "qv20d"                   "sb1"                    
## [201] "sb2"                     "sb3"                    
## [203] "sb4"                     "sb5"                    
## [205] "rsprec3_1"               "rsprec3_2"              
## [207] "rsprec3_3"               "rsprec3_4"              
## [209] "rsprec3_5"               "rsprec3_6"              
## [211] "rsprec3_7"               "rsprec3_8r1"            
## [213] "rsprec3_8r2"             "mini1a"                 
## [215] "mini1b"                  "enfant1"                
## [217] "enfant2"                 "enfant3"                
## [219] "enfant4"                 "enfant5"                
## [221] "enfant6"                 "enfant7"                
## [223] "enfant8"                 "enfant9"                
## [225] "age_4"                   "comp"                   
## [227] "enfants"                 "age2"                   
## [229] "ech_sante"               "bonnesante"             
## [231] "mauvsante"               "lim_forte"              
## [233] "mal_chro"                "limitation"             
## [235] "sante_bd"                "freq_dent"              
## [237] "pbdent"                  "trouble_vis1"           
## [239] "trouble_vis"             "lunettes"               
## [241] "vuenoncorr"              "vuemalcorr"             
## [243] "consult_spe"             "consult_opht"           
## [245] "renoncement_soin_fin"    "renoncement_soin_nonfin"
## [247] "renoncement_soin"

On peut décider de renommer une variable avec la fonction rename. Par exemple on veut renommer les variables DEP et sexe en zone et genre

data_sas%>%rename(zone=DEP,genre=sexe)%>%
  select(zone,genre)

Dimensions du data.frame

On peut connaître les dimensions de la table avec les fonctions dim nrow ncol

dim(data_sas)
## [1] 32371   247
ncol(data_sas)
## [1] 247
nrow(data_sas)
## [1] 32371

Inspection rapide des variables

structure str

On peut utiliser la fonction str comme structure pour connaître la structure de chaque variable : type et première observations.
str(data_sas)
## Classes 'tbl_df', 'tbl' and 'data.frame':    32371 obs. of  247 variables:
##  $ mc26s1                 : atomic  5 NA NA NA NA NA NA 5 NA NA ...
##   ..- attr(*, "format.sas")= chr "BEST"
##  $ mc26s2                 : atomic  NA NA NA NA NA NA NA 0 NA NA ...
##   ..- attr(*, "format.sas")= chr "BEST"
##  $ mc26s3                 : atomic  1 NA NA NA NA NA NA 3 NA NA ...
##   ..- attr(*, "format.sas")= chr "BEST"
##  $ mc26s4                 : atomic  0 NA NA NA NA NA NA 0 NA NA ...
##   ..- attr(*, "format.sas")= chr "BEST"
##  $ mc26s5                 : atomic  0 NA NA NA NA NA NA 0 NA NA ...
##   ..- attr(*, "format.sas")= chr "BEST"
##  $ mc26s6                 : atomic  0 NA NA NA NA NA NA 0 NA NA ...
##   ..- attr(*, "format.sas")= chr "BEST"
##  $ mc27s1                 : Factor w/ 3 levels "","non","oui": 1 1 1 1 1 1 1 3 1 1 ...
##  $ mc27s2                 : Factor w/ 4 levels "","[nsp]","non",..: 1 4 4 4 4 4 4 1 4 4 ...
##  $ mc27s3                 : Factor w/ 3 levels "","n","o": 1 1 1 1 1 1 1 1 1 1 ...
##  $ mc27s4                 : Factor w/ 4 levels "","[nsp]","non",..: 3 3 1 4 1 1 4 4 1 4 ...
##  $ mc27s5                 : Factor w/ 4 levels "","[nsp]","non",..: 3 3 3 3 3 3 3 3 3 3 ...
##  $ mc27s6                 : Factor w/ 4 levels "","[nsp]","non",..: 3 4 3 3 3 3 4 4 4 3 ...
##  $ mc27s7                 : Factor w/ 4 levels "","[nsp]","non",..: 3 3 4 3 4 3 3 3 3 3 ...
##  $ mc27s8                 : Factor w/ 4 levels "","[nsp]","non",..: 3 3 3 3 3 3 3 3 3 3 ...
##  $ mc27s9                 : Factor w/ 4 levels "","[nsp]","non",..: 1 3 3 3 3 4 3 1 4 3 ...
##  $ age                    : atomic  50 52 34 69 52 53 52 18 52 47 ...
##   ..- attr(*, "format.sas")= chr "CLAGALT"
##  $ pcs7                   : Factor w/ 8 levels "","Agriculteurs exploitants",..: 5 7 7 7 7 4 7 4 7 7 ...
##  $ sexe                   : Factor w/ 2 levels "Femmes","Hommes": 1 1 2 1 2 2 1 1 2 1 ...
##  $ sit16                  : Factor w/ 5 levels "","[ns","[ou",..: 5 5 4 5 5 5 5 2 5 5 ...
##  $ sd_sitprof_6           : Factor w/ 6 levels "","Autres ina",..: 6 6 6 5 6 6 6 4 6 6 ...
##  $ mh5_score              : atomic  50 75 85 85 60 85 80 40 75 60 ...
##   ..- attr(*, "format.sas")= chr "BEST"
##  $ DEP                    : Factor w/ 5 levels "Guadeloupe","Guyane",..: 5 5 5 5 5 5 5 5 5 5 ...
##  $ annee                  : atomic  2010 2010 2010 2010 2010 2010 2010 2010 2010 2010 ...
##   ..- attr(*, "format.sas")= chr "BEST"
##  $ poids_ind              : atomic  1.221 1.85 1.576 0.819 1.433 ...
##   ..- attr(*, "format.sas")= chr "BEST"
##  $ poids_ind_metro        : atomic  1.221 1.85 1.576 0.819 1.433 ...
##   ..- attr(*, "format.sas")= chr "BEST"
##  $ sit_financiere_percue  : Factor w/ 6 levels "","A l'aise",..: 3 2 2 2 4 4 4 2 5 4 ...
##  $ sit_financiere_percue_3: Factor w/ 4 levels "","C'est difficile",..: 2 4 4 4 3 3 3 4 4 3 ...
##  $ sd_diplome3            : Factor w/ 4 levels "","< Bac","> Bac",..: 2 3 4 3 2 3 2 2 3 2 ...
##  $ sd_revenus_3K          : Factor w/ 4 levels "1er tercile (faible)",..: 2 3 3 4 3 2 3 1 2 2 ...
##  $ sd_vitseul             : Factor w/ 2 levels "Non","Oui": 1 1 1 1 1 1 1 1 1 1 ...
##  $ consult_mg             : atomic  1 1 1 1 1 1 1 1 1 1 ...
##   ..- attr(*, "format.sas")= chr "BEST"
##  $ consult_dentiste       : atomic  0 1 0 0 0 0 1 1 1 0 ...
##   ..- attr(*, "format.sas")= chr "BEST"
##  $ consult_gyneco         : atomic  0 0 NA 1 NA NA 1 1 NA 1 ...
##   ..- attr(*, "format.sas")= chr "BEST"
##  $ Q4_1                   : Factor w/ 12 levels "","0","1","2",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q4_2                   : Factor w/ 12 levels "","0","1","2",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q4_3                   : Factor w/ 12 levels "","0","1","2",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q4_4                   : Factor w/ 11 levels "","0","1","2",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q4_5                   : Factor w/ 11 levels "","0","1","2",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q4_6                   : Factor w/ 6 levels "","1","3","6",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q4_7                   : Factor w/ 3 levels "","1","N": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q4_8                   : Factor w/ 2 levels "","1": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q5_1                   : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q5_2                   : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q5_3                   : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q5_4                   : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q5_5                   : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q5_6                   : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q5_7                   : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q5_8                   : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q6_1                   : Factor w/ 11 levels "","A","B","c",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q6_2                   : Factor w/ 11 levels "","A","B","c",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q6_3                   : Factor w/ 10 levels "","B","c","C",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q6_4                   : Factor w/ 11 levels "","A","B","c",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q6_5                   : Factor w/ 8 levels "","B","c","f",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q6_6                   : Factor w/ 7 levels "","C","f","F",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q6_7                   : Factor w/ 5 levels "","f","F","n",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q6_8                   : Factor w/ 3 levels "","f","S": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q9                     : Factor w/ 10 levels "","1","2","3",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q22                    : Factor w/ 80 levels "","107","115",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q23                    : Factor w/ 103 levels "","100","101",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q24                    : Factor w/ 8 levels "","[NSP]","[Refus]",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q25                    : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q26                    : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q27                    : Factor w/ 7 levels "","[NSP]","[Refus]",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q28                    : Factor w/ 5 levels "","[Refus]","Je suis non voyant, je ne peux pas voir",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q29                    : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q30                    : Factor w/ 6 levels "","[Refus]","Beaucoup de difficultés",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q31_1                  : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q31_2                  : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q31_3                  : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q31_4                  : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q31_5                  : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q31_6                  : Factor w/ 5 levels "","[NSP]","[Refus]",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q31_7                  : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q31_8                  : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q31_9                  : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q31_10                 : Factor w/ 3 levels "","Non","Oui": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q32_spec_1             : Factor w/ 43 levels "","Acupuncteur",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q32_spec_2             : Factor w/ 37 levels "","Acupuncteur",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q32_spec_3             : Factor w/ 29 levels "","Acupuncteur",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q32_spec_4             : Factor w/ 17 levels "","Autres spécialistes",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q32_spec_5             : Factor w/ 8 levels "","Autres spécialistes",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_1_lieu1            : Factor w/ 12 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_1_lieu2            : Factor w/ 5 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_1_lieu3            : Factor w/ 4 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_2_lieu1            : Factor w/ 8 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_2_lieu2            : Factor w/ 3 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_3_lieu1            : Factor w/ 5 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_3_lieu2            : Factor w/ 3 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_4_lieu1            : Factor w/ 8 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_4_lieu2            : Factor w/ 2 levels "","Autre lieu": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_5_lieu1            : Factor w/ 8 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_5_lieu2            : Factor w/ 3 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_5_lieu3            : Factor w/ 2 levels "","Autre lieu": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_6_lieu1            : Factor w/ 10 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_6_lieu2            : Factor w/ 4 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_7_lieu1            : Factor w/ 8 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_7_lieu2            : Factor w/ 3 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Q33_7_lieu3            : Factor w/ 2 levels "","Clinique/Laboratoire": 1 1 1 1 1 1 1 1 1 1 ...
##   [list output truncated]
On peut utiliser la fonction summary pour connaître quelques statistiques descriptives sur chaque variable :
  • si la variable est numérique, on obtient min, 1er quartile, médiane et moyenne (et 3ème quartile et maximum si on appelle la fonction sur une variable spécifique).
  • si la variable est catégorielle/factorielle, on obtient les 4 modalités les plus présentes ainsi que leur décompte.
  • si la variable est une chaîne de caractère, aucune stat n’est réalisée parce qu’on suppose que les chaînes de caractère sont des champs textuels libres.

sommaire summary

sur le data.frame entier

summary(data_sas)
##      mc26s1           mc26s2          mc26s3           mc26s4       
##  Min.   : 0.000   Min.   :0.0     Min.   : 0.000   Min.   :  0.000  
##  1st Qu.: 3.000   1st Qu.:0.0     1st Qu.: 1.000   1st Qu.:  0.000  
##  Median : 4.000   Median :0.0     Median : 2.000   Median :  0.000  
##  Mean   : 5.588   Mean   :0.2     Mean   : 3.001   Mean   :  4.832  
##  3rd Qu.: 6.000   3rd Qu.:0.0     3rd Qu.: 3.000   3rd Qu.:  1.000  
##  Max.   :72.000   Max.   :3.0     Max.   :70.000   Max.   :365.000  
##  NA's   :30351    NA's   :32331   NA's   :30347    NA's   :30348    
##      mc26s5            mc26s6      mc27s1        mc27s2      mc27s3   
##  Min.   :  0.000   Min.   : 0.00      :31658        :25837    :31865  
##  1st Qu.:  0.000   1st Qu.: 0.00   non:  437   [nsp]:    3   n:  491  
##  Median :  0.000   Median : 0.00   oui:  276   non  : 1093   o:   15  
##  Mean   :  5.641   Mean   : 0.21               oui  : 5438            
##  3rd Qu.:  1.000   3rd Qu.: 0.00                                      
##  Max.   :365.000   Max.   :45.00                                      
##  NA's   :30346     NA's   :30333                                      
##    mc27s4        mc27s5        mc27s6        mc27s7        mc27s8     
##       :27628        :23798        :23798        :23798        :23798  
##  [nsp]:    1   [nsp]:    1   [nsp]:    2   [nsp]:   20   [nsp]:    5  
##  non  : 1973   non  : 7882   non  : 3565   non  : 7867   non  : 8208  
##  oui  : 2769   oui  :  690   oui  : 5006   oui  :  686   oui  :  360  
##                                                                       
##                                                                       
##                                                                       
##    mc27s9           age       
##       :25837   Min.   :15.00  
##  [nsp]:    3   1st Qu.:31.00  
##  non  : 4327   Median :44.00  
##  oui  : 2204   Mean   :44.25  
##                3rd Qu.:57.00  
##                Max.   :75.00  
##                               
##                                      pcs7          sexe       sit16      
##  Employés                              :9545   Femmes:17944      :24067  
##  Professions intermédiaires...         :8381   Hommes:14427   [ns:   85  
##  Ouvriers                              :6178                  [ou:   26  
##  Cadres, professions intellectuelles...:5200                  non:  657  
##  Artisans, commerçants,...             :1915                  oui: 7536  
##  Agriculteurs exploitants              : 537                             
##  (Other)                               : 615                             
##      sd_sitprof_6     mh5_score              DEP            annee     
##            :   15   Min.   :  0.00   Guadeloupe: 2028   Min.   :2010  
##  Autres ina: 1882   1st Qu.: 60.00   Guyane    : 2015   1st Qu.:2010  
##  Chomage   : 3322   Median : 75.00   La Réunion: 2094   Median :2014  
##  Etudes    : 2914   Mean   : 70.71   Martinique: 2026   Mean   :2013  
##  Retraite  : 6019   3rd Qu.: 85.00   Métropole :24208   3rd Qu.:2014  
##  Travail   :18219   Max.   :100.00                      Max.   :2014  
##                     NA's   :5                                         
##    poids_ind        poids_ind_metro          sit_financiere_percue
##  Min.   : 0.05322   Min.   : 0.05322                    :  107    
##  1st Qu.: 0.55661   1st Qu.: 0.55090   A l'aise         : 5078    
##  Median : 0.84126   Median : 0.83374   C'est difficile  : 4321    
##  Mean   : 0.99637   Mean   : 0.99637   C'est juste      : 8430    
##  3rd Qu.: 1.18021   3rd Qu.: 1.18156   Ca va            :13328    
##  Max.   :13.00816   Max.   :13.00816   N'y arrive pas sa: 1107    
##                                                                   
##     sit_financiere_percue_3 sd_diplome3                sd_revenus_3K  
##                 :  107           :   90   1er tercile (faible): 7989  
##  C'est difficile: 5428      < Bac:15392   2nd tercile         :10555  
##  C'est juste    : 8430      > Bac:10666   3ème tercile (élevé):11295  
##  Ca va          :18406      Bac  : 6223   NSP/Refus           : 2532  
##                                                                       
##                                                                       
##                                                                       
##  sd_vitseul    consult_mg    consult_dentiste consult_gyneco 
##  Non:25377   Min.   :0.000   Min.   :0.000    Min.   :0.000  
##  Oui: 6994   1st Qu.:1.000   1st Qu.:0.000    1st Qu.:0.000  
##              Median :1.000   Median :1.000    Median :1.000  
##              Mean   :0.868   Mean   :0.568    Mean   :0.584  
##              3rd Qu.:1.000   3rd Qu.:1.000    3rd Qu.:1.000  
##              Max.   :1.000   Max.   :1.000    Max.   :1.000  
##              NA's   :15664   NA's   :15649    NA's   :27629  
##       Q4_1            Q4_2            Q4_3            Q4_4      
##         :28881          :30639          :31808          :32185  
##  1      : 1363   1      :  742   1      :  310   1      :  110  
##  8      :  263   6      :  162   8      :   60   9      :   18  
##  0      :  258   8      :  149   9      :   48   8      :   12  
##  3      :  258   7      :  140   7      :   34   5      :   11  
##  6      :  253   9      :  140   4      :   31   3      :    8  
##  (Other): 1095   (Other):  399   (Other):   80   (Other):   27  
##       Q4_5       Q4_6      Q4_7      Q4_8      Q5_1      Q5_2     
##         :32316    :32349    :32365    :32369    :28881    :30639  
##  1      :   36   1:   18   1:    5   1:    2   f: 1714   f:  877  
##  6      :    4   3:    1   N:    1             g: 1776   g:  855  
##  0      :    3   6:    1                                          
##  9      :    3   9:    1                                          
##  2      :    2   N:    1                                          
##  (Other):    7                                                    
##  Q5_3      Q5_4      Q5_5      Q5_6      Q5_7      Q5_8     
##   :31808    :32185    :32316    :32349    :32365    :32369  
##  f:  273   f:   75   f:   24   f:   10   f:    1   f:    1  
##  g:  290   g:  111   g:   31   g:   12   g:    5   g:    1  
##                                                             
##                                                             
##                                                             
##                                                             
##       Q6_1            Q6_2            Q6_3            Q6_4      
##         :28881          :30639          :31808          :32185  
##  F      : 1534   F      :  797   F      :  250   f      :   76  
##  f      : 1384   f      :  667   f      :  208   F      :   75  
##  S      :  266   S      :  106   S      :   43   S      :   14  
##  P      :  123   n      :   58   B      :   22   B      :    6  
##  n      :   99   P      :   41   n      :   17   n      :    5  
##  (Other):   84   (Other):   63   (Other):   23   (Other):   10  
##       Q6_5       Q6_6      Q6_7      Q6_8            Q9       
##         :32316    :32349    :32365    :32369          :24208  
##  F      :   24   C:    1   f:    3   f:    1   2      : 2136  
##  f      :   18   f:    5   F:    1   S:    1   3      : 1737  
##  n      :    4   F:   10   n:    1             4      : 1544  
##  S      :    4   n:    4   S:    1             1      : 1495  
##  B      :    2   P:    1                       5      :  757  
##  (Other):    3   S:    1                       (Other):  494  
##       Q22             Q23                             Q24       
##         :24429          :24467                          :24208  
##  170    :  592   70     :  568   A peu près du bon poids: 4448  
##  160    :  590   80     :  467   Un peu trop gros (se)  : 2484  
##  165    :  542   60     :  412   Beaucoup trop gros (se):  735  
##  175    :  365   65     :  366   Un peu trop maigre     :  416  
##  180    :  352   75     :  351   Beaucoup trop maigre   :   64  
##  (Other): 5501   (Other): 5740   (Other)                :   16  
##     Q25           Q26                                    Q27       
##       :24208        :28952                                 :24208  
##  [NSP]:   15   [NSP]:    7   [NSP]                         :   24  
##  Non  : 4729   Non  : 2868   [Refus]                       :    2  
##  Oui  : 3419   Oui  :  544   Non, pas du tout              :  230  
##                              Non, pas trop                 : 1250  
##                              Oui, mais pas dans les détails: 3617  
##                              Oui, parfaitement             : 3040  
##                                       Q28           Q29       
##                                         :24208        :27665  
##  [Refus]                                :    1   [NSP]:   10  
##  Je suis non voyant, je ne peux pas voir:    3   Non  : 3837  
##  Non                                    : 3453   Oui  :  859  
##  Oui                                    : 4706                
##                                                               
##                                                               
##                                  Q30          Q31_1         Q31_2      
##                                    :28917        :24208        :24208  
##  [Refus]                           :    1   [NSP]:    7   [NSP]:   12  
##  Beaucoup de difficultés           :   67   Non  : 1033   Non  : 3651  
##  ou Vous ne pouvez pas du tout voir:    4   Oui  : 7123   Oui  : 4500  
##  Pas de difficultés                : 2658                              
##  Quelques difficultés              :  724                              
##                                                                        
##    Q31_3         Q31_4         Q31_5           Q31_6         Q31_7      
##       :24208        :24208        :27615          :24208        :30186  
##  [NSP]:   20   [NSP]:   20   [NSP]:   13   [NSP]  :   43   [NSP]:   12  
##  Non  : 6450   Non  : 4911   Non  : 2251   [Refus]:    4   Non  : 1674  
##  Oui  : 1693   Oui  : 3232   Oui  : 2492   Non    : 5878   Oui  :  499  
##                                            Oui    : 2238                
##                                                                         
##                                                                         
##    Q31_8         Q31_9       Q31_10     
##       :31879        :32268      :32343  
##  [NSP]:    1   [NSP]:    1   Non:   19  
##  Non  :  388   Non  :   73   Oui:    9  
##  Oui  :  103   Oui  :   29              
##                                         
##                                         
##                                         
##                                     Q32_spec_1   
##                                          :30133  
##  Cardiologue                             :  393  
##  Ostéopathe                              :  196  
##  Dermatologue                            :  185  
##  Rhumatologue (médecin pour hernie, artht:  163  
##  ORL                                     :  148  
##  (Other)                                 : 1153  
##                           Q32_spec_2   
##                                :31872  
##  Cardiologue                   :   74  
##  Gastro-entérologue/hépatologue:   37  
##  ORL                           :   32  
##  Dermatologue                  :   31  
##  Chirurgien/anesthésiste       :   30  
##  (Other)                       :  295  
##                          Q32_spec_3                       Q32_spec_4   
##                               :32268                           :32342  
##  Cardiologue                  :   12   Autres spécialistes     :    4  
##  Pneumologue                  :    9   Cardiologue             :    4  
##  Dermatologue                 :    7   Cancerologue / oncologue:    2  
##  Diabétologue / endocrinologue:    7   Dermatologue            :    2  
##  Psychologue                  :    6   Neurologue              :    2  
##  (Other)                      :   62   (Other)                 :   15  
##                           Q32_spec_5        Q33_1_lieu1   
##                                :32362             :30721  
##  Chirurgien/anesthésiste       :    3   Domicile  : 1513  
##  Autres spécialistes           :    1   Autre lieu:   72  
##  Cardiologue                   :    1   Cabinet   :   22  
##  Diététicien/nutritionniste    :    1   Hôpital   :   19  
##  Gastro-entérologue/hépatologue:    1   Caserne   :   12  
##  (Other)                       :    2   (Other)   :   12  
##                      Q33_1_lieu2                    Q33_1_lieu3   
##                            :32286                         :32368  
##  Autre lieu                :   70   Autre lieu            :    1  
##  Centre des drépanocytaires:    1   Centre de cancérologie:    1  
##  Clinique/Laboratoire      :    1   Domicile              :    1  
##  Domicile                  :   13                                 
##                                                                   
##                                                                   
##              Q33_2_lieu1                Q33_2_lieu2   
##                    :31415                     :32361  
##  Domicile          :  913   Autre lieu        :    9  
##  Autre lieu        :   29   Métropole/étranger:    1  
##  Caserne           :    6                             
##  Métropole/étranger:    4                             
##  Centre médical    :    2                             
##  (Other)           :    2                             
##                        Q33_3_lieu1        Q33_3_lieu2   
##                              :32067             :32367  
##  Autre lieu                  :   17   Autre lieu:    3  
##  Clinique/Laboratoire        :    1   Domicile  :    1  
##  Domicile                    :  285                     
##  Médecine du travail/Scolaire:    1                     
##                                                         
##                                                         
##                        Q33_4_lieu1        Q33_4_lieu2   
##                              :31799             :32356  
##  Domicile                    :  489   Autre lieu:   15  
##  Autre lieu                  :   76                     
##  Médecine du travail/Scolaire:    3                     
##  Clinique/Laboratoire        :    1                     
##  Métropole/étranger          :    1                     
##  (Other)                     :    2                     
##                Q33_5_lieu1        Q33_5_lieu2        Q33_5_lieu3   
##                      :31800             :32341             :32370  
##  Domicile            :  380   Autre lieu:   26   Autre lieu:    1  
##  Autre lieu          :  161   Domicile  :    4                     
##  Cabinet             :   11                                        
##  Hôpital             :    9                                        
##  Clinique/Laboratoire:    7                                        
##  (Other)             :    3                                        
##                        Q33_6_lieu1                  Q33_6_lieu2   
##                              :31990                       :32353  
##  Domicile                    :  212   Autre lieu          :   14  
##  Autre lieu                  :  153   Clinique/Laboratoire:    2  
##  Cabinet                     :    5   Domicile            :    2  
##  Clinique/Laboratoire        :    5                               
##  Médecine du travail/Scolaire:    2                               
##  (Other)                     :    4                               
##                Q33_7_lieu1                  Q33_7_lieu2   
##                      :32286                       :32364  
##  Autre lieu          :   41   Autre lieu          :    6  
##  Domicile            :   38   Clinique/Laboratoire:    1  
##  Clinique/Laboratoire:    2                               
##  Cabinet             :    1                               
##  Croix rouge         :    1                               
##  (Other)             :    2                               
##                Q33_7_lieu3        Q33_8_lieu1        Q33_9_lieu1   
##                      :32370             :32356             :32365  
##  Clinique/Laboratoire:    1   Autre lieu:    8   Autre lieu:    3  
##                               Domicile  :    7   Domicile  :    3  
##                                                                    
##                                                                    
##                                                                    
##                                                                    
##      Q33_10_lieu1                          Q35                  Q36       
##            :32369                            :28720               :24208  
##  Autre lieu:    1   [NSP]                    :   43   Bon         : 3602  
##  Domicile  :    1   5 ans ou plus            :  903   Moyen       : 2769  
##                     Entre 1 et moins de 2 ans: 1163   Très bon    : 1234  
##                     Entre 2 et moins de 3 ans:  848   Mauvais     :  358  
##                     Entre 3 et moins de 5 ans:  516   Très mauvais:  169  
##                     Vous n y êtes jamais allé:  178   (Other)     :   31  
##                 Q37           Q38          Q39_1         Q39_2      
##                   :24208        :24208        :24208        :24208  
##  [Nsp]            :   20   [NSP]:    3   [NSP]:    5   [NSP]:    6  
##  Jamais           : 4026   Non  : 7096   Non  : 6698   Non  : 7098  
##  Occasionnellement: 3474   Oui  : 1064   Oui  : 1460   Oui  : 1059  
##  Souvent          :  466                                            
##  Très souvent     :  177                                            
##                                                                     
##    Q39_3         Q39_4       Q40_1       Q40_2       Q40_3      
##       :24208        :24208      :31554      :31554      :31554  
##  [NSP]:    5   [NSP]:   18   Non:  311   Non:  425   Non:  791  
##  Non  : 7341   Non  : 7995   Oui:  506   Oui:  392   Oui:   26  
##  Oui  :  817   Oui  :  150                                      
##                                                                 
##                                                                 
##                                                                 
##                       Q41_1                            Q41_2      
##                          :31865                           :32271  
##  Opthalmo                :   80   Gynécologue/obstétricien:   19  
##  Gynécologue/obstétricien:   69   Opthalmo                :   15  
##  Dermatologue            :   62   Ostéopathe              :   13  
##  Ostéopathe              :   56   Kiné                    :    8  
##  Kiné                    :   32   Radiologue              :    6  
##  (Other)                 :  207   (Other)                 :   39  
##                       Q41_3      
##                          :32345  
##  Opthalmo                :    8  
##  Dentiste                :    2  
##  Gynécologue/obstétricien:    2  
##  Kiné                    :    2  
##  Podologue               :    2  
##  (Other)                 :   10  
##                                       Q41_4              Q41_5      
##                                          :32366             :32369  
##  Dentiste                                :    1   Opthalmo  :    1  
##  Opthalmo                                :    1   Ostéopathe:    1  
##  ORL                                     :    1                     
##  Radiologue                              :    1                     
##  Rhumatologue (médecin pour hernie, artht:    1                     
##                                                                     
##                 Q41_6      
##                    :32370  
##  Psychiatre/pédopsy:    1  
##                            
##                            
##                            
##                            
##                            
##                                       Q41_7      
##                                          :32370  
##  Rhumatologue (médecin pour hernie, artht:    1  
##                                                  
##                                                  
##                                                  
##                                                  
##                                                  
##                                       Q42_1      
##                                          :32221  
##  Faire des radios/scanner/mammographie   :   29  
##  Acheter des médicaments, des semelles, d:   26  
##  Bilan complet/analyses                  :   16  
##  Soins esthétiques                       :   13  
##  opération des varices/autre opération   :   12  
##  (Other)                                 :   54  
##                                       Q42_2         Q43_1      
##                                          :32360        :24208  
##  Acheter des médicaments, des semelles, d:    1   [NSP]:    6  
##  Bilan complet/analyses                  :    5   Non  : 7626  
##  Ophtalmo / vue                          :    1   Oui  :  531  
##  Prise de sang                           :    1                
##  Soins dentaires                         :    1                
##  Soins gynéco                            :    2                
##    Q43_2         Q43_3           Q43_4      
##       :24208        :24208          :24208  
##  [NSP]:    2   [NSP]:   10   [NSP]  :    6  
##  Non  : 7544   Non  : 6345   [Refus]:    1  
##  Oui  :  617   Oui  : 1808   Non    : 7671  
##                              Oui    :  485  
##                                             
##                                             
##                                        Q44                  Q45       
##                                          :31886               :24208  
##  Pas le temps (en général)               :  101   Bon         : 3508  
##  Pb de motivation (Oubli/flemme/fainéanti:   67   Assez bon   : 2698  
##  Temps d'attente trop long dans la salle :   66   Très bon    : 1481  
##  Horaires de rdv incompatibles avec le tr:   56   Mauvais     :  361  
##  Problème de relation ou de confiance / c:   30   Très mauvais:   75  
##  (Other)                                 :  165   (Other)     :   40  
##       Q46                                    Q47       
##         :24208                                 :24208  
##  [NSP]  :   69   [NSP]                         :   21  
##  [Refus]:    4   Non, pas limité du tout       : 6638  
##  Non    : 5211   Oui, fortement limité,        :  470  
##  Oui    : 2879   Oui, limité mais pas fortement: 1034  
##                                                        
##                                                        
##           Q48                  Q49_1                 Q49_2      
##             :24208                :24208                :24208  
##  [NSP]      :    8   [NSP]        :   13   [NSP]        :   14  
##  Beaucoup   : 1110   En permanence:  386   En permanence:  170  
##  Pas du tout: 4927   Jamais       : 2371   Jamais       : 4396  
##  Un peu     : 2118   Quelquefois  : 2738   Quelquefois  : 1603  
##                      Rarement     : 1710   Rarement     : 1489  
##                      Souvent      :  945   Souvent      :  491  
##            Q49_3                 Q49_4                 Q49_5      
##               :24208                :24208                :24208  
##  Souvent      : 3232   Jamais       : 3363   Souvent      : 3357  
##  Quelquefois  : 2427   Quelquefois  : 2175   Quelquefois  : 2236  
##  En permanence: 1390   Rarement     : 1996   En permanence: 1634  
##  Rarement     :  749   Souvent      :  494   Rarement     :  567  
##  Jamais       :  331   En permanence:  124   Jamais       :  296  
##  (Other)      :   34   (Other)      :   11   (Other)      :   73  
##                                     pcscdf     
##                                        :26061  
##  Ouvriers                              : 1804  
##  Professions intermédiaires...         : 1439  
##  Cadres, professions intellectuelles...: 1268  
##  Employés                              : 1048  
##  Artisans, commerçants,...             :  597  
##  (Other)                               :  154  
##                                     pcsind      sd_nbhabitant  
##                                        :10705   Min.   : 1.00  
##  Employés                              : 7028   1st Qu.: 2.00  
##  Professions intermédiaires...         : 5703   Median : 2.00  
##  Ouvriers                              : 4081   Mean   : 2.77  
##  Cadres, professions intellectuelles...: 3278   3rd Qu.: 4.00  
##  Artisans, commerçants,...             : 1214   Max.   :15.00  
##  (Other)                               :  362   NA's   :8573   
##  sd_nbhabitant_inf14 sd_nbhabitant_sup76 sd_nbenfants_inf15
##  0      :15849        :24208                    :24208     
##  .      : 8577       0: 7740             0      : 4687     
##  1      : 4029       1:  373             1      : 1760     
##  2      : 2845       2:   49             2      : 1162     
##  3      :  815       3:    1             3      :  369     
##  4      :  189                           4      :  133     
##  (Other):   67                           (Other):   52     
##  sd_nbenfants_inf14 sd_habite_en_couple          mini1       mini2      
##         :24208         : 8573                       :19074      : 8573  
##  0      : 4935      Non:10735           Assez bon   : 3989   Non:15336  
##  1      : 1688      Oui:13063           Bon         : 5775   NSP:  123  
##  2      : 1065                          Mauvais     :  548   Oui: 8339  
##  3      :  327                          NSP         :   44              
##  4      :  104                          Très bon    : 2832              
##  (Other):   44                          Très mauvais:  109              
##                      mini3       Renoncement_1 Renoncement_2 Renoncement_3
##                         : 8612      : 8574        : 8574        : 8573    
##  Non                    :18438   Non:19876     Non:21032     Non:21972    
##  Oui, fortement         : 1543   Oui: 3921     Oui: 2765     Oui: 1826    
##  Oui, mais pas fortement: 3778                                            
##                                                                           
##                                                                           
##                                                                           
##  Renoncement_4 Renoncement_5 Renoncement_6 Renoncement_7  rsa       
##     : 8575        : 8573        : 8574        : 8574        :24208  
##  Non:22262     Non:22194     Non:22426     Non:18589     Non: 6790  
##  Oui: 1534     Oui: 1604     Oui: 1371     Oui: 5208     Oui: 1373  
##                                                                     
##                                                                     
##                                                                     
##                                                                     
##  francais_parle                   ne_DOM      complementaire
##     :24208                           :24208      :24208     
##  Non: 3172      Autre endroit        : 1215   Non:  934     
##  Oui: 4991      DOM                  : 5823   Nsp:   63     
##                 France métropolitaine: 1125   Oui: 7166     
##                                                             
##                                                             
##                                                             
##       cf1        cf4_1     cf4_2     cf4_3     cf4_4     cf4_5    
##         :16736    :16736    :20048    :25278    :28033    :30904  
##  2      : 5229   F: 8443   F: 6090   F: 3448   F: 2052   F:  708  
##  1      : 3314   H: 7192   H: 6233   H: 3645   H: 2286   H:  759  
##  4      : 2871                                                    
##  3      : 2755                                                    
##  5      : 1113                                                    
##  (Other):  353                                                    
##  cf4_6     cf4_7     cf4_8     cf4_9     cf4_10    cf4_11    cf4_12   
##   :32017    :32264    :32338    :32358    :32367    :32369    :32370  
##  F:  169   F:   51   F:   16   F:    6   F:    2   F:    2   H:    1  
##  H:  185   H:   56   H:   17   H:    7   H:    2                      
##                                                                       
##                                                                       
##                                                                       
##                                                                       
##      cf5_1           cf5_2           cf5_3           cf5_4      
##         :16736          :16738          :16736          :16736  
##  40     :  365   0      : 3323   0      : 8715   0      :11461  
##  50     :  359   40     :  334   14     :  288   10     :  232  
##  35     :  331   50     :  324   17     :  287   12     :  219  
##  47     :  329   47     :  317   10     :  280   14     :  218  
##  60     :  327   42     :  305   13     :  269   8      :  215  
##  (Other):13924   (Other):11030   (Other): 5796   (Other): 3290  
##      cf5_5           cf5_6           cf5_7           cf5_8      
##         :16736          :16738          :16738          :16738  
##  0      :14237   0      :15296   0      :15534   0      :15600  
##  5      :   99   7      :   24   7      :    9   2      :    5  
##  10     :   94   4      :   20   4      :    7   10     :    3  
##  6      :   88   6      :   17   10     :    6   8      :    3  
##  8      :   83   1      :   16   2      :    6   9      :    3  
##  (Other): 1034   (Other):  260   (Other):   71   (Other):   19  
##      cf5_9       cf5_10     cf5_11     cf5_12                rs5_2r     
##         :16738     :32367     :32369     :32370                 :20042  
##  0      :15620   13:    1   12:    1   10:    1   Votre conjoint: 9257  
##  8      :    3   26:    1   3 :    1              Votre mère    :  895  
##  10     :    1   4 :    1                         Votre fils ou :  570  
##  12     :    1   5 :    1                         Votre père    :  526  
##  14     :    1                                    Votre fille ou:  507  
##  (Other):    7                                    (Other)       :  574  
##             rs5_3r                 rs5_4r                 rs5_5r     
##                :25269                 :28027                 :30902  
##  Votre fils ou : 2747   Votre fils ou : 1740   Votre fils ou :  538  
##  Votre fille ou: 2587   Votre fille ou: 1510   Votre fille ou:  484  
##  Votre mère    :  573   Votre frère ou:  353   Votre frère ou:  143  
##  Votre père    :  503   Votre soeur ou:  344   Votre soeur ou:  139  
##  Votre frère ou:  151   Votre mère    :   91   Votre mère    :   30  
##  (Other)       :  541   (Other)       :  306   (Other)       :  135  
##             rs5_6r                 rs5_7r                 rs5_8r     
##                :32015                 :32264                 :32338  
##  Votre fils ou :  101   Votre fille ou:   29   Votre fille ou:    9  
##  Votre fille ou:   90   Votre fils ou :   29   Votre fils ou :    7  
##  Votre frère ou:   45   Votre frère ou:   15   Votre frère ou:    5  
##  Votre soeur ou:   38   Votre soeur ou:    9   enfant (famill:    3  
##  Votre mère    :   16   Votre père    :    6   Autre lien fam:    2  
##  (Other)       :   66   (Other)       :   19   (Other)       :    7  
##             rs5_9r                rs5_10r                rs5_11r     
##                :32358                 :32367                 :32369  
##  Autre lien fam:    1   Votre fille ou:    2   Votre fille ou:    2  
##  Autre lien non:    1   Votre fils ou :    2                         
##  enfant (famill:    1                                                
##  Votre fille ou:    5                                                
##  Votre fils ou :    5                                                
##                                                                      
##           rs5_12r               qv20                qv20b      
##               :32370              :27164               :27237  
##  Votre fils ou:    1   Bonne      : 2899   Assez bon   : 1291  
##                        Excellente :  524   Bon         : 2267  
##                        Mauvaise   :  126   Mauvais     :  187  
##                        Médiocre   :  393   Ne sait pas :    4  
##                        Ne sait pas:    4   Très bon    : 1351  
##                        Très bonne : 1261   Très mauvais:   34  
##           qv20b2              qv20c      
##              :27077              :16736  
##  Bon         : 2738   Ne sait pas:   50  
##  Mauvais     :  134   Non        :10125  
##  Moyen       :  933   Oui        : 5460  
##  Ne sait pas :    2                      
##  Très bon    : 1451                      
##  Très mauvais:   36                      
##                              qv20d      
##                                 :16736  
##  Ne sait pas                    :   18  
##  Non, pas limité du tout        :11800  
##  Oui, fortement limité          : 1073  
##  Oui, limité, mais pas fortement: 2744  
##                                         
##                                         
##                                 sb1                 sb2       
##                                   :27077              :27077  
##  Deux fois par jour ou plus       : 3778   Ne sait pas:    2  
##  Une fois par jour                : 1301   Non        : 1859  
##  De temps en temps dans la semaine:  106   Oui        : 3433  
##  (Vous portez un dentier)         :   41                      
##  Une fois par semaine             :   38                      
##  (Other)                          :   30                      
##                         sb3       
##                           :30512  
##  5 ans ou plus            :  253  
##  Entre 1 et moins de 2 ans:  818  
##  Entre 2 et moins de 3 ans:  483  
##  Entre 3 et moins de 5 ans:  271  
##  Ne sait pas              :    1  
##  Vous n'y êtes jamais allé:   33  
##                                        sb4       
##                                          :27113  
##  Ne sait pas                             :    9  
##  Pour un examen de contrôle ou un détartr: 2979  
##  Pour un traitement suite à un précédent :  376  
##  Pour une autre raison                   :  446  
##  Quelque chose n'allait pas, vous gênait : 1448  
##                                                  
##                 sb5                 rsprec3_1              rsprec3_2    
##                   :27077                 :16736                 :16736  
##  Jamais           : 3106   (Non concerné):   51   (Non concerné):  251  
##  Ne sait pas      :    4   Ne sait pas   :    1   Ne sait pas   :    1  
##  Occasionnellement: 1919   Non           :13122   Non           :13677  
##  Souvent          :  204   Oui           : 2461   Oui           : 1706  
##  Très souvent     :   61                                                
##                                                                         
##           rsprec3_3              rsprec3_4              rsprec3_5    
##                :16736                 :16736                 :16736  
##  (Non concerné):   12   (Non concerné):   11   (Non concerné):   14  
##  Non           :14614   Ne sait pas   :    2   Non           :14561  
##  Oui           : 1009   Non           :14238   Oui           : 1060  
##                         Oui           : 1384                         
##                                                                      
##                                                                      
##           rsprec3_6              rsprec3_7    
##                :16736                 :16736  
##  (Non concerné):   13   (Non concerné):    9  
##  Ne sait pas   :    1   Ne sait pas   :    1  
##  Non           :14867   Non           :12261  
##  Oui           :  754   Oui           : 3364  
##                                               
##                                               
##                                    rsprec3_8r1   
##                                          :31001  
##  Pas le temps (en général)               :  532  
##  Pb de motivation (Oubli/flemme/fainéanti:  178  
##  Problème de relation ou de confiance / c:  113  
##  Horaires de rdv incompatibles avec le  t:   52  
##  A prendre un rdv                        :   44  
##  (Other)                                 :  451  
##                                    rsprec3_8r2        mini1a     
##                                          :32299          :16736  
##  Pb de motivation (Oubli/flemme/fainéanti:   21   0      :10993  
##  Pas le temps (en général)               :   13   1      : 2285  
##  La douleur passera toute seule / pas de :    7   2      : 1778  
##  Rdv dans trop longtemps                 :    5   3      :  491  
##  Temps d'attente trop long dans la salle :    5   4      :   73  
##  (Other)                                 :   21   (Other):   15  
##         mini1b         enfant1         enfant2         enfant3     
##            :27164   Min.   :0       Min.   :0.00    Min.   :0.000  
##  Bonne     : 2899   1st Qu.:0       1st Qu.:0.00    1st Qu.:0.000  
##  Excellente:  524   Median :0       Median :0.00    Median :0.000  
##  Mauvaise  :  126   Mean   :0       Mean   :0.03    Mean   :0.192  
##  Médicore  :  393   3rd Qu.:0       3rd Qu.:0.00    3rd Qu.:0.000  
##  NSP       :    4   Max.   :0       Max.   :1.00    Max.   :1.000  
##  Très bonne: 1261   NA's   :16736   NA's   :16738   NA's   :16736  
##     enfant4         enfant5         enfant6         enfant7     
##  Min.   :0.000   Min.   :0.000   Min.   :0.000   Min.   :0.000  
##  1st Qu.:0.000   1st Qu.:0.000   1st Qu.:0.000   1st Qu.:0.000  
##  Median :0.000   Median :0.000   Median :0.000   Median :0.000  
##  Mean   :0.159   Mean   :0.062   Mean   :0.013   Mean   :0.004  
##  3rd Qu.:0.000   3rd Qu.:0.000   3rd Qu.:0.000   3rd Qu.:0.000  
##  Max.   :1.000   Max.   :1.000   Max.   :1.000   Max.   :1.000  
##  NA's   :16736   NA's   :16736   NA's   :16738   NA's   :16738  
##     enfant8         enfant9          age_4        comp       enfants  
##  Min.   :0.000   Min.   :0.000   Min.   :1.000      :16052    : 8577  
##  1st Qu.:0.000   1st Qu.:0.000   1st Qu.:2.000   Non: 1591   0:15849  
##  Median :0.000   Median :0.000   Median :2.000   Oui:14728   1: 4029  
##  Mean   :0.002   Mean   :0.001   Mean   :2.426               2: 2845  
##  3rd Qu.:0.000   3rd Qu.:0.000   3rd Qu.:3.000               3: 1071  
##  Max.   :1.000   Max.   :1.000   Max.   :4.000                        
##  NA's   :16738   NA's   :16738                                        
##       age2        ech_sante       bonnesante      mauvsante    
##  Min.   : 225   Min.   :1.000   Min.   :0.000   Min.   :0.00   
##  1st Qu.: 961   1st Qu.:3.000   1st Qu.:0.000   1st Qu.:0.00   
##  Median :1936   Median :4.000   Median :1.000   Median :0.00   
##  Mean   :2211   Mean   :3.805   Mean   :0.649   Mean   :0.05   
##  3rd Qu.:3249   3rd Qu.:4.000   3rd Qu.:1.000   3rd Qu.:0.00   
##  Max.   :5625   Max.   :5.000   Max.   :1.000   Max.   :1.00   
##                 NA's   :19118   NA's   :19118   NA's   :19118  
##    lim_forte        mal_chro       limitation       sante_bd    
##  Min.   :0.000   Min.   :0.000   Min.   :0.000   Min.   :1.000  
##  1st Qu.:0.000   1st Qu.:0.000   1st Qu.:0.000   1st Qu.:3.000  
##  Median :0.000   Median :0.000   Median :0.000   Median :4.000  
##  Mean   :0.065   Mean   :0.352   Mean   :0.224   Mean   :3.661  
##  3rd Qu.:0.000   3rd Qu.:1.000   3rd Qu.:0.000   3rd Qu.:4.000  
##  Max.   :1.000   Max.   :1.000   Max.   :1.000   Max.   :5.000  
##  NA's   :8612    NA's   :8696    NA's   :8612    NA's   :24239  
##    freq_dent         pbdent       trouble_vis1     trouble_vis  
##  Min.   :0.000   Min.   :0.000   Min.   :0.0000   Min.   :0.00  
##  1st Qu.:0.000   1st Qu.:0.000   1st Qu.:0.0000   1st Qu.:0.00  
##  Median :0.000   Median :0.000   Median :0.0000   Median :0.00  
##  Mean   :0.554   Mean   :0.469   Mean   :0.2461   Mean   :0.17  
##  3rd Qu.:1.000   3rd Qu.:1.000   3rd Qu.:0.0000   3rd Qu.:0.00  
##  Max.   :3.000   Max.   :1.000   Max.   :4.0000   Max.   :1.00  
##  NA's   :18938   NA's   :18938                                  
##     lunettes     vuenoncorr vuemalcorr  consult_spe     consult_opht  
##  Min.   :0.000    :24208     :24208    Min.   :0.000   Min.   :0.000  
##  1st Qu.:0.000   0: 7372    0: 6513    1st Qu.:0.000   1st Qu.:0.000  
##  Median :1.000   1:  791    1: 1650    Median :0.000   Median :0.000  
##  Mean   :0.577                         Mean   :0.359   Mean   :0.397  
##  3rd Qu.:1.000                         3rd Qu.:1.000   3rd Qu.:1.000  
##  Max.   :1.000                         Max.   :1.000   Max.   :1.000  
##  NA's   :24212                         NA's   :15661   NA's   :24228  
##  renoncement_soin_fin renoncement_soin_nonfin renoncement_soin
##  Min.   :0.000        Min.   :0.000           Min.   :0.0     
##  1st Qu.:0.000        1st Qu.:0.000           1st Qu.:0.0     
##  Median :0.000        Median :0.000           Median :0.0     
##  Mean   :0.255        Mean   :0.256           Mean   :0.4     
##  3rd Qu.:1.000        3rd Qu.:1.000           3rd Qu.:1.0     
##  Max.   :1.000        Max.   :1.000           Max.   :1.0     
##  NA's   :8573         NA's   :8573            NA's   :8573

variable par variable, en sélectionnant sur les variables numériques

lapply(data_sas%>%select_if(is.numeric),summary)
## $mc26s1
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   3.000   4.000   5.588   6.000  72.000   30351 
## 
## $mc26s2
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##     0.0     0.0     0.0     0.2     0.0     3.0   32331 
## 
## $mc26s3
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   1.000   2.000   3.001   3.000  70.000   30347 
## 
## $mc26s4
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   4.832   1.000 365.000   30348 
## 
## $mc26s5
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   5.641   1.000 365.000   30346 
## 
## $mc26s6
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    0.00    0.00    0.00    0.21    0.00   45.00   30333 
## 
## $age
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   15.00   31.00   44.00   44.25   57.00   75.00 
## 
## $mh5_score
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    0.00   60.00   75.00   70.71   85.00  100.00       5 
## 
## $annee
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2010    2010    2014    2013    2014    2014 
## 
## $poids_ind
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
##  0.05322  0.55661  0.84126  0.99637  1.18021 13.00816 
## 
## $poids_ind_metro
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
##  0.05322  0.55090  0.83374  0.99637  1.18156 13.00816 
## 
## $consult_mg
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   1.000   1.000   0.868   1.000   1.000   15664 
## 
## $consult_dentiste
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   1.000   0.568   1.000   1.000   15649 
## 
## $consult_gyneco
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   1.000   0.584   1.000   1.000   27629 
## 
## $sd_nbhabitant
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    1.00    2.00    2.00    2.77    4.00   15.00    8573 
## 
## $enfant1
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##       0       0       0       0       0       0   16736 
## 
## $enfant2
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    0.00    0.00    0.00    0.03    0.00    1.00   16738 
## 
## $enfant3
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.192   0.000   1.000   16736 
## 
## $enfant4
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.159   0.000   1.000   16736 
## 
## $enfant5
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.062   0.000   1.000   16736 
## 
## $enfant6
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.013   0.000   1.000   16738 
## 
## $enfant7
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.004   0.000   1.000   16738 
## 
## $enfant8
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.002   0.000   1.000   16738 
## 
## $enfant9
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.001   0.000   1.000   16738 
## 
## $age_4
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   2.000   2.000   2.426   3.000   4.000 
## 
## $age2
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     225     961    1936    2211    3249    5625 
## 
## $ech_sante
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   3.000   4.000   3.805   4.000   5.000   19118 
## 
## $bonnesante
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   1.000   0.649   1.000   1.000   19118 
## 
## $mauvsante
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    0.00    0.00    0.00    0.05    0.00    1.00   19118 
## 
## $lim_forte
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.065   0.000   1.000    8612 
## 
## $mal_chro
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.352   1.000   1.000    8696 
## 
## $limitation
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.224   0.000   1.000    8612 
## 
## $sante_bd
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.000   3.000   4.000   3.661   4.000   5.000   24239 
## 
## $freq_dent
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.554   1.000   3.000   18938 
## 
## $pbdent
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.469   1.000   1.000   18938 
## 
## $trouble_vis1
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  0.0000  0.2461  0.0000  4.0000 
## 
## $trouble_vis
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    0.00    0.17    0.00    1.00 
## 
## $lunettes
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   1.000   0.577   1.000   1.000   24212 
## 
## $consult_spe
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.359   1.000   1.000   15661 
## 
## $consult_opht
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.397   1.000   1.000   24228 
## 
## $renoncement_soin_fin
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.255   1.000   1.000    8573 
## 
## $renoncement_soin_nonfin
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.000   0.000   0.000   0.256   1.000   1.000    8573 
## 
## $renoncement_soin
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##     0.0     0.0     0.0     0.4     1.0     1.0    8573

freq/tabulate table

Pour connaître la distribution d’une variable catégorielle, on peut utiliser la fonction table qui est assez proche de la PROC FREQ. Pour ajouter les marges ont utilise la fonction addmargins.

decompte_sexe=table(data_sas$sexe)
decompte_sexe
## 
## Femmes Hommes 
##  17944  14427
addmargins(decompte_sexe)
## 
## Femmes Hommes    Sum 
##  17944  14427  32371

Si on s’intéresse à la proportion et non au décompte, on peut rapporter le décompte au nombre d’observations non manquantes, ou bien s’intéresse à des fonctions telles que prop.table.

table(data_sas$sexe)/sum(!is.na(data_sas$sexe))
## 
##    Femmes    Hommes 
## 0.5543233 0.4456767
prop.table(decompte_sexe)
## 
##    Femmes    Hommes 
## 0.5543233 0.4456767
Bien sûr on peut réaliser des tableaux croisés sur plusieurs variables.
Vous trouverez des explications supplémentaires en français sur ce site.
decompte_sexe_age=table(data_sas$sexe,data_sas$age)
addmargins(decompte_sexe_age)
##         
##             15    16    17    18    19    20    21    22    23    24    25
##   Femmes   190   152   216   257   229   261   259   241   254   257   294
##   Hommes   162   183   223   218   219   231   197   240   201   258   252
##   Sum      352   335   439   475   448   492   456   481   455   515   546
##         
##             26    27    28    29    30    31    32    33    34    35    36
##   Femmes   242   245   285   262   343   269   358   306   311   393   293
##   Hommes   206   234   266   245   278   228   248   280   254   308   287
##   Sum      448   479   551   507   621   497   606   586   565   701   580
##         
##             37    38    39    40    41    42    43    44    45    46    47
##   Femmes   331   323   317   499   291   374   348   358   380   338   377
##   Hommes   272   294   303   338   278   336   306   282   296   278   292
##   Sum      603   617   620   837   569   710   654   640   676   616   669
##         
##             48    49    50    51    52    53    54    55    56    57    58
##   Femmes   317   320   475   286   388   295   332   308   344   348   345
##   Hommes   265   252   355   236   275   263   225   260   237   259   255
##   Sum      582   572   830   522   663   558   557   568   581   607   600
##         
##             59    60    61    62    63    64    65    66    67    68    69
##   Femmes   346   414   310   341   271   293   315   249   249   235   212
##   Hommes   280   270   203   254   248   220   235   164   186   165   155
##   Sum      626   684   513   595   519   513   550   413   435   400   367
##         
##             70    71    72    73    74    75   Sum
##   Femmes   262   147   194   154   171   170 17944
##   Hommes   170   100   123   107    85    87 14427
##   Sum      432   247   317   261   256   257 32371
decompte_sexe_age%>%prop.table(2)%>%addmargins
##         
##                  15         16         17         18         19         20
##   Femmes  0.5397727  0.4537313  0.4920273  0.5410526  0.5111607  0.5304878
##   Hommes  0.4602273  0.5462687  0.5079727  0.4589474  0.4888393  0.4695122
##   Sum     1.0000000  1.0000000  1.0000000  1.0000000  1.0000000  1.0000000
##         
##                  21         22         23         24         25         26
##   Femmes  0.5679825  0.5010395  0.5582418  0.4990291  0.5384615  0.5401786
##   Hommes  0.4320175  0.4989605  0.4417582  0.5009709  0.4615385  0.4598214
##   Sum     1.0000000  1.0000000  1.0000000  1.0000000  1.0000000  1.0000000
##         
##                  27         28         29         30         31         32
##   Femmes  0.5114823  0.5172414  0.5167653  0.5523349  0.5412475  0.5907591
##   Hommes  0.4885177  0.4827586  0.4832347  0.4476651  0.4587525  0.4092409
##   Sum     1.0000000  1.0000000  1.0000000  1.0000000  1.0000000  1.0000000
##         
##                  33         34         35         36         37         38
##   Femmes  0.5221843  0.5504425  0.5606277  0.5051724  0.5489221  0.5235008
##   Hommes  0.4778157  0.4495575  0.4393723  0.4948276  0.4510779  0.4764992
##   Sum     1.0000000  1.0000000  1.0000000  1.0000000  1.0000000  1.0000000
##         
##                  39         40         41         42         43         44
##   Femmes  0.5112903  0.5961768  0.5114236  0.5267606  0.5321101  0.5593750
##   Hommes  0.4887097  0.4038232  0.4885764  0.4732394  0.4678899  0.4406250
##   Sum     1.0000000  1.0000000  1.0000000  1.0000000  1.0000000  1.0000000
##         
##                  45         46         47         48         49         50
##   Femmes  0.5621302  0.5487013  0.5635277  0.5446735  0.5594406  0.5722892
##   Hommes  0.4378698  0.4512987  0.4364723  0.4553265  0.4405594  0.4277108
##   Sum     1.0000000  1.0000000  1.0000000  1.0000000  1.0000000  1.0000000
##         
##                  51         52         53         54         55         56
##   Femmes  0.5478927  0.5852187  0.5286738  0.5960503  0.5422535  0.5920826
##   Hommes  0.4521073  0.4147813  0.4713262  0.4039497  0.4577465  0.4079174
##   Sum     1.0000000  1.0000000  1.0000000  1.0000000  1.0000000  1.0000000
##         
##                  57         58         59         60         61         62
##   Femmes  0.5733114  0.5750000  0.5527157  0.6052632  0.6042885  0.5731092
##   Hommes  0.4266886  0.4250000  0.4472843  0.3947368  0.3957115  0.4268908
##   Sum     1.0000000  1.0000000  1.0000000  1.0000000  1.0000000  1.0000000
##         
##                  63         64         65         66         67         68
##   Femmes  0.5221580  0.5711501  0.5727273  0.6029056  0.5724138  0.5875000
##   Hommes  0.4778420  0.4288499  0.4272727  0.3970944  0.4275862  0.4125000
##   Sum     1.0000000  1.0000000  1.0000000  1.0000000  1.0000000  1.0000000
##         
##                  69         70         71         72         73         74
##   Femmes  0.5776567  0.6064815  0.5951417  0.6119874  0.5900383  0.6679688
##   Hommes  0.4223433  0.3935185  0.4048583  0.3880126  0.4099617  0.3320312
##   Sum     1.0000000  1.0000000  1.0000000  1.0000000  1.0000000  1.0000000
##         
##                  75        Sum
##   Femmes  0.6614786 33.9172116
##   Hommes  0.3385214 27.0827884
##   Sum     1.0000000 61.0000000

On peut aussi trouver de l’inspiration avec les packages reshape2, dplyr, data.table et pander.
Ici une discussion sur le sujet en français.

Manipulation de données

Modification/création de variables

On peut créer/modifier une/plusieur variables avec les fonctions mutate, mutate_if, mutate_at, mutate_all.
Ici on réalise un traitement standard dans R qui consiste à transformer les variables de type chaînes de caractères character en variable catégorielle/factorielle factor.

data_sas=data_sas%>%mutate_if(is.character,factor)

sélection sur variables (keep) ou observations (where ou delete)

keep

Si on souhaite conserver seulement certaines variables, on peut utiliser la fonction select et lister les variables à garder.

data_sas%>%select(annee,DEP,sexe,age,poids_ind,mh5_score)

remove/delete

Si à l’inverse on souhaite supprimer certaines variables, on peut utiliser la fonction select et faire précéder le nom des variables à supprimer d’un signe -.

data_sas%>%ncol
## [1] 247
data_sas%>%select(-mc26s1,-mc26s2)%>%ncol
## [1] 245

filter

Si on souhaite ne conserver que les observations telles que la variable mh5_score est supérieure à 90.

data_sas%>%nrow
## [1] 32371
data_sas%>%filter(mh5_score>90)%>%nrow
## [1] 2646

unique (distinct)

Si on souhaite supprimer les doublons, on peut utiliser la fonction unique ou la fonction distinct qui utilise la même syntaxe mais tourne beaucoup plus vite.

system.time(data_sas%>%select(annee,DEP,sexe)%>%
  unique())
##    user  system elapsed 
##    0.04    0.00    0.04
system.time(data_sas%>%select(annee,DEP,sexe)%>%
  distinct())
##    user  system elapsed 
##       0       0       0

le tri

Afin de réaliser un tri sur une ou plusieurs variables, on peut utiliser la fonction arrange.

data_sas%>%
  arrange(age)%>%
  select(annee,DEP,sexe,age,poids_ind,mh5_score)

création de nouvelles variables

On est souvent amené à créer de nouvelles variables, traitons quelques exemples classiques. On fera le plus souvent appel à la fonction mutate

tranches

Disons qu’on souhaite découper la variable âge en tranches de 10 ans.

if       age < 10 then tage = "1";
if 10 <= age < 20 then tage = "2";
if 20 <= age < 30 then tage = "3";
if 30 <= age < 40 then tage = "4";
if 40 <= age < 50 then tage = "5";
if 50 <= age < 60 then tage = "6";
if 60 <= age < 70 then tage = "7";
if 70 <= age < 80 then tage = "8";
if 80 <= age      then tage = "9";

Le découpage de la variable peut être effectué avec les fonctions cut ou Hmisc::cut2

data_sas%>%mutate(tage=cut(age,breaks = c(min(age),1:7*10,max(age)))) -> data_sas
table(data_sas$tage)
## 
## (10,15] (15,20] (20,30] (30,40] (40,50] (50,60] (60,70] (70,75] 
##     352    2189    5059    6212    6518    5966    4737    1338

Création de variables par somme ou collage

Disons qu’on veut créer une variable de catégorie age x genre, pour cela on va utiliser paste.
On souhaite également compter le nombre de spécialités consultées, on va donc appeler sum sur les lignes en précisant rowwise. On pourrait tout simplement utiliser l’opérateur +.

data_sas%>%
  mutate(age_sexe=paste(sexe,age,sep="_"))%>%
  rowwise() %>% 
  mutate(consult = sum(consult_mg,
                       consult_dentiste,
                       consult_gyneco,
                       consult_opht, 
                       na.rm=TRUE)) -> data_sas
data_sas$age_sexe%>%table%>%sort(decreasing = T)%>%head(10)
## .
## Femmes_40 Femmes_50 Femmes_60 Femmes_35 Femmes_52 Femmes_45 Femmes_47 
##       499       475       414       393       388       380       377 
## Femmes_42 Femmes_32 Femmes_44 
##       374       358       358
data_sas$consult%>%table
## .
##     0     1     2     3 
## 16823  4943  6757  3848

[Niveau avancé] lag (décalage)

Cet exemple et très complet et fait appel aux fonctions filter, group_by, summarise, arrange, mutate, ggplot, pour gagner quelques lignes de code on fait même appel à la fonction set (:=) de data.table pour faire un group_by “sur place”.
On étudie parfois des séries temporelles ou données de panel et on a besoin de comparer \(X_t\) avec \(X_{t-1}\), pour cela on doit créer une variable de retard/lag, par groupe.
Par exemple, disons qu’on veut comparer, à genre et zone donnés, le niveau d’isolement à l’âge A et à l’âge A+1.

# niveau d'isolement par âge, genre, zone
data_sas%>%
  filter(age>50)%>%
  group_by(DEP,age,sexe)%>%
  summarise(volume=n(),
            # volume_noNA=sum(!is.na(sd_vitseul)),
            isolement=sum(sd_vitseul=="Oui"),
            tx_isolement=isolement/volume)%>%
  arrange(DEP,sexe,age)%>%
  data.table-> data_sas_dt
#lag par genre et zone
data_sas_dt[,c("tx_isolement_lag"):=list(lag(tx_isolement)),by=c("DEP","sexe")]

#ratio et visualisation pour une zone et un genre donnés
data_sas_dt%>%
  mutate(tx_isolement_ratio=tx_isolement/tx_isolement_lag)%>%
  filter(DEP=="Métropole"&sexe=="Femmes")%>%
  mutate(volume=volume/mean(volume))%>%
  ggplot() -> g

g+geom_line(aes(x=age,y=tx_isolement_ratio))+geom_col(aes(x=age,y=volume),alpha=.1)

group by

On veut conserver uniquement les CSP “Q23” telles que mh5_score est CONNU au moins 10 fois. On va faire appel à group_by et summarise puis filter.

nb_Q23=data_sas%>%
  group_by(Q23)%>%
  summarise(mh5_filled_in_Q23=sum(!is.na(mh5_score)))%>%
  filter(mh5_filled_in_Q23>10)

jointure (merge)

Afin de filter les observations pour garder uniquements celles dont la classe Q23 compte au moins 10 mh5_score renseignés (non manquants). Pour cela on fait un inner-join sur la table générée précédemment.

data_sas_sub=merge(data_sas,nb_Q23,by="Q23", all.x=F,all.y=F)

Pour réaliser la même opération on aurait pû utiliser une syntaxe data.table :

data_sas=data.table(data_sas)
data_sas[,"mh5_filled_in_Q23":=sum(!is.na(mh5_score)),by="Q23"]
data_sas_sub=data_sas[mh5_filled_in_Q23>10]

proc compare

Exemple simple

Code SAS

DATA version1;
   INPUT id $ age sexe;
   DATALINES;
1 20 1
2 30 2
3 40 2
4 50 1
5 60 2
    ;
RUN;

DATA version2;
   INPUT id $ age;
   DATALINES;
1 20
2 30
3 30
5 70
    ;
RUN;

PROC COMPARE DATA = version1
            COMPARE = version2;
    ID id;
RUN;

package arsenal

library(arsenal)
version1=data.frame(id=1:5,age=c(2:6*10),sexe=sample(1:2,replace = T,size = 5))
version2=data.frame(id=c(1,2,3,5),age=c(20,30,30,70))
exemple1=compare(version1, version2,by="id")
exemple1$vars.summary$values[[2]]
# summary(exemple1)
# diffs(exemple1)

Autre exemple

data

d1
d2

Package arsenal

https://cran.r-project.org/web/packages/arsenal/vignettes/compare.html

library(arsenal)
comparison=compare(d1,d2)
comparison
## Compare Object
## 
## Function Call: 
## compare.data.frame(x = d1, y = d2)
## 
## Shared: 6 variables and 3 observations.
## Not shared: 0 variables and 1 observations.
## 
## Differences found in 4/5 variables compared.
## 0 variables compared have non-identical attributes.
summary(comparison)
## 
## 
## Table: Variables not shared
## 
## |                        |
## |:-----------------------|
## |No variables not shared |
## 
## 
## 
## Table: Other variables not compared
## 
## |                                |
## |:-------------------------------|
## |No other variables not compared |
## 
## 
## 
## Table: Observations not shared
## 
## version    ..row.names..   observation
## --------  --------------  ------------
## x                      4             4
## 
## 
## 
## Table: Differences detected by variable
## 
## var.x            var.y              n   NAs
## ---------------  ---------------  ---  ----
## Last_Name        Last_Name          1     0
## First_Name       First_Name         0     0
## Street_Address   Street_Address     1     0
## ZIP              ZIP                2     0
## VisitCount       VisitCount         1     0
## 
## 
## 
## Table: First 10 differences detected per variable
## 
## var.x            var.y             ..row.names..  values.x        values.y         row.x   row.y
## ---------------  ---------------  --------------  --------------  --------------  ------  ------
## Last_Name        Last_Name                     3  Don             Donn                 3       3
## Street_Address   Street_Address                2  4321 Tower St   4111 Tower St        2       2
## ZIP              ZIP                           2  54321           32132                2       2
## ZIP              ZIP                           3  23232           11111                3       3
## VisitCount       VisitCount                    2  10              17                   2       2
## 
## 
## 
## Table: Non-identical attributes
## 
## |                            |
## |:---------------------------|
## |No non-identical attributes |
summary(compare(d1,d2,by=c("Last_Name","First_Name")))
## 
## 
## Table: Variables not shared
## 
## |                        |
## |:-----------------------|
## |No variables not shared |
## 
## 
## 
## Table: Other variables not compared
## 
## |                                |
## |:-------------------------------|
## |No other variables not compared |
## 
## 
## 
## Table: Observations not shared
## 
## version   Last_Name   First_Name    observation
## --------  ----------  -----------  ------------
## x         Don         Bob                     3
## x         Smith       Mike                    4
## y         Donn        Bob                     3
## 
## 
## 
## Table: Differences detected by variable
## 
## var.x            var.y              n   NAs
## ---------------  ---------------  ---  ----
## Street_Address   Street_Address     1     0
## ZIP              ZIP                1     0
## VisitCount       VisitCount         1     0
## 
## 
## 
## Table: First 10 differences detected per variable
## 
## var.x            var.y            Last_Name   First_Name   values.x        values.y         row.x   row.y
## ---------------  ---------------  ----------  -----------  --------------  --------------  ------  ------
## Street_Address   Street_Address   Doe         Jane         4321 Tower St   4111 Tower St        2       2
## ZIP              ZIP              Doe         Jane         54321           32132                2       2
## VisitCount       VisitCount       Doe         Jane         10              17                   2       2
## 
## 
## 
## Table: Non-identical attributes
## 
## |                            |
## |:---------------------------|
## |No non-identical attributes |
diffs(comparison)
diffs(comparison,by.var=T)

Une piste intéressante avec data.table

https://stackoverflow.com/questions/28056805/find-discrepancies-between-two-tables

setDT(d1)
d1 <- d1[, list(VarName = names(.SD), TableOne = unlist(.SD, use.names = F)),by=c('Last_Name','First_Name')]

setDT(d2)
d2 <- d2[, list(VarName = names(.SD), TableTwo = unlist(.SD, use.names = F)),by=c('Last_Name','First_Name')]

# Set keys for merging
setkey(d1,Last_Name,First_Name,VarName)

# Merge, remove duplicates
d1[d2,nomatch=0][TableOne!=TableTwo]

fonctions pour les chaînes de caractère

find, count dans SAS

Où est la première occurrence de “consult” ? match = find(nm, "consult");

Combien d’occurrence de l’expression “consult” ? howmany = count(nm, "consult");

grep

Concept plus riche avec grep

nm=names(data_sas)
nm[grep(pattern = "consult",x = nm)]
## [1] "consult_mg"       "consult_dentiste" "consult_gyneco"  
## [4] "consult_spe"      "consult_opht"     "consult"

substr

data_sas%>%
  select(Q32_spec_1)%>%
  mutate(Q32_spec_char=as.character(Q32_spec_1),
         Q32_spec_len=nchar(Q32_spec_char))%>%
  filter(Q32_spec_len>1)%>%
  mutate(Q32_spec_1a3=substr(Q32_spec_char,start = 1,stop = 3))%>%
  select(Q32_spec_char,Q32_spec_1a3)

Fonctions de simulation/échantillonnage

Tirage aléatoire

On s’intéresse à la variableQ32_spec_1 relative aux spécialités médicales. On veut simuler un vecteur de 1000 spécialistes. On commence par calculer la distribution des modalités avec un équivalent proc freq : table puis on réalise le tirage aléatoire pondéré avec la fonction sample

freq_Q33=data_sas%>%filter(!Q32_spec_1=="")%>%
                              mutate(Q32_spec_1=as.character(Q32_spec_1))%>%
                              select(Q32_spec_1)%>%table
freq_Q33
## .
##                              Acupuncteur 
##                                        5 
##                             Allergologue 
##                                       62 
##                               Angiologue 
##                                       23 
##                  Autres non spécialistes 
##                                       21 
##                      Autres spécialistes 
##                                       43 
##                 Cancerologue / oncologue 
##                                       56 
##                              Cardiologue 
##                                      393 
##                  Chiropracteur/Etiopathe 
##                                        7 
##                  Chirurgien/anesthésiste 
##                                      102 
##                             Dermatologue 
##                                      185 
##            Diabétologue / endocrinologue 
##                                      111 
##               Diététicien/nutritionniste 
##                                       20 
##                            Drepanocytose 
##                                        2 
##                         Estomac/intestin 
##                                        3 
##           Gastro-entérologue/hépatologue 
##                                      114 
##                 Gynécologue/obstétricien 
##                                        3 
##                              Hématologue 
##                                        6 
##                               Homéopathe 
##                                        6 
##              Médecin du sport/du travail 
##                                       18 
##                              Nephrologue 
##                                       20 
##                          Neurochirurgien 
##                                       11 
##                               Neurologue 
##                                       95 
##                                      NSP 
##                                       23 
##                                      ORL 
##                                      148 
##                           Ortho-dentiste 
##                                       11 
##                             Orthopédiste 
##                                       39 
##                            Orthophoniste 
##                                        3 
##                              Orthoptiste 
##                                        8 
##                               Ostéopathe 
##                                      196 
##                                 Pédiatre 
##                                        2 
##        Phlébologue/veines sans précision 
##                                       21 
##                              Pneumologue 
##                                       47 
##                                Podologue 
##                                       36 
##                                 Prostate 
##                                       14 
##                       Psychiatre/pédopsy 
##                                       27 
##                              Psychologue 
##                                       18 
##                               Radiologue 
##                                      101 
## Rhumatologue (médecin pour hernie, artht 
##                                      163 
##               Spécialiste jambes, genous 
##                                       15 
##                             Stomatologue 
##                                       10 
##                            Traumatologue 
##                                        5 
##                                 Urologue 
##                                       45
sample(x = names(freq_Q33),size=1000,replace = T,prob = freq_Q33)
##    [1] "Prostate"                                
##    [2] "Pneumologue"                             
##    [3] "Autres non spécialistes"                 
##    [4] "Cardiologue"                             
##    [5] "Diabétologue / endocrinologue"           
##    [6] "Neurologue"                              
##    [7] "Ostéopathe"                              
##    [8] "Ostéopathe"                              
##    [9] "Médecin du sport/du travail"             
##   [10] "Podologue"                               
##   [11] "Cardiologue"                             
##   [12] "Cardiologue"                             
##   [13] "Spécialiste jambes, genous"              
##   [14] "Neurologue"                              
##   [15] "Cardiologue"                             
##   [16] "Cardiologue"                             
##   [17] "Chirurgien/anesthésiste"                 
##   [18] "Orthopédiste"                            
##   [19] "Radiologue"                              
##   [20] "Rhumatologue (médecin pour hernie, artht"
##   [21] "Urologue"                                
##   [22] "Autres spécialistes"                     
##   [23] "Diabétologue / endocrinologue"           
##   [24] "Cardiologue"                             
##   [25] "Radiologue"                              
##   [26] "Podologue"                               
##   [27] "Chirurgien/anesthésiste"                 
##   [28] "Rhumatologue (médecin pour hernie, artht"
##   [29] "Gynécologue/obstétricien"                
##   [30] "Cardiologue"                             
##   [31] "Autres spécialistes"                     
##   [32] "Cardiologue"                             
##   [33] "Gastro-entérologue/hépatologue"          
##   [34] "Pneumologue"                             
##   [35] "Urologue"                                
##   [36] "Rhumatologue (médecin pour hernie, artht"
##   [37] "Allergologue"                            
##   [38] "Diabétologue / endocrinologue"           
##   [39] "Psychiatre/pédopsy"                      
##   [40] "Diabétologue / endocrinologue"           
##   [41] "Radiologue"                              
##   [42] "Urologue"                                
##   [43] "Chirurgien/anesthésiste"                 
##   [44] "Dermatologue"                            
##   [45] "Ostéopathe"                              
##   [46] "Ostéopathe"                              
##   [47] "Cardiologue"                             
##   [48] "Rhumatologue (médecin pour hernie, artht"
##   [49] "Ostéopathe"                              
##   [50] "Rhumatologue (médecin pour hernie, artht"
##   [51] "NSP"                                     
##   [52] "Psychiatre/pédopsy"                      
##   [53] "Autres non spécialistes"                 
##   [54] "Chirurgien/anesthésiste"                 
##   [55] "Ostéopathe"                              
##   [56] "Autres spécialistes"                     
##   [57] "Orthopédiste"                            
##   [58] "Cardiologue"                             
##   [59] "Cancerologue / oncologue"                
##   [60] "Ostéopathe"                              
##   [61] "Ostéopathe"                              
##   [62] "Chirurgien/anesthésiste"                 
##   [63] "Médecin du sport/du travail"             
##   [64] "Rhumatologue (médecin pour hernie, artht"
##   [65] "Urologue"                                
##   [66] "Orthopédiste"                            
##   [67] "ORL"                                     
##   [68] "Cardiologue"                             
##   [69] "Neurologue"                              
##   [70] "Urologue"                                
##   [71] "Cardiologue"                             
##   [72] "Rhumatologue (médecin pour hernie, artht"
##   [73] "Psychiatre/pédopsy"                      
##   [74] "Cardiologue"                             
##   [75] "Cardiologue"                             
##   [76] "Neurologue"                              
##   [77] "Diabétologue / endocrinologue"           
##   [78] "Nephrologue"                             
##   [79] "Cardiologue"                             
##   [80] "Ostéopathe"                              
##   [81] "Cardiologue"                             
##   [82] "Cardiologue"                             
##   [83] "Radiologue"                              
##   [84] "Cardiologue"                             
##   [85] "Cardiologue"                             
##   [86] "Gastro-entérologue/hépatologue"          
##   [87] "Cardiologue"                             
##   [88] "Psychiatre/pédopsy"                      
##   [89] "Autres spécialistes"                     
##   [90] "Ostéopathe"                              
##   [91] "Radiologue"                              
##   [92] "Ostéopathe"                              
##   [93] "Cancerologue / oncologue"                
##   [94] "Gastro-entérologue/hépatologue"          
##   [95] "Neurologue"                              
##   [96] "Allergologue"                            
##   [97] "Chirurgien/anesthésiste"                 
##   [98] "Ostéopathe"                              
##   [99] "Neurologue"                              
##  [100] "ORL"                                     
##  [101] "Cardiologue"                             
##  [102] "Urologue"                                
##  [103] "Rhumatologue (médecin pour hernie, artht"
##  [104] "Chirurgien/anesthésiste"                 
##  [105] "Chirurgien/anesthésiste"                 
##  [106] "Pneumologue"                             
##  [107] "Dermatologue"                            
##  [108] "Chirurgien/anesthésiste"                 
##  [109] "Rhumatologue (médecin pour hernie, artht"
##  [110] "Radiologue"                              
##  [111] "Pneumologue"                             
##  [112] "Cardiologue"                             
##  [113] "Ostéopathe"                              
##  [114] "Neurologue"                              
##  [115] "Dermatologue"                            
##  [116] "Phlébologue/veines sans précision"       
##  [117] "Dermatologue"                            
##  [118] "Dermatologue"                            
##  [119] "Ostéopathe"                              
##  [120] "ORL"                                     
##  [121] "Diabétologue / endocrinologue"           
##  [122] "Autres spécialistes"                     
##  [123] "Dermatologue"                            
##  [124] "Cardiologue"                             
##  [125] "Médecin du sport/du travail"             
##  [126] "Diabétologue / endocrinologue"           
##  [127] "Dermatologue"                            
##  [128] "Cardiologue"                             
##  [129] "NSP"                                     
##  [130] "Diabétologue / endocrinologue"           
##  [131] "Médecin du sport/du travail"             
##  [132] "Neurologue"                              
##  [133] "ORL"                                     
##  [134] "Nephrologue"                             
##  [135] "Ostéopathe"                              
##  [136] "Chirurgien/anesthésiste"                 
##  [137] "Gastro-entérologue/hépatologue"          
##  [138] "Orthopédiste"                            
##  [139] "Podologue"                               
##  [140] "Gastro-entérologue/hépatologue"          
##  [141] "Cardiologue"                             
##  [142] "Cardiologue"                             
##  [143] "Cancerologue / oncologue"                
##  [144] "ORL"                                     
##  [145] "Diabétologue / endocrinologue"           
##  [146] "Rhumatologue (médecin pour hernie, artht"
##  [147] "Cardiologue"                             
##  [148] "Podologue"                               
##  [149] "Radiologue"                              
##  [150] "Radiologue"                              
##  [151] "Gastro-entérologue/hépatologue"          
##  [152] "Cancerologue / oncologue"                
##  [153] "Autres spécialistes"                     
##  [154] "Dermatologue"                            
##  [155] "Neurologue"                              
##  [156] "Chirurgien/anesthésiste"                 
##  [157] "Radiologue"                              
##  [158] "Cancerologue / oncologue"                
##  [159] "Cardiologue"                             
##  [160] "Cardiologue"                             
##  [161] "Ostéopathe"                              
##  [162] "Radiologue"                              
##  [163] "Ostéopathe"                              
##  [164] "Cardiologue"                             
##  [165] "ORL"                                     
##  [166] "Dermatologue"                            
##  [167] "Diabétologue / endocrinologue"           
##  [168] "Dermatologue"                            
##  [169] "Cardiologue"                             
##  [170] "Dermatologue"                            
##  [171] "Rhumatologue (médecin pour hernie, artht"
##  [172] "Cardiologue"                             
##  [173] "Chirurgien/anesthésiste"                 
##  [174] "Allergologue"                            
##  [175] "Gastro-entérologue/hépatologue"          
##  [176] "Cardiologue"                             
##  [177] "Dermatologue"                            
##  [178] "Dermatologue"                            
##  [179] "Gastro-entérologue/hépatologue"          
##  [180] "Rhumatologue (médecin pour hernie, artht"
##  [181] "Angiologue"                              
##  [182] "Gastro-entérologue/hépatologue"          
##  [183] "Radiologue"                              
##  [184] "Chirurgien/anesthésiste"                 
##  [185] "Rhumatologue (médecin pour hernie, artht"
##  [186] "Allergologue"                            
##  [187] "NSP"                                     
##  [188] "Urologue"                                
##  [189] "Cardiologue"                             
##  [190] "Cancerologue / oncologue"                
##  [191] "Dermatologue"                            
##  [192] "Radiologue"                              
##  [193] "Dermatologue"                            
##  [194] "Autres non spécialistes"                 
##  [195] "Neurologue"                              
##  [196] "Ostéopathe"                              
##  [197] "Neurologue"                              
##  [198] "Urologue"                                
##  [199] "Psychologue"                             
##  [200] "Cardiologue"                             
##  [201] "Ostéopathe"                              
##  [202] "Cancerologue / oncologue"                
##  [203] "Ostéopathe"                              
##  [204] "Gastro-entérologue/hépatologue"          
##  [205] "Dermatologue"                            
##  [206] "Dermatologue"                            
##  [207] "ORL"                                     
##  [208] "ORL"                                     
##  [209] "Urologue"                                
##  [210] "Pneumologue"                             
##  [211] "Dermatologue"                            
##  [212] "Cardiologue"                             
##  [213] "Rhumatologue (médecin pour hernie, artht"
##  [214] "Ostéopathe"                              
##  [215] "Cancerologue / oncologue"                
##  [216] "Allergologue"                            
##  [217] "Ostéopathe"                              
##  [218] "Cardiologue"                             
##  [219] "Ostéopathe"                              
##  [220] "Phlébologue/veines sans précision"       
##  [221] "Radiologue"                              
##  [222] "Spécialiste jambes, genous"              
##  [223] "Ostéopathe"                              
##  [224] "Radiologue"                              
##  [225] "Cardiologue"                             
##  [226] "Dermatologue"                            
##  [227] "Gastro-entérologue/hépatologue"          
##  [228] "Dermatologue"                            
##  [229] "Chirurgien/anesthésiste"                 
##  [230] "Cardiologue"                             
##  [231] "Radiologue"                              
##  [232] "Rhumatologue (médecin pour hernie, artht"
##  [233] "Orthopédiste"                            
##  [234] "Cardiologue"                             
##  [235] "Cancerologue / oncologue"                
##  [236] "ORL"                                     
##  [237] "Dermatologue"                            
##  [238] "Cardiologue"                             
##  [239] "Rhumatologue (médecin pour hernie, artht"
##  [240] "Acupuncteur"                             
##  [241] "Rhumatologue (médecin pour hernie, artht"
##  [242] "Cardiologue"                             
##  [243] "Diabétologue / endocrinologue"           
##  [244] "Orthopédiste"                            
##  [245] "Cardiologue"                             
##  [246] "Neurologue"                              
##  [247] "Diabétologue / endocrinologue"           
##  [248] "Cancerologue / oncologue"                
##  [249] "Allergologue"                            
##  [250] "NSP"                                     
##  [251] "Cardiologue"                             
##  [252] "Allergologue"                            
##  [253] "Dermatologue"                            
##  [254] "Allergologue"                            
##  [255] "Dermatologue"                            
##  [256] "Gastro-entérologue/hépatologue"          
##  [257] "Cardiologue"                             
##  [258] "Gastro-entérologue/hépatologue"          
##  [259] "Neurologue"                              
##  [260] "Cardiologue"                             
##  [261] "Cardiologue"                             
##  [262] "Diabétologue / endocrinologue"           
##  [263] "Ostéopathe"                              
##  [264] "Psychologue"                             
##  [265] "Cardiologue"                             
##  [266] "Orthopédiste"                            
##  [267] "Chirurgien/anesthésiste"                 
##  [268] "Cardiologue"                             
##  [269] "Ostéopathe"                              
##  [270] "Cardiologue"                             
##  [271] "Cancerologue / oncologue"                
##  [272] "Ostéopathe"                              
##  [273] "Urologue"                                
##  [274] "Chirurgien/anesthésiste"                 
##  [275] "Drepanocytose"                           
##  [276] "Diététicien/nutritionniste"              
##  [277] "Stomatologue"                            
##  [278] "ORL"                                     
##  [279] "Ostéopathe"                              
##  [280] "Rhumatologue (médecin pour hernie, artht"
##  [281] "Rhumatologue (médecin pour hernie, artht"
##  [282] "Orthopédiste"                            
##  [283] "Phlébologue/veines sans précision"       
##  [284] "Allergologue"                            
##  [285] "Gastro-entérologue/hépatologue"          
##  [286] "Cardiologue"                             
##  [287] "Psychiatre/pédopsy"                      
##  [288] "Cardiologue"                             
##  [289] "Rhumatologue (médecin pour hernie, artht"
##  [290] "Cardiologue"                             
##  [291] "Gastro-entérologue/hépatologue"          
##  [292] "Cardiologue"                             
##  [293] "Cardiologue"                             
##  [294] "Gastro-entérologue/hépatologue"          
##  [295] "Radiologue"                              
##  [296] "Ostéopathe"                              
##  [297] "Allergologue"                            
##  [298] "Diabétologue / endocrinologue"           
##  [299] "Diabétologue / endocrinologue"           
##  [300] "ORL"                                     
##  [301] "Dermatologue"                            
##  [302] "Spécialiste jambes, genous"              
##  [303] "NSP"                                     
##  [304] "Urologue"                                
##  [305] "Cardiologue"                             
##  [306] "Ostéopathe"                              
##  [307] "Rhumatologue (médecin pour hernie, artht"
##  [308] "Dermatologue"                            
##  [309] "Gastro-entérologue/hépatologue"          
##  [310] "Hématologue"                             
##  [311] "Neurologue"                              
##  [312] "Gastro-entérologue/hépatologue"          
##  [313] "Ostéopathe"                              
##  [314] "Neurologue"                              
##  [315] "Homéopathe"                              
##  [316] "Autres non spécialistes"                 
##  [317] "Ostéopathe"                              
##  [318] "Rhumatologue (médecin pour hernie, artht"
##  [319] "Ortho-dentiste"                          
##  [320] "Ostéopathe"                              
##  [321] "Dermatologue"                            
##  [322] "Dermatologue"                            
##  [323] "Cardiologue"                             
##  [324] "Ostéopathe"                              
##  [325] "Pneumologue"                             
##  [326] "Pédiatre"                                
##  [327] "Allergologue"                            
##  [328] "Neurologue"                              
##  [329] "Dermatologue"                            
##  [330] "Ostéopathe"                              
##  [331] "Ostéopathe"                              
##  [332] "Diabétologue / endocrinologue"           
##  [333] "Pédiatre"                                
##  [334] "Rhumatologue (médecin pour hernie, artht"
##  [335] "Cardiologue"                             
##  [336] "Ostéopathe"                              
##  [337] "Podologue"                               
##  [338] "Rhumatologue (médecin pour hernie, artht"
##  [339] "Autres spécialistes"                     
##  [340] "Radiologue"                              
##  [341] "Médecin du sport/du travail"             
##  [342] "ORL"                                     
##  [343] "Chirurgien/anesthésiste"                 
##  [344] "Podologue"                               
##  [345] "Dermatologue"                            
##  [346] "Rhumatologue (médecin pour hernie, artht"
##  [347] "Pneumologue"                             
##  [348] "Radiologue"                              
##  [349] "Cardiologue"                             
##  [350] "Nephrologue"                             
##  [351] "Rhumatologue (médecin pour hernie, artht"
##  [352] "Cardiologue"                             
##  [353] "Cardiologue"                             
##  [354] "ORL"                                     
##  [355] "NSP"                                     
##  [356] "Cardiologue"                             
##  [357] "Neurochirurgien"                         
##  [358] "Cardiologue"                             
##  [359] "Rhumatologue (médecin pour hernie, artht"
##  [360] "Cardiologue"                             
##  [361] "Ostéopathe"                              
##  [362] "Prostate"                                
##  [363] "Ostéopathe"                              
##  [364] "Rhumatologue (médecin pour hernie, artht"
##  [365] "Diabétologue / endocrinologue"           
##  [366] "Ostéopathe"                              
##  [367] "Rhumatologue (médecin pour hernie, artht"
##  [368] "Radiologue"                              
##  [369] "Diététicien/nutritionniste"              
##  [370] "Diabétologue / endocrinologue"           
##  [371] "Diabétologue / endocrinologue"           
##  [372] "ORL"                                     
##  [373] "Dermatologue"                            
##  [374] "ORL"                                     
##  [375] "Cardiologue"                             
##  [376] "Dermatologue"                            
##  [377] "Chirurgien/anesthésiste"                 
##  [378] "Cardiologue"                             
##  [379] "Rhumatologue (médecin pour hernie, artht"
##  [380] "Diététicien/nutritionniste"              
##  [381] "NSP"                                     
##  [382] "Radiologue"                              
##  [383] "Diabétologue / endocrinologue"           
##  [384] "Cardiologue"                             
##  [385] "Dermatologue"                            
##  [386] "ORL"                                     
##  [387] "Cardiologue"                             
##  [388] "Gastro-entérologue/hépatologue"          
##  [389] "Gastro-entérologue/hépatologue"          
##  [390] "Cardiologue"                             
##  [391] "Ostéopathe"                              
##  [392] "Orthopédiste"                            
##  [393] "Allergologue"                            
##  [394] "Cancerologue / oncologue"                
##  [395] "Orthopédiste"                            
##  [396] "Cardiologue"                             
##  [397] "Radiologue"                              
##  [398] "Dermatologue"                            
##  [399] "Angiologue"                              
##  [400] "Dermatologue"                            
##  [401] "Chirurgien/anesthésiste"                 
##  [402] "Dermatologue"                            
##  [403] "Nephrologue"                             
##  [404] "Pneumologue"                             
##  [405] "Ostéopathe"                              
##  [406] "Autres non spécialistes"                 
##  [407] "Orthopédiste"                            
##  [408] "Psychiatre/pédopsy"                      
##  [409] "ORL"                                     
##  [410] "ORL"                                     
##  [411] "Rhumatologue (médecin pour hernie, artht"
##  [412] "Angiologue"                              
##  [413] "Psychologue"                             
##  [414] "Ostéopathe"                              
##  [415] "Gastro-entérologue/hépatologue"          
##  [416] "Rhumatologue (médecin pour hernie, artht"
##  [417] "Chirurgien/anesthésiste"                 
##  [418] "Estomac/intestin"                        
##  [419] "Neurologue"                              
##  [420] "Ostéopathe"                              
##  [421] "Diététicien/nutritionniste"              
##  [422] "Allergologue"                            
##  [423] "Dermatologue"                            
##  [424] "Dermatologue"                            
##  [425] "ORL"                                     
##  [426] "Cardiologue"                             
##  [427] "Pédiatre"                                
##  [428] "Phlébologue/veines sans précision"       
##  [429] "Dermatologue"                            
##  [430] "Radiologue"                              
##  [431] "Diabétologue / endocrinologue"           
##  [432] "Neurologue"                              
##  [433] "Dermatologue"                            
##  [434] "Dermatologue"                            
##  [435] "Chirurgien/anesthésiste"                 
##  [436] "Cancerologue / oncologue"                
##  [437] "Diabétologue / endocrinologue"           
##  [438] "Dermatologue"                            
##  [439] "Dermatologue"                            
##  [440] "Cardiologue"                             
##  [441] "Neurologue"                              
##  [442] "Cardiologue"                             
##  [443] "Rhumatologue (médecin pour hernie, artht"
##  [444] "Dermatologue"                            
##  [445] "Urologue"                                
##  [446] "Diététicien/nutritionniste"              
##  [447] "ORL"                                     
##  [448] "Ostéopathe"                              
##  [449] "Ostéopathe"                              
##  [450] "Ostéopathe"                              
##  [451] "Dermatologue"                            
##  [452] "ORL"                                     
##  [453] "Rhumatologue (médecin pour hernie, artht"
##  [454] "Cardiologue"                             
##  [455] "Autres spécialistes"                     
##  [456] "Ostéopathe"                              
##  [457] "Cancerologue / oncologue"                
##  [458] "Autres non spécialistes"                 
##  [459] "Gastro-entérologue/hépatologue"          
##  [460] "Dermatologue"                            
##  [461] "Psychiatre/pédopsy"                      
##  [462] "ORL"                                     
##  [463] "Cardiologue"                             
##  [464] "ORL"                                     
##  [465] "Cardiologue"                             
##  [466] "Podologue"                               
##  [467] "Cardiologue"                             
##  [468] "ORL"                                     
##  [469] "Cardiologue"                             
##  [470] "Rhumatologue (médecin pour hernie, artht"
##  [471] "Chiropracteur/Etiopathe"                 
##  [472] "Rhumatologue (médecin pour hernie, artht"
##  [473] "Gastro-entérologue/hépatologue"          
##  [474] "Psychiatre/pédopsy"                      
##  [475] "Ostéopathe"                              
##  [476] "Neurologue"                              
##  [477] "Diabétologue / endocrinologue"           
##  [478] "Dermatologue"                            
##  [479] "ORL"                                     
##  [480] "Dermatologue"                            
##  [481] "Médecin du sport/du travail"             
##  [482] "Ostéopathe"                              
##  [483] "Rhumatologue (médecin pour hernie, artht"
##  [484] "Cardiologue"                             
##  [485] "Rhumatologue (médecin pour hernie, artht"
##  [486] "Rhumatologue (médecin pour hernie, artht"
##  [487] "ORL"                                     
##  [488] "Cardiologue"                             
##  [489] "Diabétologue / endocrinologue"           
##  [490] "Diététicien/nutritionniste"              
##  [491] "Gastro-entérologue/hépatologue"          
##  [492] "Ostéopathe"                              
##  [493] "Rhumatologue (médecin pour hernie, artht"
##  [494] "Ostéopathe"                              
##  [495] "Cardiologue"                             
##  [496] "Cardiologue"                             
##  [497] "Cardiologue"                             
##  [498] "Diabétologue / endocrinologue"           
##  [499] "Radiologue"                              
##  [500] "Ostéopathe"                              
##  [501] "Rhumatologue (médecin pour hernie, artht"
##  [502] "Autres spécialistes"                     
##  [503] "Gastro-entérologue/hépatologue"          
##  [504] "Cardiologue"                             
##  [505] "Gastro-entérologue/hépatologue"          
##  [506] "Nephrologue"                             
##  [507] "Ostéopathe"                              
##  [508] "Urologue"                                
##  [509] "Ostéopathe"                              
##  [510] "Cardiologue"                             
##  [511] "Nephrologue"                             
##  [512] "Chirurgien/anesthésiste"                 
##  [513] "Stomatologue"                            
##  [514] "ORL"                                     
##  [515] "Neurologue"                              
##  [516] "Radiologue"                              
##  [517] "Gastro-entérologue/hépatologue"          
##  [518] "Cardiologue"                             
##  [519] "Ostéopathe"                              
##  [520] "Cardiologue"                             
##  [521] "Orthopédiste"                            
##  [522] "Dermatologue"                            
##  [523] "Ostéopathe"                              
##  [524] "Cardiologue"                             
##  [525] "Neurologue"                              
##  [526] "Cardiologue"                             
##  [527] "Cardiologue"                             
##  [528] "Diabétologue / endocrinologue"           
##  [529] "Cardiologue"                             
##  [530] "Ostéopathe"                              
##  [531] "Gastro-entérologue/hépatologue"          
##  [532] "ORL"                                     
##  [533] "Neurologue"                              
##  [534] "Nephrologue"                             
##  [535] "Diabétologue / endocrinologue"           
##  [536] "Dermatologue"                            
##  [537] "Cardiologue"                             
##  [538] "Radiologue"                              
##  [539] "Pneumologue"                             
##  [540] "Radiologue"                              
##  [541] "Dermatologue"                            
##  [542] "Ostéopathe"                              
##  [543] "ORL"                                     
##  [544] "Rhumatologue (médecin pour hernie, artht"
##  [545] "Cardiologue"                             
##  [546] "Rhumatologue (médecin pour hernie, artht"
##  [547] "Radiologue"                              
##  [548] "Pneumologue"                             
##  [549] "Diabétologue / endocrinologue"           
##  [550] "Neurologue"                              
##  [551] "Orthopédiste"                            
##  [552] "Dermatologue"                            
##  [553] "Chirurgien/anesthésiste"                 
##  [554] "Diabétologue / endocrinologue"           
##  [555] "NSP"                                     
##  [556] "Cardiologue"                             
##  [557] "Ostéopathe"                              
##  [558] "Cardiologue"                             
##  [559] "ORL"                                     
##  [560] "Podologue"                               
##  [561] "Autres spécialistes"                     
##  [562] "Dermatologue"                            
##  [563] "Radiologue"                              
##  [564] "Cardiologue"                             
##  [565] "Prostate"                                
##  [566] "Cardiologue"                             
##  [567] "ORL"                                     
##  [568] "Allergologue"                            
##  [569] "Cardiologue"                             
##  [570] "Neurologue"                              
##  [571] "NSP"                                     
##  [572] "Gastro-entérologue/hépatologue"          
##  [573] "Dermatologue"                            
##  [574] "Dermatologue"                            
##  [575] "Neurochirurgien"                         
##  [576] "Psychiatre/pédopsy"                      
##  [577] "Neurologue"                              
##  [578] "NSP"                                     
##  [579] "Ostéopathe"                              
##  [580] "Cardiologue"                             
##  [581] "Gastro-entérologue/hépatologue"          
##  [582] "Ostéopathe"                              
##  [583] "Pneumologue"                             
##  [584] "Cardiologue"                             
##  [585] "Allergologue"                            
##  [586] "Diabétologue / endocrinologue"           
##  [587] "Gastro-entérologue/hépatologue"          
##  [588] "Ostéopathe"                              
##  [589] "Phlébologue/veines sans précision"       
##  [590] "Rhumatologue (médecin pour hernie, artht"
##  [591] "Hématologue"                             
##  [592] "Radiologue"                              
##  [593] "ORL"                                     
##  [594] "Cancerologue / oncologue"                
##  [595] "ORL"                                     
##  [596] "Diabétologue / endocrinologue"           
##  [597] "ORL"                                     
##  [598] "Neurologue"                              
##  [599] "Diabétologue / endocrinologue"           
##  [600] "Chirurgien/anesthésiste"                 
##  [601] "Dermatologue"                            
##  [602] "Ostéopathe"                              
##  [603] "Médecin du sport/du travail"             
##  [604] "ORL"                                     
##  [605] "Cardiologue"                             
##  [606] "Autres spécialistes"                     
##  [607] "Dermatologue"                            
##  [608] "ORL"                                     
##  [609] "Dermatologue"                            
##  [610] "Dermatologue"                            
##  [611] "Phlébologue/veines sans précision"       
##  [612] "Neurologue"                              
##  [613] "Prostate"                                
##  [614] "Chirurgien/anesthésiste"                 
##  [615] "Diabétologue / endocrinologue"           
##  [616] "Orthopédiste"                            
##  [617] "Allergologue"                            
##  [618] "Diabétologue / endocrinologue"           
##  [619] "Pneumologue"                             
##  [620] "Cardiologue"                             
##  [621] "Cardiologue"                             
##  [622] "Autres spécialistes"                     
##  [623] "Orthopédiste"                            
##  [624] "Rhumatologue (médecin pour hernie, artht"
##  [625] "Cardiologue"                             
##  [626] "Cardiologue"                             
##  [627] "Ostéopathe"                              
##  [628] "Radiologue"                              
##  [629] "Cancerologue / oncologue"                
##  [630] "Diabétologue / endocrinologue"           
##  [631] "Dermatologue"                            
##  [632] "Cardiologue"                             
##  [633] "Ostéopathe"                              
##  [634] "ORL"                                     
##  [635] "Gastro-entérologue/hépatologue"          
##  [636] "Ostéopathe"                              
##  [637] "Dermatologue"                            
##  [638] "Chirurgien/anesthésiste"                 
##  [639] "Diabétologue / endocrinologue"           
##  [640] "Rhumatologue (médecin pour hernie, artht"
##  [641] "Cardiologue"                             
##  [642] "Radiologue"                              
##  [643] "Cardiologue"                             
##  [644] "Dermatologue"                            
##  [645] "Cardiologue"                             
##  [646] "Ostéopathe"                              
##  [647] "Rhumatologue (médecin pour hernie, artht"
##  [648] "Neurologue"                              
##  [649] "Cardiologue"                             
##  [650] "Cardiologue"                             
##  [651] "Rhumatologue (médecin pour hernie, artht"
##  [652] "Cardiologue"                             
##  [653] "Autres non spécialistes"                 
##  [654] "Cardiologue"                             
##  [655] "Radiologue"                              
##  [656] "ORL"                                     
##  [657] "Dermatologue"                            
##  [658] "Dermatologue"                            
##  [659] "Gastro-entérologue/hépatologue"          
##  [660] "Rhumatologue (médecin pour hernie, artht"
##  [661] "ORL"                                     
##  [662] "Allergologue"                            
##  [663] "Neurochirurgien"                         
##  [664] "Diabétologue / endocrinologue"           
##  [665] "Chirurgien/anesthésiste"                 
##  [666] "Diabétologue / endocrinologue"           
##  [667] "Phlébologue/veines sans précision"       
##  [668] "Phlébologue/veines sans précision"       
##  [669] "ORL"                                     
##  [670] "Gastro-entérologue/hépatologue"          
##  [671] "Neurologue"                              
##  [672] "Nephrologue"                             
##  [673] "Prostate"                                
##  [674] "Dermatologue"                            
##  [675] "Cardiologue"                             
##  [676] "Angiologue"                              
##  [677] "ORL"                                     
##  [678] "Rhumatologue (médecin pour hernie, artht"
##  [679] "Rhumatologue (médecin pour hernie, artht"
##  [680] "Autres spécialistes"                     
##  [681] "Dermatologue"                            
##  [682] "Rhumatologue (médecin pour hernie, artht"
##  [683] "Cardiologue"                             
##  [684] "Rhumatologue (médecin pour hernie, artht"
##  [685] "Diabétologue / endocrinologue"           
##  [686] "Phlébologue/veines sans précision"       
##  [687] "Cardiologue"                             
##  [688] "Neurologue"                              
##  [689] "Diabétologue / endocrinologue"           
##  [690] "Dermatologue"                            
##  [691] "Ostéopathe"                              
##  [692] "Urologue"                                
##  [693] "Ostéopathe"                              
##  [694] "Cardiologue"                             
##  [695] "Cardiologue"                             
##  [696] "Rhumatologue (médecin pour hernie, artht"
##  [697] "Cardiologue"                             
##  [698] "Chirurgien/anesthésiste"                 
##  [699] "Ostéopathe"                              
##  [700] "Ostéopathe"                              
##  [701] "Nephrologue"                             
##  [702] "Ostéopathe"                              
##  [703] "Dermatologue"                            
##  [704] "Chirurgien/anesthésiste"                 
##  [705] "Diabétologue / endocrinologue"           
##  [706] "Ostéopathe"                              
##  [707] "Angiologue"                              
##  [708] "Cancerologue / oncologue"                
##  [709] "Angiologue"                              
##  [710] "Diabétologue / endocrinologue"           
##  [711] "Diététicien/nutritionniste"              
##  [712] "Gastro-entérologue/hépatologue"          
##  [713] "Ostéopathe"                              
##  [714] "Ostéopathe"                              
##  [715] "Allergologue"                            
##  [716] "Chirurgien/anesthésiste"                 
##  [717] "Ostéopathe"                              
##  [718] "Dermatologue"                            
##  [719] "ORL"                                     
##  [720] "Neurologue"                              
##  [721] "Cardiologue"                             
##  [722] "Chirurgien/anesthésiste"                 
##  [723] "ORL"                                     
##  [724] "Urologue"                                
##  [725] "Neurologue"                              
##  [726] "Phlébologue/veines sans précision"       
##  [727] "Acupuncteur"                             
##  [728] "Cardiologue"                             
##  [729] "Neurologue"                              
##  [730] "Autres spécialistes"                     
##  [731] "Neurologue"                              
##  [732] "Spécialiste jambes, genous"              
##  [733] "Ostéopathe"                              
##  [734] "Rhumatologue (médecin pour hernie, artht"
##  [735] "Cardiologue"                             
##  [736] "Cardiologue"                             
##  [737] "Ostéopathe"                              
##  [738] "ORL"                                     
##  [739] "Chirurgien/anesthésiste"                 
##  [740] "Pneumologue"                             
##  [741] "Psychiatre/pédopsy"                      
##  [742] "ORL"                                     
##  [743] "Dermatologue"                            
##  [744] "Cancerologue / oncologue"                
##  [745] "ORL"                                     
##  [746] "Cardiologue"                             
##  [747] "Rhumatologue (médecin pour hernie, artht"
##  [748] "Gastro-entérologue/hépatologue"          
##  [749] "Rhumatologue (médecin pour hernie, artht"
##  [750] "Cardiologue"                             
##  [751] "Phlébologue/veines sans précision"       
##  [752] "Dermatologue"                            
##  [753] "Cardiologue"                             
##  [754] "Cardiologue"                             
##  [755] "Dermatologue"                            
##  [756] "Dermatologue"                            
##  [757] "Chirurgien/anesthésiste"                 
##  [758] "Psychologue"                             
##  [759] "Cardiologue"                             
##  [760] "Cardiologue"                             
##  [761] "Chirurgien/anesthésiste"                 
##  [762] "Rhumatologue (médecin pour hernie, artht"
##  [763] "Podologue"                               
##  [764] "Cardiologue"                             
##  [765] "Podologue"                               
##  [766] "ORL"                                     
##  [767] "Chirurgien/anesthésiste"                 
##  [768] "Cardiologue"                             
##  [769] "Cardiologue"                             
##  [770] "NSP"                                     
##  [771] "Cardiologue"                             
##  [772] "Ostéopathe"                              
##  [773] "Rhumatologue (médecin pour hernie, artht"
##  [774] "Prostate"                                
##  [775] "Ostéopathe"                              
##  [776] "Chirurgien/anesthésiste"                 
##  [777] "Dermatologue"                            
##  [778] "Autres non spécialistes"                 
##  [779] "Rhumatologue (médecin pour hernie, artht"
##  [780] "Gastro-entérologue/hépatologue"          
##  [781] "Dermatologue"                            
##  [782] "Dermatologue"                            
##  [783] "Neurologue"                              
##  [784] "Diabétologue / endocrinologue"           
##  [785] "Gastro-entérologue/hépatologue"          
##  [786] "Dermatologue"                            
##  [787] "Psychiatre/pédopsy"                      
##  [788] "Chirurgien/anesthésiste"                 
##  [789] "ORL"                                     
##  [790] "Phlébologue/veines sans précision"       
##  [791] "Cardiologue"                             
##  [792] "Cardiologue"                             
##  [793] "ORL"                                     
##  [794] "Cardiologue"                             
##  [795] "ORL"                                     
##  [796] "Dermatologue"                            
##  [797] "Diabétologue / endocrinologue"           
##  [798] "ORL"                                     
##  [799] "Chirurgien/anesthésiste"                 
##  [800] "ORL"                                     
##  [801] "Cardiologue"                             
##  [802] "Urologue"                                
##  [803] "Gastro-entérologue/hépatologue"          
##  [804] "Cardiologue"                             
##  [805] "NSP"                                     
##  [806] "Dermatologue"                            
##  [807] "Ostéopathe"                              
##  [808] "Psychiatre/pédopsy"                      
##  [809] "Dermatologue"                            
##  [810] "Cardiologue"                             
##  [811] "Ostéopathe"                              
##  [812] "Urologue"                                
##  [813] "Urologue"                                
##  [814] "Angiologue"                              
##  [815] "Ostéopathe"                              
##  [816] "Ortho-dentiste"                          
##  [817] "Angiologue"                              
##  [818] "Chirurgien/anesthésiste"                 
##  [819] "Chirurgien/anesthésiste"                 
##  [820] "Allergologue"                            
##  [821] "Ostéopathe"                              
##  [822] "Rhumatologue (médecin pour hernie, artht"
##  [823] "Rhumatologue (médecin pour hernie, artht"
##  [824] "Podologue"                               
##  [825] "Diabétologue / endocrinologue"           
##  [826] "Radiologue"                              
##  [827] "Chirurgien/anesthésiste"                 
##  [828] "Diabétologue / endocrinologue"           
##  [829] "Cardiologue"                             
##  [830] "Phlébologue/veines sans précision"       
##  [831] "Diabétologue / endocrinologue"           
##  [832] "Dermatologue"                            
##  [833] "Radiologue"                              
##  [834] "ORL"                                     
##  [835] "Cardiologue"                             
##  [836] "ORL"                                     
##  [837] "Dermatologue"                            
##  [838] "Radiologue"                              
##  [839] "Ostéopathe"                              
##  [840] "Neurologue"                              
##  [841] "ORL"                                     
##  [842] "Pneumologue"                             
##  [843] "Homéopathe"                              
##  [844] "Radiologue"                              
##  [845] "Cardiologue"                             
##  [846] "Dermatologue"                            
##  [847] "Dermatologue"                            
##  [848] "Dermatologue"                            
##  [849] "Radiologue"                              
##  [850] "Psychologue"                             
##  [851] "Ostéopathe"                              
##  [852] "Allergologue"                            
##  [853] "Gastro-entérologue/hépatologue"          
##  [854] "Ortho-dentiste"                          
##  [855] "Allergologue"                            
##  [856] "Cardiologue"                             
##  [857] "Ostéopathe"                              
##  [858] "Ostéopathe"                              
##  [859] "Dermatologue"                            
##  [860] "Autres non spécialistes"                 
##  [861] "Rhumatologue (médecin pour hernie, artht"
##  [862] "Cardiologue"                             
##  [863] "Dermatologue"                            
##  [864] "Cancerologue / oncologue"                
##  [865] "Chiropracteur/Etiopathe"                 
##  [866] "Dermatologue"                            
##  [867] "Ostéopathe"                              
##  [868] "ORL"                                     
##  [869] "Autres spécialistes"                     
##  [870] "Diététicien/nutritionniste"              
##  [871] "Nephrologue"                             
##  [872] "Cardiologue"                             
##  [873] "Cardiologue"                             
##  [874] "ORL"                                     
##  [875] "ORL"                                     
##  [876] "Chirurgien/anesthésiste"                 
##  [877] "Ostéopathe"                              
##  [878] "Gastro-entérologue/hépatologue"          
##  [879] "Cardiologue"                             
##  [880] "ORL"                                     
##  [881] "Rhumatologue (médecin pour hernie, artht"
##  [882] "Cardiologue"                             
##  [883] "Dermatologue"                            
##  [884] "Neurologue"                              
##  [885] "ORL"                                     
##  [886] "Cardiologue"                             
##  [887] "Prostate"                                
##  [888] "Dermatologue"                            
##  [889] "Cardiologue"                             
##  [890] "ORL"                                     
##  [891] "Cardiologue"                             
##  [892] "Chirurgien/anesthésiste"                 
##  [893] "Rhumatologue (médecin pour hernie, artht"
##  [894] "ORL"                                     
##  [895] "Cardiologue"                             
##  [896] "Diabétologue / endocrinologue"           
##  [897] "Radiologue"                              
##  [898] "ORL"                                     
##  [899] "Cardiologue"                             
##  [900] "Cardiologue"                             
##  [901] "Neurologue"                              
##  [902] "Cardiologue"                             
##  [903] "Phlébologue/veines sans précision"       
##  [904] "Cardiologue"                             
##  [905] "Radiologue"                              
##  [906] "Nephrologue"                             
##  [907] "Cardiologue"                             
##  [908] "Diabétologue / endocrinologue"           
##  [909] "Ostéopathe"                              
##  [910] "Diabétologue / endocrinologue"           
##  [911] "Cardiologue"                             
##  [912] "Cardiologue"                             
##  [913] "Rhumatologue (médecin pour hernie, artht"
##  [914] "Ostéopathe"                              
##  [915] "Chirurgien/anesthésiste"                 
##  [916] "Autres spécialistes"                     
##  [917] "Radiologue"                              
##  [918] "Ostéopathe"                              
##  [919] "Pneumologue"                             
##  [920] "Cardiologue"                             
##  [921] "Pneumologue"                             
##  [922] "Cardiologue"                             
##  [923] "Urologue"                                
##  [924] "Rhumatologue (médecin pour hernie, artht"
##  [925] "Radiologue"                              
##  [926] "Ortho-dentiste"                          
##  [927] "Cardiologue"                             
##  [928] "Allergologue"                            
##  [929] "Nephrologue"                             
##  [930] "Neurologue"                              
##  [931] "Diabétologue / endocrinologue"           
##  [932] "Diabétologue / endocrinologue"           
##  [933] "Neurochirurgien"                         
##  [934] "Cardiologue"                             
##  [935] "Cardiologue"                             
##  [936] "Pneumologue"                             
##  [937] "Ostéopathe"                              
##  [938] "Diabétologue / endocrinologue"           
##  [939] "Orthopédiste"                            
##  [940] "ORL"                                     
##  [941] "Chirurgien/anesthésiste"                 
##  [942] "Cardiologue"                             
##  [943] "Dermatologue"                            
##  [944] "Podologue"                               
##  [945] "Diététicien/nutritionniste"              
##  [946] "Cardiologue"                             
##  [947] "Cancerologue / oncologue"                
##  [948] "Psychiatre/pédopsy"                      
##  [949] "Allergologue"                            
##  [950] "Nephrologue"                             
##  [951] "Rhumatologue (médecin pour hernie, artht"
##  [952] "Cardiologue"                             
##  [953] "Phlébologue/veines sans précision"       
##  [954] "ORL"                                     
##  [955] "Cardiologue"                             
##  [956] "Neurologue"                              
##  [957] "Rhumatologue (médecin pour hernie, artht"
##  [958] "Cardiologue"                             
##  [959] "Médecin du sport/du travail"             
##  [960] "Radiologue"                              
##  [961] "Gastro-entérologue/hépatologue"          
##  [962] "Radiologue"                              
##  [963] "Cardiologue"                             
##  [964] "Dermatologue"                            
##  [965] "Prostate"                                
##  [966] "Podologue"                               
##  [967] "Ostéopathe"                              
##  [968] "Allergologue"                            
##  [969] "Dermatologue"                            
##  [970] "Radiologue"                              
##  [971] "Gastro-entérologue/hépatologue"          
##  [972] "Autres spécialistes"                     
##  [973] "Pneumologue"                             
##  [974] "Chirurgien/anesthésiste"                 
##  [975] "Ostéopathe"                              
##  [976] "Orthoptiste"                             
##  [977] "Gastro-entérologue/hépatologue"          
##  [978] "Spécialiste jambes, genous"              
##  [979] "Cardiologue"                             
##  [980] "Podologue"                               
##  [981] "Rhumatologue (médecin pour hernie, artht"
##  [982] "Ortho-dentiste"                          
##  [983] "Cardiologue"                             
##  [984] "Diabétologue / endocrinologue"           
##  [985] "Cancerologue / oncologue"                
##  [986] "Diététicien/nutritionniste"              
##  [987] "Diabétologue / endocrinologue"           
##  [988] "Ortho-dentiste"                          
##  [989] "Autres spécialistes"                     
##  [990] "Rhumatologue (médecin pour hernie, artht"
##  [991] "Autres spécialistes"                     
##  [992] "ORL"                                     
##  [993] "Gastro-entérologue/hépatologue"          
##  [994] "Cardiologue"                             
##  [995] "Neurologue"                              
##  [996] "Cardiologue"                             
##  [997] "Chirurgien/anesthésiste"                 
##  [998] "Neurologue"                              
##  [999] "Ostéopathe"                              
## [1000] "Rhumatologue (médecin pour hernie, artht"

Retour aux PROC classiques

Proc FREQ 100% paramétrable

Un équivalent proc freq avec des ajustements de mise en forme : pourcentage avec symbole % et arrondi à 2 décimales.
lapply(data_sas%>%
         select_if(is.factor)%>%.[,1:10],
       function(x){
        x%>%
           tibble()%>%
           group_by_all()%>%
           summarise(volume=n(),
                     len=length(x),
                     freq_pct=round(100*volume/len,2),
                     freq_print=paste0(freq_pct,"%")
                     )%>%
           arrange(-freq_pct)%>%
           select(-volume,-len,-freq_pct)
})
## $mc27s1
## # A tibble: 3 x 2
##   .     freq_print
##   <fct> <chr>     
## 1 ""    97.8%     
## 2 non   1.35%     
## 3 oui   0.85%     
## 
## $mc27s2
## # A tibble: 4 x 2
##   .     freq_print
##   <fct> <chr>     
## 1 ""    79.82%    
## 2 oui   16.8%     
## 3 non   3.38%     
## 4 [nsp] 0.01%     
## 
## $mc27s3
## # A tibble: 3 x 2
##   .     freq_print
##   <fct> <chr>     
## 1 ""    98.44%    
## 2 n     1.52%     
## 3 o     0.05%     
## 
## $mc27s4
## # A tibble: 4 x 2
##   .     freq_print
##   <fct> <chr>     
## 1 ""    85.35%    
## 2 oui   8.55%     
## 3 non   6.09%     
## 4 [nsp] 0%        
## 
## $mc27s5
## # A tibble: 4 x 2
##   .     freq_print
##   <fct> <chr>     
## 1 ""    73.52%    
## 2 non   24.35%    
## 3 oui   2.13%     
## 4 [nsp] 0%        
## 
## $mc27s6
## # A tibble: 4 x 2
##   .     freq_print
##   <fct> <chr>     
## 1 ""    73.52%    
## 2 oui   15.46%    
## 3 non   11.01%    
## 4 [nsp] 0.01%     
## 
## $mc27s7
## # A tibble: 4 x 2
##   .     freq_print
##   <fct> <chr>     
## 1 ""    73.52%    
## 2 non   24.3%     
## 3 oui   2.12%     
## 4 [nsp] 0.06%     
## 
## $mc27s8
## # A tibble: 4 x 2
##   .     freq_print
##   <fct> <chr>     
## 1 ""    73.52%    
## 2 non   25.36%    
## 3 oui   1.11%     
## 4 [nsp] 0.02%     
## 
## $mc27s9
## # A tibble: 4 x 2
##   .     freq_print
##   <fct> <chr>     
## 1 ""    79.82%    
## 2 non   13.37%    
## 3 oui   6.81%     
## 4 [nsp] 0.01%     
## 
## $pcs7
## # A tibble: 8 x 2
##   .                                      freq_print
##   <fct>                                  <chr>     
## 1 Employés                               29.49%    
## 2 Professions intermédiaires...          25.89%    
## 3 Ouvriers                               19.08%    
## 4 Cadres, professions intellectuelles... 16.06%    
## 5 Artisans, commerçants,...              5.92%     
## 6 Agriculteurs exploitants               1.66%     
## 7 ""                                     0.95%     
## 8 Sans activite (DOM seulement)          0.95%

proc means, univariate, summary

data_sas%>%
  filter(DEP%in%c("Métropole","Martinique"))%>%
  filter(!is.na(mh5_score))%>%
  group_by(age,sexe)%>%
  summarise(
    volume=n(),
    pond=sum(poids_ind),
    bonnesante_w=weighted.mean(bonnesante,w=poids_ind,na.rm=T),
    mh5_score_dec1=quantile(mh5_score,.1),
    mh5_score_dec9=quantile(mh5_score,.9),
    mh5_score_sd=sd(mh5_score),
    mh5_score_cl_inf=t.test(mh5_score)$conf.int[1],
    mh5_score_cl_sup=t.test(mh5_score)$conf.int[2],
    pbdent_w=weighted.mean(pbdent,w=poids_ind,na.rm=T))%>%
  arrange(age)

Outils supplémentaires

les boucles

cf formation

do i = 1 %to 4

for (i in 1:4){
  print(i^2)
}
## [1] 1
## [1] 4
## [1] 9
## [1] 16

les fonctions/macro

cf formation

GLM

GLM basique

GLM, choix des levels dans le GLM

https://stackoverflow.com/questions/23282048/logistic-regression-defining-reference-level-in-r
data_sas%>%
  mutate(sexe = relevel(sexe, ref = "Femmes"),
         sd_diplome3 = relevel(sd_diplome3, ref = "< Bac"),
         sd_sitprof_6 = relevel(sd_sitprof_6, ref = "Chomage"),
         sit_financiere_percue = relevel(sit_financiere_percue, ref = "Ca va"),
         sd_revenus_3K = relevel(sd_revenus_3K, ref = "1er tercile (faible)")
  ) -> data_sas


logistic <- glm(bonnesante ~ age + sexe + sd_diplome3 + sd_sitprof_6 + sit_financiere_percue + sd_revenus_3K ,family=binomial(link=logit), data=data_sas%>%filter(DEP=="Métropole"), na.action = na.exclude)

summary(logistic)
## 
## Call:
## glm(formula = bonnesante ~ age + sexe + sd_diplome3 + sd_sitprof_6 + 
##     sit_financiere_percue + sd_revenus_3K, family = binomial(link = logit), 
##     data = data_sas %>% filter(DEP == "Métropole"), na.action = na.exclude)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.1462  -1.2005   0.6448   0.8555   1.5527  
## 
## Coefficients:
##                                          Estimate Std. Error z value
## (Intercept)                              2.119346   0.204001  10.389
## age                                     -0.027873   0.003421  -8.148
## sexeHommes                               0.128928   0.065129   1.980
## sd_diplome3                             12.641911 227.624984   0.056
## sd_diplome3> Bac                         0.368788   0.078637   4.690
## sd_diplome3Bac                           0.085883   0.087801   0.978
## sd_sitprof_6                             0.232424   1.177101   0.197
## sd_sitprof_6Autres ina                  -0.318371   0.179432  -1.774
## sd_sitprof_6Etudes                      -0.154651   0.189683  -0.815
## sd_sitprof_6Retraite                    -0.099666   0.162678  -0.613
## sd_sitprof_6Travail                     -0.060831   0.129616  -0.469
## sit_financiere_percue                    0.266234   0.583074   0.457
## sit_financiere_percueA l'aise            0.252130   0.101075   2.494
## sit_financiere_percueC'est difficile    -0.682505   0.109218  -6.249
## sit_financiere_percueC'est juste        -0.216673   0.080200  -2.702
## sit_financiere_percueN'y arrive pas sa  -1.062393   0.183790  -5.780
## sd_revenus_3K2nd tercile                 0.060777   0.089305   0.681
## sd_revenus_3K3ème tercile (élevé)        0.096390   0.100669   0.957
## sd_revenus_3KNSP/Refus                   0.218558   0.157462   1.388
##                                        Pr(>|z|)    
## (Intercept)                             < 2e-16 ***
## age                                    3.69e-16 ***
## sexeHommes                               0.0478 *  
## sd_diplome3                              0.9557    
## sd_diplome3> Bac                       2.74e-06 ***
## sd_diplome3Bac                           0.3280    
## sd_sitprof_6                             0.8435    
## sd_sitprof_6Autres ina                   0.0760 .  
## sd_sitprof_6Etudes                       0.4149    
## sd_sitprof_6Retraite                     0.5401    
## sd_sitprof_6Travail                      0.6388    
## sit_financiere_percue                    0.6480    
## sit_financiere_percueA l'aise            0.0126 *  
## sit_financiere_percueC'est difficile   4.13e-10 ***
## sit_financiere_percueC'est juste         0.0069 ** 
## sit_financiere_percueN'y arrive pas sa 7.45e-09 ***
## sd_revenus_3K2nd tercile                 0.4962    
## sd_revenus_3K3ème tercile (élevé)        0.3383    
## sd_revenus_3KNSP/Refus                   0.1651    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 6221.0  on 5129  degrees of freedom
## Residual deviance: 5842.3  on 5111  degrees of freedom
##   (19078 observations deleted due to missingness)
## AIC: 5880.3
## 
## Number of Fisher Scoring iterations: 12

GLM interactions

logistic <- glm(bonnesante ~ tage*sexe + sd_diplome3 + sd_sitprof_6 + sit_financiere_percue + sd_revenus_3K ,family=binomial(link=logit), data=data_sas%>%filter(DEP=="Métropole"), na.action = na.exclude)

summary(logistic)
## 
## Call:
## glm(formula = bonnesante ~ tage * sexe + sd_diplome3 + sd_sitprof_6 + 
##     sit_financiere_percue + sd_revenus_3K, family = binomial(link = logit), 
##     data = data_sas %>% filter(DEP == "Métropole"), na.action = na.exclude)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.4156  -1.1985   0.6457   0.8453   1.5514  
## 
## Coefficients:
##                                          Estimate Std. Error z value
## (Intercept)                              2.232618   0.777538   2.871
## tage(15,20]                             -1.196577   0.766194  -1.562
## tage(20,30]                             -0.756945   0.775132  -0.977
## tage(30,40]                             -1.010180   0.779019  -1.297
## tage(40,50]                             -1.329428   0.776598  -1.712
## tage(50,60]                             -1.708404   0.776273  -2.201
## tage(60,70]                             -1.941488   0.786580  -2.468
## tage(70,75]                             -2.368904   0.803072  -2.950
## sexeHommes                               0.237581   1.042046   0.228
## sd_diplome3                             12.736208 227.218117   0.056
## sd_diplome3> Bac                         0.349902   0.080998   4.320
## sd_diplome3Bac                           0.099249   0.088535   1.121
## sd_sitprof_6                             0.178972   1.187745   0.151
## sd_sitprof_6Autres ina                  -0.345126   0.179686  -1.921
## sd_sitprof_6Etudes                       0.125723   0.225268   0.558
## sd_sitprof_6Retraite                    -0.017245   0.189056  -0.091
## sd_sitprof_6Travail                     -0.098923   0.130210  -0.760
## sit_financiere_percue                    0.183084   0.583355   0.314
## sit_financiere_percueA l'aise            0.266062   0.101525   2.621
## sit_financiere_percueC'est difficile    -0.692915   0.109691  -6.317
## sit_financiere_percueC'est juste        -0.224301   0.080430  -2.789
## sit_financiere_percueN'y arrive pas sa  -1.072809   0.184371  -5.819
## sd_revenus_3K2nd tercile                 0.058783   0.089665   0.656
## sd_revenus_3K3ème tercile (élevé)        0.109055   0.101787   1.071
## sd_revenus_3KNSP/Refus                   0.234504   0.158095   1.483
## tage(15,20]:sexeHommes                   0.053656   1.082428   0.050
## tage(20,30]:sexeHommes                  -0.322285   1.058855  -0.304
## tage(30,40]:sexeHommes                  -0.156002   1.054517  -0.148
## tage(40,50]:sexeHommes                   0.022663   1.051503   0.022
## tage(50,60]:sexeHommes                  -0.004661   1.051040  -0.004
## tage(60,70]:sexeHommes                  -0.250418   1.052658  -0.238
## tage(70,75]:sexeHommes                  -0.203240   1.079078  -0.188
##                                        Pr(>|z|)    
## (Intercept)                             0.00409 ** 
## tage(15,20]                             0.11836    
## tage(20,30]                             0.32880    
## tage(30,40]                             0.19472    
## tage(40,50]                             0.08692 .  
## tage(50,60]                             0.02775 *  
## tage(60,70]                             0.01358 *  
## tage(70,75]                             0.00318 ** 
## sexeHommes                              0.81965    
## sd_diplome3                             0.95530    
## sd_diplome3> Bac                       1.56e-05 ***
## sd_diplome3Bac                          0.26228    
## sd_sitprof_6                            0.88023    
## sd_sitprof_6Autres ina                  0.05477 .  
## sd_sitprof_6Etudes                      0.57677    
## sd_sitprof_6Retraite                    0.92732    
## sd_sitprof_6Travail                     0.44742    
## sit_financiere_percue                   0.75364    
## sit_financiere_percueA l'aise           0.00878 ** 
## sit_financiere_percueC'est difficile   2.67e-10 ***
## sit_financiere_percueC'est juste        0.00529 ** 
## sit_financiere_percueN'y arrive pas sa 5.93e-09 ***
## sd_revenus_3K2nd tercile                0.51209    
## sd_revenus_3K3ème tercile (élevé)       0.28399    
## sd_revenus_3KNSP/Refus                  0.13799    
## tage(15,20]:sexeHommes                  0.96046    
## tage(20,30]:sexeHommes                  0.76085    
## tage(30,40]:sexeHommes                  0.88239    
## tage(40,50]:sexeHommes                  0.98280    
## tage(50,60]:sexeHommes                  0.99646    
## tage(60,70]:sexeHommes                  0.81197    
## tage(70,75]:sexeHommes                  0.85061    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 6221.0  on 5129  degrees of freedom
## Residual deviance: 5826.2  on 5098  degrees of freedom
##   (19078 observations deleted due to missingness)
## AIC: 5890.2
## 
## Number of Fisher Scoring iterations: 12

Stepwise

Il est bien sûr possible de sélectionner des variables par méthode stepwise/forward/backward de manière “brutale” (brute-force), mais ce n’est pas recommandé pour de nombreuses raisons dont le risque d’overfitting et les temps de calcul trop longs.
  • MASS::stepAIC
  • stats::step

régularisation/pénalisation (RIDGING)

Le package glmnet permet de faire des régressions L1 (LASSO), L2 (RIDGE) et Elastic-Net (mix L1-L2).
Vous trouverez dans la documentation de très bons exemples en bas du document.

Invocation de script R depuis SAS

Un exemple concret a été réalisé dans le contexte d’un projet de microsimulation des retraites. Une brique intermédiaire d’imputation a été codée en R et est maintenant invoquée depuis le “main.sas”.
Pour cela il faut
  • Installer R sur l’ordinateur
  • Trouver le chemin vers le fichier Rscript.exe, dans mon cas C:\Users\phileas.condemine\Documents\R\R-3.4.3\bin\Rscript.exe
  • Trouver le chemin vers le script R à éxécuter, dans mon cas C:\Users\phileas.condemine\Documents\MicroSim\retraite\Programmes_R\Import_data_R.R
  • Un certain nombre de paramètres peuvent être renseignés dans la fonction, dans ce cas on a 5 paramètres : generation, working_directory, output_directory, path_to_excel_input, path_to_sas_input. Il faut renseigner les paramètres dans le bon ordre.
  • L’appel de R par SAS s’appuie sur la fonction pipe.
  • Voici le programme SAS qui invoque le script R.
options noxwait xsync;
filename proc_r pipe "C:\Users\phileas.condemine\Documents\R\R-3.4.3\bin\Rscript.exe --vanilla C:\Users\phileas.condemine\Documents\MicroSim\retraite\Programmes_R\Import_data_R.R 1976 C:/Users/phileas.condemine/Documents/MicroSim/retraite/ base_en_sortie/ Base_en_entree/ import_prepared_by_sas/";
data _null_;
infile proc_r;
run;

Documentation

https://gitlab.com/DREES_code/OUTILS/Trucs_et_Astuces_en_R

Une documentation SAS->R à destination des statisticiens en laboratoires pharmaceutiques :
https://www.lexjansen.com/phuse/2014/ad/AD04.pdf
références aux PROC : IMPORT, CONTENTS, SQL, PRINT, MEANS, BOXPLOT, TTEST, SGPANEL, GLM, REG, ANOVA, MIXED, DOCUMENT