Ce notebook propose une introduction au data management avec le langage R
et s’appuyant principalement sur le package dplyr
.
Nous terminons ce notebook par un exemple d’appel de script R
dans SAS
et la réalisation d’un modèle de régression logistique.
Pour le data management on va principalement s’appuyer sur la librairie dplyr
, on pourrait aussi utiliser data.table
. Pour le chargement de tables SAS on utilise la librarie haven
. Pour réaliser des graphiques on utilise ggplot2
.
library(dplyr)
library(data.table)
library(haven)
library(ggplot2)
Pour charger une table SAS en mémoire dans un data.frame on utilise la fonction read_sas
.
Pour charger un fichier CSV dans un data.frame on peut utiliser les fonctions read.csv
ou read.csv2
.
Le format SAS est bien plus lourd à lire que le format csv, pour gagner du temps de lecture on préférera les exports en CSV.
[Facultatif] Pour des questions de simplicité et de performance on préférera souvent la fonction fread
(fast read) qui demande moins de paramétrage et est souvent bien plus rapide. Cette fonction provient du package data.table
et charge les tables dans un format dérivé des data.frame
qui s’appelle les data.table
. La syntaxe est différente mais on peut facilement passer de data.frame à data.table et réciproquement pour jongler entre les différentes syntaxes.
Tout comme SAS génère des tables SAS, R peut générer des exports dans un format optimisé pour R, ce format est RData, on sauvegarde/charge ce format avec les fonctions save
/load
.
data_sas <- haven::read_sas("data/barometre2016_fin.sas7bdat")
data_csv <- data.table::fread("data/barometre2016_fin.csv")
load("data/barometre2016_fin.RData")
On peut écrire des fichiers SAS avec la fonction write_sas()
pour conserver les formats, mais pour aller au plus vite et au plus standard on préférera écrire des CSV
haven::write_sas(data = data_sas,path = "data/barometre2016_fin_fromR.sas7bdat")
save(list=c("data_sas"),file="data/barometre2016_fin.RData")
data.table::fwrite(x = data_sas,file = "data/barometre2016_fin.csv")
names
.
names(data_sas)
## [1] "mc26s1" "mc26s2"
## [3] "mc26s3" "mc26s4"
## [5] "mc26s5" "mc26s6"
## [7] "mc27s1" "mc27s2"
## [9] "mc27s3" "mc27s4"
## [11] "mc27s5" "mc27s6"
## [13] "mc27s7" "mc27s8"
## [15] "mc27s9" "age"
## [17] "pcs7" "sexe"
## [19] "sit16" "sd_sitprof_6"
## [21] "mh5_score" "DEP"
## [23] "annee" "poids_ind"
## [25] "poids_ind_metro" "sit_financiere_percue"
## [27] "sit_financiere_percue_3" "sd_diplome3"
## [29] "sd_revenus_3K" "sd_vitseul"
## [31] "consult_mg" "consult_dentiste"
## [33] "consult_gyneco" "Q4_1"
## [35] "Q4_2" "Q4_3"
## [37] "Q4_4" "Q4_5"
## [39] "Q4_6" "Q4_7"
## [41] "Q4_8" "Q5_1"
## [43] "Q5_2" "Q5_3"
## [45] "Q5_4" "Q5_5"
## [47] "Q5_6" "Q5_7"
## [49] "Q5_8" "Q6_1"
## [51] "Q6_2" "Q6_3"
## [53] "Q6_4" "Q6_5"
## [55] "Q6_6" "Q6_7"
## [57] "Q6_8" "Q9"
## [59] "Q22" "Q23"
## [61] "Q24" "Q25"
## [63] "Q26" "Q27"
## [65] "Q28" "Q29"
## [67] "Q30" "Q31_1"
## [69] "Q31_2" "Q31_3"
## [71] "Q31_4" "Q31_5"
## [73] "Q31_6" "Q31_7"
## [75] "Q31_8" "Q31_9"
## [77] "Q31_10" "Q32_spec_1"
## [79] "Q32_spec_2" "Q32_spec_3"
## [81] "Q32_spec_4" "Q32_spec_5"
## [83] "Q33_1_lieu1" "Q33_1_lieu2"
## [85] "Q33_1_lieu3" "Q33_2_lieu1"
## [87] "Q33_2_lieu2" "Q33_3_lieu1"
## [89] "Q33_3_lieu2" "Q33_4_lieu1"
## [91] "Q33_4_lieu2" "Q33_5_lieu1"
## [93] "Q33_5_lieu2" "Q33_5_lieu3"
## [95] "Q33_6_lieu1" "Q33_6_lieu2"
## [97] "Q33_7_lieu1" "Q33_7_lieu2"
## [99] "Q33_7_lieu3" "Q33_8_lieu1"
## [101] "Q33_9_lieu1" "Q33_10_lieu1"
## [103] "Q35" "Q36"
## [105] "Q37" "Q38"
## [107] "Q39_1" "Q39_2"
## [109] "Q39_3" "Q39_4"
## [111] "Q40_1" "Q40_2"
## [113] "Q40_3" "Q41_1"
## [115] "Q41_2" "Q41_3"
## [117] "Q41_4" "Q41_5"
## [119] "Q41_6" "Q41_7"
## [121] "Q42_1" "Q42_2"
## [123] "Q43_1" "Q43_2"
## [125] "Q43_3" "Q43_4"
## [127] "Q44" "Q45"
## [129] "Q46" "Q47"
## [131] "Q48" "Q49_1"
## [133] "Q49_2" "Q49_3"
## [135] "Q49_4" "Q49_5"
## [137] "pcscdf" "pcsind"
## [139] "sd_nbhabitant" "sd_nbhabitant_inf14"
## [141] "sd_nbhabitant_sup76" "sd_nbenfants_inf15"
## [143] "sd_nbenfants_inf14" "sd_habite_en_couple"
## [145] "mini1" "mini2"
## [147] "mini3" "Renoncement_1"
## [149] "Renoncement_2" "Renoncement_3"
## [151] "Renoncement_4" "Renoncement_5"
## [153] "Renoncement_6" "Renoncement_7"
## [155] "rsa" "francais_parle"
## [157] "ne_DOM" "complementaire"
## [159] "cf1" "cf4_1"
## [161] "cf4_2" "cf4_3"
## [163] "cf4_4" "cf4_5"
## [165] "cf4_6" "cf4_7"
## [167] "cf4_8" "cf4_9"
## [169] "cf4_10" "cf4_11"
## [171] "cf4_12" "cf5_1"
## [173] "cf5_2" "cf5_3"
## [175] "cf5_4" "cf5_5"
## [177] "cf5_6" "cf5_7"
## [179] "cf5_8" "cf5_9"
## [181] "cf5_10" "cf5_11"
## [183] "cf5_12" "rs5_2r"
## [185] "rs5_3r" "rs5_4r"
## [187] "rs5_5r" "rs5_6r"
## [189] "rs5_7r" "rs5_8r"
## [191] "rs5_9r" "rs5_10r"
## [193] "rs5_11r" "rs5_12r"
## [195] "qv20" "qv20b"
## [197] "qv20b2" "qv20c"
## [199] "qv20d" "sb1"
## [201] "sb2" "sb3"
## [203] "sb4" "sb5"
## [205] "rsprec3_1" "rsprec3_2"
## [207] "rsprec3_3" "rsprec3_4"
## [209] "rsprec3_5" "rsprec3_6"
## [211] "rsprec3_7" "rsprec3_8r1"
## [213] "rsprec3_8r2" "mini1a"
## [215] "mini1b" "enfant1"
## [217] "enfant2" "enfant3"
## [219] "enfant4" "enfant5"
## [221] "enfant6" "enfant7"
## [223] "enfant8" "enfant9"
## [225] "age_4" "comp"
## [227] "enfants" "age2"
## [229] "ech_sante" "bonnesante"
## [231] "mauvsante" "lim_forte"
## [233] "mal_chro" "limitation"
## [235] "sante_bd" "freq_dent"
## [237] "pbdent" "trouble_vis1"
## [239] "trouble_vis" "lunettes"
## [241] "vuenoncorr" "vuemalcorr"
## [243] "consult_spe" "consult_opht"
## [245] "renoncement_soin_fin" "renoncement_soin_nonfin"
## [247] "renoncement_soin"
On peut décider de renommer une variable avec la fonction rename
. Par exemple on veut renommer les variables DEP et sexe en zone et genre
data_sas%>%rename(zone=DEP,genre=sexe)%>%
select(zone,genre)
On peut connaître les dimensions de la table avec les fonctions dim
nrow
ncol
dim(data_sas)
## [1] 32371 247
ncol(data_sas)
## [1] 247
nrow(data_sas)
## [1] 32371
str
comme structure pour connaître la structure de chaque variable : type et première observations.
str(data_sas)
## Classes 'tbl_df', 'tbl' and 'data.frame': 32371 obs. of 247 variables:
## $ mc26s1 : atomic 5 NA NA NA NA NA NA 5 NA NA ...
## ..- attr(*, "format.sas")= chr "BEST"
## $ mc26s2 : atomic NA NA NA NA NA NA NA 0 NA NA ...
## ..- attr(*, "format.sas")= chr "BEST"
## $ mc26s3 : atomic 1 NA NA NA NA NA NA 3 NA NA ...
## ..- attr(*, "format.sas")= chr "BEST"
## $ mc26s4 : atomic 0 NA NA NA NA NA NA 0 NA NA ...
## ..- attr(*, "format.sas")= chr "BEST"
## $ mc26s5 : atomic 0 NA NA NA NA NA NA 0 NA NA ...
## ..- attr(*, "format.sas")= chr "BEST"
## $ mc26s6 : atomic 0 NA NA NA NA NA NA 0 NA NA ...
## ..- attr(*, "format.sas")= chr "BEST"
## $ mc27s1 : Factor w/ 3 levels "","non","oui": 1 1 1 1 1 1 1 3 1 1 ...
## $ mc27s2 : Factor w/ 4 levels "","[nsp]","non",..: 1 4 4 4 4 4 4 1 4 4 ...
## $ mc27s3 : Factor w/ 3 levels "","n","o": 1 1 1 1 1 1 1 1 1 1 ...
## $ mc27s4 : Factor w/ 4 levels "","[nsp]","non",..: 3 3 1 4 1 1 4 4 1 4 ...
## $ mc27s5 : Factor w/ 4 levels "","[nsp]","non",..: 3 3 3 3 3 3 3 3 3 3 ...
## $ mc27s6 : Factor w/ 4 levels "","[nsp]","non",..: 3 4 3 3 3 3 4 4 4 3 ...
## $ mc27s7 : Factor w/ 4 levels "","[nsp]","non",..: 3 3 4 3 4 3 3 3 3 3 ...
## $ mc27s8 : Factor w/ 4 levels "","[nsp]","non",..: 3 3 3 3 3 3 3 3 3 3 ...
## $ mc27s9 : Factor w/ 4 levels "","[nsp]","non",..: 1 3 3 3 3 4 3 1 4 3 ...
## $ age : atomic 50 52 34 69 52 53 52 18 52 47 ...
## ..- attr(*, "format.sas")= chr "CLAGALT"
## $ pcs7 : Factor w/ 8 levels "","Agriculteurs exploitants",..: 5 7 7 7 7 4 7 4 7 7 ...
## $ sexe : Factor w/ 2 levels "Femmes","Hommes": 1 1 2 1 2 2 1 1 2 1 ...
## $ sit16 : Factor w/ 5 levels "","[ns","[ou",..: 5 5 4 5 5 5 5 2 5 5 ...
## $ sd_sitprof_6 : Factor w/ 6 levels "","Autres ina",..: 6 6 6 5 6 6 6 4 6 6 ...
## $ mh5_score : atomic 50 75 85 85 60 85 80 40 75 60 ...
## ..- attr(*, "format.sas")= chr "BEST"
## $ DEP : Factor w/ 5 levels "Guadeloupe","Guyane",..: 5 5 5 5 5 5 5 5 5 5 ...
## $ annee : atomic 2010 2010 2010 2010 2010 2010 2010 2010 2010 2010 ...
## ..- attr(*, "format.sas")= chr "BEST"
## $ poids_ind : atomic 1.221 1.85 1.576 0.819 1.433 ...
## ..- attr(*, "format.sas")= chr "BEST"
## $ poids_ind_metro : atomic 1.221 1.85 1.576 0.819 1.433 ...
## ..- attr(*, "format.sas")= chr "BEST"
## $ sit_financiere_percue : Factor w/ 6 levels "","A l'aise",..: 3 2 2 2 4 4 4 2 5 4 ...
## $ sit_financiere_percue_3: Factor w/ 4 levels "","C'est difficile",..: 2 4 4 4 3 3 3 4 4 3 ...
## $ sd_diplome3 : Factor w/ 4 levels "","< Bac","> Bac",..: 2 3 4 3 2 3 2 2 3 2 ...
## $ sd_revenus_3K : Factor w/ 4 levels "1er tercile (faible)",..: 2 3 3 4 3 2 3 1 2 2 ...
## $ sd_vitseul : Factor w/ 2 levels "Non","Oui": 1 1 1 1 1 1 1 1 1 1 ...
## $ consult_mg : atomic 1 1 1 1 1 1 1 1 1 1 ...
## ..- attr(*, "format.sas")= chr "BEST"
## $ consult_dentiste : atomic 0 1 0 0 0 0 1 1 1 0 ...
## ..- attr(*, "format.sas")= chr "BEST"
## $ consult_gyneco : atomic 0 0 NA 1 NA NA 1 1 NA 1 ...
## ..- attr(*, "format.sas")= chr "BEST"
## $ Q4_1 : Factor w/ 12 levels "","0","1","2",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q4_2 : Factor w/ 12 levels "","0","1","2",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q4_3 : Factor w/ 12 levels "","0","1","2",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q4_4 : Factor w/ 11 levels "","0","1","2",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q4_5 : Factor w/ 11 levels "","0","1","2",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q4_6 : Factor w/ 6 levels "","1","3","6",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q4_7 : Factor w/ 3 levels "","1","N": 1 1 1 1 1 1 1 1 1 1 ...
## $ Q4_8 : Factor w/ 2 levels "","1": 1 1 1 1 1 1 1 1 1 1 ...
## $ Q5_1 : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
## $ Q5_2 : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
## $ Q5_3 : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
## $ Q5_4 : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
## $ Q5_5 : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
## $ Q5_6 : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
## $ Q5_7 : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
## $ Q5_8 : Factor w/ 3 levels "","f","g": 1 1 1 1 1 1 1 1 1 1 ...
## $ Q6_1 : Factor w/ 11 levels "","A","B","c",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q6_2 : Factor w/ 11 levels "","A","B","c",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q6_3 : Factor w/ 10 levels "","B","c","C",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q6_4 : Factor w/ 11 levels "","A","B","c",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q6_5 : Factor w/ 8 levels "","B","c","f",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q6_6 : Factor w/ 7 levels "","C","f","F",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q6_7 : Factor w/ 5 levels "","f","F","n",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q6_8 : Factor w/ 3 levels "","f","S": 1 1 1 1 1 1 1 1 1 1 ...
## $ Q9 : Factor w/ 10 levels "","1","2","3",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q22 : Factor w/ 80 levels "","107","115",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q23 : Factor w/ 103 levels "","100","101",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q24 : Factor w/ 8 levels "","[NSP]","[Refus]",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q25 : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q26 : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q27 : Factor w/ 7 levels "","[NSP]","[Refus]",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q28 : Factor w/ 5 levels "","[Refus]","Je suis non voyant, je ne peux pas voir",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q29 : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q30 : Factor w/ 6 levels "","[Refus]","Beaucoup de difficultés",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q31_1 : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q31_2 : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q31_3 : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q31_4 : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q31_5 : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q31_6 : Factor w/ 5 levels "","[NSP]","[Refus]",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q31_7 : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q31_8 : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q31_9 : Factor w/ 4 levels "","[NSP]","Non",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q31_10 : Factor w/ 3 levels "","Non","Oui": 1 1 1 1 1 1 1 1 1 1 ...
## $ Q32_spec_1 : Factor w/ 43 levels "","Acupuncteur",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q32_spec_2 : Factor w/ 37 levels "","Acupuncteur",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q32_spec_3 : Factor w/ 29 levels "","Acupuncteur",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q32_spec_4 : Factor w/ 17 levels "","Autres spécialistes",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q32_spec_5 : Factor w/ 8 levels "","Autres spécialistes",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_1_lieu1 : Factor w/ 12 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_1_lieu2 : Factor w/ 5 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_1_lieu3 : Factor w/ 4 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_2_lieu1 : Factor w/ 8 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_2_lieu2 : Factor w/ 3 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_3_lieu1 : Factor w/ 5 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_3_lieu2 : Factor w/ 3 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_4_lieu1 : Factor w/ 8 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_4_lieu2 : Factor w/ 2 levels "","Autre lieu": 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_5_lieu1 : Factor w/ 8 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_5_lieu2 : Factor w/ 3 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_5_lieu3 : Factor w/ 2 levels "","Autre lieu": 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_6_lieu1 : Factor w/ 10 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_6_lieu2 : Factor w/ 4 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_7_lieu1 : Factor w/ 8 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_7_lieu2 : Factor w/ 3 levels "","Autre lieu",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ Q33_7_lieu3 : Factor w/ 2 levels "","Clinique/Laboratoire": 1 1 1 1 1 1 1 1 1 1 ...
## [list output truncated]
summary
pour connaître quelques statistiques descriptives sur chaque variable :
summary(data_sas)
## mc26s1 mc26s2 mc26s3 mc26s4
## Min. : 0.000 Min. :0.0 Min. : 0.000 Min. : 0.000
## 1st Qu.: 3.000 1st Qu.:0.0 1st Qu.: 1.000 1st Qu.: 0.000
## Median : 4.000 Median :0.0 Median : 2.000 Median : 0.000
## Mean : 5.588 Mean :0.2 Mean : 3.001 Mean : 4.832
## 3rd Qu.: 6.000 3rd Qu.:0.0 3rd Qu.: 3.000 3rd Qu.: 1.000
## Max. :72.000 Max. :3.0 Max. :70.000 Max. :365.000
## NA's :30351 NA's :32331 NA's :30347 NA's :30348
## mc26s5 mc26s6 mc27s1 mc27s2 mc27s3
## Min. : 0.000 Min. : 0.00 :31658 :25837 :31865
## 1st Qu.: 0.000 1st Qu.: 0.00 non: 437 [nsp]: 3 n: 491
## Median : 0.000 Median : 0.00 oui: 276 non : 1093 o: 15
## Mean : 5.641 Mean : 0.21 oui : 5438
## 3rd Qu.: 1.000 3rd Qu.: 0.00
## Max. :365.000 Max. :45.00
## NA's :30346 NA's :30333
## mc27s4 mc27s5 mc27s6 mc27s7 mc27s8
## :27628 :23798 :23798 :23798 :23798
## [nsp]: 1 [nsp]: 1 [nsp]: 2 [nsp]: 20 [nsp]: 5
## non : 1973 non : 7882 non : 3565 non : 7867 non : 8208
## oui : 2769 oui : 690 oui : 5006 oui : 686 oui : 360
##
##
##
## mc27s9 age
## :25837 Min. :15.00
## [nsp]: 3 1st Qu.:31.00
## non : 4327 Median :44.00
## oui : 2204 Mean :44.25
## 3rd Qu.:57.00
## Max. :75.00
##
## pcs7 sexe sit16
## Employés :9545 Femmes:17944 :24067
## Professions intermédiaires... :8381 Hommes:14427 [ns: 85
## Ouvriers :6178 [ou: 26
## Cadres, professions intellectuelles...:5200 non: 657
## Artisans, commerçants,... :1915 oui: 7536
## Agriculteurs exploitants : 537
## (Other) : 615
## sd_sitprof_6 mh5_score DEP annee
## : 15 Min. : 0.00 Guadeloupe: 2028 Min. :2010
## Autres ina: 1882 1st Qu.: 60.00 Guyane : 2015 1st Qu.:2010
## Chomage : 3322 Median : 75.00 La Réunion: 2094 Median :2014
## Etudes : 2914 Mean : 70.71 Martinique: 2026 Mean :2013
## Retraite : 6019 3rd Qu.: 85.00 Métropole :24208 3rd Qu.:2014
## Travail :18219 Max. :100.00 Max. :2014
## NA's :5
## poids_ind poids_ind_metro sit_financiere_percue
## Min. : 0.05322 Min. : 0.05322 : 107
## 1st Qu.: 0.55661 1st Qu.: 0.55090 A l'aise : 5078
## Median : 0.84126 Median : 0.83374 C'est difficile : 4321
## Mean : 0.99637 Mean : 0.99637 C'est juste : 8430
## 3rd Qu.: 1.18021 3rd Qu.: 1.18156 Ca va :13328
## Max. :13.00816 Max. :13.00816 N'y arrive pas sa: 1107
##
## sit_financiere_percue_3 sd_diplome3 sd_revenus_3K
## : 107 : 90 1er tercile (faible): 7989
## C'est difficile: 5428 < Bac:15392 2nd tercile :10555
## C'est juste : 8430 > Bac:10666 3ème tercile (élevé):11295
## Ca va :18406 Bac : 6223 NSP/Refus : 2532
##
##
##
## sd_vitseul consult_mg consult_dentiste consult_gyneco
## Non:25377 Min. :0.000 Min. :0.000 Min. :0.000
## Oui: 6994 1st Qu.:1.000 1st Qu.:0.000 1st Qu.:0.000
## Median :1.000 Median :1.000 Median :1.000
## Mean :0.868 Mean :0.568 Mean :0.584
## 3rd Qu.:1.000 3rd Qu.:1.000 3rd Qu.:1.000
## Max. :1.000 Max. :1.000 Max. :1.000
## NA's :15664 NA's :15649 NA's :27629
## Q4_1 Q4_2 Q4_3 Q4_4
## :28881 :30639 :31808 :32185
## 1 : 1363 1 : 742 1 : 310 1 : 110
## 8 : 263 6 : 162 8 : 60 9 : 18
## 0 : 258 8 : 149 9 : 48 8 : 12
## 3 : 258 7 : 140 7 : 34 5 : 11
## 6 : 253 9 : 140 4 : 31 3 : 8
## (Other): 1095 (Other): 399 (Other): 80 (Other): 27
## Q4_5 Q4_6 Q4_7 Q4_8 Q5_1 Q5_2
## :32316 :32349 :32365 :32369 :28881 :30639
## 1 : 36 1: 18 1: 5 1: 2 f: 1714 f: 877
## 6 : 4 3: 1 N: 1 g: 1776 g: 855
## 0 : 3 6: 1
## 9 : 3 9: 1
## 2 : 2 N: 1
## (Other): 7
## Q5_3 Q5_4 Q5_5 Q5_6 Q5_7 Q5_8
## :31808 :32185 :32316 :32349 :32365 :32369
## f: 273 f: 75 f: 24 f: 10 f: 1 f: 1
## g: 290 g: 111 g: 31 g: 12 g: 5 g: 1
##
##
##
##
## Q6_1 Q6_2 Q6_3 Q6_4
## :28881 :30639 :31808 :32185
## F : 1534 F : 797 F : 250 f : 76
## f : 1384 f : 667 f : 208 F : 75
## S : 266 S : 106 S : 43 S : 14
## P : 123 n : 58 B : 22 B : 6
## n : 99 P : 41 n : 17 n : 5
## (Other): 84 (Other): 63 (Other): 23 (Other): 10
## Q6_5 Q6_6 Q6_7 Q6_8 Q9
## :32316 :32349 :32365 :32369 :24208
## F : 24 C: 1 f: 3 f: 1 2 : 2136
## f : 18 f: 5 F: 1 S: 1 3 : 1737
## n : 4 F: 10 n: 1 4 : 1544
## S : 4 n: 4 S: 1 1 : 1495
## B : 2 P: 1 5 : 757
## (Other): 3 S: 1 (Other): 494
## Q22 Q23 Q24
## :24429 :24467 :24208
## 170 : 592 70 : 568 A peu près du bon poids: 4448
## 160 : 590 80 : 467 Un peu trop gros (se) : 2484
## 165 : 542 60 : 412 Beaucoup trop gros (se): 735
## 175 : 365 65 : 366 Un peu trop maigre : 416
## 180 : 352 75 : 351 Beaucoup trop maigre : 64
## (Other): 5501 (Other): 5740 (Other) : 16
## Q25 Q26 Q27
## :24208 :28952 :24208
## [NSP]: 15 [NSP]: 7 [NSP] : 24
## Non : 4729 Non : 2868 [Refus] : 2
## Oui : 3419 Oui : 544 Non, pas du tout : 230
## Non, pas trop : 1250
## Oui, mais pas dans les détails: 3617
## Oui, parfaitement : 3040
## Q28 Q29
## :24208 :27665
## [Refus] : 1 [NSP]: 10
## Je suis non voyant, je ne peux pas voir: 3 Non : 3837
## Non : 3453 Oui : 859
## Oui : 4706
##
##
## Q30 Q31_1 Q31_2
## :28917 :24208 :24208
## [Refus] : 1 [NSP]: 7 [NSP]: 12
## Beaucoup de difficultés : 67 Non : 1033 Non : 3651
## ou Vous ne pouvez pas du tout voir: 4 Oui : 7123 Oui : 4500
## Pas de difficultés : 2658
## Quelques difficultés : 724
##
## Q31_3 Q31_4 Q31_5 Q31_6 Q31_7
## :24208 :24208 :27615 :24208 :30186
## [NSP]: 20 [NSP]: 20 [NSP]: 13 [NSP] : 43 [NSP]: 12
## Non : 6450 Non : 4911 Non : 2251 [Refus]: 4 Non : 1674
## Oui : 1693 Oui : 3232 Oui : 2492 Non : 5878 Oui : 499
## Oui : 2238
##
##
## Q31_8 Q31_9 Q31_10
## :31879 :32268 :32343
## [NSP]: 1 [NSP]: 1 Non: 19
## Non : 388 Non : 73 Oui: 9
## Oui : 103 Oui : 29
##
##
##
## Q32_spec_1
## :30133
## Cardiologue : 393
## Ostéopathe : 196
## Dermatologue : 185
## Rhumatologue (médecin pour hernie, artht: 163
## ORL : 148
## (Other) : 1153
## Q32_spec_2
## :31872
## Cardiologue : 74
## Gastro-entérologue/hépatologue: 37
## ORL : 32
## Dermatologue : 31
## Chirurgien/anesthésiste : 30
## (Other) : 295
## Q32_spec_3 Q32_spec_4
## :32268 :32342
## Cardiologue : 12 Autres spécialistes : 4
## Pneumologue : 9 Cardiologue : 4
## Dermatologue : 7 Cancerologue / oncologue: 2
## Diabétologue / endocrinologue: 7 Dermatologue : 2
## Psychologue : 6 Neurologue : 2
## (Other) : 62 (Other) : 15
## Q32_spec_5 Q33_1_lieu1
## :32362 :30721
## Chirurgien/anesthésiste : 3 Domicile : 1513
## Autres spécialistes : 1 Autre lieu: 72
## Cardiologue : 1 Cabinet : 22
## Diététicien/nutritionniste : 1 Hôpital : 19
## Gastro-entérologue/hépatologue: 1 Caserne : 12
## (Other) : 2 (Other) : 12
## Q33_1_lieu2 Q33_1_lieu3
## :32286 :32368
## Autre lieu : 70 Autre lieu : 1
## Centre des drépanocytaires: 1 Centre de cancérologie: 1
## Clinique/Laboratoire : 1 Domicile : 1
## Domicile : 13
##
##
## Q33_2_lieu1 Q33_2_lieu2
## :31415 :32361
## Domicile : 913 Autre lieu : 9
## Autre lieu : 29 Métropole/étranger: 1
## Caserne : 6
## Métropole/étranger: 4
## Centre médical : 2
## (Other) : 2
## Q33_3_lieu1 Q33_3_lieu2
## :32067 :32367
## Autre lieu : 17 Autre lieu: 3
## Clinique/Laboratoire : 1 Domicile : 1
## Domicile : 285
## Médecine du travail/Scolaire: 1
##
##
## Q33_4_lieu1 Q33_4_lieu2
## :31799 :32356
## Domicile : 489 Autre lieu: 15
## Autre lieu : 76
## Médecine du travail/Scolaire: 3
## Clinique/Laboratoire : 1
## Métropole/étranger : 1
## (Other) : 2
## Q33_5_lieu1 Q33_5_lieu2 Q33_5_lieu3
## :31800 :32341 :32370
## Domicile : 380 Autre lieu: 26 Autre lieu: 1
## Autre lieu : 161 Domicile : 4
## Cabinet : 11
## Hôpital : 9
## Clinique/Laboratoire: 7
## (Other) : 3
## Q33_6_lieu1 Q33_6_lieu2
## :31990 :32353
## Domicile : 212 Autre lieu : 14
## Autre lieu : 153 Clinique/Laboratoire: 2
## Cabinet : 5 Domicile : 2
## Clinique/Laboratoire : 5
## Médecine du travail/Scolaire: 2
## (Other) : 4
## Q33_7_lieu1 Q33_7_lieu2
## :32286 :32364
## Autre lieu : 41 Autre lieu : 6
## Domicile : 38 Clinique/Laboratoire: 1
## Clinique/Laboratoire: 2
## Cabinet : 1
## Croix rouge : 1
## (Other) : 2
## Q33_7_lieu3 Q33_8_lieu1 Q33_9_lieu1
## :32370 :32356 :32365
## Clinique/Laboratoire: 1 Autre lieu: 8 Autre lieu: 3
## Domicile : 7 Domicile : 3
##
##
##
##
## Q33_10_lieu1 Q35 Q36
## :32369 :28720 :24208
## Autre lieu: 1 [NSP] : 43 Bon : 3602
## Domicile : 1 5 ans ou plus : 903 Moyen : 2769
## Entre 1 et moins de 2 ans: 1163 Très bon : 1234
## Entre 2 et moins de 3 ans: 848 Mauvais : 358
## Entre 3 et moins de 5 ans: 516 Très mauvais: 169
## Vous n y êtes jamais allé: 178 (Other) : 31
## Q37 Q38 Q39_1 Q39_2
## :24208 :24208 :24208 :24208
## [Nsp] : 20 [NSP]: 3 [NSP]: 5 [NSP]: 6
## Jamais : 4026 Non : 7096 Non : 6698 Non : 7098
## Occasionnellement: 3474 Oui : 1064 Oui : 1460 Oui : 1059
## Souvent : 466
## Très souvent : 177
##
## Q39_3 Q39_4 Q40_1 Q40_2 Q40_3
## :24208 :24208 :31554 :31554 :31554
## [NSP]: 5 [NSP]: 18 Non: 311 Non: 425 Non: 791
## Non : 7341 Non : 7995 Oui: 506 Oui: 392 Oui: 26
## Oui : 817 Oui : 150
##
##
##
## Q41_1 Q41_2
## :31865 :32271
## Opthalmo : 80 Gynécologue/obstétricien: 19
## Gynécologue/obstétricien: 69 Opthalmo : 15
## Dermatologue : 62 Ostéopathe : 13
## Ostéopathe : 56 Kiné : 8
## Kiné : 32 Radiologue : 6
## (Other) : 207 (Other) : 39
## Q41_3
## :32345
## Opthalmo : 8
## Dentiste : 2
## Gynécologue/obstétricien: 2
## Kiné : 2
## Podologue : 2
## (Other) : 10
## Q41_4 Q41_5
## :32366 :32369
## Dentiste : 1 Opthalmo : 1
## Opthalmo : 1 Ostéopathe: 1
## ORL : 1
## Radiologue : 1
## Rhumatologue (médecin pour hernie, artht: 1
##
## Q41_6
## :32370
## Psychiatre/pédopsy: 1
##
##
##
##
##
## Q41_7
## :32370
## Rhumatologue (médecin pour hernie, artht: 1
##
##
##
##
##
## Q42_1
## :32221
## Faire des radios/scanner/mammographie : 29
## Acheter des médicaments, des semelles, d: 26
## Bilan complet/analyses : 16
## Soins esthétiques : 13
## opération des varices/autre opération : 12
## (Other) : 54
## Q42_2 Q43_1
## :32360 :24208
## Acheter des médicaments, des semelles, d: 1 [NSP]: 6
## Bilan complet/analyses : 5 Non : 7626
## Ophtalmo / vue : 1 Oui : 531
## Prise de sang : 1
## Soins dentaires : 1
## Soins gynéco : 2
## Q43_2 Q43_3 Q43_4
## :24208 :24208 :24208
## [NSP]: 2 [NSP]: 10 [NSP] : 6
## Non : 7544 Non : 6345 [Refus]: 1
## Oui : 617 Oui : 1808 Non : 7671
## Oui : 485
##
##
## Q44 Q45
## :31886 :24208
## Pas le temps (en général) : 101 Bon : 3508
## Pb de motivation (Oubli/flemme/fainéanti: 67 Assez bon : 2698
## Temps d'attente trop long dans la salle : 66 Très bon : 1481
## Horaires de rdv incompatibles avec le tr: 56 Mauvais : 361
## Problème de relation ou de confiance / c: 30 Très mauvais: 75
## (Other) : 165 (Other) : 40
## Q46 Q47
## :24208 :24208
## [NSP] : 69 [NSP] : 21
## [Refus]: 4 Non, pas limité du tout : 6638
## Non : 5211 Oui, fortement limité, : 470
## Oui : 2879 Oui, limité mais pas fortement: 1034
##
##
## Q48 Q49_1 Q49_2
## :24208 :24208 :24208
## [NSP] : 8 [NSP] : 13 [NSP] : 14
## Beaucoup : 1110 En permanence: 386 En permanence: 170
## Pas du tout: 4927 Jamais : 2371 Jamais : 4396
## Un peu : 2118 Quelquefois : 2738 Quelquefois : 1603
## Rarement : 1710 Rarement : 1489
## Souvent : 945 Souvent : 491
## Q49_3 Q49_4 Q49_5
## :24208 :24208 :24208
## Souvent : 3232 Jamais : 3363 Souvent : 3357
## Quelquefois : 2427 Quelquefois : 2175 Quelquefois : 2236
## En permanence: 1390 Rarement : 1996 En permanence: 1634
## Rarement : 749 Souvent : 494 Rarement : 567
## Jamais : 331 En permanence: 124 Jamais : 296
## (Other) : 34 (Other) : 11 (Other) : 73
## pcscdf
## :26061
## Ouvriers : 1804
## Professions intermédiaires... : 1439
## Cadres, professions intellectuelles...: 1268
## Employés : 1048
## Artisans, commerçants,... : 597
## (Other) : 154
## pcsind sd_nbhabitant
## :10705 Min. : 1.00
## Employés : 7028 1st Qu.: 2.00
## Professions intermédiaires... : 5703 Median : 2.00
## Ouvriers : 4081 Mean : 2.77
## Cadres, professions intellectuelles...: 3278 3rd Qu.: 4.00
## Artisans, commerçants,... : 1214 Max. :15.00
## (Other) : 362 NA's :8573
## sd_nbhabitant_inf14 sd_nbhabitant_sup76 sd_nbenfants_inf15
## 0 :15849 :24208 :24208
## . : 8577 0: 7740 0 : 4687
## 1 : 4029 1: 373 1 : 1760
## 2 : 2845 2: 49 2 : 1162
## 3 : 815 3: 1 3 : 369
## 4 : 189 4 : 133
## (Other): 67 (Other): 52
## sd_nbenfants_inf14 sd_habite_en_couple mini1 mini2
## :24208 : 8573 :19074 : 8573
## 0 : 4935 Non:10735 Assez bon : 3989 Non:15336
## 1 : 1688 Oui:13063 Bon : 5775 NSP: 123
## 2 : 1065 Mauvais : 548 Oui: 8339
## 3 : 327 NSP : 44
## 4 : 104 Très bon : 2832
## (Other): 44 Très mauvais: 109
## mini3 Renoncement_1 Renoncement_2 Renoncement_3
## : 8612 : 8574 : 8574 : 8573
## Non :18438 Non:19876 Non:21032 Non:21972
## Oui, fortement : 1543 Oui: 3921 Oui: 2765 Oui: 1826
## Oui, mais pas fortement: 3778
##
##
##
## Renoncement_4 Renoncement_5 Renoncement_6 Renoncement_7 rsa
## : 8575 : 8573 : 8574 : 8574 :24208
## Non:22262 Non:22194 Non:22426 Non:18589 Non: 6790
## Oui: 1534 Oui: 1604 Oui: 1371 Oui: 5208 Oui: 1373
##
##
##
##
## francais_parle ne_DOM complementaire
## :24208 :24208 :24208
## Non: 3172 Autre endroit : 1215 Non: 934
## Oui: 4991 DOM : 5823 Nsp: 63
## France métropolitaine: 1125 Oui: 7166
##
##
##
## cf1 cf4_1 cf4_2 cf4_3 cf4_4 cf4_5
## :16736 :16736 :20048 :25278 :28033 :30904
## 2 : 5229 F: 8443 F: 6090 F: 3448 F: 2052 F: 708
## 1 : 3314 H: 7192 H: 6233 H: 3645 H: 2286 H: 759
## 4 : 2871
## 3 : 2755
## 5 : 1113
## (Other): 353
## cf4_6 cf4_7 cf4_8 cf4_9 cf4_10 cf4_11 cf4_12
## :32017 :32264 :32338 :32358 :32367 :32369 :32370
## F: 169 F: 51 F: 16 F: 6 F: 2 F: 2 H: 1
## H: 185 H: 56 H: 17 H: 7 H: 2
##
##
##
##
## cf5_1 cf5_2 cf5_3 cf5_4
## :16736 :16738 :16736 :16736
## 40 : 365 0 : 3323 0 : 8715 0 :11461
## 50 : 359 40 : 334 14 : 288 10 : 232
## 35 : 331 50 : 324 17 : 287 12 : 219
## 47 : 329 47 : 317 10 : 280 14 : 218
## 60 : 327 42 : 305 13 : 269 8 : 215
## (Other):13924 (Other):11030 (Other): 5796 (Other): 3290
## cf5_5 cf5_6 cf5_7 cf5_8
## :16736 :16738 :16738 :16738
## 0 :14237 0 :15296 0 :15534 0 :15600
## 5 : 99 7 : 24 7 : 9 2 : 5
## 10 : 94 4 : 20 4 : 7 10 : 3
## 6 : 88 6 : 17 10 : 6 8 : 3
## 8 : 83 1 : 16 2 : 6 9 : 3
## (Other): 1034 (Other): 260 (Other): 71 (Other): 19
## cf5_9 cf5_10 cf5_11 cf5_12 rs5_2r
## :16738 :32367 :32369 :32370 :20042
## 0 :15620 13: 1 12: 1 10: 1 Votre conjoint: 9257
## 8 : 3 26: 1 3 : 1 Votre mère : 895
## 10 : 1 4 : 1 Votre fils ou : 570
## 12 : 1 5 : 1 Votre père : 526
## 14 : 1 Votre fille ou: 507
## (Other): 7 (Other) : 574
## rs5_3r rs5_4r rs5_5r
## :25269 :28027 :30902
## Votre fils ou : 2747 Votre fils ou : 1740 Votre fils ou : 538
## Votre fille ou: 2587 Votre fille ou: 1510 Votre fille ou: 484
## Votre mère : 573 Votre frère ou: 353 Votre frère ou: 143
## Votre père : 503 Votre soeur ou: 344 Votre soeur ou: 139
## Votre frère ou: 151 Votre mère : 91 Votre mère : 30
## (Other) : 541 (Other) : 306 (Other) : 135
## rs5_6r rs5_7r rs5_8r
## :32015 :32264 :32338
## Votre fils ou : 101 Votre fille ou: 29 Votre fille ou: 9
## Votre fille ou: 90 Votre fils ou : 29 Votre fils ou : 7
## Votre frère ou: 45 Votre frère ou: 15 Votre frère ou: 5
## Votre soeur ou: 38 Votre soeur ou: 9 enfant (famill: 3
## Votre mère : 16 Votre père : 6 Autre lien fam: 2
## (Other) : 66 (Other) : 19 (Other) : 7
## rs5_9r rs5_10r rs5_11r
## :32358 :32367 :32369
## Autre lien fam: 1 Votre fille ou: 2 Votre fille ou: 2
## Autre lien non: 1 Votre fils ou : 2
## enfant (famill: 1
## Votre fille ou: 5
## Votre fils ou : 5
##
## rs5_12r qv20 qv20b
## :32370 :27164 :27237
## Votre fils ou: 1 Bonne : 2899 Assez bon : 1291
## Excellente : 524 Bon : 2267
## Mauvaise : 126 Mauvais : 187
## Médiocre : 393 Ne sait pas : 4
## Ne sait pas: 4 Très bon : 1351
## Très bonne : 1261 Très mauvais: 34
## qv20b2 qv20c
## :27077 :16736
## Bon : 2738 Ne sait pas: 50
## Mauvais : 134 Non :10125
## Moyen : 933 Oui : 5460
## Ne sait pas : 2
## Très bon : 1451
## Très mauvais: 36
## qv20d
## :16736
## Ne sait pas : 18
## Non, pas limité du tout :11800
## Oui, fortement limité : 1073
## Oui, limité, mais pas fortement: 2744
##
##
## sb1 sb2
## :27077 :27077
## Deux fois par jour ou plus : 3778 Ne sait pas: 2
## Une fois par jour : 1301 Non : 1859
## De temps en temps dans la semaine: 106 Oui : 3433
## (Vous portez un dentier) : 41
## Une fois par semaine : 38
## (Other) : 30
## sb3
## :30512
## 5 ans ou plus : 253
## Entre 1 et moins de 2 ans: 818
## Entre 2 et moins de 3 ans: 483
## Entre 3 et moins de 5 ans: 271
## Ne sait pas : 1
## Vous n'y êtes jamais allé: 33
## sb4
## :27113
## Ne sait pas : 9
## Pour un examen de contrôle ou un détartr: 2979
## Pour un traitement suite à un précédent : 376
## Pour une autre raison : 446
## Quelque chose n'allait pas, vous gênait : 1448
##
## sb5 rsprec3_1 rsprec3_2
## :27077 :16736 :16736
## Jamais : 3106 (Non concerné): 51 (Non concerné): 251
## Ne sait pas : 4 Ne sait pas : 1 Ne sait pas : 1
## Occasionnellement: 1919 Non :13122 Non :13677
## Souvent : 204 Oui : 2461 Oui : 1706
## Très souvent : 61
##
## rsprec3_3 rsprec3_4 rsprec3_5
## :16736 :16736 :16736
## (Non concerné): 12 (Non concerné): 11 (Non concerné): 14
## Non :14614 Ne sait pas : 2 Non :14561
## Oui : 1009 Non :14238 Oui : 1060
## Oui : 1384
##
##
## rsprec3_6 rsprec3_7
## :16736 :16736
## (Non concerné): 13 (Non concerné): 9
## Ne sait pas : 1 Ne sait pas : 1
## Non :14867 Non :12261
## Oui : 754 Oui : 3364
##
##
## rsprec3_8r1
## :31001
## Pas le temps (en général) : 532
## Pb de motivation (Oubli/flemme/fainéanti: 178
## Problème de relation ou de confiance / c: 113
## Horaires de rdv incompatibles avec le t: 52
## A prendre un rdv : 44
## (Other) : 451
## rsprec3_8r2 mini1a
## :32299 :16736
## Pb de motivation (Oubli/flemme/fainéanti: 21 0 :10993
## Pas le temps (en général) : 13 1 : 2285
## La douleur passera toute seule / pas de : 7 2 : 1778
## Rdv dans trop longtemps : 5 3 : 491
## Temps d'attente trop long dans la salle : 5 4 : 73
## (Other) : 21 (Other): 15
## mini1b enfant1 enfant2 enfant3
## :27164 Min. :0 Min. :0.00 Min. :0.000
## Bonne : 2899 1st Qu.:0 1st Qu.:0.00 1st Qu.:0.000
## Excellente: 524 Median :0 Median :0.00 Median :0.000
## Mauvaise : 126 Mean :0 Mean :0.03 Mean :0.192
## Médicore : 393 3rd Qu.:0 3rd Qu.:0.00 3rd Qu.:0.000
## NSP : 4 Max. :0 Max. :1.00 Max. :1.000
## Très bonne: 1261 NA's :16736 NA's :16738 NA's :16736
## enfant4 enfant5 enfant6 enfant7
## Min. :0.000 Min. :0.000 Min. :0.000 Min. :0.000
## 1st Qu.:0.000 1st Qu.:0.000 1st Qu.:0.000 1st Qu.:0.000
## Median :0.000 Median :0.000 Median :0.000 Median :0.000
## Mean :0.159 Mean :0.062 Mean :0.013 Mean :0.004
## 3rd Qu.:0.000 3rd Qu.:0.000 3rd Qu.:0.000 3rd Qu.:0.000
## Max. :1.000 Max. :1.000 Max. :1.000 Max. :1.000
## NA's :16736 NA's :16736 NA's :16738 NA's :16738
## enfant8 enfant9 age_4 comp enfants
## Min. :0.000 Min. :0.000 Min. :1.000 :16052 : 8577
## 1st Qu.:0.000 1st Qu.:0.000 1st Qu.:2.000 Non: 1591 0:15849
## Median :0.000 Median :0.000 Median :2.000 Oui:14728 1: 4029
## Mean :0.002 Mean :0.001 Mean :2.426 2: 2845
## 3rd Qu.:0.000 3rd Qu.:0.000 3rd Qu.:3.000 3: 1071
## Max. :1.000 Max. :1.000 Max. :4.000
## NA's :16738 NA's :16738
## age2 ech_sante bonnesante mauvsante
## Min. : 225 Min. :1.000 Min. :0.000 Min. :0.00
## 1st Qu.: 961 1st Qu.:3.000 1st Qu.:0.000 1st Qu.:0.00
## Median :1936 Median :4.000 Median :1.000 Median :0.00
## Mean :2211 Mean :3.805 Mean :0.649 Mean :0.05
## 3rd Qu.:3249 3rd Qu.:4.000 3rd Qu.:1.000 3rd Qu.:0.00
## Max. :5625 Max. :5.000 Max. :1.000 Max. :1.00
## NA's :19118 NA's :19118 NA's :19118
## lim_forte mal_chro limitation sante_bd
## Min. :0.000 Min. :0.000 Min. :0.000 Min. :1.000
## 1st Qu.:0.000 1st Qu.:0.000 1st Qu.:0.000 1st Qu.:3.000
## Median :0.000 Median :0.000 Median :0.000 Median :4.000
## Mean :0.065 Mean :0.352 Mean :0.224 Mean :3.661
## 3rd Qu.:0.000 3rd Qu.:1.000 3rd Qu.:0.000 3rd Qu.:4.000
## Max. :1.000 Max. :1.000 Max. :1.000 Max. :5.000
## NA's :8612 NA's :8696 NA's :8612 NA's :24239
## freq_dent pbdent trouble_vis1 trouble_vis
## Min. :0.000 Min. :0.000 Min. :0.0000 Min. :0.00
## 1st Qu.:0.000 1st Qu.:0.000 1st Qu.:0.0000 1st Qu.:0.00
## Median :0.000 Median :0.000 Median :0.0000 Median :0.00
## Mean :0.554 Mean :0.469 Mean :0.2461 Mean :0.17
## 3rd Qu.:1.000 3rd Qu.:1.000 3rd Qu.:0.0000 3rd Qu.:0.00
## Max. :3.000 Max. :1.000 Max. :4.0000 Max. :1.00
## NA's :18938 NA's :18938
## lunettes vuenoncorr vuemalcorr consult_spe consult_opht
## Min. :0.000 :24208 :24208 Min. :0.000 Min. :0.000
## 1st Qu.:0.000 0: 7372 0: 6513 1st Qu.:0.000 1st Qu.:0.000
## Median :1.000 1: 791 1: 1650 Median :0.000 Median :0.000
## Mean :0.577 Mean :0.359 Mean :0.397
## 3rd Qu.:1.000 3rd Qu.:1.000 3rd Qu.:1.000
## Max. :1.000 Max. :1.000 Max. :1.000
## NA's :24212 NA's :15661 NA's :24228
## renoncement_soin_fin renoncement_soin_nonfin renoncement_soin
## Min. :0.000 Min. :0.000 Min. :0.0
## 1st Qu.:0.000 1st Qu.:0.000 1st Qu.:0.0
## Median :0.000 Median :0.000 Median :0.0
## Mean :0.255 Mean :0.256 Mean :0.4
## 3rd Qu.:1.000 3rd Qu.:1.000 3rd Qu.:1.0
## Max. :1.000 Max. :1.000 Max. :1.0
## NA's :8573 NA's :8573 NA's :8573
lapply(data_sas%>%select_if(is.numeric),summary)
## $mc26s1
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 3.000 4.000 5.588 6.000 72.000 30351
##
## $mc26s2
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.0 0.0 0.0 0.2 0.0 3.0 32331
##
## $mc26s3
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 1.000 2.000 3.001 3.000 70.000 30347
##
## $mc26s4
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 4.832 1.000 365.000 30348
##
## $mc26s5
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 5.641 1.000 365.000 30346
##
## $mc26s6
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.00 0.00 0.00 0.21 0.00 45.00 30333
##
## $age
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 15.00 31.00 44.00 44.25 57.00 75.00
##
## $mh5_score
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.00 60.00 75.00 70.71 85.00 100.00 5
##
## $annee
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2010 2010 2014 2013 2014 2014
##
## $poids_ind
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.05322 0.55661 0.84126 0.99637 1.18021 13.00816
##
## $poids_ind_metro
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.05322 0.55090 0.83374 0.99637 1.18156 13.00816
##
## $consult_mg
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 1.000 1.000 0.868 1.000 1.000 15664
##
## $consult_dentiste
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 1.000 0.568 1.000 1.000 15649
##
## $consult_gyneco
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 1.000 0.584 1.000 1.000 27629
##
## $sd_nbhabitant
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.00 2.00 2.00 2.77 4.00 15.00 8573
##
## $enfant1
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0 0 0 0 0 0 16736
##
## $enfant2
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.00 0.00 0.00 0.03 0.00 1.00 16738
##
## $enfant3
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.192 0.000 1.000 16736
##
## $enfant4
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.159 0.000 1.000 16736
##
## $enfant5
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.062 0.000 1.000 16736
##
## $enfant6
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.013 0.000 1.000 16738
##
## $enfant7
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.004 0.000 1.000 16738
##
## $enfant8
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.002 0.000 1.000 16738
##
## $enfant9
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.001 0.000 1.000 16738
##
## $age_4
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 2.000 2.000 2.426 3.000 4.000
##
## $age2
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 225 961 1936 2211 3249 5625
##
## $ech_sante
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 3.000 4.000 3.805 4.000 5.000 19118
##
## $bonnesante
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 1.000 0.649 1.000 1.000 19118
##
## $mauvsante
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.00 0.00 0.00 0.05 0.00 1.00 19118
##
## $lim_forte
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.065 0.000 1.000 8612
##
## $mal_chro
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.352 1.000 1.000 8696
##
## $limitation
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.224 0.000 1.000 8612
##
## $sante_bd
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.000 3.000 4.000 3.661 4.000 5.000 24239
##
## $freq_dent
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.554 1.000 3.000 18938
##
## $pbdent
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.469 1.000 1.000 18938
##
## $trouble_vis1
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0000 0.0000 0.0000 0.2461 0.0000 4.0000
##
## $trouble_vis
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 0.00 0.17 0.00 1.00
##
## $lunettes
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 1.000 0.577 1.000 1.000 24212
##
## $consult_spe
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.359 1.000 1.000 15661
##
## $consult_opht
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.397 1.000 1.000 24228
##
## $renoncement_soin_fin
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.255 1.000 1.000 8573
##
## $renoncement_soin_nonfin
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.000 0.000 0.000 0.256 1.000 1.000 8573
##
## $renoncement_soin
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.0 0.0 0.0 0.4 1.0 1.0 8573
Pour connaître la distribution d’une variable catégorielle, on peut utiliser la fonction table
qui est assez proche de la PROC FREQ. Pour ajouter les marges ont utilise la fonction addmargins
.
decompte_sexe=table(data_sas$sexe)
decompte_sexe
##
## Femmes Hommes
## 17944 14427
addmargins(decompte_sexe)
##
## Femmes Hommes Sum
## 17944 14427 32371
Si on s’intéresse à la proportion et non au décompte, on peut rapporter le décompte au nombre d’observations non manquantes, ou bien s’intéresse à des fonctions telles que prop.table
.
table(data_sas$sexe)/sum(!is.na(data_sas$sexe))
##
## Femmes Hommes
## 0.5543233 0.4456767
prop.table(decompte_sexe)
##
## Femmes Hommes
## 0.5543233 0.4456767
Bien sûr on peut réaliser des tableaux croisés sur plusieurs variables. decompte_sexe_age=table(data_sas$sexe,data_sas$age)
addmargins(decompte_sexe_age)
##
## 15 16 17 18 19 20 21 22 23 24 25
## Femmes 190 152 216 257 229 261 259 241 254 257 294
## Hommes 162 183 223 218 219 231 197 240 201 258 252
## Sum 352 335 439 475 448 492 456 481 455 515 546
##
## 26 27 28 29 30 31 32 33 34 35 36
## Femmes 242 245 285 262 343 269 358 306 311 393 293
## Hommes 206 234 266 245 278 228 248 280 254 308 287
## Sum 448 479 551 507 621 497 606 586 565 701 580
##
## 37 38 39 40 41 42 43 44 45 46 47
## Femmes 331 323 317 499 291 374 348 358 380 338 377
## Hommes 272 294 303 338 278 336 306 282 296 278 292
## Sum 603 617 620 837 569 710 654 640 676 616 669
##
## 48 49 50 51 52 53 54 55 56 57 58
## Femmes 317 320 475 286 388 295 332 308 344 348 345
## Hommes 265 252 355 236 275 263 225 260 237 259 255
## Sum 582 572 830 522 663 558 557 568 581 607 600
##
## 59 60 61 62 63 64 65 66 67 68 69
## Femmes 346 414 310 341 271 293 315 249 249 235 212
## Hommes 280 270 203 254 248 220 235 164 186 165 155
## Sum 626 684 513 595 519 513 550 413 435 400 367
##
## 70 71 72 73 74 75 Sum
## Femmes 262 147 194 154 171 170 17944
## Hommes 170 100 123 107 85 87 14427
## Sum 432 247 317 261 256 257 32371
decompte_sexe_age%>%prop.table(2)%>%addmargins
##
## 15 16 17 18 19 20
## Femmes 0.5397727 0.4537313 0.4920273 0.5410526 0.5111607 0.5304878
## Hommes 0.4602273 0.5462687 0.5079727 0.4589474 0.4888393 0.4695122
## Sum 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
##
## 21 22 23 24 25 26
## Femmes 0.5679825 0.5010395 0.5582418 0.4990291 0.5384615 0.5401786
## Hommes 0.4320175 0.4989605 0.4417582 0.5009709 0.4615385 0.4598214
## Sum 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
##
## 27 28 29 30 31 32
## Femmes 0.5114823 0.5172414 0.5167653 0.5523349 0.5412475 0.5907591
## Hommes 0.4885177 0.4827586 0.4832347 0.4476651 0.4587525 0.4092409
## Sum 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
##
## 33 34 35 36 37 38
## Femmes 0.5221843 0.5504425 0.5606277 0.5051724 0.5489221 0.5235008
## Hommes 0.4778157 0.4495575 0.4393723 0.4948276 0.4510779 0.4764992
## Sum 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
##
## 39 40 41 42 43 44
## Femmes 0.5112903 0.5961768 0.5114236 0.5267606 0.5321101 0.5593750
## Hommes 0.4887097 0.4038232 0.4885764 0.4732394 0.4678899 0.4406250
## Sum 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
##
## 45 46 47 48 49 50
## Femmes 0.5621302 0.5487013 0.5635277 0.5446735 0.5594406 0.5722892
## Hommes 0.4378698 0.4512987 0.4364723 0.4553265 0.4405594 0.4277108
## Sum 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
##
## 51 52 53 54 55 56
## Femmes 0.5478927 0.5852187 0.5286738 0.5960503 0.5422535 0.5920826
## Hommes 0.4521073 0.4147813 0.4713262 0.4039497 0.4577465 0.4079174
## Sum 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
##
## 57 58 59 60 61 62
## Femmes 0.5733114 0.5750000 0.5527157 0.6052632 0.6042885 0.5731092
## Hommes 0.4266886 0.4250000 0.4472843 0.3947368 0.3957115 0.4268908
## Sum 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
##
## 63 64 65 66 67 68
## Femmes 0.5221580 0.5711501 0.5727273 0.6029056 0.5724138 0.5875000
## Hommes 0.4778420 0.4288499 0.4272727 0.3970944 0.4275862 0.4125000
## Sum 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
##
## 69 70 71 72 73 74
## Femmes 0.5776567 0.6064815 0.5951417 0.6119874 0.5900383 0.6679688
## Hommes 0.4223433 0.3935185 0.4048583 0.3880126 0.4099617 0.3320312
## Sum 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000
##
## 75 Sum
## Femmes 0.6614786 33.9172116
## Hommes 0.3385214 27.0827884
## Sum 1.0000000 61.0000000
On peut aussi trouver de l’inspiration avec les packages reshape2, dplyr, data.table et pander.
Ici une discussion sur le sujet en français.
On peut créer/modifier une/plusieur variables avec les fonctions mutate
, mutate_if
, mutate_at
, mutate_all
.
Ici on réalise un traitement standard dans R qui consiste à transformer les variables de type chaînes de caractères character
en variable catégorielle/factorielle factor
.
data_sas=data_sas%>%mutate_if(is.character,factor)
Si on souhaite conserver seulement certaines variables, on peut utiliser la fonction select
et lister les variables à garder.
data_sas%>%select(annee,DEP,sexe,age,poids_ind,mh5_score)
Si à l’inverse on souhaite supprimer certaines variables, on peut utiliser la fonction select
et faire précéder le nom des variables à supprimer d’un signe -
.
data_sas%>%ncol
## [1] 247
data_sas%>%select(-mc26s1,-mc26s2)%>%ncol
## [1] 245
Si on souhaite ne conserver que les observations telles que la variable mh5_score est supérieure à 90.
data_sas%>%nrow
## [1] 32371
data_sas%>%filter(mh5_score>90)%>%nrow
## [1] 2646
Si on souhaite supprimer les doublons, on peut utiliser la fonction unique
ou la fonction distinct
qui utilise la même syntaxe mais tourne beaucoup plus vite.
system.time(data_sas%>%select(annee,DEP,sexe)%>%
unique())
## user system elapsed
## 0.04 0.00 0.04
system.time(data_sas%>%select(annee,DEP,sexe)%>%
distinct())
## user system elapsed
## 0 0 0
Afin de réaliser un tri sur une ou plusieurs variables, on peut utiliser la fonction arrange
.
data_sas%>%
arrange(age)%>%
select(annee,DEP,sexe,age,poids_ind,mh5_score)
On est souvent amené à créer de nouvelles variables, traitons quelques exemples classiques. On fera le plus souvent appel à la fonction mutate
Disons qu’on souhaite découper la variable âge en tranches de 10 ans.
if age < 10 then tage = "1";
if 10 <= age < 20 then tage = "2";
if 20 <= age < 30 then tage = "3";
if 30 <= age < 40 then tage = "4";
if 40 <= age < 50 then tage = "5";
if 50 <= age < 60 then tage = "6";
if 60 <= age < 70 then tage = "7";
if 70 <= age < 80 then tage = "8";
if 80 <= age then tage = "9";
Le découpage de la variable peut être effectué avec les fonctions cut
ou Hmisc::cut2
data_sas%>%mutate(tage=cut(age,breaks = c(min(age),1:7*10,max(age)))) -> data_sas
table(data_sas$tage)
##
## (10,15] (15,20] (20,30] (30,40] (40,50] (50,60] (60,70] (70,75]
## 352 2189 5059 6212 6518 5966 4737 1338
Disons qu’on veut créer une variable de catégorie age x genre, pour cela on va utiliser paste
.
On souhaite également compter le nombre de spécialités consultées, on va donc appeler sum
sur les lignes en précisant rowwise
. On pourrait tout simplement utiliser l’opérateur +
.
data_sas%>%
mutate(age_sexe=paste(sexe,age,sep="_"))%>%
rowwise() %>%
mutate(consult = sum(consult_mg,
consult_dentiste,
consult_gyneco,
consult_opht,
na.rm=TRUE)) -> data_sas
data_sas$age_sexe%>%table%>%sort(decreasing = T)%>%head(10)
## .
## Femmes_40 Femmes_50 Femmes_60 Femmes_35 Femmes_52 Femmes_45 Femmes_47
## 499 475 414 393 388 380 377
## Femmes_42 Femmes_32 Femmes_44
## 374 358 358
data_sas$consult%>%table
## .
## 0 1 2 3
## 16823 4943 6757 3848
Cet exemple et très complet et fait appel aux fonctions filter
, group_by
, summarise
, arrange
, mutate
, ggplot
, pour gagner quelques lignes de code on fait même appel à la fonction set
(:=
) de data.table
pour faire un group_by “sur place”.
On étudie parfois des séries temporelles ou données de panel et on a besoin de comparer \(X_t\) avec \(X_{t-1}\), pour cela on doit créer une variable de retard/lag, par groupe.
Par exemple, disons qu’on veut comparer, à genre et zone donnés, le niveau d’isolement à l’âge A et à l’âge A+1.
# niveau d'isolement par âge, genre, zone
data_sas%>%
filter(age>50)%>%
group_by(DEP,age,sexe)%>%
summarise(volume=n(),
# volume_noNA=sum(!is.na(sd_vitseul)),
isolement=sum(sd_vitseul=="Oui"),
tx_isolement=isolement/volume)%>%
arrange(DEP,sexe,age)%>%
data.table-> data_sas_dt
#lag par genre et zone
data_sas_dt[,c("tx_isolement_lag"):=list(lag(tx_isolement)),by=c("DEP","sexe")]
#ratio et visualisation pour une zone et un genre donnés
data_sas_dt%>%
mutate(tx_isolement_ratio=tx_isolement/tx_isolement_lag)%>%
filter(DEP=="Métropole"&sexe=="Femmes")%>%
mutate(volume=volume/mean(volume))%>%
ggplot() -> g
g+geom_line(aes(x=age,y=tx_isolement_ratio))+geom_col(aes(x=age,y=volume),alpha=.1)
On veut conserver uniquement les CSP “Q23” telles que mh5_score est CONNU au moins 10 fois. On va faire appel à group_by
et summarise
puis filter
.
nb_Q23=data_sas%>%
group_by(Q23)%>%
summarise(mh5_filled_in_Q23=sum(!is.na(mh5_score)))%>%
filter(mh5_filled_in_Q23>10)
Afin de filter les observations pour garder uniquements celles dont la classe Q23 compte au moins 10 mh5_score renseignés (non manquants). Pour cela on fait un inner-join sur la table générée précédemment.
data_sas_sub=merge(data_sas,nb_Q23,by="Q23", all.x=F,all.y=F)
Pour réaliser la même opération on aurait pû utiliser une syntaxe data.table :
data_sas=data.table(data_sas)
data_sas[,"mh5_filled_in_Q23":=sum(!is.na(mh5_score)),by="Q23"]
data_sas_sub=data_sas[mh5_filled_in_Q23>10]
DATA version1;
INPUT id $ age sexe;
DATALINES;
1 20 1
2 30 2
3 40 2
4 50 1
5 60 2
;
RUN;
DATA version2;
INPUT id $ age;
DATALINES;
1 20
2 30
3 30
5 70
;
RUN;
PROC COMPARE DATA = version1
COMPARE = version2;
ID id;
RUN;
library(arsenal)
version1=data.frame(id=1:5,age=c(2:6*10),sexe=sample(1:2,replace = T,size = 5))
version2=data.frame(id=c(1,2,3,5),age=c(20,30,30,70))
exemple1=compare(version1, version2,by="id")
exemple1$vars.summary$values[[2]]
# summary(exemple1)
# diffs(exemple1)
d1
d2
https://cran.r-project.org/web/packages/arsenal/vignettes/compare.html
library(arsenal)
comparison=compare(d1,d2)
comparison
## Compare Object
##
## Function Call:
## compare.data.frame(x = d1, y = d2)
##
## Shared: 6 variables and 3 observations.
## Not shared: 0 variables and 1 observations.
##
## Differences found in 4/5 variables compared.
## 0 variables compared have non-identical attributes.
summary(comparison)
##
##
## Table: Variables not shared
##
## | |
## |:-----------------------|
## |No variables not shared |
##
##
##
## Table: Other variables not compared
##
## | |
## |:-------------------------------|
## |No other variables not compared |
##
##
##
## Table: Observations not shared
##
## version ..row.names.. observation
## -------- -------------- ------------
## x 4 4
##
##
##
## Table: Differences detected by variable
##
## var.x var.y n NAs
## --------------- --------------- --- ----
## Last_Name Last_Name 1 0
## First_Name First_Name 0 0
## Street_Address Street_Address 1 0
## ZIP ZIP 2 0
## VisitCount VisitCount 1 0
##
##
##
## Table: First 10 differences detected per variable
##
## var.x var.y ..row.names.. values.x values.y row.x row.y
## --------------- --------------- -------------- -------------- -------------- ------ ------
## Last_Name Last_Name 3 Don Donn 3 3
## Street_Address Street_Address 2 4321 Tower St 4111 Tower St 2 2
## ZIP ZIP 2 54321 32132 2 2
## ZIP ZIP 3 23232 11111 3 3
## VisitCount VisitCount 2 10 17 2 2
##
##
##
## Table: Non-identical attributes
##
## | |
## |:---------------------------|
## |No non-identical attributes |
summary(compare(d1,d2,by=c("Last_Name","First_Name")))
##
##
## Table: Variables not shared
##
## | |
## |:-----------------------|
## |No variables not shared |
##
##
##
## Table: Other variables not compared
##
## | |
## |:-------------------------------|
## |No other variables not compared |
##
##
##
## Table: Observations not shared
##
## version Last_Name First_Name observation
## -------- ---------- ----------- ------------
## x Don Bob 3
## x Smith Mike 4
## y Donn Bob 3
##
##
##
## Table: Differences detected by variable
##
## var.x var.y n NAs
## --------------- --------------- --- ----
## Street_Address Street_Address 1 0
## ZIP ZIP 1 0
## VisitCount VisitCount 1 0
##
##
##
## Table: First 10 differences detected per variable
##
## var.x var.y Last_Name First_Name values.x values.y row.x row.y
## --------------- --------------- ---------- ----------- -------------- -------------- ------ ------
## Street_Address Street_Address Doe Jane 4321 Tower St 4111 Tower St 2 2
## ZIP ZIP Doe Jane 54321 32132 2 2
## VisitCount VisitCount Doe Jane 10 17 2 2
##
##
##
## Table: Non-identical attributes
##
## | |
## |:---------------------------|
## |No non-identical attributes |
diffs(comparison)
diffs(comparison,by.var=T)
https://stackoverflow.com/questions/28056805/find-discrepancies-between-two-tables
setDT(d1)
d1 <- d1[, list(VarName = names(.SD), TableOne = unlist(.SD, use.names = F)),by=c('Last_Name','First_Name')]
setDT(d2)
d2 <- d2[, list(VarName = names(.SD), TableTwo = unlist(.SD, use.names = F)),by=c('Last_Name','First_Name')]
# Set keys for merging
setkey(d1,Last_Name,First_Name,VarName)
# Merge, remove duplicates
d1[d2,nomatch=0][TableOne!=TableTwo]
Où est la première occurrence de “consult” ? match = find(nm, "consult");
Combien d’occurrence de l’expression “consult” ? howmany = count(nm, "consult");
Concept plus riche avec grep
nm=names(data_sas)
nm[grep(pattern = "consult",x = nm)]
## [1] "consult_mg" "consult_dentiste" "consult_gyneco"
## [4] "consult_spe" "consult_opht" "consult"
data_sas%>%
select(Q32_spec_1)%>%
mutate(Q32_spec_char=as.character(Q32_spec_1),
Q32_spec_len=nchar(Q32_spec_char))%>%
filter(Q32_spec_len>1)%>%
mutate(Q32_spec_1a3=substr(Q32_spec_char,start = 1,stop = 3))%>%
select(Q32_spec_char,Q32_spec_1a3)
On s’intéresse à la variableQ32_spec_1
relative aux spécialités médicales. On veut simuler un vecteur de 1000 spécialistes. On commence par calculer la distribution des modalités avec un équivalent proc freq : table
puis on réalise le tirage aléatoire pondéré avec la fonction sample
freq_Q33=data_sas%>%filter(!Q32_spec_1=="")%>%
mutate(Q32_spec_1=as.character(Q32_spec_1))%>%
select(Q32_spec_1)%>%table
freq_Q33
## .
## Acupuncteur
## 5
## Allergologue
## 62
## Angiologue
## 23
## Autres non spécialistes
## 21
## Autres spécialistes
## 43
## Cancerologue / oncologue
## 56
## Cardiologue
## 393
## Chiropracteur/Etiopathe
## 7
## Chirurgien/anesthésiste
## 102
## Dermatologue
## 185
## Diabétologue / endocrinologue
## 111
## Diététicien/nutritionniste
## 20
## Drepanocytose
## 2
## Estomac/intestin
## 3
## Gastro-entérologue/hépatologue
## 114
## Gynécologue/obstétricien
## 3
## Hématologue
## 6
## Homéopathe
## 6
## Médecin du sport/du travail
## 18
## Nephrologue
## 20
## Neurochirurgien
## 11
## Neurologue
## 95
## NSP
## 23
## ORL
## 148
## Ortho-dentiste
## 11
## Orthopédiste
## 39
## Orthophoniste
## 3
## Orthoptiste
## 8
## Ostéopathe
## 196
## Pédiatre
## 2
## Phlébologue/veines sans précision
## 21
## Pneumologue
## 47
## Podologue
## 36
## Prostate
## 14
## Psychiatre/pédopsy
## 27
## Psychologue
## 18
## Radiologue
## 101
## Rhumatologue (médecin pour hernie, artht
## 163
## Spécialiste jambes, genous
## 15
## Stomatologue
## 10
## Traumatologue
## 5
## Urologue
## 45
sample(x = names(freq_Q33),size=1000,replace = T,prob = freq_Q33)
## [1] "Prostate"
## [2] "Pneumologue"
## [3] "Autres non spécialistes"
## [4] "Cardiologue"
## [5] "Diabétologue / endocrinologue"
## [6] "Neurologue"
## [7] "Ostéopathe"
## [8] "Ostéopathe"
## [9] "Médecin du sport/du travail"
## [10] "Podologue"
## [11] "Cardiologue"
## [12] "Cardiologue"
## [13] "Spécialiste jambes, genous"
## [14] "Neurologue"
## [15] "Cardiologue"
## [16] "Cardiologue"
## [17] "Chirurgien/anesthésiste"
## [18] "Orthopédiste"
## [19] "Radiologue"
## [20] "Rhumatologue (médecin pour hernie, artht"
## [21] "Urologue"
## [22] "Autres spécialistes"
## [23] "Diabétologue / endocrinologue"
## [24] "Cardiologue"
## [25] "Radiologue"
## [26] "Podologue"
## [27] "Chirurgien/anesthésiste"
## [28] "Rhumatologue (médecin pour hernie, artht"
## [29] "Gynécologue/obstétricien"
## [30] "Cardiologue"
## [31] "Autres spécialistes"
## [32] "Cardiologue"
## [33] "Gastro-entérologue/hépatologue"
## [34] "Pneumologue"
## [35] "Urologue"
## [36] "Rhumatologue (médecin pour hernie, artht"
## [37] "Allergologue"
## [38] "Diabétologue / endocrinologue"
## [39] "Psychiatre/pédopsy"
## [40] "Diabétologue / endocrinologue"
## [41] "Radiologue"
## [42] "Urologue"
## [43] "Chirurgien/anesthésiste"
## [44] "Dermatologue"
## [45] "Ostéopathe"
## [46] "Ostéopathe"
## [47] "Cardiologue"
## [48] "Rhumatologue (médecin pour hernie, artht"
## [49] "Ostéopathe"
## [50] "Rhumatologue (médecin pour hernie, artht"
## [51] "NSP"
## [52] "Psychiatre/pédopsy"
## [53] "Autres non spécialistes"
## [54] "Chirurgien/anesthésiste"
## [55] "Ostéopathe"
## [56] "Autres spécialistes"
## [57] "Orthopédiste"
## [58] "Cardiologue"
## [59] "Cancerologue / oncologue"
## [60] "Ostéopathe"
## [61] "Ostéopathe"
## [62] "Chirurgien/anesthésiste"
## [63] "Médecin du sport/du travail"
## [64] "Rhumatologue (médecin pour hernie, artht"
## [65] "Urologue"
## [66] "Orthopédiste"
## [67] "ORL"
## [68] "Cardiologue"
## [69] "Neurologue"
## [70] "Urologue"
## [71] "Cardiologue"
## [72] "Rhumatologue (médecin pour hernie, artht"
## [73] "Psychiatre/pédopsy"
## [74] "Cardiologue"
## [75] "Cardiologue"
## [76] "Neurologue"
## [77] "Diabétologue / endocrinologue"
## [78] "Nephrologue"
## [79] "Cardiologue"
## [80] "Ostéopathe"
## [81] "Cardiologue"
## [82] "Cardiologue"
## [83] "Radiologue"
## [84] "Cardiologue"
## [85] "Cardiologue"
## [86] "Gastro-entérologue/hépatologue"
## [87] "Cardiologue"
## [88] "Psychiatre/pédopsy"
## [89] "Autres spécialistes"
## [90] "Ostéopathe"
## [91] "Radiologue"
## [92] "Ostéopathe"
## [93] "Cancerologue / oncologue"
## [94] "Gastro-entérologue/hépatologue"
## [95] "Neurologue"
## [96] "Allergologue"
## [97] "Chirurgien/anesthésiste"
## [98] "Ostéopathe"
## [99] "Neurologue"
## [100] "ORL"
## [101] "Cardiologue"
## [102] "Urologue"
## [103] "Rhumatologue (médecin pour hernie, artht"
## [104] "Chirurgien/anesthésiste"
## [105] "Chirurgien/anesthésiste"
## [106] "Pneumologue"
## [107] "Dermatologue"
## [108] "Chirurgien/anesthésiste"
## [109] "Rhumatologue (médecin pour hernie, artht"
## [110] "Radiologue"
## [111] "Pneumologue"
## [112] "Cardiologue"
## [113] "Ostéopathe"
## [114] "Neurologue"
## [115] "Dermatologue"
## [116] "Phlébologue/veines sans précision"
## [117] "Dermatologue"
## [118] "Dermatologue"
## [119] "Ostéopathe"
## [120] "ORL"
## [121] "Diabétologue / endocrinologue"
## [122] "Autres spécialistes"
## [123] "Dermatologue"
## [124] "Cardiologue"
## [125] "Médecin du sport/du travail"
## [126] "Diabétologue / endocrinologue"
## [127] "Dermatologue"
## [128] "Cardiologue"
## [129] "NSP"
## [130] "Diabétologue / endocrinologue"
## [131] "Médecin du sport/du travail"
## [132] "Neurologue"
## [133] "ORL"
## [134] "Nephrologue"
## [135] "Ostéopathe"
## [136] "Chirurgien/anesthésiste"
## [137] "Gastro-entérologue/hépatologue"
## [138] "Orthopédiste"
## [139] "Podologue"
## [140] "Gastro-entérologue/hépatologue"
## [141] "Cardiologue"
## [142] "Cardiologue"
## [143] "Cancerologue / oncologue"
## [144] "ORL"
## [145] "Diabétologue / endocrinologue"
## [146] "Rhumatologue (médecin pour hernie, artht"
## [147] "Cardiologue"
## [148] "Podologue"
## [149] "Radiologue"
## [150] "Radiologue"
## [151] "Gastro-entérologue/hépatologue"
## [152] "Cancerologue / oncologue"
## [153] "Autres spécialistes"
## [154] "Dermatologue"
## [155] "Neurologue"
## [156] "Chirurgien/anesthésiste"
## [157] "Radiologue"
## [158] "Cancerologue / oncologue"
## [159] "Cardiologue"
## [160] "Cardiologue"
## [161] "Ostéopathe"
## [162] "Radiologue"
## [163] "Ostéopathe"
## [164] "Cardiologue"
## [165] "ORL"
## [166] "Dermatologue"
## [167] "Diabétologue / endocrinologue"
## [168] "Dermatologue"
## [169] "Cardiologue"
## [170] "Dermatologue"
## [171] "Rhumatologue (médecin pour hernie, artht"
## [172] "Cardiologue"
## [173] "Chirurgien/anesthésiste"
## [174] "Allergologue"
## [175] "Gastro-entérologue/hépatologue"
## [176] "Cardiologue"
## [177] "Dermatologue"
## [178] "Dermatologue"
## [179] "Gastro-entérologue/hépatologue"
## [180] "Rhumatologue (médecin pour hernie, artht"
## [181] "Angiologue"
## [182] "Gastro-entérologue/hépatologue"
## [183] "Radiologue"
## [184] "Chirurgien/anesthésiste"
## [185] "Rhumatologue (médecin pour hernie, artht"
## [186] "Allergologue"
## [187] "NSP"
## [188] "Urologue"
## [189] "Cardiologue"
## [190] "Cancerologue / oncologue"
## [191] "Dermatologue"
## [192] "Radiologue"
## [193] "Dermatologue"
## [194] "Autres non spécialistes"
## [195] "Neurologue"
## [196] "Ostéopathe"
## [197] "Neurologue"
## [198] "Urologue"
## [199] "Psychologue"
## [200] "Cardiologue"
## [201] "Ostéopathe"
## [202] "Cancerologue / oncologue"
## [203] "Ostéopathe"
## [204] "Gastro-entérologue/hépatologue"
## [205] "Dermatologue"
## [206] "Dermatologue"
## [207] "ORL"
## [208] "ORL"
## [209] "Urologue"
## [210] "Pneumologue"
## [211] "Dermatologue"
## [212] "Cardiologue"
## [213] "Rhumatologue (médecin pour hernie, artht"
## [214] "Ostéopathe"
## [215] "Cancerologue / oncologue"
## [216] "Allergologue"
## [217] "Ostéopathe"
## [218] "Cardiologue"
## [219] "Ostéopathe"
## [220] "Phlébologue/veines sans précision"
## [221] "Radiologue"
## [222] "Spécialiste jambes, genous"
## [223] "Ostéopathe"
## [224] "Radiologue"
## [225] "Cardiologue"
## [226] "Dermatologue"
## [227] "Gastro-entérologue/hépatologue"
## [228] "Dermatologue"
## [229] "Chirurgien/anesthésiste"
## [230] "Cardiologue"
## [231] "Radiologue"
## [232] "Rhumatologue (médecin pour hernie, artht"
## [233] "Orthopédiste"
## [234] "Cardiologue"
## [235] "Cancerologue / oncologue"
## [236] "ORL"
## [237] "Dermatologue"
## [238] "Cardiologue"
## [239] "Rhumatologue (médecin pour hernie, artht"
## [240] "Acupuncteur"
## [241] "Rhumatologue (médecin pour hernie, artht"
## [242] "Cardiologue"
## [243] "Diabétologue / endocrinologue"
## [244] "Orthopédiste"
## [245] "Cardiologue"
## [246] "Neurologue"
## [247] "Diabétologue / endocrinologue"
## [248] "Cancerologue / oncologue"
## [249] "Allergologue"
## [250] "NSP"
## [251] "Cardiologue"
## [252] "Allergologue"
## [253] "Dermatologue"
## [254] "Allergologue"
## [255] "Dermatologue"
## [256] "Gastro-entérologue/hépatologue"
## [257] "Cardiologue"
## [258] "Gastro-entérologue/hépatologue"
## [259] "Neurologue"
## [260] "Cardiologue"
## [261] "Cardiologue"
## [262] "Diabétologue / endocrinologue"
## [263] "Ostéopathe"
## [264] "Psychologue"
## [265] "Cardiologue"
## [266] "Orthopédiste"
## [267] "Chirurgien/anesthésiste"
## [268] "Cardiologue"
## [269] "Ostéopathe"
## [270] "Cardiologue"
## [271] "Cancerologue / oncologue"
## [272] "Ostéopathe"
## [273] "Urologue"
## [274] "Chirurgien/anesthésiste"
## [275] "Drepanocytose"
## [276] "Diététicien/nutritionniste"
## [277] "Stomatologue"
## [278] "ORL"
## [279] "Ostéopathe"
## [280] "Rhumatologue (médecin pour hernie, artht"
## [281] "Rhumatologue (médecin pour hernie, artht"
## [282] "Orthopédiste"
## [283] "Phlébologue/veines sans précision"
## [284] "Allergologue"
## [285] "Gastro-entérologue/hépatologue"
## [286] "Cardiologue"
## [287] "Psychiatre/pédopsy"
## [288] "Cardiologue"
## [289] "Rhumatologue (médecin pour hernie, artht"
## [290] "Cardiologue"
## [291] "Gastro-entérologue/hépatologue"
## [292] "Cardiologue"
## [293] "Cardiologue"
## [294] "Gastro-entérologue/hépatologue"
## [295] "Radiologue"
## [296] "Ostéopathe"
## [297] "Allergologue"
## [298] "Diabétologue / endocrinologue"
## [299] "Diabétologue / endocrinologue"
## [300] "ORL"
## [301] "Dermatologue"
## [302] "Spécialiste jambes, genous"
## [303] "NSP"
## [304] "Urologue"
## [305] "Cardiologue"
## [306] "Ostéopathe"
## [307] "Rhumatologue (médecin pour hernie, artht"
## [308] "Dermatologue"
## [309] "Gastro-entérologue/hépatologue"
## [310] "Hématologue"
## [311] "Neurologue"
## [312] "Gastro-entérologue/hépatologue"
## [313] "Ostéopathe"
## [314] "Neurologue"
## [315] "Homéopathe"
## [316] "Autres non spécialistes"
## [317] "Ostéopathe"
## [318] "Rhumatologue (médecin pour hernie, artht"
## [319] "Ortho-dentiste"
## [320] "Ostéopathe"
## [321] "Dermatologue"
## [322] "Dermatologue"
## [323] "Cardiologue"
## [324] "Ostéopathe"
## [325] "Pneumologue"
## [326] "Pédiatre"
## [327] "Allergologue"
## [328] "Neurologue"
## [329] "Dermatologue"
## [330] "Ostéopathe"
## [331] "Ostéopathe"
## [332] "Diabétologue / endocrinologue"
## [333] "Pédiatre"
## [334] "Rhumatologue (médecin pour hernie, artht"
## [335] "Cardiologue"
## [336] "Ostéopathe"
## [337] "Podologue"
## [338] "Rhumatologue (médecin pour hernie, artht"
## [339] "Autres spécialistes"
## [340] "Radiologue"
## [341] "Médecin du sport/du travail"
## [342] "ORL"
## [343] "Chirurgien/anesthésiste"
## [344] "Podologue"
## [345] "Dermatologue"
## [346] "Rhumatologue (médecin pour hernie, artht"
## [347] "Pneumologue"
## [348] "Radiologue"
## [349] "Cardiologue"
## [350] "Nephrologue"
## [351] "Rhumatologue (médecin pour hernie, artht"
## [352] "Cardiologue"
## [353] "Cardiologue"
## [354] "ORL"
## [355] "NSP"
## [356] "Cardiologue"
## [357] "Neurochirurgien"
## [358] "Cardiologue"
## [359] "Rhumatologue (médecin pour hernie, artht"
## [360] "Cardiologue"
## [361] "Ostéopathe"
## [362] "Prostate"
## [363] "Ostéopathe"
## [364] "Rhumatologue (médecin pour hernie, artht"
## [365] "Diabétologue / endocrinologue"
## [366] "Ostéopathe"
## [367] "Rhumatologue (médecin pour hernie, artht"
## [368] "Radiologue"
## [369] "Diététicien/nutritionniste"
## [370] "Diabétologue / endocrinologue"
## [371] "Diabétologue / endocrinologue"
## [372] "ORL"
## [373] "Dermatologue"
## [374] "ORL"
## [375] "Cardiologue"
## [376] "Dermatologue"
## [377] "Chirurgien/anesthésiste"
## [378] "Cardiologue"
## [379] "Rhumatologue (médecin pour hernie, artht"
## [380] "Diététicien/nutritionniste"
## [381] "NSP"
## [382] "Radiologue"
## [383] "Diabétologue / endocrinologue"
## [384] "Cardiologue"
## [385] "Dermatologue"
## [386] "ORL"
## [387] "Cardiologue"
## [388] "Gastro-entérologue/hépatologue"
## [389] "Gastro-entérologue/hépatologue"
## [390] "Cardiologue"
## [391] "Ostéopathe"
## [392] "Orthopédiste"
## [393] "Allergologue"
## [394] "Cancerologue / oncologue"
## [395] "Orthopédiste"
## [396] "Cardiologue"
## [397] "Radiologue"
## [398] "Dermatologue"
## [399] "Angiologue"
## [400] "Dermatologue"
## [401] "Chirurgien/anesthésiste"
## [402] "Dermatologue"
## [403] "Nephrologue"
## [404] "Pneumologue"
## [405] "Ostéopathe"
## [406] "Autres non spécialistes"
## [407] "Orthopédiste"
## [408] "Psychiatre/pédopsy"
## [409] "ORL"
## [410] "ORL"
## [411] "Rhumatologue (médecin pour hernie, artht"
## [412] "Angiologue"
## [413] "Psychologue"
## [414] "Ostéopathe"
## [415] "Gastro-entérologue/hépatologue"
## [416] "Rhumatologue (médecin pour hernie, artht"
## [417] "Chirurgien/anesthésiste"
## [418] "Estomac/intestin"
## [419] "Neurologue"
## [420] "Ostéopathe"
## [421] "Diététicien/nutritionniste"
## [422] "Allergologue"
## [423] "Dermatologue"
## [424] "Dermatologue"
## [425] "ORL"
## [426] "Cardiologue"
## [427] "Pédiatre"
## [428] "Phlébologue/veines sans précision"
## [429] "Dermatologue"
## [430] "Radiologue"
## [431] "Diabétologue / endocrinologue"
## [432] "Neurologue"
## [433] "Dermatologue"
## [434] "Dermatologue"
## [435] "Chirurgien/anesthésiste"
## [436] "Cancerologue / oncologue"
## [437] "Diabétologue / endocrinologue"
## [438] "Dermatologue"
## [439] "Dermatologue"
## [440] "Cardiologue"
## [441] "Neurologue"
## [442] "Cardiologue"
## [443] "Rhumatologue (médecin pour hernie, artht"
## [444] "Dermatologue"
## [445] "Urologue"
## [446] "Diététicien/nutritionniste"
## [447] "ORL"
## [448] "Ostéopathe"
## [449] "Ostéopathe"
## [450] "Ostéopathe"
## [451] "Dermatologue"
## [452] "ORL"
## [453] "Rhumatologue (médecin pour hernie, artht"
## [454] "Cardiologue"
## [455] "Autres spécialistes"
## [456] "Ostéopathe"
## [457] "Cancerologue / oncologue"
## [458] "Autres non spécialistes"
## [459] "Gastro-entérologue/hépatologue"
## [460] "Dermatologue"
## [461] "Psychiatre/pédopsy"
## [462] "ORL"
## [463] "Cardiologue"
## [464] "ORL"
## [465] "Cardiologue"
## [466] "Podologue"
## [467] "Cardiologue"
## [468] "ORL"
## [469] "Cardiologue"
## [470] "Rhumatologue (médecin pour hernie, artht"
## [471] "Chiropracteur/Etiopathe"
## [472] "Rhumatologue (médecin pour hernie, artht"
## [473] "Gastro-entérologue/hépatologue"
## [474] "Psychiatre/pédopsy"
## [475] "Ostéopathe"
## [476] "Neurologue"
## [477] "Diabétologue / endocrinologue"
## [478] "Dermatologue"
## [479] "ORL"
## [480] "Dermatologue"
## [481] "Médecin du sport/du travail"
## [482] "Ostéopathe"
## [483] "Rhumatologue (médecin pour hernie, artht"
## [484] "Cardiologue"
## [485] "Rhumatologue (médecin pour hernie, artht"
## [486] "Rhumatologue (médecin pour hernie, artht"
## [487] "ORL"
## [488] "Cardiologue"
## [489] "Diabétologue / endocrinologue"
## [490] "Diététicien/nutritionniste"
## [491] "Gastro-entérologue/hépatologue"
## [492] "Ostéopathe"
## [493] "Rhumatologue (médecin pour hernie, artht"
## [494] "Ostéopathe"
## [495] "Cardiologue"
## [496] "Cardiologue"
## [497] "Cardiologue"
## [498] "Diabétologue / endocrinologue"
## [499] "Radiologue"
## [500] "Ostéopathe"
## [501] "Rhumatologue (médecin pour hernie, artht"
## [502] "Autres spécialistes"
## [503] "Gastro-entérologue/hépatologue"
## [504] "Cardiologue"
## [505] "Gastro-entérologue/hépatologue"
## [506] "Nephrologue"
## [507] "Ostéopathe"
## [508] "Urologue"
## [509] "Ostéopathe"
## [510] "Cardiologue"
## [511] "Nephrologue"
## [512] "Chirurgien/anesthésiste"
## [513] "Stomatologue"
## [514] "ORL"
## [515] "Neurologue"
## [516] "Radiologue"
## [517] "Gastro-entérologue/hépatologue"
## [518] "Cardiologue"
## [519] "Ostéopathe"
## [520] "Cardiologue"
## [521] "Orthopédiste"
## [522] "Dermatologue"
## [523] "Ostéopathe"
## [524] "Cardiologue"
## [525] "Neurologue"
## [526] "Cardiologue"
## [527] "Cardiologue"
## [528] "Diabétologue / endocrinologue"
## [529] "Cardiologue"
## [530] "Ostéopathe"
## [531] "Gastro-entérologue/hépatologue"
## [532] "ORL"
## [533] "Neurologue"
## [534] "Nephrologue"
## [535] "Diabétologue / endocrinologue"
## [536] "Dermatologue"
## [537] "Cardiologue"
## [538] "Radiologue"
## [539] "Pneumologue"
## [540] "Radiologue"
## [541] "Dermatologue"
## [542] "Ostéopathe"
## [543] "ORL"
## [544] "Rhumatologue (médecin pour hernie, artht"
## [545] "Cardiologue"
## [546] "Rhumatologue (médecin pour hernie, artht"
## [547] "Radiologue"
## [548] "Pneumologue"
## [549] "Diabétologue / endocrinologue"
## [550] "Neurologue"
## [551] "Orthopédiste"
## [552] "Dermatologue"
## [553] "Chirurgien/anesthésiste"
## [554] "Diabétologue / endocrinologue"
## [555] "NSP"
## [556] "Cardiologue"
## [557] "Ostéopathe"
## [558] "Cardiologue"
## [559] "ORL"
## [560] "Podologue"
## [561] "Autres spécialistes"
## [562] "Dermatologue"
## [563] "Radiologue"
## [564] "Cardiologue"
## [565] "Prostate"
## [566] "Cardiologue"
## [567] "ORL"
## [568] "Allergologue"
## [569] "Cardiologue"
## [570] "Neurologue"
## [571] "NSP"
## [572] "Gastro-entérologue/hépatologue"
## [573] "Dermatologue"
## [574] "Dermatologue"
## [575] "Neurochirurgien"
## [576] "Psychiatre/pédopsy"
## [577] "Neurologue"
## [578] "NSP"
## [579] "Ostéopathe"
## [580] "Cardiologue"
## [581] "Gastro-entérologue/hépatologue"
## [582] "Ostéopathe"
## [583] "Pneumologue"
## [584] "Cardiologue"
## [585] "Allergologue"
## [586] "Diabétologue / endocrinologue"
## [587] "Gastro-entérologue/hépatologue"
## [588] "Ostéopathe"
## [589] "Phlébologue/veines sans précision"
## [590] "Rhumatologue (médecin pour hernie, artht"
## [591] "Hématologue"
## [592] "Radiologue"
## [593] "ORL"
## [594] "Cancerologue / oncologue"
## [595] "ORL"
## [596] "Diabétologue / endocrinologue"
## [597] "ORL"
## [598] "Neurologue"
## [599] "Diabétologue / endocrinologue"
## [600] "Chirurgien/anesthésiste"
## [601] "Dermatologue"
## [602] "Ostéopathe"
## [603] "Médecin du sport/du travail"
## [604] "ORL"
## [605] "Cardiologue"
## [606] "Autres spécialistes"
## [607] "Dermatologue"
## [608] "ORL"
## [609] "Dermatologue"
## [610] "Dermatologue"
## [611] "Phlébologue/veines sans précision"
## [612] "Neurologue"
## [613] "Prostate"
## [614] "Chirurgien/anesthésiste"
## [615] "Diabétologue / endocrinologue"
## [616] "Orthopédiste"
## [617] "Allergologue"
## [618] "Diabétologue / endocrinologue"
## [619] "Pneumologue"
## [620] "Cardiologue"
## [621] "Cardiologue"
## [622] "Autres spécialistes"
## [623] "Orthopédiste"
## [624] "Rhumatologue (médecin pour hernie, artht"
## [625] "Cardiologue"
## [626] "Cardiologue"
## [627] "Ostéopathe"
## [628] "Radiologue"
## [629] "Cancerologue / oncologue"
## [630] "Diabétologue / endocrinologue"
## [631] "Dermatologue"
## [632] "Cardiologue"
## [633] "Ostéopathe"
## [634] "ORL"
## [635] "Gastro-entérologue/hépatologue"
## [636] "Ostéopathe"
## [637] "Dermatologue"
## [638] "Chirurgien/anesthésiste"
## [639] "Diabétologue / endocrinologue"
## [640] "Rhumatologue (médecin pour hernie, artht"
## [641] "Cardiologue"
## [642] "Radiologue"
## [643] "Cardiologue"
## [644] "Dermatologue"
## [645] "Cardiologue"
## [646] "Ostéopathe"
## [647] "Rhumatologue (médecin pour hernie, artht"
## [648] "Neurologue"
## [649] "Cardiologue"
## [650] "Cardiologue"
## [651] "Rhumatologue (médecin pour hernie, artht"
## [652] "Cardiologue"
## [653] "Autres non spécialistes"
## [654] "Cardiologue"
## [655] "Radiologue"
## [656] "ORL"
## [657] "Dermatologue"
## [658] "Dermatologue"
## [659] "Gastro-entérologue/hépatologue"
## [660] "Rhumatologue (médecin pour hernie, artht"
## [661] "ORL"
## [662] "Allergologue"
## [663] "Neurochirurgien"
## [664] "Diabétologue / endocrinologue"
## [665] "Chirurgien/anesthésiste"
## [666] "Diabétologue / endocrinologue"
## [667] "Phlébologue/veines sans précision"
## [668] "Phlébologue/veines sans précision"
## [669] "ORL"
## [670] "Gastro-entérologue/hépatologue"
## [671] "Neurologue"
## [672] "Nephrologue"
## [673] "Prostate"
## [674] "Dermatologue"
## [675] "Cardiologue"
## [676] "Angiologue"
## [677] "ORL"
## [678] "Rhumatologue (médecin pour hernie, artht"
## [679] "Rhumatologue (médecin pour hernie, artht"
## [680] "Autres spécialistes"
## [681] "Dermatologue"
## [682] "Rhumatologue (médecin pour hernie, artht"
## [683] "Cardiologue"
## [684] "Rhumatologue (médecin pour hernie, artht"
## [685] "Diabétologue / endocrinologue"
## [686] "Phlébologue/veines sans précision"
## [687] "Cardiologue"
## [688] "Neurologue"
## [689] "Diabétologue / endocrinologue"
## [690] "Dermatologue"
## [691] "Ostéopathe"
## [692] "Urologue"
## [693] "Ostéopathe"
## [694] "Cardiologue"
## [695] "Cardiologue"
## [696] "Rhumatologue (médecin pour hernie, artht"
## [697] "Cardiologue"
## [698] "Chirurgien/anesthésiste"
## [699] "Ostéopathe"
## [700] "Ostéopathe"
## [701] "Nephrologue"
## [702] "Ostéopathe"
## [703] "Dermatologue"
## [704] "Chirurgien/anesthésiste"
## [705] "Diabétologue / endocrinologue"
## [706] "Ostéopathe"
## [707] "Angiologue"
## [708] "Cancerologue / oncologue"
## [709] "Angiologue"
## [710] "Diabétologue / endocrinologue"
## [711] "Diététicien/nutritionniste"
## [712] "Gastro-entérologue/hépatologue"
## [713] "Ostéopathe"
## [714] "Ostéopathe"
## [715] "Allergologue"
## [716] "Chirurgien/anesthésiste"
## [717] "Ostéopathe"
## [718] "Dermatologue"
## [719] "ORL"
## [720] "Neurologue"
## [721] "Cardiologue"
## [722] "Chirurgien/anesthésiste"
## [723] "ORL"
## [724] "Urologue"
## [725] "Neurologue"
## [726] "Phlébologue/veines sans précision"
## [727] "Acupuncteur"
## [728] "Cardiologue"
## [729] "Neurologue"
## [730] "Autres spécialistes"
## [731] "Neurologue"
## [732] "Spécialiste jambes, genous"
## [733] "Ostéopathe"
## [734] "Rhumatologue (médecin pour hernie, artht"
## [735] "Cardiologue"
## [736] "Cardiologue"
## [737] "Ostéopathe"
## [738] "ORL"
## [739] "Chirurgien/anesthésiste"
## [740] "Pneumologue"
## [741] "Psychiatre/pédopsy"
## [742] "ORL"
## [743] "Dermatologue"
## [744] "Cancerologue / oncologue"
## [745] "ORL"
## [746] "Cardiologue"
## [747] "Rhumatologue (médecin pour hernie, artht"
## [748] "Gastro-entérologue/hépatologue"
## [749] "Rhumatologue (médecin pour hernie, artht"
## [750] "Cardiologue"
## [751] "Phlébologue/veines sans précision"
## [752] "Dermatologue"
## [753] "Cardiologue"
## [754] "Cardiologue"
## [755] "Dermatologue"
## [756] "Dermatologue"
## [757] "Chirurgien/anesthésiste"
## [758] "Psychologue"
## [759] "Cardiologue"
## [760] "Cardiologue"
## [761] "Chirurgien/anesthésiste"
## [762] "Rhumatologue (médecin pour hernie, artht"
## [763] "Podologue"
## [764] "Cardiologue"
## [765] "Podologue"
## [766] "ORL"
## [767] "Chirurgien/anesthésiste"
## [768] "Cardiologue"
## [769] "Cardiologue"
## [770] "NSP"
## [771] "Cardiologue"
## [772] "Ostéopathe"
## [773] "Rhumatologue (médecin pour hernie, artht"
## [774] "Prostate"
## [775] "Ostéopathe"
## [776] "Chirurgien/anesthésiste"
## [777] "Dermatologue"
## [778] "Autres non spécialistes"
## [779] "Rhumatologue (médecin pour hernie, artht"
## [780] "Gastro-entérologue/hépatologue"
## [781] "Dermatologue"
## [782] "Dermatologue"
## [783] "Neurologue"
## [784] "Diabétologue / endocrinologue"
## [785] "Gastro-entérologue/hépatologue"
## [786] "Dermatologue"
## [787] "Psychiatre/pédopsy"
## [788] "Chirurgien/anesthésiste"
## [789] "ORL"
## [790] "Phlébologue/veines sans précision"
## [791] "Cardiologue"
## [792] "Cardiologue"
## [793] "ORL"
## [794] "Cardiologue"
## [795] "ORL"
## [796] "Dermatologue"
## [797] "Diabétologue / endocrinologue"
## [798] "ORL"
## [799] "Chirurgien/anesthésiste"
## [800] "ORL"
## [801] "Cardiologue"
## [802] "Urologue"
## [803] "Gastro-entérologue/hépatologue"
## [804] "Cardiologue"
## [805] "NSP"
## [806] "Dermatologue"
## [807] "Ostéopathe"
## [808] "Psychiatre/pédopsy"
## [809] "Dermatologue"
## [810] "Cardiologue"
## [811] "Ostéopathe"
## [812] "Urologue"
## [813] "Urologue"
## [814] "Angiologue"
## [815] "Ostéopathe"
## [816] "Ortho-dentiste"
## [817] "Angiologue"
## [818] "Chirurgien/anesthésiste"
## [819] "Chirurgien/anesthésiste"
## [820] "Allergologue"
## [821] "Ostéopathe"
## [822] "Rhumatologue (médecin pour hernie, artht"
## [823] "Rhumatologue (médecin pour hernie, artht"
## [824] "Podologue"
## [825] "Diabétologue / endocrinologue"
## [826] "Radiologue"
## [827] "Chirurgien/anesthésiste"
## [828] "Diabétologue / endocrinologue"
## [829] "Cardiologue"
## [830] "Phlébologue/veines sans précision"
## [831] "Diabétologue / endocrinologue"
## [832] "Dermatologue"
## [833] "Radiologue"
## [834] "ORL"
## [835] "Cardiologue"
## [836] "ORL"
## [837] "Dermatologue"
## [838] "Radiologue"
## [839] "Ostéopathe"
## [840] "Neurologue"
## [841] "ORL"
## [842] "Pneumologue"
## [843] "Homéopathe"
## [844] "Radiologue"
## [845] "Cardiologue"
## [846] "Dermatologue"
## [847] "Dermatologue"
## [848] "Dermatologue"
## [849] "Radiologue"
## [850] "Psychologue"
## [851] "Ostéopathe"
## [852] "Allergologue"
## [853] "Gastro-entérologue/hépatologue"
## [854] "Ortho-dentiste"
## [855] "Allergologue"
## [856] "Cardiologue"
## [857] "Ostéopathe"
## [858] "Ostéopathe"
## [859] "Dermatologue"
## [860] "Autres non spécialistes"
## [861] "Rhumatologue (médecin pour hernie, artht"
## [862] "Cardiologue"
## [863] "Dermatologue"
## [864] "Cancerologue / oncologue"
## [865] "Chiropracteur/Etiopathe"
## [866] "Dermatologue"
## [867] "Ostéopathe"
## [868] "ORL"
## [869] "Autres spécialistes"
## [870] "Diététicien/nutritionniste"
## [871] "Nephrologue"
## [872] "Cardiologue"
## [873] "Cardiologue"
## [874] "ORL"
## [875] "ORL"
## [876] "Chirurgien/anesthésiste"
## [877] "Ostéopathe"
## [878] "Gastro-entérologue/hépatologue"
## [879] "Cardiologue"
## [880] "ORL"
## [881] "Rhumatologue (médecin pour hernie, artht"
## [882] "Cardiologue"
## [883] "Dermatologue"
## [884] "Neurologue"
## [885] "ORL"
## [886] "Cardiologue"
## [887] "Prostate"
## [888] "Dermatologue"
## [889] "Cardiologue"
## [890] "ORL"
## [891] "Cardiologue"
## [892] "Chirurgien/anesthésiste"
## [893] "Rhumatologue (médecin pour hernie, artht"
## [894] "ORL"
## [895] "Cardiologue"
## [896] "Diabétologue / endocrinologue"
## [897] "Radiologue"
## [898] "ORL"
## [899] "Cardiologue"
## [900] "Cardiologue"
## [901] "Neurologue"
## [902] "Cardiologue"
## [903] "Phlébologue/veines sans précision"
## [904] "Cardiologue"
## [905] "Radiologue"
## [906] "Nephrologue"
## [907] "Cardiologue"
## [908] "Diabétologue / endocrinologue"
## [909] "Ostéopathe"
## [910] "Diabétologue / endocrinologue"
## [911] "Cardiologue"
## [912] "Cardiologue"
## [913] "Rhumatologue (médecin pour hernie, artht"
## [914] "Ostéopathe"
## [915] "Chirurgien/anesthésiste"
## [916] "Autres spécialistes"
## [917] "Radiologue"
## [918] "Ostéopathe"
## [919] "Pneumologue"
## [920] "Cardiologue"
## [921] "Pneumologue"
## [922] "Cardiologue"
## [923] "Urologue"
## [924] "Rhumatologue (médecin pour hernie, artht"
## [925] "Radiologue"
## [926] "Ortho-dentiste"
## [927] "Cardiologue"
## [928] "Allergologue"
## [929] "Nephrologue"
## [930] "Neurologue"
## [931] "Diabétologue / endocrinologue"
## [932] "Diabétologue / endocrinologue"
## [933] "Neurochirurgien"
## [934] "Cardiologue"
## [935] "Cardiologue"
## [936] "Pneumologue"
## [937] "Ostéopathe"
## [938] "Diabétologue / endocrinologue"
## [939] "Orthopédiste"
## [940] "ORL"
## [941] "Chirurgien/anesthésiste"
## [942] "Cardiologue"
## [943] "Dermatologue"
## [944] "Podologue"
## [945] "Diététicien/nutritionniste"
## [946] "Cardiologue"
## [947] "Cancerologue / oncologue"
## [948] "Psychiatre/pédopsy"
## [949] "Allergologue"
## [950] "Nephrologue"
## [951] "Rhumatologue (médecin pour hernie, artht"
## [952] "Cardiologue"
## [953] "Phlébologue/veines sans précision"
## [954] "ORL"
## [955] "Cardiologue"
## [956] "Neurologue"
## [957] "Rhumatologue (médecin pour hernie, artht"
## [958] "Cardiologue"
## [959] "Médecin du sport/du travail"
## [960] "Radiologue"
## [961] "Gastro-entérologue/hépatologue"
## [962] "Radiologue"
## [963] "Cardiologue"
## [964] "Dermatologue"
## [965] "Prostate"
## [966] "Podologue"
## [967] "Ostéopathe"
## [968] "Allergologue"
## [969] "Dermatologue"
## [970] "Radiologue"
## [971] "Gastro-entérologue/hépatologue"
## [972] "Autres spécialistes"
## [973] "Pneumologue"
## [974] "Chirurgien/anesthésiste"
## [975] "Ostéopathe"
## [976] "Orthoptiste"
## [977] "Gastro-entérologue/hépatologue"
## [978] "Spécialiste jambes, genous"
## [979] "Cardiologue"
## [980] "Podologue"
## [981] "Rhumatologue (médecin pour hernie, artht"
## [982] "Ortho-dentiste"
## [983] "Cardiologue"
## [984] "Diabétologue / endocrinologue"
## [985] "Cancerologue / oncologue"
## [986] "Diététicien/nutritionniste"
## [987] "Diabétologue / endocrinologue"
## [988] "Ortho-dentiste"
## [989] "Autres spécialistes"
## [990] "Rhumatologue (médecin pour hernie, artht"
## [991] "Autres spécialistes"
## [992] "ORL"
## [993] "Gastro-entérologue/hépatologue"
## [994] "Cardiologue"
## [995] "Neurologue"
## [996] "Cardiologue"
## [997] "Chirurgien/anesthésiste"
## [998] "Neurologue"
## [999] "Ostéopathe"
## [1000] "Rhumatologue (médecin pour hernie, artht"
lapply(data_sas%>%
select_if(is.factor)%>%.[,1:10],
function(x){
x%>%
tibble()%>%
group_by_all()%>%
summarise(volume=n(),
len=length(x),
freq_pct=round(100*volume/len,2),
freq_print=paste0(freq_pct,"%")
)%>%
arrange(-freq_pct)%>%
select(-volume,-len,-freq_pct)
})
## $mc27s1
## # A tibble: 3 x 2
## . freq_print
## <fct> <chr>
## 1 "" 97.8%
## 2 non 1.35%
## 3 oui 0.85%
##
## $mc27s2
## # A tibble: 4 x 2
## . freq_print
## <fct> <chr>
## 1 "" 79.82%
## 2 oui 16.8%
## 3 non 3.38%
## 4 [nsp] 0.01%
##
## $mc27s3
## # A tibble: 3 x 2
## . freq_print
## <fct> <chr>
## 1 "" 98.44%
## 2 n 1.52%
## 3 o 0.05%
##
## $mc27s4
## # A tibble: 4 x 2
## . freq_print
## <fct> <chr>
## 1 "" 85.35%
## 2 oui 8.55%
## 3 non 6.09%
## 4 [nsp] 0%
##
## $mc27s5
## # A tibble: 4 x 2
## . freq_print
## <fct> <chr>
## 1 "" 73.52%
## 2 non 24.35%
## 3 oui 2.13%
## 4 [nsp] 0%
##
## $mc27s6
## # A tibble: 4 x 2
## . freq_print
## <fct> <chr>
## 1 "" 73.52%
## 2 oui 15.46%
## 3 non 11.01%
## 4 [nsp] 0.01%
##
## $mc27s7
## # A tibble: 4 x 2
## . freq_print
## <fct> <chr>
## 1 "" 73.52%
## 2 non 24.3%
## 3 oui 2.12%
## 4 [nsp] 0.06%
##
## $mc27s8
## # A tibble: 4 x 2
## . freq_print
## <fct> <chr>
## 1 "" 73.52%
## 2 non 25.36%
## 3 oui 1.11%
## 4 [nsp] 0.02%
##
## $mc27s9
## # A tibble: 4 x 2
## . freq_print
## <fct> <chr>
## 1 "" 79.82%
## 2 non 13.37%
## 3 oui 6.81%
## 4 [nsp] 0.01%
##
## $pcs7
## # A tibble: 8 x 2
## . freq_print
## <fct> <chr>
## 1 Employés 29.49%
## 2 Professions intermédiaires... 25.89%
## 3 Ouvriers 19.08%
## 4 Cadres, professions intellectuelles... 16.06%
## 5 Artisans, commerçants,... 5.92%
## 6 Agriculteurs exploitants 1.66%
## 7 "" 0.95%
## 8 Sans activite (DOM seulement) 0.95%
data_sas%>%
filter(DEP%in%c("Métropole","Martinique"))%>%
filter(!is.na(mh5_score))%>%
group_by(age,sexe)%>%
summarise(
volume=n(),
pond=sum(poids_ind),
bonnesante_w=weighted.mean(bonnesante,w=poids_ind,na.rm=T),
mh5_score_dec1=quantile(mh5_score,.1),
mh5_score_dec9=quantile(mh5_score,.9),
mh5_score_sd=sd(mh5_score),
mh5_score_cl_inf=t.test(mh5_score)$conf.int[1],
mh5_score_cl_sup=t.test(mh5_score)$conf.int[2],
pbdent_w=weighted.mean(pbdent,w=poids_ind,na.rm=T))%>%
arrange(age)
cf formation
do i = 1 %to 4
for (i in 1:4){
print(i^2)
}
## [1] 1
## [1] 4
## [1] 9
## [1] 16
cf formation
GLM, choix des levels dans le GLM
https://stackoverflow.com/questions/23282048/logistic-regression-defining-reference-level-in-rdata_sas%>%
mutate(sexe = relevel(sexe, ref = "Femmes"),
sd_diplome3 = relevel(sd_diplome3, ref = "< Bac"),
sd_sitprof_6 = relevel(sd_sitprof_6, ref = "Chomage"),
sit_financiere_percue = relevel(sit_financiere_percue, ref = "Ca va"),
sd_revenus_3K = relevel(sd_revenus_3K, ref = "1er tercile (faible)")
) -> data_sas
logistic <- glm(bonnesante ~ age + sexe + sd_diplome3 + sd_sitprof_6 + sit_financiere_percue + sd_revenus_3K ,family=binomial(link=logit), data=data_sas%>%filter(DEP=="Métropole"), na.action = na.exclude)
summary(logistic)
##
## Call:
## glm(formula = bonnesante ~ age + sexe + sd_diplome3 + sd_sitprof_6 +
## sit_financiere_percue + sd_revenus_3K, family = binomial(link = logit),
## data = data_sas %>% filter(DEP == "Métropole"), na.action = na.exclude)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.1462 -1.2005 0.6448 0.8555 1.5527
##
## Coefficients:
## Estimate Std. Error z value
## (Intercept) 2.119346 0.204001 10.389
## age -0.027873 0.003421 -8.148
## sexeHommes 0.128928 0.065129 1.980
## sd_diplome3 12.641911 227.624984 0.056
## sd_diplome3> Bac 0.368788 0.078637 4.690
## sd_diplome3Bac 0.085883 0.087801 0.978
## sd_sitprof_6 0.232424 1.177101 0.197
## sd_sitprof_6Autres ina -0.318371 0.179432 -1.774
## sd_sitprof_6Etudes -0.154651 0.189683 -0.815
## sd_sitprof_6Retraite -0.099666 0.162678 -0.613
## sd_sitprof_6Travail -0.060831 0.129616 -0.469
## sit_financiere_percue 0.266234 0.583074 0.457
## sit_financiere_percueA l'aise 0.252130 0.101075 2.494
## sit_financiere_percueC'est difficile -0.682505 0.109218 -6.249
## sit_financiere_percueC'est juste -0.216673 0.080200 -2.702
## sit_financiere_percueN'y arrive pas sa -1.062393 0.183790 -5.780
## sd_revenus_3K2nd tercile 0.060777 0.089305 0.681
## sd_revenus_3K3ème tercile (élevé) 0.096390 0.100669 0.957
## sd_revenus_3KNSP/Refus 0.218558 0.157462 1.388
## Pr(>|z|)
## (Intercept) < 2e-16 ***
## age 3.69e-16 ***
## sexeHommes 0.0478 *
## sd_diplome3 0.9557
## sd_diplome3> Bac 2.74e-06 ***
## sd_diplome3Bac 0.3280
## sd_sitprof_6 0.8435
## sd_sitprof_6Autres ina 0.0760 .
## sd_sitprof_6Etudes 0.4149
## sd_sitprof_6Retraite 0.5401
## sd_sitprof_6Travail 0.6388
## sit_financiere_percue 0.6480
## sit_financiere_percueA l'aise 0.0126 *
## sit_financiere_percueC'est difficile 4.13e-10 ***
## sit_financiere_percueC'est juste 0.0069 **
## sit_financiere_percueN'y arrive pas sa 7.45e-09 ***
## sd_revenus_3K2nd tercile 0.4962
## sd_revenus_3K3ème tercile (élevé) 0.3383
## sd_revenus_3KNSP/Refus 0.1651
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 6221.0 on 5129 degrees of freedom
## Residual deviance: 5842.3 on 5111 degrees of freedom
## (19078 observations deleted due to missingness)
## AIC: 5880.3
##
## Number of Fisher Scoring iterations: 12
logistic <- glm(bonnesante ~ tage*sexe + sd_diplome3 + sd_sitprof_6 + sit_financiere_percue + sd_revenus_3K ,family=binomial(link=logit), data=data_sas%>%filter(DEP=="Métropole"), na.action = na.exclude)
summary(logistic)
##
## Call:
## glm(formula = bonnesante ~ tage * sexe + sd_diplome3 + sd_sitprof_6 +
## sit_financiere_percue + sd_revenus_3K, family = binomial(link = logit),
## data = data_sas %>% filter(DEP == "Métropole"), na.action = na.exclude)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.4156 -1.1985 0.6457 0.8453 1.5514
##
## Coefficients:
## Estimate Std. Error z value
## (Intercept) 2.232618 0.777538 2.871
## tage(15,20] -1.196577 0.766194 -1.562
## tage(20,30] -0.756945 0.775132 -0.977
## tage(30,40] -1.010180 0.779019 -1.297
## tage(40,50] -1.329428 0.776598 -1.712
## tage(50,60] -1.708404 0.776273 -2.201
## tage(60,70] -1.941488 0.786580 -2.468
## tage(70,75] -2.368904 0.803072 -2.950
## sexeHommes 0.237581 1.042046 0.228
## sd_diplome3 12.736208 227.218117 0.056
## sd_diplome3> Bac 0.349902 0.080998 4.320
## sd_diplome3Bac 0.099249 0.088535 1.121
## sd_sitprof_6 0.178972 1.187745 0.151
## sd_sitprof_6Autres ina -0.345126 0.179686 -1.921
## sd_sitprof_6Etudes 0.125723 0.225268 0.558
## sd_sitprof_6Retraite -0.017245 0.189056 -0.091
## sd_sitprof_6Travail -0.098923 0.130210 -0.760
## sit_financiere_percue 0.183084 0.583355 0.314
## sit_financiere_percueA l'aise 0.266062 0.101525 2.621
## sit_financiere_percueC'est difficile -0.692915 0.109691 -6.317
## sit_financiere_percueC'est juste -0.224301 0.080430 -2.789
## sit_financiere_percueN'y arrive pas sa -1.072809 0.184371 -5.819
## sd_revenus_3K2nd tercile 0.058783 0.089665 0.656
## sd_revenus_3K3ème tercile (élevé) 0.109055 0.101787 1.071
## sd_revenus_3KNSP/Refus 0.234504 0.158095 1.483
## tage(15,20]:sexeHommes 0.053656 1.082428 0.050
## tage(20,30]:sexeHommes -0.322285 1.058855 -0.304
## tage(30,40]:sexeHommes -0.156002 1.054517 -0.148
## tage(40,50]:sexeHommes 0.022663 1.051503 0.022
## tage(50,60]:sexeHommes -0.004661 1.051040 -0.004
## tage(60,70]:sexeHommes -0.250418 1.052658 -0.238
## tage(70,75]:sexeHommes -0.203240 1.079078 -0.188
## Pr(>|z|)
## (Intercept) 0.00409 **
## tage(15,20] 0.11836
## tage(20,30] 0.32880
## tage(30,40] 0.19472
## tage(40,50] 0.08692 .
## tage(50,60] 0.02775 *
## tage(60,70] 0.01358 *
## tage(70,75] 0.00318 **
## sexeHommes 0.81965
## sd_diplome3 0.95530
## sd_diplome3> Bac 1.56e-05 ***
## sd_diplome3Bac 0.26228
## sd_sitprof_6 0.88023
## sd_sitprof_6Autres ina 0.05477 .
## sd_sitprof_6Etudes 0.57677
## sd_sitprof_6Retraite 0.92732
## sd_sitprof_6Travail 0.44742
## sit_financiere_percue 0.75364
## sit_financiere_percueA l'aise 0.00878 **
## sit_financiere_percueC'est difficile 2.67e-10 ***
## sit_financiere_percueC'est juste 0.00529 **
## sit_financiere_percueN'y arrive pas sa 5.93e-09 ***
## sd_revenus_3K2nd tercile 0.51209
## sd_revenus_3K3ème tercile (élevé) 0.28399
## sd_revenus_3KNSP/Refus 0.13799
## tage(15,20]:sexeHommes 0.96046
## tage(20,30]:sexeHommes 0.76085
## tage(30,40]:sexeHommes 0.88239
## tage(40,50]:sexeHommes 0.98280
## tage(50,60]:sexeHommes 0.99646
## tage(60,70]:sexeHommes 0.81197
## tage(70,75]:sexeHommes 0.85061
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 6221.0 on 5129 degrees of freedom
## Residual deviance: 5826.2 on 5098 degrees of freedom
## (19078 observations deleted due to missingness)
## AIC: 5890.2
##
## Number of Fisher Scoring iterations: 12
Le package glmnet permet de faire des régressions L1 (LASSO), L2 (RIDGE) et Elastic-Net (mix L1-L2).
Vous trouverez dans la documentation de très bons exemples en bas du document.
C:\Users\phileas.condemine\Documents\R\R-3.4.3\bin\Rscript.exe
C:\Users\phileas.condemine\Documents\MicroSim\retraite\Programmes_R\Import_data_R.R
pipe
.
options noxwait xsync;
filename proc_r pipe "C:\Users\phileas.condemine\Documents\R\R-3.4.3\bin\Rscript.exe --vanilla C:\Users\phileas.condemine\Documents\MicroSim\retraite\Programmes_R\Import_data_R.R 1976 C:/Users/phileas.condemine/Documents/MicroSim/retraite/ base_en_sortie/ Base_en_entree/ import_prepared_by_sas/";
data _null_;
infile proc_r;
run;
https://gitlab.com/DREES_code/OUTILS/Trucs_et_Astuces_en_R
Une documentation SAS->R à destination des statisticiens en laboratoires pharmaceutiques :
https://www.lexjansen.com/phuse/2014/ad/AD04.pdf
références aux PROC : IMPORT, CONTENTS, SQL, PRINT, MEANS, BOXPLOT, TTEST, SGPANEL, GLM, REG, ANOVA, MIXED, DOCUMENT