## Variables à garder
vars <- tibble(
code = c("EA_FAC_A","EA_FAC_B", "EA_FAC_C", "EA_FAC_D", "EA_FAC_G", "EA_ROAD_A", "EA_ROAD_B", "EA_ROAD_C",
"EA_SVC_A", "EA_SVC_B", "EA_SVC_C","EA_SVC_E",
"Q1", "Q2", "Q4A","Q7C" ,"REGION",
"Q92", "Q93A", "Q93B", "URBRUR", "Q101", "Q96", "Q94C", "Q94A", "withinwt_ea", "withinwt_hh", "Q7A", "Q40H", "Q7A", "Q7B", "Q7E"),
Variable = c("bureau_poste_ZD", "ecole_ZD", "Poste_police_gendarm_ZD", "Centre_sante_ZD", "Moyen_transport_payant_ZD", "Route_point_depart", "Materiaux_5km", "Etat_route_5Km", "Reseau_electrique_ZD", "systeme_adduction_eau_ZD", "syst_evacuation_eau_usee_ZD", "Forage_puits_fore_ZD", "Age_ans", "langue", "Situation_economique_actuelle_pays", "frequence_manque_soins" ,"Region", "Source_eau", "Maison_raccordee_reseau_electrique", "Frequence_disponibilite_electricite", "Type_milieu", "Sexe", "Niv_instruction", "Secteur_emploi", "Etat_emploi","withinwt_ea" ,"withinwt_hh", "Frequence_manque_nourriture", "cout_eleve_empechant_soins", "Freq_noirriture", "Freq_eau_potable", "Manque_revenu_esp")
)
## Selectionner toutes variables
t <- to %>%
select(all_of(vars$code))
## Nom des variables
t <- to %>%
select(all_of(vars$code)) %>%
rename_with(~ vars$Variable[match(.x, vars$code)])
## convertir les variables avec leurs labels
t <- t %>%
mutate(across(-c(Age_ans, withinwt_hh, withinwt_ea) & where(haven::is.labelled),
haven::as_factor))
t <- t %>%
mutate(
Age_ans = as.numeric(Age_ans),
across(where(is.labelled) & !Age_ans, as_factor)
)
## variable dependante (Accès regulier au soins de sante)
t <- t %>%
mutate( acces_regulier_soins_sante = case_when(
frequence_manque_soins %in% c("Juste 1 ou 2 fois", "Quelques fois",
"Plusieurs fois", "Toujours") ~ "Non",
frequence_manque_soins %in% c("Jamais") ~ "Oui"
))
t$acces_regulier_soins_sante <- as.factor(t$acces_regulier_soins_sante)
## effet grappe (tiens compte de la ponderation)
design <- svydesign(
ids = ~1,
weights = ~withinwt_hh,
data = t
)
# Age recodé
t$age_rec <- cut(t$Age_ans,
include.lowest = TRUE,
right = TRUE,
breaks = c(17, 40, 96),
labels = c("18 - 39", "40+"))
## Niveau d'instruction
t <- t %>%
mutate(
niv_instr_rec = case_when(
Niv_instruction %in% c(
"Pas d’enseignement formel",
"Enseignement informel seulement (y compris enseignement coranique)",
"Ne sait pas",
"Refuse de répondre"
) ~ "Aucune",
Niv_instruction %in% c(
"Enseignement primaire inachevé",
"Enseignement primaire achevé"
) ~ "Primaire",
Niv_instruction %in% c(
"Enseignement secondaire / lycée inachevé",
"Enseignement secondaire / lycée achevé"
) ~ "Secondaire",
Niv_instruction %in% c(
"Qualifications post-secondaires autres qu’universitaires (certificat ou diplôme d'école polytechnique)",
"Université inachevée",
"Université achevée",
"Post-universitaire"
) ~ "Supérieur",
TRUE ~ NA_character_
)
)
## Accès à l'eau
t <- t %>%
mutate(
acces_eau = case_when(
Freq_eau_potable %in% c(
"Jamais",
"Juste 1 ou 2 fois"
) ~ "Oui",
Freq_eau_potable %in% c(
"Quelques fois",
"Plusieurs fois",
"Toujours",
"Refuse de répondre"
) ~ "Non",
TRUE ~ NA_character_
)
)
# Manque de nourriture
t <- t %>%
mutate(
Manque_nourriture_rec = case_when(
Frequence_manque_nourriture %in% c(
"Jamais",
"Juste 1 ou 2 fois"
) ~ "Oui",
Frequence_manque_nourriture %in% c(
"Quelques fois",
"Plusieurs fois",
"Toujours"
) ~ "Non",
TRUE ~ NA_character_
)
)
# Cout elevé
t <- t %>%
mutate(
cout_eleve_soins = case_when(
cout_eleve_empechant_soins %in% c("Jamais", "Une ou deux fois") ~ "Oui",
cout_eleve_empechant_soins %in% c("Quelques fois", "Souvent", "Pas de contact", "Ne sait pas") ~ "Non"
)
)
# recodage des variables : pauvrete vecue "voir chez ousmane"
# reduction de certaines modalités
t <- t %>%
mutate(
Etat_route_5Km_rec = case_when(
Etat_route_5Km == "Impraticable" ~ "Très mauvaise",
Etat_route_5Km == "Très mauvaise" ~ "Très mauvaise",
Etat_route_5Km == "Mauvaise" ~ "Mauvaise",
Etat_route_5Km == "Passable" ~ "Passable",
Etat_route_5Km == "Bonne" ~ "Bonne",
Etat_route_5Km == "Très bonne" ~ "Très bonne",
)
)
t <- t %>%
mutate(
Source_eau_rec = case_when(
Source_eau == "Collecte d’eau de pluie" ~ "Eau de surface / pluie",
Source_eau == "Eau de surface, telle que rivière, barrage, lac, étang, ruisseau, canal ou canaux d’irrigation" ~ "Eau de surface / pluie",
Source_eau == "Système d'eau potable public ou communautaire" ~ "Système d'eau potable public ou communautaire",
Source_eau == "Puits tubulaire ou forage" ~ "Puits tubulaire ou forage",
Source_eau == "Puits protégé" ~ "Puits protégé",
Source_eau == "Puits non protégé" ~ "Puits non protégé",
Source_eau == "Eau de source protégée" ~ "Eau de source protégée",
Source_eau == "Eau de source non protégée" ~ "Eau de source non protégée"
)
)
t <- t %>%
mutate(
Freq_eau_potable_rec = case_when(
Freq_eau_potable == "Jamais" ~ "Jamais",
Freq_eau_potable == "Refuse de répondre" ~ "Jamais",
Freq_eau_potable == "Juste 1 ou 2 fois" ~ "Juste 1 ou 2 fois",
Freq_eau_potable == "Quelques fois" ~ "Quelques fois",
Freq_eau_potable == "Plusieurs fois" ~ "Plusieurs fois",
Freq_eau_potable == "Toujours" ~ "Toujours"
)
)
t <- t %>%
mutate(
Manque_revenu_esp_rec = case_when(
Manque_revenu_esp == "Jamais" ~ "Jamais",
Manque_revenu_esp == "Juste 1 ou 2 fois" ~ "Juste 1 ou 2 fois",
Manque_revenu_esp == "Quelques fois" ~ "Quelques fois",
Manque_revenu_esp == "Plusieurs fois" ~ "Plusieurs fois",
Manque_revenu_esp == "Toujours" ~ "Toujours",
Manque_revenu_esp == "Ne sait pas" ~ "Toujours"
)
)
# recodage des variables : Disponibilité locale des infrastructures (voir chez ousmane)
# recodage des variables : infrastructure environnementale
# Variable composite
## Vulnerabilité
## facteur
t[c(1:12, 14:25, 28:41)] <- lapply(t[c(1:12, 14:25, 28:41)],factor)