En esta tarea usarás los datos de una encuesta realizada por FLACSO/Chile en Abril y Mayo de 1988 sobre intención de voto en el plebiscito de 1989, junto con otras variables socio-demográficas. Las variables son las siguientes:
región: Un factor con niveles: C, Central; M, Área
Metropolitana de Santiago; N, Norte; S, Sur; SA, ciudad de
Santiago.
población: Tamaño de la población de la comunidad
del encuestado.
sexo: Un factor con niveles: F, femenino; M,
masculino.
edad: En años.
educación: Un factor con niveles (nota: fuera de
orden): P, Primaria; PS, Post-secundaria; S, Secundaria.
ingreso: Ingreso mensual, en Pesos.
statusquo: Escala de apoyo al status quo (apoyo a
régimen de Pinochet).
voto: Un factor con niveles: A, se abstendrá; N,
votará no (en contra de Pinochet); U, indeciso; Y, votará sí (a favor de
Pinochet).
Usa un test de permutaciones para testear la hipótesis de que, en promedio, las mujeres muestran mayor apoyo al regimen de Pinochet que los hombres.
options(scipen = 999)
library(carData)
library(tidyverse)
datos_chile <- carData::Chile
#estimacion de apoyo al statusquo por género
resultados <- datos_chile %>%
group_by(sex) %>%
summarise(mu_statusquo = mean(statusquo, na.rm = T)) %>%
pull(mu_statusquo)
diferencia <- resultados[1] - resultados[2]
cat("Diferencia apoyo al regimen statusquo mujeres - hombres: ", diferencia)
## Diferencia apoyo al regimen statusquo mujeres - hombres: 0.1340608
se define la hipotesis nula e hipotesis alternativa:
Con las hipótesis ya presentadas, se comienza con la hipótesis 0, es decir, nula para determinarla como verdadera para saber si se puede rechazar o no. Para poder determinar, se usa el test de permutaciones
library(dplyr)
library(ggplot2)
library(tidyverse)
library(carData)
n <- datos_chile %>%
filter(!is.na(statusquo)) %>%
nrow()
permutacion <- function() {
index = sample(seq(1:n), replace=FALSE)
resultados_p = datos_chile %>% select(sex, statusquo) %>% drop_na(statusquo) %>%
mutate(statusquo_p = statusquo[index]) %>% group_by(sex) %>%
summarise(promedio_statusquo = mean(statusquo_p, na.rm = TRUE))
return(resultados_p$promedio_statusquo[1] - resultados_p$promedio_statusquo[2])
}
distribucion_permutaciones_hnula = replicate(n=10000, permutacion())
p_valor = sum(distribucion_permutaciones_hnula >= diferencia) / 10000
cat("valor p valor", p_valor)
## valor p valor 0.0003
Con los resultados descritos anteriormente, se puede concluir que rechazamos la hipótesis nula con un nivel de significación del 5% y además, que las mujeres si muestran mayor apoyo al régimen de Pinochet que los hombres.