Documentos previos
Para replicar estos resultados es recomendado ver los siguientes
documentos:
Bibliotecas
library(tidyverse)
library(readxl)
library(lubridate)
library(splines)
library(broom)
library(infer)
library(plotly)
Funciones
source("../functions-R/infer1.R", encoding = "UTF-8")
source("../functions-R/infer2.R", encoding = "UTF-8")
source("../functions-R/infer3.R", encoding = "UTF-8")
source("../functions-R/infer4.R", encoding = "UTF-8")
source("../functions-R/infer5.R", encoding = "UTF-8")
source("../functions-R/infer6.R", encoding = "UTF-8")
source("../functions-R/test_infer.R", encoding = "UTF-8")
Datos
datos <- read_csv("../data/EncuestasColombia2022-Update.csv") %>%
mutate(
encuesta = str_to_lower(encuesta),
encuesta = str_to_sentence(encuesta),
encuesta = if_else(
str_detect(encuesta, "Cnc"),
true = "Cnc",
false = encuesta
),
encuesta = if_else(
str_detect(encuesta, "Mosqueteros"),
true = "Mosqueteros",
false = encuesta
)
)
candidatos <- datos %>%
select(where(is.numeric)) %>%
select(-c(tamano_de_muestra, margen_de_error)) %>%
names()
datos
Inferencias
Estimación
- En este caso se asume que cada encuesta es una realización o
experimento, el parámetro de interés es \(\mu_p\), que podría ser descrito como el
promedio de intención de voto. Esta proporción es de interés estimarla
para saber cuál sería el verdadero porcentaje de personas que votaría
por un candidato.
- Se proponen cinco métodos para estimar la intención de voto:
- Inferencia clásica original (infer1): prueba
t-student para una población. En este caso la variable de
interés (proporción) se mantiene en sus unidades originales.
- Inferencia clásica logaritmo (infer2): prueba
t-student para una población. En este caso la variable de
interés (proporción) se transforma a través de logaritmos.
- Inferencia no paramétrica: Bootstrapping (infer3):
implementación de técnicas de remuestreo no paramétrico para estimación
puntual y construcción de intervalos de confianza
promedio de intención de voto. Intervalos de confianza
con el método de percentiles.
- Inferencia no paramétrica: Bootstrapping (infer4):
implementación de técnicas de remuestreo no paramétrico para estimación
puntual y construcción de intervalos de confianza para el
promedio de intención de voto. Intervalos de confianza
con el método de error estándar.
- Inferencia no paramétrica: Bootstrapping (infer5):
implementación de técnicas de remuestreo no paramétrico para estimación
puntual y construcción de intervalos de confianza para la
mediana de intención de voto. Intervalos de confianza
con el método de percentiles.
- Inferencia no paramétrica: Bootstrapping (infer6):
implementación de técnicas de remuestreo no paramétrico para estimación
puntual y construcción de intervalos de confianza para el
máximo de intención de voto. Intervalos de confianza
con el método de percentiles.
tabla_infer <- test_infer(n_reps = 10000) %>%
relocate(Candidato, Método, everything())
tabla_infer