Documentos previos

Para replicar estos resultados es recomendado ver los siguientes documentos:

Bibliotecas

library(tidyverse)
library(readxl)
library(lubridate)
library(splines)
library(broom)
library(infer)
library(plotly)

Funciones

source("../functions-R/infer1.R", encoding = "UTF-8")
source("../functions-R/infer2.R", encoding = "UTF-8")
source("../functions-R/infer3.R", encoding = "UTF-8")
source("../functions-R/infer4.R", encoding = "UTF-8")
source("../functions-R/infer5.R", encoding = "UTF-8")
source("../functions-R/infer6.R", encoding = "UTF-8")
source("../functions-R/test_infer.R", encoding = "UTF-8")

Datos

datos <- read_csv("../data/EncuestasColombia2022-Update.csv") %>%
  mutate(
    encuesta = str_to_lower(encuesta),
    encuesta = str_to_sentence(encuesta),
    encuesta = if_else(
      str_detect(encuesta, "Cnc"),
      true = "Cnc",
      false = encuesta
    ),
    encuesta = if_else(
      str_detect(encuesta, "Mosqueteros"),
      true = "Mosqueteros",
      false = encuesta
    )
  )

candidatos <- datos %>% 
  select(where(is.numeric)) %>% 
  select(-c(tamano_de_muestra, margen_de_error)) %>% 
  names()

datos

Inferencias

Estimación

  • En este caso se asume que cada encuesta es una realización o experimento, el parámetro de interés es \(\mu_p\), que podría ser descrito como el promedio de intención de voto. Esta proporción es de interés estimarla para saber cuál sería el verdadero porcentaje de personas que votaría por un candidato.
  • Se proponen cinco métodos para estimar la intención de voto:
    • Inferencia clásica original (infer1): prueba t-student para una población. En este caso la variable de interés (proporción) se mantiene en sus unidades originales.
    • Inferencia clásica logaritmo (infer2): prueba t-student para una población. En este caso la variable de interés (proporción) se transforma a través de logaritmos.
    • Inferencia no paramétrica: Bootstrapping (infer3): implementación de técnicas de remuestreo no paramétrico para estimación puntual y construcción de intervalos de confianza promedio de intención de voto. Intervalos de confianza con el método de percentiles.
    • Inferencia no paramétrica: Bootstrapping (infer4): implementación de técnicas de remuestreo no paramétrico para estimación puntual y construcción de intervalos de confianza para el promedio de intención de voto. Intervalos de confianza con el método de error estándar.
    • Inferencia no paramétrica: Bootstrapping (infer5): implementación de técnicas de remuestreo no paramétrico para estimación puntual y construcción de intervalos de confianza para la mediana de intención de voto. Intervalos de confianza con el método de percentiles.
    • Inferencia no paramétrica: Bootstrapping (infer6): implementación de técnicas de remuestreo no paramétrico para estimación puntual y construcción de intervalos de confianza para el máximo de intención de voto. Intervalos de confianza con el método de percentiles.
tabla_infer <- test_infer(n_reps = 10000) %>% 
  relocate(Candidato, Método, everything())
tabla_infer