Bibliotecas

library(tidyverse)
library(readxl)
library(janitor)
library(DT)
library(rvest)
library(lubridate)
library(cowplot)
library(ggsci)
library(splines)
library(qqplotr)
library(broom)
library(infer)
library(plotly)

Funciones

source("../functions-R/plot_distribution.R", encoding = "UTF-8")
source("../functions-R/plot_time.R", encoding = "UTF-8")
source("../functions-R/plot_cor.R", encoding = "UTF-8")
source("../functions-R/plot_scatter.R", encoding = "UTF-8")
source("../functions-R/plot_encuestas.R", encoding = "UTF-8")

Datos

  • Base de datos
  • Puede ver el documento con la información necesaria para la extracción de datos desde Wikipedia.
datos <- read_csv("../data/EncuestasColombia2022-Update.csv") %>%
  mutate(
    encuesta = str_to_lower(encuesta),
    encuesta = str_to_sentence(encuesta),
    encuesta = if_else(
      str_detect(encuesta, "Cnc"),
      true = "Cnc",
      false = encuesta
    ),
    encuesta = if_else(
      str_detect(encuesta, "Mosqueteros"),
      true = "Mosqueteros",
      false = encuesta
    )
  )

candidatos <- datos %>% 
  select(where(is.numeric)) %>% 
  select(-c(tamano_de_muestra, margen_de_error)) %>% 
  names()

datos

Exploratorio

Intención de voto

Distribuciones

plot_distribution(data = datos, agrupado = TRUE, tipo = "boxplot",
                  candidato = "sergio_fajardo")

Variación temporal

plot_time(data = datos,
          tipo = "Serie Individual",
          candidato = "gustavo_petro")

Correlaciones

datos %>% 
  plot_cor()

Dispersión

datos %>% 
  plot_scatter(data = ., candidato_x = "gustavo_petro", candidato_y = "sergio_fajardo")

Firmas encuestadoras

plot_encuestas(tipo = "Total Encuestas")