DATA 2 - ELECCIONES ABRIMOS LA DATA

library(rio)
library(tidyverse)
data_elecciones = import("DATA 2_ELECCIONES.csv")
names(data_elecciones)
##  [1] "UBIGEO"              "DEPARTAMENTO"        "PROVINCIA"           "DISTRITO"            "TIPO_ELECCION"      
##  [6] "MESA_DE_VOTACION"    "DESCRIP_ESTADO_ACTA" "TIPO_OBSERVACION"    "N_CVAS"              "N_ELEC_HABIL"       
## [11] "VOTOS_P1"            "VOTOS_P2"            "VOTOS_VB"            "VOTOS_VN"            "VOTOS_VI"
table(data_elecciones$DEPARTAMENTO)
## 
##        AFRICA      AMAZONAS       AMERICA        ANCASH      APURIMAC      AREQUIPA          ASIA      AYACUCHO 
##             5          1105          1964          3102          1125          3950           139          1704 
##     CAJAMARCA        CALLAO         CUSCO        EUROPA  HUANCAVELICA       HUANUCO           ICA         JUNIN 
##          3828          2754          3526           955          1094          2051          2223          3425 
##   LA LIBERTAD    LAMBAYEQUE          LIMA        LORETO MADRE DE DIOS      MOQUEGUA       OCEANIA         PASCO 
##          4852          3333         27942          2392           396           524            24           695 
##         PIURA          PUNO    SAN MARTIN         TACNA        TUMBES       UCAYALI 
##          4811          3163          2188           974           574          1317
##FILTRO DE SOLO DEPARTAMENTOS DE PERU (ELIMINAMOS CONTINENTES)
data_elecciones <- data_elecciones %>% filter(!(DEPARTAMENTO %in% c("ASIA", "EUROPA", "OCEANIA", "AMERICA", "AFRICA")))
table(data_elecciones$DEPARTAMENTO)
## 
##      AMAZONAS        ANCASH      APURIMAC      AREQUIPA      AYACUCHO     CAJAMARCA        CALLAO         CUSCO 
##          1105          3102          1125          3950          1704          3828          2754          3526 
##  HUANCAVELICA       HUANUCO           ICA         JUNIN   LA LIBERTAD    LAMBAYEQUE          LIMA        LORETO 
##          1094          2051          2223          3425          4852          3333         27942          2392 
## MADRE DE DIOS      MOQUEGUA         PASCO         PIURA          PUNO    SAN MARTIN         TACNA        TUMBES 
##           396           524           695          4811          3163          2188           974           574 
##       UCAYALI 
##          1317
table(data_elecciones$TIPO_ELECCION)
## 
## PRESIDENCIAL 
##        83048
table(data_elecciones$DESCRIP_ESTADO_ACTA)
## 
##            ANULADA COMPUTADA RESUELTA      CONTABILIZADA         EN PROCESO 
##                158               1077              81793                 20
##PASAR DE CHARACTER A NUMERIC
data_elecciones <- data_elecciones %>%
  mutate(across(c(6,8,9,10,11,12,13,14,15), as.numeric))

NECESARIO

resultados_okk = data_elecciones[,c(1,3,7,9:14)]

UBIGEO

resultados_okk$UBIGEO = substr(resultados_okk$UBIGEO, 1, nchar(resultados_okk$UBIGEO) - 2)

AGRUPAR

library(dplyr)
data_agrupada = resultados_okk[ ,c(2,4:9)]

data_agrupada = resultados_okk |> 
  group_by(PROVINCIA) |> 
  summarise(N_CVAS = sum(N_CVAS, na.rm = TRUE),
    N_ELEC_HABIL = sum(N_ELEC_HABIL, na.rm = TRUE),
    VOTOS_P1 = sum(VOTOS_P1, na.rm = TRUE),
    VOTOS_P2 = sum(VOTOS_P2, na.rm = TRUE),
    VOTOS_VB = sum(VOTOS_VB, na.rm = TRUE),
    VOTOS_VN = sum(VOTOS_VN, na.rm = TRUE),
    .groups = "drop"
    )

SACAR TILDES

library(scraEP)
data_agrupada[ ,1]=sapply(data_agrupada[ ,1],unaccent)
## Warning in gsub("['`^~\"]", " ", text): unable to translate 'CA<bf><bf>ETE' to a wide string
## Error in gsub("['`^~\"]", " ", text): input string 44 is invalid
data_agrupada[ ,1]=sapply(data_agrupada[ ,1],toupper)
## Error in FUN(X[[i]], ...): string multibyte 44 inválida

PASARLO A RMD

knitr::spin('DATA 2.R', precious=TRUE)
## 
## 
## processing file: DATA 2.Rmd
## 
  |                                                                                               
  |                                                                                         |   0%
  |                                                                                               
  |....                                                                                     |   5%                   
  |                                                                                               
  |........                                                                                 |  10% [unnamed-chunk-21]
  |                                                                                               
  |.............                                                                            |  14%                   
  |                                                                                               
  |.................                                                                        |  19% [unnamed-chunk-22]
  |                                                                                               
  |.....................                                                                    |  24%                   
  |                                                                                               
  |.........................                                                                |  29% [unnamed-chunk-23]
  |                                                                                               
  |..............................                                                           |  33%                   
  |                                                                                               
  |..................................                                                       |  38% [unnamed-chunk-24]
  |                                                                                               
  |......................................                                                   |  43%                   
  |                                                                                               
  |..........................................                                               |  48% [unnamed-chunk-25]
  |                                                                                               
  |...............................................                                          |  52%                   
  |                                                                                               
  |...................................................                                      |  57% [unnamed-chunk-26]
  |                                                                                               
  |.......................................................                                  |  62%                   
  |                                                                                               
  |...........................................................                              |  67% [unnamed-chunk-27]
  |                                                                                               
  |................................................................                         |  71%                   
  |                                                                                               
  |....................................................................                     |  76% [unnamed-chunk-28]
  |                                                                                               
  |........................................................................                 |  81%                   
  |                                                                                               
  |............................................................................             |  86% [unnamed-chunk-29]
  |                                                                                               
  |.................................................................................        |  90%                   
  |                                                                                               
  |.....................................................................................    |  95% [unnamed-chunk-30]
  |                                                                                               
  |.........................................................................................| 100%                   
## output file: DATA 2.md