DATA 2 - ELECCIONES ABRIMOS LA DATA
library(rio)
library(tidyverse)
data_elecciones = import("DATA 2_ELECCIONES.csv")
names(data_elecciones)
## [1] "UBIGEO" "DEPARTAMENTO" "PROVINCIA" "DISTRITO" "TIPO_ELECCION"
## [6] "MESA_DE_VOTACION" "DESCRIP_ESTADO_ACTA" "TIPO_OBSERVACION" "N_CVAS" "N_ELEC_HABIL"
## [11] "VOTOS_P1" "VOTOS_P2" "VOTOS_VB" "VOTOS_VN" "VOTOS_VI"
table(data_elecciones$DEPARTAMENTO)
##
## AFRICA AMAZONAS AMERICA ANCASH APURIMAC AREQUIPA ASIA AYACUCHO
## 5 1105 1964 3102 1125 3950 139 1704
## CAJAMARCA CALLAO CUSCO EUROPA HUANCAVELICA HUANUCO ICA JUNIN
## 3828 2754 3526 955 1094 2051 2223 3425
## LA LIBERTAD LAMBAYEQUE LIMA LORETO MADRE DE DIOS MOQUEGUA OCEANIA PASCO
## 4852 3333 27942 2392 396 524 24 695
## PIURA PUNO SAN MARTIN TACNA TUMBES UCAYALI
## 4811 3163 2188 974 574 1317
##FILTRO DE SOLO DEPARTAMENTOS DE PERU (ELIMINAMOS CONTINENTES)
data_elecciones <- data_elecciones %>% filter(!(DEPARTAMENTO %in% c("ASIA", "EUROPA", "OCEANIA", "AMERICA", "AFRICA")))
table(data_elecciones$DEPARTAMENTO)
##
## AMAZONAS ANCASH APURIMAC AREQUIPA AYACUCHO CAJAMARCA CALLAO CUSCO
## 1105 3102 1125 3950 1704 3828 2754 3526
## HUANCAVELICA HUANUCO ICA JUNIN LA LIBERTAD LAMBAYEQUE LIMA LORETO
## 1094 2051 2223 3425 4852 3333 27942 2392
## MADRE DE DIOS MOQUEGUA PASCO PIURA PUNO SAN MARTIN TACNA TUMBES
## 396 524 695 4811 3163 2188 974 574
## UCAYALI
## 1317
table(data_elecciones$TIPO_ELECCION)
##
## PRESIDENCIAL
## 83048
table(data_elecciones$DESCRIP_ESTADO_ACTA)
##
## ANULADA COMPUTADA RESUELTA CONTABILIZADA EN PROCESO
## 158 1077 81793 20
##PASAR DE CHARACTER A NUMERIC
data_elecciones <- data_elecciones %>%
mutate(across(c(6,8,9,10,11,12,13,14,15), as.numeric))
NECESARIO
resultados_okk = data_elecciones[,c(1,3,7,9:14)]
UBIGEO
resultados_okk$UBIGEO = substr(resultados_okk$UBIGEO, 1, nchar(resultados_okk$UBIGEO) - 2)
AGRUPAR
library(dplyr)
data_agrupada = resultados_okk[ ,c(2,4:9)]
data_agrupada = resultados_okk |>
group_by(PROVINCIA) |>
summarise(N_CVAS = sum(N_CVAS, na.rm = TRUE),
N_ELEC_HABIL = sum(N_ELEC_HABIL, na.rm = TRUE),
VOTOS_P1 = sum(VOTOS_P1, na.rm = TRUE),
VOTOS_P2 = sum(VOTOS_P2, na.rm = TRUE),
VOTOS_VB = sum(VOTOS_VB, na.rm = TRUE),
VOTOS_VN = sum(VOTOS_VN, na.rm = TRUE),
.groups = "drop"
)
SACAR TILDES
library(scraEP)
data_agrupada[ ,1]=sapply(data_agrupada[ ,1],unaccent)
## Warning in gsub("['`^~\"]", " ", text): unable to translate 'CA<bf><bf>ETE' to a wide string
## Error in gsub("['`^~\"]", " ", text): input string 44 is invalid
data_agrupada[ ,1]=sapply(data_agrupada[ ,1],toupper)
## Error in FUN(X[[i]], ...): string multibyte 44 inválida
PASARLO A RMD
knitr::spin('DATA 2.R', precious=TRUE)
##
##
## processing file: DATA 2.Rmd
##
|
| | 0%
|
|.... | 5%
|
|........ | 10% [unnamed-chunk-21]
|
|............. | 14%
|
|................. | 19% [unnamed-chunk-22]
|
|..................... | 24%
|
|......................... | 29% [unnamed-chunk-23]
|
|.............................. | 33%
|
|.................................. | 38% [unnamed-chunk-24]
|
|...................................... | 43%
|
|.......................................... | 48% [unnamed-chunk-25]
|
|............................................... | 52%
|
|................................................... | 57% [unnamed-chunk-26]
|
|....................................................... | 62%
|
|........................................................... | 67% [unnamed-chunk-27]
|
|................................................................ | 71%
|
|.................................................................... | 76% [unnamed-chunk-28]
|
|........................................................................ | 81%
|
|............................................................................ | 86% [unnamed-chunk-29]
|
|................................................................................. | 90%
|
|..................................................................................... | 95% [unnamed-chunk-30]
|
|.........................................................................................| 100%
## output file: DATA 2.md