Construccion de BdeD para análisis electorales de Honduras
Lógica para el cálculo del promedio de edades y el índice de masculinidad por local de votación.
Abstract
Lógica para el cálculo del promedio de edades y el índice de masculinidad por local de votación.
tabla_grande <- readRDS("tabla_madre.rds")
tabla_grande <- tabla_grande[1:1000,]
valores <- tabla_grande
# valores_filtro <- filter(valores, valores$clave_vot=="010101022")
# head(valores_filtro,5)
a <- valores$clave_vot
b <- valores$clave_pob
c <- valores$CODIGO_SEXO
d <- valores$NUMERO_IDENTIDAD
agg <- with(valores, aggregate(data.frame(c==2), data.frame(a), sum))
head(agg,5)
## a c....2
## 1 010101001 23
## 2 010102007 0
## 3 010202001 3
## 4 010302001 1
## 5 010302011 0
promedios <-aggregate(c, by=list(a), FUN = length , na.rm = TRUE)
head(promedios,5)
## Group.1 length
## 1 010101001 229
## 2 010102007 1
## 3 010202001 12
## 4 010302001 1
## 5 010302011 1
promedio_unido <- cbind(agg,promedios)
names(promedio_unido)[2] <- "hombres"
head(promedio_unido,5)
## a hombres Group.1 length
## 1 010101001 23 010101001 229
## 2 010102007 0 010102007 1
## 3 010202001 3 010202001 12
## 4 010302001 1 010302001 1
## 5 010302011 0 010302011 1
promedios_fil <- filter(valores, valores$clave_vot=="010101001")
head(promedios_fil,5)
## CODIGO_LUGAR_POBLADO CODIGO_ALDEA CODIGO_MUNICIPIO_DOMICILIO
## 1 1 1 1
## 2 1 1 1
## 3 1 1 1
## 4 1 1 1
## 5 1 1 1
## CODIGO_DEPARTAMENTO_DOMICILIO CODIGO_SECTOR_ELECTORAL CODIGO_AREA
## 1 1 1 1
## 2 1 1 1
## 3 1 1 1
## 4 1 1 1
## 5 1 1 1
## NUMERO_IDENTIDAD PRIMER_NOMBRE SEGUNDO_NOMBRE PRIMER_APELLIDO
## 1 0101190600010 MARIA URBANA GOMEZ
## 2 0101190800106 LUCILA LUCILA FLORES
## 3 0502199503000 GERSON ANTONIO RAMIREZ
## 4 0101190900050 MARIA VICTORIANA ARZU
## 5 0101191100126 FAUSTINO FAUSTINO CRUZ
## SEGUNDO_APELLIDO CODIGO_SEXO FECHA_NACIMIENTO CODIGO_HABIL_INHABIL
## 1 URBINA 0 E01
## 2 0 E01
## 3 PONCE 1 1992/07/11 E03
## 4 AMAYA 0 E01
## 5 0 E01
## CODIGO_CENTRO_VOTACION CODIGO_ESTADO_TARJETA NUMERO_MESA NUMERO_LINEA
## 1 0 0 0
## 2 0 0 0
## 3 1 Z00 0 0
## 4 0 0 0
## 5 0 0 0
## clave_vot clave_pob
## 1 010101001 010101001
## 2 010101001 010101001
## 3 010101001 010101001
## 4 010101001 010101001
## 5 010101001 010101001
promedio_unido$ind_masc <- (promedio_unido$hombres/promedio_unido$length)*100
head(promedio_unido,5)
## a hombres Group.1 length ind_masc
## 1 010101001 23 010101001 229 10.04367
## 2 010102007 0 010102007 1 0.00000
## 3 010202001 3 010202001 12 25.00000
## 4 010302001 1 010302001 1 100.00000
## 5 010302011 0 010302011 1 0.00000
tabla_madre <- readRDS("tabla_madre.rds")
tabla_madre <- tabla_madre[1:1000,]
library(eeptools)
# tabla_madre
# tabla_madre$FECHA_NACIMIENTO <- as.character(tabla_madre$FECHA_NACIMIENTO)
tabla_madre <-tabla_madre[!(tabla_madre$FECHA_NACIMIENTO == ""),]
head(tabla_madre,5)
## CODIGO_LUGAR_POBLADO CODIGO_ALDEA CODIGO_MUNICIPIO_DOMICILIO
## 2 1 1 10
## 4 1 1 1
## 6 1 1 7
## 7 1 1 1
## 15 1 1 4
## CODIGO_DEPARTAMENTO_DOMICILIO CODIGO_SECTOR_ELECTORAL CODIGO_AREA
## 2 18 1 2
## 4 1 1 1
## 6 6 1 2
## 7 11 1 1
## 15 11 1 2
## NUMERO_IDENTIDAD PRIMER_NOMBRE SEGUNDO_NOMBRE PRIMER_APELLIDO
## 2 1810199900519 KAREN LILY PALMA
## 4 0502199503000 GERSON ANTONIO RAMIREZ
## 6 0607199200633 CARLOS ANTONIO ZAMBRANO
## 7 1101199900321 LAMAR ABRAHAM BODDEN
## 15 1810197200387 FRANCISCO ROMERO
## SEGUNDO_APELLIDO CODIGO_SEXO FECHA_NACIMIENTO CODIGO_HABIL_INHABIL
## 2 CRUZ 2 1999/03/08 H01
## 4 PONCE 1 1992/07/11 E03
## 6 RODRIGUEZ 1 1992/08/17 H01
## 7 1 1994/07/08 H01
## 15 AVILA 1 1972/08/29 H01
## CODIGO_CENTRO_VOTACION CODIGO_ESTADO_TARJETA NUMERO_MESA NUMERO_LINEA
## 2 1 I10 18014 123
## 4 1 Z00 0 0
## 6 1 Z00 7196 294
## 7 1 I10 12521 243
## 15 1 Z00 12649 225
## clave_vot clave_pob
## 2 181002001 181001001
## 4 010101001 010101001
## 6 060702001 060701001
## 7 110101001 110101001
## 15 110402001 110401001
tabla_madre$edades_buenas <- age_calc(dob = as.Date(tabla_madre$FECHA_NACIMIENTO), enddate = as.Date('2021-02-16'), units = "years")
a <- tabla_madre$clave_vot
b <- tabla_madre$clave_pob
c <- tabla_madre$edades_buenas
promedios_edad <-aggregate(c, by=list(a,b), FUN = mean , na.rm = TRUE)
head(promedios_edad,5)
## Group.1 Group.2 mean.c
## 1 010101001 010101001 76.08695
## 2 010102007 010116001 30.30137
## 3 010202001 010201001 51.38382
## 4 010302001 010301001 54.87671
## 5 010302011 010316001 22.80822