Índice de masculinidad y promedio de edad por mesa de votación

1 Lectura de las bases de datos

tabla_grande <- readRDS("tabla_madre.rds")
tabla_grande <- tabla_grande[1:1000,]

2 Calculo del índice de masculinidad

valores <- tabla_grande
# valores_filtro <- filter(valores, valores$clave_vot=="010101022")
# head(valores_filtro,5)
a <- valores$clave_vot
b <- valores$clave_pob
c <- valores$CODIGO_SEXO
d <- valores$NUMERO_IDENTIDAD
agg <- with(valores, aggregate(data.frame(c==2), data.frame(a), sum))
head(agg,5)
##           a c....2
## 1 010101001     23
## 2 010102007      0
## 3 010202001      3
## 4 010302001      1
## 5 010302011      0
promedios <-aggregate(c, by=list(a), FUN = length , na.rm = TRUE)
head(promedios,5)
##     Group.1 length
## 1 010101001    229
## 2 010102007      1
## 3 010202001     12
## 4 010302001      1
## 5 010302011      1
promedio_unido <- cbind(agg,promedios)
names(promedio_unido)[2] <- "hombres"
head(promedio_unido,5)
##           a hombres   Group.1 length
## 1 010101001      23 010101001    229
## 2 010102007       0 010102007      1
## 3 010202001       3 010202001     12
## 4 010302001       1 010302001      1
## 5 010302011       0 010302011      1
promedios_fil <- filter(valores, valores$clave_vot=="010101001")
head(promedios_fil,5)
##   CODIGO_LUGAR_POBLADO CODIGO_ALDEA CODIGO_MUNICIPIO_DOMICILIO
## 1                    1            1                          1
## 2                    1            1                          1
## 3                    1            1                          1
## 4                    1            1                          1
## 5                    1            1                          1
##   CODIGO_DEPARTAMENTO_DOMICILIO CODIGO_SECTOR_ELECTORAL CODIGO_AREA
## 1                             1                       1           1
## 2                             1                       1           1
## 3                             1                       1           1
## 4                             1                       1           1
## 5                             1                       1           1
##   NUMERO_IDENTIDAD PRIMER_NOMBRE SEGUNDO_NOMBRE PRIMER_APELLIDO
## 1    0101190600010         MARIA         URBANA           GOMEZ
## 2    0101190800106        LUCILA         LUCILA          FLORES
## 3    0502199503000        GERSON        ANTONIO         RAMIREZ
## 4    0101190900050         MARIA     VICTORIANA            ARZU
## 5    0101191100126      FAUSTINO       FAUSTINO            CRUZ
##   SEGUNDO_APELLIDO CODIGO_SEXO FECHA_NACIMIENTO CODIGO_HABIL_INHABIL
## 1           URBINA           0                                   E01
## 2                            0                                   E01
## 3            PONCE           1       1992/07/11                  E03
## 4            AMAYA           0                                   E01
## 5                            0                                   E01
##   CODIGO_CENTRO_VOTACION CODIGO_ESTADO_TARJETA NUMERO_MESA NUMERO_LINEA
## 1                      0                                 0            0
## 2                      0                                 0            0
## 3                      1                   Z00           0            0
## 4                      0                                 0            0
## 5                      0                                 0            0
##   clave_vot clave_pob
## 1 010101001 010101001
## 2 010101001 010101001
## 3 010101001 010101001
## 4 010101001 010101001
## 5 010101001 010101001
promedio_unido$ind_masc <- (promedio_unido$hombres/promedio_unido$length)*100
head(promedio_unido,5)
##           a hombres   Group.1 length  ind_masc
## 1 010101001      23 010101001    229  10.04367
## 2 010102007       0 010102007      1   0.00000
## 3 010202001       3 010202001     12  25.00000
## 4 010302001       1 010302001      1 100.00000
## 5 010302011       0 010302011      1   0.00000

4 Calculo de edad a partir del año de nacimiento

tabla_madre <- readRDS("tabla_madre.rds")
tabla_madre <- tabla_madre[1:1000,]
library(eeptools)
# tabla_madre
# tabla_madre$FECHA_NACIMIENTO <- as.character(tabla_madre$FECHA_NACIMIENTO)
tabla_madre <-tabla_madre[!(tabla_madre$FECHA_NACIMIENTO == ""),]
head(tabla_madre,5)
##    CODIGO_LUGAR_POBLADO CODIGO_ALDEA CODIGO_MUNICIPIO_DOMICILIO
## 2                     1            1                         10
## 4                     1            1                          1
## 6                     1            1                          7
## 7                     1            1                          1
## 15                    1            1                          4
##    CODIGO_DEPARTAMENTO_DOMICILIO CODIGO_SECTOR_ELECTORAL CODIGO_AREA
## 2                             18                       1           2
## 4                              1                       1           1
## 6                              6                       1           2
## 7                             11                       1           1
## 15                            11                       1           2
##    NUMERO_IDENTIDAD PRIMER_NOMBRE SEGUNDO_NOMBRE PRIMER_APELLIDO
## 2     1810199900519         KAREN           LILY           PALMA
## 4     0502199503000        GERSON        ANTONIO         RAMIREZ
## 6     0607199200633        CARLOS        ANTONIO        ZAMBRANO
## 7     1101199900321         LAMAR        ABRAHAM          BODDEN
## 15    1810197200387     FRANCISCO                         ROMERO
##    SEGUNDO_APELLIDO CODIGO_SEXO FECHA_NACIMIENTO CODIGO_HABIL_INHABIL
## 2              CRUZ           2       1999/03/08                  H01
## 4             PONCE           1       1992/07/11                  E03
## 6         RODRIGUEZ           1       1992/08/17                  H01
## 7                             1       1994/07/08                  H01
## 15            AVILA           1       1972/08/29                  H01
##    CODIGO_CENTRO_VOTACION CODIGO_ESTADO_TARJETA NUMERO_MESA NUMERO_LINEA
## 2                       1                   I10       18014          123
## 4                       1                   Z00           0            0
## 6                       1                   Z00        7196          294
## 7                       1                   I10       12521          243
## 15                      1                   Z00       12649          225
##    clave_vot clave_pob
## 2  181002001 181001001
## 4  010101001 010101001
## 6  060702001 060701001
## 7  110101001 110101001
## 15 110402001 110401001
tabla_madre$edades_buenas <- age_calc(dob = as.Date(tabla_madre$FECHA_NACIMIENTO), enddate = as.Date('2021-02-16'), units = "years")
a <- tabla_madre$clave_vot
b <- tabla_madre$clave_pob
c <- tabla_madre$edades_buenas
promedios_edad <-aggregate(c, by=list(a,b), FUN = mean , na.rm = TRUE)
head(promedios_edad,5)
##     Group.1   Group.2   mean.c
## 1 010101001 010101001 76.08695
## 2 010102007 010116001 30.30137
## 3 010202001 010201001 51.38382
## 4 010302001 010301001 54.87671
## 5 010302011 010316001 22.80822