Vamos a retomar algunos de los conceptos que hemos visto recientemente y de paso añadiremos algunos trucos que creo que van a necesitar. Intentemos replicar los tabulados del INEGI. Yo creo que si logramos entender una base de datos, tendremos bastante idea de cómo usar alguna otra a la que se enfrenten después. Nuestro ejemplo maestro será la ENVIPE, encuesta sobre victimización y miedo al crimen.

Además aprovecharemosque el INEGI ya le está entrando a R. Usemos las bases que nos da precargadas en esta liga, como RData.

load("~/Dropbox/Clases/R_Intro/Ot 2021/Proyecto_Otoño_2021/BD/bd_envipe_2021_RData/BD_ENVIPE_2021.RData")

Estructura de la base de datos

Lo primero que notamos es que son muchas bases de datos; fíjense cómo varían mucho en el número de observaciones. Importante revisar el documento de donde proviene la información sobre la estructura de la bd. Las diferentes bases se explican porque está referenciando diferentes partes del cuestionario. Noten cómo vamos cambiando a diferentes niveles, la unidad de análisis pasa de la vivienda, al hogar, a la persona, al delito.

Alt text

Alt text

library(tidyverse)
glimpse(TVivienda)
## Rows: 90,335
## Columns: 20
## $ ID_VIV     <chr> "0100003.01", "0100003.02", "0100003.03", "0100003.04", "01…
## $ UPM        <chr> "0100003", "0100003", "0100003", "0100003", "0100003", "010…
## $ VIV_SEL    <chr> "01", "02", "03", "04", "05", "01", "02", "03", "04", "01",…
## $ AREAM      <chr> "14", "14", "14", "14", "14", "14", "14", "14", "14", "14",…
## $ CVE_ENT    <chr> "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",…
## $ NOM_ENT    <chr> "Aguascalientes", "Aguascalientes", "Aguascalientes", "Agua…
## $ CVE_MUN    <chr> "001", "001", "001", "001", "001", "001", "001", "001", "00…
## $ NOM_MUN    <chr> "Aguascalientes", "Aguascalientes", "Aguascalientes", "Agua…
## $ RESULT_V   <chr> "02", "01", "01", "02", "01", "02", "01", "02", "01", "02",…
## $ AP1_1      <chr> "2", "1", "1", "1", "1", "1", "1", "1", "2", "1", "1", "1",…
## $ AP1_2      <chr> "1", "2", "2", "2", "1", "1", "2", "2", "2", "2", "2", "2",…
## $ AP2_1      <chr> "03", "01", "01", "05", "03", "02", "03", "02", "03", "02",…
## $ AP2_2      <chr> "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1",…
## $ AP2_3      <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ NAP2_3     <chr> "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",…
## $ FAC_VIV    <dbl> 255, 255, 255, 255, 255, 190, 190, 190, 190, 189, 189, 189,…
## $ FAC_VIV_AM <dbl> 255, 255, 255, 255, 255, 190, 190, 190, 190, 189, 189, 189,…
## $ DOMINIO    <chr> "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U",…
## $ EST_DIS    <chr> "003", "003", "003", "003", "003", "002", "002", "002", "00…
## $ UPM_DIS    <chr> "00001", "00001", "00001", "00001", "00001", "00002", "0000…
glimpse(THogar)
## Rows: 92,143
## Columns: 18
## $ ID_VIV     <chr> "0100003.01", "0100003.02", "0100003.03", "0100003.04", "01…
## $ ID_HOG     <chr> "0100003.01.01", "0100003.02.01", "0100003.03.01", "0100003…
## $ UPM        <chr> "0100003", "0100003", "0100003", "0100003", "0100003", "010…
## $ VIV_SEL    <chr> "01", "02", "03", "04", "05", "01", "02", "03", "04", "01",…
## $ HOGAR      <chr> "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",…
## $ RESUL_H    <chr> "B", "A", "A", "B", "A", "B", "A", "B", "A", "B", "B", "B",…
## $ N_INF      <chr> "02", "01", "01", "01", "03", "02", "01", "02", "01", "01",…
## $ R_SEL      <chr> "02", "01", "01", "01", "03", "01", "02", "02", "02", "02",…
## $ CVE_ENT    <chr> "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",…
## $ NOM_ENT    <chr> "Aguascalientes", "Aguascalientes", "Aguascalientes", "Agua…
## $ CVE_MUN    <chr> "001", "001", "001", "001", "001", "001", "001", "001", "00…
## $ NOM_MUN    <chr> "Aguascalientes", "Aguascalientes", "Aguascalientes", "Agua…
## $ TOT_PER    <chr> "03", "01", "01", "05", "03", "02", "03", "02", "03", "02",…
## $ FAC_HOG    <dbl> 255, 255, 255, 255, 255, 190, 190, 190, 190, 189, 189, 189,…
## $ FAC_HOG_AM <dbl> 255, 255, 255, 255, 255, 190, 190, 190, 190, 189, 189, 189,…
## $ DOMINIO    <chr> "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U",…
## $ EST_DIS    <chr> "003", "003", "003", "003", "003", "002", "002", "002", "00…
## $ UPM_DIS    <chr> "00001", "00001", "00001", "00001", "00001", "00002", "0000…
Alt text

Alt text

glimpse(TSDem)
## Rows: 318,419
## Columns: 26
## $ ID_VIV     <chr> "2108305.03", "2108305.03", "2108305.03", "2108305.03", "21…
## $ ID_HOG     <chr> "2108305.03.01", "2108305.03.01", "2108305.03.01", "2108305…
## $ ID_PER     <chr> "2108305.03.01.01", "2108305.03.01.02", "2108305.03.01.03",…
## $ UPM        <chr> "2108305", "2108305", "2108305", "2108305", "2101679", "210…
## $ VIV_SEL    <chr> "03", "03", "03", "03", "01", "01", "01", "01", "01", "02",…
## $ HOGAR      <chr> "01", "01", "01", "01", "01", "01", "01", "01", "01", "02",…
## $ RESUL_H    <chr> "B", "B", "B", "B", "B", "B", "B", "B", "B", "B", "A", "A",…
## $ N_REN      <chr> "01", "02", "03", "04", "01", "02", "03", "04", "05", "04",…
## $ PAREN      <chr> "1", "4", "5", "5", "1", "3", "5", "5", "5", "3", "1", "3",…
## $ SEXO       <chr> "2", "2", "1", "1", "2", "1", "2", "2", "1", "2", "2", "2",…
## $ EDAD       <chr> "32", "57", "20", "29", "57", "30", "30", "07", "01", "17",…
## $ CODIGO     <chr> "2", "1", "2", "2", "1", "2", "2", NA, NA, NA, "1", "2", "2…
## $ NIV        <chr> "08", "06", "03", "02", "04", "08", "08", "02", NA, "06", "…
## $ GRA        <chr> "2", "3", "3", "6", "3", "5", "5", "1", NA, "2", "3", "3", …
## $ CVE_ENT    <chr> "21", "21", "21", "21", "21", "21", "21", "21", "21", "21",…
## $ NOM_ENT    <chr> "Puebla", "Puebla", "Puebla", "Puebla", "Puebla", "Puebla",…
## $ CVE_MUN    <chr> "114", "114", "114", "114", "114", "114", "114", "114", "11…
## $ NOM_MUN    <chr> "Puebla", "Puebla", "Puebla", "Puebla", "Puebla", "Puebla",…
## $ AP3_8      <chr> "1", "5", "1", "7", "5", "1", "8", NA, NA, NA, "1", "4", "5…
## $ AP3_9      <chr> NA, "4", NA, NA, "4", NA, "4", NA, NA, NA, NA, "4", "4", "4…
## $ AP3_10     <chr> "2", NA, "2", NA, NA, "2", NA, NA, NA, NA, "3", NA, NA, NA,…
## $ FAC_HOG    <dbl> 599, 599, 599, 599, 534, 534, 534, 534, 534, 326, 557, 326,…
## $ FAC_HOG_AM <dbl> 599, 599, 599, 599, 534, 534, 534, 534, 534, 326, 557, 326,…
## $ DOMINIO    <chr> "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U",…
## $ EST_DIS    <chr> "369", "369", "369", "369", "369", "369", "369", "369", "36…
## $ UPM_DIS    <chr> "08883", "08883", "08883", "08883", "08597", "08597", "0859…
glimpse(TPer_Vic1)
## Rows: 92,051
## Columns: 180
## $ ID_VIV     <chr> "1904750.04", "1910402.03", "1904508.02", "1910402.01", "19…
## $ ID_HOG     <chr> "1904750.04.01", "1910402.03.01", "1904508.02.01", "1910402…
## $ ID_PER     <chr> "1904750.04.01.01", "1910402.03.01.02", "1904508.02.01.02",…
## $ UPM        <chr> "1904750", "1910402", "1904508", "1910402", "1910402", "190…
## $ VIV_SEL    <chr> "04", "03", "02", "01", "02", "05", "05", "16", "19", "03",…
## $ HOGAR      <chr> "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",…
## $ RESUL_H    <chr> "A", "B", "A", "A", "B", "B", "B", "B", "B", "B", "B", "A",…
## $ R_SEL      <chr> "01", "02", "02", "02", "01", "01", "01", "04", "01", "01",…
## $ SEXO       <chr> "2", "2", "1", "1", "2", "1", "1", "2", "1", "1", "1", "2",…
## $ EDAD       <chr> "33", "36", "18", "47", "62", "44", "50", "19", "45", "57",…
## $ AREAM      <chr> "03", "03", "03", "03", "03", "03", "03", NA, NA, "03", "03…
## $ CVE_ENT    <chr> "19", "19", "19", "19", "19", "19", "19", "19", "19", "19",…
## $ NOM_ENT    <chr> "Nuevo León", "Nuevo León", "Nuevo León", "Nuevo León", "Nu…
## $ CVE_MUN    <chr> "031", "031", "031", "031", "031", "031", "031", "031", "03…
## $ NOM_MUN    <chr> "Juárez", "Juárez", "Juárez", "Juárez", "Juárez", "Juárez",…
## $ AP4_1      <chr> "3", "3", "3", "3", "3", "3", "3", "3", "3", "3", "3", "3",…
## $ AP4_2_01   <chr> "0", "0", "1", "1", "0", "0", "1", "0", "0", "1", "0", "0",…
## $ AP4_2_02   <chr> "0", "0", "0", "1", "0", "0", "1", "1", "0", "1", "0", "1",…
## $ AP4_2_03   <chr> "1", "1", "0", "0", "1", "0", "0", "0", "0", "0", "0", "1",…
## $ AP4_2_04   <chr> "0", "0", "0", "0", "1", "0", "0", "0", "1", "0", "0", "0",…
## $ AP4_2_05   <chr> "1", "1", "1", "1", "1", "1", "0", "1", "0", "1", "0", "0",…
## $ AP4_2_06   <chr> "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_2_07   <chr> "0", "0", "0", "0", "0", "0", "0", "0", "1", "0", "1", "0",…
## $ AP4_2_08   <chr> "0", "0", "1", "0", "0", "0", "0", "0", "0", "0", "1", "0",…
## $ AP4_2_09   <chr> "0", "0", "0", "0", "0", "0", "0", "0", "1", "0", "0", "0",…
## $ AP4_2_10   <chr> "0", "0", "0", "0", "0", "1", "1", "1", "0", "0", "1", "1",…
## $ AP4_2_11   <chr> "1", "1", "0", "0", "0", "1", "0", "0", "0", "0", "0", "0",…
## $ AP4_2_12   <chr> "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_2_13   <chr> "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_2_99   <chr> "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_3_1    <chr> "2", "2", "1", "2", "2", "2", "2", "2", "1", "2", "2", "2",…
## $ AP4_3_2    <chr> "2", "2", "1", "2", "1", "2", "2", "2", "1", "2", "2", "2",…
## $ AP4_3_3    <chr> "2", "2", "2", "2", "2", "2", "2", "2", "1", "2", "2", "2",…
## $ AP4_4_01   <chr> "1", "2", "1", "1", "2", "2", "1", "2", "1", "1", "1", "2",…
## $ AP4_4_02   <chr> "1", "3", "3", "1", "3", "1", "3", "3", "1", "1", "1", "3",…
## $ AP4_4_03   <chr> "2", "2", "2", "2", "1", "2", "2", "2", "1", "2", "2", "2",…
## $ AP4_4_04   <chr> "1", "3", "1", "3", "3", "3", "3", "3", "1", "3", "3", "3",…
## $ AP4_4_05   <chr> "2", "2", "3", "3", "3", "3", "2", "2", "1", "1", "1", "2",…
## $ AP4_4_06   <chr> "1", "2", "1", "2", "3", "1", "2", "2", "1", "1", "1", "2",…
## $ AP4_4_07   <chr> "2", "2", "1", "2", "3", "1", "2", "2", "1", "2", "3", "1",…
## $ AP4_4_08   <chr> "2", "2", "2", "2", "3", "2", "2", "2", "1", "2", "3", "1",…
## $ AP4_4_09   <chr> "2", "3", "1", "3", "2", "3", "3", "2", "1", "3", "1", "2",…
## $ AP4_4_10   <chr> "1", "2", "1", "1", "3", "2", "1", "1", "1", "2", "2", "2",…
## $ AP4_4_11   <chr> "2", "2", "2", "1", "3", "2", "2", "2", "1", "2", "1", "3",…
## $ AP4_4_12   <chr> "1", "2", "1", "3", "3", "2", "3", "2", "1", "3", "1", "1",…
## $ AP4_4_A    <chr> "4", "4", "4", "4", "3", "4", "2", "3", "3", "4", "3", "4",…
## $ AP4_5_01   <chr> "0", "1", "0", "0", "0", "1", "0", "0", "0", "1", "1", "0",…
## $ AP4_5_02   <chr> "1", "0", "0", "1", "1", "1", "0", "0", "0", "0", "1", "0",…
## $ AP4_5_03   <chr> "0", "0", "1", "0", "1", "0", "0", "0", "0", "0", "1", "0",…
## $ AP4_5_04   <chr> "0", "1", "0", "0", "0", "0", "0", "0", "0", "1", "0", "1",…
## $ AP4_5_05   <chr> "0", "1", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_5_06   <chr> "0", "1", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_5_07   <chr> "0", "0", "0", "0", "0", "1", "0", "0", "1", "1", "1", "1",…
## $ AP4_5_08   <chr> "1", "1", "0", "1", "0", "1", "0", "0", "0", "0", "1", "0",…
## $ AP4_5_09   <chr> "0", "1", "1", "1", "1", "1", "1", "0", "0", "1", "1", "0",…
## $ AP4_5_10   <chr> "1", "1", "0", "1", "1", "1", "0", "0", "0", "0", "1", "1",…
## $ AP4_5_11   <chr> "0", "0", "1", "1", "0", "1", "0", "0", "0", "0", "1", "1",…
## $ AP4_5_12   <chr> "0", "1", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_5_13   <chr> "0", "1", "0", "0", "1", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_5_14   <chr> "0", "1", "0", "1", "1", "1", "0", "0", "0", "0", "0", "0",…
## $ AP4_5_15   <chr> "0", "1", "0", "0", "1", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_5_16   <chr> "0", "1", "0", "0", "0", "0", "0", "1", "0", "0", "0", "0",…
## $ AP4_5_17   <chr> "0", "1", "0", "0", "0", "1", "0", "0", "0", "1", "1", "1",…
## $ AP4_5_18   <chr> "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_5_99   <chr> "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_6_1    <chr> "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1",…
## $ AP4_6_2    <chr> "1", "1", "1", "1", "1", "1", "2", "1", "2", "1", "1", "2",…
## $ AP4_6_3    <chr> "2", "1", "1", "1", "1", "1", "2", "1", "2", "1", "2", "1",…
## $ AP4_7_1    <chr> "3", "4", "2", "3", "4", "4", "4", "3", "1", "4", "1", "1",…
## $ AP4_7_2    <chr> "3", "4", "1", "4", "4", "1", "4", "3", "1", "4", "1", "3",…
## $ AP4_7_3    <chr> "1", "4", "3", "4", "4", "1", "4", "3", "1", "4", "1", "3",…
## $ AP4_8_1    <chr> "1", "1", "2", "2", "2", "1", "2", "1", "1", "1", "1", "1",…
## $ AP4_9_1    <chr> "1", "1", NA, NA, NA, "1", NA, "2", "2", "1", "2", "2", NA,…
## $ AP4_8_2    <chr> "2", "1", "2", "2", "2", "2", "2", "1", "1", "2", "2", "2",…
## $ AP4_9_2    <chr> NA, "2", NA, NA, NA, NA, NA, "2", "2", NA, NA, NA, NA, NA, …
## $ AP4_8_3    <chr> "1", "1", "2", "1", "1", "1", "2", "1", "1", "1", "1", "1",…
## $ AP4_9_3    <chr> "1", "1", NA, "2", "2", "1", NA, "2", "2", "1", "2", "2", N…
## $ AP4_8_4    <chr> "1", "1", "2", "1", "2", "1", "2", "2", "2", "9", "2", "1",…
## $ AP4_9_4    <chr> "2", "1", NA, "1", NA, "2", NA, NA, NA, NA, NA, "2", "2", N…
## $ AP4_8_5    <chr> "1", "1", "1", "1", "1", "1", "1", "1", "2", "1", "1", "1",…
## $ AP4_9_5    <chr> "1", "2", "9", "2", "2", "1", "2", "2", NA, "1", "2", "1", …
## $ AP4_8_6    <chr> "1", "1", "2", "1", "1", "1", "2", "1", "2", "2", "2", "1",…
## $ AP4_9_6    <chr> "1", "2", NA, "9", "2", "2", NA, "2", NA, NA, NA, "2", "2",…
## $ AP4_10_01  <chr> "1", "1", "1", "1", "2", "1", "2", "1", "2", "1", "2", "1",…
## $ AP4_10_02  <chr> "1", "3", "3", "3", "3", "1", "3", "1", "1", "1", "1", "3",…
## $ AP4_10_03  <chr> "1", "1", "2", "1", "2", "1", "1", "1", "2", "1", "2", "2",…
## $ AP4_10_04  <chr> "2", "1", "1", "3", "3", "1", "2", "1", "2", "1", "3", "1",…
## $ AP4_10_05  <chr> "2", "1", "2", "3", "3", "3", "2", "1", "2", "2", "2", "2",…
## $ AP4_10_06  <chr> "2", "1", "2", "1", "3", "2", "2", "1", "2", "1", "2", "1",…
## $ AP4_10_07  <chr> "2", "3", "2", "3", "3", "3", "2", "3", "2", "3", "3", "3",…
## $ AP4_10_08  <chr> "2", "1", "2", "1", "3", "2", "2", "1", "2", "1", "3", "3",…
## $ AP4_10_09  <chr> "2", "1", "2", "1", "3", "1", "2", "1", "2", "1", "1", "1",…
## $ AP4_10_10  <chr> "3", "1", "3", "1", "3", "2", "2", "1", "3", "1", "3", "1",…
## $ AP4_10_11  <chr> "2", "1", "2", "2", "3", "2", "2", "1", "2", "1", "3", "1",…
## $ AP4_10_12  <chr> "3", "3", "3", "2", "3", "2", "2", "1", "2", "1", "3", "2",…
## $ AP4_10_13  <chr> "3", "3", "3", "3", "3", "3", "3", "1", "3", "1", "3", "3",…
## $ AP4_10_14  <chr> "2", "1", "2", "3", "3", "2", "2", "1", "2", "1", "2", "2",…
## $ AP4_10_15  <chr> "2", "1", "2", "1", "3", "2", "2", "1", "3", "1", "3", "2",…
## $ AP4_10_16  <chr> "2", "2", "2", "2", "2", "2", "2", "1", "2", "1", "2", "2",…
## $ AP4_11_01  <chr> "1", "2", "2", "1", "2", "2", "2", "1", "2", "2", "2", "2",…
## $ AP4_11_02  <chr> "1", "2", "2", "1", "2", "2", "2", "1", "2", "2", "2", "2",…
## $ AP4_11_03  <chr> "2", "2", "2", "2", "2", "2", "2", "1", "2", "2", "2", "2",…
## $ AP4_11_04  <chr> "2", "2", "2", "2", "2", "1", "2", "2", "2", "2", "2", "2",…
## $ AP4_11_05  <chr> "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2",…
## $ AP4_11_06  <chr> "1", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2",…
## $ AP4_11_07  <chr> "2", "2", "2", "2", "2", "2", "2", "1", "2", "2", "2", "2",…
## $ AP4_11_08  <chr> "1", "1", "2", "2", "2", "2", "2", "1", "2", "2", "2", "1",…
## $ AP4_11_09  <chr> "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2",…
## $ AP4_11_10  <chr> "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2",…
## $ AP4_11_11  <chr> "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2",…
## $ AP4_12     <chr> "0000500", "0000000", NA, "0001500", NA, "0002000", NA, "00…
## $ AP5_1_01   <chr> "2", "3", "2", "2", "2", "1", "1", "2", "3", "1", "3", "3",…
## $ AP5_1_02   <chr> "2", "3", "2", "2", "2", "1", "1", "2", "1", "3", "3", "1",…
## $ AP5_1_03   <chr> "2", "3", "2", "2", "1", "2", "2", "2", "2", "3", "2", "2",…
## $ AP5_1_04   <chr> "2", "3", "2", "2", "2", "2", "2", "2", "2", "2", "1", "2",…
## $ AP5_1_05   <chr> "2", "3", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2",…
## $ AP5_1_06   <chr> "3", "3", "2", "3", "3", "3", "2", "2", "2", "1", "3", "3",…
## $ AP5_1_07   <chr> "3", "3", "2", "3", "3", "3", "2", "2", "2", "2", "3", "3",…
## $ AP5_1_08   <chr> "3", "3", "2", "3", "3", "3", "2", "2", "2", "2", "3", "3",…
## $ AP5_1_09   <chr> "3", "3", "2", "3", "3", "3", "2", "2", "2", "2", "2", "1",…
## $ AP5_1_10   <chr> "3", "3", "2", "3", "1", "3", "2", "2", "2", "2", "1", "3",…
## $ AP5_1_11   <chr> "3", "3", "2", "2", "2", "2", "2", "2", "2", "2", "3", "1",…
## $ AP5_1_12   <chr> "2", "3", "2", "2", "2", "2", "2", "2", "2", "2", "3", "1",…
## $ AP5_1_13   <chr> "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "3", "3",…
## $ AP5_2_1    <chr> "3", "4", "3", "3", "2", "1", "2", "3", "1", "2", "2", "3",…
## $ AP5_2_2    <chr> "5", "5", "1", "2", "5", "1", "5", "5", "1", "2", "5", "5",…
## $ AP5_2_3    <chr> "1", "1", "1", "1", "1", "1", "2", "3", "1", "1", "1", "1",…
## $ AP5_2_4    <chr> "3", "5", "1", "2", "5", "1", "2", "3", "1", "1", "2", "4",…
## $ AP5_3_01   <chr> "1", "1", "2", "1", "2", "1", "1", "1", "1", "1", "1", "1",…
## $ AP5_4_01   <chr> "3", "4", NA, "4", NA, "3", "3", "1", "2", "2", "3", "3", N…
## $ AP5_5_01   <chr> "1", "1", NA, "1", NA, "2", "1", "2", "9", "2", "1", "1", N…
## $ AP5_6_01   <chr> "3", "4", NA, "4", NA, "3", "2", "2", "2", "3", "3", "3", N…
## $ AP5_7_1    <chr> "2", "2", NA, "1", NA, "2", "2", "1", "1", "1", "2", "2", N…
## $ AP5_3_02   <chr> "1", "2", "2", "2", "2", "2", "2", "1", "1", "1", "1", "1",…
## $ AP5_4_02   <chr> "4", NA, NA, NA, NA, NA, NA, "1", "2", "2", "2", "2", NA, "…
## $ AP5_5_02   <chr> "1", NA, NA, NA, NA, NA, NA, "2", "2", "2", "2", "1", NA, "…
## $ AP5_6_02   <chr> "4", NA, NA, NA, NA, NA, NA, "1", "2", "2", "4", "2", NA, "…
## $ AP5_7_2    <chr> "2", NA, NA, NA, NA, NA, NA, "2", "1", "1", "1", "2", NA, "…
## $ AP5_3_03   <chr> "1", "2", "2", "1", "2", "1", "2", "2", "2", "1", "1", "1",…
## $ AP5_4_03   <chr> "9", NA, NA, "2", NA, "2", NA, NA, NA, "2", "2", "2", "2", …
## $ AP5_5_03   <chr> "9", NA, NA, "1", NA, "2", NA, NA, NA, "2", "2", "2", "1", …
## $ AP5_6_03   <chr> "3", NA, NA, "2", NA, "2", NA, NA, NA, "2", "2", "2", "4", …
## $ AP5_7_3    <chr> "2", NA, NA, "1", NA, "2", NA, NA, NA, "2", "1", "1", "1", …
## $ AP5_3_04   <chr> "1", "1", "2", "1", "2", "1", "2", "2", "2", "2", "1", "1",…
## $ AP5_4_04   <chr> "2", "4", NA, "2", NA, "3", NA, NA, NA, NA, "2", "2", "2", …
## $ AP5_5_04   <chr> "2", "1", NA, "1", NA, "2", NA, NA, NA, NA, "9", "1", "2", …
## $ AP5_6_04   <chr> "3", "4", NA, "2", NA, "4", NA, NA, NA, NA, "9", "2", "2", …
## $ AP5_3_05   <chr> "1", "1", "2", "1", "2", "1", "2", "2", "2", "2", "1", "1",…
## $ AP5_4_05   <chr> "3", "2", NA, "1", NA, "2", NA, NA, NA, NA, "1", "2", NA, "…
## $ AP5_5_05   <chr> "2", "1", NA, "2", NA, "2", NA, NA, NA, NA, "2", "2", NA, "…
## $ AP5_6_05   <chr> "2", "3", NA, "1", NA, "1", NA, NA, NA, NA, "1", "2", NA, "…
## $ AP5_3_06   <chr> "1", "1", "2", "2", "2", "1", "2", "2", "2", "2", "2", "2",…
## $ AP5_4_06   <chr> "2", "4", NA, NA, NA, "9", NA, NA, NA, NA, NA, NA, NA, NA, …
## $ AP5_5_06   <chr> "9", "1", NA, NA, NA, "9", NA, NA, NA, NA, NA, NA, NA, NA, …
## $ AP5_6_06   <chr> "2", "4", NA, NA, NA, "9", NA, NA, NA, NA, NA, NA, NA, NA, …
## $ AP5_3_07   <chr> "2", "2", "2", "2", "2", "1", "2", "2", "2", "2", "2", "2",…
## $ AP5_4_07   <chr> NA, NA, NA, NA, NA, "2", NA, NA, NA, NA, NA, NA, NA, NA, NA…
## $ AP5_5_07   <chr> NA, NA, NA, NA, NA, "2", NA, NA, NA, NA, NA, NA, NA, NA, NA…
## $ AP5_6_07   <chr> NA, NA, NA, NA, NA, "3", NA, NA, NA, NA, NA, NA, NA, NA, NA…
## $ AP5_3_08   <chr> "1", "1", "2", "1", "2", "1", "2", "1", "1", "1", "1", "1",…
## $ AP5_4_08   <chr> "2", "2", NA, "1", NA, "1", NA, "1", "1", "2", "1", "2", "2…
## $ AP5_5_08   <chr> "2", "1", NA, "2", NA, "2", NA, "2", "2", "2", "2", "2", "2…
## $ AP5_6_08   <chr> "1", "2", NA, "1", NA, "2", NA, "1", "1", "2", "1", "2", "2…
## $ AP5_3_09   <chr> "1", "1", "2", "1", "2", "1", "2", "1", "1", "1", "1", "1",…
## $ AP5_4_09   <chr> "2", "2", NA, "1", NA, "1", NA, "2", "1", "2", "1", "1", NA…
## $ AP5_5_09   <chr> "2", "1", NA, "9", NA, "2", NA, "2", "2", "2", "2", "2", NA…
## $ AP5_6_09   <chr> "2", "3", NA, "2", NA, "2", NA, "1", "1", "2", "1", "2", NA…
## $ AP5_3_10   <chr> "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2",…
## $ AP5_4_10   <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ AP5_5_10   <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ AP5_6_10   <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ AP5_8      <chr> "4", "4", "1", "4", "9", "3", "4", "3", "1", "4", "4", "2",…
## $ FAC_HOG    <dbl> 562, 841, 577, 841, 841, 577, 698, 471, 398, 1217, 554, 554…
## $ FAC_ELE    <dbl> 1125, 1682, 1730, 1682, 841, 1153, 1397, 1884, 795, 3652, 2…
## $ FAC_HOG_AM <dbl> 562, 841, 577, 841, 841, 577, 698, NA, NA, 1217, 554, 554, …
## $ FAC_ELE_AM <dbl> 1125, 1682, 1730, 1682, 841, 1153, 1397, NA, NA, 3652, 2215…
## $ DOMINIO    <chr> "U", "U", "U", "U", "U", "U", "U", "C", "C", "U", "U", "U",…
## $ ESTRATO    <chr> "2", "2", "3", "2", "2", "3", "4", "2", "2", "2", "2", "2",…
## $ EST_DIS    <chr> "333", "336", "334", "336", "336", "334", "335", "342", "34…
## $ UPM_DIS    <chr> "07999", "08242", "07990", "08242", "08242", "07990", "0799…
glimpse(TMod_Vic)
## Rows: 37,156
## Columns: 129
## $ ID_VIV     <chr> "0206374.01", "0208069.18", "0208098.11", "0204439.03", "02…
## $ ID_HOG     <chr> "0206374.01.01", "0208069.18.01", "0208098.11.01", "0204439…
## $ ID_PER     <chr> "0206374.01.01.02", "0208069.18.01.02", "0208098.11.01.01",…
## $ ID_DEL     <chr> "0206374.01.01.02.07.1", "0208069.18.01.02.08.1", "0208098.…
## $ UPM        <chr> "0206374", "0208069", "0208098", "0204439", "0208189", "020…
## $ VIV_SEL    <chr> "01", "18", "11", "03", "03", "04", "01", "05", "01", "02",…
## $ HOGAR      <chr> "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",…
## $ ND_TIPO    <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ TD_TIPO    <dbl> 2, 1, 1, 1, 1, 3, 1, 1, 1, 1, 1, 3, 1, 1, 1, 1, 1, 1, 2, 1,…
## $ BPCOD      <chr> "07", "08", "01", "01", "09", "03", "10", "05", "05", "07",…
## $ R_SEL      <chr> "02", "02", "01", "08", "01", "01", "02", "01", "02", "01",…
## $ RESUL_H    <chr> "A", "A", "A", "A", "A", "A", "A", "A", "A", "A", "A", "A",…
## $ SEXO       <chr> "2", "2", "1", "1", "2", "1", "2", "1", "2", "1", "1", "1",…
## $ EDAD       <chr> "43", "29", "43", "30", "32", "45", "33", "23", "30", "48",…
## $ AREAM_OCU  <chr> "21", "21", "21", "21", "21", "21", "21", "21", "21", "21",…
## $ BP1_1      <chr> "02", "11", "02", "02", "05", "06", "03", "03", "08", "07",…
## $ BP1_2C     <chr> "02", "02", "02", "02", "02", "02", "02", "02", "02", "02",…
## $ BP1_3C     <chr> "004", "004", "004", "004", "004", "004", "004", "004", "00…
## $ BP1_4      <chr> "2", "2", "2", "3", "2", "3", "3", "2", "2", "2", "4", "3",…
## $ BP1_5      <chr> "2", "4", "1", "1", "2", "2", "2", "1", "1", "1", "1", "2",…
## $ BP1_6      <chr> NA, NA, "2", "2", "2", NA, "1", "1", "1", NA, NA, NA, "1", …
## $ BP1_7      <chr> NA, NA, NA, NA, NA, NA, "1", "1", "1", NA, NA, NA, "1", "1"…
## $ BP1_8      <chr> NA, NA, NA, NA, NA, NA, "1", "1", "1", NA, NA, NA, "2", "2"…
## $ BP1_9      <chr> NA, NA, NA, NA, NA, NA, "1", "2", "1", NA, NA, NA, "1", "2"…
## $ BP1_10_1   <chr> NA, NA, NA, NA, NA, NA, "0", "1", "1", NA, NA, NA, "1", "1"…
## $ BP1_10_2   <chr> NA, NA, NA, NA, NA, NA, "1", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_10_9   <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_11     <chr> NA, NA, NA, NA, NA, NA, "4", "5", "5", NA, NA, NA, "4", "4"…
## $ BP1_12_1   <chr> NA, NA, NA, NA, NA, NA, "0", "1", "1", NA, NA, NA, "1", "1"…
## $ BP1_12_2   <chr> NA, NA, NA, NA, NA, NA, "1", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_12_3   <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_12_4   <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_12_5   <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_12_9   <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_13     <chr> NA, NA, NA, NA, NA, NA, NA, "1", "2", NA, NA, NA, "1", "1",…
## $ BP1_14_1   <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "1", "0"…
## $ BP1_14_2   <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_14_3   <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_14_4   <chr> NA, NA, NA, NA, NA, NA, "1", "1", "0", NA, NA, NA, "0", "0"…
## $ BP1_14_9   <chr> NA, NA, NA, NA, NA, NA, "0", "0", "1", NA, NA, NA, "0", "1"…
## $ BP1_15     <chr> NA, NA, NA, NA, NA, NA, "2", "2", "1", NA, NA, NA, "1", "1"…
## $ BP1_16_1   <chr> NA, NA, NA, NA, NA, NA, NA, NA, "0", NA, NA, NA, "1", "1", …
## $ BP1_16_2   <chr> NA, NA, NA, NA, NA, NA, NA, NA, "1", NA, NA, NA, "0", "0", …
## $ BP1_16_3   <chr> NA, NA, NA, NA, NA, NA, NA, NA, "0", NA, NA, NA, "0", "0", …
## $ BP1_16_4   <chr> NA, NA, NA, NA, NA, NA, NA, NA, "0", NA, NA, NA, "0", "0", …
## $ BP1_16_9   <chr> NA, NA, NA, NA, NA, NA, NA, NA, "0", NA, NA, NA, "0", "0", …
## $ BP1_17     <chr> NA, NA, NA, NA, NA, NA, NA, NA, "2", NA, NA, NA, "2", "2", …
## $ BP1_18     <chr> NA, NA, NA, NA, NA, NA, "2", "2", "2", NA, NA, NA, "2", "2"…
## $ BP1_19_1   <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_19_2   <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_19_3   <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_19_4   <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_19_5   <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_19_6   <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_19_7   <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_19_8   <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_20     <chr> "2", "2", "1", "2", "2", "2", "1", "2", "2", "2", "2", "2",…
## $ BP1_21     <chr> NA, NA, NA, "2", NA, "2", NA, NA, NA, NA, "2", "2", NA, NA,…
## $ BP1_22     <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_23     <chr> "04", "06", NA, "09", "04", "06", NA, "06", "01", "03", "04…
## $ BP1_24     <chr> NA, NA, "2", NA, NA, NA, "1", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_25     <chr> NA, NA, NA, NA, NA, NA, "7", NA, NA, NA, NA, NA, NA, NA, NA…
## $ BP1_26     <chr> NA, NA, "2", NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA…
## $ BP1_27     <chr> NA, NA, "3", NA, NA, NA, "2", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_28     <chr> NA, NA, "2", NA, NA, NA, "6", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_29     <chr> NA, NA, "2", NA, NA, NA, "2", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_30     <chr> "2", "2", "2", "1", "2", "2", "1", "2", "2", "2", "2", "2",…
## $ BP1_31_01  <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_02  <chr> NA, NA, NA, "1", NA, NA, "1", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_03  <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_04  <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_05  <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_06  <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_07  <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_08  <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_99  <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_32_1   <chr> NA, NA, "0", "1", NA, NA, "1", NA, NA, NA, NA, NA, NA, NA, …
## $ BP1_32_2   <chr> NA, NA, "0", "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, …
## $ BP1_32_3   <chr> NA, NA, "0", "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, …
## $ BP1_32_4   <chr> NA, NA, "0", "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, …
## $ BP1_32_5   <chr> NA, NA, "0", "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, …
## $ BP1_32_9   <chr> NA, NA, "1", "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, …
## $ BP1_33     <chr> "1", "1", "5", "3", "3", "1", "4", "1", "1", "1", "1", "1",…
## $ BP1_34     <chr> "0006000", "0005000", NA, "0001500", "0000000", "0002000", …
## $ BP1_35     <chr> "0000000", "0000000", NA, "0000000", "0000000", "0000000", …
## $ BP1_36_01  <chr> NA, NA, "1", NA, "1", NA, "0", "0", "1", "0", "0", NA, "0",…
## $ BP1_36_02  <chr> NA, NA, "0", NA, "1", NA, "1", "0", "1", "0", "0", NA, "0",…
## $ BP1_36_03  <chr> NA, NA, "0", NA, "1", NA, "1", "0", "1", "1", "1", NA, "0",…
## $ BP1_36_04  <chr> NA, NA, "0", NA, "1", NA, "1", "0", "1", "0", "1", NA, "0",…
## $ BP1_36_05  <chr> NA, NA, "0", NA, "0", NA, "0", "0", "0", "0", "0", NA, "0",…
## $ BP1_36_06  <chr> NA, NA, "0", NA, "0", NA, "0", "0", "1", "0", "0", NA, "0",…
## $ BP1_36_07  <chr> NA, NA, "0", NA, "0", NA, "0", "0", "0", "0", "1", NA, "0",…
## $ BP1_36_08  <chr> NA, NA, "1", NA, "0", NA, "0", "1", "1", "1", "1", NA, "1",…
## $ BP1_36_09  <chr> NA, NA, "0", NA, "0", NA, "1", "0", "1", "0", "1", NA, "1",…
## $ BP1_36_10  <chr> NA, NA, "0", NA, "0", NA, "0", "0", "0", "0", "0", NA, "0",…
## $ BP1_36_11  <chr> NA, NA, "0", NA, "0", NA, "0", "0", "0", "0", "0", NA, "0",…
## $ BP1_36_99  <chr> NA, NA, "0", NA, "0", NA, "0", "0", "0", "0", "0", NA, "0",…
## $ BP2_1      <chr> NA, NA, "2", "1", NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, N…
## $ BP3_1_01   <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_02   <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_03   <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_04   <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_05   <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_06   <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_07   <dbl> NA, NA, NA, NA, NA, NA, NA, 1, 1, NA, NA, NA, 1, 0, NA, NA,…
## $ BP3_1_08   <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_09   <dbl> NA, NA, NA, NA, NA, NA, NA, 1, 1, NA, NA, NA, 1, 1, NA, NA,…
## $ BP3_1_10   <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_11   <chr> NA, NA, NA, NA, NA, NA, NA, "0", "0", NA, NA, NA, "0", "0",…
## $ BP3_1_12   <chr> NA, NA, NA, NA, NA, NA, NA, "0", "0", NA, NA, NA, "0", "0",…
## $ BP3_1_99   <chr> NA, NA, NA, NA, NA, NA, NA, "0", "0", NA, NA, NA, "0", "0",…
## $ BP3_2      <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP4_1      <chr> "4", "1", NA, NA, NA, NA, NA, NA, NA, "4", NA, NA, NA, NA, …
## $ BP5_1      <chr> NA, NA, NA, NA, "1", NA, NA, NA, NA, NA, NA, NA, NA, NA, "1…
## $ BP5_2_1    <chr> NA, NA, NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, NA, NA, "1…
## $ BP5_2_2    <chr> NA, NA, NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, NA, NA, "0…
## $ BP5_2_3    <chr> NA, NA, NA, NA, "1", NA, NA, NA, NA, NA, NA, NA, NA, NA, "0…
## $ BP5_2_4    <chr> NA, NA, NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, NA, NA, "0…
## $ BP5_3      <chr> NA, NA, NA, NA, "3", NA, NA, NA, NA, NA, NA, NA, NA, NA, "3…
## $ BP6_1      <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP6_2      <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP6_3      <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP7_1      <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ FAC_DEL    <dbl> 1043, 1078, 377, 345, 542, 404, 948, 1107, 693, 346, 351, 4…
## $ FAC_DEL_AM <dbl> 1043, 1078, 377, 345, 542, 404, 948, 1107, 693, 346, 351, 4…
## $ DOMINIO    <chr> "U", "C", "C", "U", "U", "U", "U", "U", "U", "U", "U", "U",…
## $ ESTRATO    <chr> "4", "2", "2", "3", "3", "3", "2", "2", "2", "3", "4", "3",…
## $ EST_DIS    <chr> "015", "032", "031", "014", "014", "014", "013", "016", "01…
## $ UPM_DIS    <chr> "00714", "00781", "00782", "00572", "00783", "00710", "0057…

Unión de bases de datos

Ya vimos que INEGI nos da varias BDs porque está midiendo a varios niveles de análisis. Ahora el reto es combinarlas para tener junta toda la información que necesitamos.

Imaginemos que queremos saber si las personas que han sido víctimas de delito reportan más miedo al crimen que quienes no han sido víctimas.

El problema es que debemos unir dos bases de datos para hacer esta comparación: TPer_vic1 y TPer_vic2.

Esta es la primera pregunta que queremos usar:

Alt text

Alt text

Y esta es la segunda con la que la quiero cruzar:

Alt text

Alt text

Tenemos que unir las dos BDs.

Vamos a revisar el diagrama que nos sirve como mapa:

Alt text

Alt text

Lo que nos dice este diagrama es que necesitamos una llave que sea única y común en ambas BDs. La llave es un identificador único para que R no le asigne la información de Juan a los datos de Pedro. Queremos que quede Juan con Juan.

Afortunadamente INEGI nos provee de llaves, que nombra con el prefijo ID.

Lo primero que necesitamos hacer es preguntarnos por el nivel al que están las variables que buscamos. Si queremos unir la BD de vivienda con la de hogar, usaríamos el ID_VIV porque es el único que coincide en ambas. Por lo general se usa el ID del nivel más alto.

En nuestro caso queremos unir dos BDs a nivel persona. Y para ello usaremos la variable llamada: ID_PER

head(TPer_Vic1)

Noten cómo ID_PER es la unión, separada por un punto, de UPM + VIV_SEL + Hogar + R_sel

Y lo que es crucial, es que son Identificadores únicos. Noten cómo deben coincidir el número de filas con la columna de valores únicos (n_unique).

library(skimr)

TPer_Vic1 %>% 
  select(ID_PER) %>%
  skim()
Data summary
Name Piped data
Number of rows 92051
Number of columns 1
_______________________
Column type frequency:
character 1
________________________
Group variables None

Variable type: character

skim_variable n_missing complete_rate min max empty n_unique whitespace
ID_PER 0 1 16 16 0 92051 0

Corroboramos con la otra y vemos que coincide.

TPer_Vic2 %>% 
  select(ID_PER) %>%
  skim()
Data summary
Name Piped data
Number of rows 92051
Number of columns 1
_______________________
Column type frequency:
character 1
________________________
Group variables None

Variable type: character

skim_variable n_missing complete_rate min max empty n_unique whitespace
ID_PER 0 1 16 16 0 92051 0

Ahora sí ya las podemos unir. Este comando proviene de la serie de funciones diseñadas para bases de datos relacionales y creo que aquí hay una buena explicación; capítulo 13

tpervic_unido <- TPer_Vic1 %>% 
  left_join(TPer_Vic2, by= "ID_PER")

Veamos la estructura del comando:

Tal vez se pregunten qué es eso del “left_join”. Es una manera de indicar cuál es la base de datos que usamos como referencia para hacer la unión. Importa, principalmente, por los datos faltantes.

Y para entenderlo mejor veamos el esquema de propio Wickham.

Alt text

Alt text

Limpieza de datos

Ahora seguimos trabajando con el nuevo objeto. Vean en el entorno que tenemos las mismas observaciones, pero ahora 328 variables.

Limpiemos primero la de miedo en la colonia

library(janitor)

table(tpervic_unido$AP4_3_1) # Ese 9 es NA
## 
##     1     2     9 
## 56316 35440   295
class(tpervic_unido$AP4_3_1) # Es character y eso no es lo que quiero
## [1] "character"
tpervic_unido <- tpervic_unido %>% 
  mutate(seg_col = case_when(
    AP4_3_1== 1 ~ "seguro",
    AP4_3_1== 2 ~ "inseguro",
    AP4_3_1== 9 ~ NA_character_)) # Primero nos encargamos de los NA

table(tpervic_unido$seg_col, useNA = "ifany") # Nos los quitamos de encima
## 
## inseguro   seguro     <NA> 
##    35440    56316      295
tpervic_unido <- tpervic_unido %>% 
  mutate(seg_col1 = ordered(seg_col, levels = c("seguro", "inseguro"), labels= c("seguro", "inseguro"))) # Ahora etiquetas y nivel ordinal

table(tpervic_unido$seg_col1)
## 
##   seguro inseguro 
##    56316    35440
tpervic_unido %>% 
  tabyl(seg_col1)  %>% 
  adorn_totals("row") %>%
  adorn_pct_formatting()

Aquí un breve tutorial de cómo formatear tablas usando tabyl

Ahora victimización

table(tpervic_unido$AP6_3) # mismo problema
## 
##     1     2     9 
## 11575 80453    23
class(tpervic_unido$AP6_3)
## [1] "character"
tpervic_unido <- tpervic_unido %>%
  mutate(vic = case_when(
    AP6_3== 1 ~ "Sí",
    AP6_3== 2 ~ "No",
    AP6_3== 3 ~ NA_character_))

table(tpervic_unido$vic, useNA = "ifany")
## 
##    No    Sí  <NA> 
## 80453 11575    23
tpervic_unido <- tpervic_unido %>% 
  mutate(vic1 = ordered(vic, levels = c("Sí", "No"), labels= c("Victima", "No-Vic")))

tpervic_unido %>% 
  tabyl(vic1)  %>% 
  adorn_totals("row") %>%
  adorn_pct_formatting()

Finalmente podemos responder a la pregunta: ¿Quienes fueron víctimas de un delito reportan más miedo en la colonia que quien no fue víctima?

tpervic_unido %>%
  tabyl(vic1, seg_col1, show_na = FALSE)  %>%
   adorn_totals(c("row", "col")) %>%
  adorn_percentages("row") %>% 
  adorn_pct_formatting(rounding = "half up", digits = 0) %>%
  adorn_ns() %>%
  adorn_title("combined")

Vamos a construir nuestra gráfica

tabla1 <- prop.table(table(tpervic_unido$vic, tpervic_unido$seg_col1), margin = 1)*100

tabla1 # primero la info que quiero. Cambien el margin a 2 para ver qué pasa
##     
##        seguro inseguro
##   No 63.32244 36.67756
##   Sí 47.85207 52.14793
tabla2 <- as_tibble(tabla1, .name_repair = "unique")
## New names:
## * `` -> ...1
## * `` -> ...2
tabla2 # feos nombres
tabla3 <- tabla2 %>% 
  rename(victima="...1",
         miedo="...2",
         porcentaje= "n")

tabla4 <- tabla3 %>% 
  mutate(miedo = ordered(miedo, levels = c("seguro", "inseguro"), labels= c("seguro", "inseguro"))) %>%
  mutate(victima= ordered(victima, levels = c("No","Sí"), labels= c("No-Victima", "Victima"))) %>% mutate(porcentaje= round(porcentaje, 1))
  

tabla4 # ahora sí lista para ggplot

Y ahora sí la gráfica

g1 <- tabla4 %>%
  ggplot(aes(x= victima, y= porcentaje, group= miedo, fill= miedo))+
  geom_bar(position="dodge", stat="identity")+        
  geom_text(aes(label= paste0(porcentaje,"%")), position= position_dodge(width = .8),  vjust = 1.5, hjust= .8)+
    scale_fill_brewer(palette="Set2")+
    labs(
    x= "¿Considera que vivir en su colonia es...?",
    y= "",
    title= "Comparación de miedo en colonia por victimización en México",
    subtitle= "",
    caption= "Fuente: INEGI/ ENVIPE 2021 ") +
  theme_classic()

g2 <- g1 + theme(legend.position="bottom", legend.title = element_blank())

g2

Factores de expansión

Noten un detalle importante… Nosotros estamos estimando que el % de personas que se siente inseguro es de 38.6%

tabyl(tpervic_unido$seg_col1, show_na = FALSE) %>%
  adorn_pct_formatting()

Pero… El INEGI reporta esto en su presentación oficial

Alt text

Alt text

¿Por cuanto nos está fallando?

La explicación, por sorpresivo que parezca, está en el esquema de muestreo. ¿Recuerdan que vimos esto?

Primero noten que la cobertura geográfica es nacional, urbano, rural, entidad y área metro. Es a estos niveles donde la muestra es representativa y por tanto es a este nivel donde podemos generalizar a la población.

Ahora recordemos unas parte clave de la selección de muestra:

Alt text

Alt text

Todo ello viene a cuento porque cuando nosotros sacamos la proporción de personas con miedo en la colonia, R está asumiendo un muestreo simple. Debemos decirle que es un muestreo estratificado

Y no sólo eso. El diseño muestral del INEGI es lo que se conoce como un diseño complejo justo por como hace la muestra. Aquí un buen libro de quien hizo los paquetes para R, ahí pueden explorar a mayor detalle este tema; libro de Lumley. El punto de los factores de expansión es aproximar de manera más explícita la generalización. Por ejemplo, imaginen tenemos una población de 2,000 personas y recolectamos una muestra aleatoria de 100 personas. Nosotros vamos a preguntarles cuántos de ellos tienen miedo en su colonia: 60 dicen que no, 40 dicen que sí. Nosotros queremos decir que el 40% de la población tiene miedo. Ese brinco de muestra a población es la generalización.

Ahora bien, lo que hacen los factores de expansión es ampliar esa lógica. Otra manera de ponerlo es que la respuesta de cada una de esas personas vale por 20 personas (100*20= 2,000).La genialidad está en que el diseño complejo nos dice que no todas las respuestas valen lo mismo. Según sus características sociodemográficas, lo que me diga una persona, equivale a 14 respuestas; y lo que me diga otra, equivale a 25 respuestas. En otras palabras, necesitamos hacer una media ponderada según cuanto valga la respuesta de cada persona.

¿Por qué unos valen más que otros? Hay personas con características sociodemográficas más comunes y por eso son más fáciles de encontrar (mujer de 45 años en zona urbana sin victimización), así es que el INEGI les da una ponderación baja (Factor de expansión= 14 respuestas). Pero hay otras menos comunes, más difíciles de que salgan en mi muestra (mujer de 90 años en zona rural con victimización),y por ello el INEGI da una ponderación alta (Factor de expansión= 25 respuestas).

Vamos a ver cómo se implementa esto con ENVIPE. empecemos por reducir la bd

colnames(TPer_Vic1)
##   [1] "ID_VIV"     "ID_HOG"     "ID_PER"     "UPM"        "VIV_SEL"   
##   [6] "HOGAR"      "RESUL_H"    "R_SEL"      "SEXO"       "EDAD"      
##  [11] "AREAM"      "CVE_ENT"    "NOM_ENT"    "CVE_MUN"    "NOM_MUN"   
##  [16] "AP4_1"      "AP4_2_01"   "AP4_2_02"   "AP4_2_03"   "AP4_2_04"  
##  [21] "AP4_2_05"   "AP4_2_06"   "AP4_2_07"   "AP4_2_08"   "AP4_2_09"  
##  [26] "AP4_2_10"   "AP4_2_11"   "AP4_2_12"   "AP4_2_13"   "AP4_2_99"  
##  [31] "AP4_3_1"    "AP4_3_2"    "AP4_3_3"    "AP4_4_01"   "AP4_4_02"  
##  [36] "AP4_4_03"   "AP4_4_04"   "AP4_4_05"   "AP4_4_06"   "AP4_4_07"  
##  [41] "AP4_4_08"   "AP4_4_09"   "AP4_4_10"   "AP4_4_11"   "AP4_4_12"  
##  [46] "AP4_4_A"    "AP4_5_01"   "AP4_5_02"   "AP4_5_03"   "AP4_5_04"  
##  [51] "AP4_5_05"   "AP4_5_06"   "AP4_5_07"   "AP4_5_08"   "AP4_5_09"  
##  [56] "AP4_5_10"   "AP4_5_11"   "AP4_5_12"   "AP4_5_13"   "AP4_5_14"  
##  [61] "AP4_5_15"   "AP4_5_16"   "AP4_5_17"   "AP4_5_18"   "AP4_5_99"  
##  [66] "AP4_6_1"    "AP4_6_2"    "AP4_6_3"    "AP4_7_1"    "AP4_7_2"   
##  [71] "AP4_7_3"    "AP4_8_1"    "AP4_9_1"    "AP4_8_2"    "AP4_9_2"   
##  [76] "AP4_8_3"    "AP4_9_3"    "AP4_8_4"    "AP4_9_4"    "AP4_8_5"   
##  [81] "AP4_9_5"    "AP4_8_6"    "AP4_9_6"    "AP4_10_01"  "AP4_10_02" 
##  [86] "AP4_10_03"  "AP4_10_04"  "AP4_10_05"  "AP4_10_06"  "AP4_10_07" 
##  [91] "AP4_10_08"  "AP4_10_09"  "AP4_10_10"  "AP4_10_11"  "AP4_10_12" 
##  [96] "AP4_10_13"  "AP4_10_14"  "AP4_10_15"  "AP4_10_16"  "AP4_11_01" 
## [101] "AP4_11_02"  "AP4_11_03"  "AP4_11_04"  "AP4_11_05"  "AP4_11_06" 
## [106] "AP4_11_07"  "AP4_11_08"  "AP4_11_09"  "AP4_11_10"  "AP4_11_11" 
## [111] "AP4_12"     "AP5_1_01"   "AP5_1_02"   "AP5_1_03"   "AP5_1_04"  
## [116] "AP5_1_05"   "AP5_1_06"   "AP5_1_07"   "AP5_1_08"   "AP5_1_09"  
## [121] "AP5_1_10"   "AP5_1_11"   "AP5_1_12"   "AP5_1_13"   "AP5_2_1"   
## [126] "AP5_2_2"    "AP5_2_3"    "AP5_2_4"    "AP5_3_01"   "AP5_4_01"  
## [131] "AP5_5_01"   "AP5_6_01"   "AP5_7_1"    "AP5_3_02"   "AP5_4_02"  
## [136] "AP5_5_02"   "AP5_6_02"   "AP5_7_2"    "AP5_3_03"   "AP5_4_03"  
## [141] "AP5_5_03"   "AP5_6_03"   "AP5_7_3"    "AP5_3_04"   "AP5_4_04"  
## [146] "AP5_5_04"   "AP5_6_04"   "AP5_3_05"   "AP5_4_05"   "AP5_5_05"  
## [151] "AP5_6_05"   "AP5_3_06"   "AP5_4_06"   "AP5_5_06"   "AP5_6_06"  
## [156] "AP5_3_07"   "AP5_4_07"   "AP5_5_07"   "AP5_6_07"   "AP5_3_08"  
## [161] "AP5_4_08"   "AP5_5_08"   "AP5_6_08"   "AP5_3_09"   "AP5_4_09"  
## [166] "AP5_5_09"   "AP5_6_09"   "AP5_3_10"   "AP5_4_10"   "AP5_5_10"  
## [171] "AP5_6_10"   "AP5_8"      "FAC_HOG"    "FAC_ELE"    "FAC_HOG_AM"
## [176] "FAC_ELE_AM" "DOMINIO"    "ESTRATO"    "EST_DIS"    "UPM_DIS"
vic <- TPer_Vic1 %>% 
  select("FAC_ELE", "EST_DIS", "UPM_DIS", "AP4_3_1", "SEXO")

vic
table(vic$SEXO)
## 
##     1     2 
## 42466 49585
vic  <- vic  %>% 
  mutate(mujer = case_when(
    SEXO== 1 ~ "0",
    SEXO== 2 ~ "1")) 

vic  <- vic  %>% 
    mutate(mujer = ordered(mujer, levels = c("0", "1"), labels= c("varon", "mujer")))

table(vic$mujer)
## 
## varon mujer 
## 42466 49585
vic  <- vic  %>% 
  mutate(seg_col = case_when(
    AP4_3_1== 1 ~ "0",
    AP4_3_1== 2 ~ "1",
    AP4_3_1== 9 ~ NA_character_)) 

vic  <- vic  %>% 
  mutate(seg_col1= as.numeric(seg_col))

Veamos la lógica de la expansión. Primero lo que dice la muestra

table(vic$seg_col1)
## 
##     0     1 
## 56316 35440

Y ahora expandido…

xtabs(FAC_ELE ~ seg_col, data= vic)
## seg_col
##        0        1 
## 52189329 37871728

Pongamos comas para ver el tamaño de ese numero: 37, 871, 728

Pasamos de 35 mil a 37 millones!

Vean cómo la respuesta de la primera persona, equivale a 1,125 respuestas. Y la de la segunda es un poco diferente, equivale a 1,682. Pero la 5 sólo a 841!

head(vic)

Usemos toda esta información.

Ahora sí definamos nuestra BD con el diseño complejo. Aquí un tutorial de svyr, el paquete de r que usaremos para estos calculos

library(srvyr)

vic_survey <- vic %>% 
                  as_survey_design(ids = UPM_DIS, # cluster
                   weights = FAC_ELE, #factor
                   strata = EST_DIS) # estrato

vic_survey              
## Stratified 1 - level Cluster Sampling design (with replacement)
## With (13195) clusters.
## Called via srvyr
## Sampling variables:
##  - ids: UPM_DIS
##  - strata: EST_DIS
##  - weights: FAC_ELE
## Data variables: FAC_ELE (dbl), EST_DIS (chr), UPM_DIS (chr), AP4_3_1 (chr),
##   SEXO (chr), mujer (ord), seg_col (chr), seg_col1 (dbl)

Es importante notar que diferentes BDs pueden tener más o menos información y este setting puede cambiar. Miren este cuadro para otras variantes; proviene de otro buen libro en R.

Alt text

Alt text

Y ahora usemos nuestra BD transformada a diseño complejo

vic_survey %>%
  drop_na() %>% 
  summarize(proporcion = survey_mean(seg_col1, vartype = "ci"))

Casi! Pero creo que mucho más cerca

vic_survey %>%
  drop_na() %>% 
  group_by(mujer) %>% 
  summarize(proporcion = survey_mean(seg_col1, vartype = "ci"))

¿Le atinamos?

Alt text

Alt text

Bastante mejor que si lo hubieramos hecho sin el factor

vic %>%
  drop_na() %>% 
  group_by(mujer) %>% 
  summarize(proporcion = mean(seg_col1))

Moraleja: si su base de datos tiene Factores de Expansión, úsenlos!