Vamos a retomar algunos de los conceptos que hemos visto recientemente y de paso añadiremos algunos trucos que creo que van a necesitar. Intentemos replicar los tabulados del INEGI. Yo creo que si logramos entender una base de datos, tendremos bastante idea de cómo usar alguna otra a la que se enfrenten después. Nuestro ejemplo maestro será la ENVIPE, encuesta sobre victimización y miedo al crimen.
Además aprovecharemosque el INEGI ya le está entrando a R. Usemos las bases que nos da precargadas en esta liga, como RData.
load("~/Dropbox/Clases/R_Intro/Ot 2021/Proyecto_Otoño_2021/BD/bd_envipe_2021_RData/BD_ENVIPE_2021.RData")
Lo primero que notamos es que son muchas bases de datos; fíjense cómo varían mucho en el número de observaciones. Importante revisar el documento de donde proviene la información sobre la estructura de la bd. Las diferentes bases se explican porque está referenciando diferentes partes del cuestionario. Noten cómo vamos cambiando a diferentes niveles, la unidad de análisis pasa de la vivienda, al hogar, a la persona, al delito.
Alt text
library(tidyverse)
glimpse(TVivienda)
## Rows: 90,335
## Columns: 20
## $ ID_VIV <chr> "0100003.01", "0100003.02", "0100003.03", "0100003.04", "01…
## $ UPM <chr> "0100003", "0100003", "0100003", "0100003", "0100003", "010…
## $ VIV_SEL <chr> "01", "02", "03", "04", "05", "01", "02", "03", "04", "01",…
## $ AREAM <chr> "14", "14", "14", "14", "14", "14", "14", "14", "14", "14",…
## $ CVE_ENT <chr> "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",…
## $ NOM_ENT <chr> "Aguascalientes", "Aguascalientes", "Aguascalientes", "Agua…
## $ CVE_MUN <chr> "001", "001", "001", "001", "001", "001", "001", "001", "00…
## $ NOM_MUN <chr> "Aguascalientes", "Aguascalientes", "Aguascalientes", "Agua…
## $ RESULT_V <chr> "02", "01", "01", "02", "01", "02", "01", "02", "01", "02",…
## $ AP1_1 <chr> "2", "1", "1", "1", "1", "1", "1", "1", "2", "1", "1", "1",…
## $ AP1_2 <chr> "1", "2", "2", "2", "1", "1", "2", "2", "2", "2", "2", "2",…
## $ AP2_1 <chr> "03", "01", "01", "05", "03", "02", "03", "02", "03", "02",…
## $ AP2_2 <chr> "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1",…
## $ AP2_3 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ NAP2_3 <chr> "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",…
## $ FAC_VIV <dbl> 255, 255, 255, 255, 255, 190, 190, 190, 190, 189, 189, 189,…
## $ FAC_VIV_AM <dbl> 255, 255, 255, 255, 255, 190, 190, 190, 190, 189, 189, 189,…
## $ DOMINIO <chr> "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U",…
## $ EST_DIS <chr> "003", "003", "003", "003", "003", "002", "002", "002", "00…
## $ UPM_DIS <chr> "00001", "00001", "00001", "00001", "00001", "00002", "0000…
glimpse(THogar)
## Rows: 92,143
## Columns: 18
## $ ID_VIV <chr> "0100003.01", "0100003.02", "0100003.03", "0100003.04", "01…
## $ ID_HOG <chr> "0100003.01.01", "0100003.02.01", "0100003.03.01", "0100003…
## $ UPM <chr> "0100003", "0100003", "0100003", "0100003", "0100003", "010…
## $ VIV_SEL <chr> "01", "02", "03", "04", "05", "01", "02", "03", "04", "01",…
## $ HOGAR <chr> "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",…
## $ RESUL_H <chr> "B", "A", "A", "B", "A", "B", "A", "B", "A", "B", "B", "B",…
## $ N_INF <chr> "02", "01", "01", "01", "03", "02", "01", "02", "01", "01",…
## $ R_SEL <chr> "02", "01", "01", "01", "03", "01", "02", "02", "02", "02",…
## $ CVE_ENT <chr> "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",…
## $ NOM_ENT <chr> "Aguascalientes", "Aguascalientes", "Aguascalientes", "Agua…
## $ CVE_MUN <chr> "001", "001", "001", "001", "001", "001", "001", "001", "00…
## $ NOM_MUN <chr> "Aguascalientes", "Aguascalientes", "Aguascalientes", "Agua…
## $ TOT_PER <chr> "03", "01", "01", "05", "03", "02", "03", "02", "03", "02",…
## $ FAC_HOG <dbl> 255, 255, 255, 255, 255, 190, 190, 190, 190, 189, 189, 189,…
## $ FAC_HOG_AM <dbl> 255, 255, 255, 255, 255, 190, 190, 190, 190, 189, 189, 189,…
## $ DOMINIO <chr> "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U",…
## $ EST_DIS <chr> "003", "003", "003", "003", "003", "002", "002", "002", "00…
## $ UPM_DIS <chr> "00001", "00001", "00001", "00001", "00001", "00002", "0000…
Alt text
glimpse(TSDem)
## Rows: 318,419
## Columns: 26
## $ ID_VIV <chr> "2108305.03", "2108305.03", "2108305.03", "2108305.03", "21…
## $ ID_HOG <chr> "2108305.03.01", "2108305.03.01", "2108305.03.01", "2108305…
## $ ID_PER <chr> "2108305.03.01.01", "2108305.03.01.02", "2108305.03.01.03",…
## $ UPM <chr> "2108305", "2108305", "2108305", "2108305", "2101679", "210…
## $ VIV_SEL <chr> "03", "03", "03", "03", "01", "01", "01", "01", "01", "02",…
## $ HOGAR <chr> "01", "01", "01", "01", "01", "01", "01", "01", "01", "02",…
## $ RESUL_H <chr> "B", "B", "B", "B", "B", "B", "B", "B", "B", "B", "A", "A",…
## $ N_REN <chr> "01", "02", "03", "04", "01", "02", "03", "04", "05", "04",…
## $ PAREN <chr> "1", "4", "5", "5", "1", "3", "5", "5", "5", "3", "1", "3",…
## $ SEXO <chr> "2", "2", "1", "1", "2", "1", "2", "2", "1", "2", "2", "2",…
## $ EDAD <chr> "32", "57", "20", "29", "57", "30", "30", "07", "01", "17",…
## $ CODIGO <chr> "2", "1", "2", "2", "1", "2", "2", NA, NA, NA, "1", "2", "2…
## $ NIV <chr> "08", "06", "03", "02", "04", "08", "08", "02", NA, "06", "…
## $ GRA <chr> "2", "3", "3", "6", "3", "5", "5", "1", NA, "2", "3", "3", …
## $ CVE_ENT <chr> "21", "21", "21", "21", "21", "21", "21", "21", "21", "21",…
## $ NOM_ENT <chr> "Puebla", "Puebla", "Puebla", "Puebla", "Puebla", "Puebla",…
## $ CVE_MUN <chr> "114", "114", "114", "114", "114", "114", "114", "114", "11…
## $ NOM_MUN <chr> "Puebla", "Puebla", "Puebla", "Puebla", "Puebla", "Puebla",…
## $ AP3_8 <chr> "1", "5", "1", "7", "5", "1", "8", NA, NA, NA, "1", "4", "5…
## $ AP3_9 <chr> NA, "4", NA, NA, "4", NA, "4", NA, NA, NA, NA, "4", "4", "4…
## $ AP3_10 <chr> "2", NA, "2", NA, NA, "2", NA, NA, NA, NA, "3", NA, NA, NA,…
## $ FAC_HOG <dbl> 599, 599, 599, 599, 534, 534, 534, 534, 534, 326, 557, 326,…
## $ FAC_HOG_AM <dbl> 599, 599, 599, 599, 534, 534, 534, 534, 534, 326, 557, 326,…
## $ DOMINIO <chr> "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U",…
## $ EST_DIS <chr> "369", "369", "369", "369", "369", "369", "369", "369", "36…
## $ UPM_DIS <chr> "08883", "08883", "08883", "08883", "08597", "08597", "0859…
glimpse(TPer_Vic1)
## Rows: 92,051
## Columns: 180
## $ ID_VIV <chr> "1904750.04", "1910402.03", "1904508.02", "1910402.01", "19…
## $ ID_HOG <chr> "1904750.04.01", "1910402.03.01", "1904508.02.01", "1910402…
## $ ID_PER <chr> "1904750.04.01.01", "1910402.03.01.02", "1904508.02.01.02",…
## $ UPM <chr> "1904750", "1910402", "1904508", "1910402", "1910402", "190…
## $ VIV_SEL <chr> "04", "03", "02", "01", "02", "05", "05", "16", "19", "03",…
## $ HOGAR <chr> "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",…
## $ RESUL_H <chr> "A", "B", "A", "A", "B", "B", "B", "B", "B", "B", "B", "A",…
## $ R_SEL <chr> "01", "02", "02", "02", "01", "01", "01", "04", "01", "01",…
## $ SEXO <chr> "2", "2", "1", "1", "2", "1", "1", "2", "1", "1", "1", "2",…
## $ EDAD <chr> "33", "36", "18", "47", "62", "44", "50", "19", "45", "57",…
## $ AREAM <chr> "03", "03", "03", "03", "03", "03", "03", NA, NA, "03", "03…
## $ CVE_ENT <chr> "19", "19", "19", "19", "19", "19", "19", "19", "19", "19",…
## $ NOM_ENT <chr> "Nuevo León", "Nuevo León", "Nuevo León", "Nuevo León", "Nu…
## $ CVE_MUN <chr> "031", "031", "031", "031", "031", "031", "031", "031", "03…
## $ NOM_MUN <chr> "Juárez", "Juárez", "Juárez", "Juárez", "Juárez", "Juárez",…
## $ AP4_1 <chr> "3", "3", "3", "3", "3", "3", "3", "3", "3", "3", "3", "3",…
## $ AP4_2_01 <chr> "0", "0", "1", "1", "0", "0", "1", "0", "0", "1", "0", "0",…
## $ AP4_2_02 <chr> "0", "0", "0", "1", "0", "0", "1", "1", "0", "1", "0", "1",…
## $ AP4_2_03 <chr> "1", "1", "0", "0", "1", "0", "0", "0", "0", "0", "0", "1",…
## $ AP4_2_04 <chr> "0", "0", "0", "0", "1", "0", "0", "0", "1", "0", "0", "0",…
## $ AP4_2_05 <chr> "1", "1", "1", "1", "1", "1", "0", "1", "0", "1", "0", "0",…
## $ AP4_2_06 <chr> "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_2_07 <chr> "0", "0", "0", "0", "0", "0", "0", "0", "1", "0", "1", "0",…
## $ AP4_2_08 <chr> "0", "0", "1", "0", "0", "0", "0", "0", "0", "0", "1", "0",…
## $ AP4_2_09 <chr> "0", "0", "0", "0", "0", "0", "0", "0", "1", "0", "0", "0",…
## $ AP4_2_10 <chr> "0", "0", "0", "0", "0", "1", "1", "1", "0", "0", "1", "1",…
## $ AP4_2_11 <chr> "1", "1", "0", "0", "0", "1", "0", "0", "0", "0", "0", "0",…
## $ AP4_2_12 <chr> "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_2_13 <chr> "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_2_99 <chr> "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_3_1 <chr> "2", "2", "1", "2", "2", "2", "2", "2", "1", "2", "2", "2",…
## $ AP4_3_2 <chr> "2", "2", "1", "2", "1", "2", "2", "2", "1", "2", "2", "2",…
## $ AP4_3_3 <chr> "2", "2", "2", "2", "2", "2", "2", "2", "1", "2", "2", "2",…
## $ AP4_4_01 <chr> "1", "2", "1", "1", "2", "2", "1", "2", "1", "1", "1", "2",…
## $ AP4_4_02 <chr> "1", "3", "3", "1", "3", "1", "3", "3", "1", "1", "1", "3",…
## $ AP4_4_03 <chr> "2", "2", "2", "2", "1", "2", "2", "2", "1", "2", "2", "2",…
## $ AP4_4_04 <chr> "1", "3", "1", "3", "3", "3", "3", "3", "1", "3", "3", "3",…
## $ AP4_4_05 <chr> "2", "2", "3", "3", "3", "3", "2", "2", "1", "1", "1", "2",…
## $ AP4_4_06 <chr> "1", "2", "1", "2", "3", "1", "2", "2", "1", "1", "1", "2",…
## $ AP4_4_07 <chr> "2", "2", "1", "2", "3", "1", "2", "2", "1", "2", "3", "1",…
## $ AP4_4_08 <chr> "2", "2", "2", "2", "3", "2", "2", "2", "1", "2", "3", "1",…
## $ AP4_4_09 <chr> "2", "3", "1", "3", "2", "3", "3", "2", "1", "3", "1", "2",…
## $ AP4_4_10 <chr> "1", "2", "1", "1", "3", "2", "1", "1", "1", "2", "2", "2",…
## $ AP4_4_11 <chr> "2", "2", "2", "1", "3", "2", "2", "2", "1", "2", "1", "3",…
## $ AP4_4_12 <chr> "1", "2", "1", "3", "3", "2", "3", "2", "1", "3", "1", "1",…
## $ AP4_4_A <chr> "4", "4", "4", "4", "3", "4", "2", "3", "3", "4", "3", "4",…
## $ AP4_5_01 <chr> "0", "1", "0", "0", "0", "1", "0", "0", "0", "1", "1", "0",…
## $ AP4_5_02 <chr> "1", "0", "0", "1", "1", "1", "0", "0", "0", "0", "1", "0",…
## $ AP4_5_03 <chr> "0", "0", "1", "0", "1", "0", "0", "0", "0", "0", "1", "0",…
## $ AP4_5_04 <chr> "0", "1", "0", "0", "0", "0", "0", "0", "0", "1", "0", "1",…
## $ AP4_5_05 <chr> "0", "1", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_5_06 <chr> "0", "1", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_5_07 <chr> "0", "0", "0", "0", "0", "1", "0", "0", "1", "1", "1", "1",…
## $ AP4_5_08 <chr> "1", "1", "0", "1", "0", "1", "0", "0", "0", "0", "1", "0",…
## $ AP4_5_09 <chr> "0", "1", "1", "1", "1", "1", "1", "0", "0", "1", "1", "0",…
## $ AP4_5_10 <chr> "1", "1", "0", "1", "1", "1", "0", "0", "0", "0", "1", "1",…
## $ AP4_5_11 <chr> "0", "0", "1", "1", "0", "1", "0", "0", "0", "0", "1", "1",…
## $ AP4_5_12 <chr> "0", "1", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_5_13 <chr> "0", "1", "0", "0", "1", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_5_14 <chr> "0", "1", "0", "1", "1", "1", "0", "0", "0", "0", "0", "0",…
## $ AP4_5_15 <chr> "0", "1", "0", "0", "1", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_5_16 <chr> "0", "1", "0", "0", "0", "0", "0", "1", "0", "0", "0", "0",…
## $ AP4_5_17 <chr> "0", "1", "0", "0", "0", "1", "0", "0", "0", "1", "1", "1",…
## $ AP4_5_18 <chr> "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_5_99 <chr> "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0", "0",…
## $ AP4_6_1 <chr> "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1", "1",…
## $ AP4_6_2 <chr> "1", "1", "1", "1", "1", "1", "2", "1", "2", "1", "1", "2",…
## $ AP4_6_3 <chr> "2", "1", "1", "1", "1", "1", "2", "1", "2", "1", "2", "1",…
## $ AP4_7_1 <chr> "3", "4", "2", "3", "4", "4", "4", "3", "1", "4", "1", "1",…
## $ AP4_7_2 <chr> "3", "4", "1", "4", "4", "1", "4", "3", "1", "4", "1", "3",…
## $ AP4_7_3 <chr> "1", "4", "3", "4", "4", "1", "4", "3", "1", "4", "1", "3",…
## $ AP4_8_1 <chr> "1", "1", "2", "2", "2", "1", "2", "1", "1", "1", "1", "1",…
## $ AP4_9_1 <chr> "1", "1", NA, NA, NA, "1", NA, "2", "2", "1", "2", "2", NA,…
## $ AP4_8_2 <chr> "2", "1", "2", "2", "2", "2", "2", "1", "1", "2", "2", "2",…
## $ AP4_9_2 <chr> NA, "2", NA, NA, NA, NA, NA, "2", "2", NA, NA, NA, NA, NA, …
## $ AP4_8_3 <chr> "1", "1", "2", "1", "1", "1", "2", "1", "1", "1", "1", "1",…
## $ AP4_9_3 <chr> "1", "1", NA, "2", "2", "1", NA, "2", "2", "1", "2", "2", N…
## $ AP4_8_4 <chr> "1", "1", "2", "1", "2", "1", "2", "2", "2", "9", "2", "1",…
## $ AP4_9_4 <chr> "2", "1", NA, "1", NA, "2", NA, NA, NA, NA, NA, "2", "2", N…
## $ AP4_8_5 <chr> "1", "1", "1", "1", "1", "1", "1", "1", "2", "1", "1", "1",…
## $ AP4_9_5 <chr> "1", "2", "9", "2", "2", "1", "2", "2", NA, "1", "2", "1", …
## $ AP4_8_6 <chr> "1", "1", "2", "1", "1", "1", "2", "1", "2", "2", "2", "1",…
## $ AP4_9_6 <chr> "1", "2", NA, "9", "2", "2", NA, "2", NA, NA, NA, "2", "2",…
## $ AP4_10_01 <chr> "1", "1", "1", "1", "2", "1", "2", "1", "2", "1", "2", "1",…
## $ AP4_10_02 <chr> "1", "3", "3", "3", "3", "1", "3", "1", "1", "1", "1", "3",…
## $ AP4_10_03 <chr> "1", "1", "2", "1", "2", "1", "1", "1", "2", "1", "2", "2",…
## $ AP4_10_04 <chr> "2", "1", "1", "3", "3", "1", "2", "1", "2", "1", "3", "1",…
## $ AP4_10_05 <chr> "2", "1", "2", "3", "3", "3", "2", "1", "2", "2", "2", "2",…
## $ AP4_10_06 <chr> "2", "1", "2", "1", "3", "2", "2", "1", "2", "1", "2", "1",…
## $ AP4_10_07 <chr> "2", "3", "2", "3", "3", "3", "2", "3", "2", "3", "3", "3",…
## $ AP4_10_08 <chr> "2", "1", "2", "1", "3", "2", "2", "1", "2", "1", "3", "3",…
## $ AP4_10_09 <chr> "2", "1", "2", "1", "3", "1", "2", "1", "2", "1", "1", "1",…
## $ AP4_10_10 <chr> "3", "1", "3", "1", "3", "2", "2", "1", "3", "1", "3", "1",…
## $ AP4_10_11 <chr> "2", "1", "2", "2", "3", "2", "2", "1", "2", "1", "3", "1",…
## $ AP4_10_12 <chr> "3", "3", "3", "2", "3", "2", "2", "1", "2", "1", "3", "2",…
## $ AP4_10_13 <chr> "3", "3", "3", "3", "3", "3", "3", "1", "3", "1", "3", "3",…
## $ AP4_10_14 <chr> "2", "1", "2", "3", "3", "2", "2", "1", "2", "1", "2", "2",…
## $ AP4_10_15 <chr> "2", "1", "2", "1", "3", "2", "2", "1", "3", "1", "3", "2",…
## $ AP4_10_16 <chr> "2", "2", "2", "2", "2", "2", "2", "1", "2", "1", "2", "2",…
## $ AP4_11_01 <chr> "1", "2", "2", "1", "2", "2", "2", "1", "2", "2", "2", "2",…
## $ AP4_11_02 <chr> "1", "2", "2", "1", "2", "2", "2", "1", "2", "2", "2", "2",…
## $ AP4_11_03 <chr> "2", "2", "2", "2", "2", "2", "2", "1", "2", "2", "2", "2",…
## $ AP4_11_04 <chr> "2", "2", "2", "2", "2", "1", "2", "2", "2", "2", "2", "2",…
## $ AP4_11_05 <chr> "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2",…
## $ AP4_11_06 <chr> "1", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2",…
## $ AP4_11_07 <chr> "2", "2", "2", "2", "2", "2", "2", "1", "2", "2", "2", "2",…
## $ AP4_11_08 <chr> "1", "1", "2", "2", "2", "2", "2", "1", "2", "2", "2", "1",…
## $ AP4_11_09 <chr> "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2",…
## $ AP4_11_10 <chr> "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2",…
## $ AP4_11_11 <chr> "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2",…
## $ AP4_12 <chr> "0000500", "0000000", NA, "0001500", NA, "0002000", NA, "00…
## $ AP5_1_01 <chr> "2", "3", "2", "2", "2", "1", "1", "2", "3", "1", "3", "3",…
## $ AP5_1_02 <chr> "2", "3", "2", "2", "2", "1", "1", "2", "1", "3", "3", "1",…
## $ AP5_1_03 <chr> "2", "3", "2", "2", "1", "2", "2", "2", "2", "3", "2", "2",…
## $ AP5_1_04 <chr> "2", "3", "2", "2", "2", "2", "2", "2", "2", "2", "1", "2",…
## $ AP5_1_05 <chr> "2", "3", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2",…
## $ AP5_1_06 <chr> "3", "3", "2", "3", "3", "3", "2", "2", "2", "1", "3", "3",…
## $ AP5_1_07 <chr> "3", "3", "2", "3", "3", "3", "2", "2", "2", "2", "3", "3",…
## $ AP5_1_08 <chr> "3", "3", "2", "3", "3", "3", "2", "2", "2", "2", "3", "3",…
## $ AP5_1_09 <chr> "3", "3", "2", "3", "3", "3", "2", "2", "2", "2", "2", "1",…
## $ AP5_1_10 <chr> "3", "3", "2", "3", "1", "3", "2", "2", "2", "2", "1", "3",…
## $ AP5_1_11 <chr> "3", "3", "2", "2", "2", "2", "2", "2", "2", "2", "3", "1",…
## $ AP5_1_12 <chr> "2", "3", "2", "2", "2", "2", "2", "2", "2", "2", "3", "1",…
## $ AP5_1_13 <chr> "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "3", "3",…
## $ AP5_2_1 <chr> "3", "4", "3", "3", "2", "1", "2", "3", "1", "2", "2", "3",…
## $ AP5_2_2 <chr> "5", "5", "1", "2", "5", "1", "5", "5", "1", "2", "5", "5",…
## $ AP5_2_3 <chr> "1", "1", "1", "1", "1", "1", "2", "3", "1", "1", "1", "1",…
## $ AP5_2_4 <chr> "3", "5", "1", "2", "5", "1", "2", "3", "1", "1", "2", "4",…
## $ AP5_3_01 <chr> "1", "1", "2", "1", "2", "1", "1", "1", "1", "1", "1", "1",…
## $ AP5_4_01 <chr> "3", "4", NA, "4", NA, "3", "3", "1", "2", "2", "3", "3", N…
## $ AP5_5_01 <chr> "1", "1", NA, "1", NA, "2", "1", "2", "9", "2", "1", "1", N…
## $ AP5_6_01 <chr> "3", "4", NA, "4", NA, "3", "2", "2", "2", "3", "3", "3", N…
## $ AP5_7_1 <chr> "2", "2", NA, "1", NA, "2", "2", "1", "1", "1", "2", "2", N…
## $ AP5_3_02 <chr> "1", "2", "2", "2", "2", "2", "2", "1", "1", "1", "1", "1",…
## $ AP5_4_02 <chr> "4", NA, NA, NA, NA, NA, NA, "1", "2", "2", "2", "2", NA, "…
## $ AP5_5_02 <chr> "1", NA, NA, NA, NA, NA, NA, "2", "2", "2", "2", "1", NA, "…
## $ AP5_6_02 <chr> "4", NA, NA, NA, NA, NA, NA, "1", "2", "2", "4", "2", NA, "…
## $ AP5_7_2 <chr> "2", NA, NA, NA, NA, NA, NA, "2", "1", "1", "1", "2", NA, "…
## $ AP5_3_03 <chr> "1", "2", "2", "1", "2", "1", "2", "2", "2", "1", "1", "1",…
## $ AP5_4_03 <chr> "9", NA, NA, "2", NA, "2", NA, NA, NA, "2", "2", "2", "2", …
## $ AP5_5_03 <chr> "9", NA, NA, "1", NA, "2", NA, NA, NA, "2", "2", "2", "1", …
## $ AP5_6_03 <chr> "3", NA, NA, "2", NA, "2", NA, NA, NA, "2", "2", "2", "4", …
## $ AP5_7_3 <chr> "2", NA, NA, "1", NA, "2", NA, NA, NA, "2", "1", "1", "1", …
## $ AP5_3_04 <chr> "1", "1", "2", "1", "2", "1", "2", "2", "2", "2", "1", "1",…
## $ AP5_4_04 <chr> "2", "4", NA, "2", NA, "3", NA, NA, NA, NA, "2", "2", "2", …
## $ AP5_5_04 <chr> "2", "1", NA, "1", NA, "2", NA, NA, NA, NA, "9", "1", "2", …
## $ AP5_6_04 <chr> "3", "4", NA, "2", NA, "4", NA, NA, NA, NA, "9", "2", "2", …
## $ AP5_3_05 <chr> "1", "1", "2", "1", "2", "1", "2", "2", "2", "2", "1", "1",…
## $ AP5_4_05 <chr> "3", "2", NA, "1", NA, "2", NA, NA, NA, NA, "1", "2", NA, "…
## $ AP5_5_05 <chr> "2", "1", NA, "2", NA, "2", NA, NA, NA, NA, "2", "2", NA, "…
## $ AP5_6_05 <chr> "2", "3", NA, "1", NA, "1", NA, NA, NA, NA, "1", "2", NA, "…
## $ AP5_3_06 <chr> "1", "1", "2", "2", "2", "1", "2", "2", "2", "2", "2", "2",…
## $ AP5_4_06 <chr> "2", "4", NA, NA, NA, "9", NA, NA, NA, NA, NA, NA, NA, NA, …
## $ AP5_5_06 <chr> "9", "1", NA, NA, NA, "9", NA, NA, NA, NA, NA, NA, NA, NA, …
## $ AP5_6_06 <chr> "2", "4", NA, NA, NA, "9", NA, NA, NA, NA, NA, NA, NA, NA, …
## $ AP5_3_07 <chr> "2", "2", "2", "2", "2", "1", "2", "2", "2", "2", "2", "2",…
## $ AP5_4_07 <chr> NA, NA, NA, NA, NA, "2", NA, NA, NA, NA, NA, NA, NA, NA, NA…
## $ AP5_5_07 <chr> NA, NA, NA, NA, NA, "2", NA, NA, NA, NA, NA, NA, NA, NA, NA…
## $ AP5_6_07 <chr> NA, NA, NA, NA, NA, "3", NA, NA, NA, NA, NA, NA, NA, NA, NA…
## $ AP5_3_08 <chr> "1", "1", "2", "1", "2", "1", "2", "1", "1", "1", "1", "1",…
## $ AP5_4_08 <chr> "2", "2", NA, "1", NA, "1", NA, "1", "1", "2", "1", "2", "2…
## $ AP5_5_08 <chr> "2", "1", NA, "2", NA, "2", NA, "2", "2", "2", "2", "2", "2…
## $ AP5_6_08 <chr> "1", "2", NA, "1", NA, "2", NA, "1", "1", "2", "1", "2", "2…
## $ AP5_3_09 <chr> "1", "1", "2", "1", "2", "1", "2", "1", "1", "1", "1", "1",…
## $ AP5_4_09 <chr> "2", "2", NA, "1", NA, "1", NA, "2", "1", "2", "1", "1", NA…
## $ AP5_5_09 <chr> "2", "1", NA, "9", NA, "2", NA, "2", "2", "2", "2", "2", NA…
## $ AP5_6_09 <chr> "2", "3", NA, "2", NA, "2", NA, "1", "1", "2", "1", "2", NA…
## $ AP5_3_10 <chr> "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2", "2",…
## $ AP5_4_10 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ AP5_5_10 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ AP5_6_10 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ AP5_8 <chr> "4", "4", "1", "4", "9", "3", "4", "3", "1", "4", "4", "2",…
## $ FAC_HOG <dbl> 562, 841, 577, 841, 841, 577, 698, 471, 398, 1217, 554, 554…
## $ FAC_ELE <dbl> 1125, 1682, 1730, 1682, 841, 1153, 1397, 1884, 795, 3652, 2…
## $ FAC_HOG_AM <dbl> 562, 841, 577, 841, 841, 577, 698, NA, NA, 1217, 554, 554, …
## $ FAC_ELE_AM <dbl> 1125, 1682, 1730, 1682, 841, 1153, 1397, NA, NA, 3652, 2215…
## $ DOMINIO <chr> "U", "U", "U", "U", "U", "U", "U", "C", "C", "U", "U", "U",…
## $ ESTRATO <chr> "2", "2", "3", "2", "2", "3", "4", "2", "2", "2", "2", "2",…
## $ EST_DIS <chr> "333", "336", "334", "336", "336", "334", "335", "342", "34…
## $ UPM_DIS <chr> "07999", "08242", "07990", "08242", "08242", "07990", "0799…
Percepción de seguridad 2: Mismo número de observaciones, pero se pregunta sobre victimización
Módulo de victimización: Características de los delitos. Ahora la unidad de análisis es el delito y ya no la persona. Vean que es la más pequeña: n= 37, 156
glimpse(TMod_Vic)
## Rows: 37,156
## Columns: 129
## $ ID_VIV <chr> "0206374.01", "0208069.18", "0208098.11", "0204439.03", "02…
## $ ID_HOG <chr> "0206374.01.01", "0208069.18.01", "0208098.11.01", "0204439…
## $ ID_PER <chr> "0206374.01.01.02", "0208069.18.01.02", "0208098.11.01.01",…
## $ ID_DEL <chr> "0206374.01.01.02.07.1", "0208069.18.01.02.08.1", "0208098.…
## $ UPM <chr> "0206374", "0208069", "0208098", "0204439", "0208189", "020…
## $ VIV_SEL <chr> "01", "18", "11", "03", "03", "04", "01", "05", "01", "02",…
## $ HOGAR <chr> "01", "01", "01", "01", "01", "01", "01", "01", "01", "01",…
## $ ND_TIPO <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ TD_TIPO <dbl> 2, 1, 1, 1, 1, 3, 1, 1, 1, 1, 1, 3, 1, 1, 1, 1, 1, 1, 2, 1,…
## $ BPCOD <chr> "07", "08", "01", "01", "09", "03", "10", "05", "05", "07",…
## $ R_SEL <chr> "02", "02", "01", "08", "01", "01", "02", "01", "02", "01",…
## $ RESUL_H <chr> "A", "A", "A", "A", "A", "A", "A", "A", "A", "A", "A", "A",…
## $ SEXO <chr> "2", "2", "1", "1", "2", "1", "2", "1", "2", "1", "1", "1",…
## $ EDAD <chr> "43", "29", "43", "30", "32", "45", "33", "23", "30", "48",…
## $ AREAM_OCU <chr> "21", "21", "21", "21", "21", "21", "21", "21", "21", "21",…
## $ BP1_1 <chr> "02", "11", "02", "02", "05", "06", "03", "03", "08", "07",…
## $ BP1_2C <chr> "02", "02", "02", "02", "02", "02", "02", "02", "02", "02",…
## $ BP1_3C <chr> "004", "004", "004", "004", "004", "004", "004", "004", "00…
## $ BP1_4 <chr> "2", "2", "2", "3", "2", "3", "3", "2", "2", "2", "4", "3",…
## $ BP1_5 <chr> "2", "4", "1", "1", "2", "2", "2", "1", "1", "1", "1", "2",…
## $ BP1_6 <chr> NA, NA, "2", "2", "2", NA, "1", "1", "1", NA, NA, NA, "1", …
## $ BP1_7 <chr> NA, NA, NA, NA, NA, NA, "1", "1", "1", NA, NA, NA, "1", "1"…
## $ BP1_8 <chr> NA, NA, NA, NA, NA, NA, "1", "1", "1", NA, NA, NA, "2", "2"…
## $ BP1_9 <chr> NA, NA, NA, NA, NA, NA, "1", "2", "1", NA, NA, NA, "1", "2"…
## $ BP1_10_1 <chr> NA, NA, NA, NA, NA, NA, "0", "1", "1", NA, NA, NA, "1", "1"…
## $ BP1_10_2 <chr> NA, NA, NA, NA, NA, NA, "1", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_10_9 <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_11 <chr> NA, NA, NA, NA, NA, NA, "4", "5", "5", NA, NA, NA, "4", "4"…
## $ BP1_12_1 <chr> NA, NA, NA, NA, NA, NA, "0", "1", "1", NA, NA, NA, "1", "1"…
## $ BP1_12_2 <chr> NA, NA, NA, NA, NA, NA, "1", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_12_3 <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_12_4 <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_12_5 <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_12_9 <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_13 <chr> NA, NA, NA, NA, NA, NA, NA, "1", "2", NA, NA, NA, "1", "1",…
## $ BP1_14_1 <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "1", "0"…
## $ BP1_14_2 <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_14_3 <chr> NA, NA, NA, NA, NA, NA, "0", "0", "0", NA, NA, NA, "0", "0"…
## $ BP1_14_4 <chr> NA, NA, NA, NA, NA, NA, "1", "1", "0", NA, NA, NA, "0", "0"…
## $ BP1_14_9 <chr> NA, NA, NA, NA, NA, NA, "0", "0", "1", NA, NA, NA, "0", "1"…
## $ BP1_15 <chr> NA, NA, NA, NA, NA, NA, "2", "2", "1", NA, NA, NA, "1", "1"…
## $ BP1_16_1 <chr> NA, NA, NA, NA, NA, NA, NA, NA, "0", NA, NA, NA, "1", "1", …
## $ BP1_16_2 <chr> NA, NA, NA, NA, NA, NA, NA, NA, "1", NA, NA, NA, "0", "0", …
## $ BP1_16_3 <chr> NA, NA, NA, NA, NA, NA, NA, NA, "0", NA, NA, NA, "0", "0", …
## $ BP1_16_4 <chr> NA, NA, NA, NA, NA, NA, NA, NA, "0", NA, NA, NA, "0", "0", …
## $ BP1_16_9 <chr> NA, NA, NA, NA, NA, NA, NA, NA, "0", NA, NA, NA, "0", "0", …
## $ BP1_17 <chr> NA, NA, NA, NA, NA, NA, NA, NA, "2", NA, NA, NA, "2", "2", …
## $ BP1_18 <chr> NA, NA, NA, NA, NA, NA, "2", "2", "2", NA, NA, NA, "2", "2"…
## $ BP1_19_1 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_19_2 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_19_3 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_19_4 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_19_5 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_19_6 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_19_7 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_19_8 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_20 <chr> "2", "2", "1", "2", "2", "2", "1", "2", "2", "2", "2", "2",…
## $ BP1_21 <chr> NA, NA, NA, "2", NA, "2", NA, NA, NA, NA, "2", "2", NA, NA,…
## $ BP1_22 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP1_23 <chr> "04", "06", NA, "09", "04", "06", NA, "06", "01", "03", "04…
## $ BP1_24 <chr> NA, NA, "2", NA, NA, NA, "1", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_25 <chr> NA, NA, NA, NA, NA, NA, "7", NA, NA, NA, NA, NA, NA, NA, NA…
## $ BP1_26 <chr> NA, NA, "2", NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA…
## $ BP1_27 <chr> NA, NA, "3", NA, NA, NA, "2", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_28 <chr> NA, NA, "2", NA, NA, NA, "6", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_29 <chr> NA, NA, "2", NA, NA, NA, "2", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_30 <chr> "2", "2", "2", "1", "2", "2", "1", "2", "2", "2", "2", "2",…
## $ BP1_31_01 <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_02 <chr> NA, NA, NA, "1", NA, NA, "1", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_03 <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_04 <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_05 <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_06 <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_07 <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_08 <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_31_99 <chr> NA, NA, NA, "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, N…
## $ BP1_32_1 <chr> NA, NA, "0", "1", NA, NA, "1", NA, NA, NA, NA, NA, NA, NA, …
## $ BP1_32_2 <chr> NA, NA, "0", "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, …
## $ BP1_32_3 <chr> NA, NA, "0", "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, …
## $ BP1_32_4 <chr> NA, NA, "0", "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, …
## $ BP1_32_5 <chr> NA, NA, "0", "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, …
## $ BP1_32_9 <chr> NA, NA, "1", "0", NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, …
## $ BP1_33 <chr> "1", "1", "5", "3", "3", "1", "4", "1", "1", "1", "1", "1",…
## $ BP1_34 <chr> "0006000", "0005000", NA, "0001500", "0000000", "0002000", …
## $ BP1_35 <chr> "0000000", "0000000", NA, "0000000", "0000000", "0000000", …
## $ BP1_36_01 <chr> NA, NA, "1", NA, "1", NA, "0", "0", "1", "0", "0", NA, "0",…
## $ BP1_36_02 <chr> NA, NA, "0", NA, "1", NA, "1", "0", "1", "0", "0", NA, "0",…
## $ BP1_36_03 <chr> NA, NA, "0", NA, "1", NA, "1", "0", "1", "1", "1", NA, "0",…
## $ BP1_36_04 <chr> NA, NA, "0", NA, "1", NA, "1", "0", "1", "0", "1", NA, "0",…
## $ BP1_36_05 <chr> NA, NA, "0", NA, "0", NA, "0", "0", "0", "0", "0", NA, "0",…
## $ BP1_36_06 <chr> NA, NA, "0", NA, "0", NA, "0", "0", "1", "0", "0", NA, "0",…
## $ BP1_36_07 <chr> NA, NA, "0", NA, "0", NA, "0", "0", "0", "0", "1", NA, "0",…
## $ BP1_36_08 <chr> NA, NA, "1", NA, "0", NA, "0", "1", "1", "1", "1", NA, "1",…
## $ BP1_36_09 <chr> NA, NA, "0", NA, "0", NA, "1", "0", "1", "0", "1", NA, "1",…
## $ BP1_36_10 <chr> NA, NA, "0", NA, "0", NA, "0", "0", "0", "0", "0", NA, "0",…
## $ BP1_36_11 <chr> NA, NA, "0", NA, "0", NA, "0", "0", "0", "0", "0", NA, "0",…
## $ BP1_36_99 <chr> NA, NA, "0", NA, "0", NA, "0", "0", "0", "0", "0", NA, "0",…
## $ BP2_1 <chr> NA, NA, "2", "1", NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, N…
## $ BP3_1_01 <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_02 <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_03 <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_04 <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_05 <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_06 <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_07 <dbl> NA, NA, NA, NA, NA, NA, NA, 1, 1, NA, NA, NA, 1, 0, NA, NA,…
## $ BP3_1_08 <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_09 <dbl> NA, NA, NA, NA, NA, NA, NA, 1, 1, NA, NA, NA, 1, 1, NA, NA,…
## $ BP3_1_10 <dbl> NA, NA, NA, NA, NA, NA, NA, 0, 0, NA, NA, NA, 0, 0, NA, NA,…
## $ BP3_1_11 <chr> NA, NA, NA, NA, NA, NA, NA, "0", "0", NA, NA, NA, "0", "0",…
## $ BP3_1_12 <chr> NA, NA, NA, NA, NA, NA, NA, "0", "0", NA, NA, NA, "0", "0",…
## $ BP3_1_99 <chr> NA, NA, NA, NA, NA, NA, NA, "0", "0", NA, NA, NA, "0", "0",…
## $ BP3_2 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP4_1 <chr> "4", "1", NA, NA, NA, NA, NA, NA, NA, "4", NA, NA, NA, NA, …
## $ BP5_1 <chr> NA, NA, NA, NA, "1", NA, NA, NA, NA, NA, NA, NA, NA, NA, "1…
## $ BP5_2_1 <chr> NA, NA, NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, NA, NA, "1…
## $ BP5_2_2 <chr> NA, NA, NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, NA, NA, "0…
## $ BP5_2_3 <chr> NA, NA, NA, NA, "1", NA, NA, NA, NA, NA, NA, NA, NA, NA, "0…
## $ BP5_2_4 <chr> NA, NA, NA, NA, "0", NA, NA, NA, NA, NA, NA, NA, NA, NA, "0…
## $ BP5_3 <chr> NA, NA, NA, NA, "3", NA, NA, NA, NA, NA, NA, NA, NA, NA, "3…
## $ BP6_1 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP6_2 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP6_3 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ BP7_1 <chr> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
## $ FAC_DEL <dbl> 1043, 1078, 377, 345, 542, 404, 948, 1107, 693, 346, 351, 4…
## $ FAC_DEL_AM <dbl> 1043, 1078, 377, 345, 542, 404, 948, 1107, 693, 346, 351, 4…
## $ DOMINIO <chr> "U", "C", "C", "U", "U", "U", "U", "U", "U", "U", "U", "U",…
## $ ESTRATO <chr> "4", "2", "2", "3", "3", "3", "2", "2", "2", "3", "4", "3",…
## $ EST_DIS <chr> "015", "032", "031", "014", "014", "014", "013", "016", "01…
## $ UPM_DIS <chr> "00714", "00781", "00782", "00572", "00783", "00710", "0057…
Ya vimos que INEGI nos da varias BDs porque está midiendo a varios niveles de análisis. Ahora el reto es combinarlas para tener junta toda la información que necesitamos.
Imaginemos que queremos saber si las personas que han sido víctimas de delito reportan más miedo al crimen que quienes no han sido víctimas.
El problema es que debemos unir dos bases de datos para hacer esta comparación: TPer_vic1 y TPer_vic2.
Esta es la primera pregunta que queremos usar:
Alt text
Y esta es la segunda con la que la quiero cruzar:
Alt text
Tenemos que unir las dos BDs.
Vamos a revisar el diagrama que nos sirve como mapa:
Alt text
Lo que nos dice este diagrama es que necesitamos una llave que sea única y común en ambas BDs. La llave es un identificador único para que R no le asigne la información de Juan a los datos de Pedro. Queremos que quede Juan con Juan.
Afortunadamente INEGI nos provee de llaves, que nombra con el prefijo ID.
Lo primero que necesitamos hacer es preguntarnos por el nivel al que están las variables que buscamos. Si queremos unir la BD de vivienda con la de hogar, usaríamos el ID_VIV porque es el único que coincide en ambas. Por lo general se usa el ID del nivel más alto.
En nuestro caso queremos unir dos BDs a nivel persona. Y para ello usaremos la variable llamada: ID_PER
head(TPer_Vic1)
Noten cómo ID_PER es la unión, separada por un punto, de UPM + VIV_SEL + Hogar + R_sel
Y lo que es crucial, es que son Identificadores únicos. Noten cómo deben coincidir el número de filas con la columna de valores únicos (n_unique).
library(skimr)
TPer_Vic1 %>%
select(ID_PER) %>%
skim()
| Name | Piped data |
| Number of rows | 92051 |
| Number of columns | 1 |
| _______________________ | |
| Column type frequency: | |
| character | 1 |
| ________________________ | |
| Group variables | None |
Variable type: character
| skim_variable | n_missing | complete_rate | min | max | empty | n_unique | whitespace |
|---|---|---|---|---|---|---|---|
| ID_PER | 0 | 1 | 16 | 16 | 0 | 92051 | 0 |
Corroboramos con la otra y vemos que coincide.
TPer_Vic2 %>%
select(ID_PER) %>%
skim()
| Name | Piped data |
| Number of rows | 92051 |
| Number of columns | 1 |
| _______________________ | |
| Column type frequency: | |
| character | 1 |
| ________________________ | |
| Group variables | None |
Variable type: character
| skim_variable | n_missing | complete_rate | min | max | empty | n_unique | whitespace |
|---|---|---|---|---|---|---|---|
| ID_PER | 0 | 1 | 16 | 16 | 0 | 92051 | 0 |
Ahora sí ya las podemos unir. Este comando proviene de la serie de funciones diseñadas para bases de datos relacionales y creo que aquí hay una buena explicación; capítulo 13
tpervic_unido <- TPer_Vic1 %>%
left_join(TPer_Vic2, by= "ID_PER")
Veamos la estructura del comando:
Tal vez se pregunten qué es eso del “left_join”. Es una manera de indicar cuál es la base de datos que usamos como referencia para hacer la unión. Importa, principalmente, por los datos faltantes.
Y para entenderlo mejor veamos el esquema de propio Wickham.
Alt text
Ahora seguimos trabajando con el nuevo objeto. Vean en el entorno que tenemos las mismas observaciones, pero ahora 328 variables.
Limpiemos primero la de miedo en la colonia
library(janitor)
table(tpervic_unido$AP4_3_1) # Ese 9 es NA
##
## 1 2 9
## 56316 35440 295
class(tpervic_unido$AP4_3_1) # Es character y eso no es lo que quiero
## [1] "character"
tpervic_unido <- tpervic_unido %>%
mutate(seg_col = case_when(
AP4_3_1== 1 ~ "seguro",
AP4_3_1== 2 ~ "inseguro",
AP4_3_1== 9 ~ NA_character_)) # Primero nos encargamos de los NA
table(tpervic_unido$seg_col, useNA = "ifany") # Nos los quitamos de encima
##
## inseguro seguro <NA>
## 35440 56316 295
tpervic_unido <- tpervic_unido %>%
mutate(seg_col1 = ordered(seg_col, levels = c("seguro", "inseguro"), labels= c("seguro", "inseguro"))) # Ahora etiquetas y nivel ordinal
table(tpervic_unido$seg_col1)
##
## seguro inseguro
## 56316 35440
tpervic_unido %>%
tabyl(seg_col1) %>%
adorn_totals("row") %>%
adorn_pct_formatting()
Aquí un breve tutorial de cómo formatear tablas usando tabyl
Ahora victimización
table(tpervic_unido$AP6_3) # mismo problema
##
## 1 2 9
## 11575 80453 23
class(tpervic_unido$AP6_3)
## [1] "character"
tpervic_unido <- tpervic_unido %>%
mutate(vic = case_when(
AP6_3== 1 ~ "Sí",
AP6_3== 2 ~ "No",
AP6_3== 3 ~ NA_character_))
table(tpervic_unido$vic, useNA = "ifany")
##
## No Sí <NA>
## 80453 11575 23
tpervic_unido <- tpervic_unido %>%
mutate(vic1 = ordered(vic, levels = c("Sí", "No"), labels= c("Victima", "No-Vic")))
tpervic_unido %>%
tabyl(vic1) %>%
adorn_totals("row") %>%
adorn_pct_formatting()
Finalmente podemos responder a la pregunta: ¿Quienes fueron víctimas de un delito reportan más miedo en la colonia que quien no fue víctima?
tpervic_unido %>%
tabyl(vic1, seg_col1, show_na = FALSE) %>%
adorn_totals(c("row", "col")) %>%
adorn_percentages("row") %>%
adorn_pct_formatting(rounding = "half up", digits = 0) %>%
adorn_ns() %>%
adorn_title("combined")
Vamos a construir nuestra gráfica
tabla1 <- prop.table(table(tpervic_unido$vic, tpervic_unido$seg_col1), margin = 1)*100
tabla1 # primero la info que quiero. Cambien el margin a 2 para ver qué pasa
##
## seguro inseguro
## No 63.32244 36.67756
## Sí 47.85207 52.14793
tabla2 <- as_tibble(tabla1, .name_repair = "unique")
## New names:
## * `` -> ...1
## * `` -> ...2
tabla2 # feos nombres
tabla3 <- tabla2 %>%
rename(victima="...1",
miedo="...2",
porcentaje= "n")
tabla4 <- tabla3 %>%
mutate(miedo = ordered(miedo, levels = c("seguro", "inseguro"), labels= c("seguro", "inseguro"))) %>%
mutate(victima= ordered(victima, levels = c("No","Sí"), labels= c("No-Victima", "Victima"))) %>% mutate(porcentaje= round(porcentaje, 1))
tabla4 # ahora sí lista para ggplot
Y ahora sí la gráfica
g1 <- tabla4 %>%
ggplot(aes(x= victima, y= porcentaje, group= miedo, fill= miedo))+
geom_bar(position="dodge", stat="identity")+
geom_text(aes(label= paste0(porcentaje,"%")), position= position_dodge(width = .8), vjust = 1.5, hjust= .8)+
scale_fill_brewer(palette="Set2")+
labs(
x= "¿Considera que vivir en su colonia es...?",
y= "",
title= "Comparación de miedo en colonia por victimización en México",
subtitle= "",
caption= "Fuente: INEGI/ ENVIPE 2021 ") +
theme_classic()
g2 <- g1 + theme(legend.position="bottom", legend.title = element_blank())
g2
Noten un detalle importante… Nosotros estamos estimando que el % de personas que se siente inseguro es de 38.6%
tabyl(tpervic_unido$seg_col1, show_na = FALSE) %>%
adorn_pct_formatting()
Pero… El INEGI reporta esto en su presentación oficial
Alt text
¿Por cuanto nos está fallando?
La explicación, por sorpresivo que parezca, está en el esquema de muestreo. ¿Recuerdan que vimos esto?
Primero noten que la cobertura geográfica es nacional, urbano, rural, entidad y área metro. Es a estos niveles donde la muestra es representativa y por tanto es a este nivel donde podemos generalizar a la población.
Ahora recordemos unas parte clave de la selección de muestra:
Probabilístico: es una selección aleatoria
Estratificado: Nos dice dónde aleatoriza. Primero toman las Unidades Primarias de Muestreo (UPM) y las separan en los niveles de la cobertura geográfica. Por ejemplo, toman primero las UPM de la CDMX. Luego las separan en urbano y rural. Luego las separan en zonas metro de interés. Y en ese “estrato” realizan la aleatorización.
Conglomerados: Hay una sobremuestra para poder hacer comparaciones entre grupos pequeños (por ejemplo: víctimas/ no-victimas)
Alt text
Todo ello viene a cuento porque cuando nosotros sacamos la proporción de personas con miedo en la colonia, R está asumiendo un muestreo simple. Debemos decirle que es un muestreo estratificado
Y no sólo eso. El diseño muestral del INEGI es lo que se conoce como un diseño complejo justo por como hace la muestra. Aquí un buen libro de quien hizo los paquetes para R, ahí pueden explorar a mayor detalle este tema; libro de Lumley. El punto de los factores de expansión es aproximar de manera más explícita la generalización. Por ejemplo, imaginen tenemos una población de 2,000 personas y recolectamos una muestra aleatoria de 100 personas. Nosotros vamos a preguntarles cuántos de ellos tienen miedo en su colonia: 60 dicen que no, 40 dicen que sí. Nosotros queremos decir que el 40% de la población tiene miedo. Ese brinco de muestra a población es la generalización.
Ahora bien, lo que hacen los factores de expansión es ampliar esa lógica. Otra manera de ponerlo es que la respuesta de cada una de esas personas vale por 20 personas (100*20= 2,000).La genialidad está en que el diseño complejo nos dice que no todas las respuestas valen lo mismo. Según sus características sociodemográficas, lo que me diga una persona, equivale a 14 respuestas; y lo que me diga otra, equivale a 25 respuestas. En otras palabras, necesitamos hacer una media ponderada según cuanto valga la respuesta de cada persona.
¿Por qué unos valen más que otros? Hay personas con características sociodemográficas más comunes y por eso son más fáciles de encontrar (mujer de 45 años en zona urbana sin victimización), así es que el INEGI les da una ponderación baja (Factor de expansión= 14 respuestas). Pero hay otras menos comunes, más difíciles de que salgan en mi muestra (mujer de 90 años en zona rural con victimización),y por ello el INEGI da una ponderación alta (Factor de expansión= 25 respuestas).
Vamos a ver cómo se implementa esto con ENVIPE. empecemos por reducir la bd
colnames(TPer_Vic1)
## [1] "ID_VIV" "ID_HOG" "ID_PER" "UPM" "VIV_SEL"
## [6] "HOGAR" "RESUL_H" "R_SEL" "SEXO" "EDAD"
## [11] "AREAM" "CVE_ENT" "NOM_ENT" "CVE_MUN" "NOM_MUN"
## [16] "AP4_1" "AP4_2_01" "AP4_2_02" "AP4_2_03" "AP4_2_04"
## [21] "AP4_2_05" "AP4_2_06" "AP4_2_07" "AP4_2_08" "AP4_2_09"
## [26] "AP4_2_10" "AP4_2_11" "AP4_2_12" "AP4_2_13" "AP4_2_99"
## [31] "AP4_3_1" "AP4_3_2" "AP4_3_3" "AP4_4_01" "AP4_4_02"
## [36] "AP4_4_03" "AP4_4_04" "AP4_4_05" "AP4_4_06" "AP4_4_07"
## [41] "AP4_4_08" "AP4_4_09" "AP4_4_10" "AP4_4_11" "AP4_4_12"
## [46] "AP4_4_A" "AP4_5_01" "AP4_5_02" "AP4_5_03" "AP4_5_04"
## [51] "AP4_5_05" "AP4_5_06" "AP4_5_07" "AP4_5_08" "AP4_5_09"
## [56] "AP4_5_10" "AP4_5_11" "AP4_5_12" "AP4_5_13" "AP4_5_14"
## [61] "AP4_5_15" "AP4_5_16" "AP4_5_17" "AP4_5_18" "AP4_5_99"
## [66] "AP4_6_1" "AP4_6_2" "AP4_6_3" "AP4_7_1" "AP4_7_2"
## [71] "AP4_7_3" "AP4_8_1" "AP4_9_1" "AP4_8_2" "AP4_9_2"
## [76] "AP4_8_3" "AP4_9_3" "AP4_8_4" "AP4_9_4" "AP4_8_5"
## [81] "AP4_9_5" "AP4_8_6" "AP4_9_6" "AP4_10_01" "AP4_10_02"
## [86] "AP4_10_03" "AP4_10_04" "AP4_10_05" "AP4_10_06" "AP4_10_07"
## [91] "AP4_10_08" "AP4_10_09" "AP4_10_10" "AP4_10_11" "AP4_10_12"
## [96] "AP4_10_13" "AP4_10_14" "AP4_10_15" "AP4_10_16" "AP4_11_01"
## [101] "AP4_11_02" "AP4_11_03" "AP4_11_04" "AP4_11_05" "AP4_11_06"
## [106] "AP4_11_07" "AP4_11_08" "AP4_11_09" "AP4_11_10" "AP4_11_11"
## [111] "AP4_12" "AP5_1_01" "AP5_1_02" "AP5_1_03" "AP5_1_04"
## [116] "AP5_1_05" "AP5_1_06" "AP5_1_07" "AP5_1_08" "AP5_1_09"
## [121] "AP5_1_10" "AP5_1_11" "AP5_1_12" "AP5_1_13" "AP5_2_1"
## [126] "AP5_2_2" "AP5_2_3" "AP5_2_4" "AP5_3_01" "AP5_4_01"
## [131] "AP5_5_01" "AP5_6_01" "AP5_7_1" "AP5_3_02" "AP5_4_02"
## [136] "AP5_5_02" "AP5_6_02" "AP5_7_2" "AP5_3_03" "AP5_4_03"
## [141] "AP5_5_03" "AP5_6_03" "AP5_7_3" "AP5_3_04" "AP5_4_04"
## [146] "AP5_5_04" "AP5_6_04" "AP5_3_05" "AP5_4_05" "AP5_5_05"
## [151] "AP5_6_05" "AP5_3_06" "AP5_4_06" "AP5_5_06" "AP5_6_06"
## [156] "AP5_3_07" "AP5_4_07" "AP5_5_07" "AP5_6_07" "AP5_3_08"
## [161] "AP5_4_08" "AP5_5_08" "AP5_6_08" "AP5_3_09" "AP5_4_09"
## [166] "AP5_5_09" "AP5_6_09" "AP5_3_10" "AP5_4_10" "AP5_5_10"
## [171] "AP5_6_10" "AP5_8" "FAC_HOG" "FAC_ELE" "FAC_HOG_AM"
## [176] "FAC_ELE_AM" "DOMINIO" "ESTRATO" "EST_DIS" "UPM_DIS"
vic <- TPer_Vic1 %>%
select("FAC_ELE", "EST_DIS", "UPM_DIS", "AP4_3_1", "SEXO")
vic
table(vic$SEXO)
##
## 1 2
## 42466 49585
vic <- vic %>%
mutate(mujer = case_when(
SEXO== 1 ~ "0",
SEXO== 2 ~ "1"))
vic <- vic %>%
mutate(mujer = ordered(mujer, levels = c("0", "1"), labels= c("varon", "mujer")))
table(vic$mujer)
##
## varon mujer
## 42466 49585
vic <- vic %>%
mutate(seg_col = case_when(
AP4_3_1== 1 ~ "0",
AP4_3_1== 2 ~ "1",
AP4_3_1== 9 ~ NA_character_))
vic <- vic %>%
mutate(seg_col1= as.numeric(seg_col))
Veamos la lógica de la expansión. Primero lo que dice la muestra
table(vic$seg_col1)
##
## 0 1
## 56316 35440
Y ahora expandido…
xtabs(FAC_ELE ~ seg_col, data= vic)
## seg_col
## 0 1
## 52189329 37871728
Pongamos comas para ver el tamaño de ese numero: 37, 871, 728
Pasamos de 35 mil a 37 millones!
Vean cómo la respuesta de la primera persona, equivale a 1,125 respuestas. Y la de la segunda es un poco diferente, equivale a 1,682. Pero la 5 sólo a 841!
head(vic)
Usemos toda esta información.
Ahora sí definamos nuestra BD con el diseño complejo. Aquí un tutorial de svyr, el paquete de r que usaremos para estos calculos
library(srvyr)
vic_survey <- vic %>%
as_survey_design(ids = UPM_DIS, # cluster
weights = FAC_ELE, #factor
strata = EST_DIS) # estrato
vic_survey
## Stratified 1 - level Cluster Sampling design (with replacement)
## With (13195) clusters.
## Called via srvyr
## Sampling variables:
## - ids: UPM_DIS
## - strata: EST_DIS
## - weights: FAC_ELE
## Data variables: FAC_ELE (dbl), EST_DIS (chr), UPM_DIS (chr), AP4_3_1 (chr),
## SEXO (chr), mujer (ord), seg_col (chr), seg_col1 (dbl)
Es importante notar que diferentes BDs pueden tener más o menos información y este setting puede cambiar. Miren este cuadro para otras variantes; proviene de otro buen libro en R.
Alt text
Y ahora usemos nuestra BD transformada a diseño complejo
vic_survey %>%
drop_na() %>%
summarize(proporcion = survey_mean(seg_col1, vartype = "ci"))
Casi! Pero creo que mucho más cerca
vic_survey %>%
drop_na() %>%
group_by(mujer) %>%
summarize(proporcion = survey_mean(seg_col1, vartype = "ci"))
¿Le atinamos?
Alt text
Bastante mejor que si lo hubieramos hecho sin el factor
vic %>%
drop_na() %>%
group_by(mujer) %>%
summarize(proporcion = mean(seg_col1))
Moraleja: si su base de datos tiene Factores de Expansión, úsenlos!