Utilizaremos datos inspirados en la encuesta del Proyecto de Opinión Pública de América Latina (LAPOP) 2025, cuyo objetivo es analizar las experiencias de los ciudadanos con las instituciones públicas en América Latina. En particular, se estudiará la probabilidad de que una persona sea víctima de extorsión por parte de un agente de policía. La base de datos contiene información de 1000 personas encuestadas y recoge variables sociodemográficas y de interacción con la policía. Estas variables pueden ayudar a explicar diferencias en la probabilidad de sufrir extorsión.
Las variables disponibles son:
El objetivo es ajustar un modelo de regresión logística que permita analizar qué factores se asocian con la probabilidad de que una persona reporte haber sido víctima de extorsión por parte de la policía.
Calcule la razón de probabilidades (odds) de extorsión e interprete su valor.
data <- read.csv("LAPOP.csv")
data$genero <- factor(data$genero, levels = c("Hombre","Mujer"))
data$extorsion <- factor(data$extorsion,levels = c(0,1),labels = c("No", "Sí"))
data$educacion <- factor(data$educacion, levels = c("Primaria","Secundaria","Universitaria"))
data$percepcion_corrupcion <- factor(data$percepcion_corrupcion,levels = c("1","2","3","4","5"))
str(data)## 'data.frame': 1000 obs. of 7 variables:
## $ edad : int 63 20 46 52 56 35 37 60 40 51 ...
## $ genero : Factor w/ 2 levels "Hombre","Mujer": 1 1 2 1 1 2 2 1 1 1 ...
## $ educacion : Factor w/ 3 levels "Primaria","Secundaria",..: 3 3 1 1 2 3 3 2 1 2 ...
## $ ingreso_mensual : num 2470 400 1654 2396 2486 ...
## $ contactos_policia : int 1 2 3 4 4 4 0 2 2 3 ...
## $ percepcion_corrupcion: Factor w/ 5 levels "1","2","3","4",..: 2 5 3 1 2 2 3 3 5 1 ...
## $ extorsion : Factor w/ 2 levels "No","Sí": 2 2 2 2 2 1 1 1 2 2 ...
Proporciones
prop1 <- prop.table(table(data$extorsion))
# Probabilidades
p1 <- prop1["Sí"]
q1 <- prop1["No"]
# Odds de compra
# por cada 85 clientes que compran, hay 100 que no compran
odds1 <- p1 / q1
odds1## Sí
## 4.102041
Por cada persona que NO sufrió extorsión, hay aproximadamente 4 personas que SÍ sufrieron extorsión.
Ajuste un modelo de regresión logística con las variables disponibles.
# Ajustar modelo de regresión logística
mod <- glm(extorsion ~ ., data = data, family = binomial)
# Resumen del modelo
summary(mod)##
## Call:
## glm(formula = extorsion ~ ., family = binomial, data = data)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -2.0392139 0.5152919 -3.957 7.58e-05 ***
## edad 0.0138421 0.0063993 2.163 0.030536 *
## generoMujer -0.5783650 0.1890216 -3.060 0.002215 **
## educacionSecundaria -0.3332713 0.2276508 -1.464 0.143205
## educacionUniversitaria -0.8038154 0.2386791 -3.368 0.000758 ***
## ingreso_mensual 0.0005171 0.0001424 3.631 0.000282 ***
## contactos_policia 0.6988897 0.0793809 8.804 < 2e-16 ***
## percepcion_corrupcion2 0.3572905 0.2406039 1.485 0.137551
## percepcion_corrupcion3 1.6336887 0.2764809 5.909 3.44e-09 ***
## percepcion_corrupcion4 2.2586153 0.3149113 7.172 7.38e-13 ***
## percepcion_corrupcion5 3.0802320 0.4139673 7.441 1.00e-13 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 989.61 on 999 degrees of freedom
## Residual deviance: 729.07 on 989 degrees of freedom
## AIC: 751.07
##
## Number of Fisher Scoring iterations: 6
Interprete los resultados del modelo.
El modelo logístico estimado es \(log\left(\frac{p}{1-p}\right)=−2.0392+0.0138(edad)−0.5784(generoMujer)−0.3333(educacionSecundaria)\\−0.8038(educacionUniversitaria)+0.0005171(ingreso_mensual)+0.6989(contactos_policia)\\+0.3573(percepcion_corrupcion2)+1.6337(percepcion_corrupcion3)+2.2586(percepcion_corrupcion4)\\+3.0802(percepcion_corrupcion5)\)
## Sí
## 0.804
## No
## 0.196
En los datos se observa una proporción de extorsión de p =0.804. Además, como p > 1 − p, sufrir extorsión es más frecuente
## (Intercept) edad generoMujer
## 0.1301310 1.0139384 0.5608145
## educacionSecundaria educacionUniversitaria ingreso_mensual
## 0.7165757 0.4476179 1.0005172
## contactos_policia percepcion_corrupcion2 percepcion_corrupcion3
## 2.0115181 1.4294511 5.1227364
## percepcion_corrupcion4 percepcion_corrupcion5
## 9.5698290 21.7634507
Odds de extorsión: (Odds=4.102041) por cada persona que NO sufrió extorsión, hay aproximadamente 4 personas que SÍ sufrieron extorsión.
Edad \((e^{0.0138421}\approx1.0139384)\) por cada año adicional de edad, multiplica la odds de extorsión por 1.0139384. Es decir, la odds de extorsión aumenta un 1.394% por cada año adicional de edad, manteniendo constante el ingreso mensual, los contactos a la polícia, el género masculino, educación primaria y la percepción de corrupción en nivel 1 .
Género Mujer \((e^{-0.5783650}\approx0.5608145)\) las mujeres tienen 0.561 veces las probabilidades de sufrir extorsión en comparación con los hombres, manteniendo constantes el nivel educativo primaria, el ingreso mensual, la edad, el número de contactos con la policía y la percepción de corrupción nivel 1.
Educación Secundaria: La variable no resulta estadísticamente significativa, por lo que no se evidencia una diferencia respecto a la educación primaria en la probabilidad de sufrir extorsión, manteniendo constantes las demás variables del modelo.
educacion universitaria \((e^{-0.8038154}\approx0.4476179)\) las personas con educación universitaria tienen 0.448 veces las probabilidades de sufrir extorsión que quienes tienen primaria, manteniendo constantes el ingreso mensual, la edad, el género masculino, el número de contactos con la policía y la percepción de corrupción nivel 1.
ingreso mensual \((e^{0.0005171}\approx1.0005172)\) por cada dólar adicional de ingreso, multiplica la odds de extorsión por 1.0005172. Es decir, la odds de extorsión aumenta 0.052% por cada dólar adicional de ingreso, manteniendo constante los contactos a la polícia, la edad, el género masculino, educación primaria y la percepción de corrupción en nivel 1.
Contactos Policía \((e^{0.6988897}\approx2.0115181)\) Por cada contacto adicional con la policía, las odds de sufrir extorsión se multiplican por 2.0115181. Es decir, la odds de extorsión aumenta 101.152% por cada contacto adicional con la polícia, manteniendo constante el ingreso, la edad, el género masculino, educación primaria y la percepción de corrupción en nivel 1
Percepción Corrupción: la percepción de corrupción en nivel 2 no es estadísticamente significativa (p = 0.138), por lo que no se evidencia una diferencia respecto al nivel 1, manteniendo constantes las demás variables.
Percepción Corrupción 3 \((e^{1.6336887}\approx5.1227364 )\) las personas que indican la percepción de corrupción en nivel 3 tienen 5.123 veces las probabilidades de sufrir extorsión que quienes indican la percepción de corrupción en nivel 1, manteniendo constantes el ingreso mensual, la edad, el género masculino, la educación primaria y el número de contactos con la policía.
Percepción Corrupción 4 \((e^{2.2586153}\approx9.5698290 )\) las personas que indican la percepción de corrupción en nivel 4 tienen 9.57 veces las probabilidades de sufrir extorsión que quienes indican la percepción de corrupción en nivel 1, manteniendo constantes el ingreso mensual, la edad, el género masculino, la educación primaria y el número de contactos con la policía.
Percepción Corrupción 5 \((e^{3.0802320}\approx21.7634507)\) las personas que indican la percepción de corrupción en nivel 5 tienen 21.763 veces las probabilidades de sufrir extorsión que quienes indican la percepción de corrupción en nivel 1, manteniendo constantes el ingreso mensual, la edad, el género masculino, la educación primaria y el número de contactos con la policía.
En particular, la edad, el ingreso y los contactos con la policía incrementan las probabilidades de extorsión, destacándose este último como uno de los factores de mayor efecto. Asimismo, niveles elevados de percepción de corrupción (a partir del nivel 3) se asocian con aumentos sustanciales en dichas probabilidades. Por el contrario, ser mujer y poseer educación universitaria se relacionan con menores probabilidades de experimentar extorsión.
Calcule la probabilidad estimada de extorsión para una persona con las siguientes características: 35 años, mujer, educación secundaria, ingreso mensual de $15000, 3 contactos con la policía en el último año y percepción de corrupción igual a 4.
\(log\left(\frac{p}{1-p}\right)=−2.0392+0.0138(35)−0.5784(1))−0.3333(1)−0.8038(0)+0.0005171(15000)\\+0.6989(3)+0.3573(0)+1.6337(0)+2.2586(1)+3.0802(0)\)
\(log\left(\frac{p}{1-p}\right)=9.6439\)
\(p\approx\frac{1}{1+e^{-9.6439}}\)
\(p\approx0.999935\)
Interprete el resultado obtenido.
La probabilidad estimada de extorsión para esta persona con 35 años, mujer, educación secundaria, ingreso mensual de $15000, 3 contactos con la policía en el último año y percepción de corrupción igual a 4 es aproximadamente 99.99%.