1. Base

column

Introducción

  • Problema observado: Actualmente el crimen es uno de los principales problemas de seguridad interna de los países, en este caso en Estados Unidos. Afecta gravemnete a la población, tanto en pérdidas materiales e incluso humanas. Asímismo, es perjudicial apra la cohesión social interna, así como para la sensación de seguridad de los ciudadanos. A raiz de esto, surgen diversas hipotesis de las posibles causas del crimen, lamnetablemente algunas de ellas reflejan prejuicios. Por lo cual en este trabajo se busca explorar cuales serían las causas del crimen, basándose en evidencia.

  • Pregunta de investigación: ¿Qué factores socioeconómicos que influyen en la criminalidad en Estados Unidos?

  • Justificación: El tema elegido es relevante particularmente en un sentido práctico ya que ara poder no solo combatir el crimen, sino prevenirlo es necesario entenderlo. El crimen no es sólo un hecho jurídico que debe ser perseguido, sino también como un complejo fenómeno social. Investigarlo desde las ciencias sociales permitirá comprender cómo los factores económicos y sociales, como el desempleo o el nivel educativo, interactúan con las tasas de criminalidad. La información obtenida será de ayuda para identificar factores de riesgo que puedan contribuir a un aumento de la incidencia criminal. Esto ayudará al diseño e implementación de políticas públicas más eficaces para reducir el número de crímenes cometidos en determinada área.

  • Hipótesis: En este trabajo nuestra hipotesis es que las variables desempleo (porcentaje de la PEA desempleada), educación (porcentaje de personas que terminaron la preparatoria), y pobreza (porcentaje de personas que se encuentran en situcación de pobreza monetaria) son explicativas del crimen en Estados Unidos. Para esto la variable crimen se representa con un ratio del total de crimenes cada 1000 habitantes

Column

Variables

Column

Gráfico de mapa

2. Análisis univariado

Column {data-width=500}

Gráfico de barras

Tabla de fecuencias

State Population Total RATIO
DISTRICT OF COLUMBIA 705749 76448 108.32180
NEW MEXICO 2096829 165438 78.89914
ALASKA 731545 55274 75.55789
LOUISIANA 4648794 345060 74.22570
SOUTH CAROLINA 5148714 355424 69.03161
ARKANSAS 3017804 207786 68.85338
OKLAHOMA 3956971 259346 65.54155
TENNESSEE 6829174 443600 64.95661
ALABAMA 4903185 312358 63.70512
MISSOURI 6137428 384652 62.67316
HAWAII 1415872 88540 62.53390
OREGON 4217737 254330 60.30011
WASHINGTON 7614893 453202 59.51522
COLORADO 5758736 342254 59.43214
ARIZONA 7278717 421558 57.91653
NEVADA 3080156 173470 56.31858
TEXAS 28995881 1629356 56.19267
CALIFORNIA 39512223 2190890 55.44841
NORTH CAROLINA 10488084 572462 54.58213
KANSAS 2913314 158792 54.50562
GEORGIA 10617423 576838 54.32938
DELAWARE 973764 52092 53.49551
MISSISSIPPI 2976149 157958 53.07463
MONTANA 1068778 55536 51.96215
FLORIDA 21477737 1084232 50.48167
UTAH 3205958 154198 48.09732
MARYLAND 6045680 290714 48.08624
OHIO 11689100 549120 46.97710
INDIANA 6732219 315320 46.83745
NEBRASKA 1934408 90540 46.80502
MINNESOTA 5639632 261136 46.30373
NORTH DAKOTA 762062 34470 45.23254
ILLINOIS 12671821 571090 45.06771
SOUTH DAKOTA 884659 38394 43.39977
KENTUCKY 4467673 188940 42.29047
MICHIGAN 9986857 403964 40.44956
IOWA 3155070 126218 40.00482
WEST VIRGINIA 1792147 68100 37.99912
VIRGINIA 8535519 315932 37.01380
WYOMING 578759 20702 35.76964
WISCONSIN 5822434 205484 35.29177
RHODE ISLAND 1059361 37202 35.11740
NEW YORK 19453561 673838 34.63829
PENNSYLVANIA 12801989 437786 34.19672
VERMONT 623989 20300 32.53262
CONNECTICUT 3565287 114816 32.20386
NEW JERSEY 8882190 274024 30.85095
MASSACHUSETTS 6892503 207790 30.14725
IDAHO 1787065 51586 28.86633
NEW HAMPSHIRE 1359711 37032 27.23520
MAINE 1344212 36582 27.21446

Explicación

  • Gráfico de barras

Se hace un análisis explorativo de la variable dependiente: RATIO. Comenzando por un gráfico de barras con los 5 Estados que mas crimenes tienen por cada 1000 habitantes.

Es posible observar que el Estado con más crimenes por cada 1000 habitantes es el distrito de Columnbia, siendo el único en el cual se cometen más de 100crimenes por cada 1000 habitantes, a este le sigue Nuevo Mexico en el cual se reportan aproximandamente 78 crimenes por cada 1000 habitantes, por lo cual el Distrito de Columbia podría tratarse de un caso atípico. * Tabla de frecuencias

El estado con menos crimenes por cada 100 habitantes es Maine con aproximadamente 27, la diferencia en el ratio en los que se encuentran en el medio no varia en más de 2 unidades, a excepción del Distrito de Columbia, esto podría resultar un tema de estudio relevante.

Column

Variables independientes

Variables de control

3. Análisis multivariado

Column {data-width=600}

Correlación total

Correlación social

Correlación económica

Column {data-width=400}

Correlación total

RATIO POBREZA ARMAS MIGRACION IDH EDUCACION DESEMPLEO
RATIO 1.00 0.50 -0.06 0.04 -0.43 -0.40 0.20
POBREZA 0.50 1.00 0.07 0.01 -0.87 -0.77 0.26
ARMAS -0.06 0.07 1.00 0.15 -0.12 0.10 -0.19
MIGRACION 0.04 0.01 0.15 1.00 -0.36 0.06 -0.22
IDH -0.43 -0.87 -0.12 -0.36 1.00 0.63 -0.10
EDUCACION -0.40 -0.77 0.10 0.06 0.63 1.00 -0.46
DESEMPLEO 0.20 0.26 -0.19 -0.22 -0.10 -0.46 1.00

En esta matriz de correlaciones tanto como en su tabla podemos observar que las variables con más correlación entre sí son, Educación con IDH, seguido por Educación y pobreza, en ambos casos se trata de una correlación negativa. Por otro lado, es posible observar que vas variables migración y armas tienen una correlación entre baja e inexistente con la mayoría de variables.

Correlación social

RATIO MIGRACION IDH EDUCACION
RATIO 1.00 -0.15 -0.28 -0.29
MIGRACION -0.15 1.00 -0.38 0.02
IDH -0.28 -0.38 1.00 0.64
EDUCACION -0.29 0.02 0.64 1.00

Se elabora una matriz de correlaciones de la variables que miden factores sociales con el objetivo de ver como se relacionan estos con la variabla dependiente, Ratio y entre ellas. Este gráfico permite enforcarse especialmente en estas variables. Se observa que existe una correlaciónde moderada a alta entre IDH y Educación, mientras que educación y migración carecend e correlación alguna.

Correlación económica

RATIO POBREZA IDH DESEMPLEO
RATIO 1.00 0.54 -0.28 0.31
POBREZA 0.54 1.00 -0.80 0.30
IDH -0.28 -0.80 1.00 -0.06
DESEMPLEO 0.31 0.30 -0.06 1.00

Para esta matriz de corralciones se han seleccionado variables que miden factores económicos como Desempleom,, Pobreza e IDH. Es posible observar que existe una fuerte correlación negativa entre IDH Y pobreza, así como ninguna correlación entre desempleo e IDH

4.Regresiones

Column {data-width=500}

Regresión Poisson

Regresión Poisson con coeficientes exponencialos
 (1)
(Intercept) 0.7774
[0.08571, 7.111]
DESEMPLEO 1.0830**
[1.02835, 1.140]
EDUCACION 1.0331**
[1.01060, 1.056]
POBREZA 1.0779***
[1.05609, 1.100]
Num.Obs. 51
AIC 453.8
BIC 461.6
Log.Lik. -222.925
F 28.460
RMSE 12.41
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Lo primero que se observa es que las 3 variables son siginificativas en este modelo, por lo que se debe prestar atención a los coeficientes, que en este caso estan previamente exponenciados.

En los coeficientes, se ve que si bien tienen efecto este es bastante debil, ya que los valores son bastante cercanos a 1, lo que les resta valor explicativo.

Test de equidispersión

Aunque el modelo es siginificativo, al tratarse de una regresión Poisson es necesario realizar un test de equidispersión.
Test de Equidispersión
Es probable?
overdispersion TRUE
underdispersion FALSE
El test nos indica que existe sobredispersión, por lo cual se debe realizar modelos predictivos usando la regresión Quasipoisson y Binomial Negativa. ### Regresión quasipoisson
Regresiones QuasiPoisson
 (1)
(Intercept) 0.7774
[0.01553, 39.972]
DESEMPLEO 1.0830+
[0.98755, 1.187]
EDUCACION 1.0331
[0.99344, 1.074]
POBREZA 1.0779***
[1.03941, 1.118]
Num.Obs. 51
F 9.008
RMSE 12.41
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

En este modelo solo la variable Pobreza es significativa, aunque es poco explicativa, ya que al igual que en el primer caso, su coeficiente es bastante cercano 1.

Regresión binomial negativa

Regresión Binomial Negativa
 (1)
(Intercept) 1.372
[0.02996, 61.305]
DESEMPLEO 1.075
[0.98323, 1.175]
EDUCACION 1.027
[0.98922, 1.067]
POBREZA 1.075***
[1.03665, 1.115]
Num.Obs. 51
AIC 408.3
BIC 418.0
Log.Lik. -199.158
F 8.284
RMSE 12.47
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Al igual que en el caso de la QuasiPoisson, solo la variable pobreza es significativa. Como en el caso de la Poisson ahora posee efecto positivo nuevamente, aunque con poco efecto, siendo el coeficiente poco mayor de 1.

Comparación

A continuación comparamos los coeficientes de las 3 regresiones, así como la significancia de estas
Regresiones Poisson, Quasi Poisson y Binomial Negativa
Poisson QuasiPoisson Binomial Negativa
(Intercept) 0.7774 0.7774 1.372
[0.08571, 7.111] [0.01553, 39.972] [0.02996, 61.305]
DESEMPLEO 1.0830** 1.0830+ 1.075
[1.02835, 1.140] [0.98755, 1.187] [0.98323, 1.175]
EDUCACION 1.0331** 1.0331 1.027
[1.01060, 1.056] [0.99344, 1.074] [0.98922, 1.067]
POBREZA 1.0779*** 1.0779*** 1.075***
[1.05609, 1.100] [1.03941, 1.118] [1.03665, 1.115]
Num.Obs. 51 51 51
AIC 453.8 408.3
BIC 461.6 418.0
Log.Lik. -222.925 -199.158
F 28.460 9.008 8.284
RMSE 12.41 12.41 12.47
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
Test de sobredispersión para la regressión poisson
# Overdispersion test

       dispersion ratio =   3.160
  Pearson's Chi-Squared = 148.499
                p-value = < 0.001
se detecta sobredispersión Test de sobredispersión para quasipoisson
# Overdispersion test

       dispersion ratio =   3.160
  Pearson's Chi-Squared = 148.499
                p-value = < 0.001

se detecta sobredispersión Test de sobredispersión para binomial negativa

# Overdispersion test

 dispersion ratio = 1.030
          p-value = 0.776

no se detecta sobredispersión

Se observa que solo la variable Pobreza es significativa en los 3 modelos, aunque tenga poco valor explicativo, podemos concluir que es relevante para estudiar el fenómeno de la criminalidad y debe ser tomada en cuenta. En este caso se escogerá el modelo de la regresión Binomial Negativa, por ser el único que logra eliminar la sobredispersión

Column {data-width=500}

Regresión total

Se realizarán otras regresiones con las mismas variables de las correlaciones social y económica, con el objetivo de ver cual de estos factores es de mayor ayuda cuando se busca estudiar el crimen.
Regresión Poisson con coeficientes exponencialos
 (1)
(Intercept) 0.7774
[0.08571, 7.111]
DESEMPLEO 1.0830**
[1.02835, 1.140]
EDUCACION 1.0331**
[1.01060, 1.056]
POBREZA 1.0779***
[1.05609, 1.100]
Num.Obs. 51
AIC 453.8
BIC 461.6
Log.Lik. -222.925
F 28.460
RMSE 12.41
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Regresión social

Regresión Poisson social exponenciada
 (1)
(Intercept) 10285.205494***
[1662.0708251, 62313.1342]
EDUCACION 0.992474
[ 0.9718942, 1.0138]
MIGRACION 0.995097***
[ 0.9924850, 0.9977]
IDH 0.006476***
[ 0.0003976, 0.1049]
Num.Obs. 50
AIC 491.9
BIC 499.5
Log.Lik. -241.941
F 12.781
RMSE 14.56
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Se observa que las variables Migración e IDH son significativas, entre estas 2 el IDH muestra un impacto negativo mucho más fuerte al de la migración, cuyo coeficiente es bastante cercano a 1.

Regresión económica

Regresión Poisson económico
 (1)
(Intercept) 0.2297
[0.01101, 4.984]
DESEMPLEO 1.0364
[0.98176, 1.094]
POBREZA 1.0888***
[1.06159, 1.116]
IDH 94.2494**
[4.09928, 2090.875]
Num.Obs. 50
AIC 447.8
BIC 455.4
Log.Lik. -219.896
F 28.855
RMSE 12.47
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Comparación

Comparación de regresiones
 POISSON  POISSON sociales  POISSON económico
(Intercept) 0.7774 10285.205494*** 0.2297
[0.08571, 7.111] [1662.0708251, 62313.1342] [0.01101, 4.984]
DESEMPLEO 1.0830** 1.0364
[1.02835, 1.140] [0.98176, 1.094]
EDUCACION 1.0331** 0.992474
[1.01060, 1.056] [ 0.9718942, 1.0138]
POBREZA 1.0779*** 1.0888***
[1.05609, 1.100] [1.06159, 1.116]
MIGRACION 0.995097***
[ 0.9924850, 0.9977]
IDH 0.006476*** 94.2494**
[ 0.0003976, 0.1049] [4.09928, 2090.875]
Num.Obs. 51 50 50
AIC 453.8 491.9 447.8
BIC 461.6 499.5 455.4
Log.Lik. -222.925 -241.941 -219.896
F 28.460 12.781 28.855
RMSE 12.41 14.56 12.47
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

5.Análisis de conglomerados