En 1968 segun las ideas de Gary Becker, se entiende que la decision de cometer un delito es el resultado de un calculo de utilidad esperada, es decir que si la utilidad del acto ilicito es mas conveniente o favorable que la de una actividad licita, el individuo delinque, comparando el beneficio potencial contra los dos costos principales del crimen: la probabilidad de ser arrestado y la severidad del castigo, de esta forma el criminal deja de ser visto como un ser irracional y es mas bien un agente que responde a estimulos de incentivos, teniendo en cuenta que en cualquier momento puede ser atrapado y castigado, lo que implica directamente que las politicas publicas pueden influir en la tasa de crimen al manipular estas dos palancas de disuasion.
A esta teoria Isaac Ehrlich se le suma aportando el concepto de la asignacion del tiempo, donde se vuelve crucial el mercado laboral, ya que los salarios y oportunidades de empleo se vuelven de suma importancia para un costo de oportunidad, pues si las condiciones del mercado laboral mejoran, el crimen se vuelve una opcion menos tentativa, aumentando el valor de dedicar tiempo a actividades legales sobre las ilegales, ademas Ehrlich fue pionero en demostrar con evidencia que influye mas la certeza del castigo, es decir el peso de que si llegase a ser atrapado habria una consecuencia, que la severidad de la misma, un hallazgo que sugiere que mejorar la eficiencia policial y judicial podria ser más efectivo que simplemente alargar las sentencias.
Para empezar con los estudios nacionales, Alejandro Mancera en su articulo “Factores socioeconomicos y demograficos de distintas categorias de delitos en Colombia. Prueba desde un panel de datos de las regiones de Colombia” (2009), queria ver que cosas de la sociedad y la economia hacian que hubiera mas de ciertos delitos en las cinco regiones de Colombia entre 2001 y 2006, su idea era usar las teorias de Becker y Ehrlich aqui en el pais, pero añadiendo cosas locales como el desplazamiento o los cultivos de coca, para lograrlo uso un modelo de panel de datos con efectos fijos, lo que le permitio controlar las diferencias invisibles entre regiones, el encontro que si la policia es mas eficiente y captura mas gente, bajan delitos como la extorsion y el narcotrafico, pero tambien vio que la pobreza y el desplazamiento hacen que suban los crimenes mas graves como homicidios o secuestros. Siguiendo en Colombia, Ervyn Norza Céspedes, Walther Alfonso López Guaje y María Ximena Peñalosa Otero escribieron “Exégesis de los delitos en Colombia, 2011” (2012), donde querian medir si poner mas policias o dar mejores trabajos bajaba el crimen en los departamentos del pais, esto lo hicieron para saber si era mejor la mano dura o la ayuda social, usaron un modelo de panel de datos y una tecnica especial llamada variables instrumentales para que los resultados no salieran mal por el hecho de que a veces hay mas policias porque ya hay mucho crimen, lo que encontraron fue que si, poner mas policias ayuda a bajar el crimen, como un 3 o 5% menos si aumentas los policias un 10%, pero tambien vieron que si la gente tiene mejores sueldos y mas trabajo, el crimen baja casi igual.
Articulos Internacionales
Mirando estudios de otros paises, John M MacDonald, Jonathan Klick y Ben Grunwald publicaron “The Effect of Privately Provided Police Services on Crime: Evidence from a Geographic Regression Discontinuity Design” (2024), ellos querian saber si tener policias privados ademas de los publicos ayudaba a bajar el crimen, esto porque hay un debate sobre si la policia privada realmente sirve o solo mueve el crimen de un lado a otro, usaron una tecnica llamada regresion discontinua geografica en Los Angeles, comparando zonas justo al borde de donde patrullaban policias privados contra zonas sin ellos, encontraron que donde habia policias privados si bajaba el crimen significativamente, sobre todo los robos. Finalmente, Mark Duggan escribio “More Guns, More Crime?” (2001), donde queria investigar si tener mas armas hacia que hubiera mas crimenes, sobre todo homicidios, esto lo hizo para probar si era cierto eso que dicen en Estados Unidos de que si la gente buena tiene armas los malos se asustan, o si al contrario mas armas es mas peligro, para eso uso datos de panel de los condados de EEUU y una idea muy ingeniosa, uso que tan popular era una revista de armas como una variable instrumental, pensando que si a la gente le gustaba la revista compraria mas armas pero la revista en si no causaba crimen, lo que encontro fue que la idea de mas armas es mas seguridad era falsa, porque donde la gente tenia mas armas habia mas homicidios, especialmente con armas de fuego.
El primer grafico muestra el promedio de crimen por condado, nos deja ver que el crimen no es igual en todos lados, o sea, hay unos condados que son mucho mas peligrosos que otros y esto se mantiene asi en el tiempo, esto nos dice que cada condado tiene sus propias cosas que no cambian, como su cultura o su geografia, que hacen que tengan mas o menos crimen, y a eso se le llama el efecto individual (el alfa i), si no tuvieramos en cuenta esto y usaramos un modelo simple, los resultados estarian mal porque estariamos ignorando estas diferencias tan grandes.
El segundo grafico el de los promedios por año, nos muestra que hubo cosas que pasaron en ciertos años que afectaron a todos los condados al mismo tiempo, como se ve en el grafico, parece que hubo una bajada en el crimen al principio y despues una subida, esto podria ser por una crisis economica o una nueva ley que se aplico en todo el estado, a esto se le llama efecto temporal (el lambda t), y si tampoco lo metemos en el modelo, los resultados tambien estarian mal porque le estariamos echando la culpa a otras variables de algo que en verdad fue un cambio general en el tiempo.
## # A tibble: 1 × 2
## county mean_crmrte
## <int> <dbl>
## 1 119 0.0887
Al ver el grafico notamos que algun condado como el 141 tiene un pico de crimen super alto en un solo año, pero el codigo nos dice que el condado 119 es el mas peligroso en general, esto pasa porque el codigo no busca el pico mas alto de un solo año, sino que calcula el promedio de crimen de cada condado durante los siete años del estudio, entonces, el condado 119 es el top 1 porque su nivel de crimen fue el mas alto de forma consistente durante todo el periodo, aunque otro condado haya tenido un año puntualmente peor.
##
## ====================================================================================
## MCO Primeras Difs Efectos Fijos Efectos Aleatorios
## ------------------------------------------------------------------------------------
## (Intercept) -1.4315 *** -0.0040 -1.1488 ***
## (0.2759) (0.0061) (0.1915)
## log(prbarr + 0.001) -0.7064 *** -0.3108 *** -0.3517 *** -0.4224 ***
## (0.0352) (0.0278) (0.0300) (0.0300)
## log(prbconv + 0.001) -0.5518 *** -0.2331 *** -0.2820 *** -0.3295 ***
## (0.0258) (0.0170) (0.0197) (0.0198)
## log(prbpris + 0.001) 0.2227 *** -0.1558 *** -0.1778 *** -0.1818 ***
## (0.0633) (0.0240) (0.0299) (0.0315)
## log(avgsen + 0.001) -0.0574 -0.0108 0.0024 0.0158
## (0.0526) (0.0204) (0.0242) (0.0253)
## log(polpc + 0.001) 0.5196 *** 0.5335 *** 0.5600 *** 0.5667 ***
## (0.0414) (0.0335) (0.0322) (0.0330)
## factor(year)82 0.0129
## (0.0144)
## factor(year)83 -0.0667 ***
## (0.0177)
## factor(year)84 -0.1040 ***
## (0.0190)
## factor(year)85 -0.0951 ***
## (0.0181)
## factor(year)86 -0.0559 ***
## (0.0140)
## ------------------------------------------------------------------------------------
## R^2 0.5661 0.4549 0.3993 0.3939
## Adj. R^2 0.5626 0.4446 0.2858 0.3891
## Num. obs. 630 540 630 630
## s_idios 0.1271
## s_id 0.2861
## s_time 0.0156
## ====================================================================================
## *** p < 0.001; ** p < 0.01; * p < 0.05
D2) El termino αi (alfa i) representa todas las caracteristicas de cada
condado que no podemos medir y que no cambian con el tiempo pero que
afectan el crimen, cuatro ejemplos son:
Cultura y Actitudes Sociales: Esto se refiere a si la gente en un condado tiene una cultura rigurosa y de mucho respeto a la ley, o si por el contrario hay una cultura de desconfianza hacia la policia, estas actitudes son muy profundas y no cambian de un año para otro, pero obviamente afectan el nivel de crimen.
Ubicacion Geografica: Un condado puede estar pegado a una autopista principal que usan los narcos para mover mercancia, o puede ser un condado muy aislado en las montañas, esta ubicacion no va a cambiar y claramente influye en el tipo y la cantidad de crimen que hay.
Calidad de las Instituciones Locales: Se refiere a si el gobierno local, la policia o los juzgados de un condado son historicamente eficientes o si por el contrario son conocidos por ser corruptos o lentos, esta “calidad” es algo que se mantiene en el tiempo y que no es facil de medir con un numero, pero que sin duda afecta el crimen.
Estructura Economica Historica: Un condado pudo haber dependido por decadas de una sola industria, como la textil, y si esa industria quebro hace tiempo, puede que haya quedado un ambiente de desmotivacion y falta de oportunidades que es dificil de medir pero que puede generar mas crimen año tras año.
Si porque el αi son como las cosas que no se ven de cada condado que no cambian con el tiempo, como la cultura de la gente, o si estan cerca de una ruta de narcos, y esas cosas seguro tienen que ver con las variables que si vemos, por ejemplo, un condado donde la gente es rigurosa (eso seria el αi) seguro vota por politicos que ponen mas policias, y entonces la variable polpc (que es una Xjit) va a ser mas alta, o un condado donde los jueces son muy ineficientes (el αi) seguro va a tener una probabilidad de condena prbconv (la Xjit) mas baja siempre, como esto es tan posible, el modelo de efectos aleatorios que supone que esas cosas no estan relacionadas seguro daria resultados malos, asi que por pura logica es mejor usar el modelo de efectos fijos.
Si es necesario usar los dos, el individual y el temporal, el efecto individual (alfa i) es para controlar por todas las cosas que no se ven de cada condado y que no cambian, como vimos en los graficos, cada condado es un mundo aparte y si no controlamos por eso los resultados salen mal, y el efecto temporal es para controlar por las cosas que pasaron en un año especifico y que afectaron a todos, como una crisis o una nueva ley, si no lo ponemos, el modelo le podria echar la culpa a las otras variables de algo que en verdad fue un shock de ese año.
¿Que diferencias se ven entre los resultados de los modelos?
Mirando la tabla que nos sale podemos ver varias cosas:
contra el MCO: Los resultados del MCO son muy diferentes a los de efectos fijos, por ejemplo, el MCO dice que la probabilidad de arresto (prbarr) casi no tiene efecto, pero el de ef dice que si tiene un efecto negativo y fuerte, esto pasa porque el MCO no controla por las caracteristicas de cada condado (el alfa i) y por eso sus resultados estan sesgados, o sea estan mal.
contra primeras diferencias: Los resultados entre efectos fijos y primeras diferencias son bastante parecidos, por ejemplo para prbarr uno da -0,32 y el otro -0,42, y para prbconv uno da -0,24 y el otro -0,30, esto tiene sentido porque los dos modelos (ef y pd) son dos formas distintas de hacer lo mismo, que es quitar el alfa i para tener resultados buenos, que den parecido es una buena señal.
contra efectos aleatorios: Los resultados entre efectos fijos y efectos aleatorios tambien son diferentes, el de ef dice que el efecto de la policia (polpc) no es significativo, pero el de ea dice que si, estas diferencias nos hacen sospechar que el alfa i si esta correlacionado con las variables X, y si eso es verdad, el modelo de ea estaria mal y el bueno seria el de ef, esto es justo lo que vamos a confirmar con la prueba de Hausman en el siguiente punto.
hausman<- phtest(efmodelo, eamodelo)
print(hausman)
##
## Hausman Test
##
## data: formulalog
## chisq = 152, df = 5, p-value < 2.2e-16
## alternative hypothesis: one model is inconsistent
las hipotesis:
H0 (la hipotesis nula): dice que las cosas que no vemos de los condados (el alfa i) no tienen nada que ver con las variables que si vemos (las Xjit), si esto es verdad el modelo de efectos aleatorios es el mejor porque funciona bien y es mas preciso.
H1 (la hipotesis alternativa): dice que las cosas que no vemos (el alfa i) si estan relacionadas con las variables que si vemos (las Xjit), si esto es verdad el modelo de efectos aleatorios da resultados malos y el unico que sirve es el de efectos fijos.
el calculo y la regla para decidir: la prueba calcula un numero llamado Chi-cuadrado (chi2) y nos da un p-valor, la regla es facil, si el p-valor es menor que 0,05 (que es como el limite que ponemos), entonces botamos la idea H0.
el eesultado que nos dio en R: cuando corrimos el codigo, nos salio un p-valor super bajo (p-value < 2.2e-16).
modelo ideal: como el p-valor es muchisimo menor que 0,05, botamos la idea H0, esto quiere decir que encontramos pruebas de que las cosas que no vemos si afectan a las que si vemos, por eso el modelo de efectos aleatorios esta mal y el mejor modelo para usar es el de efectos fijos.
interpretacion de los resultados del modelo de efectos fijos: ahora que sabemos que el mejor modelo es el de efectos fijos, miramos sus resultados en la tabla (la que se hizo en el punto f) para ver si cuadran con lo que dijeron Becker y Ehrlich y los articulos que leimos.
log(prbarr) (la probabilidad de arresto): el numero que salio fue -0,32, esto quiere decir que si la probabilidad de que te arresten sube un 1%, la tasa de crimen baja un 0,32%, esto cuadra perfecto con lo que dice la teoria, porque si es mas probable que te atrapen, pues la gente lo piensa dos veces antes de hacer algo malo, como dijeron en los articulos.
log(prbconv) (la probabilidad de condena): el numero fue -0,24, o sea que si la probabilidad de que te condenen sube un 1%, el crimen baja un 0,24%, esto tambien tiene sentido con la teoria y los articulos, porque hace que el “costo” de delinquir sea mas alto.
log(prbpris) (la probabilidad de ir a la carcel): el numero fue -0,14, asi que si la probabilidad de ir a la carcel sube un 1%, el crimen baja un 0,14%, otra vez, esto muestra que si el castigo es mas seguro, el crimen baja, como decia Becker.
log(polpc) (los policias): esta variable dio un numero positivo pero no fue importante (no salieron asteriscos), que sea positivo es raro, porque uno piensa que mas policias deberian bajar el crimen, como decian los articulos de Londres y Colombia, pero esto pasa mucho, se llama simultaneidad, y es porque justo donde hay mas crimen es donde mandan mas policias, entonces el modelo se enreda y no sabe si los policias causan crimen o si el crimen causa mas policias, para arreglar esto se necesita usar otras tecnicas mas complicadas.
aqui vamos a demostrar que si los errores de un modelo de panel no tienen correlacion serial y su varianza es constante, entonces la correlacion de las diferencias de esos errores es -0.5.
\[\Delta u_{it} = u_{it} - u_{i,t-1}\]
y la del momento anterior a ese es:
\[\Delta u_{i,t-1} = u_{i,t-1} - u_{i,t-2}\]
\[Var(\Delta u_{it}) = Var(u_{it} - u_{i,t-1})\]
\[= Var(u_{it}) + Var(u_{i,t-1}) - 2 \cdot Cov(u_{it}, u_{i,t-1})\]
\[= \sigma_u^2 + \sigma_u^2 - 2 \cdot (0)\]
\[Var(\Delta u_{it}) = 2\sigma_u^2\]
de la misma forma, se puede ver que \(Var(\Delta u_{i,t-1}) = 2\sigma_u^2\).
\[Cov(\Delta u_{it}, \Delta u_{i,t-1}) = Cov(u_{it} - u_{i,t-1}, u_{i,t-1} - u_{i,t-2})\]
si separamos eso usando las propiedades de la covarianza queda:
\[= Cov(u_{it}, u_{i,t-1}) - Cov(u_{it}, u_{i,t-2}) - Cov(u_{i,t-1}, u_{i,t-1}) + Cov(u_{i,t-1}, u_{i,t-2})\]
como las covarianzas entre errores de tiempos distintos son cero (supuesto del problema) y la covarianza de un error con el mismo es su varianza (\(Var(u_{i,t-1}) = \sigma_u^2\)), esto queda:
\[= 0 - 0 - \sigma_u^2 + 0\]
\[Cov(\Delta u_{it}, \Delta u_{i,t-1}) = -\sigma_u^2\]
\[Corr(\Delta u_{it}, \Delta u_{i,t-1}) = \frac{Cov(\Delta u_{it}, \Delta u_{i,t-1})}{\sqrt{Var(\Delta u_{it})} \sqrt{Var(\Delta u_{i,t-1})}}\]
si reemplazamos con lo que ya calculamos en los pasos 2 y 3:
\[= \frac{-\sigma_u^2}{\sqrt{2\sigma_u^2} \sqrt{2\sigma_u^2}}\]
\[= \frac{-\sigma_u^2}{\sqrt{4(\sigma_u^2)^2}}\]
\[= \frac{-\sigma_u^2}{2\sigma_u^2} = -0.5\]
y asi se demuestra que cuando haces primeras diferencias, los nuevos errores siempre van a tener una correlacion de -0.5 entre periodos seguidos.
Referencias Bibliograficas
Duggan, M, (2001), More Guns, More Crime?, Journal of Political Economy, 109(5), 1086-1114. Disponible en: https://www.nber.org/system/files/working_papers/w7967/w7967.pdf
MacDonald, J M, Klick, J, & Grunwald, B, (2024), The Effect of Privately Provided Police Services on Crime: Evidence from a Geographic Regression Discontinuity Design, The Economic Journal. Disponible en: https://publicsafety.jhu.edu/assets/uploads/sites/9/2024/12/effect_of_privately_provided_police_services_on_crime.pdf
Mancera, A, (2009), Factores socioeconomicos y demograficos de distintas categorias de delitos en Colombia, Prueba desde un panel de datos de las regiones de Colombia, Revista de la Facultad de Ciencias Economicas: Investigacion y Reflexion, 17(2), 163-184. Disponible en: https://www.google.com/search?q=https://www.scielo.org.co/scielo.php%3Fscript%3Dsci_arttext%26pid%3DS0121-68052009000200009
Norza Cespedes, E, López Guaje, W A, & Peñalosa Otero, M X, (2012), Exégesis de los delitos en Colombia, 2011, Revista Criminalidad, 54(1), 9-28. Disponible en: http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S1794-31082012000100002