El presente trabajo tiene por objetivo modelar y pronosticar el número de homicidios intencionales diarios registrados en Colombia entre enero de 2022 y hasta el 15 de octubre de 2024, teniendo en cuenta la incidencia de variables como el número de hurtos a personas, casos registrados de lesiones personales y violencia intrafamiliar. Estos datos son registros de la Policía Nacional de Colombia provenientes del portal de estadísticas delictivas (https://www.policia.gov.co/estadistica-delictiva).
En este sentido, la pregunta de investigación que se aborda es ¿Cuál es el impacto de el número de hurtos a personas, los casos de lesiones personales y violencia intrafamiliar en la evolución y pronóstico de los homicidios intencionales diarios en Colombia durante el período comprendido entre enero de 2022 y el 15 de octubre de 2024? Con base en el objetivo planteado, los objetivos específicos del trabajo son: (1) Realizar el análisis exploratorio de las variables abordadas; (2) identificar el modelo que mejor se ajuste a los datos que describen el fenómeno y validar sus supuestos; y (3) Realizar el pronóstico de valores diarios de homicidios del 16 al 31 de octubre.
Este análisis busca aportar una visión comprensiva de la dinámica y los factores asociados a los homicidios intencionales en el país. Para ello, se tendrán en cuenta variables como el número de hurtos a personas, los casos de lesiones personales y la violencia intrafamiliar, dada su posible relación e incidencia en las tasas de homicidios de acuerdo con Pérez, Madera, Cortés, Ortiz y Taborda (2024).
Lo anterior a través de modelos VAR (Vectores Autorregresivos), los cuales ofrecen múltiples ventajas cuando se trata de analizar y pronosticar series temporales interrelacionadas, especialmente en fenómenos complejos como los homicidios intencionales y sus factores asociados. Una de sus principales fortalezas es la capacidad de capturar dinámicas multivariadas al permitir que todas las variables en el modelo sean tratadas de manera simétrica, considerando sus posibles efectos de retroalimentación y causalidad. Esto es particularmente útil para identificar relaciones e interacciones entre diferentes indicadores sociales, como los hurtos, las lesiones personales y la violencia intrafamiliar, lo que mejora la precisión del pronóstico y la comprensión del fenómeno. .
De acuerdo con lo descrito, este documento se estructura en tres partes: en primer lugar, se realiza una fase exploratoria, se describen las características principales de las variables abordadas; en segundo lugar, se realiza la identificación del modelo más adecuado ajustado al fenómeno objeto de interés; en tercer lugar se procede con la fase de validación o evaluación del modelo seleccionado; finalmente se realiza el pronóstico e interpretación.
En el Código Penal de Colombia se estipula que el homicidio doloso (o intencional) es la acción encaminada a producir la muerte de otra persona con conocimiento y voluntad. Es decir, el homicidio doloso tiene como característica principal obrar con la intención de generar el resultado. Este tipo de homicidio se distingue de otras categorías, como el homicidio culposo, donde la muerte ocurre por negligencia o imprudencia sin la intención de matar.
En el contexto legal colombiano, el homicidio doloso está regulado por el Código Penal. Las penas varían dependiendo de factores como la circunstancia del delito, si hay agravantes o atenuantes, y si el autor es reincidente. Las circunstancias pueden incluir aspectos como la premeditación, la alevosía (actuar con ventaja), o si la víctima era un servidor público, entre otros.
El Código Penal contempla circunstancias agravantes, según las cuales las penas pueden aumentar para el autor. Entre estos agravantes se encuentran: Cuando se comete contra niños, niñas y adolescentes; Cuando se comete contra una mujer; Cuando se auxilia la comisión de suicidio, bien sea por homicidio, por piedad o por inducción o ayuda al suicidio.
El homicidio doloso es considerado uno de los crímenes más graves en Colombia, y la violencia en el país ha hecho que este tema sea de gran relevancia social y política.
El homicidio intencional en Colombia ha sido un fenómeno ampliamente estudiado debido a su impacto significativo en la seguridad y el desarrollo social del país. Este tipo de delito no ocurre de manera aislada, sino que mantiene vínculos complejos con diversas condiciones sociales, económicas y demográficas, así como con otros tipos de delitos. Según la investigación titulada “Transición demográfica, condición económica y tasa de homicidio. El caso de Colombia, 1990-2013” (Sandoval, 2014), existe una relación directa entre la evolución demográfica del país y las tasas de homicidios, mostrando que los cambios poblacionales, como el crecimiento de la población urbana, han estado asociados con fluctuaciones en la violencia homicida. Las tensiones económicas, marcadas por la desigualdad y la falta de oportunidades, también son factores determinantes que influyen en el comportamiento delictivo, elevando las tasas de homicidios en contextos de mayor precariedad económica.
El trabajo titulado “Determinantes del crimen violento en un país altamente violento: el caso de Colombia” (Sánchez y Núñez, 2001) profundiza en la relación entre el crimen violento y variables socioeconómicas y políticas en Colombia. La investigación revela que factores como el desempleo, la desigualdad de ingresos y la presencia de actividades criminales organizadas contribuyen al aumento de los homicidios. La violencia en Colombia no es homogénea; se manifiesta con características particulares según la región y el contexto socioeconómico. Por ejemplo, las zonas con presencia de grupos armados ilegales o economías informales más prevalentes suelen experimentar tasas de homicidios más altas. Esto demuestra que la violencia homicida se relaciona estrechamente con el entorno socioeconómico, además de estar condicionada por dinámicas criminales específicas.
El estudio “Factores socioeconómicos y demográficos de distintas categorías de delitos en Colombia: Prueba desde un panel de datos de las regiones de Colombia” (Mancera, 2008) destaca cómo las condiciones socioeconómicas, como el acceso desigual a servicios públicos, la educación y las oportunidades laborales, tienen un impacto directo en la incidencia de distintos tipos de delitos, incluidos los homicidios. El análisis regional sugiere que las áreas con mayores niveles de pobreza y menor desarrollo social presentan tasas de homicidio más elevadas. Esto refuerza la idea de que las políticas para prevenir el crimen violento deben abordar no solo el control del delito sino también las condiciones estructurales subyacentes que propician estos fenómenos.
Finalmente, el análisis contenido en “Correlación de las modalidades de homicidio con los delitos de impacto en cuadrantes atípicos de la policía nacional de Colombia” (Pérez, Madera, Cortés, Ortiz y Taborda; 2024) pone de relieve la conexión entre el homicidio y otros delitos de alto impacto, como los hurtos y las lesiones personales, en zonas específicas. Según el estudio, en cuadrantes atípicos identificados por la policía, donde la criminalidad y el desorden social son más elevados, el homicidio suele estar correlacionado con un aumento de otros delitos violentos. Esta relación sugiere que la violencia letal no solo es un resultado de conflictos interpersonales, sino que también puede ser una manifestación de la dinámica criminal en entornos caracterizados por la competencia entre actores ilegales, disputas territoriales y carencia de mecanismos efectivos de resolución de conflictos.
En síntesis, el homicidio intencional en Colombia refleja una compleja interacción de factores socioeconómicos, demográficos y contextuales, y guarda una estrecha relación con otros delitos de alto impacto. Abordar esta problemática de manera integral requiere estrategias que vayan más allá del control policial, abarcando mejoras en la equidad social, el desarrollo económico y la provisión de oportunidades para la población más vulnerable.
El siguiente gráfico muestra el comportamiento de las variables abordadas: homicidio intencional, hurto a personas, casos de violencia intrafamiliar y de lesiones personales.
La serie histórica evidencia aumentos estacionales en la serie de tiempo cada primero de enero de los años 2022, 2023 y 2024. Adicionalmente los fines de semana hay incrementos de los homicidios, por lo que este fenómeno tambien podría indicar estacionalidad. Los casos de lesiones personales y violencia intrafamiliar tambien ocurren con una periodicidad de cada siete (7) días, denotando picos más altos los días domingos. Respecto a los casos de hurtos, estos evidencian ser estacionales cada 7 días, los días viernes o sábados, en donde se registran el mayor número de hurtos a personas.
A continuación se observa el comportamiento de la serie histórica de homicidios intencionales y la descomposición de la misma.
Adicionalmente el siguiente gráfico muestra el diágnostico de anomalías en la serie de tiempo, denotando valores inusualmente altos los días primero de enero y estacionalidad cada siete (7) días.
## frequency = 7 observations per 1 week
## trend = 92 observations per 3 months
El siguiente gráfico muestra la descomposición de la serie de homicidios, se evidencia una tendencia hacia la disminución de homicidios. Se corrobora que hay una tendencia estacional y la gráfica de residuales sugiere ruido blanco, es decir un componente estacionario.
A continuación se desestacionaliza la serie:
Una vez restado el componente estacionalidad se realizarán las pruebas de estacionariedad con la serie desestacionalizada.
A continuación se realizan las pruebas de estacionariedad con el fin de corroborar que los residuales de la serie se comportan como ruido blanco y se pueden realizar pronósticos. Tanto la prueba Dickey-Fuller aumentada como la prueba de raiz unitaria Phillips-Perron tienen en cuenta las siguientes hipótesis:
\[ \left\{ \begin{array}{ll} H_{0}: & \text{La serie NO es estacionaria} \\ H_{1}: & \text{La serie es estacionaria} \end{array} \right. \]
Augmented Dickey-Fuller Test
##
## Augmented Dickey-Fuller Test
##
## data: serie_desestacional
## Dickey-Fuller = -11, Lag order = 10, p-value = 0.01
## alternative hypothesis: stationary
Phillips-Perron Unit Root Test
##
## Phillips-Perron Unit Root Test
##
## data: serie_desestacional
## Dickey-Fuller Z(alpha) = -630, Truncation lag parameter = 7, p-value =
## 0.01
## alternative hypothesis: stationary
Con un nivel de confianza del 99%, existe evidencia estadística suficiente para rechazar la hipótesis nula, es decir se puede afirmar que la serie es estacionaria tanto para la prueba Augmented Dickey-Fuller como para la prueba de raiz unitaria Phillips-Perron.
A continuación se observa el comportamiento de la serie histórica de hurtos a personas y la descomposición de la misma.
Adicionalmente el siguiente gráfico muestra el diágnostico de anomalías en la serie de tiempo, denotando valores estacionales cada siete (7) días. Hay múltiples anomalías de días donde hubo casos insualmente bajos de hurtos.
## frequency = 7 observations per 1 week
## trend = 92 observations per 3 months
El siguiente gráfico muestra la descomposición de la serie de hurtos, se evidencia una tendencia hacia el aumento y luego hacia la disminución de hurtos. Entre los datos originales y la tendencia estacional no se evidencian diferencias. Respecto a la gráfica de residuales sugiere ruido blanco, es decir un componente estacionario.
#### Pruebas de estacionariedad
A continuación se realizan las pruebas de estacionariedad con el fin de corroborar que los residuales de la serie se comportan como ruido blanco y se pueden realizar pronósticos. Tanto la prueba Dickey-Fuller aumentada como la prueba de raiz unitaria Phillips-Perron tienen en cuenta las siguientes hipótesis:
\[ \left\{ \begin{array}{ll} H_{0}: & \text{La serie NO es estacionaria} \\ H_{1}: & \text{La serie es estacionaria} \end{array} \right. \]
Augmented Dickey-Fuller Test
##
## Augmented Dickey-Fuller Test
##
## data: serie_stl2
## Dickey-Fuller = -5, Lag order = 10, p-value = 0.01
## alternative hypothesis: stationary
Phillips-Perron Unit Root Test
##
## Phillips-Perron Unit Root Test
##
## data: serie_stl2
## Dickey-Fuller Z(alpha) = -451, Truncation lag parameter = 7, p-value =
## 0.01
## alternative hypothesis: stationary
Con un nivel de confianza del 99%, existe evidencia estadística suficiente para rechazar la hipótesis nula, es decir se puede afirmar que la serie es estacionaria tanto para la prueba Augmented Dickey-Fuller como para la prueba de raiz unitaria Phillips-Perron.
A continuación se observa el comportamiento de la serie histórica de casos de violencia intrafamiliar y la descomposición de la misma.
De forma similiar que para los homicidios, el gráfico muestra el diágnostico de anomalías en la serie de tiempo, denotando valores inusualmente altos los días primero de enero y estacionalidad aproximadamente cada siete (7) días.
## frequency = 7 observations per 1 week
## trend = 92 observations per 3 months
El siguiente gráfico muestra la descomposición de la serie de casos de violencia intrafamiliar, en principio se evidencia una tendencia hacia la dsiminución y luego hacia el aumento de casos. Respecto a la gráfica de residuales sugiere ruido blanco, es decir un componente estacionario.
A continuación se desestacionaliza la serie:
Una vez restado el componente estacionalidad se realizarán las pruebas de estacionariedad.
A continuación se realizan las pruebas de estacionariedad con el fin de corroborar que los residuales de la serie se comportan como ruido blanco y se pueden realizar pronósticos. Tanto la prueba Dickey-Fuller aumentada como la prueba de raiz unitaria Phillips-Perron tienen en cuenta las siguientes hipótesis:
\[ \left\{ \begin{array}{ll} H_{0}: & \text{La serie NO es estacionaria} \\ H_{1}: & \text{La serie es estacionaria} \end{array} \right. \]
Augmented Dickey-Fuller Test
##
## Augmented Dickey-Fuller Test
##
## data: serie_vio
## Dickey-Fuller = -3, Lag order = 10, p-value = 0.09
## alternative hypothesis: stationary
Phillips-Perron Unit Root Test
##
## Phillips-Perron Unit Root Test
##
## data: serie_vio
## Dickey-Fuller Z(alpha) = -529, Truncation lag parameter = 7, p-value =
## 0.01
## alternative hypothesis: stationary
Utilizando la serie original (dado que on la serie desestacionalizada el p-valor es menor), con un nivel de confianza del 90%, existe evidencia estadística suficiente para rechazar la hipótesis nula, es decir se puede afirmar que la serie es estacionaria tanto para la prueba Augmented Dickey-Fuller como para la prueba de raiz unitaria Phillips-Perron.
A continuación se observa el comportamiento de la serie histórica de casos de lesiones personales y la descomposición de la misma.
De forma similiar que para los homicidios y casos de violencia intrafamiliar, el gráfico muestra el diágnostico de anomalías en la serie de tiempo, denotando valores inusualmente altos los días primero de enero, 25 de diciembre y disminuciones los días 31 de diciembre; así mismo denota estacionalidad aproximadamente cada siete (7) días.
## frequency = 7 observations per 1 week
## trend = 92 observations per 3 months
El siguiente gráfico muestra la descomposición de la serie de lesiones personales, se evidencia una tendencia general hacia la disminución. Entre los datos originales y la tendencia estacional no se evidencian diferencias significativas. Respecto a la gráfica de residuales sugiere ruido blanco, es decir un componente estacionario.
A continuación se desestacionaliza la serie:
Una vez restado el componente estacionalidad se realizarán las pruebas de estacionariedad.
A continuación se realizan las pruebas de estacionariedad con el fin de corroborar que los residuales de la serie se comportan como ruido blanco y se pueden realizar pronósticos. Tanto la prueba Dickey-Fuller aumentada como la prueba de raiz unitaria Phillips-Perron tienen en cuenta las siguientes hipótesis:
\[ \left\{ \begin{array}{ll} H_{0}: & \text{La serie NO es estacionaria} \\ H_{1}: & \text{La serie es estacionaria} \end{array} \right. \]
Augmented Dickey-Fuller Test
##
## Augmented Dickey-Fuller Test
##
## data: serie_desestacional2
## Dickey-Fuller = -5, Lag order = 10, p-value = 0.01
## alternative hypothesis: stationary
Phillips-Perron Unit Root Test
##
## Phillips-Perron Unit Root Test
##
## data: serie_desestacional2
## Dickey-Fuller Z(alpha) = -724, Truncation lag parameter = 7, p-value =
## 0.01
## alternative hypothesis: stationary
Con un nivel de confianza del 99%, existe evidencia estadística suficiente para rechazar la hipótesis nula, es decir se puede afirmar que la serie es estacionaria tanto para la prueba Augmented Dickey-Fuller como para la prueba de raiz unitaria Phillips-Perron.
El siguiente cuadro presenta el resumen de las pruebas de estacionariedad de las series abordadas; todas las pruebas fueron significativas con un nivel de confianza del 99%, con excepción de la prueba Augmented Dickey-Fuller (ADF) para los casos de violencia intrafamiliar, la cual evidenció un p-valor de 0.09, sin embargo se rechaza la hipótesis nula con un nivel de confianza del 90%.
Variable | Prueba ADF | Prueba PP | Decisión | Conclusión |
---|---|---|---|---|
Homicidio intencional | 0.01 | 0.01 | Rechazo Ho | Es estacionaria |
Hurto a personas | 0.01 | 0.01 | Rechazo Ho | Es estacionaria |
Violencia intrafamiliar | 0.09 | 0.01 | Rechazo Ho | Es estacionaria |
Lesiones personales | 0.01 | 0.01 | Rechazo Ho | Es estacionaria |
A continuación se presenta la prueba de causalidad de Granger con el fin de determinar si la serie de homicidios es influida o puede ser predicha por la serie de hurtos, de casos de violencia intrafamiliar y de lesiones personales. Es decir, se evaluará si los valores pasados de las series aportan información útil para predecir los valores actuales de los homicidios. Teniendo en cuenta que se identificó estacionalidades de una semana o cada 7 días, se tuvieron en cuenta este tipo de interacciones en la prueba de causalidad de Granger.
## Granger causality test
##
## Model 1: Hom ~ Lags(Hom, 1:7) + Lags(Hur, 1:7)
## Model 2: Hom ~ Lags(Hom, 1:7)
## Res.Df Df F Pr(>F)
## 1 997
## 2 1004 -7 18.9 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El valor de p-valor < 2e-16 indica que el resultado es extremadamente significativo (al nivel de significancia 0.001 o menor). Esto significa que los rezagos de la serie “Hurtos a personas” proporcionan información significativa para explicar los “Homicidios intencionales” más allá de los rezagos de los homicidios por sí solos. En otras palabras, hay evidencia estadística suficiente para afirmar que los hurtos causan los homicidios en el sentido de Granger.
## Granger causality test
##
## Model 1: Hom ~ Lags(Hom, 1:7) + Lags(Vio, 1:7)
## Model 2: Hom ~ Lags(Hom, 1:7)
## Res.Df Df F Pr(>F)
## 1 997
## 2 1004 -7 14.3 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Nuevamente, el valor extremadamente bajo del p-valor sugiere que los casos de violencia intrafamiliar tienen una relación causal con homicidios intencionales en el sentido de Granger. Es decir, los valores pasados de violencia intrafamiliar son significativos para predecirlos homicidios intencionales.
## Granger causality test
##
## Model 1: Hom ~ Lags(Hom, 1:7) + Lags(Les, 1:7)
## Model 2: Hom ~ Lags(Hom, 1:7)
## Res.Df Df F Pr(>F)
## 1 997
## 2 1004 -7 29.7 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El valor de p-valor < 2e-16 indica que los casos de lesiones personales tienen una relación causal significativa con los homicidios intencionales, proporcionando información relevante para predecir los homicidios cuando se consideran los valores pasados.
El siguiente cuadro presenta el resumen de las pruebas de causalidad de Granger de las series abordadas; todas las pruebas fueron significativas con un nivel de confianza del 99%.
Causalidades | p-valor | Decisión | Conclusión |
---|---|---|---|
Homicidios determinados por Hurtos | < 2e-16 | Rechazar Ho | Los hurtos causan los homicidios en el sentido de Granger. |
Homicidios determinados por violencia intrafamiliar | < 2e-16 | Rechazar Ho | Los casos de violencia intrafamiliar causan los homicidios en el sentido de Granger. |
Homicidios determinados por lesiones personales | < 2e-16 | Rechazar Ho | Las lesiones personales causan los homicidios en el sentido de Granger. |
De acuerdo con lo anterior todas las variables muestran un efecto de causalidad de Granger sobre los homicidios al nivel de significancia más bajo (< 0.001). Esto significa que los valores pasados de Hurtos, Violencia intrafamiliar y Lesiones personales son útiles para explicar y predecir los homicidios.
Los p-valores extremadamente bajos y los estadísticos F altos indican una relación estadísticamente significativa, proporcionando evidencia de que estas variables influyen en los homicidios.
Para saber el número óptimo de rezagos recomendado, se aplican criterios de calidad del modelo, cuyo resultadfo es el siguiente:
## AIC(n) HQ(n) SC(n) FPE(n)
## 8 8 7 8
AIC(n) (Criterio de Información de Akaike) y HQ(n) (Criterio de Hannan-Quinn) sugieren usar 8 lags. Estos criterios son conocidos por penalizar menos la inclusión de parámetros adicionales, lo que significa que están optimizando el ajuste del modelo a los datos. El uso de 8 lags indica que el modelo puede capturar relaciones de largo plazo entre las series, pero puede ser algo más complejo en términos de número de parámetros.
SC(n) (Criterio de Schwarz o BIC) recomienda 7 lags. El BIC es un criterio más conservador que penaliza más la inclusión de parámetros adicionales. Al sugerir 7 lags, el BIC busca un modelo más parsimonioso (más sencillo) que explique la dinámica de los datos con menos lags, sacrificando un poco de ajuste a favor de un modelo más simple y, potencialmente, más robusto.
FPE(n) (Error de Predicción Final) también sugiere 8 lags, lo que indica que usar 8 lags optimiza la predicción del modelo según este criterio.
De acuerdo con lo anterior se utilizará como criterio ocho (8) rezagos, sugerencia en tres de cuatro criterios.
A continuación se presentan los coeficientes estimados del modelo VAR para cada serie; no obstante, considerando que la variable de interés es homicidio, se intepretarán los coeficientes del modelo par la serie homicidios:
##
## Call:
## lm(formula = y ~ -1 + ., data = datamat)
##
## Coefficients:
## serie_hom.l1 serie_hur.l1 serie_vio.l1 serie_les.l1 serie_hom.l2
## 0.123705 0.005203 -0.024783 0.022095 0.075879
## serie_hur.l2 serie_vio.l2 serie_les.l2 serie_hom.l3 serie_hur.l3
## 0.005000 0.001648 -0.012102 0.004162 -0.000680
## serie_vio.l3 serie_les.l3 serie_hom.l4 serie_hur.l4 serie_vio.l4
## 0.004731 -0.010131 0.051981 0.001517 -0.004430
## serie_les.l4 serie_hom.l5 serie_hur.l5 serie_vio.l5 serie_les.l5
## -0.006608 0.029518 -0.003488 0.017039 -0.014575
## serie_hom.l6 serie_hur.l6 serie_vio.l6 serie_les.l6 serie_hom.l7
## 0.045830 0.000402 0.004519 -0.002203 0.023122
## serie_hur.l7 serie_vio.l7 serie_les.l7 serie_hom.l8 serie_hur.l8
## -0.010665 -0.001948 0.036577 -0.037748 0.005858
## serie_vio.l8 serie_les.l8 const
## 0.001441 -0.011870 22.288925
Los coeficientes muestran cómo los rezagos (lags) de los homicidios, hurtos, casos de violencia intrafamiliar y lesiones personales afectan el valor actual de los homicidios:
Por otra parte el R-cuadrado indica que aproximadamente el 50.1% de la variabilidad de los homicidios está explicada por el modelo, lo cual es un ajuste razonable. Así mismo la prueba F (30.7) y su p-valor (<2e-16) muestran que el modelo en su conjunto es altamente significativo.
Este modelo sugiere que los homicidios están influenciados de manera significativa por sus propios valores pasados y, en menor medida, por los valores pasados de hurtos, violencia intrafamiliar y lesiones personales. Los efectos de cada variable varían dependiendo del número de retrasos considerados, y algunos efectos son más significativos que otros. Es importante centrarse en los coeficientes significativos para interpretar las relaciones causales y dinámicas entre las variables.
## [1] 0.993 0.984 0.984 0.976 0.976 0.948 0.948 0.927 0.927 0.811 0.811 0.771
## [13] 0.771 0.747 0.747 0.739 0.739 0.717 0.717 0.709 0.709 0.707 0.707 0.669
## [25] 0.669 0.668 0.668 0.626 0.542 0.542 0.540 0.418
Raíces del polinomio característico (8 rezagos): De acuerdo con lo anterior todas las raíces tienen un módulo (valor absoluto) menor que 1, entonces el modelo VAR es estable para ocho (8) rezagos.
A continuación se realiza la prueba de Portmanteau para validar el supuesto de autocorrelación de los residuales del modelo a partir de la siguiente prueba de hipótesis:
\[ \left\{ \begin{array}{ll} H_{0}: & \text{No hay autocorrelación en los residuos del modelo (los residuos son independientes).} \\ H_{1}: & \text{Hay autocorrelación en los residuos.} \end{array} \right. \]
##
## Portmanteau Test (asymptotic)
##
## data: Residuals of VAR object var1
## Chi-squared = 184, df = 64, p-value = 2e-13
Dado que el p-valor (2e-13) es menor que 0.05, se rechaza la hipótesis nula, lo que sugiere que hay autocorrelación en los residuos. Esto sugiere que el modelo VAR podría no haber capturado adecuadamente todas las dinámicas de las variables, lo que puede afectar la precisión de las predicciones y las inferencias del modelo.
A continuación se realiza la prueba de Portmanteau para validar el supuesto de normalidad de los residuales del modelo a partir de la siguiente prueba de hipótesis:
\[ \left\{ \begin{array}{ll} H_{0}: & \text{Los residuos del modelo tienen una distribución normal.} \\ H_{1}: & \text{Los residuos del modelo no tienen una distribución normal.} \end{array} \right. \]
## $JB
##
## JB-Test (multivariate)
##
## data: Residuals of VAR object var1
## Chi-squared = 6124, df = 8, p-value <2e-16
##
##
## $Skewness
##
## Skewness only (multivariate)
##
## data: Residuals of VAR object var1
## Chi-squared = 141, df = 4, p-value <2e-16
##
##
## $Kurtosis
##
## Kurtosis only (multivariate)
##
## data: Residuals of VAR object var1
## Chi-squared = 5984, df = 4, p-value <2e-16
Prueba global de normalidad:
El p-valor extremadamente pequeño (< 2e-16) sugiere que hay una fuerte evidencia para rechazar la hipótesis nula de que los residuos tienen una distribución normal. Esto significa que los residuos no son normalmente distribuidos, lo que puede indicar un problema con el ajuste del modelo, como la presencia de outliers, sesgo o una distribución de cola pesada.
Prueba de sesgo (Skewness):
El p-valor pequeño (< 2e-16) sugiere que hay un sesgo significativo en los residuos. Esto significa que los residuos no están simétricamente distribuidos alrededor de la media, mostrando una asimetría.
Prueba de curtosis (Kurtosis):
El p-valor extremadamente bajo (< 2e-16) indica que hay un problema significativo de curtosis en los residuos. Esto significa que los residuos tienen una curtosis que difiere considerablemente de la normal, lo que podría indicar la presencia de colas más pesadas o más ligeras que una distribución normal.
A continuación se realiza la prueba de heterocedasticidad de los residuales del modelo a partir de la siguiente prueba de hipótesis:
\[ \left\{ \begin{array}{ll} H_{0}: & \text{No hay heterocedasticidad en los residuos (los residuos tienen varianza constante).} \\ H_{1}: & \text{Hay heterocedasticidad en los residuos (la varianza de los residuos cambia).} \end{array} \right. \]
##
## ARCH (multivariate)
##
## data: Residuals of VAR object var1
## Chi-squared = 3088, df = 1200, p-value <2e-16
El p-valor extremadamente bajo (< 2e-16) sugiere que hay evidencia significativa de heterocedasticidad condicional en los residuos del modelo. Esto significa que la varianza de los errores no es constante a lo largo del tiempo, lo que indica que los residuos presentan volatilidad que cambia con el tiempo.
Para saber el número óptimo de rezagos recomendado, se aplican criterios de calidad del modelo, cuyo resultado es el siguiente:
## AIC(n) HQ(n) SC(n) FPE(n)
## 8 8 7 8
AIC(n) (Criterio de Información de Akaike) y HQ(n) (Criterio de Hannan-Quinn) sugieren usar 8 lags. Estos criterios son conocidos por penalizar menos la inclusión de parámetros adicionales, lo que significa que están optimizando el ajuste del modelo a los datos. El uso de 8 lags indica que el modelo puede capturar relaciones de largo plazo entre las series, pero puede ser algo más complejo en términos de número de parámetros.
SC(n) (Criterio de Schwarz o BIC) recomienda 7 lags. El BIC es un criterio más conservador que penaliza más la inclusión de parámetros adicionales. Al sugerir 7 lags, el BIC busca un modelo más parsimonioso (más sencillo) que explique la dinámica de los datos con menos lags, sacrificando un poco de ajuste a favor de un modelo más simple y, potencialmente, más robusto.
FPE(n) (Error de Predicción Final) también sugiere 8 lags, lo que indica que usar 8 lags optimiza la predicción del modelo según este criterio.
De acuerdo con lo anterior se utilizará como criterio ocho (8) rezagos, sugerencia en tres de cuatro criterios.
A continuación se presentan los coeficientes estimados del modelo VAR para cada serie; no obstante, considerando que la variable de interés es homicidio, se intepretarán los coeficientes del modelo par la serie homicidios:
##
## Call:
## lm(formula = y ~ -1 + ., data = datamat)
##
## Coefficients:
## serie_hom.l1 serie_vio.l1 serie_les.l1 serie_hom.l2 serie_vio.l2
## 0.12299 -0.02530 0.02391 0.08972 0.00691
## serie_les.l2 serie_hom.l3 serie_vio.l3 serie_les.l3 serie_hom.l4
## -0.01995 -0.00424 0.00666 -0.01336 0.04038
## serie_vio.l4 serie_les.l4 serie_hom.l5 serie_vio.l5 serie_les.l5
## -0.00282 -0.00892 0.02090 0.01501 -0.01521
## serie_hom.l6 serie_vio.l6 serie_les.l6 serie_hom.l7 serie_vio.l7
## 0.04600 0.00801 -0.00634 0.03125 -0.00789
## serie_les.l7 serie_hom.l8 serie_vio.l8 serie_les.l8 const
## 0.04853 -0.04277 -0.00369 -0.01101 27.34155
Los coeficientes muestran cómo los rezagos (lags) de los homicidios, casos de violencia intrafamiliar y lesiones personales afectan el valor actual de los homicidios:
Por otra parte el R-cuadrado indica que aproximadamente el 47.8% de la variabilidad en los homicidios está explicada por el modelo, es decir, por sus propios valores pasados y los valores pasados de las otras variables incluidas violencia intrafamiliar y lesiones personales.
El valor de p-value < 2e-16 indica que el modelo es altamente significativo en su conjunto, lo que significa que al menos una de las variables predictoras tiene un efecto significativo sobre la serie de homicidios.
## [1] 0.991 0.981 0.981 0.965 0.965 0.934 0.934 0.921 0.774 0.774 0.752 0.752
## [13] 0.708 0.708 0.687 0.641 0.641 0.638 0.638 0.613 0.613 0.587 0.587 0.481
Raíces del polinomio característico (8 rezagos): De acuerdo con lo anterior todas las raíces tienen un módulo (valor absoluto) menor que 1, entonces el modelo VAR es estable para ocho (8) rezagos.
A continuación se realiza la prueba de Portmanteau para validar el supuesto de autocorrelación de los residuales del modelo a partir de la siguiente prueba de hipótesis:
\[ \left\{ \begin{array}{ll} H_{0}: & \text{No hay autocorrelación en los residuos del modelo (los residuos son independientes).} \\ H_{1}: & \text{Hay autocorrelación en los residuos.} \end{array} \right. \]
##
## Portmanteau Test (asymptotic)
##
## data: Residuals of VAR object var2
## Chi-squared = 109, df = 36, p-value = 3e-09
Dado que el p-valor (3e-09) es menor que 0.05, se rechaza la hipótesis nula, lo que sugiere que hay autocorrelación en los residuos. Esto sugiere que el modelo VAR podría no haber capturado adecuadamente todas las dinámicas de las variables, lo que puede afectar la precisión de las predicciones y las inferencias del modelo.
A continuación se realiza la prueba de Portmanteau para validar el supuesto de normalidad de los residuales del modelo a partir de la siguiente prueba de hipótesis:
\[ \left\{ \begin{array}{ll} H_{0}: & \text{Los residuos del modelo tienen una distribución normal.} \\ H_{1}: & \text{Los residuos del modelo no tienen una distribución normal.} \end{array} \right. \]
## $JB
##
## JB-Test (multivariate)
##
## data: Residuals of VAR object var2
## Chi-squared = 4846, df = 6, p-value <2e-16
##
##
## $Skewness
##
## Skewness only (multivariate)
##
## data: Residuals of VAR object var2
## Chi-squared = 66, df = 3, p-value = 3e-14
##
##
## $Kurtosis
##
## Kurtosis only (multivariate)
##
## data: Residuals of VAR object var2
## Chi-squared = 4780, df = 3, p-value <2e-16
Prueba global de normalidad:
El p-valor extremadamente pequeño (< 2e-16) sugiere que hay una fuerte evidencia para rechazar la hipótesis nula de que los residuos tienen una distribución normal. Esto significa que los residuos no son normalmente distribuidos, lo que puede indicar un problema con el ajuste del modelo, como la presencia de outliers, sesgo o una distribución de cola pesada.
Prueba de sesgo (Skewness):
El p-valor pequeño (3e-14) sugiere que hay un sesgo significativo en los residuos. Esto significa que los residuos no están simétricamente distribuidos alrededor de la media, mostrando una asimetría.
Prueba de curtosis (Kurtosis):
El p-valor extremadamente bajo (< 2e-16) indica que hay un problema significativo de curtosis en los residuos. Esto significa que los residuos tienen una curtosis que difiere considerablemente de la normal, lo que podría indicar la presencia de colas más pesadas o más ligeras que una distribución normal.
A continuación se realiza la prueba de heterocedasticidad de los residuales del modelo a partir de la siguiente prueba de hipótesis:
\[ \left\{ \begin{array}{ll} H_{0}: & \text{No hay heterocedasticidad en los residuos (los residuos tienen varianza constante).} \\ H_{1}: & \text{Hay heterocedasticidad en los residuos (la varianza de los residuos cambia).} \end{array} \right. \]
##
## ARCH (multivariate)
##
## data: Residuals of VAR object var2
## Chi-squared = 1594, df = 432, p-value <2e-16
El p-valor extremadamente bajo (< 2e-16) sugiere que hay evidencia significativa de heterocedasticidad condicional en los residuos del modelo. Esto significa que la varianza de los errores no es constante a lo largo del tiempo, lo que indica que los residuos presentan volatilidad que cambia con el tiempo.
Para saber el número óptimo de rezagos recomendado, se aplican criterios de calidad del modelo, cuyo resultado es el siguiente:
## AIC(n) HQ(n) SC(n) FPE(n)
## 10 8 7 10
De acuerdo con lo anterior se utilizará como criterio diez (10) rezagos, sugerencia en dos de cuatro criterios.
A continuación se presentan los coeficientes estimados del modelo VAR para cada serie; no obstante, considerando que la variable de interés es homicidio, se intepretarán los coeficientes del modelo par la serie homicidios:
##
## VAR Estimation Results:
## =========================
## Endogenous variables: serie_hom, serie_hur, serie_les
## Deterministic variables: const
## Sample size: 1009
## Log Likelihood: -15199.509
## Roots of the characteristic polynomial:
## 0.983 0.983 0.977 0.977 0.963 0.945 0.945 0.908 0.814 0.814 0.792 0.792 0.788 0.788 0.783 0.783 0.775 0.775 0.762 0.762 0.762 0.762 0.712 0.712 0.668 0.668 0.569 0.569 0.51 0.263
## Call:
## VAR(y = serie3, p = 10)
##
##
## Estimation results for equation serie_hom:
## ==========================================
## serie_hom = serie_hom.l1 + serie_hur.l1 + serie_les.l1 + serie_hom.l2 + serie_hur.l2 + serie_les.l2 + serie_hom.l3 + serie_hur.l3 + serie_les.l3 + serie_hom.l4 + serie_hur.l4 + serie_les.l4 + serie_hom.l5 + serie_hur.l5 + serie_les.l5 + serie_hom.l6 + serie_hur.l6 + serie_les.l6 + serie_hom.l7 + serie_hur.l7 + serie_les.l7 + serie_hom.l8 + serie_hur.l8 + serie_les.l8 + serie_hom.l9 + serie_hur.l9 + serie_les.l9 + serie_hom.l10 + serie_hur.l10 + serie_les.l10 + const
##
## Estimate Std. Error t value Pr(>|t|)
## serie_hom.l1 0.122802 0.035580 3.45 0.00058 ***
## serie_hur.l1 0.003763 0.002249 1.67 0.09455 .
## serie_les.l1 0.012312 0.004625 2.66 0.00790 **
## serie_hom.l2 0.066285 0.035815 1.85 0.06451 .
## serie_hur.l2 0.006354 0.002518 2.52 0.01177 *
## serie_les.l2 -0.013811 0.004729 -2.92 0.00357 **
## serie_hom.l3 0.017585 0.035815 0.49 0.62355
## serie_hur.l3 -0.003419 0.002507 -1.36 0.17294
## serie_les.l3 -0.006091 0.004599 -1.32 0.18564
## serie_hom.l4 0.054123 0.035702 1.52 0.12985
## serie_hur.l4 0.003028 0.002370 1.28 0.20163
## serie_les.l4 -0.010354 0.004162 -2.49 0.01301 *
## serie_hom.l5 0.028594 0.035718 0.80 0.42358
## serie_hur.l5 -0.002100 0.002378 -0.88 0.37743
## serie_les.l5 -0.007231 0.004140 -1.75 0.08102 .
## serie_hom.l6 0.043128 0.035748 1.21 0.22793
## serie_hur.l6 -0.000595 0.002374 -0.25 0.80219
## serie_les.l6 0.002882 0.004155 0.69 0.48814
## serie_hom.l7 0.023879 0.035702 0.67 0.50376
## serie_hur.l7 -0.010792 0.002364 -4.57 5.6e-06 ***
## serie_les.l7 0.039990 0.004150 9.63 < 2e-16 ***
## serie_hom.l8 -0.060924 0.035881 -1.70 0.08983 .
## serie_hur.l8 0.005976 0.002507 2.38 0.01733 *
## serie_les.l8 -0.012948 0.004812 -2.69 0.00725 **
## serie_hom.l9 0.071888 0.035460 2.03 0.04290 *
## serie_hur.l9 -0.002142 0.002545 -0.84 0.40024
## serie_les.l9 -0.008345 0.004795 -1.74 0.08207 .
## serie_hom.l10 -0.083595 0.035206 -2.37 0.01777 *
## serie_hur.l10 0.003634 0.002276 1.60 0.11075
## serie_les.l10 -0.000216 0.004456 -0.05 0.96142
## const 23.726996 3.965506 5.98 3.1e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
##
## Residual standard error: 8.08 on 978 degrees of freedom
## Multiple R-Squared: 0.498, Adjusted R-squared: 0.483
## F-statistic: 32.3 on 30 and 978 DF, p-value: <2e-16
##
##
## Estimation results for equation serie_hur:
## ==========================================
## serie_hur = serie_hom.l1 + serie_hur.l1 + serie_les.l1 + serie_hom.l2 + serie_hur.l2 + serie_les.l2 + serie_hom.l3 + serie_hur.l3 + serie_les.l3 + serie_hom.l4 + serie_hur.l4 + serie_les.l4 + serie_hom.l5 + serie_hur.l5 + serie_les.l5 + serie_hom.l6 + serie_hur.l6 + serie_les.l6 + serie_hom.l7 + serie_hur.l7 + serie_les.l7 + serie_hom.l8 + serie_hur.l8 + serie_les.l8 + serie_hom.l9 + serie_hur.l9 + serie_les.l9 + serie_hom.l10 + serie_hur.l10 + serie_les.l10 + const
##
## Estimate Std. Error t value Pr(>|t|)
## serie_hom.l1 1.0495 0.5094 2.06 0.03964 *
## serie_hur.l1 0.4491 0.0322 13.95 < 2e-16 ***
## serie_les.l1 -0.2728 0.0662 -4.12 4.1e-05 ***
## serie_hom.l2 -0.8934 0.5128 -1.74 0.08177 .
## serie_hur.l2 0.0836 0.0360 2.32 0.02063 *
## serie_les.l2 -0.0680 0.0677 -1.00 0.31547
## serie_hom.l3 -0.7763 0.5128 -1.51 0.13040
## serie_hur.l3 0.0350 0.0359 0.97 0.32999
## serie_les.l3 0.1046 0.0659 1.59 0.11256
## serie_hom.l4 0.4764 0.5112 0.93 0.35155
## serie_hur.l4 0.1142 0.0339 3.37 0.00079 ***
## serie_les.l4 -0.0093 0.0596 -0.16 0.87607
## serie_hom.l5 -1.0120 0.5114 -1.98 0.04810 *
## serie_hur.l5 -0.0465 0.0340 -1.37 0.17231
## serie_les.l5 0.2235 0.0593 3.77 0.00017 ***
## serie_hom.l6 0.3876 0.5118 0.76 0.44903
## serie_hur.l6 -0.0204 0.0340 -0.60 0.54850
## serie_les.l6 0.0536 0.0595 0.90 0.36778
## serie_hom.l7 -0.6784 0.5112 -1.33 0.18479
## serie_hur.l7 0.3399 0.0338 10.04 < 2e-16 ***
## serie_les.l7 -0.5141 0.0594 -8.65 < 2e-16 ***
## serie_hom.l8 0.2396 0.5137 0.47 0.64100
## serie_hur.l8 -0.1557 0.0359 -4.34 1.6e-05 ***
## serie_les.l8 -0.0185 0.0689 -0.27 0.78885
## serie_hom.l9 0.3959 0.5077 0.78 0.43572
## serie_hur.l9 0.0232 0.0364 0.64 0.52511
## serie_les.l9 0.1213 0.0687 1.77 0.07755 .
## serie_hom.l10 0.1486 0.5041 0.29 0.76827
## serie_hur.l10 0.0350 0.0326 1.07 0.28302
## serie_les.l10 -0.0494 0.0638 -0.77 0.43925
## const 289.3666 56.7779 5.10 4.2e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
##
## Residual standard error: 116 on 978 degrees of freedom
## Multiple R-Squared: 0.663, Adjusted R-squared: 0.652
## F-statistic: 64.1 on 30 and 978 DF, p-value: <2e-16
##
##
## Estimation results for equation serie_les:
## ==========================================
## serie_les = serie_hom.l1 + serie_hur.l1 + serie_les.l1 + serie_hom.l2 + serie_hur.l2 + serie_les.l2 + serie_hom.l3 + serie_hur.l3 + serie_les.l3 + serie_hom.l4 + serie_hur.l4 + serie_les.l4 + serie_hom.l5 + serie_hur.l5 + serie_les.l5 + serie_hom.l6 + serie_hur.l6 + serie_les.l6 + serie_hom.l7 + serie_hur.l7 + serie_les.l7 + serie_hom.l8 + serie_hur.l8 + serie_les.l8 + serie_hom.l9 + serie_hur.l9 + serie_les.l9 + serie_hom.l10 + serie_hur.l10 + serie_les.l10 + const
##
## Estimate Std. Error t value Pr(>|t|)
## serie_hom.l1 0.11896 0.27519 0.43 0.6656
## serie_hur.l1 0.09420 0.01739 5.42 7.7e-08 ***
## serie_les.l1 0.21152 0.03577 5.91 4.6e-09 ***
## serie_hom.l2 -0.37559 0.27700 -1.36 0.1754
## serie_hur.l2 0.00453 0.01947 0.23 0.8161
## serie_les.l2 0.03037 0.03657 0.83 0.4065
## serie_hom.l3 -0.34831 0.27701 -1.26 0.2089
## serie_hur.l3 -0.04073 0.01939 -2.10 0.0359 *
## serie_les.l3 -0.00596 0.03557 -0.17 0.8669
## serie_hom.l4 -0.02103 0.27613 -0.08 0.9393
## serie_hur.l4 0.02254 0.01833 1.23 0.2191
## serie_les.l4 -0.05115 0.03219 -1.59 0.1124
## serie_hom.l5 0.05870 0.27625 0.21 0.8318
## serie_hur.l5 0.02379 0.01840 1.29 0.1962
## serie_les.l5 -0.01427 0.03202 -0.45 0.6558
## serie_hom.l6 0.18409 0.27648 0.67 0.5057
## serie_hur.l6 -0.03125 0.01836 -1.70 0.0891 .
## serie_les.l6 -0.02581 0.03214 -0.80 0.4221
## serie_hom.l7 0.30113 0.27613 1.09 0.2758
## serie_hur.l7 -0.11261 0.01828 -6.16 1.1e-09 ***
## serie_les.l7 0.54608 0.03210 17.01 < 2e-16 ***
## serie_hom.l8 -0.54163 0.27751 -1.95 0.0513 .
## serie_hur.l8 0.08575 0.01939 4.42 1.1e-05 ***
## serie_les.l8 0.00105 0.03722 0.03 0.9775
## serie_hom.l9 -0.10213 0.27426 -0.37 0.7097
## serie_hur.l9 -0.00896 0.01969 -0.46 0.6490
## serie_les.l9 0.00243 0.03708 0.07 0.9479
## serie_hom.l10 -0.88577 0.27229 -3.25 0.0012 **
## serie_hur.l10 -0.02020 0.01761 -1.15 0.2516
## serie_les.l10 0.00294 0.03447 0.09 0.9321
## const 129.58854 30.67049 4.23 2.6e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
##
## Residual standard error: 62.5 on 978 degrees of freedom
## Multiple R-Squared: 0.677, Adjusted R-squared: 0.667
## F-statistic: 68.4 on 30 and 978 DF, p-value: <2e-16
##
##
##
## Covariance matrix of residuals:
## serie_hom serie_hur serie_les
## serie_hom 65.2 -62 224
## serie_hur -62.0 13371 -1049
## serie_les 223.5 -1049 3902
##
## Correlation matrix of residuals:
## serie_hom serie_hur serie_les
## serie_hom 1.0000 -0.0664 0.443
## serie_hur -0.0664 1.0000 -0.145
## serie_les 0.4431 -0.1452 1.000
##
## Call:
## lm(formula = y ~ -1 + ., data = datamat)
##
## Coefficients:
## serie_hom.l1 serie_hur.l1 serie_les.l1 serie_hom.l2 serie_hur.l2
## 0.122802 0.003763 0.012312 0.066285 0.006354
## serie_les.l2 serie_hom.l3 serie_hur.l3 serie_les.l3 serie_hom.l4
## -0.013811 0.017585 -0.003419 -0.006091 0.054123
## serie_hur.l4 serie_les.l4 serie_hom.l5 serie_hur.l5 serie_les.l5
## 0.003028 -0.010354 0.028594 -0.002100 -0.007231
## serie_hom.l6 serie_hur.l6 serie_les.l6 serie_hom.l7 serie_hur.l7
## 0.043128 -0.000595 0.002882 0.023879 -0.010792
## serie_les.l7 serie_hom.l8 serie_hur.l8 serie_les.l8 serie_hom.l9
## 0.039990 -0.060924 0.005976 -0.012948 0.071888
## serie_hur.l9 serie_les.l9 serie_hom.l10 serie_hur.l10 serie_les.l10
## -0.002142 -0.008345 -0.083595 0.003634 -0.000216
## const
## 23.726996
Los coeficientes muestran cómo los rezagos (lags) de los homicidios, hurtos y lesiones personales afectan el valor actual de los homicidios:
Por otra parte el R-cuadrado indica que aproximadamente el 49.8% de la variabilidad en los homicidios está explicada por el modelo, es decir, por sus propios valores pasados y los valores pasados de las otras variables incluidas hurto y lesiones personales.
El valor de p-value < 2e-16 indica que el modelo es altamente significativo en su conjunto, lo que significa que al menos una de las variables predictoras tiene un efecto significativo sobre la serie de homicidios.
## [1] 0.983 0.983 0.977 0.977 0.963 0.945 0.945 0.908 0.814 0.814 0.792 0.792
## [13] 0.788 0.788 0.783 0.783 0.775 0.775 0.762 0.762 0.762 0.762 0.712 0.712
## [25] 0.668 0.668 0.569 0.569 0.510 0.263
Raíces del polinomio característico (8 rezagos): De acuerdo con lo anterior todas las raíces tienen un módulo (valor absoluto) menor que 1, entonces el modelo VAR es estable para ocho (8) rezagos.
A continuación se realiza la prueba de Portmanteau para validar el supuesto de autocorrelación de los residuales del modelo a partir de la siguiente prueba de hipótesis:
\[ \left\{ \begin{array}{ll} H_{0}: & \text{No hay autocorrelación en los residuos del modelo (los residuos son independientes).} \\ H_{1}: & \text{Hay autocorrelación en los residuos.} \end{array} \right. \]
##
## Portmanteau Test (asymptotic)
##
## data: Residuals of VAR object var3
## Chi-squared = 117, df = 18, p-value <2e-16
Dado que el p-valor (<2e-16) es menor que 0.05, se rechaza la hipótesis nula, lo que sugiere que hay autocorrelación en los residuos. Esto sugiere que el modelo VAR podría no haber capturado adecuadamente todas las dinámicas de las variables, lo que puede afectar la precisión de las predicciones y las inferencias del modelo.
A continuación se realiza la prueba de Portmanteau para validar el supuesto de normalidad de los residuales del modelo a partir de la siguiente prueba de hipótesis:
\[ \left\{ \begin{array}{ll} H_{0}: & \text{Los residuos del modelo tienen una distribución normal.} \\ H_{1}: & \text{Los residuos del modelo no tienen una distribución normal.} \end{array} \right. \]
## $JB
##
## JB-Test (multivariate)
##
## data: Residuals of VAR object var3
## Chi-squared = 8000, df = 6, p-value <2e-16
##
##
## $Skewness
##
## Skewness only (multivariate)
##
## data: Residuals of VAR object var3
## Chi-squared = 56, df = 3, p-value = 4e-12
##
##
## $Kurtosis
##
## Kurtosis only (multivariate)
##
## data: Residuals of VAR object var3
## Chi-squared = 7944, df = 3, p-value <2e-16
Prueba global de normalidad:
El p-valor extremadamente pequeño (< 2e-16) sugiere que hay una fuerte evidencia para rechazar la hipótesis nula de que los residuos tienen una distribución normal. Esto significa que los residuos no son normalmente distribuidos, lo que puede indicar un problema con el ajuste del modelo, como la presencia de outliers, sesgo o una distribución de cola pesada.
Prueba de sesgo (Skewness):
El p-valor pequeño (4e-12) sugiere que hay un sesgo significativo en los residuos. Esto significa que los residuos no están simétricamente distribuidos alrededor de la media, mostrando una asimetría.
Prueba de curtosis (Kurtosis):
El p-valor extremadamente bajo (< 2e-16) indica que hay un problema significativo de curtosis en los residuos. Esto significa que los residuos tienen una curtosis que difiere considerablemente de la normal, lo que podría indicar la presencia de colas más pesadas o más ligeras que una distribución normal.
A continuación se realiza la prueba de heterocedasticidad de los residuales del modelo a partir de la siguiente prueba de hipótesis:
\[ \left\{ \begin{array}{ll} H_{0}: & \text{No hay heterocedasticidad en los residuos (los residuos tienen varianza constante).} \\ H_{1}: & \text{Hay heterocedasticidad en los residuos (la varianza de los residuos cambia).} \end{array} \right. \]
##
## ARCH (multivariate)
##
## data: Residuals of VAR object var3
## Chi-squared = 1739, df = 432, p-value <2e-16
El p-valor extremadamente bajo (< 2e-16) sugiere que hay evidencia significativa de heterocedasticidad condicional en los residuos del modelo. Esto significa que la varianza de los errores no es constante a lo largo del tiempo, lo que indica que los residuos presentan volatilidad que cambia con el tiempo.
El siguiente cuadro presenta el resumen de las pruebas de validación de los modelos propuestos.
Modelos | Rezagos usados | Raices unitarias | Autocorrelacion | Normalidad | Heterocedasticidad |
---|---|---|---|---|---|
Homicidio ~ Hurto + Lesiones personales + violencia intrafamiliar | 8 | Modelo estable | No | No | No |
Homicidio ~ Lesiones personales + violencia intrafamiliar | 8 | Modelo estable | No | No | No |
Homicidio ~ Lesiones personales + Hurto | 10 | Modelo estable | No | No | No |
Si bien ninguno de los modelos cumple con los supuestos de validación, se procederá con las predicciones y se compararán con los datos de homicidios intencionales observados del 16 al 31 de octubre de 2024.
La siguiente tabla muestra el pronóstico del modelo con todas las variables del 16 al 31 de octubre de 2024.
## fcst lower upper CI
## [1,] 25.6 9.78 41.3 15.8
## [2,] 28.2 12.02 44.3 16.1
## [3,] 30.4 14.05 46.8 16.4
## [4,] 37.9 21.44 54.4 16.5
## [5,] 49.2 32.65 65.8 16.6
## [6,] 43.2 26.51 59.8 16.6
## [7,] 31.8 15.06 48.5 16.7
## [8,] 28.3 10.61 46.1 17.7
## [9,] 30.9 13.08 48.8 17.9
## [10,] 31.5 13.53 49.5 18.0
## [11,] 38.5 20.43 56.6 18.1
## [12,] 47.7 29.53 65.9 18.2
## [13,] 43.7 25.45 61.9 18.2
## [14,] 32.6 14.32 50.9 18.3
## [15,] 29.7 10.86 48.5 18.8
## [16,] 31.4 12.40 50.4 19.0
El gráfico muestra la serie recortada desde el 01 de agosto y hasta el 15 de octubre, mostrando en rojo la predicción del 16 al 31 de octubre.
La siguiente tabla muestra el pronóstico del modelo con todas las variables del 16 al 31 de octubre de 2024.
## fcst lower upper CI
## [1,] 26.2 10.1 42.3 16.1
## [2,] 28.0 11.5 44.5 16.5
## [3,] 30.4 13.8 47.0 16.6
## [4,] 38.3 21.6 55.0 16.7
## [5,] 49.1 32.3 65.9 16.8
## [6,] 42.4 25.5 59.2 16.9
## [7,] 32.9 15.9 49.8 16.9
## [8,] 28.8 10.6 47.0 18.2
## [9,] 30.3 12.0 48.6 18.3
## [10,] 31.9 13.4 50.3 18.4
## [11,] 38.8 20.3 57.3 18.5
## [12,] 47.4 28.9 66.0 18.6
## [13,] 42.9 24.3 61.5 18.6
## [14,] 33.9 15.2 52.6 18.7
## [15,] 30.1 10.8 49.5 19.3
## [16,] 30.9 11.4 50.3 19.5
El gráfico muestra la serie recortada desde el 01 de agosto y hasta el 15 de octubre, mostrando en rojo la predicción del 16 al 31 de octubre.
La siguiente tabla muestra el pronóstico del modelo con todas las variables del 16 al 31 de octubre de 2024.
## fcst lower upper CI
## [1,] 24.9 9.06 40.7 15.8
## [2,] 30.4 14.33 46.5 16.1
## [3,] 29.6 13.28 45.9 16.3
## [4,] 38.8 22.43 55.2 16.4
## [5,] 47.9 31.44 64.4 16.5
## [6,] 43.8 27.28 60.4 16.6
## [7,] 31.1 14.50 47.7 16.6
## [8,] 30.2 12.45 48.0 17.8
## [9,] 29.3 11.48 47.1 17.8
## [10,] 31.7 13.79 49.6 17.9
## [11,] 39.2 21.07 57.2 18.1
## [12,] 47.6 29.41 65.8 18.2
## [13,] 43.5 25.24 61.8 18.3
## [14,] 32.5 14.24 50.8 18.3
## [15,] 30.3 11.36 49.2 18.9
## [16,] 31.1 12.09 50.1 19.0
El gráfico muestra la serie recortada desde el 01 de agosto y hasta el 15 de octubre, mostrando en rojo la predicción del 16 al 31 de octubre.
El siguiente cuadro presenta un comparativo de los pronósticos realizados por cada modelo y los valores observados entre el 16 y el 31 de octubre.
El análisis realizado tuvo como propósito modelar y pronosticar el número de homicidios intencionales diarios en Colombia desde enero de 2022 hasta mediados de octubre de 2024, utilizando modelos VAR (Vectores Autorregresivos) para considerar la posible influencia de variables como hurtos a personas, lesiones personales y violencia intrafamiliar. Los pronósticos realizados del 16 al 31 de octubre de 2024 fueron contrastados contra datos reales para evaluar la precisión de cada modelo.
Comparación de los Modelos VAR:
## [1] 40926
## [1] 28601
## [1] 30585
Evaluación de la Variación de los Pronósticos:
La columna de variación muestra las diferencias diarias y la estabilidad relativa entre los modelos. Aunque todos los modelos muestran ciertas desviaciones, ninguno se desvía drásticamente del valor real durante el período pronosticado.
Influencia de las Variables Independientes:
Los resultados sugieren que las variables de hurto, violencia intrafamiliar y lesiones personales tienen diferentes grados de influencia sobre el número de homicidios diarios, con un impacto más evidente al considerar las combinaciones de variables. Esto respalda la hipótesis inicial de que estos factores están relacionados con la evolución de los homicidios intencionales.
Precisión del Modelo:
Apesar de que ninguno de los modelos pasó las pruebas de validación, los modelos VAR presentan pequeñas desviaciones respecto a los valores reales, su capacidad de capturar relaciones multivariadas y considerar dinámicas de retroalimentación demuestra su utilidad para modelar fenómenos complejos. Los resultados muestran que los tres modelos pueden ser útiles para pronosticar tendencias de homicidios, aunque se podrían explorar modelos adicionales o combinaciones de variables para mejorar la precisión.
Recomendaciones y Aplicaciones Futuras:
El uso de modelos VAR puede servir como herramienta predictiva para ayudar a las autoridades en la planificación y ejecución de políticas públicas orientadas a la prevención del crimen. Los modelos podrían complementarse con análisis de causalidad y retroalimentación entre las variables para identificar intervenciones más efectivas. Dado que los datos de entrada provienen de fuentes oficiales como la Policía Nacional, se recomienda mantener la actualización periódica de estas variables para mejorar la precisión de futuros pronósticos. El análisis mostró que el uso de modelos VAR aporta una visión comprensiva de la dinámica de los homicidios intencionales y su relación con otros delitos. Esto puede ser aprovechado para el diseño de estrategias preventivas y para entender mejor los factores asociados que influyen en la ocurrencia de estos delitos.
Mancera, A. (2008). Factores socioeconómicos y demográficos de distintas categorías de delitos en Colombia: Prueba desde un panel de datos de las regiones de Colombia. Revista de Economía del Caribe, (2).
Pérez, A., Madera, W., Cortés, J., Ortiz, S., & Taborda, A. (2024). Correlación de las modalidades de homicidio con los delitos de impacto en cuadrantes atípicos de la Policía Nacional de Colombia. En J. Lozano Medina (Ed.), Analítica de datos para la seguridad ciudadana (pp. 113-140). Editorial de la Dirección de Educación Policial de la Policía Nacional de Colombia. https://doi.org/10.22335/y1jrrh33
Sandoval, L. E. (2014). Transición demográfica, condición económica y tasa de homicidio. El caso de Colombia, 1990-2013. Ecos de Economía, 18(39), 97-111.
Sánchez Torres, F. J., & Núñez Méndez, J. A. (2001). Determinantes del crimen violento en un país altamente violento: el caso de Colombia.