Introducción

El presente trabajo tiene por objetivo modelar y pronosticar el número de homicidios intencionales diarios registrados en Colombia entre enero de 2022 y hasta el 15 de octubre de 2024, teniendo en cuenta la incidencia de variables como el número de hurtos a personas, casos registrados de lesiones personales y violencia intrafamiliar. Estos datos son registros de la Policía Nacional de Colombia provenientes del portal de estadísticas delictivas (https://www.policia.gov.co/estadistica-delictiva).

En este sentido, la pregunta de investigación que se aborda es ¿Cuál es el impacto de el número de hurtos a personas, los casos de lesiones personales y violencia intrafamiliar en la evolución y pronóstico de los homicidios intencionales diarios en Colombia durante el período comprendido entre enero de 2022 y el 15 de octubre de 2024? Con base en el objetivo planteado, los objetivos específicos del trabajo son: (1) Realizar el análisis exploratorio de las variables abordadas; (2) identificar el modelo que mejor se ajuste a los datos que describen el fenómeno y validar sus supuestos; y (3) Realizar el pronóstico de valores diarios de homicidios del 16 al 31 de octubre.

Este análisis busca aportar una visión comprensiva de la dinámica y los factores asociados a los homicidios intencionales en el país. Para ello, se tendrán en cuenta variables como el número de hurtos a personas, los casos de lesiones personales y la violencia intrafamiliar, dada su posible relación e incidencia en las tasas de homicidios de acuerdo con Pérez, Madera, Cortés, Ortiz y Taborda (2024).

Lo anterior a través de modelos VAR (Vectores Autorregresivos), los cuales ofrecen múltiples ventajas cuando se trata de analizar y pronosticar series temporales interrelacionadas, especialmente en fenómenos complejos como los homicidios intencionales y sus factores asociados. Una de sus principales fortalezas es la capacidad de capturar dinámicas multivariadas al permitir que todas las variables en el modelo sean tratadas de manera simétrica, considerando sus posibles efectos de retroalimentación y causalidad. Esto es particularmente útil para identificar relaciones e interacciones entre diferentes indicadores sociales, como los hurtos, las lesiones personales y la violencia intrafamiliar, lo que mejora la precisión del pronóstico y la comprensión del fenómeno. .

De acuerdo con lo descrito, este documento se estructura en tres partes: en primer lugar, se realiza una fase exploratoria, se describen las características principales de las variables abordadas; en segundo lugar, se realiza la identificación del modelo más adecuado ajustado al fenómeno objeto de interés; en tercer lugar se procede con la fase de validación o evaluación del modelo seleccionado; finalmente se realiza el pronóstico e interpretación.

Contexto del homicidio en Colombia

El Homicidio intencional

En el Código Penal de Colombia se estipula que el homicidio doloso (o intencional) es la acción encaminada a producir la muerte de otra persona con conocimiento y voluntad. Es decir, el homicidio doloso tiene como característica principal obrar con la intención de generar el resultado. Este tipo de homicidio se distingue de otras categorías, como el homicidio culposo, donde la muerte ocurre por negligencia o imprudencia sin la intención de matar.

En el contexto legal colombiano, el homicidio doloso está regulado por el Código Penal. Las penas varían dependiendo de factores como la circunstancia del delito, si hay agravantes o atenuantes, y si el autor es reincidente. Las circunstancias pueden incluir aspectos como la premeditación, la alevosía (actuar con ventaja), o si la víctima era un servidor público, entre otros.

El Código Penal contempla circunstancias agravantes, según las cuales las penas pueden aumentar para el autor. Entre estos agravantes se encuentran: Cuando se comete contra niños, niñas y adolescentes; Cuando se comete contra una mujer; Cuando se auxilia la comisión de suicidio, bien sea por homicidio, por piedad o por inducción o ayuda al suicidio.

El homicidio doloso es considerado uno de los crímenes más graves en Colombia, y la violencia en el país ha hecho que este tema sea de gran relevancia social y política.

Relación del Homicidio intencional con otras variables delictivas

El homicidio intencional en Colombia ha sido un fenómeno ampliamente estudiado debido a su impacto significativo en la seguridad y el desarrollo social del país. Este tipo de delito no ocurre de manera aislada, sino que mantiene vínculos complejos con diversas condiciones sociales, económicas y demográficas, así como con otros tipos de delitos. Según la investigación titulada “Transición demográfica, condición económica y tasa de homicidio. El caso de Colombia, 1990-2013” (Sandoval, 2014), existe una relación directa entre la evolución demográfica del país y las tasas de homicidios, mostrando que los cambios poblacionales, como el crecimiento de la población urbana, han estado asociados con fluctuaciones en la violencia homicida. Las tensiones económicas, marcadas por la desigualdad y la falta de oportunidades, también son factores determinantes que influyen en el comportamiento delictivo, elevando las tasas de homicidios en contextos de mayor precariedad económica.

El trabajo titulado “Determinantes del crimen violento en un país altamente violento: el caso de Colombia” (Sánchez y Núñez, 2001) profundiza en la relación entre el crimen violento y variables socioeconómicas y políticas en Colombia. La investigación revela que factores como el desempleo, la desigualdad de ingresos y la presencia de actividades criminales organizadas contribuyen al aumento de los homicidios. La violencia en Colombia no es homogénea; se manifiesta con características particulares según la región y el contexto socioeconómico. Por ejemplo, las zonas con presencia de grupos armados ilegales o economías informales más prevalentes suelen experimentar tasas de homicidios más altas. Esto demuestra que la violencia homicida se relaciona estrechamente con el entorno socioeconómico, además de estar condicionada por dinámicas criminales específicas.

El estudio “Factores socioeconómicos y demográficos de distintas categorías de delitos en Colombia: Prueba desde un panel de datos de las regiones de Colombia” (Mancera, 2008) destaca cómo las condiciones socioeconómicas, como el acceso desigual a servicios públicos, la educación y las oportunidades laborales, tienen un impacto directo en la incidencia de distintos tipos de delitos, incluidos los homicidios. El análisis regional sugiere que las áreas con mayores niveles de pobreza y menor desarrollo social presentan tasas de homicidio más elevadas. Esto refuerza la idea de que las políticas para prevenir el crimen violento deben abordar no solo el control del delito sino también las condiciones estructurales subyacentes que propician estos fenómenos.

Finalmente, el análisis contenido en “Correlación de las modalidades de homicidio con los delitos de impacto en cuadrantes atípicos de la policía nacional de Colombia” (Pérez, Madera, Cortés, Ortiz y Taborda; 2024) pone de relieve la conexión entre el homicidio y otros delitos de alto impacto, como los hurtos y las lesiones personales, en zonas específicas. Según el estudio, en cuadrantes atípicos identificados por la policía, donde la criminalidad y el desorden social son más elevados, el homicidio suele estar correlacionado con un aumento de otros delitos violentos. Esta relación sugiere que la violencia letal no solo es un resultado de conflictos interpersonales, sino que también puede ser una manifestación de la dinámica criminal en entornos caracterizados por la competencia entre actores ilegales, disputas territoriales y carencia de mecanismos efectivos de resolución de conflictos.

En síntesis, el homicidio intencional en Colombia refleja una compleja interacción de factores socioeconómicos, demográficos y contextuales, y guarda una estrecha relación con otros delitos de alto impacto. Abordar esta problemática de manera integral requiere estrategias que vayan más allá del control policial, abarcando mejoras en la equidad social, el desarrollo económico y la provisión de oportunidades para la población más vulnerable.

Analisis Exploratorio

Analisis Exploratorio

El siguiente gráfico muestra el comportamiento de las variables abordadas: homicidio intencional, hurto a personas, casos de violencia intrafamiliar y de lesiones personales.

La serie histórica evidencia aumentos estacionales en la serie de tiempo cada primero de enero de los años 2022, 2023 y 2024. Adicionalmente los fines de semana hay incrementos de los homicidios, por lo que este fenómeno tambien podría indicar estacionalidad. Los casos de lesiones personales y violencia intrafamiliar tambien ocurren con una periodicidad de cada siete (7) días, denotando picos más altos los días domingos. Respecto a los casos de hurtos, estos evidencian ser estacionales cada 7 días, los días viernes o sábados, en donde se registran el mayor número de hurtos a personas.

Descomposición de la serie de homicidios

A continuación se observa el comportamiento de la serie histórica de homicidios intencionales y la descomposición de la misma.

Adicionalmente el siguiente gráfico muestra el diágnostico de anomalías en la serie de tiempo, denotando valores inusualmente altos los días primero de enero y estacionalidad cada siete (7) días.

## frequency = 7 observations per 1 week
## trend = 92 observations per 3 months

El siguiente gráfico muestra la descomposición de la serie de homicidios, se evidencia una tendencia hacia la disminución de homicidios. Se corrobora que hay una tendencia estacional y la gráfica de residuales sugiere ruido blanco, es decir un componente estacionario.

A continuación se desestacionaliza la serie:

Desestacionalización

Una vez restado el componente estacionalidad se realizarán las pruebas de estacionariedad con la serie desestacionalizada.

Pruebas de estacionariedad

A continuación se realizan las pruebas de estacionariedad con el fin de corroborar que los residuales de la serie se comportan como ruido blanco y se pueden realizar pronósticos. Tanto la prueba Dickey-Fuller aumentada como la prueba de raiz unitaria Phillips-Perron tienen en cuenta las siguientes hipótesis:

\[ \left\{ \begin{array}{ll} H_{0}: & \text{La serie NO es estacionaria} \\ H_{1}: & \text{La serie es estacionaria} \end{array} \right. \]

Augmented Dickey-Fuller Test

## 
##  Augmented Dickey-Fuller Test
## 
## data:  serie_desestacional
## Dickey-Fuller = -11, Lag order = 10, p-value = 0.01
## alternative hypothesis: stationary

Phillips-Perron Unit Root Test

## 
##  Phillips-Perron Unit Root Test
## 
## data:  serie_desestacional
## Dickey-Fuller Z(alpha) = -630, Truncation lag parameter = 7, p-value =
## 0.01
## alternative hypothesis: stationary

Con un nivel de confianza del 99%, existe evidencia estadística suficiente para rechazar la hipótesis nula, es decir se puede afirmar que la serie es estacionaria tanto para la prueba Augmented Dickey-Fuller como para la prueba de raiz unitaria Phillips-Perron.

Descomposición de la serie de hurto a personas

A continuación se observa el comportamiento de la serie histórica de hurtos a personas y la descomposición de la misma.

Adicionalmente el siguiente gráfico muestra el diágnostico de anomalías en la serie de tiempo, denotando valores estacionales cada siete (7) días. Hay múltiples anomalías de días donde hubo casos insualmente bajos de hurtos.

## frequency = 7 observations per 1 week
## trend = 92 observations per 3 months

El siguiente gráfico muestra la descomposición de la serie de hurtos, se evidencia una tendencia hacia el aumento y luego hacia la disminución de hurtos. Entre los datos originales y la tendencia estacional no se evidencian diferencias. Respecto a la gráfica de residuales sugiere ruido blanco, es decir un componente estacionario.

#### Pruebas de estacionariedad

A continuación se realizan las pruebas de estacionariedad con el fin de corroborar que los residuales de la serie se comportan como ruido blanco y se pueden realizar pronósticos. Tanto la prueba Dickey-Fuller aumentada como la prueba de raiz unitaria Phillips-Perron tienen en cuenta las siguientes hipótesis:

\[ \left\{ \begin{array}{ll} H_{0}: & \text{La serie NO es estacionaria} \\ H_{1}: & \text{La serie es estacionaria} \end{array} \right. \]

Augmented Dickey-Fuller Test

## 
##  Augmented Dickey-Fuller Test
## 
## data:  serie_stl2
## Dickey-Fuller = -5, Lag order = 10, p-value = 0.01
## alternative hypothesis: stationary

Phillips-Perron Unit Root Test

## 
##  Phillips-Perron Unit Root Test
## 
## data:  serie_stl2
## Dickey-Fuller Z(alpha) = -451, Truncation lag parameter = 7, p-value =
## 0.01
## alternative hypothesis: stationary

Con un nivel de confianza del 99%, existe evidencia estadística suficiente para rechazar la hipótesis nula, es decir se puede afirmar que la serie es estacionaria tanto para la prueba Augmented Dickey-Fuller como para la prueba de raiz unitaria Phillips-Perron.

Descomposición de la serie violencia intrafamiliar

A continuación se observa el comportamiento de la serie histórica de casos de violencia intrafamiliar y la descomposición de la misma.

De forma similiar que para los homicidios, el gráfico muestra el diágnostico de anomalías en la serie de tiempo, denotando valores inusualmente altos los días primero de enero y estacionalidad aproximadamente cada siete (7) días.

## frequency = 7 observations per 1 week
## trend = 92 observations per 3 months

El siguiente gráfico muestra la descomposición de la serie de casos de violencia intrafamiliar, en principio se evidencia una tendencia hacia la dsiminución y luego hacia el aumento de casos. Respecto a la gráfica de residuales sugiere ruido blanco, es decir un componente estacionario.

A continuación se desestacionaliza la serie:

Desestacionalización

Una vez restado el componente estacionalidad se realizarán las pruebas de estacionariedad.

Pruebas de estacionariedad

A continuación se realizan las pruebas de estacionariedad con el fin de corroborar que los residuales de la serie se comportan como ruido blanco y se pueden realizar pronósticos. Tanto la prueba Dickey-Fuller aumentada como la prueba de raiz unitaria Phillips-Perron tienen en cuenta las siguientes hipótesis:

\[ \left\{ \begin{array}{ll} H_{0}: & \text{La serie NO es estacionaria} \\ H_{1}: & \text{La serie es estacionaria} \end{array} \right. \]

Augmented Dickey-Fuller Test

## 
##  Augmented Dickey-Fuller Test
## 
## data:  serie_vio
## Dickey-Fuller = -3, Lag order = 10, p-value = 0.09
## alternative hypothesis: stationary

Phillips-Perron Unit Root Test

## 
##  Phillips-Perron Unit Root Test
## 
## data:  serie_vio
## Dickey-Fuller Z(alpha) = -529, Truncation lag parameter = 7, p-value =
## 0.01
## alternative hypothesis: stationary

Utilizando la serie original (dado que on la serie desestacionalizada el p-valor es menor), con un nivel de confianza del 90%, existe evidencia estadística suficiente para rechazar la hipótesis nula, es decir se puede afirmar que la serie es estacionaria tanto para la prueba Augmented Dickey-Fuller como para la prueba de raiz unitaria Phillips-Perron.

Descomposición de la serie de lesiones personales

A continuación se observa el comportamiento de la serie histórica de casos de lesiones personales y la descomposición de la misma.

De forma similiar que para los homicidios y casos de violencia intrafamiliar, el gráfico muestra el diágnostico de anomalías en la serie de tiempo, denotando valores inusualmente altos los días primero de enero, 25 de diciembre y disminuciones los días 31 de diciembre; así mismo denota estacionalidad aproximadamente cada siete (7) días.

## frequency = 7 observations per 1 week
## trend = 92 observations per 3 months

El siguiente gráfico muestra la descomposición de la serie de lesiones personales, se evidencia una tendencia general hacia la disminución. Entre los datos originales y la tendencia estacional no se evidencian diferencias significativas. Respecto a la gráfica de residuales sugiere ruido blanco, es decir un componente estacionario.

A continuación se desestacionaliza la serie:

Desestacionalización

Una vez restado el componente estacionalidad se realizarán las pruebas de estacionariedad.

Pruebas de estacionariedad

A continuación se realizan las pruebas de estacionariedad con el fin de corroborar que los residuales de la serie se comportan como ruido blanco y se pueden realizar pronósticos. Tanto la prueba Dickey-Fuller aumentada como la prueba de raiz unitaria Phillips-Perron tienen en cuenta las siguientes hipótesis:

\[ \left\{ \begin{array}{ll} H_{0}: & \text{La serie NO es estacionaria} \\ H_{1}: & \text{La serie es estacionaria} \end{array} \right. \]

Augmented Dickey-Fuller Test

## 
##  Augmented Dickey-Fuller Test
## 
## data:  serie_desestacional2
## Dickey-Fuller = -5, Lag order = 10, p-value = 0.01
## alternative hypothesis: stationary

Phillips-Perron Unit Root Test

## 
##  Phillips-Perron Unit Root Test
## 
## data:  serie_desestacional2
## Dickey-Fuller Z(alpha) = -724, Truncation lag parameter = 7, p-value =
## 0.01
## alternative hypothesis: stationary

Con un nivel de confianza del 99%, existe evidencia estadística suficiente para rechazar la hipótesis nula, es decir se puede afirmar que la serie es estacionaria tanto para la prueba Augmented Dickey-Fuller como para la prueba de raiz unitaria Phillips-Perron.

Resumen de pruebas de estacionariedad

El siguiente cuadro presenta el resumen de las pruebas de estacionariedad de las series abordadas; todas las pruebas fueron significativas con un nivel de confianza del 99%, con excepción de la prueba Augmented Dickey-Fuller (ADF) para los casos de violencia intrafamiliar, la cual evidenció un p-valor de 0.09, sin embargo se rechaza la hipótesis nula con un nivel de confianza del 90%.

Variable Prueba ADF Prueba PP Decisión Conclusión
Homicidio intencional 0.01 0.01 Rechazo Ho Es estacionaria
Hurto a personas 0.01 0.01 Rechazo Ho Es estacionaria
Violencia intrafamiliar 0.09 0.01 Rechazo Ho Es estacionaria
Lesiones personales 0.01 0.01 Rechazo Ho Es estacionaria

Identificación del Modelo

Prueba de causalidad de Granger

A continuación se presenta la prueba de causalidad de Granger con el fin de determinar si la serie de homicidios es influida o puede ser predicha por la serie de hurtos, de casos de violencia intrafamiliar y de lesiones personales. Es decir, se evaluará si los valores pasados de las series aportan información útil para predecir los valores actuales de los homicidios. Teniendo en cuenta que se identificó estacionalidades de una semana o cada 7 días, se tuvieron en cuenta este tipo de interacciones en la prueba de causalidad de Granger.

Homicidios determinados por Hurtos

## Granger causality test
## 
## Model 1: Hom ~ Lags(Hom, 1:7) + Lags(Hur, 1:7)
## Model 2: Hom ~ Lags(Hom, 1:7)
##   Res.Df Df    F Pr(>F)    
## 1    997                   
## 2   1004 -7 18.9 <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El valor de p-valor < 2e-16 indica que el resultado es extremadamente significativo (al nivel de significancia 0.001 o menor). Esto significa que los rezagos de la serie “Hurtos a personas” proporcionan información significativa para explicar los “Homicidios intencionales” más allá de los rezagos de los homicidios por sí solos. En otras palabras, hay evidencia estadística suficiente para afirmar que los hurtos causan los homicidios en el sentido de Granger.

Homicidios determinados por violencia intrafamiliar

## Granger causality test
## 
## Model 1: Hom ~ Lags(Hom, 1:7) + Lags(Vio, 1:7)
## Model 2: Hom ~ Lags(Hom, 1:7)
##   Res.Df Df    F Pr(>F)    
## 1    997                   
## 2   1004 -7 14.3 <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Nuevamente, el valor extremadamente bajo del p-valor sugiere que los casos de violencia intrafamiliar tienen una relación causal con homicidios intencionales en el sentido de Granger. Es decir, los valores pasados de violencia intrafamiliar son significativos para predecirlos homicidios intencionales.

Homicidios determinados por lesiones personales

## Granger causality test
## 
## Model 1: Hom ~ Lags(Hom, 1:7) + Lags(Les, 1:7)
## Model 2: Hom ~ Lags(Hom, 1:7)
##   Res.Df Df    F Pr(>F)    
## 1    997                   
## 2   1004 -7 29.7 <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El valor de p-valor < 2e-16 indica que los casos de lesiones personales tienen una relación causal significativa con los homicidios intencionales, proporcionando información relevante para predecir los homicidios cuando se consideran los valores pasados.

Resumen pruebas de causalidad de Granger

El siguiente cuadro presenta el resumen de las pruebas de causalidad de Granger de las series abordadas; todas las pruebas fueron significativas con un nivel de confianza del 99%.

Causalidades p-valor Decisión Conclusión
Homicidios determinados por Hurtos < 2e-16 Rechazar Ho Los hurtos causan los homicidios en el sentido de Granger.
Homicidios determinados por violencia intrafamiliar < 2e-16 Rechazar Ho Los casos de violencia intrafamiliar causan los homicidios en el sentido de Granger.
Homicidios determinados por lesiones personales < 2e-16 Rechazar Ho Las lesiones personales causan los homicidios en el sentido de Granger.

De acuerdo con lo anterior todas las variables muestran un efecto de causalidad de Granger sobre los homicidios al nivel de significancia más bajo (< 0.001). Esto significa que los valores pasados de Hurtos, Violencia intrafamiliar y Lesiones personales son útiles para explicar y predecir los homicidios.

Los p-valores extremadamente bajos y los estadísticos F altos indican una relación estadísticamente significativa, proporcionando evidencia de que estas variables influyen en los homicidios.

Proceso VAR: Todas las variables (1)

Para saber el número óptimo de rezagos recomendado, se aplican criterios de calidad del modelo, cuyo resultadfo es el siguiente:

## AIC(n)  HQ(n)  SC(n) FPE(n) 
##      8      8      7      8

AIC(n) (Criterio de Información de Akaike) y HQ(n) (Criterio de Hannan-Quinn) sugieren usar 8 lags. Estos criterios son conocidos por penalizar menos la inclusión de parámetros adicionales, lo que significa que están optimizando el ajuste del modelo a los datos. El uso de 8 lags indica que el modelo puede capturar relaciones de largo plazo entre las series, pero puede ser algo más complejo en términos de número de parámetros.

SC(n) (Criterio de Schwarz o BIC) recomienda 7 lags. El BIC es un criterio más conservador que penaliza más la inclusión de parámetros adicionales. Al sugerir 7 lags, el BIC busca un modelo más parsimonioso (más sencillo) que explique la dinámica de los datos con menos lags, sacrificando un poco de ajuste a favor de un modelo más simple y, potencialmente, más robusto.

FPE(n) (Error de Predicción Final) también sugiere 8 lags, lo que indica que usar 8 lags optimiza la predicción del modelo según este criterio.

De acuerdo con lo anterior se utilizará como criterio ocho (8) rezagos, sugerencia en tres de cuatro criterios.

Modelo VAR: Todas las variables (1)

A continuación se presentan los coeficientes estimados del modelo VAR para cada serie; no obstante, considerando que la variable de interés es homicidio, se intepretarán los coeficientes del modelo par la serie homicidios:

## 
## Call:
## lm(formula = y ~ -1 + ., data = datamat)
## 
## Coefficients:
## serie_hom.l1  serie_hur.l1  serie_vio.l1  serie_les.l1  serie_hom.l2  
##     0.123705      0.005203     -0.024783      0.022095      0.075879  
## serie_hur.l2  serie_vio.l2  serie_les.l2  serie_hom.l3  serie_hur.l3  
##     0.005000      0.001648     -0.012102      0.004162     -0.000680  
## serie_vio.l3  serie_les.l3  serie_hom.l4  serie_hur.l4  serie_vio.l4  
##     0.004731     -0.010131      0.051981      0.001517     -0.004430  
## serie_les.l4  serie_hom.l5  serie_hur.l5  serie_vio.l5  serie_les.l5  
##    -0.006608      0.029518     -0.003488      0.017039     -0.014575  
## serie_hom.l6  serie_hur.l6  serie_vio.l6  serie_les.l6  serie_hom.l7  
##     0.045830      0.000402      0.004519     -0.002203      0.023122  
## serie_hur.l7  serie_vio.l7  serie_les.l7  serie_hom.l8  serie_hur.l8  
##    -0.010665     -0.001948      0.036577     -0.037748      0.005858  
## serie_vio.l8  serie_les.l8         const  
##     0.001441     -0.011870     22.288925

Los coeficientes muestran cómo los rezagos (lags) de los homicidios, hurtos, casos de violencia intrafamiliar y lesiones personales afectan el valor actual de los homicidios:

  • serie_hom.l1 (coeficiente = 0.123705, p-valor = 0.00047): El valor del primer retraso de homicidios tiene un impacto positivo significativo sobre el valor actual de los homicidios. Esto significa que un aumento en los homicidios en el período anterior está asociado con un aumento en los homicidios actuales, con un efecto moderado.
  • serie_hur.l1 (coeficiente = 0.005203, p-valor = 0.02380): El primer retraso de hurtos tiene un efecto positivo y significativo sobre los homicidios, aunque el efecto es pequeño.
  • serie_vio.l1 (coeficiente = -0.024783, p-valor = 0.00013): La violencia intrafamiliar en el primer retraso tiene un impacto negativo y significativo sobre los homicidios actuales.
  • serie_les.l1 (coeficiente = 0.022095, p-valor = 5.6e-05): Las lesiones personales en el primer retraso tienen un efecto positivo significativo sobre los homicidios.

Por otra parte el R-cuadrado indica que aproximadamente el 50.1% de la variabilidad de los homicidios está explicada por el modelo, lo cual es un ajuste razonable. Así mismo la prueba F (30.7) y su p-valor (<2e-16) muestran que el modelo en su conjunto es altamente significativo.

Este modelo sugiere que los homicidios están influenciados de manera significativa por sus propios valores pasados y, en menor medida, por los valores pasados de hurtos, violencia intrafamiliar y lesiones personales. Los efectos de cada variable varían dependiendo del número de retrasos considerados, y algunos efectos son más significativos que otros. Es importante centrarse en los coeficientes significativos para interpretar las relaciones causales y dinámicas entre las variables.

Validación del Modelo VAR

Raices unitarias

##  [1] 0.993 0.984 0.984 0.976 0.976 0.948 0.948 0.927 0.927 0.811 0.811 0.771
## [13] 0.771 0.747 0.747 0.739 0.739 0.717 0.717 0.709 0.709 0.707 0.707 0.669
## [25] 0.669 0.668 0.668 0.626 0.542 0.542 0.540 0.418

Raíces del polinomio característico (8 rezagos): De acuerdo con lo anterior todas las raíces tienen un módulo (valor absoluto) menor que 1, entonces el modelo VAR es estable para ocho (8) rezagos.

Prueba de autocorrelación de los residuos (Portmanteau test)

A continuación se realiza la prueba de Portmanteau para validar el supuesto de autocorrelación de los residuales del modelo a partir de la siguiente prueba de hipótesis:

\[ \left\{ \begin{array}{ll} H_{0}: & \text{No hay autocorrelación en los residuos del modelo (los residuos son independientes).} \\ H_{1}: & \text{Hay autocorrelación en los residuos.} \end{array} \right. \]

## 
##  Portmanteau Test (asymptotic)
## 
## data:  Residuals of VAR object var1
## Chi-squared = 184, df = 64, p-value = 2e-13

Dado que el p-valor (2e-13) es menor que 0.05, se rechaza la hipótesis nula, lo que sugiere que hay autocorrelación en los residuos. Esto sugiere que el modelo VAR podría no haber capturado adecuadamente todas las dinámicas de las variables, lo que puede afectar la precisión de las predicciones y las inferencias del modelo.

Prueba de normalidad

A continuación se realiza la prueba de Portmanteau para validar el supuesto de normalidad de los residuales del modelo a partir de la siguiente prueba de hipótesis:

\[ \left\{ \begin{array}{ll} H_{0}: & \text{Los residuos del modelo tienen una distribución normal.} \\ H_{1}: & \text{Los residuos del modelo no tienen una distribución normal.} \end{array} \right. \]

## $JB
## 
##  JB-Test (multivariate)
## 
## data:  Residuals of VAR object var1
## Chi-squared = 6124, df = 8, p-value <2e-16
## 
## 
## $Skewness
## 
##  Skewness only (multivariate)
## 
## data:  Residuals of VAR object var1
## Chi-squared = 141, df = 4, p-value <2e-16
## 
## 
## $Kurtosis
## 
##  Kurtosis only (multivariate)
## 
## data:  Residuals of VAR object var1
## Chi-squared = 5984, df = 4, p-value <2e-16

Prueba global de normalidad:

El p-valor extremadamente pequeño (< 2e-16) sugiere que hay una fuerte evidencia para rechazar la hipótesis nula de que los residuos tienen una distribución normal. Esto significa que los residuos no son normalmente distribuidos, lo que puede indicar un problema con el ajuste del modelo, como la presencia de outliers, sesgo o una distribución de cola pesada.

Prueba de sesgo (Skewness):

El p-valor pequeño (< 2e-16) sugiere que hay un sesgo significativo en los residuos. Esto significa que los residuos no están simétricamente distribuidos alrededor de la media, mostrando una asimetría.

Prueba de curtosis (Kurtosis):

El p-valor extremadamente bajo (< 2e-16) indica que hay un problema significativo de curtosis en los residuos. Esto significa que los residuos tienen una curtosis que difiere considerablemente de la normal, lo que podría indicar la presencia de colas más pesadas o más ligeras que una distribución normal.

Prueba de heterocedasticidad

A continuación se realiza la prueba de heterocedasticidad de los residuales del modelo a partir de la siguiente prueba de hipótesis:

\[ \left\{ \begin{array}{ll} H_{0}: & \text{No hay heterocedasticidad en los residuos (los residuos tienen varianza constante).} \\ H_{1}: & \text{Hay heterocedasticidad en los residuos (la varianza de los residuos cambia).} \end{array} \right. \]

## 
##  ARCH (multivariate)
## 
## data:  Residuals of VAR object var1
## Chi-squared = 3088, df = 1200, p-value <2e-16

El p-valor extremadamente bajo (< 2e-16) sugiere que hay evidencia significativa de heterocedasticidad condicional en los residuos del modelo. Esto significa que la varianza de los errores no es constante a lo largo del tiempo, lo que indica que los residuos presentan volatilidad que cambia con el tiempo.

Proceso VAR: Sin la variable hurto (2)

Para saber el número óptimo de rezagos recomendado, se aplican criterios de calidad del modelo, cuyo resultado es el siguiente:

## AIC(n)  HQ(n)  SC(n) FPE(n) 
##      8      8      7      8

AIC(n) (Criterio de Información de Akaike) y HQ(n) (Criterio de Hannan-Quinn) sugieren usar 8 lags. Estos criterios son conocidos por penalizar menos la inclusión de parámetros adicionales, lo que significa que están optimizando el ajuste del modelo a los datos. El uso de 8 lags indica que el modelo puede capturar relaciones de largo plazo entre las series, pero puede ser algo más complejo en términos de número de parámetros.

SC(n) (Criterio de Schwarz o BIC) recomienda 7 lags. El BIC es un criterio más conservador que penaliza más la inclusión de parámetros adicionales. Al sugerir 7 lags, el BIC busca un modelo más parsimonioso (más sencillo) que explique la dinámica de los datos con menos lags, sacrificando un poco de ajuste a favor de un modelo más simple y, potencialmente, más robusto.

FPE(n) (Error de Predicción Final) también sugiere 8 lags, lo que indica que usar 8 lags optimiza la predicción del modelo según este criterio.

De acuerdo con lo anterior se utilizará como criterio ocho (8) rezagos, sugerencia en tres de cuatro criterios.

Modelo VAR: Sin la variable hurto (2)

A continuación se presentan los coeficientes estimados del modelo VAR para cada serie; no obstante, considerando que la variable de interés es homicidio, se intepretarán los coeficientes del modelo par la serie homicidios:

## 
## Call:
## lm(formula = y ~ -1 + ., data = datamat)
## 
## Coefficients:
## serie_hom.l1  serie_vio.l1  serie_les.l1  serie_hom.l2  serie_vio.l2  
##      0.12299      -0.02530       0.02391       0.08972       0.00691  
## serie_les.l2  serie_hom.l3  serie_vio.l3  serie_les.l3  serie_hom.l4  
##     -0.01995      -0.00424       0.00666      -0.01336       0.04038  
## serie_vio.l4  serie_les.l4  serie_hom.l5  serie_vio.l5  serie_les.l5  
##     -0.00282      -0.00892       0.02090       0.01501      -0.01521  
## serie_hom.l6  serie_vio.l6  serie_les.l6  serie_hom.l7  serie_vio.l7  
##      0.04600       0.00801      -0.00634       0.03125      -0.00789  
## serie_les.l7  serie_hom.l8  serie_vio.l8  serie_les.l8         const  
##      0.04853      -0.04277      -0.00369      -0.01101      27.34155

Los coeficientes muestran cómo los rezagos (lags) de los homicidios, casos de violencia intrafamiliar y lesiones personales afectan el valor actual de los homicidios:

  • serie_hom.l1 (coeficiente = 0.12299, p-valor = 0.00059): El valor del primer retraso de serie_hom tiene un efecto positivo y altamente significativo sobre el valor actual, lo que indica una fuerte dependencia temporal.
  • serie_vio.l1 (coeficiente = -0.02530, p-valor = 8.6e-05): La violencia intrafamiliar en el primer retraso tiene un efecto negativo y significativo sobre los homicidios actuales.
  • serie_les.l1 (coeficiente = 0.02391, p-valor = 6.1e-06): Las lesiones personales en el primer retraso tienen un impacto positivo y altamente significativo sobre los homicidios actuales.
  • serie_les.l7 (coeficiente = 0.04853, p-valor < 2e-16): El séptimo retraso de serie_les muestra un impacto positivo altamente significativo sobre serie_hom.

Por otra parte el R-cuadrado indica que aproximadamente el 47.8% de la variabilidad en los homicidios está explicada por el modelo, es decir, por sus propios valores pasados y los valores pasados de las otras variables incluidas violencia intrafamiliar y lesiones personales.

El valor de p-value < 2e-16 indica que el modelo es altamente significativo en su conjunto, lo que significa que al menos una de las variables predictoras tiene un efecto significativo sobre la serie de homicidios.

Raices unitarias

##  [1] 0.991 0.981 0.981 0.965 0.965 0.934 0.934 0.921 0.774 0.774 0.752 0.752
## [13] 0.708 0.708 0.687 0.641 0.641 0.638 0.638 0.613 0.613 0.587 0.587 0.481

Raíces del polinomio característico (8 rezagos): De acuerdo con lo anterior todas las raíces tienen un módulo (valor absoluto) menor que 1, entonces el modelo VAR es estable para ocho (8) rezagos.

Prueba de autocorrelación de los residuos (Portmanteau test)

A continuación se realiza la prueba de Portmanteau para validar el supuesto de autocorrelación de los residuales del modelo a partir de la siguiente prueba de hipótesis:

\[ \left\{ \begin{array}{ll} H_{0}: & \text{No hay autocorrelación en los residuos del modelo (los residuos son independientes).} \\ H_{1}: & \text{Hay autocorrelación en los residuos.} \end{array} \right. \]

## 
##  Portmanteau Test (asymptotic)
## 
## data:  Residuals of VAR object var2
## Chi-squared = 109, df = 36, p-value = 3e-09

Dado que el p-valor (3e-09) es menor que 0.05, se rechaza la hipótesis nula, lo que sugiere que hay autocorrelación en los residuos. Esto sugiere que el modelo VAR podría no haber capturado adecuadamente todas las dinámicas de las variables, lo que puede afectar la precisión de las predicciones y las inferencias del modelo.

Prueba de normalidad

A continuación se realiza la prueba de Portmanteau para validar el supuesto de normalidad de los residuales del modelo a partir de la siguiente prueba de hipótesis:

\[ \left\{ \begin{array}{ll} H_{0}: & \text{Los residuos del modelo tienen una distribución normal.} \\ H_{1}: & \text{Los residuos del modelo no tienen una distribución normal.} \end{array} \right. \]

## $JB
## 
##  JB-Test (multivariate)
## 
## data:  Residuals of VAR object var2
## Chi-squared = 4846, df = 6, p-value <2e-16
## 
## 
## $Skewness
## 
##  Skewness only (multivariate)
## 
## data:  Residuals of VAR object var2
## Chi-squared = 66, df = 3, p-value = 3e-14
## 
## 
## $Kurtosis
## 
##  Kurtosis only (multivariate)
## 
## data:  Residuals of VAR object var2
## Chi-squared = 4780, df = 3, p-value <2e-16

Prueba global de normalidad:

El p-valor extremadamente pequeño (< 2e-16) sugiere que hay una fuerte evidencia para rechazar la hipótesis nula de que los residuos tienen una distribución normal. Esto significa que los residuos no son normalmente distribuidos, lo que puede indicar un problema con el ajuste del modelo, como la presencia de outliers, sesgo o una distribución de cola pesada.

Prueba de sesgo (Skewness):

El p-valor pequeño (3e-14) sugiere que hay un sesgo significativo en los residuos. Esto significa que los residuos no están simétricamente distribuidos alrededor de la media, mostrando una asimetría.

Prueba de curtosis (Kurtosis):

El p-valor extremadamente bajo (< 2e-16) indica que hay un problema significativo de curtosis en los residuos. Esto significa que los residuos tienen una curtosis que difiere considerablemente de la normal, lo que podría indicar la presencia de colas más pesadas o más ligeras que una distribución normal.

Prueba de heterocedasticidad

A continuación se realiza la prueba de heterocedasticidad de los residuales del modelo a partir de la siguiente prueba de hipótesis:

\[ \left\{ \begin{array}{ll} H_{0}: & \text{No hay heterocedasticidad en los residuos (los residuos tienen varianza constante).} \\ H_{1}: & \text{Hay heterocedasticidad en los residuos (la varianza de los residuos cambia).} \end{array} \right. \]

## 
##  ARCH (multivariate)
## 
## data:  Residuals of VAR object var2
## Chi-squared = 1594, df = 432, p-value <2e-16

El p-valor extremadamente bajo (< 2e-16) sugiere que hay evidencia significativa de heterocedasticidad condicional en los residuos del modelo. Esto significa que la varianza de los errores no es constante a lo largo del tiempo, lo que indica que los residuos presentan volatilidad que cambia con el tiempo.

Proceso VAR: Sin la variable violencia intrafamiliar (3)

Para saber el número óptimo de rezagos recomendado, se aplican criterios de calidad del modelo, cuyo resultado es el siguiente:

## AIC(n)  HQ(n)  SC(n) FPE(n) 
##     10      8      7     10

De acuerdo con lo anterior se utilizará como criterio diez (10) rezagos, sugerencia en dos de cuatro criterios.

Modelo VAR: Sin la variable violencia intrafamiliar

A continuación se presentan los coeficientes estimados del modelo VAR para cada serie; no obstante, considerando que la variable de interés es homicidio, se intepretarán los coeficientes del modelo par la serie homicidios:

## 
## VAR Estimation Results:
## ========================= 
## Endogenous variables: serie_hom, serie_hur, serie_les 
## Deterministic variables: const 
## Sample size: 1009 
## Log Likelihood: -15199.509 
## Roots of the characteristic polynomial:
## 0.983 0.983 0.977 0.977 0.963 0.945 0.945 0.908 0.814 0.814 0.792 0.792 0.788 0.788 0.783 0.783 0.775 0.775 0.762 0.762 0.762 0.762 0.712 0.712 0.668 0.668 0.569 0.569 0.51 0.263
## Call:
## VAR(y = serie3, p = 10)
## 
## 
## Estimation results for equation serie_hom: 
## ========================================== 
## serie_hom = serie_hom.l1 + serie_hur.l1 + serie_les.l1 + serie_hom.l2 + serie_hur.l2 + serie_les.l2 + serie_hom.l3 + serie_hur.l3 + serie_les.l3 + serie_hom.l4 + serie_hur.l4 + serie_les.l4 + serie_hom.l5 + serie_hur.l5 + serie_les.l5 + serie_hom.l6 + serie_hur.l6 + serie_les.l6 + serie_hom.l7 + serie_hur.l7 + serie_les.l7 + serie_hom.l8 + serie_hur.l8 + serie_les.l8 + serie_hom.l9 + serie_hur.l9 + serie_les.l9 + serie_hom.l10 + serie_hur.l10 + serie_les.l10 + const 
## 
##                Estimate Std. Error t value Pr(>|t|)    
## serie_hom.l1   0.122802   0.035580    3.45  0.00058 ***
## serie_hur.l1   0.003763   0.002249    1.67  0.09455 .  
## serie_les.l1   0.012312   0.004625    2.66  0.00790 ** 
## serie_hom.l2   0.066285   0.035815    1.85  0.06451 .  
## serie_hur.l2   0.006354   0.002518    2.52  0.01177 *  
## serie_les.l2  -0.013811   0.004729   -2.92  0.00357 ** 
## serie_hom.l3   0.017585   0.035815    0.49  0.62355    
## serie_hur.l3  -0.003419   0.002507   -1.36  0.17294    
## serie_les.l3  -0.006091   0.004599   -1.32  0.18564    
## serie_hom.l4   0.054123   0.035702    1.52  0.12985    
## serie_hur.l4   0.003028   0.002370    1.28  0.20163    
## serie_les.l4  -0.010354   0.004162   -2.49  0.01301 *  
## serie_hom.l5   0.028594   0.035718    0.80  0.42358    
## serie_hur.l5  -0.002100   0.002378   -0.88  0.37743    
## serie_les.l5  -0.007231   0.004140   -1.75  0.08102 .  
## serie_hom.l6   0.043128   0.035748    1.21  0.22793    
## serie_hur.l6  -0.000595   0.002374   -0.25  0.80219    
## serie_les.l6   0.002882   0.004155    0.69  0.48814    
## serie_hom.l7   0.023879   0.035702    0.67  0.50376    
## serie_hur.l7  -0.010792   0.002364   -4.57  5.6e-06 ***
## serie_les.l7   0.039990   0.004150    9.63  < 2e-16 ***
## serie_hom.l8  -0.060924   0.035881   -1.70  0.08983 .  
## serie_hur.l8   0.005976   0.002507    2.38  0.01733 *  
## serie_les.l8  -0.012948   0.004812   -2.69  0.00725 ** 
## serie_hom.l9   0.071888   0.035460    2.03  0.04290 *  
## serie_hur.l9  -0.002142   0.002545   -0.84  0.40024    
## serie_les.l9  -0.008345   0.004795   -1.74  0.08207 .  
## serie_hom.l10 -0.083595   0.035206   -2.37  0.01777 *  
## serie_hur.l10  0.003634   0.002276    1.60  0.11075    
## serie_les.l10 -0.000216   0.004456   -0.05  0.96142    
## const         23.726996   3.965506    5.98  3.1e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## 
## Residual standard error: 8.08 on 978 degrees of freedom
## Multiple R-Squared: 0.498,   Adjusted R-squared: 0.483 
## F-statistic: 32.3 on 30 and 978 DF,  p-value: <2e-16 
## 
## 
## Estimation results for equation serie_hur: 
## ========================================== 
## serie_hur = serie_hom.l1 + serie_hur.l1 + serie_les.l1 + serie_hom.l2 + serie_hur.l2 + serie_les.l2 + serie_hom.l3 + serie_hur.l3 + serie_les.l3 + serie_hom.l4 + serie_hur.l4 + serie_les.l4 + serie_hom.l5 + serie_hur.l5 + serie_les.l5 + serie_hom.l6 + serie_hur.l6 + serie_les.l6 + serie_hom.l7 + serie_hur.l7 + serie_les.l7 + serie_hom.l8 + serie_hur.l8 + serie_les.l8 + serie_hom.l9 + serie_hur.l9 + serie_les.l9 + serie_hom.l10 + serie_hur.l10 + serie_les.l10 + const 
## 
##               Estimate Std. Error t value Pr(>|t|)    
## serie_hom.l1    1.0495     0.5094    2.06  0.03964 *  
## serie_hur.l1    0.4491     0.0322   13.95  < 2e-16 ***
## serie_les.l1   -0.2728     0.0662   -4.12  4.1e-05 ***
## serie_hom.l2   -0.8934     0.5128   -1.74  0.08177 .  
## serie_hur.l2    0.0836     0.0360    2.32  0.02063 *  
## serie_les.l2   -0.0680     0.0677   -1.00  0.31547    
## serie_hom.l3   -0.7763     0.5128   -1.51  0.13040    
## serie_hur.l3    0.0350     0.0359    0.97  0.32999    
## serie_les.l3    0.1046     0.0659    1.59  0.11256    
## serie_hom.l4    0.4764     0.5112    0.93  0.35155    
## serie_hur.l4    0.1142     0.0339    3.37  0.00079 ***
## serie_les.l4   -0.0093     0.0596   -0.16  0.87607    
## serie_hom.l5   -1.0120     0.5114   -1.98  0.04810 *  
## serie_hur.l5   -0.0465     0.0340   -1.37  0.17231    
## serie_les.l5    0.2235     0.0593    3.77  0.00017 ***
## serie_hom.l6    0.3876     0.5118    0.76  0.44903    
## serie_hur.l6   -0.0204     0.0340   -0.60  0.54850    
## serie_les.l6    0.0536     0.0595    0.90  0.36778    
## serie_hom.l7   -0.6784     0.5112   -1.33  0.18479    
## serie_hur.l7    0.3399     0.0338   10.04  < 2e-16 ***
## serie_les.l7   -0.5141     0.0594   -8.65  < 2e-16 ***
## serie_hom.l8    0.2396     0.5137    0.47  0.64100    
## serie_hur.l8   -0.1557     0.0359   -4.34  1.6e-05 ***
## serie_les.l8   -0.0185     0.0689   -0.27  0.78885    
## serie_hom.l9    0.3959     0.5077    0.78  0.43572    
## serie_hur.l9    0.0232     0.0364    0.64  0.52511    
## serie_les.l9    0.1213     0.0687    1.77  0.07755 .  
## serie_hom.l10   0.1486     0.5041    0.29  0.76827    
## serie_hur.l10   0.0350     0.0326    1.07  0.28302    
## serie_les.l10  -0.0494     0.0638   -0.77  0.43925    
## const         289.3666    56.7779    5.10  4.2e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## 
## Residual standard error: 116 on 978 degrees of freedom
## Multiple R-Squared: 0.663,   Adjusted R-squared: 0.652 
## F-statistic: 64.1 on 30 and 978 DF,  p-value: <2e-16 
## 
## 
## Estimation results for equation serie_les: 
## ========================================== 
## serie_les = serie_hom.l1 + serie_hur.l1 + serie_les.l1 + serie_hom.l2 + serie_hur.l2 + serie_les.l2 + serie_hom.l3 + serie_hur.l3 + serie_les.l3 + serie_hom.l4 + serie_hur.l4 + serie_les.l4 + serie_hom.l5 + serie_hur.l5 + serie_les.l5 + serie_hom.l6 + serie_hur.l6 + serie_les.l6 + serie_hom.l7 + serie_hur.l7 + serie_les.l7 + serie_hom.l8 + serie_hur.l8 + serie_les.l8 + serie_hom.l9 + serie_hur.l9 + serie_les.l9 + serie_hom.l10 + serie_hur.l10 + serie_les.l10 + const 
## 
##                Estimate Std. Error t value Pr(>|t|)    
## serie_hom.l1    0.11896    0.27519    0.43   0.6656    
## serie_hur.l1    0.09420    0.01739    5.42  7.7e-08 ***
## serie_les.l1    0.21152    0.03577    5.91  4.6e-09 ***
## serie_hom.l2   -0.37559    0.27700   -1.36   0.1754    
## serie_hur.l2    0.00453    0.01947    0.23   0.8161    
## serie_les.l2    0.03037    0.03657    0.83   0.4065    
## serie_hom.l3   -0.34831    0.27701   -1.26   0.2089    
## serie_hur.l3   -0.04073    0.01939   -2.10   0.0359 *  
## serie_les.l3   -0.00596    0.03557   -0.17   0.8669    
## serie_hom.l4   -0.02103    0.27613   -0.08   0.9393    
## serie_hur.l4    0.02254    0.01833    1.23   0.2191    
## serie_les.l4   -0.05115    0.03219   -1.59   0.1124    
## serie_hom.l5    0.05870    0.27625    0.21   0.8318    
## serie_hur.l5    0.02379    0.01840    1.29   0.1962    
## serie_les.l5   -0.01427    0.03202   -0.45   0.6558    
## serie_hom.l6    0.18409    0.27648    0.67   0.5057    
## serie_hur.l6   -0.03125    0.01836   -1.70   0.0891 .  
## serie_les.l6   -0.02581    0.03214   -0.80   0.4221    
## serie_hom.l7    0.30113    0.27613    1.09   0.2758    
## serie_hur.l7   -0.11261    0.01828   -6.16  1.1e-09 ***
## serie_les.l7    0.54608    0.03210   17.01  < 2e-16 ***
## serie_hom.l8   -0.54163    0.27751   -1.95   0.0513 .  
## serie_hur.l8    0.08575    0.01939    4.42  1.1e-05 ***
## serie_les.l8    0.00105    0.03722    0.03   0.9775    
## serie_hom.l9   -0.10213    0.27426   -0.37   0.7097    
## serie_hur.l9   -0.00896    0.01969   -0.46   0.6490    
## serie_les.l9    0.00243    0.03708    0.07   0.9479    
## serie_hom.l10  -0.88577    0.27229   -3.25   0.0012 ** 
## serie_hur.l10  -0.02020    0.01761   -1.15   0.2516    
## serie_les.l10   0.00294    0.03447    0.09   0.9321    
## const         129.58854   30.67049    4.23  2.6e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## 
## Residual standard error: 62.5 on 978 degrees of freedom
## Multiple R-Squared: 0.677,   Adjusted R-squared: 0.667 
## F-statistic: 68.4 on 30 and 978 DF,  p-value: <2e-16 
## 
## 
## 
## Covariance matrix of residuals:
##           serie_hom serie_hur serie_les
## serie_hom      65.2       -62       224
## serie_hur     -62.0     13371     -1049
## serie_les     223.5     -1049      3902
## 
## Correlation matrix of residuals:
##           serie_hom serie_hur serie_les
## serie_hom    1.0000   -0.0664     0.443
## serie_hur   -0.0664    1.0000    -0.145
## serie_les    0.4431   -0.1452     1.000
## 
## Call:
## lm(formula = y ~ -1 + ., data = datamat)
## 
## Coefficients:
##  serie_hom.l1   serie_hur.l1   serie_les.l1   serie_hom.l2   serie_hur.l2  
##      0.122802       0.003763       0.012312       0.066285       0.006354  
##  serie_les.l2   serie_hom.l3   serie_hur.l3   serie_les.l3   serie_hom.l4  
##     -0.013811       0.017585      -0.003419      -0.006091       0.054123  
##  serie_hur.l4   serie_les.l4   serie_hom.l5   serie_hur.l5   serie_les.l5  
##      0.003028      -0.010354       0.028594      -0.002100      -0.007231  
##  serie_hom.l6   serie_hur.l6   serie_les.l6   serie_hom.l7   serie_hur.l7  
##      0.043128      -0.000595       0.002882       0.023879      -0.010792  
##  serie_les.l7   serie_hom.l8   serie_hur.l8   serie_les.l8   serie_hom.l9  
##      0.039990      -0.060924       0.005976      -0.012948       0.071888  
##  serie_hur.l9   serie_les.l9  serie_hom.l10  serie_hur.l10  serie_les.l10  
##     -0.002142      -0.008345      -0.083595       0.003634      -0.000216  
##         const  
##     23.726996

Los coeficientes muestran cómo los rezagos (lags) de los homicidios, hurtos y lesiones personales afectan el valor actual de los homicidios:

  • serie_hom.l1 (coeficiente = 0.122802, p-valor = 0.00058): El primer retraso de serie_hom tiene un efecto positivo y significativo sobre el valor actual de serie_hom. Esto indica una fuerte dependencia temporal en los homicidios; un aumento en el valor anterior de serie_hom se asocia con un aumento en el valor actual.
  • serie_hur.l1 (coeficiente = 0.003763, p-valor = 0.09455): Aunque marginalmente significativo (p-valor cercano a 0.05), el primer retraso de serie_hur muestra un efecto positivo sobre serie_hom, indicando una posible relación débil entre hurtos en el período anterior y homicidios actuales.
  • serie_les.l1 (coeficiente = 0.012312, p-valor = 0.00790): Las lesiones personales en el primer retraso tienen un efecto positivo significativo sobre serie_hom, lo que sugiere una relación entre incidentes de lesiones personales en el período anterior y el número actual de homicidios.
  • serie_hur.l7 (coeficiente = -0.010792, p-valor = 5.6e-06) y serie_les.l7 (coeficiente = 0.039990, p-valor < 2e-16): El séptimo retraso de serie_hur tiene un efecto negativo significativo sobre serie_hom, mientras que serie_les muestra un efecto positivo muy significativo. Esto sugiere que ciertos valores retrasados específicos tienen efectos importantes y duraderos.

Por otra parte el R-cuadrado indica que aproximadamente el 49.8% de la variabilidad en los homicidios está explicada por el modelo, es decir, por sus propios valores pasados y los valores pasados de las otras variables incluidas hurto y lesiones personales.

El valor de p-value < 2e-16 indica que el modelo es altamente significativo en su conjunto, lo que significa que al menos una de las variables predictoras tiene un efecto significativo sobre la serie de homicidios.

Raices unitarias

##  [1] 0.983 0.983 0.977 0.977 0.963 0.945 0.945 0.908 0.814 0.814 0.792 0.792
## [13] 0.788 0.788 0.783 0.783 0.775 0.775 0.762 0.762 0.762 0.762 0.712 0.712
## [25] 0.668 0.668 0.569 0.569 0.510 0.263

Raíces del polinomio característico (8 rezagos): De acuerdo con lo anterior todas las raíces tienen un módulo (valor absoluto) menor que 1, entonces el modelo VAR es estable para ocho (8) rezagos.

Prueba de autocorrelación de los residuos (Portmanteau test)

A continuación se realiza la prueba de Portmanteau para validar el supuesto de autocorrelación de los residuales del modelo a partir de la siguiente prueba de hipótesis:

\[ \left\{ \begin{array}{ll} H_{0}: & \text{No hay autocorrelación en los residuos del modelo (los residuos son independientes).} \\ H_{1}: & \text{Hay autocorrelación en los residuos.} \end{array} \right. \]

## 
##  Portmanteau Test (asymptotic)
## 
## data:  Residuals of VAR object var3
## Chi-squared = 117, df = 18, p-value <2e-16

Dado que el p-valor (<2e-16) es menor que 0.05, se rechaza la hipótesis nula, lo que sugiere que hay autocorrelación en los residuos. Esto sugiere que el modelo VAR podría no haber capturado adecuadamente todas las dinámicas de las variables, lo que puede afectar la precisión de las predicciones y las inferencias del modelo.

Prueba de normalidad

A continuación se realiza la prueba de Portmanteau para validar el supuesto de normalidad de los residuales del modelo a partir de la siguiente prueba de hipótesis:

\[ \left\{ \begin{array}{ll} H_{0}: & \text{Los residuos del modelo tienen una distribución normal.} \\ H_{1}: & \text{Los residuos del modelo no tienen una distribución normal.} \end{array} \right. \]

## $JB
## 
##  JB-Test (multivariate)
## 
## data:  Residuals of VAR object var3
## Chi-squared = 8000, df = 6, p-value <2e-16
## 
## 
## $Skewness
## 
##  Skewness only (multivariate)
## 
## data:  Residuals of VAR object var3
## Chi-squared = 56, df = 3, p-value = 4e-12
## 
## 
## $Kurtosis
## 
##  Kurtosis only (multivariate)
## 
## data:  Residuals of VAR object var3
## Chi-squared = 7944, df = 3, p-value <2e-16

Prueba global de normalidad:

El p-valor extremadamente pequeño (< 2e-16) sugiere que hay una fuerte evidencia para rechazar la hipótesis nula de que los residuos tienen una distribución normal. Esto significa que los residuos no son normalmente distribuidos, lo que puede indicar un problema con el ajuste del modelo, como la presencia de outliers, sesgo o una distribución de cola pesada.

Prueba de sesgo (Skewness):

El p-valor pequeño (4e-12) sugiere que hay un sesgo significativo en los residuos. Esto significa que los residuos no están simétricamente distribuidos alrededor de la media, mostrando una asimetría.

Prueba de curtosis (Kurtosis):

El p-valor extremadamente bajo (< 2e-16) indica que hay un problema significativo de curtosis en los residuos. Esto significa que los residuos tienen una curtosis que difiere considerablemente de la normal, lo que podría indicar la presencia de colas más pesadas o más ligeras que una distribución normal.

Prueba de heterocedasticidad

A continuación se realiza la prueba de heterocedasticidad de los residuales del modelo a partir de la siguiente prueba de hipótesis:

\[ \left\{ \begin{array}{ll} H_{0}: & \text{No hay heterocedasticidad en los residuos (los residuos tienen varianza constante).} \\ H_{1}: & \text{Hay heterocedasticidad en los residuos (la varianza de los residuos cambia).} \end{array} \right. \]

## 
##  ARCH (multivariate)
## 
## data:  Residuals of VAR object var3
## Chi-squared = 1739, df = 432, p-value <2e-16

El p-valor extremadamente bajo (< 2e-16) sugiere que hay evidencia significativa de heterocedasticidad condicional en los residuos del modelo. Esto significa que la varianza de los errores no es constante a lo largo del tiempo, lo que indica que los residuos presentan volatilidad que cambia con el tiempo.

Resumen de validación de los modelos

El siguiente cuadro presenta el resumen de las pruebas de validación de los modelos propuestos.

Modelos Rezagos usados Raices unitarias Autocorrelacion Normalidad Heterocedasticidad
Homicidio ~ Hurto + Lesiones personales + violencia intrafamiliar 8 Modelo estable No No No
Homicidio ~ Lesiones personales + violencia intrafamiliar 8 Modelo estable No No No
Homicidio ~ Lesiones personales + Hurto 10 Modelo estable No No No

Si bien ninguno de los modelos cumple con los supuestos de validación, se procederá con las predicciones y se compararán con los datos de homicidios intencionales observados del 16 al 31 de octubre de 2024.

Pronósticos

Modelo VAR 1: Homicidio ~ Hurto + Lesiones personales + violencia intrafamiliar

La siguiente tabla muestra el pronóstico del modelo con todas las variables del 16 al 31 de octubre de 2024.

##       fcst lower upper   CI
##  [1,] 25.6  9.78  41.3 15.8
##  [2,] 28.2 12.02  44.3 16.1
##  [3,] 30.4 14.05  46.8 16.4
##  [4,] 37.9 21.44  54.4 16.5
##  [5,] 49.2 32.65  65.8 16.6
##  [6,] 43.2 26.51  59.8 16.6
##  [7,] 31.8 15.06  48.5 16.7
##  [8,] 28.3 10.61  46.1 17.7
##  [9,] 30.9 13.08  48.8 17.9
## [10,] 31.5 13.53  49.5 18.0
## [11,] 38.5 20.43  56.6 18.1
## [12,] 47.7 29.53  65.9 18.2
## [13,] 43.7 25.45  61.9 18.2
## [14,] 32.6 14.32  50.9 18.3
## [15,] 29.7 10.86  48.5 18.8
## [16,] 31.4 12.40  50.4 19.0

El gráfico muestra la serie recortada desde el 01 de agosto y hasta el 15 de octubre, mostrando en rojo la predicción del 16 al 31 de octubre.

Modelo VAR 2: Homicidio ~ Lesiones personales + violencia intrafamiliar

La siguiente tabla muestra el pronóstico del modelo con todas las variables del 16 al 31 de octubre de 2024.

##       fcst lower upper   CI
##  [1,] 26.2  10.1  42.3 16.1
##  [2,] 28.0  11.5  44.5 16.5
##  [3,] 30.4  13.8  47.0 16.6
##  [4,] 38.3  21.6  55.0 16.7
##  [5,] 49.1  32.3  65.9 16.8
##  [6,] 42.4  25.5  59.2 16.9
##  [7,] 32.9  15.9  49.8 16.9
##  [8,] 28.8  10.6  47.0 18.2
##  [9,] 30.3  12.0  48.6 18.3
## [10,] 31.9  13.4  50.3 18.4
## [11,] 38.8  20.3  57.3 18.5
## [12,] 47.4  28.9  66.0 18.6
## [13,] 42.9  24.3  61.5 18.6
## [14,] 33.9  15.2  52.6 18.7
## [15,] 30.1  10.8  49.5 19.3
## [16,] 30.9  11.4  50.3 19.5

El gráfico muestra la serie recortada desde el 01 de agosto y hasta el 15 de octubre, mostrando en rojo la predicción del 16 al 31 de octubre.

Modelo VAR 3: Homicidio ~ Lesiones personales + Hurto

La siguiente tabla muestra el pronóstico del modelo con todas las variables del 16 al 31 de octubre de 2024.

##       fcst lower upper   CI
##  [1,] 24.9  9.06  40.7 15.8
##  [2,] 30.4 14.33  46.5 16.1
##  [3,] 29.6 13.28  45.9 16.3
##  [4,] 38.8 22.43  55.2 16.4
##  [5,] 47.9 31.44  64.4 16.5
##  [6,] 43.8 27.28  60.4 16.6
##  [7,] 31.1 14.50  47.7 16.6
##  [8,] 30.2 12.45  48.0 17.8
##  [9,] 29.3 11.48  47.1 17.8
## [10,] 31.7 13.79  49.6 17.9
## [11,] 39.2 21.07  57.2 18.1
## [12,] 47.6 29.41  65.8 18.2
## [13,] 43.5 25.24  61.8 18.3
## [14,] 32.5 14.24  50.8 18.3
## [15,] 30.3 11.36  49.2 18.9
## [16,] 31.1 12.09  50.1 19.0

El gráfico muestra la serie recortada desde el 01 de agosto y hasta el 15 de octubre, mostrando en rojo la predicción del 16 al 31 de octubre.

Resumen de pronósticos de los modelos

El siguiente cuadro presenta un comparativo de los pronósticos realizados por cada modelo y los valores observados entre el 16 y el 31 de octubre.

JuveYell

Resultados y Conclusiones

El análisis realizado tuvo como propósito modelar y pronosticar el número de homicidios intencionales diarios en Colombia desde enero de 2022 hasta mediados de octubre de 2024, utilizando modelos VAR (Vectores Autorregresivos) para considerar la posible influencia de variables como hurtos a personas, lesiones personales y violencia intrafamiliar. Los pronósticos realizados del 16 al 31 de octubre de 2024 fueron contrastados contra datos reales para evaluar la precisión de cada modelo.

Resultados

Comparación de los Modelos VAR:

  • Modelo VAR 1 (Hom ~ Hur + V. Intra + Lesiones): Este modelo mostró una tendencia a sobreestimar ligeramente el número de homicidios en la mayoría de los días, especialmente entre el 19 y el 27 de octubre, donde se observaron diferencias de hasta 5 unidades en comparación con los valores reales. Sin embargo, hacia el final del período pronosticado (30 y 31 de octubre), el modelo mostró un ajuste más cercano.
  • Modelo VAR 2 (Hom ~ V. Intra + Lesiones): Al excluir el componente de hurtos, este modelo tendió a comportarse de manera similar al Modelo VAR 1 en términos de precisión general, pero en algunos casos presentó estimaciones ligeramente más alejadas, particularmente en días con picos más altos de homicidios, como el 20 y 27 de octubre.
  • Modelo VAR 3 (Hom ~ Hur + Lesiones): Este modelo mostró una precisión comparable a los otros dos modelos, con diferencias menores en algunas fechas específicas. Se observó una tendencia más consistente al acercarse al valor real de homicidios en la mayoría de los días pronosticados.
## [1] 40926
## [1] 28601
## [1] 30585

Evaluación de la Variación de los Pronósticos:

La columna de variación muestra las diferencias diarias y la estabilidad relativa entre los modelos. Aunque todos los modelos muestran ciertas desviaciones, ninguno se desvía drásticamente del valor real durante el período pronosticado.

Conclusiones

Influencia de las Variables Independientes:

Los resultados sugieren que las variables de hurto, violencia intrafamiliar y lesiones personales tienen diferentes grados de influencia sobre el número de homicidios diarios, con un impacto más evidente al considerar las combinaciones de variables. Esto respalda la hipótesis inicial de que estos factores están relacionados con la evolución de los homicidios intencionales.

Precisión del Modelo:

Apesar de que ninguno de los modelos pasó las pruebas de validación, los modelos VAR presentan pequeñas desviaciones respecto a los valores reales, su capacidad de capturar relaciones multivariadas y considerar dinámicas de retroalimentación demuestra su utilidad para modelar fenómenos complejos. Los resultados muestran que los tres modelos pueden ser útiles para pronosticar tendencias de homicidios, aunque se podrían explorar modelos adicionales o combinaciones de variables para mejorar la precisión.

Recomendaciones y Aplicaciones Futuras:

El uso de modelos VAR puede servir como herramienta predictiva para ayudar a las autoridades en la planificación y ejecución de políticas públicas orientadas a la prevención del crimen. Los modelos podrían complementarse con análisis de causalidad y retroalimentación entre las variables para identificar intervenciones más efectivas. Dado que los datos de entrada provienen de fuentes oficiales como la Policía Nacional, se recomienda mantener la actualización periódica de estas variables para mejorar la precisión de futuros pronósticos. El análisis mostró que el uso de modelos VAR aporta una visión comprensiva de la dinámica de los homicidios intencionales y su relación con otros delitos. Esto puede ser aprovechado para el diseño de estrategias preventivas y para entender mejor los factores asociados que influyen en la ocurrencia de estos delitos.

Bibliografía

Mancera, A. (2008). Factores socioeconómicos y demográficos de distintas categorías de delitos en Colombia: Prueba desde un panel de datos de las regiones de Colombia. Revista de Economía del Caribe, (2).

Pérez, A., Madera, W., Cortés, J., Ortiz, S., & Taborda, A. (2024). Correlación de las modalidades de homicidio con los delitos de impacto en cuadrantes atípicos de la Policía Nacional de Colombia. En J. Lozano Medina (Ed.), Analítica de datos para la seguridad ciudadana (pp. 113-140). Editorial de la Dirección de Educación Policial de la Policía Nacional de Colombia. https://doi.org/10.22335/y1jrrh33

Sandoval, L. E. (2014). Transición demográfica, condición económica y tasa de homicidio. El caso de Colombia, 1990-2013. Ecos de Economía, 18(39), 97-111.

Sánchez Torres, F. J., & Núñez Méndez, J. A. (2001). Determinantes del crimen violento en un país altamente violento: el caso de Colombia.