Introducción

En el presente informe se analizan las muertes por accidentes de tránsito en Israel entre 2005 y 2020, utilizando técnicas de series de tiempo para identificar patrones, entender tendencias y predecir comportamientos futuros. Este tipo de análisis es fundamental para planificar estrategias que ayuden a reducir la incidencia de estos accidentes y sus consecuencias. A lo largo del periodo estudiado, los accidentes de tránsito en Israel han representado un desafío constante para la seguridad pública, afectando tanto el ámbito urbano como el rural. A través de este informe, se busca no solo comprender las dinámicas locales, sino también conectar este problema con iniciativas globales que buscan salvar vidas y mejorar la movilidad en general.

En un contexto global, la seguridad vial es una prioridad reconocida por organismos internacionales como las Naciones Unidas, que establecieron en los Objetivos de Desarrollo Sostenible (ODS) la meta de reducir a la mitad las muertes y lesiones por accidentes de tránsito para 2030. En Israel, factores como el crecimiento de la población, el aumento del parque automotor y la urbanización acelerada han contribuido a este problema. Además, los picos de movilidad durante festividades nacionales, como el Yom Kipur o el Pésaj, aumentan el riesgo de accidentes en carreteras y zonas urbanas densas. A esto se suman desafíos específicos de las zonas rurales, donde las velocidades más altas y la menor supervisión vial incrementan el peligro.

El análisis de las muertes por accidentes de tránsito no solo es relevante para abordar un problema nacional, sino también para evaluar el progreso de Israel frente a estándares internacionales de seguridad vial. Las series de tiempo permiten identificar tendencias, como el impacto de políticas públicas o cambios en la infraestructura vial, y prever periodos críticos donde el riesgo de accidentes es más alto. Este conocimiento no solo ayuda a diseñar estrategias preventivas, sino también a distribuir recursos de manera más eficiente, tanto en el ámbito urbano como rural.

En el ámbito práctico, las predicciones generadas a partir de este análisis tienen implicaciones directas en la toma de decisiones estratégicas. Por ejemplo, permiten planificar medidas específicas durante eventos masivos, mejorar la señalización en zonas de alto riesgo o ajustar las políticas de control vehicular. Además, este enfoque facilita la comparación de Israel con otros países, lo que abre la posibilidad de adoptar mejores prácticas internacionales para mejorar la seguridad vial.

Este informe busca no solo entender las tendencias históricas, sino también ofrecer herramientas predictivas que apoyen la planificación y gestión de la seguridad vial en Israel, contribuyendo así al cumplimiento de metas globales y nacionales para reducir la mortalidad en accidentes de tránsito.

Metodología

El objetivo de este estudio es modelar una serie temporal utilizando el método ARIMA, un enfoque estadístico ampliamente utilizado para analizar y predecir series temporales. Para llevar a cabo este análisis, se construyó una base de datos a partir de información proporcionada por la Organización para la Cooperación y el Desarrollo Económicos (OECD), seleccionando como variable de interés el número de muertes por accidentes de tránsito en Israel. El rango temporal abarca datos mensuales desde 2005 hasta 2020, con el propósito de construir una línea de tiempo que permita visualizar la evolución de esta variable a lo largo de los años.

En primera instancia, se generó una gráfica inicial para identificar patrones de tendencia y estacionalidad en la serie temporal. Posteriormente, se aplicó la prueba de Dickey-Fuller aumentada (ADF) con el fin de evaluar si la serie es estacionaria. En caso de que no cumpliera con este requisito, se aplicaron diferenciaciones a los datos para eliminar tendencias y patrones estacionales, ya que la estacionariedad es un requisito esencial para el modelo ARIMA. Tras la diferenciación, se volvió a aplicar la prueba ADF para confirmar que la serie se había estacionarizado correctamente.

Una vez garantizada la estacionariedad, la serie se dividió en dos subconjuntos: un conjunto de entrenamiento, utilizado para ajustar los modelos, y un conjunto de prueba, empleado para evaluar el desempeño del modelo final. Durante el ajuste del modelo ARIMA, se probaron diversas configuraciones para los parámetros \(p\) (términos autorregresivos), \(d\) (diferenciaciones necesarias para estacionarizar la serie) y \(q\) (términos de media móvil), con el objetivo de identificar la configuración más adecuada.

Además, se observó un patrón recurrente cada 12 meses, lo que llevó a tomar un rezago (\(k\)) de 12 al analizar la función de autocorrelación (ACF) y la función de autocorrelación parcial (PACF). Este proceso también incluyó la evaluación de los residuos, que debían asemejarse a ruido blanco, y el análisis de métricas de ajuste para seleccionar el modelo más óptimo.

Finalmente, el modelo seleccionado fue utilizado para generar pronósticos, los cuales se compararon con los valores reales del conjunto de prueba. Esta comparación permitió evaluar la precisión del modelo y validar su capacidad para realizar predicciones confiables.

Serie Temporal

La serie temporal obtenida a partir de la variable del número de muertes por accidentes de tránsito en Israel, arrojó picos altos en distintos años, empezando por 2005 en el mes de Marzo, época en donde hubo una gran inestabilidad política, violencia en diversos territorios y finalmente se presenció el proceso de retirada de la Franja de Gaza, el cual fue parte de un plan aprobado en el mes de febrero del mismo año, como Ley de Implementación del Plan de Desconexión; a pesar de no encontrarse una relación directa con la variable escogida, se debe tener presente que debido a todos los cambios políticos y sociales ocurrieron varias protestas, bloqueos y un gobierno que se enfocó en otras prioridades.

El segundo pico, ocurrió dos años después, momento en donde la situación política seguía en estado de alerta, empezando por el hecho de que un año antes había terminado la guerra de Líbano, lo cual a pesar de todo dejó tensiones en el territorio; en segundo puesto estaría la situación de Gaza, en donde de igual manera se seguían formando tensiones, las cuales aunmentarían meses después, ya que un movimiento militante islamista tomaría el control del lugar, este hecho no afectaría de forma directa a Israel, pero fue un factor que influyó en su comunidad, sobretodo por que en ese tiempo se presentaba una división interna que currió por factores como el descontento por parte de sus habitantes frente al manejo que estaba llevando su gobierno, generando luego protestas y disturbios. Se relacionaron estos conflictos políticos y sociales a la variable, siguiendo el enfoque del anterior pico.

Por último, el tercer pico ocurrió en diciembre del siguiente año, en donde a finales de ese mes empezó la operación plomo fundido en Gaza, conflicto que provocó grandes cambios sociales y políticos, además de muertes y desplazamientos forzados, teniendo como resultado un crisis humanitaria en el territorio de Gaza; de forma interna en Israel, se estaban llevando a cabo campañas electorales, adicionalmente provocando aún más desconfianzas hacia el gobierno que estaba en ese momento en el poder.

De forma un poco más general, las cifras más altas de accidentes que se observaron, se ubicaron temporalmente entre el 2005 y el 2008, esto muy probablemente debido a los disturbios sociales y las situaciones políticas ocurridas; luego en los próximos años, se evidenció un descenso en estos valores, presentando picos más constantes.

Estadísticas Descriptivas

Según la base de datos encontrada, la variable de número de muertos por accidentes de tráfico en Israel tiene un promedio de 30.7 , en cuanto a la dispersión de los datos, se obtuvo una desviación de 7.3 lo que termina sugiriendo que no se encuentran muy dispersos; ya por último el CV resultó de 23,79%, expresando una variabilidad moderada.

Por otro lado, en el siguiente gráfico, se puede visualizar la dispersión de dichos datos, evidenciando en el camino el valor de la mediana y dos de los picos, anteriormente descritos, correspondiendo a datos atípicos.

Cabe recalcar, que la serie temporal presentada es estacional, ya que se observa cierto grado de repetición, en este caso identificando una tendencia que ocurre cada 12 meses, especialmente en los primeros años

Modelo

Prueba de Hipótesis

A continuación se evaluarán dos enfoques para el modelado de series de tiempo: un modelo ARIMA seleccionado manualmente con base en las funciones de autocorrelación (ACF) y autocorrelación parcial (PACF), y el modelo generado automáticamente mediante la función auto.arima. Ambos modelos serán comparados mediante un análisis de residuos y métricas de ajuste. Finalmente, se eligirá el modelo con mejor desempeño, sobre el cual se realizarán los pronósticos y se evaluarán las medidas de precisión.

## 
##  Augmented Dickey-Fuller Test
## 
## data:  Entrenamiento
## Dickey-Fuller = -2.2359, Lag order = 12, p-value = 0.4777
## alternative hypothesis: stationary

En primer lugar, se aplicó la prueba de Dickey-Fuller a la serie original, la cual arrojó un valor p de 0.4777. Este resultado llevó a aceptar la hipótesis nula (H0), lo que indica que la serie no es estacionaria. Dado que el objetivo es trabajar con una serie estacionaria, será necesario aplicar una diferenciación, lo cual implicará la pérdida de un dato.

Tras esta transformación, se reevaluará la estacionariedad de la serie mediante una nueva aplicación de la prueba de Dickey-Fuller, garantizando que se cumplan las condiciones necesarias para el modelo ARIMA.

Gráfica del ACF de la serie sin diferenciar

De igual forma se procedió a observarla función de autocorrelación (ACF) de la serie original, sin aplicar diferenciación, con el objetivo de observar el comportamiento de sus rezagos, para de esta forma compararlo con la diferenciación que se realizará más adelante

Como se preveeia se observan varios rezagos que salen de limite de error de la autocorrelación. Ahora, tras observar la función de autocorrelación de la serie original, se aplicará una diferenciación para transformar la serie en estacionaria, observar su nuevo comportamiento y evaluar con el test de Dickey Fuller para saber si se necesitará repetir el proceso.

## 
##  Augmented Dickey-Fuller Test
## 
## data:  Entrenamientoserie
## Dickey-Fuller = -3.9056, Lag order = 5, p-value = 0.01561
## alternative hypothesis: stationary

En esta ocasión La prueba de Dickey Fuller, el resultado del test arrojó un valor p de 0.015, lo que permitió rechazar la hipótesis nula (H0) y aceptar la hipótesis alternativa (H1). Esto confirma que, tras la diferenciación, la serie es estacionaria y no se requieren más transformaciones adicionales.

Gráfica del ACF de la serie diferenciada

Finalmente, se generó la nueva gráfica de autocorrelación (ACF) para la serie diferenciada.

En comparación con la ACF de la serie original, la diferenciación redujo significativamente los patrones de dependencia temporal. En la serie transformada, únicamente se observaron dos rezagos que sobrepasan el límite, de los cuales uno presenta un valor muy bajo que puede considerarse despreciable.

Esta reducción en los rezagos indica que la diferenciación logró eliminar gran parte de la estructura de dependencia en los datos, dejando una serie más adecuada para el modelado ARIMA.

Modelos elegidos

El primer modelo se definió a partir del análisis de las funciones de autocorrelación (ACF) y autocorrelación parcial (PACF) de la serie diferenciada. Los valores de los parámetros p, q y d fueron seleccionados con base en la observación de los rezagos significativos en las gráficas correspondientes:

Se seleccionaron los valores de p, q y d como 1. El valor de p se determinó a partir de la gráfica de autocorrelación parcial (PACF), mientras que el valor de q se obtuvo de la gráfica de autocorrelación (ACF). Finalmente, el valor de d corresponde al número de diferenciaciones necesarias para lograr la estacionariedad, que en este caso fue igual a 1.

El segundo modelo fue generado mediante la función auto.arima, la cual selecciona los parámetros óptimos basándose en criterios estadísticos como AIC y BIC.

L-Jung Box y residuos

Una vez obtenidos los dos modelos, procedemos a comparar su efectividad evaluando los residuos y realizando pruebas adicionales para determinar cuál ofrece un mejor ajuste y desempeño predictivo:

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(1,1,1)
## Q* = 5.4109, df = 8, p-value = 0.7129
## 
## Model df: 2.   Total lags used: 10

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(0,1,1)
## Q* = 6.488, df = 9, p-value = 0.6903
## 
## Model df: 1.   Total lags used: 10

El primer criterio utilizado para evaluar los modelos fue la prueba de Ljung-Box, cuya hipótesis nula (H0) establece que los residuos del modelo son independientes. En ambos casos, el resultado de la prueba permitió aceptar la hipótesis nula, lo que sugiere que los residuos son independientes y que los modelos no presentan autocorrelación significativa. Además, al examinar los residuos y sus gráficos, se observó un comportamiento similar entre los modelos, con una autocorrelación bien ajustada en ambos.

Por lo tanto, ambos modelos son adecuados y, con base en este análisis, se puede proceder a seleccionar el modelo más apropiado para el pronóstico.

Accuracy

Luego, se compararon los dos modelos utilizando la función accuracy, que calcula varias métricas para evaluar la precisión de los pronósticos. Las métricas evaluadas incluyen ME (Error Medio), RMSE (Raíz del Error Cuadrático Medio), MAE (Error Absoluto Medio), MPE (Porcentaje de Error Medio), MAPE (Porcentaje de Error Absoluto Medio), y MASE (Error Absoluto Escalonado).

Los resultados de estas métricas se presentan a continuación para ambos modelos:

##                     ME     RMSE      MAE       MPE     MAPE      MASE
## Training set -0.666627 6.560035 5.270941 -6.632849 18.58818 0.7323116
##                     ACF1
## Training set -0.02054438
##                     ME     RMSE      MAE       MPE     MAPE      MASE
## Training set -0.694891 6.583659 5.283537 -6.745135 18.58037 0.7340617
##                     ACF1
## Training set -0.09119907

Al observar los valores de MAE, RMSE y MAPE, se concluyó que el Modelo 1 presenta un desempeño ligeramente superior en cuanto a precisión de los pronósticos. En particular, el Modelo 1 muestra valores más bajos en las métricas de error, lo que indica un mejor ajuste a los datos y una menor desviación en los pronósticos.

En base a esta comparación, el Modelo 1 es el más adecuado para continuar con los pronósticos, ya que ofrece mejores resultados en las métricas clave de evaluación.

## Series: Entrenamiento 
## ARIMA(1,1,1) 
## 
## Coefficients:
##           ar1      ma1
##       -0.0930  -0.8735
## s.e.   0.0837   0.0401
## 
## sigma^2 = 43.79:  log likelihood = -568.89
## AIC=1143.78   AICc=1143.92   BIC=1153.22
## Series: Entrenamiento 
## ARIMA(0,1,1) 
## 
## Coefficients:
##           ma1
##       -0.8918
## s.e.   0.0327
## 
## sigma^2 = 43.85:  log likelihood = -569.5
## AIC=1143   AICc=1143.07   BIC=1149.29

También se analizó el AICc de cada modelo para obtener una visión más completa y guiarnos en la selección final. Los resultados mostraron que el Modelo 1 proporcionó valores más certeros en comparación con el Modelo 2, lo que lo hizo superior al modelo generado por auto.arima.

Por lo tanto, basándonos en el Modelo 1, realizamos los pronósticos para los datos comprendidos entre junio de 2019 y enero de 2020.

Pronóstico

##     Point Forecast    Lo 95    Hi 95
## 174       27.08993 14.11955 40.06032
## 175       26.70952 13.73187 39.68716
## 176       26.74490 13.66899 39.82080
## 177       26.74161 13.58091 39.90231
## 178       26.74191 13.49582 39.98801
## 179       26.74189 13.41105 40.07272
##            [,1]
## 2019-06-01   29
## 2019-07-01   33
## 2019-08-01   31
## 2019-09-01   24
## 2019-10-01   38
## 2019-11-01   28
## 2019-12-01   42
## 2020-01-01   24

En la tabla de pronóstico, se presentan los valores proyectados para los seis períodos futuros, con un intervalo de confianza del 95%. La columna “Point Forecast” muestra las muertes por accidentes de tránsito pronosticadas, mientras que las columnas “Lo 95” y “Hi 95” indican los límites inferior y superior del intervalo de confianza.

Para este análisis, se pronosticaron las siguientes muertes por accidentes de tránsito: 27.09 en el primer período, 26.71 en el segundo, 26.74 en el tercero, 26.74 en el cuarto, 26.74 en el quinto y 26.74 en el sexto. Aunque se observan algunas pequeñas fluctuaciones, los pronósticos se mantienen dentro del margen de error aceptable. La diferencia más significativa fue de 3 unidades (de 39 a 42), lo que no representa una desviación considerable y puede considerarse dentro del rango de precisión esperado.

Análisis gráfica del pronóstico

Por último, procedemos a analizar la gráfica de pronósticos que muestra los valores proyectados con el intervalo de confianza del 95%. En ella,la zona sombreada de tonos azules indica el rango de incertidumbre de las predicciones, donde la zona más clara representa un intervalo de confianza más amplio y la zona más oscura muestra un intervalo de confianza más estrecho.

En la gráfica, se observa que la línea de pronóstico se mantiene estable a lo largo de los períodos, sin mostrar grandes picos, lo que indica que el modelo proyecta una tendencia constante en las muertes por accidentes de tránsito.

Conclusiones

  • Aunque el modelo muestra estabilidad, es posible que los datos históricos y las pequeñas fluctuaciones que observamos estén influenciados por cosas que el modelo no toma en cuenta, como cambios en las carreteras, nuevas políticas de seguridad vial o incluso cambios en el comportamiento de las personas al manejar. Estos factores externos podrían estar afectando los resultados.

  • Por otro lado, aunque auto.arima hace que todo el proceso de elegir parámetros sea más sencillo, el análisis manual usando ACF y PACF dio un modelo más sólido. Esto deja claro que combinar herramientas automáticas con un toque personalizado puede darnos mejores resultados.

  • Las series temporales tienen características de patrones estacionales y recurrentes, que se manejan diferenciando y analizando funciones de autocorrelación. Esto le permite identificar retrasos relevantes, como períodos de 12 meses que pueden verse afectados por días festivos y cambios en la liquidez en determinadas épocas del año.

  • El modelo ARIMA(1,1,1) seleccionado demostró ser eficaz para capturar la dinámica de las series y crear pronósticos a corto plazo. La evaluación de los residuales confirma que el modelo cumple con el supuesto de ruido blanco, lo que valida su uso para explicar y predecir el desarrollo de accidentes fatales.

  • Los resultados obtenidos tienen consecuencias prácticas en la planificación de la política nacional. Estos pronósticos pueden identificar períodos clave en los que se necesitan mayores medidas de prevención, como campañas de concientización, mayor señalización vial y vigilancia en áreas de alto riesgo.

  • Además de comprender la dinámica local, este estudio evalúa el progreso de Israel en la reducción de las muertes por accidentes de tránsito en el marco de los Objetivos de Desarrollo Sostenible (ODS). Los vínculos con estándares internacionales abren oportunidades para implementar mejores prácticas de seguridad vial en situaciones similares.

Referencias