Resumen

Trabajo final de la materia ciencia de los datos de la Especialización en Analítica de la Universidad Nacional de Colombia sede Medellín. Este trabajo final consistió en realizar, a partir de las bases de datos de accidentalidad de la Alcaldía de Medellín, un informe técnico y una aplicación que permitiera conocer sobre el comportamiento de la accidentalidad en la ciudad. Para esto, partimos del siguiente supuesto: el Concejo de Medellín, en el marco de un debate de control político, la bancada citante realizó una petición a la Secretaría de Movilidad de Medellín para que respondiera una serie de preguntas que permitira a los concejales tener un panorama sobre la accidentalidad en la ciudad.

Introducción

La plenaria de el Concejo de Medellín aprobó la realización de una sesión ordinaria dedicada a “Analizar la situación de accidentalidad en la ciudad entre los años 2014 y 2018” . Los concejales de la bancada citante invitaron a la Secertaría de Movilidad de Medellín para que respondieran el siguiente cuestionario:
  1. ¿Cuál ha sido el comportamiendo de la accidentalidad en Medellín durante los años 2014, 2015, 2016, 2017 y 2018?
  2. ¿Cuáles meses del año o épocas son las presentan mayor cantidad de accidentes en Medellín?
  3. ¿Qué tipos de accidentes han tenido mayor recurrencia?
  4. ¿Qué afectaciones han dejado los accidentes en Medellín?
  5. ¿Cuáles han sido los días de la semana que presentan mayor accidentalidad?
  6. ¿Qué tipos de vías son las más propensas a tener accidentes?
  7. ¿Qué horas son las mas propensas a tener accidentes?
Este documento técnico, además de responder las anteriores preguntas realizadas por los honorables concejales, hace una descripción del manejo de datos realizado, el cual se ajusta a las variables e información que proporcionan las bases de datos.

La base de datos

Los datos para realizar este reporte fueron tomados del portal institucional de datos abiertos GeoMedellin

Se unificaron los datos para los años 2014, 2015, 2016, 2017, 2018 y 2019. Posterior al análisis inicial que realizó el equipo se decide solo tomar los años 2014, 2015, 2016, 2017, 2018 ya que son los años donde se cuenta con información completa.

Preparación de los datos

  • Con el fin de tener una base de datos menos pesada, se decide eliminar aquellos campos que no poseen información relevante para el analisis planetado, asi las cosas se eliminan los campos: OBJECTID, RADICADO, DIRECCION_ENC, CBML, TIPO_GEOCOD, MES_NOMBRE.

  • Se realiza renombre de las variables dejando la base de datos con los siguientes campos renombrados: hora, dia_semana, anno, clase_acc, direccion, gravedad_acc, barrio, comuna, tipo_via, mes, dia, fecha, latitud y longitud.

  • Se realiza cambio de formato a la fecha dejando este campo en formato Año-mes-dia

  • Se realiza limpieza mediante la funcion gsub al campo clase_acc, con el fin de dejar estandarizados los registros.

  • Se realiza limpieza mediante la funcion gsub al campo gravedad_acc, con el fin de dejar estandarizados los registros.

  • Se realiza limpieza mediante la funcion gsub al campo nom_mes, con el fin de dejar estandarizados los registros.

  • Se realiza limpieza mediante la funcion gsub al campo barrios, con el fin de dejar estandarizados los registros (se crea el campo barrios a partir del campo barrio).

  • Se realiza limpieza mediante la funcion gsub al campo comunas, con el fin de dejar estandarizados los registros (se crea el campo barrios a partir del campo comuna).

  • En este punto, procedemos nuevamente a eliminar algunos campos que ya no tienen uso: acci_total, barrio, comuna.

  • Se realiza un filtro a la base de datos, para trabajar solo con aquellos registros cuyo campo comunas, este bien clasificada con alguna de las comunas de la ciudad: Popular, Santa Cruz, Manrique, Aranjuez, Castilla, Doce de Octubre, Robledo, Villa Hermosa, Buenos Aires, La Candelaria, Laureles Estadio, La America, San Javier, El Poblado, Guayabal, Belen.

  • Se procede a crear el campo hora_acc (a partide del campo hora), para realizar analisis sobre las horas de los accidentes.

  • Se elimina el campo hora, pues ya no tiene uso este.

  • Se realiza renombre de algunas variables para mayor entendimiento posterior: barrios pasa a llamarse barrio, comunas pasa a llamarse comuna y hora_acc pasa a llamarse hora.

  • Por último se eliminan aquellas variables y dataframes que hicieron parte del proceso de limpieza pero ya no tienen mas uso, para posteriormente exportar la base final llamada acci_total_fil, con la cual se realizaran los analisis y la aplicación Shiny.

Respuestas al cuestionario

Comportamiendo de la accidentalidad durante los años 2014, 2015, 2016, 2017 y 2018

Para responder a la pregunta ¿Cuál ha sido el comportamiendo de la accidentalidad en Medellín durante los años 2014, 2015, 2016, 2017 y 2018?, se tomó la base de datos completa filtrando el número de accidentes por año y se graficó por medio de barras como se muestra acontinuación:


  • Como se puede observar el número de accidentes por año no ha presentado variaciones representativas en cuanto a su aumento o disminución en el horizonte de tiempo estudiado, se presentan aproximadamente 40.000 accidentes por año, el año con mayor accidentalidad ha sido el 2016 con 41.798 accidentes y el año de menor accidentalidad ha sido el 2018 con 39.066.

Meses del año o épocas son las presentan mayor cantidad de accidentes

Para conocer las épocas del año o meses en las cuales se presenta mayor cantidad de accidentes fue necesario desagregar los anteriores datos por mes, estos se ubicaron en una tabla con el fin de hacer una evaluación no solo mensual sino también a través del horizonte de tiempo analizado:

Consolidado número de accidentes por mes y por año
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
2014 2908 3179 3747 3335 3595 3319 3532 3473 3452 3361 3213 3395
2015 2858 3196 3520 3344 3586 3175 3592 3638 3684 3562 3285 3499
2016 2947 3446 3494 3523 3486 3280 3508 3793 3663 3754 3475 3429
2017 3048 3385 3498 3236 3612 3324 3503 3757 3649 3475 3310 3398
2018 2856 3147 3241 3271 3414 3200 3233 3481 3343 3404 3178 3298

  • Como se puede observar en la anterior tabla, los meses o épocas con mayor accidentaidad son las mismas durante los 5 años analizados, como era de esperarse fin de año presenta una gran accidentalidad debido a celebraciones irresponsables, viajes, entre otros, de igual manera los meses en los que hay vacaciones o recesos en colegios, universidades y empresas presentan altos numero de accidentalidad como Marzo, Julio y Agosto. De lo anterior se puede inferir que celebraciones nacionales y épocas de descanso aumentan la probabilidad de sufrir accidentes, por ende se puede aumentar la intensidad de políticas preventivas en estos meses.

Tipos de accidentes han tenido mayor recurrencia

Los tipos de accidentes dentro de los registros se han clasificado como atropello, caida de ocupante, choque, volcamiento y otro. Es importante aclarar que estos tipos de accidente no se encuentran discriminados por tipo de vehículo, ya que la base de datos no contaba con esta información.


  • Como se puede observar en este gráfico los choques han sido el tipo de accidente con mayor frecuencia en el horizonte de tiempo representando, más del 50% para todos los años, desafortunadamente los datos tomados no permiten hacer la diferencia en cuanto al tipo de vehículo que ha estado involucrado en los choques, sin embargo, esta es una señal de que las estrategias de mitigación deben estar dirigidas a factores viales que pueden generar choques como: exceso de velocidad, grados de alcoholemia del conductor y ocupantes, acciones irresponsables en la carretera, etc.

Afectaciones han dejado los accidentes

Los daños provocados por la accidentalidad en Medellín se evaluaron y clasificaron con base a su gravedad discriminada en: muertes, heridos y solo daños. Esto teniendo en cuenta que tanto las muertes como heridos pueden afectar el sistema de salud del país.


  • Las muertes ocasionadas por accidentes en los años 2014, 2015, 2016, 2017 y 2018 han sido bajas en comparación a los heridos y daños. La cantidad de heridos generan un aumento en los costos que debe asumir el sistema de salud, además, de los colapsos que pueden haber en centros de salud por exceder en algunas ocasiones su capacidad de atención.

Días de la semana que presentan mayor accidentalidad

Para determinar el día de la semana con mayor accidentalidad se elaboró una gráfica de barras con datos acumulados durante cada año, así se verifica este comportamiento por día y año.


  • Como se puede observar el día con menor accidentalidad durante los 5 años son los lunes, mientras que los días con mayor accidentalidad son los domingos, viernes y jueves.

Tipos de vías son las más propensas a tener accidentes

Para analizar el tipo de via propenso a ocurrencia de accidentes se realizó la siguiente clasificación, para ser organizados en una tabla por año:

  • Ciclo Ruta
  • Glorieta
  • Interseccion
  • Lote o Predio
  • Paso a Nivel
  • Paso Elevado
  • Paso Inferior
  • Pont n
  • Puente
  • Tramo de Via
  • Tunel
  • Via peatonal

Consolidado número de accidentes por mes y por año
V1 Ciclo Ruta Glorieta Interseccion Lote o Predio Paso a Nivel Paso Elevado Paso Inferior Pont—n Puente Tramo de via Tunel Via peatonal
2014 241 186 701 5256 1021 12 128 61 2 89 32801 0 11
2015 240 92 750 5716 1138 5 98 40 2 81 32768 2 7
2016 223 91 901 6072 1509 7 151 66 3 110 32643 4 18
2017 135 188 1356 8128 4542 21 311 143 10 195 26151 9 6
2018 189 130 1285 7792 5717 37 296 151 2 206 23248 8 5

  • Como se puede observar los lugares con mayor accidentalidad son las vías, glorietas, intersecciones y lotes o predios, estos lugares necesitan mayor atención del conductor debido a que pueden presentar congestión vehicular, exceso de velocidad, maniobras peligrosas y eventos imprevistos.

horas son las mas propensas a tener accidentes

Para determinar las horas del día donde ocurren más accidentes se realizó un mapa de calor que revela la hora y el día de la semana con mayor número de accidentes el los años analizados.


  • De lunes a viernes las horas con mayor accidentalidad son las 5 de la mañana y de 4 a 5 de la tarde. En la madrugada los conductores pierden cuidado debido a que piensan que hay pocos vehículos en la carretera y el riesgo disminuye, en las horas de la tarde el tráfico vehícular aumenta debido a que termina la jornada laboral.

Dashboard y mapa de visualización

Como forma de complementar este informe técnico sobre la accidentalidad en la ciudad, se creó una aplicación que muestra una representación gráfica de las principales métricas que intervienen en esta base de datos, la cual puede ser consultada y filtrada por comuna y barrio de la ciudad.

En la aplicacion los concejales podrán identificar en graficos interactivos, las clases de accidente presentados en funcion de días, asi como la gravedad de dicho accidente, su consulta la podran realizar ya sea por barrio o comuna y seleccionando el periodo a consultar. Adicional podran encontrar también un consolidado general del total de accidentes de ese barrio o comuna por los 5 periodos aquí procesados.

Finalmente, en la pestaña de “Mapa”, podrán observar de manera interactiva las clases de accidente graficados en el mapa de la ciudad y con las opciones de acercamiento/alejamiento, podrán ver las agrupaciones por las clases de accidentes, lo cual puede ayudar a entender de mejor manera la problematica de la accidentalidad en Medellín.

Puede consultar aplicaciòn aquí