Logo de Collision

1 Breve introducción

En este documento se abordará una breve descripción relaciondada con la base de datos sobre la accidentalidad vehicular en la ciudad de Medellín entre los años 2014 y 2020, haciéndo énfasis en las variables más relevantes de esta base de datos como lo son la fecha de ocurrencia, las comunas y los barrios en los que se dan los incidentes y el tipo de accidentalidad sucedida, entre otros. Esto con el propósito de tener un acercamiento inicial a esta base de datos como parte del primer proyecto del curso de Técnicas de Aprendizaje Estadístico del semestre 2021-2 de la Universidad Nacional de Colombia, sede Medellín.

Característica Formato Observación uno
Fecha del accidente Factor 2014-12-13 17:00:00
Año Doble 2014
Mes Factor Diciembre
Fecha Fecha 2014-12-13
Hora Factor 17:00:00
Clase de accidente Factor Atropello
Diseño Factor Tramo de vía
Gravedad del accidente Factor Con heridos
Barrio Factor Los Ángeles
Comuna Factor NA
Coordenada x, Magna Doble 838649.
Coordenada Y, Magna Doble 1180876
Longitud Doble -75.53534
Latitud Doble 6.229826
Comunas modificado Carácter La Candelaria
Día modificado Entero 13
Mes modificado Doble 12
Año modificado Doble 2014
Semana modificado Doble 50
Semana modificado II Carácter 50
Día semana Carácter Sábaddo
Mes semana Carácter Diciembre
Festivo Doble 0
Flores Doble 0
Fútbol Doble 0
Quincena Doble 0
Puente Doble 0

2 Descripción general de la base de datos

La base de datos de accidentalidad de Medellín recoge todos los accidentes que sucedieron en la ciudad de Medellín, Antioquia (Colombia) entre el lunes 14 de julio de 2014 y el lunes 31 de agosto de 2020, recogiendo algunos aspectos de cada uno de estos incidentes viales como la clase de accidente observado, la dirección en la que ocurrió, el código del expediente y su número de radicado, la fecha y hora y la ubicación en coordenadas geográficas. En general, las variables a considerar por esta base de datos son las siguientes:

3 Descripción general

A continuación se puede observar una descripción general de las variables más importantes de esta base de datos.

Data Frame Summary

accidentes

Dimensions: 250609 x 27
Duplicates: 190
No Variable Stats / Values Freqs (% of Valid) Graph Valid Missing
1 FECHA_ACCIDENTE [factor]
1. (Empty string)
2. 2014-07-04 05:40:00
3. 2014-07-04 06:50:00
4. 2014-07-04 07:10:00
5. 2014-07-04 08:15:00
6. 2014-07-04 08:20:00
7. 2014-07-04 09:40:00
8. 2014-07-04 10:00:00
9. 2014-07-04 10:30:00
10. 2014-07-04 10:40:00
[ 167371 others ]
3(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
250597(100.0%)
250609 (100.0%) 0 (0.0%)
2 AÑO [numeric]
Mean (sd) : 2017 (1.8)
min ≤ med ≤ max:
2014 ≤ 2017 ≤ 2020
IQR (CV) : 3 (0)
2014:20728(8.3%)
2015:42642(17.0%)
2016:43472(17.3%)
2017:42655(17.0%)
2018:40205(16.0%)
2019:42458(16.9%)
2020:18449(7.4%)
250609 (100.0%) 0 (0.0%)
3 MES [factor]
1. Abril
2. Agosto
3. Diciembre
4. Enero
5. Febero
6. Julio
7. Junio
8. Marzo
9. Mayo
10. Noviembre
[ 2 others ]
17862(7.1%)
25074(10.0%)
21486(8.6%)
18598(7.4%)
20648(8.2%)
23251(9.3%)
18799(7.5%)
19872(7.9%)
19663(7.8%)
20712(8.3%)
44644(17.8%)
250609 (100.0%) 0 (0.0%)
4 FECHA [Date]
min : 2014-07-04
med : 2017-06-09
max : 2020-08-31
range : 6y 1m 27d
2251 distinct values 250606 (100.0%) 3 (0.0%)
5 HORA [factor]
1. (Empty string)
2. 00:00:00
3. 00:01:00
4. 00:02:00
5. 00:03:00
6. 00:04:00
7. 00:05:00
8. 00:06:00
9. 00:07:00
10. 00:08:00
[ 1414 others ]
3(0.0%)
357(0.1%)
31(0.0%)
15(0.0%)
5(0.0%)
4(0.0%)
227(0.1%)
4(0.0%)
8(0.0%)
3(0.0%)
249952(99.7%)
250609 (100.0%) 0 (0.0%)
6 CLASE_ACCIDENTE [factor]
1. (Empty string)
2. Atropello
3. Caída del ocupante
4. Choque
5. Incendio
6. Otro
7. Volcamiento
6(0.0%)
23781(9.5%)
21568(8.6%)
169391(67.6%)
28(0.0%)
26761(10.7%)
9074(3.6%)
250609 (100.0%) 0 (0.0%)
7 DISEÑO [factor]
1. (Empty string)
2. Ciclorruta
3. Glorieta
4. Intersección
5. Lote o predio
6. Paso a nivel
7. Paso elevado
8. Paso inferior
9. Pontón
10. Puente
[ 3 others ]
656(0.3%)
964(0.4%)
6358(2.5%)
42341(16.9%)
24049(9.6%)
113(0.0%)
1315(0.5%)
644(0.3%)
29(0.0%)
968(0.4%)
173172(69.1%)
250609 (100.0%) 0 (0.0%)
8 GRAVEDAD_ACCIDENTE [factor]
1. Con heridos
2. Con muertos
3. Solo daños
137419(54.8%)
973(0.4%)
112217(44.8%)
250609 (100.0%) 0 (0.0%)
9 BARRIO [factor]
1. Aguas Frías
2. Aldea Pablo VI
3. Alejandría
4. Alejandro Echavarría
5. Alfonso López
6. Altamira
7. Altavista
8. Altavista Sector Central
9. Altos del Poblado
10. Andalucía
[ 306 others ]
88(0.0%)
86(0.0%)
632(0.3%)
1032(0.4%)
1170(0.5%)
779(0.3%)
374(0.1%)
257(0.1%)
324(0.1%)
267(0.1%)
245600(98.0%)
250609 (100.0%) 0 (0.0%)
10 COMUNA [factor]
1. (Empty string)
2. Aranjuez
3. Belén
4. Buenos Aires
5. Castilla
6. Corregimiento de Altavist
7. Corregimiento de San Anto
8. Corregimiento de San Cris
9. Corregimiento de San Seba
10. Corregimiento de Santa El
[ 13 others ]
277(0.1%)
14333(5.7%)
16771(6.7%)
9867(3.9%)
24858(9.9%)
567(0.2%)
4028(1.6%)
2626(1.0%)
19(0.0%)
605(0.2%)
176658(70.5%)
250609 (100.0%) 0 (0.0%)
11 X_MAGNA [numeric]
Mean (sd) : 834018.2 (2147.4)
min ≤ med ≤ max:
820242.7 ≤ 834276.3 ≤ 843984.8
IQR (CV) : 2451.4 (0)
25855 distinct values 250609 (100.0%) 0 (0.0%)
12 Y_MAGNA [numeric]
Mean (sd) : 1183124 (3172)
min ≤ med ≤ max:
1172451 ≤ 1183128 ≤ 1196215
IQR (CV) : 4354.9 (0)
26162 distinct values 250609 (100.0%) 0 (0.0%)
13 LONGITUD [numeric]
Mean (sd) : -75.6 (0)
min ≤ med ≤ max:
-75.7 ≤ -75.6 ≤ -75.5
IQR (CV) : 0 (0)
26647 distinct values 250609 (100.0%) 0 (0.0%)
14 LATITUD [numeric]
Mean (sd) : 6.3 (0)
min ≤ med ≤ max:
6.2 ≤ 6.3 ≤ 6.4
IQR (CV) : 0 (0)
26647 distinct values 250609 (100.0%) 0 (0.0%)
15 COMUNASMOD [character]
1. La Candelaria
2. Laureles - Estadio
3. Castilla
4. El Poblado
5. Guayabal
6. Belén
7. Robledo
8. Aranjuez
9. Buenos Aires
10. La América
[ 11 others ]
52403(20.9%)
26996(10.8%)
24947(10.0%)
21721(8.7%)
18495(7.4%)
16888(6.7%)
16496(6.6%)
14335(5.7%)
9868(3.9%)
8035(3.2%)
40425(16.1%)
250609 (100.0%) 0 (0.0%)
16 DIAX [integer]
Mean (sd) : 15.7 (8.7)
min ≤ med ≤ max:
1 ≤ 16 ≤ 31
IQR (CV) : 15 (0.6)
31 distinct values 250606 (100.0%) 3 (0.0%)
17 MESX [numeric]
Mean (sd) : 6.7 (3.4)
min ≤ med ≤ max:
1 ≤ 7 ≤ 12
IQR (CV) : 6 (0.5)
12 distinct values 250606 (100.0%) 3 (0.0%)
18 AÑOX [numeric]
Mean (sd) : 2017 (1.8)
min ≤ med ≤ max:
2014 ≤ 2017 ≤ 2020
IQR (CV) : 3 (0)
2014:20728(8.3%)
2015:42642(17.0%)
2016:43472(17.3%)
2017:42652(17.0%)
2018:40205(16.0%)
2019:42458(16.9%)
2020:18449(7.4%)
250606 (100.0%) 3 (0.0%)
19 SEMANAX [numeric]
Mean (sd) : 27.3 (14.9)
min ≤ med ≤ max:
1 ≤ 28 ≤ 53
IQR (CV) : 26 (0.5)
53 distinct values 250606 (100.0%) 3 (0.0%)
20 SEMANAXX [character]
1. 31
2. 33
3. 35
4. 32
5. 28
6. 30
7. 29
8. 38
9. 51
10. 37
[ 43 others ]
5917(2.4%)
5772(2.3%)
5716(2.3%)
5658(2.3%)
5505(2.2%)
5462(2.2%)
5384(2.1%)
5360(2.1%)
5289(2.1%)
5271(2.1%)
195272(77.9%)
250606 (100.0%) 3 (0.0%)
21 DIA_SEMANA [character]
1. domingo
2. jueves
3. lunes
4. martes
5. miércoles
6. sábado
7. viernes
23431(9.3%)
37816(15.1%)
36035(14.4%)
39218(15.6%)
38162(15.2%)
36053(14.4%)
39891(15.9%)
250606 (100.0%) 3 (0.0%)
22 MES_SEMANA [character]
1. agosto
2. julio
3. septiembre
4. octubre
5. diciembre
6. noviembre
7. febrero
8. marzo
9. mayo
10. junio
[ 2 others ]
25073(10.0%)
23251(9.3%)
22400(8.9%)
22244(8.9%)
21485(8.6%)
20712(8.3%)
20648(8.2%)
19871(7.9%)
19663(7.8%)
18798(7.5%)
36461(14.5%)
250606 (100.0%) 3 (0.0%)
23 FESTIVO [numeric]
Min : 0
Mean : 0
Max : 1
0:243491(97.2%)
1:7118(2.8%)
250609 (100.0%) 0 (0.0%)
24 FLORES [numeric]
Min : 0
Mean : 0
Max : 1
0:244088(97.4%)
1:6521(2.6%)
250609 (100.0%) 0 (0.0%)
25 FUTBOL [numeric]
Min : 0
Mean : 0
Max : 1
0:248433(99.1%)
1:2176(0.9%)
250609 (100.0%) 0 (0.0%)
26 QUINCENA [numeric]
Min : 0
Mean : 0.2
Max : 1
0:210587(84.0%)
1:40022(16.0%)
250609 (100.0%) 0 (0.0%)
27 PREFESTIVO [numeric]
Min : 0
Mean : 0.1
Max : 1
0:230378(91.9%)
1:20231(8.1%)
250609 (100.0%) 0 (0.0%)

Generated by summarytools 1.0.0 (R version 4.0.5)
2021-12-05

4 Año

A continuación se observa una tabla de frecuencias para los años de los incidentes registrados en la base de datos de incidentes.

Frecuencia Válidos (%) Válidos acum. (%) Total acum. (%) % Total Cum.
2014 20728 8.27 8.27 8.27 8.27
2015 42642 17.02 25.29 17.02 25.29
2016 43472 17.35 42.63 17.35 42.63
2017 42655 17.02 59.65 17.02 59.65
2018 40205 16.04 75.70 16.04 75.70
2019 42458 16.94 92.64 16.94 92.64
2020 18449 7.36 100.00 7.36 100.00
0 NA NA 0.00 100.00
Total 250609 100.00 100.00 100.00 100.00

Como se observa, los años 2015 a 2019 tienen aproximadamente la misma cantidad de observaciones en cada uno de ellos, lo cual es de esperar porque para todos ellos se cubre la totalidad del año, mientras que para los años 2014 y 2020 solo se cubre una parte de ellos. En todo caso, es interesante observar que el año en el que más accidentes se observaron fue el 2016, con 46,991 incidentes en total, lo cual representa el 17.38 % del total de observaciones. Gráficamente, se puede visualizar mediante el siguiente gráfico de barras:

5 Clase de accidente

La clase de accidente es una variable categórica de orden nominal que define de forma generar las características del incidente observado, de manera que esta variable puede asumir cualquiera de los siguientes niveles:

Teniendo esto presente, se puede definir la siguiente tabla de frecuencias para esta base de datos:

Frecuencia Válidos (%) Válidos acum. (%) Total acum. (%) % Total Cum.
(Empty string) 6 0.00 0.00 0.00 0.00
Atropello 23781 9.49 9.49 9.49 9.49
Caída del ocupante 21568 8.61 18.10 8.61 18.10
Choque 169391 67.59 85.69 67.59 85.69
Incendio 28 0.01 85.70 0.01 85.70
Otro 26761 10.68 96.38 10.68 96.38
Volcamiento 9074 3.62 100.00 3.62 100.00
0 NA NA 0.00 100.00
Total 250609 100.00 100.00 100.00 100.00

De la tabla anterior se puede observar que el tipo de accidente más frecuente es el choque, pues se observaron un total de 180,431 incidentes de tráfico que involucraron a este tipo de colisiones, lo que representa al 66.75 % de los accidentes, lo cual es llamativo porque resulta más de dos terceras partes de todos los incidentes ocurridos en la ciudad de Medellín entre el año 2014 y 2020. A continuación se tienen a los incidentes que no clasifican en ninguna de las categorías propuestas por Informe Policial de Accidentes de Tránsito, IPAT, es decir, los que se etiquetan como “otro”, dado que el 11,11 % de los incidentes registrados clasifican en esta categoría. En tercer lugar se tiene a los atropellamientos que abarcan al 9.36 % de los accidentes de tránsito observados en Medellín en el periodo mencionado. Por último, vale destacar que el tipo de incidente menos frecuente de todos es el que involucra a incendios, ya que durante este periodo solo sucedieron 35 eventos de este tipo, lo cual se evidencia en el siguiente gráfico de barras, pues la barra asociada a este tipo de incidente ni siquiera es apreciable, toda vez que las colisiones opacan al resto por su alta frecuencia relativa.

6 Diseño

Uno de los aspectos más importantes a la hora de evaluar un incidente de tránsito es caracterizar el tipo de espacio en el que sucedió el accidente en términos de la infraestructura física, y esta característica es determinada en la base de datos en la variable “diseño”, que resulta siendo una variable categórica con un nivel nominal, y se describen los siguientes tipos de infraestructura:

Y una tabla de frecuencias relacionada a esta variable es la siguiente:

Frecuencia Válidos (%) Válidos acum. (%) Total acum. (%) % Total Cum.
(Empty string) 656 0.26 0.26 0.26 0.26
Ciclorruta 964 0.38 0.65 0.38 0.65
Glorieta 6358 2.54 3.18 2.54 3.18
Intersección 42341 16.90 20.08 16.90 20.08
Lote o predio 24049 9.60 29.67 9.60 29.67
Paso a nivel 113 0.05 29.72 0.05 29.72
Paso elevado 1315 0.52 30.24 0.52 30.24
Paso inferior 644 0.26 30.50 0.26 30.50
Pontón 29 0.01 30.51 0.01 30.51
Puente 968 0.39 30.90 0.39 30.90
Tramo de vía 173067 69.06 99.96 69.06 99.96
Túnel 51 0.02 99.98 0.02 99.98
Vía peatonal 54 0.02 100.00 0.02 100.00
0 NA NA 0.00 100.00
Total 250609 100.00 100.00 100.00 100.00

Revisando la tabla anterior se tiene que la infraestructura vial en la que más incidentes de tránsito sucedieron en Medellín entre el 2014 y el 2020 es el tramo de vía, pues en estos se dieron el 69,45 % del total de accidentes observados en la ciudad de Medellín en el periodo mencionado, lo cual es bastante lejano al resto de incidentes. Además, es llamativo observar que el segundo tipo de infraestructura donde más incidentes se dieron son las intersecciones, donde ocurrieron el 16.30 % de los incidentes. Además, donde menos incidentes ocurrieron fue en los pasos inferiores, ya que únicamente el 0.25 % de los accidentes ocurrieron en este tipo de vías.

7 Fecha

A continuación se muestra un gráfico en el que se muestra la cantidad de accidentes que se dieron en la ciudad de Medellín en cada uno de los días en los que se observaron datos. Para poder ver con mayor detalle algún periodo particular, se recomienda hacer un zoom con las herramientas que aparecen en el extremo superior derecho del gráfico.

Y del esquema anterior llama la atención que la mayoría de días se presentan entre 75y 175 accidentes por día, con algunas excepciones que se salen de estos extremos, de las cuales vale la pena mencionar que aquellas que aquellos picos superiores, es decir, fechas en las que se producen más accidentes en comparación con el resto de días, la mayoría se concentra en los meses de agosto y septiembre. Por otro lado, se debe rescatar que al comenzar cada año también se observa que ocurrencia de mínimos. También llama la atención la caída de accidentes que se presentan en la ciudad de Medellín luego del comienzo del confinamiento nacional como medida de contingencia por la pandemia de la COVID-19 el 18 de marzo de 2020.

Además, de estos datos se pueden rescatar los siguientes estadísticos, excluyendo los datos posteriores al 18 de marzo de 2020 por haber menos tránsito de vehículos que en otros días:

Parámetro Valor
Media 115
Desviación estándar 27.31
Mínimo 23
Máximo (Q4) 99
Primer cuantil (Q1) 99.5
Mediana (Q2) 120
Tercer cuantil 135.5
Rango intercuartídico 35.25
Coeficiente de variación 0.24
Coeficiente de asimetría -0.44
Curtosis -0.09

Y como se observa, el número promedio de accidentes por día es 125 con una desviación estándar de 28.45 accidentes diarios. Además, el día en que menos accidentes ocurrieron fue el 4 de julio de 2014, donde se dieron 24 accidentes (nótese que este es justamente el día en el que se comienzan a tomar datos), toda vez que el día con mayor accidentes fue 4 de agosto de 2021, ya que en él se registraron 234 incidentes viales en la ciudad. Por otro lado, se tiene que la mediana es de 130 accidentes por día, lo que significa que en la mitad de los días se tienen 130 incidentes o más, mientras que en la otra mitad hay 129 accidentes de tránsito o menos. Asimismo, el primer cuantil ocurre en los 107.5 accidentes por día, y el tercer cuantil está asociado a los 144 accidentes viales diarios. Finalmente, se puede observar que el índice de asimetría es -0.4, lo que significa que los datos no son perfectamente simétricos y que tienden más hacia los valores más altos de accidentalidad diarios; además, la curtosis es de -0.06, lo cual significa que la cantidad de accidentes diarios podría tener una distribución parecida a la normal, y el hecho de que sea negativo implica que hay una concentración ligeralmente mayos datos hacia la media que en una distribución normal, lo que implica que la ocurrencia de valores extremos es menos frecuente que en una distribución auténticamente normal. Respecto a estos dos últimos parámetros, resulta interesante realizar un histograma para poder observar la distribución de accidentes diarios.

Y en este se observa un gráfico que no se asemeja al de una distribución normal, empezando por el hecho de que la simetría no es muy clara y también por la presencia de dos modas, lo cual no se asemeja a una distribución normal en el sentido que esta tiene una y solo una moda. En todo caso, vale la pena realizar una prueba de hipótesis de normalidad para esta variable mediante el test de Lillifors, que es el test más potente para una alta cantidad de datos y que se basa en una modificación del test de Lillifors. Para ello, se plantean las siguientes hipótesis con un nivel de confianza del 95 % (\(\alpha = 0.05\)):

\(H_0:\) La distribución de la cantidad de accidentes por día en Medellín entre julio de 2014 y marzo de 2020 es normal.

\(H_1:\) La distribución de la cantidad de accidentes por día en Medellín entre julio de 2014 y marzo de 2020 no es normal.

Y al realizarlo con ayuda de \(\color{blue}{\textsf{R}}\) se obtiene un valor p de \(V_p < 2.2 \times 10^{-16} < 0.05 = \alpha\), lo cual permite rechazar la hipótesis nula y por tanto se concluye la cantidad de accidentes que suceden en Medellín por día no tienen una distribución normal.

Ahora bien, para poder tener una mejor visibilidad, se va a hacer la suma de accidentes diarios pero presentados por mes.

Y en esta se puede constatar lo que ya se había mencionado previamente y es que existen mínimos en los meses de enero y máximos en los meses de agosto. Además, llama la atención que hay comportamiento aproximadamente uniforme en todos los años, salvo en el 2019, donde el pico del mes de agosto se preserva para los meses de septiembre y octubre. Además, se debe observar que en febrero del año 2020 se tiene un comportamiento semejante al de año previos hasta el mes de marzo, donde se da inicio al confinamiento nacional por cuenta de la pandemia del virus de la COVID-19. De aquí se pueden obtener los siguientes estadísticos excluyendo los valores posteriores a marzo de 2020:

Parámetro Valor
Media 3,521.60
Desviación estándar 262.63
Mínimo 2,920
Máximo (Q4) 4,105
Primer cuantil (Q1) 3,339.50
Mediana (Q2) 3,531.5
Tercer cuantil 3,694
Rango intercuartídico 348
Coeficiente de variación 0.07
Coeficiente de asimetría -0.13
Curtosis -0.35

Y de lo anterior se sigue que la cantidad de accidentes promedio por mes es de 3,800, con una desviación estándar 281.27 accidentes mensuales. Además, se observa que el mínimo es de 3,142 accidentes mensuales, lo cual ocurre en junio de 2019; toda vez que el máximo es de 4,405 accidentes mensuales asociado a agosto de 2019. Además, la mediana es de 3,832 accidentes mensuales, lo que quiere decir que en al menos la mitad de los meses de los cuales hay registros cuentan con al menos 3,832 accidentes mensuales observados, toda vez que en la otra mitad se observaron una cantidad inferior de accidentes.

7.0.0.1 Mapa de calor

A continuación se observa un mapa de calor para la cantidad de accidentes observados por día.

En este resalta inicialmente quea partir del mes de marza de 2020 la cantidad de accidentes registrada por día en la última quincena de marzo y en el mes de abril es muy baja, toda vez que a medida que se va permitiendo la apertura de ciertos sectores económicos fue aumentado progresivamente la acidentalidad. Además, llama la atención que es en el mes de agosto donde se tienen más colores naranjas y oscuras, lo cual indica una alta cantidad de accidentailidad, mientras que en la primera quincena de enera predominan colores suaves y verdosos, que se asocian a bajas tasas de accidentalidad.

8 Mes

Ahora se va a realizar la evaluación de la cantidad de accidentes viales ocurridos en la ciudad de Medellín según el mes sin importar el año, para lo cual se puede realizar la siguiente tabla de frecuencias:

Frecuencia Válidos (%) Válidos acum. (%) Total acum. (%) % Total Cum.
Abril 17862 7.13 7.13 7.13 7.13
Agosto 25074 10.01 17.13 10.01 17.13
Diciembre 21486 8.57 25.71 8.57 25.71
Enero 18598 7.42 33.13 7.42 33.13
Febero 20648 8.24 41.37 8.24 41.37
Julio 23251 9.28 50.64 9.28 50.64
Junio 18799 7.50 58.15 7.50 58.15
Marzo 19872 7.93 66.08 7.93 66.08
Mayo 19663 7.85 73.92 7.85 73.92
Noviembre 20712 8.26 82.19 8.26 82.19
Octubre 22244 8.88 91.06 8.88 91.06
Septiembre 22400 8.94 100.00 8.94 100.00
0 NA NA 0.00 100.00
Total 250609 100.00 100.00 100.00 100.00

La cual se puede acompañar del siguiente gráfico de barras.

Y como se observa, el mes en el que más accidentes se registran es agosto, que cuenta con 27,001 accidentes observados en dicho mes, seguido por 25,018 incidentes viales que ocurrieron durante los diferentes meses de julio, y en tercer lugar se tiene al mes de septiembre que registra a 24,129 accidentes. Además, los dos meses con menos incidentes viales registrados son enero con 20,098 incidentes viales y abril con 19,293 accidentes. Finalmente, es llamativo notar que los seis últimos meses del año se reparten los seis primeros lugares y que los meses del primer semestre hacen lo propio con los últimos seis puestos.

9 Comuna

A continución se visualiza la tabla de frecuencias para la cantidad de incidentes de tránsito registrados en las dieciséis comunas y cinco corregimientos de la ciudad de Medellín:

Frecuencia Válidos (%) Válidos acum. (%) Total (%) Total acum. (%)
Altavista 457 0.18 0.18 0.18 0.18
Aranjuez 14335 5.72 5.90 5.72 5.90
Belén 16888 6.74 12.64 6.74 12.64
Buenos Aires 9868 3.94 16.58 3.94 16.58
Castilla 24947 9.95 26.53 9.95 26.53
Doce de Octubre 6954 2.77 29.31 2.77 29.31
El Poblado 21721 8.67 37.98 8.67 37.98
Guayabal 18495 7.38 45.36 7.38 45.36
La América 8035 3.21 48.56 3.21 48.56
La Candelaria 52403 20.91 69.47 20.91 69.47
Laureles - Estadio 26996 10.77 80.24 10.77 80.24
Popular 3731 1.49 81.73 1.49 81.73
Robledo 16496 6.58 88.32 6.58 88.32
San Antonio de Prado 4007 1.60 89.91 1.60 89.91
San Cristóbal 2644 1.06 90.97 1.06 90.97
San Javier 4313 1.72 92.69 1.72 92.69
San Sebastián de Palmitas 17 0.01 92.70 0.01 92.70
Santa Cruz 3436 1.37 94.07 1.37 94.07
Santa Elena 346 0.14 94.21 0.14 94.21
Santa Manrique 7813 3.12 97.32 3.12 97.32
Villa Hermosa 6707 2.68 100.00 2.68 100.00
0 NA NA 0.00 100.00
Total 250609 100.00 100.00 100.00 100.00

Y se acompaña con el siguiente gráfico de barras:

De los esquemas anteriores llama la atención que la comuna en la que más incidentes viales ocurren es en La Candelaria, que es la comuna central de la ciudad de Medellín y que concentra a la mayoría de las sedes de instituciones públicas municipales, departamentales nacionales, así como múltiples negocios y empresas que requieren una ingente cantidad de trabajadores y asimismo atrae a miles de consumidores diariamente. Así, se tiene que en dicha comuna se dan 67,352 incidentes viales o 24.91 % del total, lo que significa que casi uno de cada cuatro accidentes suceden en la comuna de La Candelaria. A continuación, se tiene a la comuna de Laureles-Estadio, la cual registró 27,978 incidentes viales en su territorio. En el otro extremo se tiene que los cuatro territorios en los que menos incidentes viales son corregimientos, en orden de mayor a menor: San Cristóbal (2,758 accidentes de tránsito), Santa Elena (487 accidentes de tránsito), Alta Vista (457 incidentes de tránsito) y San Sebastián de Palmitas (17 incidentes de tránsito), teniendo esta última 457 accidentes de tránsito. Adicionalmente, llama la atención que el corregimiento de San Antonio de Prado, que sumó 4,313 accidentes de tránsito, tuvo más incidentes que dos comunas: Popular (3,822 incidentes de tránsito) y Santa Cruz (3,437 accidentes de tránsito).

10 Barrio

Respecto a los barrios, se tiene que los barrios en los que más accidentes de tránsito son Corazón de Jesús (La Candelaria) con 16,084 accidentes de tránsito, La Candelaria (La Candelaria) coon 5,915 accidentes de tránsito y Caribe (Castilla) con 5,619 incidentes de tránsito en total, siendo el último caracterizado por estar en las inmediaciones de la Terminal de Transportes Norte de la ciudad de Medellín, así como varios intercambios hacia los cuatro puntos cardinales de la ciudad, así como salidas hacia la autopista Medellín - Bogotá y vías que van hacia el Caribe colombiano y hacia el occidente antioqueño.

11 Variables adicionales

En el capítulo de transformaciones adicionales a la base de dato se explicaron algunas variables explicativas adicionales a partir de la fecha para ser empleadas en la creación del modelo predictivo que permita proyectar los accidentes para los años 2020 y 2021. En ese sentido, se va a mostrar básico de lo que se obtuvo en cada una de estas variables extra. Debe tenerse en cuenta que como algunas de las variables creadas con dicotómicas binarias, es decir, que sus niveles de medición son únicamente el número uno o el número cero, entonces todos los resultados que se verán a continuación están en términos de proporciones o porcentajes.

11.1 Día modificado

A continuación se observa una tabla en la que se evidencia la cantidad total y la proporción de accidentes que ocurren en cada uno de los días de un mes.

Frecuencia Válidos (%) Válidos acum. (%) Total (%) Total acum. (%)
1 7900 3.15 3.15 3.15 3.15
2 8067 3.22 6.37 3.22 6.37
3 8066 3.22 9.59 3.22 9.59
4 8267 3.30 12.89 3.30 12.89
5 8486 3.39 16.27 3.39 16.27
6 8449 3.37 19.65 3.37 19.65
7 8057 3.22 22.86 3.21 22.86
8 8051 3.21 26.07 3.21 26.07
9 8163 3.26 29.33 3.26 29.33
10 8511 3.40 32.73 3.40 32.73
11 8330 3.32 36.05 3.32 36.05
12 8355 3.33 39.39 3.33 39.38
13 8285 3.31 42.69 3.31 42.69
14 8207 3.27 45.97 3.27 45.97
15 8304 3.31 49.28 3.31 49.28
16 8738 3.49 52.77 3.49 52.77
17 8464 3.38 56.14 3.38 56.14
18 8676 3.46 59.61 3.46 59.61
19 8233 3.29 62.89 3.29 62.89
20 8151 3.25 66.14 3.25 66.14
21 8474 3.38 69.53 3.38 69.52
22 8319 3.32 72.84 3.32 72.84
23 8426 3.36 76.21 3.36 76.21
24 8027 3.20 79.41 3.20 79.41
25 7923 3.16 82.57 3.16 82.57
26 8149 3.25 85.82 3.25 85.82
27 8278 3.30 89.13 3.30 89.13
28 8244 3.29 92.42 3.29 92.41
29 7456 2.98 95.39 2.98 95.39
30 7181 2.87 98.26 2.87 98.26
31 4369 1.74 100.00 1.74 100.00
3 NA NA 0.00 100.00
Total 250609 100.00 100.00 100.00 100.00

Y como se observa, hay una distribución aproximadamente uniforme en la cantidad de accidentes que sucede por día, ya que la proporción de incidentes viales que suceden en cada día del mes aproximadamente la misma para cada día. Esto se puede ver mejor mediante el siguiente gráfico de barras.

En este gráfico son notables las caídas en la cantidad de incidentes viables que se dan en los últimos días del mes, es decir, los días 29, 30 y 31. Sin embargo, esto puede ser atribuible al hecho de que el mes de febrero llega hasta el 28 de febrero (salvo en los años 2016 y 2020), lo que cual puede explicar la reducción en los días 29 y 30, y respecto al día 31 se tiene que tener presente que solo siete de los doce meses del mes tienen 31 días, de manera que se omiten las observaciones para el resto de los cinco meses y a partir de ello se puede explicar que su proporción sea aproximadamente la mitad del resto de día.

11.2 Semana modificada (natural)

Entiéndase por semana natural aquella que siempre tendrá como primera semana del año aquella que abarca los primeros siete días del año, es decir, del primero a siete de enero, independientemente de los días de la semana en los que hayan ocurrido dichos días. En el siguiente gráfico se observa la cantidad de incidentes viables acontencidos en cada semana del año.

De este gráfico llama especialmente la atención que la semana en la que más incidentes viales se dieron, que es la número 31 (29 de julio al 4 de agosto), destacaba notablemente del resto, pero se tiene que tener presente que las otras semanas que completan las cinco semanas con más incidentes del año son aquellas que se durante la última quincena de julio y el mes de agosto, lo cual se podría explicar por el hecho de que durante es mes ocurre la Feria de Flores de Medellín, se paga la primera prima legal del año a los empleados formales de la ciudad y múltiples cadenas con importante presencia en la ciudad (como los almacenes Éxito) celebran su aniversario con descuentos. Por otro lado, si se omite la semana 53 del año (que únicamente incluye a los días 30 y 31 de diciembre), la semana con menos incidentes viales del año es la primera, lo cual se puede atribuir a la disminución del tráfico vehícular en la ciudad de Medellín dadas las vacaciones de millones de empleados y estudiantes de toda la ciudad.

11.3 Día de la semana

Frecuencia Válidos (%) Válidos acum. (%) Total (%) Total acum. (%)
domingo 23431 9.35 9.35 9.35 9.35
jueves 37816 15.09 24.44 15.09 24.44
lunes 36035 14.38 38.82 14.38 38.82
martes 39218 15.65 54.47 15.65 54.47
miércoles 38162 15.23 69.70 15.23 69.70
sábado 36053 14.39 84.08 14.39 84.08
viernes 39891 15.92 100.00 15.92 100.00
3 NA NA 0.00 100.00
Total 250609 100.00 100.00 100.00 100.00

De la tabla anterior se puede destacar que hay una distribución aproximadamente uniforme para los incidentes que ocurren en cada uno de los días de la semana, con un 15 % de incidentes por día, salvo el día domingo que registra el 9.35 % de los incidentes viales; empero, de los otros seis días, destaca el día viernes con un 15.92 % de los incidentes registrados, lo cual podría deberse a la gran cantidad de personas que se transportan por la ciudad no solo para atender actividades académicas, laborales y comerciales, entre otras, durante la mañana y la tarde, sino también por la salida de personas de la ciudad este día o por la búsqueda de actividades de ocio en la noche. La tabla anterior se puede ilustrar mejor a través de la siguiente gráfica de barras:

11.4 Día festivo

Frecuencia Válidos (%) Válidos acum. (%) Total (%) Total acum. (%)
0 243491 97.16 97.16 97.16 97.16
1 7118 2.84 100.00 2.84 100.00
0 NA NA 0.00 100.00
Total 250609 100.00 100.00 100.00 100.00

Se debe comenzar teniendo presente que aquellos días que coinciden con un día festivo son aquellos que están marcados con el número uno (1), mientras que los que no tienen el número cero (0). En virtud de lo anterior, se observa que el 2.84 % de los incidentes viales observados en Medellín entre agosto de 2014 y marzo de 2021 ocurrieron un día festivo.

11.5 Feria de Flores

Frecuencia Válidos (%) Válidos acum. (%) Total (%) Total acum. (%)
0 244088 97.4 97.4 97.4 97.4
1 6521 2.6 100.0 2.6 100.0
0 NA NA 0.0 100.0
Total 250609 100.0 100.0 100.0 100.0

Se debe comenzar teniendo presente que aquellos días que coinciden con un día en el que se celebró la feria de flores en Medellín son aquellos que están marcados con el número uno (1), mientras que los que no tienen el número cero (0). En virtud de lo anterior, se observa que el 2.6 % de los incidentes viales observados en Medellín entre agosto de 2014 y marzo de 2021 ocurrieron durante la feria de flores.

11.6 Feria de Flores

Frecuencia Válidos (%) Válidos acum. (%) Total (%) Total acum. (%)
0 210587 84.03 84.03 84.03 84.03
1 40022 15.97 100.00 15.97 100.00
0 NA NA 0.00 100.00
Total 250609 100.00 100.00 100.00 100.00

Se debe comenzar teniendo presente que aquellos días que coinciden con un día en el que se pagó quincena (días 1, 5, 15, 20 o 30 de cada mes) son aquellos que están marcados con el número uno (1), mientras que los que no tienen el número cero (0). En virtud de lo anterior, se observa que el 15,97 % de los incidentes viales observados en Medellín entre agosto de 2014 y marzo de 2021 ocurrieron durante la cancelación de la quincena de los empleados formales de la ciudad.

11.7 Días previos a un festivo

Frecuencia Válidos (%) Válidos acum. (%) Total (%) Total acum. (%)
0 230378 91.93 91.93 91.93 91.93
1 20231 8.07 100.00 8.07 100.00
0 NA NA 0.00 100.00
Total 250609 100.00 100.00 100.00 100.00

Se debe comenzar teniendo presente que aquellos días que son viernes, sábado y domingo y que ocurren previo a un lunes festivo son aquellos que están marcados con el número uno (1), mientras que los que no tienen el número cero (0). En virtud de lo anterior, se observa que el 8.07 % de los incidentes viales observados en Medellín entre agosto de 2014 y marzo de 2021 ocurrieron durante un viernes, sábado y domingo y que ocurren previo a un lunes festivo.