Predicción de Accidentabilidad

1. Planteamiento del problema

La accidentalidad en Medellín es un problema actual en el cual como ciudadanos debemos buscar soluciones para disminuir los incidentes viales.El objetivo de este trabajo es predecir la accidentalidad en la ciudad de Medellín mediante modelos predictivos para pronosticar la accidentalidad por clase de accidente a nivel diario, semanal, mensiual y anual. Los datos fueron obtenidos de la base de datos incidentes viales del portal MetaData suministrada por la Secretaría de Movilidad de la Alcaldía de Medellín en la cual se encuentran accidentes de tránsito desde julio del 2014 hasta agosto del 2020.

Esta base de datos se descargó el 8 de noviembre del 2021 en formato CSV y tiene como fecha de actualización 6 de marzo del 2021. El total de registros de la base de datos es de 270765 contenidas 17 variables, las cuales son las siguientes:

\(\hspace{1 cm}\)

  • AÑO: Año de ocurrencia del incidente.
  • CBML: Código catastral que corresponde al código comuna, barrio, manzana, lote catastral de un predio.
  • CLASE_DE_ACCIDENTE: choque, atropello, volcamiento, caída de ocupante, incendio, u otro (que no corresponde a las anteriores 5 clasificaciones, p. ej: sumersión).
  • DIRECCION: Dirección donde ocurrió el incidente.
  • DIRECCION_ENCASILLADA: Dirección encasillada que entrega el geocodificador.
  • DISEÑO: Sitio de la vía donde ocurrió el accidente: Cicloruta, Glorieta, Interseccion, Lote o Predio, Paso a Nivel, Paso Elevado, Paso Inferior, Pontón, Puente, Tramo de via, Tunel, Via peatonal.
  • EXPEDIENTE: Consecutivo que asigna UNE, según el orden de llegada de los expedientes para su diligenciamiento.
  • FECHA_ACCIDENTE: Fecha del accidente, proviene del IPAT - Informe Policial de accidente de Tránsito.
  • FECHA_ACCIDENTES: Fecha de los accidente (formato YYYY-MM-DD hh:mi:ss), proviene del IPAT - Informe Policial de accidentes de Tránsito.
  • GRAVEDAD_ACCIDENTE: Clasificación del IPAT - Informe Policial de Accidentes de Tránsito, sobre la gravedad del accidente, corresponde al resultado más grave presentado en el accidente. Daños materiales “Sólo daños”, accidente con heridos “Herido”, accidente con muertos “Muerto”. No indica cantidad true.
  • MES: Mes de ocurrencia del incidente vial.
  • NRO_RADICADO: Consecutivo que asigna UNE, según el orden de llegada de los expedientes para su diligenciamiento.
  • NUMCOMUNA: Número de la comuna en la que ocurrio incidente vial.
  • COMUNA: Denominación con la cual se identifica cada Comuna o Corregimiento. 01:Popular 02:Santa Cruz 03:Manrique 04:Aranjuez 05:Castilla 06:Doce de Octubre 07:Robledo 08:Villa Hermosa 09:Buenos Aires 10:La Candelaria 11:Laureles - Estadio 12:La América 13:San Javier 14:El Poblado 15:Guayabal 16:Belén 50:San Sebastián de Palmitas 60:San Cristobal 70:Altavista 80:San Antonio de Prado 90:Santa Elena 99:Toda la Ciudad.
  • LOCATION: Fuente de información con la cual se realizó la geocodificación.
  • X: Coordenada X en metros del accidente, en sistema de coordenadas MAGNA Medellín Local.
  • Y: Coordenada Y en metros del accidente, en sistema de coordenadas MAGNA Medellín Local.

Además para los modelos predictivos se agregarón como variable indicadores los dias festivos y ferias. En las ferias seincluyen dias como feria de flores, festival internacional del tango, festival internacional del Jazz y festival del humor.

\(\hspace{1 cm}\)

2. Tratamiento de datos.

El preprocesamiento, limpieza y depuración de la base de y todo el codigo para el desarrollo de este proyecto se encuentra en el siguiente link.

2.1 Datos faltantes por variable

En la Tabla 1 se muestra cada una de las variables de la base de datos original junto con el número de registros faltantes.

Tabla 1. Registros faltantes por variable
N° Registros Faltantes
AÑO 26760
CBML 19118
CLASE_ACCIDENTE 6
DIRECCION 0
DIRECCION ENCASILLADA 391
DISEÑO 1148
EXPEDIENTE 110
FECHA_ACCIDENTE 6
FECHA_ACCIDENTES 0
GRAVEDAD 0
MES 0
NRO_RADICADO 37
NUMCOMUNA 0
BARRIO 19006
COMUNA 12798
LOCATION 0
X 0

2.2 Depuración y Limpieza

  • Para mejorar la base de datos se modificaron registros que estaban escritos incorrectamente en las siguientes variables: CLASE_ACCIDENTE, DISEÑO,COMUNA, BARRIO y GRAVEDAD.

  • La variable FECHA_ACCIDENTES se modificó en formato año-mes-día-hora-minutos-segundos y se añadieron las variables DIA, MES, AÑO, HORA, DIA_MES, SEMANA y DIA_AÑO.

  • En COMUNA la información suministrada como (0, AU, IN, SN, No Georef, Sin Inf) se asignó como NA.

  • La variable BARRIO se encontró que algunos aparecen con sus nombres y otros con su número, por medio de una base de datos externa de la Alcaldía de Medellín y verificada por el Departamento Nacional de Planeación se reemplazaron los números y se asignarón sus respectivos nombres. Para el análisis solo se tuvo en cuenta los barrios, excluyendo los corregimientos.

  • La variable LOCATION se separó en dos LATITUD y LONGITUD. Las coordenadas 6.22141524356,-75.7037762763 de la variable LOCATION se encuentrán fuera de Medellín, por tanto no se tuvo en cuenta en el desarrollo del trabajo.

  • En la variable CLASE_ACCIDENTE las categorías incendio y volcamiento se agregaron a la clase Otro. En consecuencia, esta variable queda con las siguientes categorias: Atropello, Caída Ocupante, Choque y Otro.

El 10.43% es el porcentaje de la información de los datos originales que no se tuvo en cuenta para la realización del trabajo. El procedimiento y el codigo usado en este item se encuentra el el siguiente script. Finalmente la base de datos limpia contiene 242533 registros y 16 variables, sumadas a las que se presentaron anteriormente, se inclyen las siguientes.

  • LATITUD: Latitud en la que ocurrio el accidente.
  • LONGITUD: Longitud en la que ocurrio el accidente.
  • MES: Mes en el que ocurrio el accidente.
  • DIA_MES: Dia del mes en el que ocurrio el accidente.
  • SEMANA: Semana del año en el que ocurrio el accidente.
  • DIA: Dia de la semana en que ocurrio el accidente.
  • DIA_AÑO: Dia en el año en que ocurrio el accidente.
  • HORA: Hora que ocurrio el accidente.

3. Análisis descriptivo

En la Tabla 2 se muestra Los primeros ocho registros de los dartos.

Tabla 2. Datos
CLASE_ACCIDENTE GRAVEDAD DISEÑO COMUNA BARRIO LATITUD LONGITUD FECHA_ACCIDENTE AÑO MES DIA_MES SEMANA DIA DIA_AÑO HORA
Otro Con heridos Tramo de via Laureles Estadio Los Conquistadores 6.23979 -75.58931 2014-08-05 2014 8 5 31 Mar 217 7.250
Choque Con heridos Interseccion Castilla Girardot 6.30004 -75.57082 2014-08-05 2014 8 5 31 Mar 217 14.500
Choque Con heridos Tramo de via El Poblado Patio Bonito 6.20875 -75.57657 2014-08-05 2014 8 5 31 Mar 217 15.833
Otro Con heridos Tramo de via Villa Hermosa Villa Hermosa 6.25906 -75.55125 2014-08-05 2014 8 5 31 Mar 217 13.000
Choque Con heridos Tramo de via La Candelaria Los Ángeles 6.24997 -75.55615 2014-08-05 2014 8 5 31 Mar 217 19.500
Atropello Con heridos Tramo de via Aranjuez Manrique Central No.1 6.26527 -75.55540 2014-08-05 2014 8 5 31 Mar 217 11.500

3.1 Causa y gravedad en accidentes

  • Se encuentrá que la mayor causa de accidentes se debe choques.

  • Los accidentes con heridos son mayormente causados por choques y otras causas

  • La frecuencia de accidentes donde involucra muertes es muy inferior comparativamente con las demás categorías de gravedad.

3.2 Comportamiento de accidentes segun fechas.

  • Se visualiza que se presenta una mayor accidentabilidad los días Martes,Miércoles,jueves y viernes.Se infiere que el día viernes se presenta mayor accidentabilidad porque comienza fin de semana provocando más movilidad en la ciudad de Medellín y el día domingo disminuye notablemente la accidentabilidad en el cual muchas personas no laboran y hay menos flujo vehicular.

  • En el mes de agosto y julio es donde el número de accidentes es superior , en julio esto puede darse por el periodo de vacaciones y en agosto por algunos eventos relacionados con feria de flores.En enero, abril y junio se presenta la menor accidentabilidad.

  • En el año 2016 se presentó la mayor accidentabilidad, El número de accidentes para el 2020 es bajo debido a la crisis sanitaria que afrontaba el mundo por motivos del COVID-19 y se debe tener en cuenta que los registros en este año solo son hasta el 31 de agosto.

  • Durante el dia, el mayor número de accidentes ocurren en las hora pico, alrededor de las 6am, 12pm y 6pm.

4. Predicción

Para la predicción del número de acciedentes se usarón técnicas de regresión como: Lasso, Ridge, Poisson y Arboles. Para seleccionar el modelo adecuado se usó como métrica el error cuadrático medio ECM. El objetivo es encontrar un modelo que el ECM en los datos de prueba no sea superado en un 15% por el ECM de los datos de entreno.

Cada una de las regresiones se usó para modelar el número de accidentes de acuerdo a las clases de accidentes (atropello,caída de ocupante,choque y otro).

Los modelos ganadores fueron los siguientes: - Caída de ocupante: Regresión Poisson. - Atropello: Regresión Poisson. - Choque: Regresión Ridge, - Otro: Regresión Ridge

En cada uno de los modelos se observó que el ECM de las predicciones para el año 2020 son superiores a lo encontrado en el conjunto de datos de entreno y prueba. Esto se debe a que el confinamiento implicó que el número de vehiculos en circulación por la ciudad disminuyera ocasionando una reduccion en la accidentabilidad. Este cambio estructural causado por la pandemia trae como consecuencia una sobreestimación en la predicción.

4.1 Datos de entrenamiento y validación

Los datos de entrenamiento para los modelos predictivos son los registros de accidentes de los años 2014,2015,2016 y 2017. Para validar los modelos se usan los accidentes de los años 2018 y 2019.

4.2 Modelo para Caída de ocupante

En la categoría Caída de ocupante el mejor modelo predictivo es el modelo de arboles de regresion. En la Tabla 3 se encuentra la comparación de los ECM de entreno y prueba para cada uno de los modelos propuestos.

Tabla 3. ECM de entreno y Prueba
ridge lasso poisson rp
9.37969 10.06574 8.63586 8.30577
10.96356 11.62928 8.92674 7.46220
9.32582 10.54020 6.49470 6.41868

4.3 Modelo para Atropello

En la categoría Atropello el mejor modelo predictivo es el modelo de regresión poisson, la ecuación del modelo ajusttado se presenta a continuación.

\[Casos_{Atropello, i}=Exp(\beta_{0}+\beta_{1,k}\cdot GRAVEDAD_i+\beta_{2,m}\cdot DISEÑO_i+\beta_3\cdot AÑO+\\ \beta_4 \cdot MES+\beta_{5,p}\cdot DIA+\beta_6\cdot SEMANA+\beta_7\cdot DIAMES+\beta_8\cdot FERIA+\beta_9\cdot FESTIVO)\]

El resumen de los parámetros ajustados se muestra en la siguiente tabla.

Fitting generalized (poisson/log) linear model: CASOS ~ .
  Estimate Std. Error z value Pr(>|z|)
(Intercept) 252 16.88 14.93 2.245e-50
GRAVEDADCon muertos 0.1503 0.2146 0.7004 0.4837
DISEÑOGlorieta -0.2017 0.2063 -0.9774 0.3284
DISEÑOInterseccion 0.2282 0.1358 1.681 0.09273
DISEÑOLote o Predio 0.3205 0.1373 2.334 0.01961
DISEÑOOtro -0.2329 0.2471 -0.9426 0.3459
DISEÑOPaso Elevado -0.07035 0.2652 -0.2653 0.7908
DISEÑOPuente -0.1987 0.2553 -0.778 0.4366
DISEÑOTramo de via 1.975 0.1329 14.86 5.816e-50
AÑO -0.1248 0.008372 -14.9 3.126e-50
MES -0.2886 0.1286 -2.244 0.02485
DIAJue 0.09345 0.03269 2.858 0.004261
DIALun 0.06194 0.03385 1.83 0.06726
DIAMar 0.1052 0.03364 3.128 0.001761
DIAMie 0.0962 0.03368 2.857 0.00428
DIASab 0.221 0.03174 6.964 3.297e-12
DIAVie 0.141 0.03214 4.389 1.138e-05
SEMANA 0.06468 0.02957 2.187 0.02872
DIA_MES -0.01006 0.004332 -2.322 0.02026
FERIA 0.06147 0.03019 2.036 0.04176
FESTIVO -0.1854 0.04415 -4.198 2.691e-05

En la tabla 4 se encuentra el ECM de entreno y prueba para cada uno de los modelos propuestos.

Tabla 4. ECM de Entreno y Prueba
ridge lasso poisson rp
5.87754 6.21002 5.06700 5.46424
5.89837 5.83220 4.62682 4.47811
8.67056 9.38659 5.28170 7.03016

4.4 Modelo para Choque

Aunque para la clase de Choque, los modelos Poisson y Arboles tienen un menor ECM, no los seleccionamos ya que son susceptibles a un sobreentrenamiento. Por tal motivo, se decidio seleccionar Ridge como modeo adecuado.

Para la estimación del modelo Ridge se minimiza la funcion \(RSS_{Ridge}\) e funcion de los parametros.

\[RSS_{Ridge}=\sum_{i=1}^n(y_i-f(x_i))^2+\sum_{i=1}^p\beta_j^2\]

donde:

\[f(x) = \beta_{0}+\beta_{1,k}\cdot GRAVEDAD_i+\beta_{2,m}\cdot DISEÑO_i+\\ \beta_3\cdot AÑO+\beta_4\cdot MES+\beta_{5,p}\cdot DIA+\beta_6\cdot SEMANA+\beta_7\cdot DIAMES+\beta_8\cdot FERIA+\beta_9\cdot FESTIVO\]

  • importancia de los parámetros del modelo.

Se observa que un gran número de parámetros son relevantes para el modelo. El \(\lambda=1.045628\) optímo se encuentra por medio de validación cruzada.

  • Valor de los coeficientes del modelo
Tabla 5. Coeficientes del modelo RIDGE
s1
(Intercept) -284.99526
GRAVEDADCon muertos 2.74726
GRAVEDADSolo daños 5.98069
DISEÑOGlorieta -5.43758
DISEÑOInterseccion 1.34477
DISEÑOLote o Predio -5.84601
DISEÑOOtro -5.11845
DISEÑOPaso Elevado -5.73159
DISEÑOPuente -6.38983
DISEÑOTramo de via 19.85560
AÑO 0.14167
MES 0.03779
DIAJue 3.21991
DIALun 3.41845
DIAMar 3.79877
DIAMie 3.27340
DIASab 2.66545
DIAVie 3.82826
SEMANA 0.00632
DIA_MES -0.00521
FERIA 0.47942
FESTIVO -5.60557

En la tabla 6 se encuentra el ECM de entreno y prueba para cada uno de los modelos propuestos.

Tabla 6. ECM de Entreno y Prueba
ridge lasso poisson rp
46.55747 54.76882 20.20910 20.48308
46.60063 49.62509 31.81894 33.47314
96.32260 86.17606 113.14570 113.82900

4.5 Modelo para Otro

En la clase de accidente otros la cual esán incluidas las categorías de volcamiento, incendio y otras causas se seleccionó como mejor modelo la regresión Ridge ya que el ECM de entreno y prueba son los mas cercanos.

El \(\lambda=0.4100249\) optimo se encontró por medio de validación cruzada. Los parámetros ajustados se presentan en la siguiente tabla.

Tabla 7. Coeficientes modelo LASSO
s1
(Intercept) 358.91836
GRAVEDADCon muertos 0.21684
GRAVEDADSolo daños -8.44883
DISEÑOGlorieta -2.84880
DISEÑOInterseccion -2.58911
DISEÑOLote o Predio -0.16062
DISEÑOOtro -3.24056
DISEÑOPaso Elevado -3.40026
DISEÑOPuente -3.38770
DISEÑOTramo de via 7.27968
AÑO -0.17629
MES -0.00324
DIAJue 1.53968
DIALun 1.32258
DIAMar 1.28150
DIAMie 1.32909
DIASab 0.69879
DIAVie 1.27704
SEMANA -0.00191
DIA_MES 0.00082
FERIA 0.58093
FESTIVO -1.32134

En la tabla 8 se encuentra el ECM de entreno y prueba para cada uno de los modelos propuestos.

Tabla 8. ECM de Entreno y Prueba
ridge lasso poisson rp
17.37564 18.65867 14.97200 14.55689
19.76217 21.69503 20.05122 17.30424
20.73500 23.47058 20.52860 20.81062

5. Agrupamiento.

5.1 Selección de variables.

Para el agrupamiento se utilizó la base de datos previamente depurada, a partir de esta se crearon varaiables asociadas a cada uno de los barrios tales como: accidentes con muertos, heridos, solo daños,atropello,caída de ocupante,choque, otro y la proporción de accientes ocurridos en días laborales (semana). En la Tabla 9 se muestra el encabezado de las datos usados en el modelo de agrupamiento.

Tabla 9. Datos para Agrupamiento
Con heridos Con muertos Solo daños Atropello Caída Ocupante Choque Otro Semana
66 1 20 25 17 36 9 0.5977
198 1 433 18 19 542 53 0.8608
722 5 308 109 113 605 208 0.7121
818 5 347 153 185 568 264 0.7222
476 1 301 49 122 503 104 0.7776
224 3 147 63 30 216 65 0.7193

5.2 Análisis exploratorio

Resumen de las variables para el agrupamiento.

En la Tabla 9 se presenta un resumen de las varaibles usadas en el modelo de Agrupamiento.

Tabla 9. Datos para Agrupamiento
Con heridos Con muertos Solo daños Atropello Caída Ocupante Choque Otro Semana
Min. : 0.0 Min. : 0.00 Min. : 0.0 Min. : 0.00 Min. : 0.00 Min. : 0.0 Min. : 0.00 Min. :0.0000
1st Qu.: 165.5 1st Qu.: 1.00 1st Qu.: 86.0 1st Qu.: 28.00 1st Qu.: 24.25 1st Qu.: 149.0 1st Qu.: 41.25 1st Qu.:0.6917
Median : 359.0 Median : 2.00 Median : 200.5 Median : 63.00 Median : 58.00 Median : 334.0 Median : 92.50 Median :0.7349
Mean : 489.2 Mean : 4.77 Mean : 404.3 Mean : 85.12 Mean : 76.53 Mean : 609.6 Mean :127.01 Mean :0.7278
3rd Qu.: 674.8 3rd Qu.: 6.00 3rd Qu.: 461.0 3rd Qu.: 109.75 3rd Qu.:108.75 3rd Qu.: 750.8 3rd Qu.:177.50 3rd Qu.:0.7743
Max. :2492.0 Max. :29.00 Max. :3438.0 Max. :1007.00 Max. :411.00 Max. :4134.0 Max. :711.00 Max. :0.8608

Grafico de correlación.

A partir del Grafico 4se observa que las variables de accidebtabilidad asociada a los barrios tiene una correlación positiva y alta. Ademaás todas las distribuciones son sesgadas a la derecha indicando que la mayoría de barrios tienen baja frecuecnia de casos.

5.3 Modelo de Agrupamiento

Para agupar los barrios se usa el algoritmo de knn de la siguiente forma:

  • Paso 1: Se generan aleatoriamente \(k\) centroides,
  • Paso 2: Se asigna a cada individuo al centroide mas cercano, donde cada centroide define un grupo.
  • Paso 3: Se recalcula el centroide de cada grupo como el promedio de las observaciones del grupo.
  • Paso 4: se repite el paso 2 y 3 hasta que cumpla un número \(n\) de iteraciones.

En la Tabla 10 se muestran algunos barrios con la clasificación de los grupos en función del numero de centroides.

Tabla 10. Barrios y grupos
BARRIO K2 K3 K4 K5 K6 K7 K8 K9 K10
Aldea Pablo VI 2 3 4 4 1 7 2 6 3
Alejandría 2 3 3 5 3 2 1 3 2
Alejandro Echavarría 2 2 3 3 2 1 5 7 9
Alfonso López 2 2 3 3 2 1 5 7 9
Altamira 2 3 3 5 3 1 1 2 7
Altavista 2 3 4 4 1 2 8 5 4

5.4 Grafícas de dispersión entre variables clasificadas por el número de grupos.

  • Atropello vs Heridos

  • Semana vs Heridos

5.5 Criterio para escoger el \(K\).

De acuerdo al desempeño del agrupamiento en función de los k grupos, se decide que el k apropiado es \(k=4\). Ya que el paso de \(k=4\) a \(k=5\) la diferencia en la metrica no es muy relevante.

Análisis descriptivo de grupos.

En los siguientes graficos se presentan graficos de algunas variables en función de los grupos seleccionados.

5.6 Clasificación de grupos

  • Grupo 1: Accidentabilidad Alta Crítica:

A este grupo pertenecen 13 barrios de la ciudad de Medellín, los cuales presentan una alta accidentabilidad. Son los que presentan un mayor número en las clases y gravedad de accidentes, además son los que tiene una mayor porporción de accidentes durante la semana laboral.

  • Grupo 2: Accidentabilidad Alta Moderada:

A este grupo pertenecen 24 barrios de la ciudad de Medellín, los cuales presentan una alta accidentabilidad, pero en todas las variables los registros son menores a los registrados en el grupo de accidentabilidad alta critica.

  • Grupo 3: Accidentabilidad Moderada:

A este grupo pertenecen 79 barrios de la ciudad de Medellín. En comparacion con el grupo de accidentabilidad alta crítica, este grupo tiene en promedio el 33% del número de accidentes en heridos, 25% en muertes y 20% de solo daños. este mismo comportamiento se evidencia en Atropello, caída de ocupante, Choque y otros.

  • Grupo 4: Accidentabilidad Baja:

A este grupo pertenecen el 57% de los barrios, este gruopo se caracteeriza por tener un numero de accidentes bajo comparativamente con los otros. Sin embargo lo mas caracteristico es que en promedio, los muertos es de 1.7.

Resumen de los grupos.

En las siguientes tablas se presentan los resumenes de las variables por grupo.

Tabla 11. Media en los grupos
grupo Con heridos Con muertos Solo daños Atropello Caída Ocupante Choque Otro Semana
Accidentabilidad Alta Crítica 1863.3846 21.30769 2232.5385 320.23077 255.23077 3084.1539 457.61538 0.80306
Accidentabilidad Alta Moderada 1114.3750 12.16667 1206.2917 149.66667 152.33333 1752.7917 278.04167 0.78785
Accidentabilidad Moderada 620.6582 5.68354 427.4557 99.77215 100.86076 689.6203 163.54430 0.74897
Accidentabilidad Baja 208.4091 1.75325 113.0260 47.70130 37.14286 181.5260 56.81818 0.70126
Tabla 12. Mediana en los grupos
grupo Con heridos Con muertos Solo daños Atropello Caída Ocupante Choque Otro Semana
Accidentabilidad Alta Crítica 1766 22 2082.0 237.0 242.0 2885 409 0.80070
Accidentabilidad Alta Moderada 1056 12 1143.0 133.0 132.0 1677 260 0.78040
Accidentabilidad Moderada 635 5 433.0 92.0 94.0 663 164 0.74480
Accidentabilidad Baja 179 1 109.5 34.5 28.5 178 48 0.70875
Tabla 13. Desviación estándar en los grupos
grupo Con heridos Con muertos Solo daños Atropello Caída Ocupante Choque Otro Semana
Accidentabilidad Alta Crítica 459.2544 6.45994 476.50649 231.50168 65.74592 617.0593 139.97591 0.01225
Accidentabilidad Alta Moderada 353.0624 6.53197 293.31204 75.36443 78.09730 322.4147 118.18316 0.03263
Accidentabilidad Moderada 180.9440 4.24126 153.89622 60.33495 48.34219 191.2671 57.44290 0.04029
Accidentabilidad Baja 142.4176 1.81609 81.17261 39.61566 31.03433 123.1076 41.76646 0.10071

5.7 Mapa.

A continuación se presentan el mapa con los barrios distinguidos por un color según el grupo:

  • Accidentabilidad Alta Crítica: color rojo
  • Accidentabilidad Alta Moderada: color Naranja
  • Accidentabilidad Moderada: color Amarillo
  • Accidentabilidad Baja: color Verde

\(\hspace{1 cm}\)

Geograficamente se observa que los barrios que tienen una mayor accidenttabilidad se encuentran en el centro de la cuidad o son barrios de gran tamaño. Por otro lado, los barrios con menor accidentabilidad se encuentran en la periferia de la ciudad.

## OGR data source with driver: ESRI Shapefile 
## Source: "C:\Users\Asus\OneDrive\1 U\2021-2\TAE\Trabajo 1\Barrios de Medellín\Barrio_Vereda.shp", layer: "Barrio_Vereda"
## with 332 features
## It has 6 fields
## Integer64 fields read as strings:  OBJECTID SUBTIPO_BA

6. App y Video Promocional

En el siguiente link direcciona a una App en la cual se puede hacer predicciones de la accidentabilidad por clase de accidente. Ademas se puede observar a detalle las caracteristicas de los barrios segun el grupo clasificado. El el siguiente video se explica su uso.

\(\hspace{1 cm}\)

7. Referencias

[1] Secretaría de Movilidad. (2014). Incidentes viales, de http://medata.gov.co/dataset/incidentes-viales

[2] Autor anónimo. (2007).Expresiones Regulares : Conócelas y Piérdeles el miedo, de https://sg.com.mx/content/view/545

[3] Agiragil. (2016).03_ViviendasComunaBarrioVeredaEstrato_Certificada_17122015, de https://medellin.gov.co/irj/go/km/docs/pccdesign/SubportaldelCiudadano_2/PlandeDesarrollo_0_17/Publicaciones/Shared%20Content/sisben/03_ViviendasComunaBarrioVeredaEstrato_Certificada_17122015.pdf

[4] Selección de predictores: subset selection, ridge, lasso y reducción de dimensionalidad by Joaquín Amat Rodrigo, available under a Attribution 4.0 International (CC BY 4.0) at https://www.cienciadedatos.net/documentos/31_seleccion_de_predictores_subset_selection_ridge_lasso_dimension_reduction

[5] Funcion embed_url: https://www.rdocumentation.org/packages/vembedr/versions/0.1.4/topics/embed_url