📊 Análisis de Comparendos 2010

Autor: Jeiseer Wilches

20-11-2025


Introducción

El presente informe tiene como propósito realizar un análisis estadístico y exploratorio de la base de datos de comparendos del año 2010, con el fin de identificar los principales patrones de comportamiento vial, los tipos de infracciones más recurrentes y los factores que inciden en la imposición de sanciones.

Para ello, se emplearon herramientas del lenguaje R, particularmente las librerías tidyverse, readxl, scales y rmarkdown, que permiten la limpieza, manipulación, visualización y presentación de datos de forma dinámica y reproducible. A partir de estas herramientas, se generaron representaciones gráficas que facilitan la interpretación de la información y la toma de decisiones basadas en evidencia.

El estudio aborda variables clave como el tipo de vehículo, el género del infractor, el tipo de infracción, el monto total de pago por sanciones y la tendencia mensual de los comparendos, con el objetivo de comprender de manera integral el comportamiento de las infracciones de tránsito durante el periodo analizado.

Asimismo, los resultados obtenidos permiten establecer tendencias relevantes y relaciones significativas que pueden ser utilizadas por las autoridades competentes para el diseño de estrategias de prevención, control y educación vial, contribuyendo así al fortalecimiento de una movilidad más segura, ordenada y sostenible.

Comparendos por tipo de vehículo

ListaComparendos %>%
  count(`TIPO DE VEHICULO`) %>%
  arrange(desc(n)) %>%
  ggplot(aes(x = reorder(`TIPO DE VEHICULO`, n), y = n, fill = `TIPO DE VEHICULO`)) +
  geom_col(show.legend = FALSE) +
  coord_flip() +
  labs(
    title = "Comparendos por tipo de vehículo",
    x = "Tipo de vehículo",
    y = "Cantidad de comparendos"
  ) +
  theme_minimal() +
  theme(plot.title = element_text(face = "bold", size = 14, hjust = 0.5))+
  geom_text(aes(label = n), vjust= 0.5, hjust= 1.3, color = "black", size = 4)

El gráfico de barras permite identificar la distribución de los comparendos según el tipo de vehículo. Los resultados evidencian que los automóviles particulares y las motocicletas concentran el mayor número de infracciones durante el año 2010. Este comportamiento puede explicarse por la alta proporción que estos medios de transporte representan dentro del parque automotor urbano, así como por su mayor exposición al tráfico cotidiano y a los controles de tránsito.

En contraste, los vehículos de servicio público, como buses o camiones de carga, presentan una participación significativamente menor. Esto podría atribuirse a su operación en rutas establecidas y al cumplimiento de normativas más estrictas por parte de las empresas transportadoras.

En términos analíticos, este resultado resalta la necesidad de reforzar las estrategias de educación y control vial dirigidas especialmente a los conductores de vehículos particulares y motocicletas, con el fin de reducir las conductas infractoras más recurrentes.

Comparendos por género

ListaComparendos %>%
  count(SEXO) %>%
  ggplot(aes(x = "", y = n, fill = SEXO)) +
  geom_col(width = 1, show.legend = TRUE) +
  coord_polar(theta = "y") +
  labs(title = "Distribución de comparendos por género", x = NULL, y = NULL) +
  theme_void() +
  scale_fill_brewer(palette = "Set2")+
  geom_text(aes(label = n),
            position = position_stack(vjust = 0.5), color = "black", size = 4)

La gráfica circular muestra una diferencia marcada entre los géneros en cuanto a la comisión de infracciones. Los datos evidencian que los conductores de género masculino concentran la mayor cantidad de comparendos registrados, mientras que el género femenino representa un porcentaje significativamente menor.

Este patrón es consistente con estadísticas nacionales que reflejan una mayor participación de hombres en la conducción y una tendencia más alta hacia comportamientos de riesgo al volante. Las mujeres, en contraste, suelen mostrar mayor prudencia y adherencia a las normas de tránsito.

El resultado pone de manifiesto la conveniencia de diseñar campañas de sensibilización y programas de educación vial orientados a reducir los índices de infracción entre los conductores masculinos, promoviendo una conducción responsable e igualitaria.

Top infracciones más comunes

ListaComparendos %>%
  count(`COD. INFRACCION`) %>%
  slice_max(n, n = 10) %>%
  ggplot(aes(x = reorder(`COD. INFRACCION`, n), y = n)) +
  geom_col(fill = "steelblue") +
  coord_flip() +
  labs(
    title = "Top infracciones más comunes",
    x = "Código de infracción",
    y = "Cantidad de comparendos"
  ) +
  theme_classic()+
 geom_text(aes(label = n),
            position = position_stack(vjust = 0.5), color = "black", size = 5)

El gráfico de barras horizontales presenta las diez infracciones más recurrentes durante el periodo analizado. Entre las más destacadas se encuentran las relacionadas con el exceso de velocidad, estacionamiento en lugares prohibidos, y no portar la documentación exigida.

Este hallazgo refleja que las infracciones más frecuentes corresponden a conductas preventibles mediante estrategias de control, señalización adecuada y formación ciudadana. Además, el hecho de que pocas categorías concentren la mayoría de las infracciones sugiere la existencia de patrones reiterativos de comportamiento, que las autoridades de tránsito podrían abordar de manera focalizada para mejorar la eficiencia en la aplicación de sanciones y campañas preventivas.

Promedio a pagar por infracción

ListaComparendos$VALOR_A_PAGAR <- gsub("[$, .]","", ListaComparendos$VALOR_A_PAGAR)
ListaComparendos$VALOR_A_PAGAR <- as.numeric(ListaComparendos$VALOR_A_PAGAR)

ListaComparendos %>%
  filter(`TIPO DE IDENTIFICACION` %in% c("Cedula de Ciudadanía", "Cedula de Extanjería", "Nit")) %>%
  group_by(`TIPO DE IDENTIFICACION`) %>%
  summarise(Monto_Total = sum(VALOR_A_PAGAR, na.rm = TRUE)) %>%
  ggplot(aes(x = `TIPO DE IDENTIFICACION`, y = Monto_Total, fill = `TIPO DE IDENTIFICACION`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
   geom_text(aes(label = dollar(Monto_Total, prefix = "$", big.mark = ",")), 
            vjust = -0.3, size = 4, color = "black") +
  scale_y_continuous(labels = label_dollar(prefix = "$", big.mark = ",")) +
  labs(
    title = "Monto total a pagar por tipo de documento",
    x = "Tipo de documento",
    y = "Monto total ($)",
    fill = "Tipo de documento"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold", size = 14),
    axis.text.x = element_text(angle = 15, hjust = 1),
    legend.position = "none"
  )

El gráfico de barras que analiza el monto total de dinero recaudado por tipo de documento evidencia que los portadores de Cédula de Ciudadanía son responsables del mayor volumen económico de comparendos, seguidos por los identificados con NIT y Cédula de Extranjería.

Esta tendencia es coherente con la composición demográfica de los conductores registrados, donde la población colombiana representa la mayor proporción. Los resultados reflejan que las sanciones económicas por infracciones constituyen una fuente significativa de ingresos para las autoridades de tránsito, aunque también evidencian el impacto financiero derivado del incumplimiento de las normas.

Desde una perspectiva institucional, este comportamiento sugiere la necesidad de implementar incentivos al cumplimiento normativo, como descuentos por pronto pago o programas de educación vial que reduzcan la reincidencia

Tendencia mensual de comparendos

ListaComparendos %>%
  count(`NOMBRE DEL MES`) %>%
  ggplot(aes(x = factor(`NOMBRE DEL MES`, levels = unique(`NOMBRE DEL MES`)), y = n, group = 1)) +
  geom_line(color = "dodgerblue", size = 1.2) +
  geom_point(color = "darkred", size = 2) +
  labs(
    title = "Tendencia mensual de comparendos 2010",
    x = "Mes",
    y = "Cantidad de comparendos"
  ) +
  theme_light() +
  theme(plot.title = element_text(face = "bold", hjust = 0.5))+
   geom_text(aes(label = n),
            position = position_stack(vjust = 1.1), color = "black", size = 4)

El gráfico de líneas ilustra la evolución mensual de los comparendos registrados durante el año 2010. Se observan fluctuaciones significativas a lo largo del periodo, con picos de incremento en determinados meses que podrían asociarse con temporadas de alta movilidad, festividades o reforzamiento de operativos de control.

Los descensos en otros periodos podrían deberse a factores como condiciones climáticas, vacaciones o variaciones en la actividad económica. En conjunto, los resultados permiten inferir que la ocurrencia de infracciones sigue un patrón estacional, lo que ofrece información valiosa para la planificación de estrategias de control preventivo y operativo en función de las épocas del año con mayor incidencia.

Librerias usadas

library(rmarkdown) : Sirve para crear reportes dinamicos y presentaciones

library(tidyverse) : Es un conjunto de librerias diseñadas para trabajar con datos de forma ordenada

library(readxl) : Esta libreria sirve para leer archivos de excel

library(scales) : Se usa para dar formatos a los valores en graficos y tablas

CONCLUSION

El análisis integral de los resultados permite concluir que durante el año 2010 se presentaron patrones claros de comportamiento infractor en el sistema vial. Los conductores masculinos, especialmente de automóviles particulares y motocicletas, fueron los principales responsables de las infracciones, siendo las faltas por exceso de velocidad y estacionamiento indebido las más frecuentes.

Asimismo, el impacto económico asociado a las sanciones revela la magnitud del problema y la importancia de adoptar medidas correctivas sostenibles. Se recomienda a las autoridades de tránsito reforzar la educación vial, la señalización preventiva y los controles focalizados para mitigar los comportamientos de riesgo.

En suma, este estudio aporta una visión estadística y analítica que puede servir como base para la formulación de políticas públicas orientadas a mejorar la seguridad vial y promover una movilidad más segura y responsable.