Introducción
La presente investigación se fundamenta en el análisis detallado de una base de datos que recopila información sobre los comparendos impuestos por cámaras electrónicas de tránsito en una ciudad colombiana durante los meses de abril y mayo del año 2010. Este tipo de dispositivos, instalados en puntos estratégicos, tienen como finalidad detectar automáticamente conductas que infringen las normas de tránsito, contribuyendo así a la reducción de accidentes y a la promoción de una movilidad más segura y responsable. La base de datos contiene un total de 2.120 registros, cada uno correspondiente a una infracción específica registrada por las cámaras. Esta muestra, aunque limitada a un período de dos meses, ofrece una visión representativa del comportamiento vial, permitiendo examinar tanto infracciones leves como graves. Dentro de los campos más relevantes del conjunto de datos se incluyen: Fecha y hora de la infracción,Tipo de vehículo involucrado,Valor económico del comparendo, Tipo de infracción cometida,Datos del infractor como el sexo , entre otros. Gracias a esta información, es posible realizar un análisis exploratorio que permita identificar: Las tendencias de comportamiento de los conductores,Los tipos de vehículos más propensos a cometer infracciones,La distribución de las sanciones económicas,Las diferencias por género, y otros patrones de interés, además, se busca evaluar el impacto financiero total de las sanciones impuestas en este periodo, así como generar recomendaciones prácticas que contribuyan a fortalecer las estrategias de control vial y educación ciudadana. Este análisis puede ser de gran utilidad para entidades gubernamentales, autoridades de tránsito, investigadores y tomadores de decisiones en el ámbito de la movilidad urbana.
visualizacion de datos
Se visualizan las columnas y los primeros cinco registros del archivo de comparendos captados por una cámara electrónica. Esta vista previa inicial cumple un propósito clave en todo análisis de datos: familiarizarse con la estructura del dataset. Permite identificar las variables que lo componen como la fecha del comparendo, el tipo de infracción, el valor del comparendo, el género del infractor, entre otro, sus formatos numéricos, texto, fechas entre otros
df <- read_excel("comparendos.xlsx", sheet = "tabla estandarizada")
df %>%
head(5) %>%
kable("html", caption = "Primeras 5 filas del archivo de comparendos") %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"))
| No. MANDAMIENTO DE PAGO | FECHA MANDAMIENTO DE PAGO | EJECUTADO | TIPO DE IDENTIFICACION | SUMA_TIPO IDENTIFICACION | No. IDENTIFICACION | GENERO | SUMA_GENERO | COD. INFRACCION | NOMBRE_INFRACCION | SUMA_TIPO INFRACCION | NUM_DIAS COMPA | VALOR COMPARENDO | COMPARENDO | FECHA DE COMPARENDO | DIA | NOMBRE DIA | MES | NOMBRE_MES | AÑO | PACA DE VEHICULO | TIPO VEHICULO | SUMA_TIPO VEHICULO |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| F00002658 | 19/08/2010 | RAMIRO ANTONIO PEREZ HERRERA | Cedula de Ciudadanía | 1 | 72127412 | HOMBRE | 1 | 67 | NO RESPETAR PASO PEATONAL | 1 | 15 | 257490 | F00007946 | 40302 | 4 | martes | 5 | MAYO | 2010 | QHO294 | CARRO | 1 |
| F00004304 | 19/08/2010 | Transportes Mst Y Compania S En C | Nit | 1 | 9001288484 | EMPRESA | 1 | 64 | VELOCIDAD MAYOR A LA PERMITIDA | 1 | 15 | 257490 | F0000469 | 40281 | 13 | martes | 4 | ABRIL | 2010 | UYU967 | CARRO | 1 |
| F00001544 | 19/08/2010 | NANCY ANGELICA GARCIA DUARTE | Cedula de Ciudadanía | 1 | 22692743 | MUJER | 1 | 64 | VELOCIDAD MAYOR A LA PERMITIDA | 1 | 15 | 257490 | F0000925 | 40283 | 15 | jueves | 4 | ABRIL | 2010 | UYZ604 | CARRO | 1 |
| F00001578 | 19/08/2010 | FILOMENA DEL SOCORRO MARTINEZ ROMERO | Cedula de Ciudadanía | 1 | 23179461 | MUJER | 1 | 64 | VELOCIDAD MAYOR A LA PERMITIDA | 1 | 15 | 257490 | F0000160 | 40280 | 12 | lunes | 4 | ABRIL | 2010 | EDN17B | MOTO | 1 |
| F00001372 | 19/08/2010 | SHENYS PAOLA RICO OSPINO | Cedula de Ciudadanía | 1 | 22516592 | MUJER | 1 | 64 | VELOCIDAD MAYOR A LA PERMITIDA | 1 | 15 | 257490 | F00004537 | 40294 | 26 | lunes | 4 | ABRIL | 2010 | BXF75A | MOTO | 1 |
Numero de comparendos cometidos se procede a analizar el numero de comparendos cometidos por los infractores incluyendo en en tipo de sexo y el tipo de vehiculo durante este periodo.
nrow(df)
## [1] 2120
comparendos por mes
Se hace un análisis comparatorio de las infracciones captadas por la cámara electrónica por cada mes, de esta forma se analiza cuál mes presenta el mayor número de infracciones, siendo este el mes de mayo con el mayor número de estas infracciones
df %>%
filter(AÑO == 2010, MES %in% c(4, 5)) %>%
count(NOMBRE_MES) %>%
ggplot(aes(x = NOMBRE_MES, y = n, fill = NOMBRE_MES)) +
geom_col() +
geom_text(aes(label = n), vjust = -0.5, size = 5) +
labs(title = "Comparendos en Abril y Mayo de 2010",
x = "Mes", y = "Cantidad de Comparendos") +
theme_minimal()
tipos de vehiculos con infraccion
en esta grafica se muestra el tipo de vehiculo con mayor infraccion siendo el vehiculo tipo carro el que presenta un mayor numero de infraccion
df %>%
count(`TIPO VEHICULO`) %>%
ggplot(aes(x = reorder(`TIPO VEHICULO`, -n), y = n, fill = `TIPO VEHICULO`)) +
geom_col() +
geom_text(aes(label = n), vjust = -0.3, size = 3.5) +
labs(title = "Comparendos por Tipo de Vehículo",
x = "Tipo de Vehículo", y = "Cantidad") +
theme_minimal() +
theme(legend.position = "none")
Distribución por genero en infraccion
n el análisis realizado sobre el género de los infractores durante los meses de abril y mayo de 2010, se evidenció que el género femenino presentó la mayor proporción de infracciones detectadas por cámaras electrónicas de tránsito. Según el gráfico de torta generado, las mujeres representan un porcentaje superior al masculino dentro del conjunto total de comparendos registrados en este periodo.
Este hallazgo resulta particularmente interesante, ya que contrasta con la percepción común de que los hombres suelen cometer más infracciones de tránsito. No obstante, es importante interpretar estos resultados con una mirada crítica
df %>%
count(GENERO) %>%
mutate(pct = n / sum(n) * 100,
label = paste0(GENERO, "\n", round(pct, 1), "%")) %>%
ggplot(aes(x = "", y = n, fill = GENERO)) +
geom_bar(stat = "identity", width = 1) +
coord_polar("y") +
geom_text(aes(label = label),
position = position_stack(vjust = 0.5), size = 5) +
labs(title = "Distribución por Género") +
theme_void()
Densidad de los valores de comparendos
El gráfico siguiente muestra la distribución de densidad de los valores monetarios de los comparendos registrados por cámaras electrónicas durante los meses de abril y mayo de 2010, la curva no sigue una distribución normal, sino que presenta dos concentraciones de datos claramente diferenciadas, Un pico principal en torno a los $250.000, lo que indica que la mayoría de los comparendos corresponden a sanciones de bajo valor, posiblemente relacionadas con infracciones comunes como exceso de velocidad moderado o no respetar señales de tránsito, Un segundo pico menor cercano a los $500.000, que sugiere la existencia de un número reducido de comparendos de alto valor, La mayor parte de las multas se concentra en valores inferiores a los $300.000, lo que evidencia una tendencia general hacia infracciones menores pero frecuentes, Aunque en menor proporción, se detecta una acumulación significativa de comparendos con valores elevados (superiores a $450.000,El monto total recaudado por concepto de comparendos en el periodo analizado asciende a $646.042.410, una cifra considerable que refleja tanto la frecuencia de las infracciones como el impacto económico del sistema de sanciones electrónicas
total_valor <- sum(df$`VALOR COMPARENDO`, na.rm = TRUE)
df %>%
ggplot(aes(x = `VALOR COMPARENDO`)) +
geom_density(fill = "purple", alpha = 0.6) + # color morado
labs(title = "Distribución del Valor de los Comparendos",
x = "Valor ($)", y = "Densidad") +
theme_minimal() +
annotate("text", x = Inf, y = Inf, label = paste0("Total: $", format(total_valor, big.mark = ",")),
hjust = 1.1, vjust = 1.5, size = 5, color = "black")
Tipo de infracciones En la siguiente gráfica se visualizan los diferentes tipos de infracciones detectadas por las cámaras de tránsito durante los meses de abril y mayo de 2010. El objetivo de esta visualización es identificar cuál o cuáles son las conductas más recurrentes entre los infractores, lo que permite establecer focos de atención para las autoridades viales y orientar estrategias preventivas.
De acuerdo con los datos analizados, la infracción “Mayor velocidad a la permitida” aparece como la más frecuente entre todas las registradas. Esta tendencia pone en evidencia un patrón preocupante: el exceso de velocidad es una conducta reiterada en los conductores, a pesar de ser una de las principales causas de accidentes de tránsito
df %>%
count(NOMBRE_INFRACCION, sort = TRUE) %>%
ggplot(aes(x = reorder(NOMBRE_INFRACCION, n), y = n, fill = NOMBRE_INFRACCION)) +
geom_col(show.legend = FALSE) +
geom_text(aes(label = n), hjust = 1.2, color = "white", size = 4) +
coord_flip() +
labs(title = "Número de Infracciones",
x = "Infracción", y = "Cantidad") +
theme_minimal()
Medidas de tencencia Este bloque de código tiene como objetivo calcular y resumir las principales medidas de tendencia central y dispersión aplicadas a la columna VALOR COMPARENDO de la base de datos, que representa el monto económico de cada comparendo impuesto por cámaras electrónicas de tránsito durante abril y mayo de 2010. El propósito de estas estadísticas es ofrecer una comprensión general del comportamiento de los valores monetarios de las infracciones, ayudando a identificar patrones, extremos y variabilidad en las sanciones impuestas.
Primero, se eliminan los valores vacíos (NA) de la columna mediante na.omit(), para asegurar que los cálculos estadísticos no se vean distorsionados. Luego, se calculan mediana, moda,y media y Posteriormente, se calculan medidas de dispersión, que indican cuánto se alejan los valores del promedio
# Asegurar que el campo tiene el nombre exacto con dos espacios
valores <- na.omit(df$`VALOR COMPARENDO`)
# Medidas de tendencia central
media_valor <- mean(valores)
mediana_valor <- median(valores)
moda_valor <- as.numeric(names(sort(table(valores), decreasing = TRUE)[1]))
# Medidas de dispersión
desviacion <- sd(valores)
varianza <- var(valores)
minimo <- min(valores)
maximo <- max(valores)
rango_total <- maximo - minimo
coef_var <- (desviacion / media_valor) * 100 # en porcentaje
# Crear tabla resumen
resumen <- data.frame(
Estadística = c("Media", "Mediana", "Moda",
"Desviación estándar", "Varianza",
"Mínimo", "Máximo",
"Rango total", "Coeficiente de variación (%)"),
Valor = round(c(media_valor, mediana_valor, moda_valor,
desviacion, varianza,
minimo, maximo,
rango_total, coef_var), 2)
)
# Mostrar tabla bonita
kable(resumen, caption = "Resumen estadístico del valor de los comparendos") %>%
kable_styling(full_width = FALSE, bootstrap_options = c("striped", "hover", "condensed"))
| Estadística | Valor |
|---|---|
| Media | 3.047370e+05 |
| Mediana | 2.574900e+05 |
| Moda | 2.574900e+05 |
| Desviación estándar | 9.968970e+04 |
| Varianza | 9.938036e+09 |
| Mínimo | 2.574900e+05 |
| Máximo | 5.149800e+05 |
| Rango total | 2.574900e+05 |
| Coeficiente de variación (%) | 3.271000e+01 |
Infraccion por genero En este análisis se busca identificar cómo se distribuyen las diferentes infracciones de tránsito entre los géneros registrados en la base de datos. Para ello, se realiza un cruce de variables entre la columna GENERO (que indica el sexo del infractor) y NOMBRE_INFRACCION (que describe el tipo de falta cometida).
# Agrupar por infracción y género, y contar
df %>%
count(NOMBRE_INFRACCION, GENERO) %>%
ggplot(aes(x = reorder(NOMBRE_INFRACCION, n), y = n, fill = GENERO)) +
geom_col(position = "dodge") +
coord_flip() +
labs(
title = "Tipo de Infracción según Género",
x = "Infracción",
y = "Cantidad de Comparendos",
fill = "Género"
) +
theme_minimal() +
theme(
plot.title = element_text(face = "bold", size = 14),
axis.text.y = element_text(size = 10)
)
Conclusón
El análisis de la base de datos de comparendos impuestos por cámaras electrónicas en el periodo de abril y mayo de 2010 revela un panorama claro sobre el comportamiento vial y sus consecuencias económicas. Con un total de 2120 registros, se evidencia una actividad significativa de control electrónico del tránsito, que permite identificar tendencias relevantes para la gestión de la movilidad y la seguridad vial. A través de la exploración de variables como el tipo de vehículo, el sexo del infractor y el valor de los comparendos, se observa que: Los automóviles particulares son los más involucrados en infracciones, seguidos por motocicletas y vehículos de servicio público, La mayoría de los comparendos fueron cometidos por personas de sexo femenino, lo que sugiere posibles diferencias en patrones de conducción Además, se analizaron medidas de tendencia central y dispersión sobre el valor de los comparendos, lo que permite cuantificar el impacto financiero de las infracciones. Estos datos no solo ayudan a comprender el perfil de los infractores, sino que también pueden ser insumo clave para tomar decisiones en campañas de prevención, señalización inteligente y políticas públicas orientadas a reducir las infracciones de tránsito.
En conclusión, este análisis demuestra el valor de la analítica de datos aplicada a la movilidad urbana, aportando evidencias claras sobre patrones de infracción que deben ser considerados para mejorar la cultura vial y la eficiencia de los sistemas de control electrónico.