Informe de Análisis Base de Datos Comparendos Barranquilla 2010
1 Introducción
El presente informe tiene como objetivo aplicar funciones estadísticas básicas al análisis de una base de datos relacionada con comparendos de tránsito en los meses de Abril y Mayo del año 2010 en la ciudad de Barranquilla. A través del uso del lenguaje R, se emplearán herramientas para explorar, describir y visualizar la información contenida en el conjunto de datos, con el fin de identificar patrones, tendencias y relaciones relevantes. El análisis incluye medidas de tendencia central, dispersión y representaciones gráficas, lo cual permitirá una comprensión más clara de la dinámica de las infracciones de tránsito registradas.
1.1 Descripción General
La base de datos mencionada en la introducción la cual es utilizada en este análisis contiene registros de comparendos de tránsito aplicados a conductores en la ciudad de Barranquilla en el departamento del Atlántico. Contiene filas y columnas donde se integran un conjunto de datos con información de los infractores como: Nombre, Genero, Tipo de vehiculo, Codigo de la infracción, nombre de la infracción, la fecha en que se cometió tanto general como desglosada por el dia, mes, año, nombre del dia y nombre del mes, el valor a pagar, la placa del vehiculo, el tipo y numero de identificacion del infractor.En total, la base contiene 18 columnas y 38.178 registros que permiten realizar un análisis estadístico descriptivo robusto
2 Aplicación de Funciones
2.1 Función colnames()
Lo primero es llamar a la funcion colnames() para poder identificar los nombres de las columnas y poder llamar a cada uno correctamente.
## [1] "No. MANDAMIENTO DE PAGO" "FECHA MANDAMIENTO DE PAGO"
## [3] "EJECUTADO" "TIPO DE IDENTIFICACION"
## [5] "No. IDENTIFICACION" "SEXO"
## [7] "COD. INFRACCION" "NOMBRE INFRACCION"
## [9] "COMPARENDO" "FECHA DE COMPARENDO"
## [11] "FECHA" "AÑO"
## [13] "DIA" "MES"
## [15] "NOMBRE DEL MES" "PLACA DE VEHICULO"
## [17] "TIPO DE VEHICULO" "VALOR_A_PAGAR"
2.2 Función Resumen
Visualizamos un resumen general de las columnas fechas y del valor a pagar para efectos de revision de estadistica y cuartiles.
## FECHA
## Min. :2010-04-12
## 1st Qu.:2010-04-27
## Median :2010-05-06
## Mean :2010-05-05
## 3rd Qu.:2010-05-16
## Max. :2010-05-27
3 Aplicación de Medidas y Análisis
3.1 Comparendos por dia
Se analiza la cantidad diaria de comparendos registrados, utilizando la columna de fechas para contar cuántas infracciones ocurrieron en cada jornada.
df %>%
count(FECHA) %>% # Contar comparendos por fecha específica
ggplot(aes(x = FECHA, y = n)) + # Define ejes del gráfico
geom_line(color = "steelblue") + # Gráfico de línea para observar evolución diaria
labs(title = "Comparendos por Día", x = "Fecha", y = "Cantidad de Comparendos") # Etiquetas del gráficoSe muestra la variación diaria de comparendos. Esto permite detectar días atípicos, eventos especiales o aumentos significativos en infracciones que puedan estar ligados a operativos específicos, cambios de clima, festivos o tráfico inusual. El patrón temporal puede ser útil para prever puntos críticos y ajustar los operativos de tránsito en consecuencia.
3.2 Comparendos por género
Se cuenta la cantidad de comparendos según el sexo del infractor.
df %>%
count(SEXO) %>% # Cuenta comparendos por género/empresa
ggplot(aes(x = reorder(SEXO, -n), y = n, fill = SEXO)) + # Ordena barras por frecuencia
geom_col() + # Crea gráfico de barras
labs(title = "Distribución de Comparendos por Género/Empresa", x = "Género", y = "Cantidad") + #Titulos y ejes
theme(legend.position = "none") #Ocultar leyendasLa segmentación por género revela que las mujeres registran una mayor proporción de comparendos. Este comportamiento podría estar relacionado con su creciente participación como conductoras, tanto en vehículos particulares como en el sector del transporte público y privado. Por otro lado, la participación de empresas también representa un volumen considerable de infracciones, lo que indica la necesidad de fortalecer los controles sobre las flotas vehiculares corporativas.
3.3 Recaudo total por tipo de infracción
Se suman los valores económicos de los comparendos agrupados por el tipo de infracción cometida.
df %>%
group_by(`NOMBRE INFRACCION`) %>% # Agrupa por tipo de infracción
summarise(Total = sum(VALOR_A_PAGAR, na.rm = TRUE)) %>% # Suma total recaudado por infracción
arrange(desc(Total)) %>% # Ordena de mayor a menor
top_n(10, Total) %>% # Selecciona las 10 con mayor recaudo
ggplot(aes(x = reorder(`NOMBRE INFRACCION`, Total), y = Total)) + # Define ejes ordenando por total
geom_col(fill = "darkred") + # Barras en color rojo oscuro
coord_flip() + # Invierte ejes para mejor lectura
labs(title = "Top 10 Infracciones con Mayor Recaudo", x = "Infracción", y = "Total Recaudado") + # Título y ejes
scale_y_continuous(labels = comma) # Formato con comas en el eje YSe evidencia que la infracción con mayor recaudo es el exceso de velocidad, superando los 600 millones de pesos, lo que indica una alta frecuencia y sanción elevada. Le sigue omitir luz roja o PARE, con más de 200 millones, reflejando también una conducta común y sancionada. En tercer lugar, detenerse sobre la cebra genera un recaudo menor, pero evidencia una falta de respeto a la señalización peatonal. Finalmente, transitar en sentido contrario presenta un recaudo muy bajo, lo que puede deberse a su baja ocurrencia o menor detección. En general, el 80 % del recaudo se concentra en las dos primeras infracciones.
3.4 Comparendos por tipo de vehiculo
Se agrupa la información por tipo de vehículo y se cuenta la cantidad de infracciones cometidas por cada uno.
df %>%
count(`TIPO DE VEHICULO`) %>% # Cuenta comparendos por tipo de vehículo
ggplot(aes(x = reorder(`TIPO DE VEHICULO`, -n), y = n)) + # Ordena barras por frecuencia
geom_col(fill = "darkgreen") +
labs(title = "Comparendos por Tipo de Vehículo", x = "Tipo de Vehículo", y = "Cantidad")Se observa que los carros concentran la mayor cantidad de comparendos, superando los 1.900 registros, mientras que las motos registran una cifra significativamente menor, con menos de 300. Esto indica que los vehículos particulares tienen una mayor participación en las infracciones detectadas, posiblemente por su volumen en circulación o mayor exposición a controles automatizados.
3.5 Comparendos por mes
Se agrupan los comparendos por el mes en que ocurrieron para revisar la variación mensual.
df %>%
count(`NOMBRE DEL MES`) %>% # Cuenta comparendos por mes
ggplot(aes(x = reorder(`NOMBRE DEL MES`, -n), y = n)) + # Ordena barras por cantidad
geom_col(fill = "purple") +
labs(title = "Comparendos por Mes", x = "Mes", y = "Cantidad")Se observa la cantidad de comparendos registrados por mes. Durante el mes de mayo se registraron aproximadamente 1.300 comparendos, mientras que en abril se reportaron cerca de 700. Esto representa un incremento de más del 85 % en el número de comparendos de abril a mayo.
3.6 Top 10 personas con mas comparendos
Se identifican las 10 personas con más comparendos registrados, excluyendo empresas.
df %>%
filter(SEXO != "EMPRESA") %>% # Excluir empresas
count(EJECUTADO, sort = TRUE) %>% # Contar comparendos por persona, ordenado descendente
top_n(10, n) %>% # Seleccionar top 10 personas con más comparendos
ggplot(aes(x = reorder(EJECUTADO, n), y = n)) + # Definir ejes y orden para el gráfico
geom_col(fill = "brown") +
coord_flip() + # Invierte ejes para mejor lectura
labs(title = "Top 10 Personas con Más Comparendos", x = "Nombre", y = "Cantidad")Permite ver de forma discriminada las 10 personas que mas cometieron infracciones durante abril y mayo del 2010 en Barranquilla, iniciando el listado por parte del genero femenino, la señora Liliana Rozo Pinzon sumando 20 infracciones cometidas, lo que indica una falta de sensibilizacion y control por parte de las autoridades, en especifico con los reincidentes comunes.
4 Conclusión
El análisis integral de los comparendos revela patrones claros en el comportamiento vial dentro del período observado. La mayor cantidad de infracciones es cometida por mujeres y automoviles, especialmente en días de semana con alto flujo vehicular, cada 15 dias en el mes. Las infracciones más comunes también son las de mayor impacto económico, lo que sugiere una relación entre la gravedad de la falta y su recurrencia. Además, las empresas juegan un papel en la generación de comparendos, destacando la necesidad de estrategias diferenciadas entre personas naturales y jurídicas.
El total recaudado por infracciones representa un impacto económico considerable, lo cual evidencia tanto la magnitud del problema como el potencial de estos recursos para ser reinvertidos en seguridad vial. La identificación de reincidentes permite focalizar intervenciones educativas y sancionatorias más precisas.
En conjunto, estos resultados subrayan la importancia de implementar políticas públicas basadas en datos: desde campañas educativas personalizadas hasta operativos estratégicos según el tipo de vehículo, día y tipo de infractor. La gestión efectiva de los comparendos no solo debe castigar, sino también prevenir, orientar y transformar los hábitos de conducción para mejorar la seguridad vial colectiva.