Informe de Análisis Base de Datos Comparendos Barranquilla 2010

1 Introducción

El presente informe tiene como objetivo aplicar funciones estadísticas básicas al análisis de una base de datos relacionada con comparendos de tránsito en los meses de Abril y Mayo del año 2010 en la ciudad de Barranquilla. A través del uso del lenguaje R, se emplearán herramientas para explorar, describir y visualizar la información contenida en el conjunto de datos, con el fin de identificar patrones, tendencias y relaciones relevantes. El análisis incluye medidas de tendencia central, dispersión y representaciones gráficas, lo cual permitirá una comprensión más clara de la dinámica de las infracciones de tránsito registradas.

1.1 Descripción General

La base de datos mencionada en la introducción la cual es utilizada en este análisis contiene registros de comparendos de tránsito aplicados a conductores en la ciudad de Barranquilla en el departamento del Atlántico. Contiene filas y columnas donde se integran un conjunto de datos con información de los infractores como: Nombre, Genero, Tipo de vehiculo, Codigo de la infracción, nombre de la infracción, la fecha en que se cometió tanto general como desglosada por el dia, mes, año, nombre del dia y nombre del mes, el valor a pagar, la placa del vehiculo, el tipo y numero de identificacion del infractor.En total, la base contiene 18 columnas y 38.178 registros que permiten realizar un análisis estadístico descriptivo robusto

# Cargar librerías necesarias y lectura del archivo excel
knitr::opts_chunk$set(echo = TRUE)
library(dplyr)
library(readxl)
library(ggplot2)
library(scales)
df <- read_excel("BD Comparendos OK$.xlsx")

2 Aplicación de Funciones

2.1 Función colnames()

Lo primero es llamar a la funcion colnames() para poder identificar los nombres de las columnas y poder llamar a cada uno correctamente.

colnames(df) #Devoler un vector con los nombres de las columnas
##  [1] "No. MANDAMIENTO DE PAGO"   "FECHA MANDAMIENTO DE PAGO"
##  [3] "EJECUTADO"                 "TIPO DE IDENTIFICACION"   
##  [5] "No. IDENTIFICACION"        "SEXO"                     
##  [7] "COD. INFRACCION"           "NOMBRE INFRACCION"        
##  [9] "COMPARENDO"                "FECHA DE COMPARENDO"      
## [11] "FECHA"                     "AÑO"                      
## [13] "DIA"                       "MES"                      
## [15] "NOMBRE DEL MES"            "PLACA DE VEHICULO"        
## [17] "TIPO DE VEHICULO"          "VALOR_A_PAGAR"

2.2 Función Resumen

Visualizamos un resumen general de las columnas fechas y del valor a pagar para efectos de revision de estadistica y cuartiles.

summary(df[, c("FECHA")]) # Mostrar resumen estadistico
##      FECHA           
##  Min.   :2010-04-12  
##  1st Qu.:2010-04-27  
##  Median :2010-05-06  
##  Mean   :2010-05-05  
##  3rd Qu.:2010-05-16  
##  Max.   :2010-05-27

3 Aplicación de Medidas y Análisis

3.1 Comparendos por dia

Se analiza la cantidad diaria de comparendos registrados, utilizando la columna de fechas para contar cuántas infracciones ocurrieron en cada jornada.

df %>%
  count(FECHA) %>%  # Contar comparendos por fecha específica
  ggplot(aes(x = FECHA, y = n)) + # Define ejes del gráfico
  geom_line(color = "steelblue") +  # Gráfico de línea para observar evolución diaria
  labs(title = "Comparendos por Día", x = "Fecha", y = "Cantidad de Comparendos") # Etiquetas del gráfico

Se muestra la variación diaria de comparendos. Esto permite detectar días atípicos, eventos especiales o aumentos significativos en infracciones que puedan estar ligados a operativos específicos, cambios de clima, festivos o tráfico inusual. El patrón temporal puede ser útil para prever puntos críticos y ajustar los operativos de tránsito en consecuencia.

3.2 Comparendos por género

Se cuenta la cantidad de comparendos según el sexo del infractor.

df %>%
  count(SEXO) %>% # Cuenta comparendos por género/empresa
  ggplot(aes(x = reorder(SEXO, -n), y = n, fill = SEXO)) + # Ordena barras por frecuencia
  geom_col() + # Crea gráfico de barras
  labs(title = "Distribución de Comparendos por Género/Empresa", x = "Género", y = "Cantidad") + #Titulos y ejes
  theme(legend.position = "none") #Ocultar leyendas

La segmentación por género revela que las mujeres registran una mayor proporción de comparendos. Este comportamiento podría estar relacionado con su creciente participación como conductoras, tanto en vehículos particulares como en el sector del transporte público y privado. Por otro lado, la participación de empresas también representa un volumen considerable de infracciones, lo que indica la necesidad de fortalecer los controles sobre las flotas vehiculares corporativas.

3.3 Recaudo total por tipo de infracción

Se suman los valores económicos de los comparendos agrupados por el tipo de infracción cometida.

df %>%
  group_by(`NOMBRE INFRACCION`) %>% # Agrupa por tipo de infracción
  summarise(Total = sum(VALOR_A_PAGAR, na.rm = TRUE)) %>% # Suma total recaudado por infracción
  arrange(desc(Total)) %>% # Ordena de mayor a menor
  top_n(10, Total) %>% # Selecciona las 10 con mayor recaudo
  ggplot(aes(x = reorder(`NOMBRE INFRACCION`, Total), y = Total)) + # Define ejes ordenando por total
  geom_col(fill = "darkred") + # Barras en color rojo oscuro
  coord_flip() + # Invierte ejes para mejor lectura
  labs(title = "Top 10 Infracciones con Mayor Recaudo", x = "Infracción", y = "Total Recaudado") + # Título y ejes
  scale_y_continuous(labels = comma) # Formato con comas en el eje Y

Se evidencia que la infracción con mayor recaudo es el exceso de velocidad, superando los 600 millones de pesos, lo que indica una alta frecuencia y sanción elevada. Le sigue omitir luz roja o PARE, con más de 200 millones, reflejando también una conducta común y sancionada. En tercer lugar, detenerse sobre la cebra genera un recaudo menor, pero evidencia una falta de respeto a la señalización peatonal. Finalmente, transitar en sentido contrario presenta un recaudo muy bajo, lo que puede deberse a su baja ocurrencia o menor detección. En general, el 80 % del recaudo se concentra en las dos primeras infracciones.

3.4 Comparendos por tipo de vehiculo

Se agrupa la información por tipo de vehículo y se cuenta la cantidad de infracciones cometidas por cada uno.

df %>%
  count(`TIPO DE VEHICULO`) %>% # Cuenta comparendos por tipo de vehículo
  ggplot(aes(x = reorder(`TIPO DE VEHICULO`, -n), y = n)) + # Ordena barras por frecuencia
  geom_col(fill = "darkgreen") + 
  labs(title = "Comparendos por Tipo de Vehículo", x = "Tipo de Vehículo", y = "Cantidad")

Se observa que los carros concentran la mayor cantidad de comparendos, superando los 1.900 registros, mientras que las motos registran una cifra significativamente menor, con menos de 300. Esto indica que los vehículos particulares tienen una mayor participación en las infracciones detectadas, posiblemente por su volumen en circulación o mayor exposición a controles automatizados.

3.5 Comparendos por mes

Se agrupan los comparendos por el mes en que ocurrieron para revisar la variación mensual.

df %>%
  count(`NOMBRE DEL MES`) %>% # Cuenta comparendos por mes
  ggplot(aes(x = reorder(`NOMBRE DEL MES`, -n), y = n)) + # Ordena barras por cantidad
  geom_col(fill = "purple") +
  labs(title = "Comparendos por Mes", x = "Mes", y = "Cantidad")

Se observa la cantidad de comparendos registrados por mes. Durante el mes de mayo se registraron aproximadamente 1.300 comparendos, mientras que en abril se reportaron cerca de 700. Esto representa un incremento de más del 85 % en el número de comparendos de abril a mayo.

3.6 Top 10 personas con mas comparendos

Se identifican las 10 personas con más comparendos registrados, excluyendo empresas.

df %>%
  filter(SEXO != "EMPRESA") %>%  # Excluir empresas
  count(EJECUTADO, sort = TRUE) %>% # Contar comparendos por persona, ordenado descendente
  top_n(10, n) %>% # Seleccionar top 10 personas con más comparendos
  ggplot(aes(x = reorder(EJECUTADO, n), y = n)) + # Definir ejes y orden para el gráfico
  geom_col(fill = "brown") +
  coord_flip() + # Invierte ejes para mejor lectura
  labs(title = "Top 10 Personas con Más Comparendos", x = "Nombre", y = "Cantidad")

Permite ver de forma discriminada las 10 personas que mas cometieron infracciones durante abril y mayo del 2010 en Barranquilla, iniciando el listado por parte del genero femenino, la señora Liliana Rozo Pinzon sumando 20 infracciones cometidas, lo que indica una falta de sensibilizacion y control por parte de las autoridades, en especifico con los reincidentes comunes.

4 Conclusión

El análisis integral de los comparendos revela patrones claros en el comportamiento vial dentro del período observado. La mayor cantidad de infracciones es cometida por mujeres y automoviles, especialmente en días de semana con alto flujo vehicular, cada 15 dias en el mes. Las infracciones más comunes también son las de mayor impacto económico, lo que sugiere una relación entre la gravedad de la falta y su recurrencia. Además, las empresas juegan un papel en la generación de comparendos, destacando la necesidad de estrategias diferenciadas entre personas naturales y jurídicas.

El total recaudado por infracciones representa un impacto económico considerable, lo cual evidencia tanto la magnitud del problema como el potencial de estos recursos para ser reinvertidos en seguridad vial. La identificación de reincidentes permite focalizar intervenciones educativas y sancionatorias más precisas.

En conjunto, estos resultados subrayan la importancia de implementar políticas públicas basadas en datos: desde campañas educativas personalizadas hasta operativos estratégicos según el tipo de vehículo, día y tipo de infractor. La gestión efectiva de los comparendos no solo debe castigar, sino también prevenir, orientar y transformar los hábitos de conducción para mejorar la seguridad vial colectiva.