Análisis Base de Datos Comparendos

Barranquilla 2010

El presente informe tiene como objetivo aplicar funciones estadísticas básicas al análisis de una base de datos relacionada con comparendos de tránsito en los meses de Abril y Mayo del año 2010 en la ciudad de Barranquilla. A través del uso del lenguaje R, se emplearán herramientas para explorar, describir y visualizar la información contenida en el conjunto de datos, con el fin de identificar patrones, tendencias y relaciones relevantes. El análisis incluye medidas de tendencia central, dispersión y representaciones gráficas, lo cual permitirá una comprensión más clara de la dinámica de las infracciones de tránsito registradas.

1.1 Descripción General La base de datos mencionada en la introducción la cual es utilizada en este análisis contiene registros de comparendos de tránsito aplicados a conductores en la ciudad de Barranquilla en el departamento del Atlántico. Contiene filas y columnas donde se integran un conjunto de datos con información de los infractores como: Nombre, Genero, Tipo de vehiculo, Codigo de la infracción, nombre de la infracción, la fecha en que se cometió tanto general como desglosada por el dia, mes, año, nombre del dia y nombre del mes, el valor a pagar, la placa del vehiculo, el tipo y numero de identificacion del infractor.En total, la base contiene 18 columnas y 38.178 registros que permiten realizar un análisis estadístico descriptivo robusto

2 Aplicación de Funciones

Función colnames() Lo primero es llamar a la funcion colnames() para poder identificar los nombres de las columnas y poder llamar a cada uno correctamente.

colnames(df) #Devoler un vector con los nombres de las columna
##  [1] "No. MANDAMIENTO DE PAGO"   "FECHA MANDAMIENTO DE PAGO"
##  [3] "EJECUTADO"                 "TIPO DE IDENTIFICACION"   
##  [5] "No. IDENTIFICACION"        "GENERO"                   
##  [7] "# GENERO"                  "COD. INFRACCION"          
##  [9] "NOMBRE INFRACCION"         "# INFRACCION"             
## [11] "COMPARENDO"                "COSTO DE INFRACCION"      
## [13] "FECHA DE COMPARENDO"       "DIA"                      
## [15] "NOMBRE DIA"                "# DIAS"                   
## [17] "MES"                       "NOMBRE MES"               
## [19] "# MES"                     "AÑOS"                     
## [21] "PACA DE VEHICULO"          "TRANSPORTE"               
## [23] "# VEHICULO"

2.2 Función Resumen

Visualizamos un resumen general de las columnas fechas y del valor a pagar para efectos de revision de estadistica y cuartiles.

summary(df[, c("FECHA DE COMPARENDO")]) # Mostrar resumen estadistico
##  FECHA DE COMPARENDO             
##  Min.   :2010-04-12 00:00:00.00  
##  1st Qu.:2010-04-27 00:00:00.00  
##  Median :2010-05-06 00:00:00.00  
##  Mean   :2010-05-05 16:27:37.35  
##  3rd Qu.:2010-05-16 00:00:00.00  
##  Max.   :2010-05-27 00:00:00.00

3 Aplicación de Medidas y Análisis

3.1 Comparendos por diaaquamarine

Se analiza la cantidad diaria de comparendos registrados, utilizando la columna de fechas para contar cuántas infracciones ocurrieron en cada jornada

df %>%
  count(`FECHA DE COMPARENDO`) %>%
  ggplot(aes(x = `FECHA DE COMPARENDO`, y = n)) +
  geom_line(color = "blue") +
  geom_text(aes(label = n), vjust = -0.5, size = 3, color = "#000000") + # etiquetas encima de cada punto
  labs(
    title = "COMPARENDOS POR DIA",
    x = "FECHA",
    y = "CANTIDAD DE COMPARENDOS"
  ) +
  theme(
    plot.title = element_text(hjust = 0.5)  # <-- centra el título
  )

Se muestra la variación diaria de comparendos. Esto permite detectar días atípicos, eventos especiales o aumentos significativos en infracciones que puedan estar ligados a operativos específicos, cambios de clima, festivos o tráfico inusual. El patrón temporal puede ser útil para prever puntos críticos y ajustar los operativos de tránsito en consecuencia

3.2 Comparendos por género

Se cuenta la cantidad de comparendos según el sexo del infractor

df %>%
  count(GENERO) %>%  # Cuenta comparendos por género/empresa
  ggplot(aes(x = reorder(GENERO, -n), y = n, fill = GENERO)) +  # ordena barras por frecuencia
  geom_col() +  # crea gráfico de barras
  geom_text(aes(label = n), vjust = -0.5, size = 3, color = "blue") +
  labs(
    title = "DISTRIBUCION DE COMPARENDOS POR GENERO/EMPRESA",
    x = "GENERO",   # <-- esto reemplaza 'reorder(GENERO, -n)' en el eje
    y = "CANTIDAD"
  )+
  theme(
    plot.title = element_text(hjust = 0.5)  # <-- centra el título
  )

La segmentación por género revela que las mujeres registran una mayor proporción de comparendos. Este comportamiento podría estar relacionado con su creciente participación como conductoras, tanto en vehículos particulares como en el sector del transporte público y privado. Por otro lado, la participación de empresas también representa un volumen considerable de infracciones, lo que indica la necesidad de fortalecer los controles sobre las flotas vehiculares corporativas.

3.3 Recaudo total por tipo de infracción

Se suman los valores económicos de los comparendos agrupados por el tipo de infracción cometida.

df %>%
  group_by(`NOMBRE INFRACCION`) %>%
  summarise(Total = sum(`COSTO DE INFRACCION`, na.rm = TRUE)) %>%
  arrange(desc(Total)) %>%
  top_n(10, Total) %>%
  ggplot(aes(x = reorder(`NOMBRE INFRACCION`, Total), y = Total)) +
  geom_col(fill = "blue") +
  geom_text(aes(label = scales::comma(Total)),   # etiqueta con comas
            hjust = -0.1,                        # posición horizontal (afuera de la barra)
            color = "black",
            size = 3) +
  coord_flip() +
  labs(
    title = "TOP 4 INFRACCIONES CON MAYOR RECAUDO",
    x = "INFRACCION",
    y = "TOTAL RECAUDO"
  )  +
  theme(
    plot.title = element_text(hjust = -0.5)  # <-- centra el título
  )+
  scale_y_continuous(labels = scales::comma)     # formato de miles con coma

Se evidencia que la infracción con mayor recaudo es el exceso de velocidad, superando los 400 millones de pesos, lo que indica una alta frecuencia y sanción elevada. Le sigue omitir luz roja o PARE, con más de 190 millones, reflejando también una conducta común y sancionada. En tercer lugar, detenerse sobre la cebra genera un recaudo menor, pero evidencia una falta de respeto a la señalización peatonal. Finalmente, transitar en sentido contrario presenta un recaudo muy bajo, lo que puede deberse a su baja ocurrencia o menor detección. En general, el 80 % del recaudo se concentra en las dos primeras infracciones

3.4 Comparendos por tipo de vehiculo

Se agrupa la información por tipo de vehículo y se cuenta la cantidad de infracciones cometidas por cada uno.

df %>%
  count(TRANSPORTE) %>%
  ggplot(aes(x = reorder(TRANSPORTE, -n), y = n)) +
  geom_col(fill = "red") +
  geom_text(aes(label = n), 
            vjust = -0.3,         # posición sobre la barra
            size = 3, 
            color = "black") +
  labs(
    title = "COMPARENDOS POR TIPO DE VEHICULO",
    x = "TIPO DE VEHICULO",
    y = "CANTIDAD"
  ) +
  theme(
    plot.title = element_text(hjust = 0.5)  # <-- centra el título
  )

Se observa que los VEHUCULOS concentran la mayor cantidad de comparendos, superando los 1.900 registros, mientras que las motos registran una cifra significativamente menor, con menos de 300. Esto indica que los vehículos particulares tienen una mayor participación en las infracciones detectadas, posiblemente por su volumen en circulación o mayor exposición a controles automatizados.

3.5 Comparendos por mes

Se agrupan los comparendos por el mes en que ocurrieron para revisar la variación mensual.

df %>%
  count(`NOMBRE MES`) %>%
  ggplot(aes(x = reorder(`NOMBRE MES`, -n), y = n)) +
  geom_col(fill = "green") +
  geom_text(aes(label = n), 
            vjust = -0.3,       # posición por encima de la barra
            size = 3, 
            color = "black") +
  labs(
    title = "COMPARENDOS POR MES",
    x = "MES",
    y = "CANTIDAD"
  )  +
  theme(
    plot.title = element_text(hjust = 0.5)  # <-- centra el título
  )

Se observa la cantidad de comparendos registrados por mes. Durante el mes de mayo se registraron 1.408 comparendos, mientras que en abril se reportaron cerca de 712. Esto representa un incremento de más del 85 % en el número de comparendos de abril a mayo.

3.6 Top 10 personas con mas comparendos

Se identifican las 10 personas con más comparendos registrados, excluyendo empresas.

df %>%
  filter(GENERO != "EMPRESA") %>%
  count(EJECUTADO, sort = TRUE) %>%
  top_n(10, n) %>%
  ggplot(aes(x = reorder(EJECUTADO, n), y = n)) +
  geom_col(fill = "#eeee00") +
  geom_text(aes(label = n),
            hjust = -0.2,   # posición a la derecha de la barra
            size = 3,
            color = "black") +
  coord_flip() +
  labs(
    title = "TOP 10 PERSONAS CON MAS COMPARENDOS",
    x = "NOMBRE",
    y = "CANTIDAD"
  ) +
  theme(
    plot.title = element_text(hjust = 0.5)  # <-- centra el título
  )

Permite ver de forma discriminada las 10 personas que mas cometieron infracciones durante abril y mayo del 2010 en Barranquilla, iniciando el listado por parte del genero femenino, la señora Liliana Rozo Pinzon sumando 27 infracciones cometidas, lo que indica una falta de sensibilizacion y control por parte de las autoridades, en especifico con los reincidentes comunes.

4 Conclusión

El análisis integral de los comparendos revela patrones claros en el comportamiento vial dentro del período observado. La mayor cantidad de infracciones es cometida por mujeres y automoviles, especialmente en días de semana con alto flujo vehicular, cada 15 dias en el mes. Las infracciones más comunes también son las de mayor impacto económico, lo que sugiere una relación entre la gravedad de la falta y su recurrencia. Además, las empresas juegan un papel en la generación de comparendos, destacando la necesidad de estrategias diferenciadas entre personas naturales y jurídicas. El total recaudado por infracciones representa un impacto económico considerable, lo cual evidencia tanto la magnitud del problema como el potencial de estos recursos para ser reinvertidos en seguridad vial. La identificación de reincidentes permite focalizar intervenciones educativas y sancionatorias más precisas. En conjunto, estos resultados subrayan la importancia de implementar políticas públicas basadas en datos: desde campañas educativas personalizadas hasta operativos estratégicos según el tipo de vehículo, día y tipo de infractor. La gestión efectiva de los comparendos no solo debe castigar, sino también prevenir, orientar y transformar los hábitos de conducción para mejorar la seguridad vial colectiva