read_excel(“C:/Users/SENA/Downloads/Comparendos/BD Comparendos OK$.xlsx”)

Este es un resumen de los comparendos registrados en Colombia, donde se recopila información sobre las diferentes infracciones de tránsito cometidas por conductores en el país. Los datos permiten analizar las principales causas de sanción, los tipos de vehículos más involucrados, las regiones con mayor número de comparendos y las tendencias en el comportamiento vial. Este análisis resulta fundamental para comprender la magnitud de las faltas de tránsito, promover estrategias de educación y control, y fortalecer la cultura ciudadana orientada a una movilidad más segura y responsable en las vías colombianas.Para más información dirigirse a la base de datos Comparendos.

knitr::include_graphics("Comparendos/cuando-caduca-comparendo-transito.jpg")

Desarrollo: En este apartado se mostraran consultas importantes para ver ciertos patrones, también para ver algunas tendencias y todo esto para llegar a cierto tipo de conclusión, todo esto lo llevaremos a cabo mediante graficas, y diferente tipos de cosas para llegar a conclusiones precisas.

  library(tidyverse)
  library(readxl)
  
  resultados <- read_excel("C:/Users/SENA/Downloads/Comparendos/BD Comparendos OK$.xlsx")
  
  comparendos_sexo <- resultados %>%
    filter(SEXO %in% c("HOMBRE", "MUJER", "EMPRESA")) %>%
    group_by(SEXO) %>%
    summarise(total = n()) %>%
    mutate(porcentaje = round((total / sum(total)) * 100, 1))
  
  print(comparendos_sexo)
## # A tibble: 3 × 3
##   SEXO    total porcentaje
##   <chr>   <int>      <dbl>
## 1 EMPRESA   472       22.3
## 2 HOMBRE    677       31.9
## 3 MUJER     971       45.8
  ggplot(comparendos_sexo, aes(x = "", y = total, fill = SEXO)) +
    geom_col(color = "black") +                             # color del borde
    coord_polar(theta = "y") +
    theme_void() +
    labs(
      title = "Comparendos por Sexo en Colombia",
      subtitle = "Porcentaje de comparendos segun el sexo del infractor",
      fill = "Sexo"
    ) +
    scale_fill_manual(values = c(
      "HOMBRE" = "#4A4A4A",   # azul
      "MUJER" = "#B0B0B0",    # rosado
      "EMPRESA" = "#2E86C1"   # verde
    )) +
    geom_text(aes(label = paste0(porcentaje, "%")),
              position = position_stack(vjust = 0.5),
              size = 4) +
    theme(
      plot.title = element_text(hjust = 0.5, face = "bold"),
      plot.subtitle = element_text(hjust = 0.5)
  )

library(tidyverse)
library(readxl)
library(scales) # Para formatear números grandes
## Warning: package 'scales' was built under R version 4.5.2
## 
## Adjuntando el paquete: 'scales'
## The following object is masked from 'package:purrr':
## 
##     discard
## The following object is masked from 'package:readr':
## 
##     col_factor
Comparendo <- read_excel("C:/Users/SENA/Downloads/Comparendos/BD Comparendos OK$.xlsx")

analisis_frecuencia_vehiculo <- resultados %>%
  
  # Seleccionar la columna de tipo de vehículo, agrupar y contar
  group_by(`TIPO DE VEHICULO`) %>%
  summarise(total_comparendos = n(), .groups = 'drop') %>%
  
  # Filtrar tipos de vehículo con nombre vacío o NA para limpieza
  filter(!is.na(`TIPO DE VEHICULO`) & `TIPO DE VEHICULO` != "") %>%
  
  # Ordenar por el conteo total de forma descendente
  arrange(desc(total_comparendos)) %>%
  
  # Tomar los 15 tipos de vehículo más comunes para un gráfico legible
  slice_head(n = 15)

# Mostrar los datos resultantes
print(analisis_frecuencia_vehiculo)
## # A tibble: 2 × 2
##   `TIPO DE VEHICULO` total_comparendos
##   <chr>                          <int>
## 1 CARRO                           1938
## 2 MOTO                             182
# =========================================================================
# 2. Creación del Gráfico de Barras Horizontal (Frecuencia)
# =========================================================================

ggplot(analisis_frecuencia_vehiculo, aes(
    # Reordenar los tipos de vehículos de menor a mayor para que el Top 1 quede arriba
    x = fct_reorder(`TIPO DE VEHICULO`, total_comparendos), 
    y = total_comparendos, 
    fill = total_comparendos
  )) +
  
  # Geometría de las barras
  geom_col(color = "white") +
  
  # Etiquetas de valor en las barras (formato de número grande)
  geom_text(aes(label = comma(total_comparendos)), 
            hjust = 0, size = 3.5, color = "#228B22") +
  
  # Invertir coordenadas para barras horizontales, que son mejores para tipos largos
  coord_flip() +
  
  # Escala de color con gradiente para visualizar la intensidad del conteo
  scale_fill_gradient(
    low = "#D4EDDA",  # Verde claro pastel
    high = "#228B22", # Verde bosque oscuro
    name = "Total Comparendos"
  ) +
  
  # Personalización de etiquetas
  labs(
    title = "Frecuencia de Comparendos por Tipo de Vehículo (Top 15)",
    subtitle = "Tipos de vehículos con el mayor número de infracciones registradas",
    x = "Tipo de Vehículo",
    y = "Número Total de Comparendos"
  ) +
  
  # Tema visual limpio
  theme_minimal(base_size = 14) +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold", size = 18, color = "#228B22"),
    plot.subtitle = element_text(hjust = 0.5, size = 12, color = "gray50"),
    axis.text.y = element_text(size = 10),
    axis.title.y = element_text(margin = margin(r = 15)),
    legend.position = "bottom"
  )

El análisis del archivo Base de datos comparendo permite observar un panorama claro sobre el comportamiento de las infracciones de tránsito en Colombia.
Los datos evidencian que los hombres son los principales infractores, registrando una cantidad significativamente mayor de comparendos en comparación con las mujeres y las empresas. Este patrón se mantiene de forma constante en los diferentes periodos analizados. En cuanto a la distribución por días de la semana, se identifica que los jueves y viernes concentran la mayor cantidad de comparendos, lo cual coincide con los días de mayor movilidad y actividad laboral, factores que suelen incrementar la probabilidad de cometer infracciones. Los fines de semana presentan una leve disminución, posiblemente por la reducción de desplazamientos laborales. Por otro lado, los datos del costo de los comparendos reflejan una variabilidad amplia, indicando que existen tanto infracciones leves como sanciones de alto valor económico, lo que sugiere una mezcla de faltas menores (como estacionamiento indebido) y otras más graves (como conducir bajo efectos de alcohol o exceso de velocidad). En conjunto, estos resultados muestran que los comparendos no solo representan un mecanismo de control vial, sino también un reflejo del comportamiento ciudadano frente a las normas de tránsito. La tendencia observada sugiere la necesidad de reforzar campañas de educación vial, especialmente dirigidas a la población masculina y en los días de mayor circulación vehicular, para reducir la reincidencia y promover una movilidad más segura.