1 Introducción

En este documento se realiza una breve exploración de la base de datos Comparendos, que contiene información relacionada con infracciones de tránsito en la ciudad de Barranquilla, en el periodo Abril-Mayo del año 2010. Con el fin de obtener una visión general de la situación presentada, se realizarón gráficos que muestran la cantidad de comparendos reportados con respecto al tipo de infracción, el tipo de vehiculo, los meses registrados, el sexo del infractor, etc.Se utilizarán herramientas básicas de R para importar, visualizar y analizar los datos. A continuación se muestra la información brindada por la base de datos elegida.

##  [1] "No. MANDAMIENTO DE PAGO"   "FECHA MANDAMIENTO DE PAGO"
##  [3] "EJECUTADO"                 "TIPO DE IDENTIFICACION"   
##  [5] "No. IDENTIFICACION"        "SEXO"                     
##  [7] "COD. INFRACCION"           "COMPARENDO"               
##  [9] "FECHA DE COMPARENDO"       "FECHA"                    
## [11] "AÑO"                       "DIA"                      
## [13] "MES"                       "NOMBRE DEL MES"           
## [15] "PACA DE VEHICULO"          "TIPO DE VEHICULO"         
## [17] "VALOR_A_PAGAR"

1.1 Diccionario de variables

Este resumen ofrece una descripción general de las variables numéricas y categóricas del conjunto de datos.

Clases y descripcion de cada variable en el dataset
Variable Clase Descripcion
No. MANDAMIENTO DE PAGO character Numero del mandamiento de pago
FECHA MANDAMIENTO DE PAGO character Fecha del mandamiento de pago
EJECUTADO character Estado del comparendo
TIPO DE IDENTIFICACION character Tipo de identificacion del infractor
No. IDENTIFICACION numeric Numero de identificacion del infractor
SEXO character Sexo del infractor
COD. INFRACCION numeric Codigo de la infraccion
COMPARENDO character Numero del comparendo
FECHA DE COMPARENDO numeric Fecha en que se hizo el comparendo
FECHA POSIXct, POSIXt Fecha en formato caracter
AÑO numeric Ano de la infraccion
DIA numeric Dia de la infraccion
MES numeric Mes de la infraccion
NOMBRE DEL MES character Nombre del mes de la infraccion
PACA DE VEHICULO character Placa del vehiculo
TIPO DE VEHICULO character Tipo de vehiculo
VALOR_A_PAGAR numeric Valor monetario a pagar

1.2 Control de calidad de los datos

Antes de realizar el análisis, se verifico la integridad de los datos teniendo en cuenta las siguientes caracteristicas:

Valores faltantes: Ninguna variable critica tiene NA significativos.

Variables categoricas incosistentes: Se identifico que la columna SEXO incluye categorias incorrectas como “EMPRESA” y “CEDULA NUEVA”.

Formatos de variables: Se convirtieron fechas a formato Date y el valor_a_pagar a formato numerico.

1.3 Librerías utilizadas

Para realizar este informe se hizo uso de las siguientes librerias:

knitr: Es una libreria que convierte los resultados de R en formatos bonitos dentro de los documentos Markdown, HTML, word o PDF.

readr: Forma parde del tidyverse y ayuda a importar datos desde archivos de texto (CSV, TSV, etc)

dplyr: Una de las librerias más importantes del tidyverse, sirve para manipular y transformar datos de manera eficiente.

ggplot2: Libreria para visualización de datos basada en la gramatica de los gráficos.

tidyverse: Conjunto de paquetes diseñados para trabajar juntos de manera coherente en el flujo de analisis de datos (lectura, manipulación, visualización).

2 Consultas a la base de datos

2.1 Comparendos por mes

Identificar y analizar la cantidad de comparendos registrados en cada mes del año, con el fin de determinar los períodos con mayor y menor incidencia de infracciones y observar posibles patrones de comportamiento a lo largo del tiempo.

2.2 Conteo por tipo de infracción

En esta consulta se muestran la cantidad de comparendos registrados según el tipo de infracción cometida, puede consultar las tarifas actualizadas en la ciudad de Barranquilla aqui. En el gráfico se logra observar una clara desigualdad en la distribución de infracciones, siendo el codigo 64 la que presenta mayoria de casos y el cual corresponde a infracciones por exceso de velocidad.

2.3 Cantidad de comparendos por tipo de vehiculo

Identificar y analizar la cantidad de comparendos asociados a cada tipo de vehículo registrado en la base de datos, con el fin de determinar cuáles presentan una mayor participación en las infracciones y evaluar su distribución dentro del total de comparendos.

3 Concluciones

  • Las mujeres encabezan la cantidad de comparendos con alrededor del 44%, seguidas por los hombres (29%).

  • La infracción con código 64 es la más frecuente, representando una proporción significativa del total de comparendos registrados. Esto indica que esta conducta infractora es recurrente y debería ser objeto de especial atención en programas de educación y control de tránsito.

  • Los vehiculos con mayores numeros de comparendos son los carros, representando un 91.4% de los registros totales.