En este documento se realiza una breve exploración de la base de datos Comparendos, que contiene información relacionada con infracciones de tránsito en la ciudad de Barranquilla, en el periodo Abril-Mayo del año 2010. Con el fin de obtener una visión general de la situación presentada, se realizarón gráficos que muestran la cantidad de comparendos reportados con respecto al tipo de infracción, el tipo de vehiculo, los meses registrados, el sexo del infractor, etc.Se utilizarán herramientas básicas de R para importar, visualizar y analizar los datos. A continuación se muestra la información brindada por la base de datos elegida.
## [1] "No. MANDAMIENTO DE PAGO" "FECHA MANDAMIENTO DE PAGO"
## [3] "EJECUTADO" "TIPO DE IDENTIFICACION"
## [5] "No. IDENTIFICACION" "SEXO"
## [7] "COD. INFRACCION" "COMPARENDO"
## [9] "FECHA DE COMPARENDO" "FECHA"
## [11] "AÑO" "DIA"
## [13] "MES" "NOMBRE DEL MES"
## [15] "PACA DE VEHICULO" "TIPO DE VEHICULO"
## [17] "VALOR_A_PAGAR"
Este resumen ofrece una descripción general de las variables numéricas y categóricas del conjunto de datos.
| Variable | Clase | Descripcion |
|---|---|---|
| No. MANDAMIENTO DE PAGO | character | Numero del mandamiento de pago |
| FECHA MANDAMIENTO DE PAGO | character | Fecha del mandamiento de pago |
| EJECUTADO | character | Estado del comparendo |
| TIPO DE IDENTIFICACION | character | Tipo de identificacion del infractor |
| No. IDENTIFICACION | numeric | Numero de identificacion del infractor |
| SEXO | character | Sexo del infractor |
| COD. INFRACCION | numeric | Codigo de la infraccion |
| COMPARENDO | character | Numero del comparendo |
| FECHA DE COMPARENDO | numeric | Fecha en que se hizo el comparendo |
| FECHA | POSIXct, POSIXt | Fecha en formato caracter |
| AÑO | numeric | Ano de la infraccion |
| DIA | numeric | Dia de la infraccion |
| MES | numeric | Mes de la infraccion |
| NOMBRE DEL MES | character | Nombre del mes de la infraccion |
| PACA DE VEHICULO | character | Placa del vehiculo |
| TIPO DE VEHICULO | character | Tipo de vehiculo |
| VALOR_A_PAGAR | numeric | Valor monetario a pagar |
Antes de realizar el análisis, se verifico la integridad de los datos teniendo en cuenta las siguientes caracteristicas:
Valores faltantes: Ninguna variable critica tiene NA significativos.
Variables categoricas incosistentes: Se identifico que la columna SEXO incluye categorias incorrectas como “EMPRESA” y “CEDULA NUEVA”.
Formatos de variables: Se convirtieron fechas a formato Date y el valor_a_pagar a formato numerico.
Para realizar este informe se hizo uso de las siguientes librerias:
knitr: Es una libreria que convierte los resultados de R en formatos bonitos dentro de los documentos Markdown, HTML, word o PDF.
readr: Forma parde del tidyverse y ayuda a importar datos desde archivos de texto (CSV, TSV, etc)
dplyr: Una de las librerias más importantes del tidyverse, sirve para manipular y transformar datos de manera eficiente.
ggplot2: Libreria para visualización de datos basada en la gramatica de los gráficos.
tidyverse: Conjunto de paquetes diseñados para trabajar juntos de manera coherente en el flujo de analisis de datos (lectura, manipulación, visualización).
Identificar y analizar la cantidad de comparendos registrados en cada mes del año, con el fin de determinar los períodos con mayor y menor incidencia de infracciones y observar posibles patrones de comportamiento a lo largo del tiempo.
En esta consulta se muestran la cantidad de comparendos registrados según el tipo de infracción cometida, puede consultar las tarifas actualizadas en la ciudad de Barranquilla aqui. En el gráfico se logra observar una clara desigualdad en la distribución de infracciones, siendo el codigo 64 la que presenta mayoria de casos y el cual corresponde a infracciones por exceso de velocidad.
Identificar y analizar la cantidad de comparendos asociados a cada tipo de vehículo registrado en la base de datos, con el fin de determinar cuáles presentan una mayor participación en las infracciones y evaluar su distribución dentro del total de comparendos.
Las mujeres encabezan la cantidad de comparendos con alrededor del 44%, seguidas por los hombres (29%).
La infracción con código 64 es la más frecuente, representando una proporción significativa del total de comparendos registrados. Esto indica que esta conducta infractora es recurrente y debería ser objeto de especial atención en programas de educación y control de tránsito.
Los vehiculos con mayores numeros de comparendos son los carros, representando un 91.4% de los registros totales.