Se explorará el dataframe de comparendos a través de funciones estádisticas mencionadas en la diapositiva y otras a parte, uso de los conocimientos de la estadistica descriptiva, plasmar las consultas hechas a partir de funciones de R en R Markdown con sus correspondientes gráficas, análisis y diseño en informe.
La base de datos BD Comparendos OK$ formato Excel recopila todas los comparendos cometidos dentro del area metropolitana de la ciudad de Barranquilla, Atlántico. La estructura de este dataframe tiene 19 columnas con 2120 filas, con un total de 36,040 registros, con columnas nombradas cada una: No Comparendo de pago, Fecha que se emitió el comparendo de pago, Ejecutado, Tipo de identificación, No. de identificación,Sexo ,COD. Infracción, Comparendo, fecha que se hizo el comparendo, fecha, año, mes, día,Nombre del mes, placa del vehiculo, tipo de vehiculo y valor a pagar. Este dataframe nos permite hacer un análisis estádistico robusto a nivel local.
library(readxl)
library(modeest)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(scales)
library(lubridate)
##
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
##
## date, intersect, setdiff, union
df=read_excel("~/FGHJ,/BD Comparendos SENA TAD-9 OK -terminado.xlsx",sheet="Hoja1 (2)")
attach(df)
Esta función nos permite saber el nombre de todas las columnas del dataframe. colnames(dataframe o matriz) toma como parametro un dataframe o una matriz, pero nunca un vector.
colnames(df)
## [1] "No. MANDAMIENTO DE PAGO" "FECHA MANDAMIENTO DE PAGO"
## [3] "EJECUTADO" "TIPO DE IDENTIFICACION"
## [5] "No. IDENTIFICACION" "GENERO"
## [7] "#GENERO" "COD. INFRACCION"
## [9] "# INFRACCION" "NOM - INFRACCION"
## [11] "COMPARENDO" "FECHA DE COMPARENDO"
## [13] "DÍA" "NOM-DÍA"
## [15] "MES" "NOM-MES"
## [17] "AÑO" "PACA DE VEHICULO"
## [19] "VEHICULO" "COSTO COMPARENDO"
Esta función de R nos permite sacar las medidas de tendencia central -media y mediana- y las medidas de tendencia poscicional- cuartiles, minimos y máximos-. Se le aplicará a la columna VALOR_A_PAGAR
summary(df[,c("COSTO COMPARENDO")])
## COSTO COMPARENDO
## Min. :257500
## 1st Qu.:257500
## Median :257500
## Mean :304749
## 3rd Qu.:257500
## Max. :515000
Como se puede ver el valor para pago del comparendo es un valor constante sin importar de qué código de infracción se infrinja.
De acuerdo al gráfico de lineas, la cantidad de comparendos por día tiene una tendencia que aumenta notoriamente en los días fines de semana como sábado y dómingo en comparendos.
df %>%
count(`NOM-DÍA`) %>%
mutate(`NOM-DÍA` = factor(`NOM-DÍA`,
levels = c("LUNES", "MARTES", "MIÉRCOLES",
"JUEVES", "VIERNES", "SÁBADO", "DOMINGO"))) %>%
ggplot(aes(x = `NOM-DÍA`, y = n)) +
geom_col(fill = "beige", color = "black") +
labs(title = "Comparendos por día",
x = "Día de la semana",
y = "Número de comparendos") +
theme_minimal() # Opcional: mejora el estilo del gráfico
Puede haber diferentes causales del por qué en mayo es notoriamente mayor que abril, una de las principales es el día del ascenso, en el cual las personas aprovechan para viajar lo que aumenta el flujo vehicular.
month=table(`NOM-MES`)
barplot(month, ylab="Cantidad de Comparendos")
La infracción de exceso de velocidad es el código que por gran proporción es el que más se infringe a diferencia de transitar en sentido contrario que es el que menos tiene.
Mod_cod_inf=mfv1(`COD. INFRACCION`)
table_cod=table(`COD. INFRACCION`)
print(paste("La moda es:",Mod_cod_inf))
## [1] "La moda es: 64"
print(table_cod)
## COD. INFRACCION
## 64 67 76 77
## 1626 105 4 385
table_cod <- table(`COD. INFRACCION`)
# Crear un vector con las etiquetas de caracteres que quieres usar
# (debes reemplazar estos valores con tus propias etiquetas)
etiquetas <- c("Exceso de velocidad", "Omitir luz roja o pare", "Detenerse sobre zebra","Transitar en sentido contrario" ) # etc.
etiquetas_wrapped <- sapply(etiquetas, function(x) paste(strwrap(x, width = 10), collapse = "\n"))
# Asegúrate de que el número de etiquetas coincida con el número de barras
if(length(etiquetas) == length(table_cod)) {
barplot(table_cod,
horiz=TRUE,
names.arg = etiquetas_wrapped,
xlab="Cantidad de comparendos",
las = 1, # Para etiquetas verticales si son largas
cex.names = 0.7)
} else {
warning("El número de etiquetas no coincide con el número de categorías")
barplot(table_cod)
}
Las mujeres son el género que más comparendos tienen -44.6%, a diferencia de las empresas que equivalen al un 22,3 porciento. Lo que significa que las mujeres reciben el doble de comparendos que las empresas.
Como se puede ver en el gráfico circular los carros tienen una proporción casi absoluta frente a las motos, con una diferencia de 83%. Segun datos de la RUNT en Barranquilla hay 47% motocicletas y 30% de carros y otros vehiculos un 23%. Por lo tanto, a pesar de que haya menos carros, estos son los que más comparendos cometen.
matriz=table(`VEHICULO`)
por=round(matriz/sum(matriz)*100,2)
lab=paste(names(matriz),"-",por,"%")
pie(matriz,labels=lab,
main="",col=c("steelblue","beige"))
Como se aprecia en el gráfico, la empresa LEASIN DE CREDITO S.A, es la que significativamente tiene más comparendos, caso contrario, con las AMBULANCIAS MÉDICAS DEL ATLÁNTICO.
df %>%
filter(GENERO == "EMPRESA") %>%
count(EJECUTADO, sort = TRUE) %>%
top_n(10, n) %>%
ggplot(aes(x = reorder(EJECUTADO, n), y = n)) +
geom_col(fill = "beige", color = "black") +
coord_flip() +
labs(title = "Top 10 Empresas con mas comparendos",
x = "Empresa",
y = "Cantidad comparendos")
LDe acuerdo a todas las consultas hechas en el dataframe BD Comparendos OK$ a cerca del pago de comparendos por infracción en la ciudad de Barranquilla, Atlántico ,Colombia. El comportamiento o tendencia de los registross son claros , es que, por tipo de vehiculo, el que más cantidad total de comparendos ha tenido son los carros (30%) a pesar de que representan menos porcentaje que las motos (47%) segun los datos de la RUNT. El grupo que más cantidad de infracciones comete son las mujeres, seguido de los hombres, y ocurren más infracciónes de comparendos en el mes de abrildebido a que se celebra a finales del mes el día del ascenso, ya que la gente aprovecha a viajar por lo que aumenta el flujo de tráfico. Con respecto al código de infracción que mas se infrijió fue el del exceso de velocidad se puede deber a lo que se celebra en abril. Las personas naturales y las personas Jurídicas en conjunto, aportan cantidad de comparendos, siendo las personas naturales las que en su mayoría cometen infracciones. Debido a la naturaleza misma se pueden crear los programas enfocados a personas naturales para responsabilidad vial , y otro en función a las empersas.
En suma, los comparendos de transito a pesar de ser disuasivas economicamente para no cometer infracciones no son suficientes para mitigar y prevenir significativamente la irresponsabilidad vial, es algo inherente de la sociedad si decide fomentar y crear una cultura vial que vele por la seguridad del conductor y el transeúnte.
Secretaria de transito
RUNT