En este estudio de caso se analiza la cantidad de vehículos matriculados en Colombia según el año del modelo. El objetivo es evaluar cómo este factor influye en el comportamiento del mercado a lo largo del tiempo. Así mismo, se considera que la matriculación de vehículos puede reflejar dinámicas económicas, cambios en las preferencias de consumo y procesos de renovación del parque automotor, con implicaciones tanto en movilidad como en políticas públicas de transporte.
Analizar la relación entre el año del modelo de los vehículos y la cantidad de matrículas registradas en Colombia
# Cargar librerías necesarias
library(tidyverse)
library(readr)
# Cargar el archivo
Vehiculos <- read_csv("~/Documents/Vehiculos.csv")
# Vista general
names(Vehiculos)
## [1] "ORDEN" "CLASE"
## [3] "MARCA" "MODELO"
## [5] "FECHA MATRICULA/RADICACION" "AÑO"
## [7] "MES" "DIA"
glimpse(Vehiculos)
## Rows: 16,943
## Columns: 8
## $ ORDEN <dbl> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13…
## $ CLASE <chr> "MOTOCICLETA", "MOTOCICLETA", "MOTOCICLET…
## $ MARCA <chr> "YAMAHA", "SUZUKI", "AUTECO KAWASAKI", "R…
## $ MODELO <dbl> 2000, 2000, 2000, 1988, 1988, 1992, 1968,…
## $ `FECHA MATRICULA/RADICACION` <chr> "02/02/2000", "23/02/2000", "25/09/2000",…
## $ AÑO <dbl> 2000, 2000, 2000, 2000, 2000, 2000, 2000,…
## $ MES <chr> "02.febrero", "02.febrero", "09.septiembr…
## $ DIA <chr> "02.miércoles", "23.miércoles", "25.lunes…
summary(Vehiculos$AÑO)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2000 2004 2009 2010 2015 2022
# Agrupar por año y contar
vehiculos_por_anio <- Vehiculos %>%
group_by(AÑO) %>%
summarise(Total_Matriculas = n())
# Visualizar
ggplot(vehiculos_por_anio, aes(x = AÑO, y = Total_Matriculas)) +
geom_point(color = "black") +
geom_line(color = "red") +
labs(title = "Cantidad de vehículos matriculados por año",
x = "Año del modelo",
y = "Total de matrículas")
# Ajustar modelo de regresión lineal
modelo_vehiculos <- lm(Total_Matriculas ~ AÑO, data = vehiculos_por_anio)
summary(modelo_vehiculos)
##
## Call:
## lm(formula = Total_Matriculas ~ AÑO, data = vehiculos_por_anio)
##
## Residuals:
## Min 1Q Median 3Q Max
## -372.13 -120.70 21.73 103.08 351.16
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 39041.036 11536.265 3.384 0.00280 **
## AÑO -19.047 5.737 -3.320 0.00325 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 182.5 on 21 degrees of freedom
## Multiple R-squared: 0.3443, Adjusted R-squared: 0.313
## F-statistic: 11.02 on 1 and 21 DF, p-value: 0.003251
# Agregar predicciones al dataset
vehiculos_por_anio$pred <- predict(modelo_vehiculos)
# Visualización con línea de regresión
ggplot(vehiculos_por_anio, aes(x = AÑO, y = Total_Matriculas)) +
geom_point(color = "blue") +
geom_line(aes(y = pred), color = "red", linewidth = 1) +
labs(title = "Regresión Lineal: Matrículas vs Año",
x = "Año",
y = "Cantidad de matrículas")
El modelo anteriormente planteado puede ser usado por autoridades de tránsito o fabricantes para proyectar tendencias de matriculación según el año del vehículo.
El análisis muestra una tendencia negativa entre el año del modelo y la cantidad de matrículas. Se observa que los vehiculos con modelos más antiguos tienen una mayor cantidad de registros, lo que puede reflejar que no necesariamente se estan matriculando mas vehiculos nuevos.
Esto podria deberse a que hay una mayor circulacion de modelos antiguos en el mercado de segunda mano, impactos economicos, asi como cambio de preferencias hacia otros medios de transporte.