Caso Vehiculos

Introducción

En este estudio de caso se analiza la cantidad de vehículos matriculados en Colombia según el año del modelo. El objetivo es evaluar cómo este factor influye en el comportamiento del mercado a lo largo del tiempo. Así mismo, se considera que la matriculación de vehículos puede reflejar dinámicas económicas, cambios en las preferencias de consumo y procesos de renovación del parque automotor, con implicaciones tanto en movilidad como en políticas públicas de transporte.

Objetivo:

Analizar la relación entre el año del modelo de los vehículos y la cantidad de matrículas registradas en Colombia

# Cargar librerías necesarias
library(tidyverse)
library(readr)

# Cargar el archivo
Vehiculos <- read_csv("~/Documents/Vehiculos.csv")

# Vista general
names(Vehiculos)
## [1] "ORDEN"                      "CLASE"                     
## [3] "MARCA"                      "MODELO"                    
## [5] "FECHA MATRICULA/RADICACION" "AÑO"                       
## [7] "MES"                        "DIA"
glimpse(Vehiculos)
## Rows: 16,943
## Columns: 8
## $ ORDEN                        <dbl> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13…
## $ CLASE                        <chr> "MOTOCICLETA", "MOTOCICLETA", "MOTOCICLET…
## $ MARCA                        <chr> "YAMAHA", "SUZUKI", "AUTECO KAWASAKI", "R…
## $ MODELO                       <dbl> 2000, 2000, 2000, 1988, 1988, 1992, 1968,…
## $ `FECHA MATRICULA/RADICACION` <chr> "02/02/2000", "23/02/2000", "25/09/2000",…
## $ AÑO                          <dbl> 2000, 2000, 2000, 2000, 2000, 2000, 2000,…
## $ MES                          <chr> "02.febrero", "02.febrero", "09.septiembr…
## $ DIA                          <chr> "02.miércoles", "23.miércoles", "25.lunes…
summary(Vehiculos$AÑO)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2000    2004    2009    2010    2015    2022
# Agrupar por año y contar
vehiculos_por_anio <- Vehiculos %>%
  group_by(AÑO) %>%
  summarise(Total_Matriculas = n())

# Visualizar
ggplot(vehiculos_por_anio, aes(x = AÑO, y = Total_Matriculas)) +
  geom_point(color = "black") +
  geom_line(color = "red") +
  labs(title = "Cantidad de vehículos matriculados por año",
       x = "Año del modelo",
       y = "Total de matrículas")

# Ajustar modelo de regresión lineal
modelo_vehiculos <- lm(Total_Matriculas ~ AÑO, data = vehiculos_por_anio)
summary(modelo_vehiculos)
## 
## Call:
## lm(formula = Total_Matriculas ~ AÑO, data = vehiculos_por_anio)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -372.13 -120.70   21.73  103.08  351.16 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)   
## (Intercept) 39041.036  11536.265   3.384  0.00280 **
## AÑO           -19.047      5.737  -3.320  0.00325 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 182.5 on 21 degrees of freedom
## Multiple R-squared:  0.3443, Adjusted R-squared:  0.313 
## F-statistic: 11.02 on 1 and 21 DF,  p-value: 0.003251
# Agregar predicciones al dataset
vehiculos_por_anio$pred <- predict(modelo_vehiculos)

# Visualización con línea de regresión
ggplot(vehiculos_por_anio, aes(x = AÑO, y = Total_Matriculas)) +
  geom_point(color = "blue") +
  geom_line(aes(y = pred), color = "red", linewidth = 1) +
  labs(title = "Regresión Lineal: Matrículas vs Año",
       x = "Año",
       y = "Cantidad de matrículas")

Despliegue

El modelo anteriormente planteado puede ser usado por autoridades de tránsito o fabricantes para proyectar tendencias de matriculación según el año del vehículo.

Coclusión

El análisis muestra una tendencia negativa entre el año del modelo y la cantidad de matrículas. Se observa que los vehiculos con modelos más antiguos tienen una mayor cantidad de registros, lo que puede reflejar que no necesariamente se estan matriculando mas vehiculos nuevos.

Esto podria deberse a que hay una mayor circulacion de modelos antiguos en el mercado de segunda mano, impactos economicos, asi como cambio de preferencias hacia otros medios de transporte.