library(summarytools)
## Warning: package 'summarytools' was built under R version 4.3.3
descr(BasecarrosF$precio,stats = "common")
## Descriptive Statistics
## BasecarrosF$precio
## N: 129
##
## precio
## --------------- -------------
## Mean 40445658.91
## Std.Dev 12411760.16
## Min 1000000.00
## Median 37000000.00
## Max 83000000.00
## N.Valid 129.00
## Pct.Valid 100.00
La tabla presenta estadísticas descriptivas de los precios de una base de datos de 125 carros, donde el precio promedio es de 40,887,920, con una desviación estándar de 12,063,658, lo que indica una dispersión considerable en los datos. El precio mínimo registrado es de 24,800,000, mientras que el máximo es de 83,000,000, y el precio mediano es de 37,000,000, lo que sugiere que la distribución podría estar sesgada hacia valores altos debido a posibles outliers. Todas las observaciones son válidas, representando el 100% de los datos.
ggplot(BasecarrosF, aes(x = km)) +
geom_histogram(bins = 30, fill = "skyblue", color = "black") +
labs(title = "Distribución de Kilometros de Carros", x = "Kilometros", y = "Frecuencia")
Los datos sugieren que los carros con menos kilómetros suelen tener
precios más altos, mientras que aquellos con mayor kilometraje tienden a
precios más bajos, lo que indica una relación inversa entre kilometraje
y precio.
ggplot(BasecarrosF, aes(x = precio)) +
geom_histogram(bins = 35, fill = "green", color = "black") +
labs(title = "Distribución de Precio de Carros", x = "Precio", y = "Frecuencia")
ggplot(BasecarrosF, aes(x = precio)) +
geom_histogram(binwidth = 4000000, fill = "green", color = "black") +
labs(title = "Distribución de Precio de Carros", x = "Precio", y = "Frecuencia") +
scale_x_continuous(labels = scales::comma)
Al comparar los histogramas, se observa una relación inversa entre el
precio y el kilometraje: los carros con menor kilometraje tienden a
concentrarse en los rangos de precios más altos, mientras que los
vehículos con mayor kilometraje se asocian con precios más bajos. Esto
refleja que el kilometraje es un factor clave en la valoración de los
carros
g2=ggplot(data=BasecarrosF,mapping = aes(x=km,y=precio))+geom_point()+theme_bw()+
geom_smooth()
ggplotly(g2)
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
ggplot(BasecarrosF, aes(x = km, y = precio)) +
geom_point(color = "black") +
geom_smooth(method = "loess", color = "blue") +
labs(title = "Relación entre Kilometraje y Precio", x = "Kilometraje", y = "Precio") +
scale_y_continuous(labels = scales::comma)
## `geom_smooth()` using formula = 'y ~ x'
cor(BasecarrosF$km,BasecarrosF$precio, use = "complete.obs")
## [1] -0.1984356
Una correlación de -0.2625 indica una relación negativa débil entre dos variables. Esto significa que, aunque una tiende a disminuir ligeramente cuando la otra aumenta, la relación es poco significativa
g2=ggplot(data=BasecarrosF,mapping = aes(x=modelo,y=precio))+geom_point()+theme_bw()+
geom_smooth()
ggplotly(g2)
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
ggplot(BasecarrosF, aes(x = modelo, y = precio)) +
geom_point(color = "black") +
geom_smooth(method = "loess", color = "blue") +
labs(title = "Relación entre Modelo y Precio", x = "Modelo", y = "Precio") +
scale_y_continuous(labels = scales::comma)
## `geom_smooth()` using formula = 'y ~ x'
cor(BasecarrosF$modelo,BasecarrosF$precio, use = "complete.obs")
## [1] 0.3550418
Una correlación de 0.3869 indica una relación positiva moderadamente débil entre dos variables. Esto significa que, en general, cuando una variable aumenta, la otra también tiende a aumentar, pero la relación no es muy fuerte.
modelo_simple <- lm(precio ~ km, data = BasecarrosF)
summary(modelo_simple)
##
## Call:
## lm(formula = precio ~ km, data = BasecarrosF)
##
## Residuals:
## Min 1Q Median 3Q Max
## -40856877 -7854938 -4054037 5068628 39933128
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.577e+07 2.571e+06 17.802 <2e-16 ***
## km -5.762e+01 2.525e+01 -2.282 0.0242 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 12210000 on 127 degrees of freedom
## Multiple R-squared: 0.03938, Adjusted R-squared: 0.03181
## F-statistic: 5.206 on 1 and 127 DF, p-value: 0.02418
ggplot(BasecarrosF, aes(x = km, y = precio)) +
geom_point(color = "black") +
geom_smooth(method = "lm", se = FALSE, color = "red") +
labs(title = "Regresión Lineal Simple: Precio vs. KM",
x = "KM", y = "Precio ")
## `geom_smooth()` using formula = 'y ~ x'
El kilometraje tiene una correlación negativa de -0.1984 con el precio, lo que indica que, a medida que aumenta el kilometraje, el precio tiende a disminuir, aunque la relación es débil. Esto es coherente con la idea de que los vehículos más usados suelen tener un menor valor en el mercado. Por otro lado, el modelo (año de fabricación) tiene una correlación positiva de 0.3550 con el precio, lo que sugiere que los vehículos más recientes tienden a ser más costosos. Aunque esta correlación también es moderada, refuerza la lógica de que los compradores suelen valorar más los vehículos más nuevos. En conjunto, estas correlaciones subrayan que tanto el kilometraje como el año del modelo influyen en el precio, pero de manera relativamente limitada, debido a otros factores no incluidos en esta parte del análisis.
BasecarrosF <- BasecarrosF %>%
mutate(
Zona = as.factor(veh),
Tipo = as.factor(transmision),
Barrio = as.factor(combustible)
)
g2=ggplot(data=BasecarrosF,mapping = aes(x=transmision,y=precio))+geom_point()+theme_bw()+
geom_smooth()
ggplotly(g2)
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
Al analizar en conjunto las variables precio y transmisión se aprecia una mayor variación en los precios en los vehículos de transmisión automática, así mismo se aprecia una media de precio mayor en este tipo de transmisión ($56.000.000), también los vehículos de mayor precio tienen esta característica. A diferencia de la transmisión mecánica con una media de ($36.000.000).
g2=ggplot(data=BasecarrosF,mapping = aes(x=veh,y=precio))+geom_point()+theme_bw()+
geom_smooth()
ggplotly(g2)
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
Al revisar la relación entre las variables precio y kilometraje se aprecia una relación lineal negativa, con un coeficiente de correlación de -0.26, esto tiene sentido ya que, teniendo en cuenta que a mayor kilometraje hay mayor desgaste en el vehículo y el tiempo de salido del concesionario es mayor, por lo tanto el precio disminuye.
Modelo_KM=lm(precio~km, data=BasecarrosF)
Modelo_KM
##
## Call:
## lm(formula = precio ~ km, data = BasecarrosF)
##
## Coefficients:
## (Intercept) km
## 4.577e+07 -5.762e+01
summary(Modelo_KM)
##
## Call:
## lm(formula = precio ~ km, data = BasecarrosF)
##
## Residuals:
## Min 1Q Median 3Q Max
## -40856877 -7854938 -4054037 5068628 39933128
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.577e+07 2.571e+06 17.802 <2e-16 ***
## km -5.762e+01 2.525e+01 -2.282 0.0242 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 12210000 on 127 degrees of freedom
## Multiple R-squared: 0.03938, Adjusted R-squared: 0.03181
## F-statistic: 5.206 on 1 and 127 DF, p-value: 0.02418
Se interpreta que por el incremento en 1 km del vehiculo el precio del vehículo disminuye en 0.07 pesos.
AIC(Modelo_KM)
## [1] 4580.112
BIC(Modelo_KM)
## [1] 4588.691
Modelo_Modelo=lm(precio~modelo, data=BasecarrosF)
Modelo_Modelo
##
## Call:
## lm(formula = precio ~ modelo, data = BasecarrosF)
##
## Coefficients:
## (Intercept) modelo
## -3.574e+09 1.794e+06
Se interpreta que por cada año adicional en el modelo del vehículo su precio aumentará $1.902.000 pesos.
summary(Modelo_Modelo)
##
## Call:
## lm(formula = precio ~ modelo, data = BasecarrosF)
##
## Residuals:
## Min 1Q Median 3Q Max
## -39042401 -8630002 -5042401 8251399 33988597
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -3.574e+09 8.446e+08 -4.232 4.40e-05 ***
## modelo 1.794e+06 4.191e+05 4.280 3.65e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 11650000 on 127 degrees of freedom
## Multiple R-squared: 0.1261, Adjusted R-squared: 0.1192
## F-statistic: 18.32 on 1 and 127 DF, p-value: 3.65e-05
AIC(Modelo_Modelo)
## [1] 4567.913
BIC(Modelo_Modelo)
## [1] 4576.493
#Precio vs transmision
Modelo_transmision=lm(precio~transmision, data=BasecarrosF)
Modelo_transmision
##
## Call:
## lm(formula = precio ~ transmision, data = BasecarrosF)
##
## Coefficients:
## (Intercept) transmisionMecánica
## 55590909 -18259227
Se interpretar que un carro con transmisión automática tiene un precio de $55.590.909, y si el vehículo tiene transmisón mecánica valdra $17.843.433 .
summary(Modelo_transmision)
##
## Call:
## lm(formula = precio ~ transmision, data = BasecarrosF)
##
## Residuals:
## Min 1Q Median 3Q Max
## -36331682 -5790909 -1131682 4168318 38168318
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 55590909 2209074 25.165 < 2e-16 ***
## transmisionMecánica -18259227 2425566 -7.528 8.37e-12 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 10360000 on 127 degrees of freedom
## Multiple R-squared: 0.3085, Adjusted R-squared: 0.3031
## F-statistic: 56.67 on 1 and 127 DF, p-value: 8.369e-12
AIC(Modelo_transmision)
## [1] 4537.701
BIC(Modelo_transmision)
## [1] 4546.28
#4 Mejor Modelo
El modelo que tiene mejor AIC es del modelo del carro, Igualmente para el BIC. En este caso modelo modelo
#5 Validar prediccion
BasecarrosF2 <- BasecarrosF %>% filter(!is.na(modelo))
BasecarrosF2 <- BasecarrosF2 %>% filter(!is.na(precio))
id_modelar=sample(1:125, size = 37.5)
Modelo=BasecarrosF2[id_modelar,]
Modelo_Validar=BasecarrosF2[-id_modelar,]
mod_you_modelar=lm(precio~modelo,data=Modelo)
precio_pred=predict(mod_you_modelar,list(modelo=Modelo_Validar$modelo))
precio_real=Modelo_Validar$precio
error=precio_real-precio_pred
res=data.frame(precio_real,precio_pred,error)
MAE=mean(abs(error))
MAE
## [1] 11009405
El MAE de 10,323,004 COP indica que, en promedio, el modelo de regresión lineal simple comete un error absoluto de aproximadamente 10 millones de pesos colombianos al predecir el valor de la variable dependiente (por ejemplo, el precio de los vehículos). Si este error es significativo depende del rango de los precios; por ejemplo, si los valores típicos oscilan entre 50 y 100 millones de pesos, el error representa entre el 10% y 20% del valor total, lo cual podría ser alto y sugeriría la necesidad de mejorar el modelo, ya sea refinando las variables predictoras o explorando alternativas más complejas.
#REGRESION MULTIPLe
#Modelo 1
y=BasecarrosF2$precio
x1=BasecarrosF2$modelo
x2=BasecarrosF2$km
plot(BasecarrosF2[,1:3])
cor(BasecarrosF2[,1:3])
## precio km modelo
## precio 1.0000000 -0.1984356 0.3550418
## km -0.1984356 1.0000000 -0.5350326
## modelo 0.3550418 -0.5350326 1.0000000
mod_muliple1=lm(y~x1+x2)
summary(mod_muliple1)
##
## Call:
## lm(formula = y ~ x1 + x2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -39134081 -8667818 -5101338 8117270 33985021
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -3.509e+09 1.005e+09 -3.492 0.000662 ***
## x1 1.762e+06 4.980e+05 3.537 0.000567 ***
## x2 -3.449e+00 2.862e+01 -0.120 0.904293
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 11690000 on 126 degrees of freedom
## Multiple R-squared: 0.1262, Adjusted R-squared: 0.1123
## F-statistic: 9.095 on 2 and 126 DF, p-value: 0.0002043
AIC(mod_muliple1)
## [1] 4569.898
BIC(mod_muliple1)
## [1] 4581.337
Se observa en la tabla del summary se hace presente la multicolinealidad al incluir todos las variables,excepto combustible ya que solo tiene un valor que es “gasolina” por lo que no sería relevante, asimismo, se tiene una mayor complejidad en el modelo. Las variables significativas con un intervalo de confianza del 95% son modelo (x1), vehículos (x2) y transmisión (x3). Este modelo logra explicar el 87.43% de la variabilidad en el precio de venta de los vehículos en Cali.
Así mismo posee un criterio de Akaike (AIC) de 4182,95 muestra de la complejidad del mismo
y=BasecarrosF2$precio
x1=BasecarrosF2$modelo
x2=BasecarrosF2$km
x3=BasecarrosF2$veh
x4=BasecarrosF2$transmision
plot(BasecarrosF2 %>% select(precio, modelo, km, veh, transmision))
mod_muliple2=lm(y~x1+x2+x3+x4)
summary(mod_muliple2)
##
## Call:
## lm(formula = y ~ x1 + x2 + x3 + x4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -28251553 -2588329 -116762 2151060 19644934
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -6.997e+09 4.767e+08 -14.678 < 2e-16 ***
## x1 3.489e+06 2.360e+05 14.780 < 2e-16 ***
## x2 2.733e+01 1.236e+01 2.210 0.028929 *
## x3kia cerato 2.058e+07 1.111e+06 18.524 < 2e-16 ***
## x4Mecánica -4.718e+06 1.368e+06 -3.448 0.000772 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5023000 on 124 degrees of freedom
## Multiple R-squared: 0.8414, Adjusted R-squared: 0.8362
## F-statistic: 164.4 on 4 and 124 DF, p-value: < 2.2e-16
AIC(mod_muliple2)
## [1] 4353.791
BIC(mod_muliple2)
## [1] 4370.95
Se observa en la tabla del summary del modelo 2 que se hace presente la multicolinealidad al incluir la variable kilometraje y modelo como variables predictoras, estas presentan un coeficiente de correlación de -0.69. En este caso, la variable kilometraje (x) no es significativa estando la variable modelo.
Este modelo logra explicar el 87.43% de la variabilidad en el precio de venta.
Así mismo posee un criterio de Akaike (AIC) de 3826.21 de acuerdo a la selección de variables, inferior al modelo 1.
#2) Mejor Modelo y paso a paso
El mejor modelo es el segundo
modelo_multiple_step=step(mod_muliple2)
## Start: AIC=3985.7
## y ~ x1 + x2 + x3 + x4
##
## Df Sum of Sq RSS AIC
## <none> 3.1282e+15 3985.7
## - x2 1 1.2323e+14 3.2514e+15 3988.7
## - x4 1 2.9994e+14 3.4281e+15 3995.5
## - x1 1 5.5110e+15 8.6392e+15 4114.8
## - x3 1 8.6568e+15 1.1785e+16 4154.8
summary(modelo_multiple_step)
##
## Call:
## lm(formula = y ~ x1 + x2 + x3 + x4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -28251553 -2588329 -116762 2151060 19644934
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -6.997e+09 4.767e+08 -14.678 < 2e-16 ***
## x1 3.489e+06 2.360e+05 14.780 < 2e-16 ***
## x2 2.733e+01 1.236e+01 2.210 0.028929 *
## x3kia cerato 2.058e+07 1.111e+06 18.524 < 2e-16 ***
## x4Mecánica -4.718e+06 1.368e+06 -3.448 0.000772 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5023000 on 124 degrees of freedom
## Multiple R-squared: 0.8414, Adjusted R-squared: 0.8362
## F-statistic: 164.4 on 4 and 124 DF, p-value: < 2.2e-16
modelo2 <- lm(precio ~ modelo + veh + km + transmision, data = BasecarrosF2)
predicciones <- predict(modelo2)
MAE <- mean(abs(predicciones - BasecarrosF2$precio))
MAE
## [1] 3381438
Tras calcular el MAE del modelo 2 de regresión lineal múltiple encontramos un valor de $3.153.239, monto por el que en promedio era el modelo en la predicción.
#4 Validacion de supuestos
par(mfrow=c(1.9999,1.9999))
plot(mod_muliple2)
plot(x1,log(y))
Vamos a ver si transformandolo se puede mejorar
#5 Transformacion del modelo
modelo_log_dep <- lm(log(precio) ~ modelo + veh + km + transmision, data = BasecarrosF2)
summary(modelo_log_dep)
##
## Call:
## lm(formula = log(precio) ~ modelo + veh + km + transmision, data = BasecarrosF2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.3559 -0.0234 0.0257 0.0635 0.4101
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.540e+02 3.020e+01 -5.100 1.24e-06 ***
## modelo 8.494e-02 1.495e-02 5.682 9.00e-08 ***
## vehkia cerato 5.306e-01 7.038e-02 7.539 8.68e-12 ***
## km 1.050e-06 7.831e-07 1.340 0.183
## transmisionMecánica -6.616e-02 8.667e-02 -0.763 0.447
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.3181 on 124 degrees of freedom
## Multiple R-squared: 0.4339, Adjusted R-squared: 0.4156
## F-statistic: 23.76 on 4 and 124 DF, p-value: 1.334e-14
exp_coef <- exp(coef(modelo_log_dep)) - 1
interpretacion_coef <- data.frame(
Coeficiente = names(coef(modelo_log_dep)),
Estimacion = coef(modelo_log_dep),
Cambio_Porcentual = round(exp_coef * 100, 2)
)
interpretacion_coef
## Coeficiente Estimacion Cambio_Porcentual
## (Intercept) (Intercept) -1.539927e+02 -100.00
## modelo modelo 8.494241e-02 8.87
## vehkia cerato vehkia cerato 5.306295e-01 70.00
## km km 1.049510e-06 0.00
## transmisionMecánica transmisionMecánica -6.616123e-02 -6.40
par(mfrow=c(1.9999,1.9999))
plot(modelo_log_dep)
Como vemos si sirvio haberlo transformado LOL
mod_trans_multi=lm(log(y)~x1+x2+x3+x4)
summary(mod_trans_multi)
##
## Call:
## lm(formula = log(y) ~ x1 + x2 + x3 + x4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.3559 -0.0234 0.0257 0.0635 0.4101
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.540e+02 3.020e+01 -5.100 1.24e-06 ***
## x1 8.494e-02 1.495e-02 5.682 9.00e-08 ***
## x2 1.050e-06 7.831e-07 1.340 0.183
## x3kia cerato 5.306e-01 7.038e-02 7.539 8.68e-12 ***
## x4Mecánica -6.616e-02 8.667e-02 -0.763 0.447
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.3181 on 124 degrees of freedom
## Multiple R-squared: 0.4339, Adjusted R-squared: 0.4156
## F-statistic: 23.76 on 4 and 124 DF, p-value: 1.334e-14
AIC(mod_trans_multi)
## [1] 77.50356
BIC(mod_trans_multi)
## [1] 94.66244
valores_ajustados <- predict(mod_trans_multi, newdata = BasecarrosF2)
residuos_absolutos <- abs(exp(valores_ajustados) - BasecarrosF2$precio)
MAE <- mean(residuos_absolutos)
MAE
## [1] 3186789
#6 Prediccion del modelo
modelo2 <- lm(precio~ modelo + veh + km + transmision, data = BasecarrosF2)
predicciones <- predict(modelo2)
MAE <- mean(abs(predicciones - BasecarrosF2$precio))
MAE
## [1] 3381438
precio <- 5000000
modelo <- 2010
prediccion <- predict(mod_muliple2,)
prediccion
## 1 2 3 4 5 6 7 8
## 37056571 46265432 43364323 37685075 51038389 45099465 50382559 58316148
## 9 10 11 12 13 14 15 16
## 68016882 44826279 37685075 34224134 44815348 47292899 38368232 40271931
## 17 18 19 20 21 22 23 24
## 37575770 41774876 50535586 50163949 58348940 39971342 37712402 46265432
## 25 26 27 28 29 30 31 32
## 37985588 50054644 73136017 71423526 58888688 39889363 37712402 41392308
## 33 34 35 36 37 38 39 40
## 41610842 61738696 51858101 56184775 56922585 57247691 46265432 64867186
## 41 42 43 44 45 46 47 48
## 52955697 34169126 44416385 48861351 68590733 54253673 40253745 51939397
## 49 50 51 52 53 54 55 56
## 50847105 55838597 41692897 60848428 72625882 55005146 67169767 43897186
## 57 58 59 60 61 62 63 64
## 31492231 25776593 27186629 42304278 30590541 39758412 28611913 39211886
## 65 66 67 68 69 70 71 72
## 39881380 26937960 41821469 36116762 40108188 40099990 41834826 34393416
## 73 74 75 76 77 78 79 80
## 35308846 33177397 30344604 36146821 25061587 36228799 39772075 20418853
## 81 82 83 84 85 86 87 88
## 29688774 38788329 29278880 33710259 33057161 30453909 41275020 39580791
## 89 90 91 92 93 94 95 96
## 33696596 26500740 40355066 33248445 33723922 30672519 30153320 35654948
## 97 98 99 100 101 102 103 104
## 29251553 37862652 26364108 41347859 23968536 36502062 40245761 29251553
## 105 106 107 108 109 110 111 112
## 30884449 36256126 30317278 30153320 39088918 39772075 38815655 31273697
## 113 114 115 116 117 118 119 120
## 31865736 36673616 37116903 23913884 26855981 30044015 38496880 24187146
## 121 122 123 124 125 126 127 128
## 30262625 36174147 42040580 22656875 37859236 29716100 23695273 30180647
## 129
## 34370613
#7 El mejor modelo de regresión lineal múltiple seleccionado, basado en variables como kilometraje y año del modelo, tiene una utilidad práctica significativa en el sector automotriz, particularmente para concesionarios, plataformas de compraventa en línea y aseguradoras. Este modelo permite estimar de manera precisa y objetiva el precio de los vehículos, ayudando a establecer valores competitivos que reflejen las condiciones del mercado. Su implementación en plataformas digitales facilitaría la automatización del proceso de valoración, permitiendo a usuarios ingresar datos básicos y obtener estimaciones confiables en tiempo real. Además, puede ser utilizado para segmentar mercados, optimizar estrategias de venta y reducir subjetividades en la toma de decisiones. En el ámbito asegurador, resulta valioso para calcular primas o indemnizaciones basadas en el valor estimado del vehículo. En resumen, este modelo mejora la transparencia, eficiencia y precisión en la evaluación de precios, beneficiando tanto a empresas como a consumidores.