1 Analisis Exploratorio

library(summarytools)
## Warning: package 'summarytools' was built under R version 4.3.3
descr(BasecarrosF$precio,stats = "common")
## Descriptive Statistics  
## BasecarrosF$precio  
## N: 129  
## 
##                        precio
## --------------- -------------
##            Mean   40445658.91
##         Std.Dev   12411760.16
##             Min    1000000.00
##          Median   37000000.00
##             Max   83000000.00
##         N.Valid        129.00
##       Pct.Valid        100.00

La tabla presenta estadísticas descriptivas de los precios de una base de datos de 125 carros, donde el precio promedio es de 40,887,920, con una desviación estándar de 12,063,658, lo que indica una dispersión considerable en los datos. El precio mínimo registrado es de 24,800,000, mientras que el máximo es de 83,000,000, y el precio mediano es de 37,000,000, lo que sugiere que la distribución podría estar sesgada hacia valores altos debido a posibles outliers. Todas las observaciones son válidas, representando el 100% de los datos.

ggplot(BasecarrosF, aes(x = km)) +
  geom_histogram(bins = 30, fill = "skyblue", color = "black") +
  labs(title = "Distribución de Kilometros de Carros", x = "Kilometros", y = "Frecuencia")

Los datos sugieren que los carros con menos kilómetros suelen tener precios más altos, mientras que aquellos con mayor kilometraje tienden a precios más bajos, lo que indica una relación inversa entre kilometraje y precio.

ggplot(BasecarrosF, aes(x = precio)) +
  geom_histogram(bins = 35, fill = "green", color = "black") +
  labs(title = "Distribución de Precio de Carros", x = "Precio", y = "Frecuencia")

ggplot(BasecarrosF, aes(x = precio)) +
  geom_histogram(binwidth = 4000000, fill = "green", color = "black") +
  labs(title = "Distribución de Precio de Carros", x = "Precio", y = "Frecuencia") +
  scale_x_continuous(labels = scales::comma)

Al comparar los histogramas, se observa una relación inversa entre el precio y el kilometraje: los carros con menor kilometraje tienden a concentrarse en los rangos de precios más altos, mientras que los vehículos con mayor kilometraje se asocian con precios más bajos. Esto refleja que el kilometraje es un factor clave en la valoración de los carros

g2=ggplot(data=BasecarrosF,mapping = aes(x=km,y=precio))+geom_point()+theme_bw()+
  geom_smooth()
ggplotly(g2)
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
ggplot(BasecarrosF, aes(x = km, y = precio)) +
  geom_point(color = "black") +
  geom_smooth(method = "loess", color = "blue") +
  labs(title = "Relación entre Kilometraje y Precio", x = "Kilometraje", y = "Precio") +
  scale_y_continuous(labels = scales::comma)
## `geom_smooth()` using formula = 'y ~ x'

cor(BasecarrosF$km,BasecarrosF$precio, use = "complete.obs")
## [1] -0.1984356

Una correlación de -0.2625 indica una relación negativa débil entre dos variables. Esto significa que, aunque una tiende a disminuir ligeramente cuando la otra aumenta, la relación es poco significativa

2) Analis Bivariado

Modelo vs Precio

g2=ggplot(data=BasecarrosF,mapping = aes(x=modelo,y=precio))+geom_point()+theme_bw()+
  geom_smooth()
ggplotly(g2)
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
ggplot(BasecarrosF, aes(x = modelo, y = precio)) +
  geom_point(color = "black") +
  geom_smooth(method = "loess", color = "blue") +
  labs(title = "Relación entre Modelo y Precio", x = "Modelo", y = "Precio") +
  scale_y_continuous(labels = scales::comma)
## `geom_smooth()` using formula = 'y ~ x'

cor(BasecarrosF$modelo,BasecarrosF$precio, use = "complete.obs")
## [1] 0.3550418

Una correlación de 0.3869 indica una relación positiva moderadamente débil entre dos variables. Esto significa que, en general, cuando una variable aumenta, la otra también tiende a aumentar, pero la relación no es muy fuerte.

modelo_simple <- lm(precio ~ km, data = BasecarrosF)
summary(modelo_simple)
## 
## Call:
## lm(formula = precio ~ km, data = BasecarrosF)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -40856877  -7854938  -4054037   5068628  39933128 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  4.577e+07  2.571e+06  17.802   <2e-16 ***
## km          -5.762e+01  2.525e+01  -2.282   0.0242 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 12210000 on 127 degrees of freedom
## Multiple R-squared:  0.03938,    Adjusted R-squared:  0.03181 
## F-statistic: 5.206 on 1 and 127 DF,  p-value: 0.02418

Precio vs Km

ggplot(BasecarrosF, aes(x = km, y = precio)) +
  geom_point(color = "black") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  labs(title = "Regresión Lineal Simple: Precio vs. KM",
       x = "KM", y = "Precio ")
## `geom_smooth()` using formula = 'y ~ x'

El kilometraje tiene una correlación negativa de -0.1984 con el precio, lo que indica que, a medida que aumenta el kilometraje, el precio tiende a disminuir, aunque la relación es débil. Esto es coherente con la idea de que los vehículos más usados suelen tener un menor valor en el mercado. Por otro lado, el modelo (año de fabricación) tiene una correlación positiva de 0.3550 con el precio, lo que sugiere que los vehículos más recientes tienden a ser más costosos. Aunque esta correlación también es moderada, refuerza la lógica de que los compradores suelen valorar más los vehículos más nuevos. En conjunto, estas correlaciones subrayan que tanto el kilometraje como el año del modelo influyen en el precio, pero de manera relativamente limitada, debido a otros factores no incluidos en esta parte del análisis.

Volver las variables cualis un factor

BasecarrosF <- BasecarrosF %>%
  mutate(
    Zona = as.factor(veh),
    Tipo = as.factor(transmision),
    Barrio = as.factor(combustible)
  )

Precio vs Transmision

g2=ggplot(data=BasecarrosF,mapping = aes(x=transmision,y=precio))+geom_point()+theme_bw()+
  geom_smooth()
ggplotly(g2)
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

Al analizar en conjunto las variables precio y transmisión se aprecia una mayor variación en los precios en los vehículos de transmisión automática, así mismo se aprecia una media de precio mayor en este tipo de transmisión ($56.000.000), también los vehículos de mayor precio tienen esta característica. A diferencia de la transmisión mecánica con una media de ($36.000.000).

Precio vs Veh

g2=ggplot(data=BasecarrosF,mapping = aes(x=veh,y=precio))+geom_point()+theme_bw()+
  geom_smooth()
ggplotly(g2)
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

Al revisar la relación entre las variables precio y kilometraje se aprecia una relación lineal negativa, con un coeficiente de correlación de -0.26, esto tiene sentido ya que, teniendo en cuenta que a mayor kilometraje hay mayor desgaste en el vehículo y el tiempo de salido del concesionario es mayor, por lo tanto el precio disminuye.

3) Estimacion del modelo

Precio vs km

Modelo_KM=lm(precio~km, data=BasecarrosF)
Modelo_KM
## 
## Call:
## lm(formula = precio ~ km, data = BasecarrosF)
## 
## Coefficients:
## (Intercept)           km  
##   4.577e+07   -5.762e+01
summary(Modelo_KM)
## 
## Call:
## lm(formula = precio ~ km, data = BasecarrosF)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -40856877  -7854938  -4054037   5068628  39933128 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  4.577e+07  2.571e+06  17.802   <2e-16 ***
## km          -5.762e+01  2.525e+01  -2.282   0.0242 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 12210000 on 127 degrees of freedom
## Multiple R-squared:  0.03938,    Adjusted R-squared:  0.03181 
## F-statistic: 5.206 on 1 and 127 DF,  p-value: 0.02418

Se interpreta que por el incremento en 1 km del vehiculo el precio del vehículo disminuye en 0.07 pesos.

AIC(Modelo_KM)
## [1] 4580.112
BIC(Modelo_KM)
## [1] 4588.691

Precio Vs Modelo

Modelo_Modelo=lm(precio~modelo, data=BasecarrosF)
Modelo_Modelo
## 
## Call:
## lm(formula = precio ~ modelo, data = BasecarrosF)
## 
## Coefficients:
## (Intercept)       modelo  
##  -3.574e+09    1.794e+06

Se interpreta que por cada año adicional en el modelo del vehículo su precio aumentará $1.902.000 pesos.

summary(Modelo_Modelo)
## 
## Call:
## lm(formula = precio ~ modelo, data = BasecarrosF)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -39042401  -8630002  -5042401   8251399  33988597 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -3.574e+09  8.446e+08  -4.232 4.40e-05 ***
## modelo       1.794e+06  4.191e+05   4.280 3.65e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 11650000 on 127 degrees of freedom
## Multiple R-squared:  0.1261, Adjusted R-squared:  0.1192 
## F-statistic: 18.32 on 1 and 127 DF,  p-value: 3.65e-05
AIC(Modelo_Modelo)
## [1] 4567.913
BIC(Modelo_Modelo)
## [1] 4576.493

#Precio vs transmision

Modelo_transmision=lm(precio~transmision, data=BasecarrosF)
Modelo_transmision
## 
## Call:
## lm(formula = precio ~ transmision, data = BasecarrosF)
## 
## Coefficients:
##         (Intercept)  transmisionMecánica  
##            55590909            -18259227

Se interpretar que un carro con transmisión automática tiene un precio de $55.590.909, y si el vehículo tiene transmisón mecánica valdra $17.843.433 .

summary(Modelo_transmision)
## 
## Call:
## lm(formula = precio ~ transmision, data = BasecarrosF)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -36331682  -5790909  -1131682   4168318  38168318 
## 
## Coefficients:
##                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          55590909    2209074  25.165  < 2e-16 ***
## transmisionMecánica -18259227    2425566  -7.528 8.37e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 10360000 on 127 degrees of freedom
## Multiple R-squared:  0.3085, Adjusted R-squared:  0.3031 
## F-statistic: 56.67 on 1 and 127 DF,  p-value: 8.369e-12
AIC(Modelo_transmision)
## [1] 4537.701
BIC(Modelo_transmision)
## [1] 4546.28

#4 Mejor Modelo

El modelo que tiene mejor AIC es del modelo del carro, Igualmente para el BIC. En este caso modelo modelo

#5 Validar prediccion

BasecarrosF2 <- BasecarrosF %>% filter(!is.na(modelo)) 
BasecarrosF2 <- BasecarrosF2 %>% filter(!is.na(precio)) 

id_modelar=sample(1:125, size = 37.5)
Modelo=BasecarrosF2[id_modelar,]
Modelo_Validar=BasecarrosF2[-id_modelar,]



mod_you_modelar=lm(precio~modelo,data=Modelo)

precio_pred=predict(mod_you_modelar,list(modelo=Modelo_Validar$modelo))

precio_real=Modelo_Validar$precio
error=precio_real-precio_pred
res=data.frame(precio_real,precio_pred,error)

MAE=mean(abs(error))
MAE
## [1] 11009405

El MAE de 10,323,004 COP indica que, en promedio, el modelo de regresión lineal simple comete un error absoluto de aproximadamente 10 millones de pesos colombianos al predecir el valor de la variable dependiente (por ejemplo, el precio de los vehículos). Si este error es significativo depende del rango de los precios; por ejemplo, si los valores típicos oscilan entre 50 y 100 millones de pesos, el error representa entre el 10% y 20% del valor total, lo cual podría ser alto y sugeriría la necesidad de mejorar el modelo, ya sea refinando las variables predictoras o explorando alternativas más complejas.

#REGRESION MULTIPLe

#Modelo 1

y=BasecarrosF2$precio
x1=BasecarrosF2$modelo
x2=BasecarrosF2$km

plot(BasecarrosF2[,1:3])

cor(BasecarrosF2[,1:3])
##            precio         km     modelo
## precio  1.0000000 -0.1984356  0.3550418
## km     -0.1984356  1.0000000 -0.5350326
## modelo  0.3550418 -0.5350326  1.0000000
mod_muliple1=lm(y~x1+x2)
summary(mod_muliple1)
## 
## Call:
## lm(formula = y ~ x1 + x2)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -39134081  -8667818  -5101338   8117270  33985021 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -3.509e+09  1.005e+09  -3.492 0.000662 ***
## x1           1.762e+06  4.980e+05   3.537 0.000567 ***
## x2          -3.449e+00  2.862e+01  -0.120 0.904293    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 11690000 on 126 degrees of freedom
## Multiple R-squared:  0.1262, Adjusted R-squared:  0.1123 
## F-statistic: 9.095 on 2 and 126 DF,  p-value: 0.0002043
AIC(mod_muliple1)
## [1] 4569.898
BIC(mod_muliple1)
## [1] 4581.337

Se observa en la tabla del summary se hace presente la multicolinealidad al incluir todos las variables,excepto combustible ya que solo tiene un valor que es “gasolina” por lo que no sería relevante, asimismo, se tiene una mayor complejidad en el modelo. Las variables significativas con un intervalo de confianza del 95% son modelo (x1), vehículos (x2) y transmisión (x3). Este modelo logra explicar el 87.43% de la variabilidad en el precio de venta de los vehículos en Cali.

Así mismo posee un criterio de Akaike (AIC) de 4182,95 muestra de la complejidad del mismo

Modelo 2

y=BasecarrosF2$precio
x1=BasecarrosF2$modelo
x2=BasecarrosF2$km
x3=BasecarrosF2$veh
x4=BasecarrosF2$transmision
plot(BasecarrosF2 %>% select(precio, modelo, km, veh, transmision))

mod_muliple2=lm(y~x1+x2+x3+x4)
summary(mod_muliple2)
## 
## Call:
## lm(formula = y ~ x1 + x2 + x3 + x4)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -28251553  -2588329   -116762   2151060  19644934 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -6.997e+09  4.767e+08 -14.678  < 2e-16 ***
## x1            3.489e+06  2.360e+05  14.780  < 2e-16 ***
## x2            2.733e+01  1.236e+01   2.210 0.028929 *  
## x3kia cerato  2.058e+07  1.111e+06  18.524  < 2e-16 ***
## x4Mecánica   -4.718e+06  1.368e+06  -3.448 0.000772 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5023000 on 124 degrees of freedom
## Multiple R-squared:  0.8414, Adjusted R-squared:  0.8362 
## F-statistic: 164.4 on 4 and 124 DF,  p-value: < 2.2e-16
AIC(mod_muliple2)
## [1] 4353.791
BIC(mod_muliple2)
## [1] 4370.95

Se observa en la tabla del summary del modelo 2 que se hace presente la multicolinealidad al incluir la variable kilometraje y modelo como variables predictoras, estas presentan un coeficiente de correlación de -0.69. En este caso, la variable kilometraje (x) no es significativa estando la variable modelo.

Este modelo logra explicar el 87.43% de la variabilidad en el precio de venta.

Así mismo posee un criterio de Akaike (AIC) de 3826.21 de acuerdo a la selección de variables, inferior al modelo 1.

#2) Mejor Modelo y paso a paso

El mejor modelo es el segundo

modelo_multiple_step=step(mod_muliple2)
## Start:  AIC=3985.7
## y ~ x1 + x2 + x3 + x4
## 
##        Df  Sum of Sq        RSS    AIC
## <none>               3.1282e+15 3985.7
## - x2    1 1.2323e+14 3.2514e+15 3988.7
## - x4    1 2.9994e+14 3.4281e+15 3995.5
## - x1    1 5.5110e+15 8.6392e+15 4114.8
## - x3    1 8.6568e+15 1.1785e+16 4154.8
summary(modelo_multiple_step)
## 
## Call:
## lm(formula = y ~ x1 + x2 + x3 + x4)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -28251553  -2588329   -116762   2151060  19644934 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -6.997e+09  4.767e+08 -14.678  < 2e-16 ***
## x1            3.489e+06  2.360e+05  14.780  < 2e-16 ***
## x2            2.733e+01  1.236e+01   2.210 0.028929 *  
## x3kia cerato  2.058e+07  1.111e+06  18.524  < 2e-16 ***
## x4Mecánica   -4.718e+06  1.368e+06  -3.448 0.000772 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5023000 on 124 degrees of freedom
## Multiple R-squared:  0.8414, Adjusted R-squared:  0.8362 
## F-statistic: 164.4 on 4 and 124 DF,  p-value: < 2.2e-16

3) MAE Del mejor modelo

modelo2 <- lm(precio ~ modelo + veh + km + transmision, data = BasecarrosF2)

predicciones <- predict(modelo2)

MAE <- mean(abs(predicciones - BasecarrosF2$precio))

MAE
## [1] 3381438

Tras calcular el MAE del modelo 2 de regresión lineal múltiple encontramos un valor de $3.153.239, monto por el que en promedio era el modelo en la predicción.

#4 Validacion de supuestos

par(mfrow=c(1.9999,1.9999))
plot(mod_muliple2)

plot(x1,log(y))

Vamos a ver si transformandolo se puede mejorar

#5 Transformacion del modelo

modelo_log_dep <- lm(log(precio) ~ modelo + veh + km + transmision, data = BasecarrosF2)
summary(modelo_log_dep)
## 
## Call:
## lm(formula = log(precio) ~ modelo + veh + km + transmision, data = BasecarrosF2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.3559 -0.0234  0.0257  0.0635  0.4101 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)         -1.540e+02  3.020e+01  -5.100 1.24e-06 ***
## modelo               8.494e-02  1.495e-02   5.682 9.00e-08 ***
## vehkia cerato        5.306e-01  7.038e-02   7.539 8.68e-12 ***
## km                   1.050e-06  7.831e-07   1.340    0.183    
## transmisionMecánica -6.616e-02  8.667e-02  -0.763    0.447    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.3181 on 124 degrees of freedom
## Multiple R-squared:  0.4339, Adjusted R-squared:  0.4156 
## F-statistic: 23.76 on 4 and 124 DF,  p-value: 1.334e-14
exp_coef <- exp(coef(modelo_log_dep)) - 1  


interpretacion_coef <- data.frame(
  Coeficiente = names(coef(modelo_log_dep)),
  Estimacion = coef(modelo_log_dep),
  Cambio_Porcentual = round(exp_coef * 100, 2)
)

interpretacion_coef
##                             Coeficiente    Estimacion Cambio_Porcentual
## (Intercept)                 (Intercept) -1.539927e+02           -100.00
## modelo                           modelo  8.494241e-02              8.87
## vehkia cerato             vehkia cerato  5.306295e-01             70.00
## km                                   km  1.049510e-06              0.00
## transmisionMecánica transmisionMecánica -6.616123e-02             -6.40
par(mfrow=c(1.9999,1.9999))
plot(modelo_log_dep)

Como vemos si sirvio haberlo transformado LOL

mod_trans_multi=lm(log(y)~x1+x2+x3+x4)
summary(mod_trans_multi)
## 
## Call:
## lm(formula = log(y) ~ x1 + x2 + x3 + x4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.3559 -0.0234  0.0257  0.0635  0.4101 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -1.540e+02  3.020e+01  -5.100 1.24e-06 ***
## x1            8.494e-02  1.495e-02   5.682 9.00e-08 ***
## x2            1.050e-06  7.831e-07   1.340    0.183    
## x3kia cerato  5.306e-01  7.038e-02   7.539 8.68e-12 ***
## x4Mecánica   -6.616e-02  8.667e-02  -0.763    0.447    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.3181 on 124 degrees of freedom
## Multiple R-squared:  0.4339, Adjusted R-squared:  0.4156 
## F-statistic: 23.76 on 4 and 124 DF,  p-value: 1.334e-14
AIC(mod_trans_multi)
## [1] 77.50356
BIC(mod_trans_multi)
## [1] 94.66244
valores_ajustados <- predict(mod_trans_multi, newdata = BasecarrosF2)
residuos_absolutos <- abs(exp(valores_ajustados) - BasecarrosF2$precio)

MAE <- mean(residuos_absolutos)
MAE
## [1] 3186789

#6 Prediccion del modelo

modelo2 <- lm(precio~ modelo + veh + km + transmision, data = BasecarrosF2)

predicciones <- predict(modelo2)

MAE <- mean(abs(predicciones - BasecarrosF2$precio))

MAE
## [1] 3381438
precio <- 5000000
modelo <- 2010


prediccion <- predict(mod_muliple2,)

prediccion
##        1        2        3        4        5        6        7        8 
## 37056571 46265432 43364323 37685075 51038389 45099465 50382559 58316148 
##        9       10       11       12       13       14       15       16 
## 68016882 44826279 37685075 34224134 44815348 47292899 38368232 40271931 
##       17       18       19       20       21       22       23       24 
## 37575770 41774876 50535586 50163949 58348940 39971342 37712402 46265432 
##       25       26       27       28       29       30       31       32 
## 37985588 50054644 73136017 71423526 58888688 39889363 37712402 41392308 
##       33       34       35       36       37       38       39       40 
## 41610842 61738696 51858101 56184775 56922585 57247691 46265432 64867186 
##       41       42       43       44       45       46       47       48 
## 52955697 34169126 44416385 48861351 68590733 54253673 40253745 51939397 
##       49       50       51       52       53       54       55       56 
## 50847105 55838597 41692897 60848428 72625882 55005146 67169767 43897186 
##       57       58       59       60       61       62       63       64 
## 31492231 25776593 27186629 42304278 30590541 39758412 28611913 39211886 
##       65       66       67       68       69       70       71       72 
## 39881380 26937960 41821469 36116762 40108188 40099990 41834826 34393416 
##       73       74       75       76       77       78       79       80 
## 35308846 33177397 30344604 36146821 25061587 36228799 39772075 20418853 
##       81       82       83       84       85       86       87       88 
## 29688774 38788329 29278880 33710259 33057161 30453909 41275020 39580791 
##       89       90       91       92       93       94       95       96 
## 33696596 26500740 40355066 33248445 33723922 30672519 30153320 35654948 
##       97       98       99      100      101      102      103      104 
## 29251553 37862652 26364108 41347859 23968536 36502062 40245761 29251553 
##      105      106      107      108      109      110      111      112 
## 30884449 36256126 30317278 30153320 39088918 39772075 38815655 31273697 
##      113      114      115      116      117      118      119      120 
## 31865736 36673616 37116903 23913884 26855981 30044015 38496880 24187146 
##      121      122      123      124      125      126      127      128 
## 30262625 36174147 42040580 22656875 37859236 29716100 23695273 30180647 
##      129 
## 34370613

#7 El mejor modelo de regresión lineal múltiple seleccionado, basado en variables como kilometraje y año del modelo, tiene una utilidad práctica significativa en el sector automotriz, particularmente para concesionarios, plataformas de compraventa en línea y aseguradoras. Este modelo permite estimar de manera precisa y objetiva el precio de los vehículos, ayudando a establecer valores competitivos que reflejen las condiciones del mercado. Su implementación en plataformas digitales facilitaría la automatización del proceso de valoración, permitiendo a usuarios ingresar datos básicos y obtener estimaciones confiables en tiempo real. Además, puede ser utilizado para segmentar mercados, optimizar estrategias de venta y reducir subjetividades en la toma de decisiones. En el ámbito asegurador, resulta valioso para calcular primas o indemnizaciones basadas en el valor estimado del vehículo. En resumen, este modelo mejora la transparencia, eficiencia y precisión en la evaluación de precios, beneficiando tanto a empresas como a consumidores.