Examen 1- Yadiel Suárez & Karjeet Khelani

Introducción:

En este informe, se presenta un análisis detallado sobre cómo diversas características de los vehículos influyen en su precio en el mercado. Se utilizó RStudio para llevar a cabo el análisis estadístico, incluyendo estadísticas descriptivas, análisis de correlación, ajuste de modelos de regresión lineal múltiple y verificación de los supuestos del modelo.

Trabajo a realizar:

  1. Realice una explicación de la base de datos con las herramientas de estadística descriptiva.

  2. Realiza un análisis de las correlacones existentes entre las variables.

  3. Seleccione el mejor modelo que se puede ajustar con estas variables.

  4. Interprete: los coefiecientes obtenidos, la desviación estándar estimada y el coeficiente de determinación.

  5. Revisa el cumplimiento de los supuestos del modelo ajustado. 

  6. Estima el precio de un auto con las siguientes características: 4 puertas, 100 de distancia entre ejes, 860 de peso, 6 cilindros, 180 de tamaño del motor, -200 índice de compresión del motor, 10 caballos de fuerza, 23 de rendimiento en la ciudad y 34 de rendimiento en carretera.

Variables:

  1. Precio del vehículo (y)

  2. Número de puertas (x1)

  3. Distancia entre ejes (x2)

  4. Peso (x3)

  5. Número de cilindros (x4)

  6. Tamaño del motor (x5)

  7. Índice de compresión del motor (x6)

  8. Caballos de fuerza (x7)

  9. Rendimiento en la ciudad (mpg) (x8)

  10. Rendimiento en carretera (mpg) (x9)

Parte I:

Datos <- read.csv("data1.csv")
names(Datos) <- c("Precio del vehículo", "Número de puertas", "Distancia entre ejes", "Peso", "Número de cilindros", "Tamaño del motor", "Índice de compresión del motor", "Caballos de fuerza", "Rendimiento en la ciudad (mpg)", "Rendimiento en carretera (mpg)")
y <- Datos$`Precio del vehículo`
x1 <- Datos$`Número de puertas`
x2 <- Datos$`Distancia entre ejes`
x3 <- Datos$Peso
x4 <- Datos$`Número de cilindros`
x5 <- Datos$`Tamaño del motor`
x6 <- Datos$`Índice de compresión del motor`
x7 <- Datos$`Caballos de fuerza`
x8 <- Datos$`Rendimiento en la ciudad (mpg)`
x9 <- Datos$`Rendimiento en carretera (mpg)`
################
summary(Datos)
##  Precio del vehículo Número de puertas Distancia entre ejes      Peso      
##  Min.   :15205       Min.   :2.0       Min.   : 73.20       Min.   :262.6  
##  1st Qu.:15669       1st Qu.:2.0       1st Qu.: 98.33       1st Qu.:320.6  
##  Median :15799       Median :4.0       Median :104.15       Median :354.2  
##  Mean   :15801       Mean   :3.7       Mean   :104.17       Mean   :354.6  
##  3rd Qu.:15934       3rd Qu.:5.0       3rd Qu.:110.05       3rd Qu.:388.2  
##  Max.   :16312       Max.   :5.0       Max.   :131.20       Max.   :487.8  
##  Número de cilindros Tamaño del motor Índice de compresión del motor
##  Min.   :2.00        Min.   : 48.7    Min.   :-319.9                
##  1st Qu.:3.00        1st Qu.:165.8    1st Qu.:-233.2                
##  Median :5.00        Median :190.3    Median :-198.6                
##  Mean   :5.06        Mean   :193.7    Mean   :-194.2                
##  3rd Qu.:7.00        3rd Qu.:226.9    3rd Qu.:-150.8                
##  Max.   :8.00        Max.   :329.3    Max.   : -38.2                
##  Caballos de fuerza Rendimiento en la ciudad (mpg)
##  Min.   :-5.100     Min.   :16.70                 
##  1st Qu.: 5.325     1st Qu.:28.50                 
##  Median : 9.800     Median :31.70                 
##  Mean   :10.345     Mean   :31.44                 
##  3rd Qu.:15.475     3rd Qu.:34.40                 
##  Max.   :26.000     Max.   :44.50                 
##  Rendimiento en carretera (mpg)
##  Min.   : 36.00                
##  1st Qu.: 67.00                
##  Median : 79.00                
##  Mean   : 78.86                
##  3rd Qu.: 91.00                
##  Max.   :126.00

Descripción:

Precio del vehículo: El precio del vehículo en este conjunto de datos varía desde un mínimo de 15205 hasta un máximo de 16312 unidades monetarias, con una mediana de 15799 unidades monetarias. La dispersión de los precios parece ser relativamente baja, ya que el primer cuartil se encuentra en 15669 y el tercer cuartil en 15934.

hist(Datos$`Precio del vehículo`, 
     main = "Histograma de Precio del vehículo",
     xlab = "Precio del vehículo",
     ylab = "Frecuencia",
     col = "pink")

Número de puertas: La cantidad de puertas de los vehículos en este conjunto de datos varía de 2 a 5, con una mediana de 4.

barplot(table(Datos$`Número de puertas`),
     main = "Número de Puertas",
     xlab = "Número de Puertas",
     ylab = "Frecuencia",
     col = "lightblue2")

Distancia entre ejes: La distancia entre ejes de los vehículos en este conjunto de datos varía desde un mínimo de 73.20 hasta un máximo de 131.20 unidades. La mediana de esta variable es 104.15 unidades.

hist(Datos$`Distancia entre ejes`,
     main = "Distancia entre ejes",
     xlab = "Distancia entre ejes",
     ylab = "Frecuencia",
     col = "lightgreen")

Peso: El peso de los vehículos en este conjunto de datos varía desde un mínimo de 262.6 hasta un máximo de 487.8 unidades. La mediana de esta variable es 354.2 unidades.

hist(Datos$Peso,
     main = "Peso",
     xlab = "Peso",
     ylab = "Frecuencia",
     col = "lavender")

Número de cilindros: El número de cilindros de los vehículos en este conjunto de datos varía de 2 a 8, con una mediana de 5.

barplot(table(Datos$`Número de cilindros`),
        main = "Número de cilindros",
        xlab = "Cantidad de cilindros",
        ylab = "Frecuencia",
        col = "orange")

Tamaño del motor: El tamaño del motor de los vehículos en este conjunto de datos varía desde un mínimo de 48.7 hasta un máximo de 329.3 unidades. La mediana de esta variable es 190.3 unidades.

hist(Datos$`Tamaño del motor`,
     main = "Tamaño del motor",
     xlab = "Tamaño del motor",
     ylab = "Frecuencia",
     col = "yellow")

Índice de compresión del motor: El índice de compresión del motor de los vehículos en este conjunto de datos varía desde un mínimo de -319.9 hasta un máximo de -38.2 unidades. La mediana de esta variable es -198.6 unidades.

hist(Datos$`Índice de compresión del motor`,
     main = "Índice de compresión del motor",
     xlab = "Índice de compresión",
     ylab = "Frecuencia",
     col = "blue")

Caballos de fuerza: Los caballos de fuerza de los vehículos en este conjunto de datos varían desde un mínimo de -5.100 hasta un máximo de 26.000 unidades. La mediana de esta variable es 9.800 unidades.

hist(Datos$`Caballos de fuerza`,
     main = "Caballos de fuerza",
     xlab = "Caballos de fuerza",
     ylab = "Frecuencia",
     col = "brown")

Rendimiento en la ciudad (mpg): El rendimiento en la ciudad de los vehículos en este conjunto de datos varía desde un mínimo de 16.70 hasta un máximo de 44.50 millas por galón (mpg). La mediana de esta variable es 31.70 mpg.

hist(Datos$`Rendimiento en la ciudad (mpg)`,
     main = "Rendimiento en la ciudad (mpg)",
     xlab = "Rendimiento en la ciudad (mpg)",
     ylab = "Frecuencia",
     col = "pink4")

Rendimiento en carretera (mpg): El rendimiento en carretera de los vehículos en este conjunto de datos varía desde un mínimo de 36.00 hasta un máximo de 126.00 millas por galón (mpg). La mediana de esta variable es 79.00 mpg.

hist(Datos$`Rendimiento en carretera (mpg)`,
     main = "Rendimiento en carretera (mpg)",
     xlab = "Rendimiento en carretera (mpg)",
     ylab = "Frecuencia",
     col = "cyan3")

PARTE II: Análisis de Correlación

En esta parte, exploraremos las relaciones entre diversas características de los vehículos, como el número de puertas, el tamaño del motor, la potencia y el peso, y su impacto en el precio del vehículo.

modelo1 <- lm(Datos$`Precio del vehículo`~ Datos$`Número de puertas`+Datos$`Distancia entre ejes`+Datos$Peso+Datos$`Número de cilindros`+Datos$`Tamaño del motor`+Datos$`Caballos de fuerza`+Datos$`Rendimiento en la ciudad (mpg)`+Datos$`Rendimiento en carretera (mpg)`+Datos$`Índice de compresión del motor`)
summary(modelo1)
## 
## Call:
## lm(formula = Datos$`Precio del vehículo` ~ Datos$`Número de puertas` + 
##     Datos$`Distancia entre ejes` + Datos$Peso + Datos$`Número de cilindros` + 
##     Datos$`Tamaño del motor` + Datos$`Caballos de fuerza` + 
##     Datos$`Rendimiento en la ciudad (mpg)` + Datos$`Rendimiento en carretera (mpg)` + 
##     Datos$`Índice de compresión del motor`)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -497.40 -104.03   -4.23  106.45  516.14 
## 
## Coefficients:
##                                          Estimate Std. Error t value Pr(>|t|)
## (Intercept)                            16115.2579   140.9053 114.369  < 2e-16
## Datos$`Número de puertas`                  9.9261     8.2467   1.204  0.22992
## Datos$`Distancia entre ejes`               0.6165     1.6243   0.380  0.70464
## Datos$Peso                                -2.1646     0.3416  -6.336 1.15e-09
## Datos$`Número de cilindros`               -2.2546     6.4731  -0.348  0.72792
## Datos$`Tamaño del motor`                  -0.6324     0.4225  -1.497  0.13582
## Datos$`Caballos de fuerza`                 5.3664     1.7728   3.027  0.00274
## Datos$`Rendimiento en la ciudad (mpg)`    -0.8220     3.1215  -0.263  0.79252
## Datos$`Rendimiento en carretera (mpg)`     4.0801     0.8716   4.681 4.77e-06
## Datos$`Índice de compresión del motor`    -0.6926     0.3620  -1.913  0.05693
##                                           
## (Intercept)                            ***
## Datos$`Número de puertas`                 
## Datos$`Distancia entre ejes`              
## Datos$Peso                             ***
## Datos$`Número de cilindros`               
## Datos$`Tamaño del motor`                  
## Datos$`Caballos de fuerza`             ** 
## Datos$`Rendimiento en la ciudad (mpg)`    
## Datos$`Rendimiento en carretera (mpg)` ***
## Datos$`Índice de compresión del motor` .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 159.3 on 240 degrees of freedom
## Multiple R-squared:  0.381,  Adjusted R-squared:  0.3578 
## F-statistic: 16.41 on 9 and 240 DF,  p-value: < 2.2e-16

Ajuste del modelo:

modelo2 <- lm(`Precio del vehículo` ~ Peso + `Caballos de fuerza` + `Rendimiento en carretera (mpg)` + `Índice de compresión del motor`, data = Datos)
summary(modelo2)
## 
## Call:
## lm(formula = `Precio del vehículo` ~ Peso + `Caballos de fuerza` + 
##     `Rendimiento en carretera (mpg)` + `Índice de compresión del motor`, 
##     data = Datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -489.05 -111.14    0.64   99.07  498.72 
## 
## Coefficients:
##                                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                      16137.9825   101.8663 158.423  < 2e-16 ***
## Peso                                -2.0835     0.2278  -9.147  < 2e-16 ***
## `Caballos de fuerza`                 5.1645     1.4114   3.659  0.00031 ***
## `Rendimiento en carretera (mpg)`     3.8592     0.5856   6.590 2.67e-10 ***
## `Índice de compresión del motor`    -0.2253     0.1780  -1.266  0.20665    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 159 on 245 degrees of freedom
## Multiple R-squared:  0.3701, Adjusted R-squared:  0.3598 
## F-statistic: 35.99 on 4 and 245 DF,  p-value: < 2.2e-16
modelo3 <- lm(`Precio del vehículo` ~ Peso + `Caballos de fuerza` + `Rendimiento en carretera (mpg)`, data = Datos)
summary(modelo3)
## 
## Call:
## lm(formula = `Precio del vehículo` ~ Peso + `Caballos de fuerza` + 
##     `Rendimiento en carretera (mpg)`, data = Datos)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -489.2 -110.4   -2.5  104.8  479.6 
## 
## Coefficients:
##                                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                      16181.0173    96.1467 168.295  < 2e-16 ***
## Peso                                -2.0693     0.2278  -9.085  < 2e-16 ***
## `Caballos de fuerza`                 5.0426     1.4099   3.577 0.000419 ***
## `Rendimiento en carretera (mpg)`     3.8207     0.5856   6.525 3.85e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 159.2 on 246 degrees of freedom
## Multiple R-squared:  0.366,  Adjusted R-squared:  0.3582 
## F-statistic: 47.33 on 3 and 246 DF,  p-value: < 2.2e-16

MODELO AJUSTADO:

lm(formula = `Precio del vehículo` ~ Peso + `Caballos de fuerza` +      `Rendimiento en carretera (mpg)`, data = Datos)

INTERPRETACIÓN:

  1. Coeficientes:

    • El coeficiente para el intercepto es 16181.0173, significando que cuando todas las variables son cero, el precio estimado del vehículo sería de aproximadamente $16,181.0173.

    • Para la variable Peso, el coeficiente es -2.0693. Esto indica que, en promedio, por cada unidad de aumento en el peso del vehículo, el precio del vehículo disminuiría en $2.0693 aproximadamente.

    • Para la variable Caballos de fuerza, el coeficiente es 5.0426. Esto sugiere que, en promedio, por cada unidad adicional en los caballos de fuerza del vehículo, el precio del vehículo aumentaría en $5.0426 aproximadamente.

    • Para la variable Rendimiento en Carretera, el coeficiente es 3.8207. Esto indica que, en promedio, por cada unidad adicional en el rendimiento en carretera del vehículo (medido en millas por galón), el precio del vehículo aumentaría en $3.8207 aproximadamente.

  2. Desviación estándar residual (Residual standard error): Esta medida, 159.2 en este caso, indica cuánto varían los valores reales de los precios del vehículo alrededor de la línea de regresión ajustada. Es decir,

  3. Coeficiente de determinación:: El coeficiente de determinación , en este caso, el R cuadrado múltiple es 0.366, lo que significa que aproximadamente el 36.6% de la variabilidad en el precio del vehículo puede ser explicada por las variables predictoras incluidas en el modelo. El R cuadrado ajustado, que tiene en cuenta el número de predictores en el modelo, es ligeramente menor (0.3582). Esto sugiere que el modelo explica una cantidad significativa de la variabilidad en el precio del vehículo, pero puede haber otras variables no incluidas en el modelo que también influyen en el precio del vehículo.

Confirmación:

library(MASS)
## Warning: package 'MASS' was built under R version 4.3.3
Modelo4 <- lm(`Precio del vehículo` ~ ., data = Datos)
Modelo5 <- stepAIC(Modelo4, direction = "both", trace = 1)
## Start:  AIC=2545.12
## `Precio del vehículo` ~ `Número de puertas` + `Distancia entre ejes` + 
##     Peso + `Número de cilindros` + `Tamaño del motor` + `Índice de compresión del motor` + 
##     `Caballos de fuerza` + `Rendimiento en la ciudad (mpg)` + 
##     `Rendimiento en carretera (mpg)`
## 
##                                    Df Sum of Sq     RSS    AIC
## - `Rendimiento en la ciudad (mpg)`  1      1759 6090396 2543.2
## - `Número de cilindros`             1      3078 6091714 2543.2
## - `Distancia entre ejes`            1      3654 6092290 2543.3
## - `Número de puertas`               1     36754 6125390 2544.6
## <none>                                          6088636 2545.1
## - `Tamaño del motor`                1     56819 6145455 2545.4
## - `Índice de compresión del motor`  1     92845 6181482 2546.9
## - `Caballos de fuerza`              1    232472 6321108 2552.5
## - `Rendimiento en carretera (mpg)`  1    555926 6644563 2565.0
## - Peso                              1   1018566 7107203 2581.8
## 
## Step:  AIC=2543.19
## `Precio del vehículo` ~ `Número de puertas` + `Distancia entre ejes` + 
##     Peso + `Número de cilindros` + `Tamaño del motor` + `Índice de compresión del motor` + 
##     `Caballos de fuerza` + `Rendimiento en carretera (mpg)`
## 
##                                    Df Sum of Sq     RSS    AIC
## - `Número de cilindros`             1      2722 6093117 2541.3
## - `Distancia entre ejes`            1      3800 6094195 2541.3
## - `Número de puertas`               1     35941 6126336 2542.7
## <none>                                          6090396 2543.2
## - `Tamaño del motor`                1     57718 6148113 2543.6
## - `Índice de compresión del motor`  1     93432 6183828 2545.0
## + `Rendimiento en la ciudad (mpg)`  1      1759 6088636 2545.1
## - `Caballos de fuerza`              1    231190 6321585 2550.5
## - Peso                              1   1036902 7127298 2580.5
## - `Rendimiento en carretera (mpg)`  1   1111217 7201612 2583.1
## 
## Step:  AIC=2541.3
## `Precio del vehículo` ~ `Número de puertas` + `Distancia entre ejes` + 
##     Peso + `Tamaño del motor` + `Índice de compresión del motor` + 
##     `Caballos de fuerza` + `Rendimiento en carretera (mpg)`
## 
##                                    Df Sum of Sq     RSS    AIC
## - `Distancia entre ejes`            1      3371 6096488 2539.4
## - `Número de puertas`               1     36099 6129216 2540.8
## <none>                                          6093117 2541.3
## - `Tamaño del motor`                1     59156 6152273 2541.7
## - `Índice de compresión del motor`  1     93747 6186864 2543.1
## + `Número de cilindros`             1      2722 6090396 2543.2
## + `Rendimiento en la ciudad (mpg)`  1      1403 6091714 2543.2
## - `Caballos de fuerza`              1    315901 6409018 2551.9
## - Peso                              1   1035423 7128540 2578.5
## - `Rendimiento en carretera (mpg)`  1   1109066 7202183 2581.1
## 
## Step:  AIC=2539.44
## `Precio del vehículo` ~ `Número de puertas` + Peso + `Tamaño del motor` + 
##     `Índice de compresión del motor` + `Caballos de fuerza` + 
##     `Rendimiento en carretera (mpg)`
## 
##                                    Df Sum of Sq     RSS    AIC
## - `Número de puertas`               1     36031 6132519 2538.9
## <none>                                          6096488 2539.4
## - `Tamaño del motor`                1     60156 6156643 2539.9
## + `Distancia entre ejes`            1      3371 6093117 2541.3
## + `Número de cilindros`             1      2292 6094195 2541.3
## + `Rendimiento en la ciudad (mpg)`  1      1552 6094935 2541.4
## - `Índice de compresión del motor`  1     99157 6195645 2541.5
## - `Caballos de fuerza`              1    318611 6415099 2550.2
## - `Rendimiento en carretera (mpg)`  1   1108941 7205429 2579.2
## - Peso                              1   2107982 8204469 2611.7
## 
## Step:  AIC=2538.91
## `Precio del vehículo` ~ Peso + `Tamaño del motor` + `Índice de compresión del motor` + 
##     `Caballos de fuerza` + `Rendimiento en carretera (mpg)`
## 
##                                    Df Sum of Sq     RSS    AIC
## <none>                                          6132519 2538.9
## + `Número de puertas`               1     36031 6096488 2539.4
## - `Tamaño del motor`                1     63478 6195997 2539.5
## + `Distancia entre ejes`            1      3303 6129216 2540.8
## + `Número de cilindros`             1      2442 6130077 2540.8
## + `Rendimiento en la ciudad (mpg)`  1       790 6131729 2540.9
## - `Índice de compresión del motor`  1    101529 6234047 2541.0
## - `Caballos de fuerza`              1    327461 6459980 2549.9
## - `Rendimiento en carretera (mpg)`  1   1092175 7224694 2577.9
## - Peso                              1   2116939 8249458 2611.1
modelo5_ajustado <- lm(`Precio del vehículo` ~ Peso + `Tamaño del motor` + `Índice de compresión del motor` +  `Caballos de fuerza` + `Rendimiento en carretera (mpg)`, data = Datos)
summary(modelo5_ajustado)
## 
## Call:
## lm(formula = `Precio del vehículo` ~ Peso + `Tamaño del motor` + 
##     `Índice de compresión del motor` + `Caballos de fuerza` + 
##     `Rendimiento en carretera (mpg)`, data = Datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -493.09 -107.01   -2.94   99.55  489.99 
## 
## Coefficients:
##                                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                      16172.9209   103.9030 155.654  < 2e-16 ***
## Peso                                -2.0839     0.2271  -9.178  < 2e-16 ***
## `Tamaño del motor`                  -0.6662     0.4192  -1.589 0.113304    
## `Índice de compresión del motor`    -0.7192     0.3578  -2.010 0.045545 *  
## `Caballos de fuerza`                 5.0823     1.4080   3.610 0.000372 ***
## `Rendimiento en carretera (mpg)`     3.8488     0.5838   6.592 2.66e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 158.5 on 244 degrees of freedom
## Multiple R-squared:  0.3766, Adjusted R-squared:  0.3638 
## F-statistic: 29.47 on 5 and 244 DF,  p-value: < 2.2e-16
modelo5_ajustado2 <- lm(`Precio del vehículo` ~ Peso + `Índice de compresión del motor` +  `Caballos de fuerza` + `Rendimiento en carretera (mpg)`, data = Datos)
summary(modelo5_ajustado2)
## 
## Call:
## lm(formula = `Precio del vehículo` ~ Peso + `Índice de compresión del motor` + 
##     `Caballos de fuerza` + `Rendimiento en carretera (mpg)`, 
##     data = Datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -489.05 -111.14    0.64   99.07  498.72 
## 
## Coefficients:
##                                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                      16137.9825   101.8663 158.423  < 2e-16 ***
## Peso                                -2.0835     0.2278  -9.147  < 2e-16 ***
## `Índice de compresión del motor`    -0.2253     0.1780  -1.266  0.20665    
## `Caballos de fuerza`                 5.1645     1.4114   3.659  0.00031 ***
## `Rendimiento en carretera (mpg)`     3.8592     0.5856   6.590 2.67e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 159 on 245 degrees of freedom
## Multiple R-squared:  0.3701, Adjusted R-squared:  0.3598 
## F-statistic: 35.99 on 4 and 245 DF,  p-value: < 2.2e-16
modelo5_ajustado3 <- lm(`Precio del vehículo` ~ `Peso` + `Caballos de fuerza` + `Rendimiento en carretera (mpg)`, data = Datos)
summary(modelo5_ajustado3)
## 
## Call:
## lm(formula = `Precio del vehículo` ~ Peso + `Caballos de fuerza` + 
##     `Rendimiento en carretera (mpg)`, data = Datos)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -489.2 -110.4   -2.5  104.8  479.6 
## 
## Coefficients:
##                                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                      16181.0173    96.1467 168.295  < 2e-16 ***
## Peso                                -2.0693     0.2278  -9.085  < 2e-16 ***
## `Caballos de fuerza`                 5.0426     1.4099   3.577 0.000419 ***
## `Rendimiento en carretera (mpg)`     3.8207     0.5856   6.525 3.85e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 159.2 on 246 degrees of freedom
## Multiple R-squared:  0.366,  Adjusted R-squared:  0.3582 
## F-statistic: 47.33 on 3 and 246 DF,  p-value: < 2.2e-16

Parte III: Supuestos

  1. La distribución de los residuos debe ser aproximadamente normal.

  2. Los residuales deben tener varianza constante (Heterocedasticidad).

  3. Los residuales deben ser independientes (Multicolinealidad).

1. La distribución de los residuos debe ser aproximadamente normal.

residuosmod2 <- resid(modelo5_ajustado3)
library(car)
## Warning: package 'car' was built under R version 4.3.3
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.3.3
qqPlot(residuosmod2, main = "QQ Plot del Modelo Ajustado", ylab = "Residuos del Modelo", xlab = "Cuantiles")

## [1]  91 246
shapiro.test(residuosmod2)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuosmod2
## W = 0.99777, p-value = 0.9824

El resultado muestra un valor de estadístico de prueba (W) de 0.99785 y un valor p de 0.9858, lo cual sugiere que los residuos del modelo podrían seguir una distribución normal, lo que apoya el supuesto de normalidad en el modelo.

2. Los residuales deben tener varianza constante (Heterocedasticidad).

plot(residuosmod2)
abline(h=0,col="red",lty=2)
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.3.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.3.3
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric

bptest(modelo5_ajustado3)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo5_ajustado3
## BP = 0.30334, df = 3, p-value = 0.9594

Dado que el valor p es mayor que el nivel de significancia típico de 0.05, no hay suficiente evidencia para rechazar la hipótesis nula. Por lo tanto, los residuos parecen tener varianza constante, lo que sugiere que se cumple el supuesto de homocedasticidad.

3. Los residuales deben ser independientes (Multicolinealidad).

plot(residuosmod2)
abline(h=0,col="red",lty=2)

dwtest(modelo5_ajustado3)
## 
##  Durbin-Watson test
## 
## data:  modelo5_ajustado3
## DW = 1.9346, p-value = 0.3027
## alternative hypothesis: true autocorrelation is greater than 0

En el resultado proporcionado, el valor del estadístico de Durbin-Watson es 1.9346 y el valor p asociado con la prueba es 0.3027. Sugiriendo que la autocorrelación es mayor que cero, lo que implica que los residuos están correlacionados positivamente entre sí.

PARTE IV: Proyección

#MANUAL
coef(modelo5_ajustado3)
##                      (Intercept)                             Peso 
##                     16181.017285                        -2.069329 
##             `Caballos de fuerza` `Rendimiento en carretera (mpg)` 
##                         5.042645                         3.820717
#PESO=860
#CABALLOSDEFUERZA=10
#RENDIMIENTO=34

Precio_estimado1 =16181.017285-2.069329*860+5.042645*10+3.820717*34

print(Precio_estimado1)
## [1] 14581.73

Por lo tanto, con un peso de 860, caballos de fuerza de 10 y un rendimiento en carretera de 34 mpg, el precio estimado del vehículo sería aproximadamente $14,583.50.