Análisis de predicción

Con base en los resultados del EDA y los resultados correlacionales, se propuso la realización de una tercera etapa con la siguiente pregunta:

¿Cuál es el efecto de la cilindrada de los automóviles fabricados en 1978 sobre su rendimiento de millas por galón, dependiendo de su origen?

Dada la naturaleza de las variables, se eligió el modelo lm()

Resultados de los modelos

Para autos nacionales

Se encontró una relación negativa y estadísticamente significativa entre la cilindrada del motor y el rendimiento de gasolina en los autos nacionales (β = -0.0416, p < 0.001). El modelo explicó aproximadamente el 55.8% de la variabilidad del consumo (R² = 0.5585), lo que indica un ajuste moderadamente fuerte. Esto confirma que autos con motores más grandes presentan, en promedio, un menor rendimiento de combustible.

## 
## Call:
## lm(formula = mpg ~ displacement, data = autos_nacionales)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.9397 -1.9397 -0.9397  0.7715  9.0954 
## 
## Coefficients:
##               Estimate Std. Error t value             Pr(>|t|)    
## (Intercept)  29.543672   1.299004  22.743 < 0.0000000000000002 ***
## displacement -0.041576   0.005227  -7.953       0.000000000196 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.183 on 50 degrees of freedom
## Multiple R-squared:  0.5585, Adjusted R-squared:  0.5497 
## F-statistic: 63.26 on 1 and 50 DF,  p-value: 0.0000000001964

Para autos extranjeros

Se encontró una relación negativa y estadísticamente significativa entre la cilindrada del motor y el rendimiento de gasolina en los autos nacionales (β = -0.199, p < 0.001). El modelo explicó aproximadamente el 56.21% de la variabilidad del consumo (R² = 0.5621), lo que indica un ajuste moderadamente fuerte. Esto confirma que autos con motores más grandes presentan, en promedio, un menor rendimiento de combustible.

## 
## Call:
## lm(formula = mpg ~ displacement, data = autos_extranjeros)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.1931 -3.5269 -0.5367  2.4497 11.9983 
## 
## Coefficients:
##              Estimate Std. Error t value      Pr(>|t|)    
## (Intercept)  46.93169    4.47631  10.484 0.00000000142 ***
## displacement -0.19922    0.03932  -5.067 0.00005891555 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.483 on 20 degrees of freedom
## Multiple R-squared:  0.5621, Adjusted R-squared:  0.5402 
## F-statistic: 25.68 on 1 and 20 DF,  p-value: 0.00005892

Interpretación

Modelo para autos nacionales

El intercepto fue de 29.54, lo que significa que, teóricamente, si la cilindrada fuera de 0, el consumo esperado sería 29.54 millas por galón. La pendiente fue de -0.041, por lo que, por cada aumente de una unidad de cilindrada, el rendimiento de gasolina disminuye en promedio 0.041 millas por galón. En otras palabras, entre más grande el motor, menor el rendimiento de gasolina. El p valor fue menor a .001, por lo que el efecto de la cilindrada sobre el rendimiento fue estadísticamente significativa. El R² fue de 0.55, lo que implica que el 55.85% de la variabilidad del consumo se explica por la cilindrada. Es decir, el ajusto fue moderadamente fuerte. Por último, el error estándar del modelo fue de 3.11, lo que indica que, en promedio, las predicciones del modelo se equivocan en ±3.18 mpg.

Modelo para autos extranjeros

El intercepto fue de 46.93, lo que significa que, teóricamente, si la cilindrada fuera de 0, el consumo esperado sería 46.93 millas por galón. La pendiente fue de -0.199, por lo que, por cada aumente de una unidad de cilindrada, el rendimiento de gasolina disminuye en promedio 0.199 millas por galón. En otras palabras, entre más grande el motor, menor el rendimiento de gasolina. El p valor fue menor a .001, por lo que el efecto de la cilindrada sobre el rendimiento fue estadísticamente significativa. El R² fue de 0.5621, lo que implica que el 56.21% de la variabilidad del consumo se explica por la cilindrada. Es decir, el ajusto fue moderadamente fuerte. Por último, el error estándar del modelo fue de 4.48, lo que indica que, en promedio, las predicciones del modelo se equivocan en ±4.48 mpg.

Conclusión comparando ambos modelos

En ambos grupos de vehículos se encontró una relación negativa y estadísticamente significativa entre la cilindrada del motor y el rendimiento de combustible (p < 0.001). La magnitud del efecto fue considerablemente mayor en los autos extranjeros (β = -0.199) en comparación con los nacionales (β = -0.042), lo que indica que el aumento en la cilindrada reduce el rendimiento de forma mucho más pronunciada en los vehículos extranjeros. Específicamente, la cilindrada afecta casi 5 veces más al consumo en autos extranjeros que en lso nacionales. En ambos casos, la cilindrada explicó alrededor del 56% de la variabilidad total del consumo de gasolina. Además, el modelo para autos nacionales es más preciso que el modelo para autos extranjeros

Relevancia práctica

Las implicaciones de estos resultados pueden ir para el consumidor o para las agencias de autos. Para el consumidor esta evidencia es valiosa, pues le ayudaría a elegir un auto con mayor cilindrada de origen nacional, pues son aquellos que mantienen mejor su rendimiento. Para las agencias de autos extrajeras les permitiría conocer, que en ese aspecto, sus autos son peores que los autos nacionales, y con ello realizar esfuerzos para mejorar este apartado y poder competir mejor en el mercado.

Limitaciones

Se consideró específicamente la cilindrada del motor para predecir el rendimiento de los autos, sin embargo, considero que se pudieron incluir otras variables relevantes que permitan explicar mejor esta variable.