Análisis de predicción
Con base en los resultados del EDA y los resultados correlacionales,
se propuso la realización de una tercera etapa con la siguiente
pregunta:
¿Cuál es el efecto de la cilindrada de los automóviles fabricados en
1978 sobre su rendimiento de millas por galón, dependiendo de su
origen?
Dada la naturaleza de las variables, se eligió el modelo lm()
Resultados de los modelos
Para autos nacionales
Se encontró una relación negativa y estadísticamente significativa
entre la cilindrada del motor y el rendimiento de gasolina en los autos
nacionales (β = -0.0416, p < 0.001). El modelo explicó
aproximadamente el 55.8% de la variabilidad del consumo (R² = 0.5585),
lo que indica un ajuste moderadamente fuerte. Esto confirma que autos
con motores más grandes presentan, en promedio, un menor rendimiento de
combustible.
##
## Call:
## lm(formula = mpg ~ displacement, data = autos_nacionales)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.9397 -1.9397 -0.9397 0.7715 9.0954
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 29.543672 1.299004 22.743 < 0.0000000000000002 ***
## displacement -0.041576 0.005227 -7.953 0.000000000196 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.183 on 50 degrees of freedom
## Multiple R-squared: 0.5585, Adjusted R-squared: 0.5497
## F-statistic: 63.26 on 1 and 50 DF, p-value: 0.0000000001964
Interpretación
Modelo para autos nacionales
El intercepto fue de 29.54, lo que significa que, teóricamente, si
la cilindrada fuera de 0, el consumo esperado sería 29.54 millas por
galón. La pendiente fue de -0.041, por lo que, por cada aumente de una
unidad de cilindrada, el rendimiento de gasolina disminuye en promedio
0.041 millas por galón. En otras palabras, entre más grande el motor,
menor el rendimiento de gasolina. El p valor fue menor a .001, por lo
que el efecto de la cilindrada sobre el rendimiento fue estadísticamente
significativa. El R² fue de 0.55, lo que implica que el 55.85% de la
variabilidad del consumo se explica por la cilindrada. Es decir, el
ajusto fue moderadamente fuerte. Por último, el error estándar del
modelo fue de 3.11, lo que indica que, en promedio, las predicciones del
modelo se equivocan en ±3.18 mpg.
Conclusión comparando ambos modelos
Relevancia práctica
Limitaciones
Se consideró específicamente la cilindrada del motor para predecir
el rendimiento de los autos, sin embargo, considero que se pudieron
incluir otras variables relevantes que permitan explicar mejor esta
variable.