Resumen ejecutivo

En esta muestra, los vehĆ­culos manuales presentan mayor MPG que los automĆ”ticos. Ajustando por peso y desempeƱo (wt, qsec), la diferencia estimada es de ~3 MPG a favor de manual (IC 95% ~1–5). Conjunto pequeƱo (n=32): evidencia exploratoria.

Datos y mƩtodo

Usamos mtcars (R base). Resultado: mpg. Exposición: am (0=AutomÔtico, 1=Manual). Posibles confusores: wt (1000 lb), qsec (¼ de milla).

AnƔlisis exploratorio

Primero comparamos medias de MPG por tipo de transmisión.

df |>
group_by(am) |>
summarise(
n = n(),
mpg_media = mean(mpg),
mpg_sd = sd(mpg)
)
## # A tibble: 2 Ɨ 4
##   am            n mpg_media mpg_sd
##   <fct>     <int>     <dbl>  <dbl>
## 1 Automatic    19      17.1   3.83
## 2 Manual       13      24.4   6.17

Lectura rÔpida: la media de MPG es mayor en Manual que en AutomÔtica. Esta comparación es descriptiva y puede estar afectada por confusión.

Modelos de regresión

Modelo 1: diferencia cruda (solo transmisión)

m1 <- lm(mpg ~ am, data = df)
summary(m1)
## 
## Call:
## lm(formula = mpg ~ am, data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -9.3923 -3.0923 -0.2974  3.2439  9.5077 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   17.147      1.125  15.247 1.13e-15 ***
## amManual       7.245      1.764   4.106 0.000285 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.902 on 30 degrees of freedom
## Multiple R-squared:  0.3598, Adjusted R-squared:  0.3385 
## F-statistic: 16.86 on 1 and 30 DF,  p-value: 0.000285
confint(m1)
##                2.5 %   97.5 %
## (Intercept) 14.85062 19.44411
## amManual     3.64151 10.84837

Se ajustó un modelo de regresión lineal simple para evaluar la relación entre el tipo de transmisión y el consumo de combustible (MPG), tomando como categoría de referencia la transmisión automÔtica.

El intercepto del modelo (17.15 MPG) representa el consumo promedio estimado para los vehículos con transmisión automÔtica. El coeficiente asociado a la transmisión manual es de 7.25 MPG, lo que indica que, en promedio, los vehículos manuales consumen 7.25 millas por galón mÔs que los automÔticos.

Este efecto es estadísticamente significativo (t = 4.11, p = 0.000285). El intervalo de confianza al 95% para la diferencia entre transmisiones se encuentra entre 3.64 y 10.85 MPG, lo que refuerza la evidencia de una diferencia real y positiva a favor de la transmisión manual.

El modelo explica aproximadamente el 36% de la variabilidad total del MPG (R² = 0.36), lo cual es razonable considerando que solo incluye un predictor. El estadístico F (16.86, p < 0.001) confirma que el tipo de transmisión es un predictor significativo del consumo de combustible.

Modelo 2: Modelo ajustado por peso y desempeƱo

Para aislar el efecto de la transmisión, se ajusta un modelo que controla por el peso del vehículo (wt) y el tiempo en el cuarto de milla (qsec).

modelo_2 <- lm(mpg ~ am + wt + qsec, data = df)
summary(modelo_2)
## 
## Call:
## lm(formula = mpg ~ am + wt + qsec, data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.4811 -1.5555 -0.7257  1.4110  4.6610 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   9.6178     6.9596   1.382 0.177915    
## amManual      2.9358     1.4109   2.081 0.046716 *  
## wt           -3.9165     0.7112  -5.507 6.95e-06 ***
## qsec          1.2259     0.2887   4.247 0.000216 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.459 on 28 degrees of freedom
## Multiple R-squared:  0.8497, Adjusted R-squared:  0.8336 
## F-statistic: 52.75 on 3 and 28 DF,  p-value: 1.21e-11
confint(modelo_2)
##                   2.5 %    97.5 %
## (Intercept) -4.63829946 23.873860
## amManual     0.04573031  5.825944
## wt          -5.37333423 -2.459673
## qsec         0.63457320  1.817199

Se ajustó un modelo de regresión lineal múltiple para evaluar el efecto del tipo de transmisión sobre el consumo de combustible (MPG), controlando por el peso del vehículo (wt) y una medida de desempeño asociada a la aceleración (qsec).

El coeficiente asociado a la transmisión manual es de 2.94 MPG, lo que indica que, manteniendo constantes el peso y el desempeño del vehículo, los autos con transmisión manual presentan en promedio 2.94 millas por galón mÔs que los automÔticos. Este efecto resulta estadísticamente significativo al nivel del 5% (p = 0.0467). El intervalo de confianza al 95% para esta diferencia se extiende desde 0.05 hasta 5.83 MPG, lo que sugiere una ventaja positiva, aunque moderada, a favor de la transmisión manual.

El peso del vehículo (wt) muestra un efecto negativo y altamente significativo sobre el consumo, con una disminución estimada de 3.92 MPG por cada 1000 libras adicionales, confirmando que el peso es uno de los principales determinantes del rendimiento de combustible. Por su parte, qsec presenta un coeficiente positivo (1.23 MPG), indicando que vehículos con mayor tiempo en el cuarto de milla (menor aceleración) tienden a ser mÔs eficientes en términos de consumo.

El modelo explica aproximadamente el 85% de la variabilidad total del MPG (R² = 0.85), lo que representa una mejora sustancial respecto al modelo no ajustado. El estadístico F global (F = 52.75, p < 0.001) confirma que el conjunto de predictores incluidos proporciona una explicación significativa del consumo de combustible.

En conjunto, estos resultados muestran que la diferencia observada inicialmente entre transmisiones automÔticas y manuales se reduce considerablemente al controlar por características clave del vehículo. No obstante, incluso tras el ajuste, la transmisión manual conserva una ventaja estadísticamente significativa en términos de MPG, aunque de menor magnitud que la estimada en el anÔlisis exploratorio inicial.

Comparación de modelos

Se evalúa si la inclusión del tipo de transmisión mejora significativamente el modelo respecto a uno que solo incluye peso y desempeño.

modelo_base <- lm(mpg ~ wt + qsec, data = df)
anova(modelo_base, modelo_2)
## Analysis of Variance Table
## 
## Model 1: mpg ~ wt + qsec
## Model 2: mpg ~ am + wt + qsec
##   Res.Df    RSS Df Sum of Sq      F  Pr(>F)  
## 1     29 195.46                              
## 2     28 169.29  1    26.178 4.3298 0.04672 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Para evaluar si el tipo de transmisión aporta información adicional una vez controlados el peso del vehículo y el desempeño, se comparó un modelo base (mpg ~ wt + qsec) con un modelo extendido que incorpora la transmisión (mpg ~ am + wt + qsec), mediante un anÔlisis de varianza (ANOVA).

La inclusión de la variable transmisión reduce la suma de cuadrados residual de 195.46 a 169.29, lo que representa una disminución de 26.18 unidades de variabilidad no explicada del consumo de combustible. Este cambio resulta estadísticamente significativo (F = 4.33, p = 0.0467).

Este resultado indica que, incluso después de controlar por peso y desempeño, el tipo de transmisión explica una fracción adicional y significativa de la variabilidad del MPG. En consecuencia, la transmisión no solo estÔ asociada indirectamente al consumo a través de otras características del vehículo, sino que mantiene un efecto propio sobre el rendimiento de combustible.

ApĆ©ndice — Figuras

ggplot(df, aes(x = am, y = mpg)) +
geom_boxplot() +
labs(x = "Tipo de transmisión", y = "MPG")

ggplot(df, aes(x = wt, y = mpg, shape = am)) +
geom_point(size = 2.2) +
geom_smooth(method = "lm", se = FALSE) +
labs(x = "Peso (wt)", y = "MPG", shape = "Transmisión")

par(mfrow = c(2, 2))
plot(modelo_2)

par(mfrow = c(1, 1))