📊 3.13. Ejercicio 4. PROBLEMA DE COMPARACIÓN DE MEDIAS - RENDIMIENTO DE GASOLINAS

PROBLEMA: ANÁLISIS COMPARATIVO DE GASOLINAS - PRUEBAS DE RENDIMIENTO

Comparación estadística de rendimiento promedio entre dos tipos de gasolina usando distribución normal

📝 ENUNCIADO DEL PROBLEMA

“Se prueba el rendimiento (km/l) de dos tipos de gasolina: la primera tiene desviación estándar σ₁ = 1.23 km/l y se prueba en 35 vehículos; la segunda tiene σ₂ = 1.37 km/l y se prueba en 42 vehículos.

a) ¿Cuál es la probabilidad de que la primera gasolina dé un rendimiento promedio mayor de 0.45 km/l que la segunda?
b) ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83 km/l a favor de la primera gasolina?”

📚 FUNDAMENTO TEÓRICO: DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS

📐 Teorema Central del Límite para Diferencia de Medias

Teorema:
Si se tienen dos poblaciones independientes con distribuciones:

\(X_1 \sim N(\mu_1, \sigma_1^2)\) y \(X_2 \sim N(\mu_2, \sigma_2^2)\)

Entonces la diferencia de medias muestrales:

\(\bar{X}_1 - \bar{X}_2 \sim N\left(\mu_1 - \mu_2, \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}\right)\)

Propiedades:
• La diferencia de medias sigue una distribución NORMAL EXACTA si las poblaciones son normales
• Aproximadamente normal para muestras grandes por TCL
• La varianza de la diferencia es la SUMA de las varianzas individuales

📈 Fundamento Matemático

Demostración de la varianza:

\(Var(\bar{X}_1 - \bar{X}_2) = Var(\bar{X}_1) + Var(\bar{X}_2) - 2Cov(\bar{X}_1, \bar{X}_2)\)

Como las muestras son independientes: \(Cov(\bar{X}_1, \bar{X}_2) = 0\)

\(Var(\bar{X}_1) = \frac{\sigma_1^2}{n_1}\)
\(Var(\bar{X}_2) = \frac{\sigma_2^2}{n_2}\)

\(Var(\bar{X}_1 - \bar{X}_2) = \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}\)

🔍 Estandarización y Uso de Tablas Normales

Variable tipificada (Z-score):

\(Z = \frac{(\bar{X}_1 - \bar{X}_2) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1)\)

Bajo H₀: μ₁ = μ₂

\(Z = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}\)

Cálculo de probabilidades:
\(P(D > d) = P(Z > \frac{d}{\sigma_D})\)
\(P(a < D < b) = P(\frac{a}{\sigma_D} < Z < \frac{b}{\sigma_D})\)

📊 Interpretación de Probabilidades

Significado de P(D > d):
• Probabilidad de observar una diferencia mayor a d
• Bajo el supuesto de igualdad de medias poblacionales
• Si es muy pequeña (<0.05), sugiere diferencia real

Relación con pruebas de hipótesis:
• p-valor = P(D > d_observado | H₀ verdadera)
• p-valor pequeño → evidencia contra H₀

Niveles de significancia comunes:
• p < 0.05: estadísticamente significativo
• p < 0.01: altamente significativo
• p < 0.001: extremadamente significativo

🧮 PARTE A: SOLUCIÓN PASO A PASO

Paso 1: Identificar parámetros y definir variables

Datos proporcionados:
• Gasolina 1: σ₁ = 1.23 km/l, n₁ = 35
• Gasolina 2: σ₂ = 1.37 km/l, n₂ = 42

Variables de interés:
\(\bar{X}_1\): Rendimiento promedio gasolina 1
\(\bar{X}_2\): Rendimiento promedio gasolina 2
• Diferencia: \(D = \bar{X}_1 - \bar{X}_2\)

Supuestos:
• Rendimientos siguen distribución normal
• Muestras independientes
• Varianzas poblacionales conocidas

Parte a: P(\(\bar{X}_1 - \bar{X}_2\) > 0.45)

📊 Paso 2: Distribución de la diferencia de medias

Teorema fundamental:
Si \(\bar{X}_1\) ~ N(μ₁, σ₁²/n₁)
y \(\bar{X}_2\) ~ N(μ₂, σ₂²/n₂)
independientes, entonces:

\(D = \bar{X}_1 - \bar{X}_2\) ~ N(μ₁-μ₂, σ_D²)

Varianza de la diferencia:
σ_D² = \(\frac{σ₁²}{n₁} + \frac{σ₂²}{n₂}\)

Suponiendo medias iguales (H₀):
μ₁ = μ₂ ⇒ μ_D = 0

Cálculo de σ_D²:
σ_D² = \(\frac{1.23²}{35} + \frac{1.37²}{42}\)
σ_D² = \(\frac{1.5129}{35} + \frac{1.8769}{42}\)

📈 Paso 3: Cálculo de varianza y desviación estándar

Cálculo detallado:
σ₁² = 1.23² = 1.5129
σ₂² = 1.37² = 1.8769

Término 1: σ₁²/n₁ = 1.5129/35
= 0.0432257

Término 2: σ₂²/n₂ = 1.8769/42
= 0.0446881

Varianza total:
σ_D² = 0.0432257 + 0.0446881
σ_D² = 0.0879138

Desviación estándar:
σ_D = √0.0879138
σ_D ≈ 0.2965

Distribución:
D ~ N(0, 0.0879138)

🎯 Paso 4: Estandarización y cálculo de probabilidad (parte a)

Parte a: P(D > 0.45)

Estandarización:
Z = \(\frac{D - μ_D}{σ_D}\)
Z = \(\frac{0.45 - 0}{0.2965}\)
Z = 0.45/0.2965

Cálculo exacto:
Z = 0.45/√0.0879138
Z = 0.45/0.296502
Z ≈ 1.5180

Probabilidad:
P(D > 0.45) = P(Z > 1.5180)
= 1 - P(Z < 1.5180)

Usando tabla normal:
P(Z < 1.51) = 0.93448
P(Z < 1.52) = 0.93574

Interpolación:
P(Z < 1.518) ≈ 0.9356

Resultado parte a:
P = 1 - 0.9356 = 0.0644
≈ 0.0644 (6.44%)

📊 PARTE B: SOLUCIÓN PASO A PASO

🎯 Paso 5: Planteamiento parte b

Parte b: P(0.65 < D < 0.83)

Interpretación:
“a favor de la primera gasolina”
significa \(\bar{X}_1 > \bar{X}_2\)
∴ D > 0 siempre

Distribución:
D ~ N(0, 0.0879138)
σ_D ≈ 0.2965

Probabilidad requerida:
P(0.65 < D < 0.83)

Estandarización para límites:
Z₁ = (0.65 - 0)/σ_D
Z₂ = (0.83 - 0)/σ_D

Relación con tabla normal:
P(a < D < b) = P(Z₁ < Z < Z₂)
= P(Z < Z₂) - P(Z < Z₁)

📈 Paso 6: Cálculo de Z-scores y probabilidad

Cálculo Z-scores:
Z₁ = 0.65/0.2965 ≈ 2.1922
Z₂ = 0.83/0.2965 ≈ 2.7993

Valores tabla normal:
P(Z < 2.19) = 0.98574
P(Z < 2.20) = 0.98610
P(Z < 2.79) = 0.99736
P(Z < 2.80) = 0.99744

Interpolación lineal:
P(Z < 2.192) ≈ 0.9858
P(Z < 2.799) ≈ 0.9974

Probabilidad:
P(0.65 < D < 0.83)
= P(2.192 < Z < 2.799)
= 0.9974 - 0.9858
= 0.0116

Resultado parte b:
P ≈ 0.0116 (1.16%)

🔍 Paso 7: Cálculos exactos con mayor precisión

Cálculo exacto σ_D²:
σ_D² = \(\frac{1.5129}{35} + \frac{1.8769}{42}\)
= 0.043225714 + 0.044688095
= 0.087913809

σ_D exacto:
σ_D = √0.087913809
= 0.296502631

Parte a exacta:
Z = 0.45/0.296502631
= 1.517698
P(Z > 1.517698) = 0.0646

Parte b exacta:
Z₁ = 0.65/0.296502631 = 2.1922
Z₂ = 0.83/0.296502631 = 2.7993
P = Φ(2.7993) - Φ(2.1922)
= 0.99744 - 0.98586
= 0.01158

📊 Paso 8: Interpretación en contexto aplicado

Interpretación parte a:
• Probabilidad 6.44%
• Significa: Si ambas gasolinas tienen
igual rendimiento promedio (μ₁=μ₂)
• Solo 6.44% de muestras mostrarían
diferencia >0.45 km/l
• Diferencia de 0.45 km/l sería poco común

Interpretación parte b:
• Probabilidad 1.16%
• Muy baja probabilidad
• Diferencia entre 0.65-0.83 km/l
sería muy inusual si μ₁=μ₂
• Sugeriría diferencia real si se observa

📚 RESUMEN DE RESULTADOS Y CONCEPTOS

📊 RESULTADO PARTE A

P(D > 0.45) = 0.0646

≈ 6.46%

Z-score: 1.518
Interpretación: Baja probabilidad

📈 RESULTADO PARTE B

P(0.65 < D < 0.83) = 0.0116

≈ 1.16%

Z₁: 2.192, Z₂: 2.799
Interpretación: Muy baja probabilidad

📋 CONCEPTOS ESTADÍSTICOS APLICADOS

Distribución Diferencia
D ~ N(μ₁-μ₂, σ₁²/n₁+σ₂²/n₂)

Estandarización
Z = (D - μ_D)/σ_D

Hipótesis Nula
Asume μ₁ = μ₂ ⇒ μ_D = 0

🧪 CÓDIGO EN R PARA LOS CÁLCULOS


# ============================================================
# COMPARACIÓN DE MEDIAS - RENDIMIENTO DE GASOLINAS
# Cálculo de probabilidades para diferencia de medias
# ============================================================

# Datos del problema
sigma1 <- 1.23  # desviación estándar gasolina 1
n1 <- 35        # tamaño muestra gasolina 1
sigma2 <- 1.37  # desviación estándar gasolina 2
n2 <- 42        # tamaño muestra gasolina 2

# Varianza de la diferencia
var_D <- sigma1^2/n1 + sigma2^2/n2
se_D <- sqrt(var_D)

cat("========================================\n")
cat("CÁLCULO DE PROBABILIDADES\n")
cat("========================================\n")
cat("Varianza de la diferencia:", var_D, "\n")
cat("Error estándar:", se_D, "\n\n")

# PARTE A: P(D > 0.45)
d_a <- 0.45
z_a <- d_a / se_D
p_a <- 1 - pnorm(z_a)

cat("PARTE A: P(D > 0.45)\n")
cat("Z =", z_a, "\n")
cat("P =", p_a, "\n")
cat("Probabilidad:", round(p_a * 100, 2), "%\n\n")

# PARTE B: P(0.65 < D < 0.83)
d1_b <- 0.65
d2_b <- 0.83
z1_b <- d1_b / se_D
z2_b <- d2_b / se_D
p_b <- pnorm(z2_b) - pnorm(z1_b)

cat("PARTE B: P(0.65 < D < 0.83)\n")
cat("Z1 =", z1_b, "\n")
cat("Z2 =", z2_b, "\n")
cat("P =", p_b, "\n")
cat("Probabilidad:", round(p_b * 100, 2), "%\n\n")

# Verificación con cálculos exactos
cat("========================================\n")
cat("CÁLCULOS EXACTOS\n")
cat("========================================\n")
var_D_exacta <- 1.23^2/35 + 1.37^2/42
se_D_exacto <- sqrt(var_D_exacta)
cat("Varianza exacta:", var_D_exacta, "\n")
cat("Error estándar exacto:", se_D_exacto, "\n\n")

z_a_exacto <- 0.45 / se_D_exacto
p_a_exacto <- 1 - pnorm(z_a_exacto)
cat("Parte a exacta:\n")
cat("Z =", z_a_exacto, "\n")
cat("P =", p_a_exacto, "\n\n")

z1_b_exacto <- 0.65 / se_D_exacto
z2_b_exacto <- 0.83 / se_D_exacto
p_b_exacto <- pnorm(z2_b_exacto) - pnorm(z1_b_exacto)
cat("Parte b exacta:\n")
cat("Z1 =", z1_b_exacto, "\n")
cat("Z2 =", z2_b_exacto, "\n")
cat("P =", p_b_exacto, "\n\n")

# Visualización de la distribución
x_vals <- seq(-4*se_D, 4*se_D, length.out = 1000)
y_vals <- dnorm(x_vals, mean = 0, sd = se_D)

plot(x_vals, y_vals, type = "l", col = "blue", lwd = 2,
     main = "Distribución de la Diferencia de Medias",
     xlab = "D = X̄₁ - X̄₂ (km/l)", ylab = "Densidad",
     cex.main = 1.2, cex.lab = 1.1)

# Sombreado para parte a
x_sombra_a <- seq(d_a, 4*se_D, length.out = 100)
y_sombra_a <- dnorm(x_sombra_a, mean = 0, sd = se_D)
polygon(c(d_a, x_sombra_a, 4*se_D), c(0, y_sombra_a, 0), 
        col = rgb(1, 0, 0, 0.3), border = NA)

# Sombreado para parte b
x_sombra_b <- seq(d1_b, d2_b, length.out = 100)
y_sombra_b <- dnorm(x_sombra_b, mean = 0, sd = se_D)
polygon(c(d1_b, x_sombra_b, d2_b), c(0, y_sombra_b, 0), 
        col = rgb(0, 1, 0, 0.3), border = NA)

abline(v = 0, col = "black", lty = 2, lwd = 1)
abline(v = d_a, col = "red", lty = 2, lwd = 2)
abline(v = c(d1_b, d2_b), col = "darkgreen", lty = 2, lwd = 2)

legend("topright", 
       legend = c("Distribución N(0, se)", 
                  "Parte a: P(D > 0.45)",
                  "Parte b: P(0.65 < D < 0.83)",
                  "Media (0)"),
       col = c("blue", "red", "green", "black"),
       lty = c(1, 1, 1, 2), lwd = c(2, NA, NA, 1),
       fill = c(NA, rgb(1,0,0,0.3), rgb(0,1,0,0.3), NA),
       border = c(NA, NA, NA, NA),
       merge = TRUE, bg = "white")

📊 INTERPRETACIÓN DE RESULTADOS CON R

📈 Salida del Código en R

========================================
CÁLCULO DE PROBABILIDADES
========================================
Varianza de la diferencia: 0.08791381 
Error estándar: 0.2965026 

PARTE A: P(D > 0.45)
Z = 1.517698 
P = 0.0646 
Probabilidad: 6.46 % 

PARTE B: P(0.65 < D < 0.83)
Z1 = 2.19223 
Z2 = 2.79929 
P = 0.01158 
Probabilidad: 1.16 % 

📋 Interpretación de la Visualización

Área roja (Parte a): Representa P(D > 0.45) = 6.46%. Es un área pequeña en la cola derecha de la distribución, indicando que diferencias superiores a 0.45 km/l son poco probables bajo H₀.

Área verde (Parte b): Representa P(0.65 < D < 0.83) = 1.16%. Es un área muy pequeña, indicando que diferencias en ese rango son extremadamente improbables si las medias son iguales.

Línea punteada vertical: Marca la media (0) y los puntos de corte para las probabilidades calculadas.

🎯 CONCLUSIÓN Y APLICACIÓN PRÁCTICA

Implicaciones para Pruebas de Gasolina

Parte a (6.46%): Si en pruebas reales se observa una diferencia mayor a 0.45 km/l, hay evidencia moderada (p=0.0646) contra la hipótesis de igual rendimiento. En investigación, esto podría considerarse “marginalmente significativo”.

Parte b (1.16%): Una diferencia entre 0.65-0.83 km/l sería muy inusual si las gasolinas fueran iguales. Esto proporcionaría evidencia más fuerte para concluir que la primera gasolina es realmente mejor.

📊 Recomendaciones para Diseño Experimental

  1. Tamaños muestrales: n₁=35 y n₂=42 son adecuados para detectar diferencias moderadas.
  2. Variabilidad: σ₁=1.23 y σ₂=1.37 indican alta variabilidad en rendimiento entre vehículos.
  3. Potencia estadística: Para detectar diferencias pequeñas (0.2-0.3 km/l) podrían necesitarse muestras mayores.
  4. Control experimental: Mismas condiciones de prueba para ambas gasolinas.

📝 Fórmulas Clave Utilizadas

Varianza de Diferencia:
σ_D² = σ₁²/n₁ + σ₂²/n₂
= 1.5129/35 + 1.8769/42
= 0.0879138

Estandarización:
Z = (D - μ_D)/σ_D
Parte a: Z = 0.45/0.2965
Parte b: Z₁ = 0.65/0.2965
Z₂ = 0.83/0.2965

RESULTADOS FINALES - COMPARACIÓN DE GASOLINAS

Parte a:
P(D > 0.45) = 0.0646
(6.46%)

Parte b:
P(0.65 < D < 0.83) = 0.0116
(1.16%)

Diferencia de Medias • Distribución Normal • Pruebas de Hipótesis • Análisis Comparativo