Comparación estadística de rendimiento promedio entre dos tipos de gasolina usando distribución normal
“Se prueba el rendimiento (km/l) de dos tipos de gasolina: la primera
tiene desviación estándar σ₁ = 1.23 km/l y se prueba en 35 vehículos; la
segunda tiene σ₂ = 1.37 km/l y se prueba en 42 vehículos.
a)
¿Cuál es la probabilidad de que la primera gasolina dé un rendimiento
promedio mayor de 0.45 km/l que la segunda?
b) ¿Cuál es la
probabilidad de que la diferencia en rendimientos promedio se encuentre
entre 0.65 y 0.83 km/l a favor de la primera gasolina?”
Teorema:
Si se tienen dos poblaciones
independientes con distribuciones:
\(X_1 \sim N(\mu_1, \sigma_1^2)\) y \(X_2 \sim N(\mu_2, \sigma_2^2)\)
Entonces la diferencia de medias muestrales:
\(\bar{X}_1 - \bar{X}_2 \sim N\left(\mu_1 - \mu_2,
\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}\right)\)
Propiedades:
• La diferencia de medias sigue una
distribución NORMAL EXACTA si las poblaciones son normales
•
Aproximadamente normal para muestras grandes por TCL
• La varianza
de la diferencia es la SUMA de las varianzas individuales
Demostración de la varianza:
\(Var(\bar{X}_1 - \bar{X}_2) = Var(\bar{X}_1) +
Var(\bar{X}_2) - 2Cov(\bar{X}_1, \bar{X}_2)\)
Como las
muestras son independientes: \(Cov(\bar{X}_1,
\bar{X}_2) = 0\)
\(Var(\bar{X}_1) =
\frac{\sigma_1^2}{n_1}\)
\(Var(\bar{X}_2) =
\frac{\sigma_2^2}{n_2}\)
∴ \(Var(\bar{X}_1 - \bar{X}_2) =
\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}\)
Variable tipificada (Z-score):
\(Z = \frac{(\bar{X}_1 - \bar{X}_2) - (\mu_1 -
\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim
N(0,1)\)
Bajo H₀: μ₁ = μ₂
\(Z = \frac{\bar{X}_1 -
\bar{X}_2}{\sqrt{\frac{\sigma_1^2}{n_1} +
\frac{\sigma_2^2}{n_2}}}\)
Cálculo de
probabilidades:
• \(P(D > d) =
P(Z > \frac{d}{\sigma_D})\)
• \(P(a < D < b) = P(\frac{a}{\sigma_D} < Z
< \frac{b}{\sigma_D})\)
Significado de P(D > d):
• Probabilidad de
observar una diferencia mayor a d
• Bajo el supuesto de igualdad de
medias poblacionales
• Si es muy pequeña (<0.05), sugiere
diferencia real
Relación con pruebas de
hipótesis:
• p-valor = P(D > d_observado | H₀
verdadera)
• p-valor pequeño → evidencia contra H₀
Niveles de significancia comunes:
• p < 0.05:
estadísticamente significativo
• p < 0.01: altamente
significativo
• p < 0.001: extremadamente significativo
Datos proporcionados:
• Gasolina 1: σ₁ = 1.23 km/l,
n₁ = 35
• Gasolina 2: σ₂ = 1.37 km/l, n₂ = 42
Variables de interés:
• \(\bar{X}_1\): Rendimiento promedio gasolina
1
• \(\bar{X}_2\): Rendimiento
promedio gasolina 2
• Diferencia: \(D =
\bar{X}_1 - \bar{X}_2\)
Supuestos:
• Rendimientos siguen distribución normal
• Muestras
independientes
• Varianzas poblacionales conocidas
Parte a: P(\(\bar{X}_1 -
\bar{X}_2\) > 0.45)
Teorema fundamental:
Si \(\bar{X}_1\) ~ N(μ₁, σ₁²/n₁)
y \(\bar{X}_2\) ~ N(μ₂, σ₂²/n₂)
independientes, entonces:
\(D =
\bar{X}_1 - \bar{X}_2\) ~ N(μ₁-μ₂, σ_D²)
Varianza de la diferencia:
σ_D² = \(\frac{σ₁²}{n₁} + \frac{σ₂²}{n₂}\)
Suponiendo medias iguales (H₀):
μ₁ = μ₂ ⇒ μ_D =
0
Cálculo de σ_D²:
σ_D² = \(\frac{1.23²}{35} + \frac{1.37²}{42}\)
σ_D² = \(\frac{1.5129}{35} +
\frac{1.8769}{42}\)
Cálculo detallado:
σ₁² = 1.23² = 1.5129
σ₂² =
1.37² = 1.8769
Término 1: σ₁²/n₁ =
1.5129/35
= 0.0432257
Término 2: σ₂²/n₂ =
1.8769/42
= 0.0446881
Varianza total:
σ_D² = 0.0432257 + 0.0446881
σ_D² = 0.0879138
Desviación estándar:
σ_D = √0.0879138
σ_D ≈
0.2965
Distribución:
D ~ N(0, 0.0879138)
Parte a: P(D > 0.45)
Estandarización:
Z = \(\frac{D - μ_D}{σ_D}\)
Z = \(\frac{0.45 - 0}{0.2965}\)
Z =
0.45/0.2965
Cálculo exacto:
Z =
0.45/√0.0879138
Z = 0.45/0.296502
Z ≈ 1.5180
Probabilidad:
P(D > 0.45) = P(Z > 1.5180)
= 1 - P(Z < 1.5180)
Usando tabla
normal:
P(Z < 1.51) = 0.93448
P(Z < 1.52) =
0.93574
Interpolación:
P(Z < 1.518) ≈
0.9356
Resultado parte a:
P = 1 - 0.9356 =
0.0644
≈ 0.0644 (6.44%)
Parte b: P(0.65 < D < 0.83)
Interpretación:
“a favor de la primera
gasolina”
significa \(\bar{X}_1 >
\bar{X}_2\)
∴ D > 0 siempre
Distribución:
D ~ N(0, 0.0879138)
σ_D ≈
0.2965
Probabilidad requerida:
P(0.65 <
D < 0.83)
Estandarización para límites:
Z₁ = (0.65 - 0)/σ_D
Z₂ = (0.83 - 0)/σ_D
Relación
con tabla normal:
P(a < D < b) = P(Z₁ < Z <
Z₂)
= P(Z < Z₂) - P(Z < Z₁)
Cálculo Z-scores:
Z₁ = 0.65/0.2965 ≈ 2.1922
Z₂
= 0.83/0.2965 ≈ 2.7993
Valores tabla
normal:
P(Z < 2.19) = 0.98574
P(Z < 2.20) =
0.98610
P(Z < 2.79) = 0.99736
P(Z < 2.80) = 0.99744
Interpolación lineal:
P(Z < 2.192) ≈
0.9858
P(Z < 2.799) ≈ 0.9974
Probabilidad:
P(0.65 < D < 0.83)
=
P(2.192 < Z < 2.799)
= 0.9974 - 0.9858
= 0.0116
Resultado parte b:
P ≈ 0.0116 (1.16%)
Cálculo exacto σ_D²:
σ_D² = \(\frac{1.5129}{35} + \frac{1.8769}{42}\)
= 0.043225714 + 0.044688095
= 0.087913809
σ_D
exacto:
σ_D = √0.087913809
= 0.296502631
Parte a exacta:
Z = 0.45/0.296502631
=
1.517698
P(Z > 1.517698) = 0.0646
Parte b
exacta:
Z₁ = 0.65/0.296502631 = 2.1922
Z₂ =
0.83/0.296502631 = 2.7993
P = Φ(2.7993) - Φ(2.1922)
= 0.99744 -
0.98586
= 0.01158
Interpretación parte a:
• Probabilidad 6.44%
•
Significa: Si ambas gasolinas tienen
igual rendimiento promedio
(μ₁=μ₂)
• Solo 6.44% de muestras mostrarían
diferencia >0.45
km/l
• Diferencia de 0.45 km/l sería poco común
Interpretación parte b:
• Probabilidad 1.16%
•
Muy baja probabilidad
• Diferencia entre 0.65-0.83 km/l
sería
muy inusual si μ₁=μ₂
• Sugeriría diferencia real si se observa
P(D > 0.45) = 0.0646
≈ 6.46%
Z-score: 1.518
Interpretación: Baja probabilidad
P(0.65 < D < 0.83) = 0.0116
≈ 1.16%
Z₁: 2.192, Z₂: 2.799
Interpretación: Muy baja probabilidad
Distribución Diferencia
D ~ N(μ₁-μ₂, σ₁²/n₁+σ₂²/n₂)
Estandarización
Z = (D - μ_D)/σ_D
Hipótesis Nula
Asume μ₁ = μ₂ ⇒ μ_D = 0
# ============================================================
# COMPARACIÓN DE MEDIAS - RENDIMIENTO DE GASOLINAS
# Cálculo de probabilidades para diferencia de medias
# ============================================================
# Datos del problema
sigma1 <- 1.23 # desviación estándar gasolina 1
n1 <- 35 # tamaño muestra gasolina 1
sigma2 <- 1.37 # desviación estándar gasolina 2
n2 <- 42 # tamaño muestra gasolina 2
# Varianza de la diferencia
var_D <- sigma1^2/n1 + sigma2^2/n2
se_D <- sqrt(var_D)
cat("========================================\n")
cat("CÁLCULO DE PROBABILIDADES\n")
cat("========================================\n")
cat("Varianza de la diferencia:", var_D, "\n")
cat("Error estándar:", se_D, "\n\n")
# PARTE A: P(D > 0.45)
d_a <- 0.45
z_a <- d_a / se_D
p_a <- 1 - pnorm(z_a)
cat("PARTE A: P(D > 0.45)\n")
cat("Z =", z_a, "\n")
cat("P =", p_a, "\n")
cat("Probabilidad:", round(p_a * 100, 2), "%\n\n")
# PARTE B: P(0.65 < D < 0.83)
d1_b <- 0.65
d2_b <- 0.83
z1_b <- d1_b / se_D
z2_b <- d2_b / se_D
p_b <- pnorm(z2_b) - pnorm(z1_b)
cat("PARTE B: P(0.65 < D < 0.83)\n")
cat("Z1 =", z1_b, "\n")
cat("Z2 =", z2_b, "\n")
cat("P =", p_b, "\n")
cat("Probabilidad:", round(p_b * 100, 2), "%\n\n")
# Verificación con cálculos exactos
cat("========================================\n")
cat("CÁLCULOS EXACTOS\n")
cat("========================================\n")
var_D_exacta <- 1.23^2/35 + 1.37^2/42
se_D_exacto <- sqrt(var_D_exacta)
cat("Varianza exacta:", var_D_exacta, "\n")
cat("Error estándar exacto:", se_D_exacto, "\n\n")
z_a_exacto <- 0.45 / se_D_exacto
p_a_exacto <- 1 - pnorm(z_a_exacto)
cat("Parte a exacta:\n")
cat("Z =", z_a_exacto, "\n")
cat("P =", p_a_exacto, "\n\n")
z1_b_exacto <- 0.65 / se_D_exacto
z2_b_exacto <- 0.83 / se_D_exacto
p_b_exacto <- pnorm(z2_b_exacto) - pnorm(z1_b_exacto)
cat("Parte b exacta:\n")
cat("Z1 =", z1_b_exacto, "\n")
cat("Z2 =", z2_b_exacto, "\n")
cat("P =", p_b_exacto, "\n\n")
# Visualización de la distribución
x_vals <- seq(-4*se_D, 4*se_D, length.out = 1000)
y_vals <- dnorm(x_vals, mean = 0, sd = se_D)
plot(x_vals, y_vals, type = "l", col = "blue", lwd = 2,
main = "Distribución de la Diferencia de Medias",
xlab = "D = X̄₁ - X̄₂ (km/l)", ylab = "Densidad",
cex.main = 1.2, cex.lab = 1.1)
# Sombreado para parte a
x_sombra_a <- seq(d_a, 4*se_D, length.out = 100)
y_sombra_a <- dnorm(x_sombra_a, mean = 0, sd = se_D)
polygon(c(d_a, x_sombra_a, 4*se_D), c(0, y_sombra_a, 0),
col = rgb(1, 0, 0, 0.3), border = NA)
# Sombreado para parte b
x_sombra_b <- seq(d1_b, d2_b, length.out = 100)
y_sombra_b <- dnorm(x_sombra_b, mean = 0, sd = se_D)
polygon(c(d1_b, x_sombra_b, d2_b), c(0, y_sombra_b, 0),
col = rgb(0, 1, 0, 0.3), border = NA)
abline(v = 0, col = "black", lty = 2, lwd = 1)
abline(v = d_a, col = "red", lty = 2, lwd = 2)
abline(v = c(d1_b, d2_b), col = "darkgreen", lty = 2, lwd = 2)
legend("topright",
legend = c("Distribución N(0, se)",
"Parte a: P(D > 0.45)",
"Parte b: P(0.65 < D < 0.83)",
"Media (0)"),
col = c("blue", "red", "green", "black"),
lty = c(1, 1, 1, 2), lwd = c(2, NA, NA, 1),
fill = c(NA, rgb(1,0,0,0.3), rgb(0,1,0,0.3), NA),
border = c(NA, NA, NA, NA),
merge = TRUE, bg = "white")
======================================== CÁLCULO DE PROBABILIDADES ======================================== Varianza de la diferencia: 0.08791381 Error estándar: 0.2965026 PARTE A: P(D > 0.45) Z = 1.517698 P = 0.0646 Probabilidad: 6.46 % PARTE B: P(0.65 < D < 0.83) Z1 = 2.19223 Z2 = 2.79929 P = 0.01158 Probabilidad: 1.16 %
Área roja (Parte a): Representa P(D > 0.45) = 6.46%.
Es un área pequeña en la cola derecha de la distribución, indicando que
diferencias superiores a 0.45 km/l son poco probables bajo H₀.
Área verde (Parte b): Representa P(0.65 < D <
0.83) = 1.16%. Es un área muy pequeña, indicando que diferencias en ese
rango son extremadamente improbables si las medias son iguales.
Línea punteada vertical: Marca la media (0) y los
puntos de corte para las probabilidades calculadas.
Parte a (6.46%): Si en pruebas reales se observa una
diferencia mayor a 0.45 km/l, hay evidencia moderada (p=0.0646) contra
la hipótesis de igual rendimiento. En investigación, esto podría
considerarse “marginalmente significativo”.
Parte b
(1.16%): Una diferencia entre 0.65-0.83 km/l sería muy inusual
si las gasolinas fueran iguales. Esto proporcionaría evidencia más
fuerte para concluir que la primera gasolina es realmente mejor.
Varianza de Diferencia:
σ_D² = σ₁²/n₁ + σ₂²/n₂
= 1.5129/35 + 1.8769/42
= 0.0879138
Estandarización:
Z = (D - μ_D)/σ_D
Parte a: Z =
0.45/0.2965
Parte b: Z₁ = 0.65/0.2965
Z₂ = 0.83/0.2965
⛽ RESULTADOS FINALES - COMPARACIÓN DE GASOLINAS
Parte a:
P(D > 0.45) = 0.0646
(6.46%)
Parte b:
P(0.65 < D < 0.83) = 0.0116
(1.16%)
Diferencia de Medias • Distribución Normal • Pruebas de Hipótesis • Análisis Comparativo