📊 3.13. Ejercicio 4. PROBLEMA DE COMPARACIÓN DE MEDIAS - RENDIMIENTO DE GASOLINAS

⛽ PROBLEMA: ANÁLISIS COMPARATIVO DE GASOLINAS - PRUEBAS DE RENDIMIENTO

Comparación estadística de rendimiento promedio entre dos tipos de gasolina usando distribución normal

📝 ENUNCIADO DEL PROBLEMA

“Se prueba el rendimiento (km/l) de dos tipos de gasolina: la primera tiene desviación estándar σ₁ = 1.23 km/l y se prueba en 35 vehículos; la segunda tiene σ₂ = 1.37 km/l y se prueba en 42 vehículos.

a) ¿Cuál es la probabilidad de que la primera gasolina dé un rendimiento promedio mayor de 0.45 km/l que la segunda?
b) ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83 km/l a favor de la primera gasolina?”

📚 FUNDAMENTO TEÓRICO: DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS

📐 Teorema Central del Límite para Diferencia de Medias

Teorema:
Si se tienen dos poblaciones independientes con distribuciones:

\(X_1 \sim N(\mu_1, \sigma_1^2)\) y \(X_2 \sim N(\mu_2, \sigma_2^2)\)

Entonces la diferencia de medias muestrales:

\(\bar{X}_1 - \bar{X}_2 \sim N\left(\mu_1 - \mu_2, \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}\right)\)

Propiedades:
• La diferencia de medias sigue una distribución NORMAL EXACTA si las poblaciones son normales
• Aproximadamente normal para muestras grandes por TCL
• La varianza de la diferencia es la SUMA de las varianzas individuales

📈 Fundamento Matemático

Demostración de la varianza:

\(Var(\bar{X}_1 - \bar{X}_2) = Var(\bar{X}_1) + Var(\bar{X}_2) - 2Cov(\bar{X}_1, \bar{X}_2)\)

Como las muestras son independientes: \(Cov(\bar{X}_1, \bar{X}_2) = 0\)

\(Var(\bar{X}_1) = \frac{\sigma_1^2}{n_1}\)
\(Var(\bar{X}_2) = \frac{\sigma_2^2}{n_2}\)

∴ \(Var(\bar{X}_1 - \bar{X}_2) = \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}\)

🔍 Estandarización y Uso de Tablas Normales

Variable tipificada (Z-score):

\(Z = \frac{(\bar{X}_1 - \bar{X}_2) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1)\)

Bajo H₀: μ₁ = μ₂

\(Z = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}\)

Cálculo de probabilidades:
• \(P(D > d) = P(Z > \frac{d}{\sigma_D})\)
• \(P(a < D < b) = P(\frac{a}{\sigma_D} < Z < \frac{b}{\sigma_D})\)

📊 Interpretación de Probabilidades

Significado de P(D > d):
• Probabilidad de observar una diferencia mayor a d
• Bajo el supuesto de igualdad de medias poblacionales
• Si es muy pequeña (<0.05), sugiere diferencia real

Relación con pruebas de hipótesis:
• p-valor = P(D > d_observado | H₀ verdadera)
• p-valor pequeño → evidencia contra H₀

Niveles de significancia comunes:
• p < 0.05: estadísticamente significativo
• p < 0.01: altamente significativo
• p < 0.001: extremadamente significativo

🧮 PARTE A: SOLUCIÓN PASO A PASO

⛽ Paso 1: Identificar parámetros y definir variables

Datos proporcionados:
• Gasolina 1: σ₁ = 1.23 km/l, n₁ = 35
• Gasolina 2: σ₂ = 1.37 km/l, n₂ = 42

Variables de interés:
• \(\bar{X}_1\): Rendimiento promedio gasolina 1
• \(\bar{X}_2\): Rendimiento promedio gasolina 2
• Diferencia: \(D = \bar{X}_1 - \bar{X}_2\)

Supuestos:
• Rendimientos siguen distribución normal
• Muestras independientes
• Varianzas poblacionales conocidas

Parte a: P(\(\bar{X}_1 - \bar{X}_2\) > 0.45)

📊 Paso 2: Distribución de la diferencia de medias

Teorema fundamental:
Si \(\bar{X}_1\) ~ N(μ₁, σ₁²/n₁)
y \(\bar{X}_2\) ~ N(μ₂, σ₂²/n₂)
independientes, entonces:

\(D = \bar{X}_1 - \bar{X}_2\) ~ N(μ₁-μ₂, σ_D²)

Varianza de la diferencia:
σ_D² = \(\frac{σ₁²}{n₁} + \frac{σ₂²}{n₂}\)

Suponiendo medias iguales (H₀):
μ₁ = μ₂ ⇒ μ_D = 0

Cálculo de σ_D²:
σ_D² = \(\frac{1.23²}{35} + \frac{1.37²}{42}\)
σ_D² = \(\frac{1.5129}{35} + \frac{1.8769}{42}\)

📈 Paso 3: Cálculo de varianza y desviación estándar

Cálculo detallado:
σ₁² = 1.23² = 1.5129
σ₂² = 1.37² = 1.8769

Término 1: σ₁²/n₁ = 1.5129/35
= 0.0432257

Término 2: σ₂²/n₂ = 1.8769/42
= 0.0446881

Varianza total:
σ_D² = 0.0432257 + 0.0446881
σ_D² = 0.0879138

Desviación estándar:
σ_D = √0.0879138
σ_D ≈ 0.2965

Distribución:
D ~ N(0, 0.0879138)

🎯 Paso 4: Estandarización y cálculo de probabilidad (parte a)

Parte a: P(D > 0.45)

Estandarización:
Z = \(\frac{D - μ_D}{σ_D}\)
Z = \(\frac{0.45 - 0}{0.2965}\)
Z = 0.45/0.2965

Cálculo exacto:
Z = 0.45/√0.0879138
Z = 0.45/0.296502
Z ≈ 1.5180

Probabilidad:
P(D > 0.45) = P(Z > 1.5180)
= 1 - P(Z < 1.5180)

Usando tabla normal:
P(Z < 1.51) = 0.93448
P(Z < 1.52) = 0.93574

Interpolación:
P(Z < 1.518) ≈ 0.9356

Resultado parte a:
P = 1 - 0.9356 = 0.0644
≈ 0.0644 (6.44%)

📊 PARTE B: SOLUCIÓN PASO A PASO

🎯 Paso 5: Planteamiento parte b

Parte b: P(0.65 < D < 0.83)

Interpretación:
“a favor de la primera gasolina”
significa \(\bar{X}_1 > \bar{X}_2\)
∴ D > 0 siempre

Distribución:
D ~ N(0, 0.0879138)
σ_D ≈ 0.2965

Probabilidad requerida:
P(0.65 < D < 0.83)

Estandarización para límites:
Z₁ = (0.65 - 0)/σ_D
Z₂ = (0.83 - 0)/σ_D

Relación con tabla normal:
P(a < D < b) = P(Z₁ < Z < Z₂)
= P(Z < Z₂) - P(Z < Z₁)

📈 Paso 6: Cálculo de Z-scores y probabilidad

Cálculo Z-scores:
Z₁ = 0.65/0.2965 ≈ 2.1922
Z₂ = 0.83/0.2965 ≈ 2.7993

Valores tabla normal:
P(Z < 2.19) = 0.98574
P(Z < 2.20) = 0.98610
P(Z < 2.79) = 0.99736
P(Z < 2.80) = 0.99744

Interpolación lineal:
P(Z < 2.192) ≈ 0.9858
P(Z < 2.799) ≈ 0.9974

Probabilidad:
P(0.65 < D < 0.83)
= P(2.192 < Z < 2.799)
= 0.9974 - 0.9858
= 0.0116

Resultado parte b:
P ≈ 0.0116 (1.16%)

🔍 Paso 7: Cálculos exactos con mayor precisión

Cálculo exacto σ_D²:
σ_D² = \(\frac{1.5129}{35} + \frac{1.8769}{42}\)
= 0.043225714 + 0.044688095
= 0.087913809

σ_D exacto:
σ_D = √0.087913809
= 0.296502631

Parte a exacta:
Z = 0.45/0.296502631
= 1.517698
P(Z > 1.517698) = 0.0646

Parte b exacta:
Z₁ = 0.65/0.296502631 = 2.1922
Z₂ = 0.83/0.296502631 = 2.7993
P = Φ(2.7993) - Φ(2.1922)
= 0.99744 - 0.98586
= 0.01158

📊 Paso 8: Interpretación en contexto aplicado

Interpretación parte a:
• Probabilidad 6.44%
• Significa: Si ambas gasolinas tienen
igual rendimiento promedio (μ₁=μ₂)
• Solo 6.44% de muestras mostrarían
diferencia >0.45 km/l
• Diferencia de 0.45 km/l sería poco común

Interpretación parte b:
• Probabilidad 1.16%
• Muy baja probabilidad
• Diferencia entre 0.65-0.83 km/l
sería muy inusual si μ₁=μ₂
• Sugeriría diferencia real si se observa

📚 RESUMEN DE RESULTADOS Y CONCEPTOS

📊 RESULTADO PARTE A

P(D > 0.45) = 0.0646

≈ 6.46%

Z-score: 1.518
Interpretación: Baja probabilidad

📈 RESULTADO PARTE B

P(0.65 < D < 0.83) = 0.0116

≈ 1.16%

Z₁: 2.192, Z₂: 2.799
Interpretación: Muy baja probabilidad

📋 CONCEPTOS ESTADÍSTICOS APLICADOS

Distribución Diferencia
D ~ N(μ₁-μ₂, σ₁²/n₁+σ₂²/n₂)

Estandarización
Z = (D - μ_D)/σ_D

Hipótesis Nula
Asume μ₁ = μ₂ ⇒ μ_D = 0

🧪 CÓDIGO EN R PARA LOS CÁLCULOS

# ============================================================ # COMPARACIÓN DE MEDIAS - RENDIMIENTO DE GASOLINAS # Cálculo de probabilidades para diferencia de medias # ============================================================ # Datos del problema sigma1 <- 1.23 # desviación estándar gasolina 1 n1 <- 35 # tamaño muestra gasolina 1 sigma2 <- 1.37 # desviación estándar gasolina 2 n2 <- 42 # tamaño muestra gasolina 2 # Varianza de la diferencia var_D <- sigma1^2/n1 + sigma2^2/n2 se_D <- sqrt(var_D) cat("========================================\n") cat("CÁLCULO DE PROBABILIDADES\n") cat("========================================\n") cat("Varianza de la diferencia:", var_D, "\n") cat("Error estándar:", se_D, "\n\n") # PARTE A: P(D > 0.45) d_a <- 0.45 z_a <- d_a / se_D p_a <- 1 - pnorm(z_a) cat("PARTE A: P(D > 0.45)\n") cat("Z =", z_a, "\n") cat("P =", p_a, "\n") cat("Probabilidad:", round(p_a * 100, 2), "%\n\n") # PARTE B: P(0.65 < D < 0.83) d1_b <- 0.65 d2_b <- 0.83 z1_b <- d1_b / se_D z2_b <- d2_b / se_D p_b <- pnorm(z2_b) - pnorm(z1_b) cat("PARTE B: P(0.65 < D < 0.83)\n") cat("Z1 =", z1_b, "\n") cat("Z2 =", z2_b, "\n") cat("P =", p_b, "\n") cat("Probabilidad:", round(p_b * 100, 2), "%\n\n") # Verificación con cálculos exactos cat("========================================\n") cat("CÁLCULOS EXACTOS\n") cat("========================================\n") var_D_exacta <- 1.23^2/35 + 1.37^2/42 se_D_exacto <- sqrt(var_D_exacta) cat("Varianza exacta:", var_D_exacta, "\n") cat("Error estándar exacto:", se_D_exacto, "\n\n") z_a_exacto <- 0.45 / se_D_exacto p_a_exacto <- 1 - pnorm(z_a_exacto) cat("Parte a exacta:\n") cat("Z =", z_a_exacto, "\n") cat("P =", p_a_exacto, "\n\n") z1_b_exacto <- 0.65 / se_D_exacto z2_b_exacto <- 0.83 / se_D_exacto p_b_exacto <- pnorm(z2_b_exacto) - pnorm(z1_b_exacto) cat("Parte b exacta:\n") cat("Z1 =", z1_b_exacto, "\n") cat("Z2 =", z2_b_exacto, "\n") cat("P =", p_b_exacto, "\n\n") # Visualización de la distribución x_vals <- seq(-4*se_D, 4*se_D, length.out = 1000) y_vals <- dnorm(x_vals, mean = 0, sd = se_D) plot(x_vals, y_vals, type = "l", col = "blue", lwd = 2, main = "Distribución de la Diferencia de Medias", xlab = "D = X̄₁ - X̄₂ (km/l)", ylab = "Densidad", cex.main = 1.2, cex.lab = 1.1) # Sombreado para parte a x_sombra_a <- seq(d_a, 4*se_D, length.out = 100) y_sombra_a <- dnorm(x_sombra_a, mean = 0, sd = se_D) polygon(c(d_a, x_sombra_a, 4*se_D), c(0, y_sombra_a, 0), col = rgb(1, 0, 0, 0.3), border = NA) # Sombreado para parte b x_sombra_b <- seq(d1_b, d2_b, length.out = 100) y_sombra_b <- dnorm(x_sombra_b, mean = 0, sd = se_D) polygon(c(d1_b, x_sombra_b, d2_b), c(0, y_sombra_b, 0), col = rgb(0, 1, 0, 0.3), border = NA) abline(v = 0, col = "black", lty = 2, lwd = 1) abline(v = d_a, col = "red", lty = 2, lwd = 2) abline(v = c(d1_b, d2_b), col = "darkgreen", lty = 2, lwd = 2) legend("topright", legend = c("Distribución N(0, se)", "Parte a: P(D > 0.45)", "Parte b: P(0.65 < D < 0.83)", "Media (0)"), col = c("blue", "red", "green", "black"), lty = c(1, 1, 1, 2), lwd = c(2, NA, NA, 1), fill = c(NA, rgb(1,0,0,0.3), rgb(0,1,0,0.3), NA), border = c(NA, NA, NA, NA), merge = TRUE, bg = "white")

📊 INTERPRETACIÓN DE RESULTADOS CON R

📈 Salida del Código en R

======================================== CÁLCULO DE PROBABILIDADES ======================================== Varianza de la diferencia: 0.08791381 Error estándar: 0.2965026 PARTE A: P(D > 0.45) Z = 1.517698 P = 0.0646 Probabilidad: 6.46 % PARTE B: P(0.65 < D < 0.83) Z1 = 2.19223 Z2 = 2.79929 P = 0.01158 Probabilidad: 1.16 %

📋 Interpretación de la Visualización

Área roja (Parte a): Representa P(D > 0.45) = 6.46%. Es un área pequeña en la cola derecha de la distribución, indicando que diferencias superiores a 0.45 km/l son poco probables bajo H₀.

Área verde (Parte b): Representa P(0.65 < D < 0.83) = 1.16%. Es un área muy pequeña, indicando que diferencias en ese rango son extremadamente improbables si las medias son iguales.

Línea punteada vertical: Marca la media (0) y los puntos de corte para las probabilidades calculadas.

🎯 CONCLUSIÓN Y APLICACIÓN PRÁCTICA

⚡ Implicaciones para Pruebas de Gasolina

Parte a (6.46%): Si en pruebas reales se observa una diferencia mayor a 0.45 km/l, hay evidencia moderada (p=0.0646) contra la hipótesis de igual rendimiento. En investigación, esto podría considerarse “marginalmente significativo”.

Parte b (1.16%): Una diferencia entre 0.65-0.83 km/l sería muy inusual si las gasolinas fueran iguales. Esto proporcionaría evidencia más fuerte para concluir que la primera gasolina es realmente mejor.

📊 Recomendaciones para Diseño Experimental

Tamaños muestrales: n₁=35 y n₂=42 son adecuados para detectar diferencias moderadas.

Variabilidad: σ₁=1.23 y σ₂=1.37 indican alta variabilidad en rendimiento entre vehículos.

Potencia estadística: Para detectar diferencias pequeñas (0.2-0.3 km/l) podrían necesitarse muestras mayores.

Control experimental: Mismas condiciones de prueba para ambas gasolinas.

📝 Fórmulas Clave Utilizadas

Varianza de Diferencia:
σ_D² = σ₁²/n₁ + σ₂²/n₂
= 1.5129/35 + 1.8769/42
= 0.0879138

Estandarización:
Z = (D - μ_D)/σ_D
Parte a: Z = 0.45/0.2965
Parte b: Z₁ = 0.65/0.2965
Z₂ = 0.83/0.2965

⛽ RESULTADOS FINALES - COMPARACIÓN DE GASOLINAS

Parte a:
P(D > 0.45) = 0.0646
(6.46%)

Parte b:
P(0.65 < D < 0.83) = 0.0116
(1.16%)

Diferencia de Medias • Distribución Normal • Pruebas de Hipótesis • Análisis Comparativo

DOSPOBLACIONES

Julio Hurtado Marquez

2026-02-27

📊 3.13. Ejercicio 4. PROBLEMA DE COMPARACIÓN DE MEDIAS - RENDIMIENTO DE GASOLINAS

⛽ PROBLEMA: ANÁLISIS COMPARATIVO DE GASOLINAS - PRUEBAS DE RENDIMIENTO

📝 ENUNCIADO DEL PROBLEMA

📚 FUNDAMENTO TEÓRICO: DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS

📐 Teorema Central del Límite para Diferencia de Medias

📈 Fundamento Matemático

🔍 Estandarización y Uso de Tablas Normales

📊 Interpretación de Probabilidades

🧮 PARTE A: SOLUCIÓN PASO A PASO

⛽ Paso 1: Identificar parámetros y definir variables

📊 Paso 2: Distribución de la diferencia de medias

📈 Paso 3: Cálculo de varianza y desviación estándar

🎯 Paso 4: Estandarización y cálculo de probabilidad (parte a)

📊 PARTE B: SOLUCIÓN PASO A PASO

🎯 Paso 5: Planteamiento parte b

📈 Paso 6: Cálculo de Z-scores y probabilidad

🔍 Paso 7: Cálculos exactos con mayor precisión

📊 Paso 8: Interpretación en contexto aplicado

📚 RESUMEN DE RESULTADOS Y CONCEPTOS

📊 RESULTADO PARTE A

📈 RESULTADO PARTE B

📋 CONCEPTOS ESTADÍSTICOS APLICADOS

🧪 CÓDIGO EN R PARA LOS CÁLCULOS

📊 INTERPRETACIÓN DE RESULTADOS CON R

📈 Salida del Código en R

📋 Interpretación de la Visualización

🎯 CONCLUSIÓN Y APLICACIÓN PRÁCTICA

⚡ Implicaciones para Pruebas de Gasolina

📊 Recomendaciones para Diseño Experimental

📝 Fórmulas Clave Utilizadas