Cálculo de probabilidad para la media muestral de incrementos salariales
“Supongamos que el incremento porcentual de los salarios de los funcionarios de todas las corporaciones medianas se distribuye siguiendo una normal con media 12,2% y desviación típica 3,6%. Si se toma una muestra aleatoria de nueve observaciones de esta población según los incrementos porcentuales de salario, ¿cuál es la probabilidad de que la media muestral sea mayor del 10%?”
Parámetros poblacionales:
• Media poblacional (μ) =
12.2%
• Desviación típica poblacional (σ) = 3.6%
• La población
se distribuye normal
Parámetros
muestrales:
• Tamaño de la muestra (n) = 9
• Media
muestral (x̄) es variable aleatoria
• Se pide P(x̄ > 10%)
Distribución de la media muestral:
• Como la
población es normal, la media muestral también sigue una distribución
normal
• Media de la distribución muestral: μx̄ = μ =
12.2%
• Error estándar: σx̄ = σ / √n
Cálculo del error estándar:
σx̄ = 3.6% /
√9
= 3.6% / 3
= 1.2%
Por lo tanto: x̄ ~
N(μ = 12.2%, σ = 1.2%)
Fórmula del estadístico Z:
Z = (x̄ - μx̄)
/ σx̄
Para x̄ = 10%:
Z = (10% -
12.2%) / 1.2%
= (-2.2%) / 1.2%
= -1.8333
Interpretación:
El valor 10% está 1.8333
desviaciones estándar
por debajo de la media de la distribución
muestral.
Se pide P(x̄ > 10%) = P(Z > -1.8333)
Por
simetría de la distribución normal:
P(Z > -1.8333) = P(Z <
1.8333)
Usando tabla normal estándar:
•
Para Z = 1.83 → área acumulada ≈ 0.9664
• Para Z = 1.84 → área
acumulada ≈ 0.9671
Interpolación lineal para Z =
1.8333:
Diferencia = 1.8333 - 1.83 = 0.0033
Rango entre
1.83 y 1.84 = 0.01
Proporción = 0.0033 / 0.01 = 0.33
Diferencia
en áreas = 0.9671 - 0.9664 = 0.0007
Ajuste = 0.33 × 0.0007 =
0.000231
Área para Z = 1.8333 ≈ 0.9664 + 0.000231 =
0.966631
Por lo tanto:
P(x̄ > 10%) ≈ 0.9666 (96.66%)
Usando función de distribución normal:
P(x̄
> 10%) = 1 - Φ(-1.8333)
= Φ(1.8333)
Con
calculadora o software:
Φ(1.8333) = 0.9666
(aproximadamente)
Valor exacto con más
precisión:
• Usando la función de error complementaria:
Φ(1.8333) = 0.966597
Por lo tanto, la probabilidad es
aproximadamente 96.66%
Significado del 96.66%:
• Si tomamos muchas
muestras aleatorias de 9 observaciones,
aproximadamente el 96.66% de
ellas tendrán una media muestral
superior al 10%
• Es muy
probable que la media muestral sea mayor que 10%,
dado que la media
poblacional es 12.2% y la variabilidad
de la media muestral es
relativamente pequeña (1.2%)
Representación gráfica
conceptual:
Distribución muestral centrada en 12.2% con
desviación 1.2%:
• El valor 10% está a 1.83 desviaciones a la
izquierda de la media
• Casi toda el área (96.66%) está a la derecha
de 10%
• Solo 3.34% de las medias muestrales serían menores a 10%
Error 1: Usar desviación poblacional en lugar del error
estándar
• Usar σ = 3.6% en lugar de σ/√n = 1.2%
• Esto
daría Z = (10-12.2)/3.6 = -0.611 → probabilidad ≈ 72.9% (incorrecto)
Error 2: No estandarizar correctamente
•
Calcular directamente P(x̄ > 10) sin convertir a Z
Error 3: Confundir el signo de Z
• Z negativo
significa que el valor está por debajo de la media
• P(Z > -1.83)
= P(Z < 1.83) por simetría
Error 4: Usar tabla normal para el lado incorrecto
• Buscar P(Z < -1.83) = 0.0334 en lugar de P(Z > -1.83)
• Eso
daría 3.34% en lugar de 96.66%
Error 5: No considerar
el tamaño de muestra en el error estándar
• El error
estándar disminuye con √n
• Para n=9, σx̄ = σ/3
Aclaración importante:
Como la población es normal,
la distribución muestral de la media
es exactamente normal, no
aproximada, incluso para n pequeña.
También podemos expresar el resultado como:
La
media muestral de 9 observaciones seguirá una distribución
N(12.2%,
1.2%). El percentil 3.34 de esta distribución es 10%,
lo que
significa que solo el 3.34% de las medias muestrales
serán
inferiores al 10%.
Verificación con la regla
empírica:
• El 68% de las medias muestrales estarán entre
11.0% y 13.4%
• El 95% estarán entre 9.8% y 14.6%
• El valor 10%
está cerca del límite inferior del 95%
• Por eso la probabilidad de
ser mayor a 10% es alta (96.66%)
Intervalo de confianza
asociado:
Un intervalo de confianza del 95% para la media
poblacional
basado en una muestra sería x̄ ± 1.96 × 1.2% = x̄ ±
2.352%
Esto muestra la precisión de la estimación con n=9.
📊
Fórmula clave:
Z = (x̄ - μ) / (σ/√n)
Resultado final:
P(x̄ > 10%) = 96.66%
Conclusión clave: La probabilidad de que la media muestral de nueve observaciones de incrementos salariales sea mayor al 10% es aproximadamente 0.9666 o 96.66%. Este resultado se obtiene aplicando la teoría de distribución muestral, donde la media muestral sigue una distribución normal con media igual a la poblacional (12.2%) y error estándar de 1.2% (σ/√n). Dado que el valor de interés (10%) está 1.83 desviaciones estándar por debajo de la media, casi toda el área de la distribución (96.66%) se encuentra por encima de este valor, indicando que es muy probable que la media muestral supere el 10%.
✅ RESPUESTA CORRECTA: 96.66%
La probabilidad de que la media muestral sea mayor del 10% es 96.66%
Cálculo de probabilidad para la media muestral de consumo de gasolina
“Una muestra aleatoria de seis autos de un determinado modelo evidencia que cada uno de ellos consume las siguientes cantidades en kilómetros por litro: 18.6, 18.4, 19.2, 20.8, 19.4, 20.5. Determine la probabilidad de que el consumo de gasolina medio muestral de automóviles sea menor que 17.6 kilómetros por litro, suponiendo que la distribución de la población es normal con media 17.”
Parámetros poblacionales:
• Media poblacional (μ) =
17 km/L
• La población se distribuye normal
• Desviación típica
poblacional (σ) = DESCONOCIDA
Muestra:
• n = 6 observaciones
• Datos: 18.6,
18.4, 19.2, 20.8, 19.4, 20.5
Se pide: P(x̄ <
17.6) con μ = 17
Media muestral (x̄):
x̄ = (18.6 + 18.4 + 19.2 + 20.8
+ 19.4 + 20.5) / 6
Suma = 18.6 + 18.4 = 37.0
37.0 + 19.2 =
56.2
56.2 + 20.8 = 77.0
77.0 + 19.4 = 96.4
96.4 + 20.5 =
116.9
x̄ = 116.9 / 6 = 19.4833 km/L
Nota importante: Este valor (19.48) es la media de la
muestra,
pero NO se utiliza directamente en el cálculo de
probabilidad,
ya que la pregunta es sobre la distribución muestral
bajo la hipótesis de μ=17.
Problema fundamental:
• La desviación típica
poblacional σ es DESCONOCIDA
• Para calcular P(x̄ < 17.6)
necesitamos conocer la variabilidad
• Con σ desconocida, debemos
estimarla a partir de la muestra
• Pero la muestra que tenemos
(19.48) es muy superior a 17.6
• Esto sugiere que la probabilidad
será extremadamente pequeña
Enfoque
correcto:
1. Estimar σ con la desviación típica muestral
(s)
2. Usar distribución t de Student (no normal)
3. Calcular el
estadístico t
4. Encontrar la probabilidad en la cola izquierda
Fórmula de varianza muestral:
s² = Σ(xi - x̄)² /
(n-1)
Calculando desviaciones:
• 18.6 -
19.4833 = -0.8833 → (-0.8833)² = 0.7802
• 18.4 - 19.4833 = -1.0833 →
(-1.0833)² = 1.1735
• 19.2 - 19.4833 = -0.2833 → (-0.2833)² =
0.0803
• 20.8 - 19.4833 = 1.3167 → (1.3167)² = 1.7337
• 19.4 -
19.4833 = -0.0833 → (-0.0833)² = 0.0069
• 20.5 - 19.4833 = 1.0167 →
(1.0167)² = 1.0337
Suma de cuadrados:
0.7802 + 1.1735 = 1.9537
1.9537 + 0.0803 = 2.0340
2.0340 +
1.7337 = 3.7677
3.7677 + 0.0069 = 3.7746
3.7746 + 1.0337 =
4.8083
s² = 4.8083 / (6-1) = 4.8083 / 5 = 0.96166
s =
√0.96166 = 0.9806 km/L
Error estándar estimado:
EE = s / √n = 0.9806 /
√6
√6 ≈ 2.4495
EE = 0.9806 / 2.4495 = 0.4004
km/L
Estadístico t:
t = (x̄ - μ) /
EE
Pero aquí queremos P(x̄ < 17.6) bajo H₀: μ = 17
Para el valor límite 17.6:
t = (17.6 - 17) /
0.4004
= 0.6 / 0.4004
= 1.4985
Interpretación:
Buscamos P(x̄ < 17.6) = P(t <
1.4985) con 5 grados de libertad
(tiene signo positivo porque 17.6
> 17)
Distribución t con gl = 5:
Valores críticos de
tabla t (una cola):
• t₀.₁₀ = 1.476
• t₀.₀₅ = 2.015
Nuestro t = 1.4985 está entre 1.476 y 2.015
Interpolación:
Para t = 1.476 → área cola derecha =
0.10
Para t = 2.015 → área cola derecha = 0.05
Diferencia
en t = 2.015 - 1.476 = 0.539
Nuestro t excede 1.476 en: 1.4985 -
1.476 = 0.0225
Proporción = 0.0225 / 0.539 = 0.0417
Reducción en área = 0.0417 × (0.10 - 0.05) = 0.0417 × 0.05 =
0.002085
Área cola derecha para t = 1.4985 ≈ 0.10 - 0.0021 =
0.0979
Por lo tanto:
P(t > 1.4985) ≈
0.0979
P(t < 1.4985) = 1 - 0.0979 = 0.9021
Pero esto es P(x̄ < 17.6)? ¡CUIDADO!
Confusión detectada:
• Calculamos t = (17.6 -
17)/EE = 1.4985
• Esto da P(x̄ < 17.6) = P(t < 1.4985) ≈
0.90
Pero esto NO puede ser correcto:
• La
media muestral observada es 19.48, muy superior a 17.6
• La
probabilidad de que x̄ sea menor que 17.6 debería ser MUY pequeña
•
Obtener 0.90 (90%) es absurdo
¿Qué pasó?
•
Usamos la media muestral observada (19.48) para estimar s
• Pero esa
media es mucho mayor que 17
• La variabilidad estimada (s=0.98) es
pequeña relativa a la distancia
• El estadístico t positivo indica
que 17.6 está por ENCIMA de μ=17
• Por eso P(t < 1.4985) es alta
(90%)
El problema conceptual:
La pregunta es: bajo
el supuesto de que μ=17,
¿cuál es la probabilidad de que la media
muestral sea menor que 17.6?
Esto es
simplemente:
P(x̄ < 17.6 | μ=17) = P(Z <
(17.6-17)/(σ/√n))
Pero σ es desconocida
•
Si usamos s de la muestra (que es 0.98), estamos condicionando
en
una muestra que tiene media 19.48, lo cual es inconsistente
• Lo
correcto sería tener una estimación de σ independiente
• O reconocer
que el problema está mal planteado
Conclusión:
Con la información dada,
no es posible calcular la probabilidad
solicitada
porque falta la desviación típica poblacional.
Si interpretamos el problema de otra manera:
Quizás la muestra dada es solo para que calculemos s,
y luego usamos
esa s como si fuera σ conocida.
Entonces, con σ = s =
0.9806:
EE = σ/√n = 0.9806/√6 = 0.4004
Z = (17.6 -
17) / 0.4004 = 1.4985
P(x̄ < 17.6) = P(Z < 1.4985) ≈
0.9332 (usando normal)
Pero esto sigue siendo alto y
contradictorio.
La realidad:
•
Los datos muestrales (promedio 19.48) son inconsistentes
con una
media poblacional de 17
• La probabilidad de obtener una muestra con
media 19.48
si μ=17 y σ≈0.98 es prácticamente cero
• Por eso,
cualquier cálculo de P(x̄ < 17.6) dará un valor
cercano a 1, lo
cual es absurdo en el contexto
Respuesta más
sensata:
Dados los datos, la probabilidad de que la media
muestral
sea menor que 17.6 es esencialmente 1 (100%),
pero esto
contradice el supuesto de que μ=17.
🚗
Con s como estimación de σ:
P(x̄ < 17.6) ≈ 0.93
Realidad:
Los datos son inconsistentes con μ=17
Conclusión clave: El problema presenta una inconsistencia fundamental: se pide calcular P(x̄ < 17.6) bajo el supuesto de que μ=17, pero los datos muestrales tienen una media de 19.48, lo que es extremadamente improbable si μ=17 y la variabilidad es moderada. Esto sugiere que la desviación típica poblacional debería ser mucho mayor para que tal muestra sea posible, o que el supuesto de μ=17 es incorrecto. Sin conocer σ, no es posible dar una respuesta numérica con sentido. El ejercicio ilustra la importancia de verificar la coherencia entre los supuestos y los datos antes de realizar cálculos de probabilidad.
⚠️ PROBLEMA INCONSISTENTE
Los datos muestrales (x̄=19.48) son incompatibles con μ=17. Falta σ poblacional.
Cálculo de probabilidades para la diferencia de rendimientos promedio bajo el supuesto de igualdad de medias poblacionales
“Se prueba el rendimiento (km/l) de dos tipos de gasolina: la primera
tiene desviación estándar σ₁ = 1.23 km/l y se prueba en 35 vehículos; la
segunda tiene σ₂ = 1.37 km/l y se prueba en 42 vehículos.
a)
¿Cuál es la probabilidad de que la primera gasolina dé un rendimiento
promedio mayor de 0.45 km/l que la segunda?
b) ¿Cuál es la
probabilidad de que la diferencia en rendimientos promedio se encuentre
entre 0.65 y 0.83 km/l a favor de la primera gasolina?”
SOLUCIÓN PROBLEMA: Suponga que μ₁ = μ₂
Gasolina 1:
• Desviación estándar poblacional: σ₁ =
1.23 km/l
• Tamaño de muestra: n₁ = 35
Gasolina
2:
• Desviación estándar poblacional: σ₂ = 1.37 km/l
•
Tamaño de muestra: n₂ = 42
Supuesto
fundamental:
μ₁ = μ₂ (las medias poblacionales son
iguales)
Variable de interés:
D = x̄₁ - x̄₂
(diferencia de medias muestrales)
Propiedades de D = x̄₁ - x̄₂:
• Media:
μD = μ₁ - μ₂ = 0 (por el supuesto μ₁ = μ₂)
•
Varianza: σD² = σ₁²/n₁ + σ₂²/n₂
Cálculo de
la varianza:
σ₁²/n₁ = (1.23)² / 35 = 1.5129 / 35 =
0.043226
σ₂²/n₂ = (1.37)² / 42 = 1.8769 / 42 = 0.044688
σD² = 0.043226 + 0.044688 = 0.087914
Desviación estándar:
σD = √0.087914 =
0.2965 km/l
Distribución: D ~
N(0, 0.2965)
Queremos: P(D > 0.45)
Estandarización:
Z = (D - μD) /
σD
Z = (0.45 - 0) / 0.2965
Z = 0.45 / 0.2965
Z =
1.5177
Por lo tanto:
P(D
> 0.45) = P(Z > 1.5177)
Usando tabla normal
estándar:
• Para Z = 1.51 → área cola derecha = 0.0655
• Para Z = 1.52 → área cola derecha = 0.0643
Interpolación lineal:
Diferencia en Z = 1.52 - 1.51
= 0.01
Nuestro Z excede 1.51 en: 1.5177 - 1.51 = 0.0077
Proporción = 0.0077 / 0.01 = 0.77
Diferencia en áreas = 0.0655 -
0.0643 = 0.0012
Ajuste = 0.77 × 0.0012 = 0.000924
Área para
Z = 1.5177 ≈ 0.0655 - 0.0009 = 0.0646
Respuesta (a): P(D > 0.45) ≈ 0.0646
Queremos: P(0.65 < D < 0.83)
Estandarizamos los límites:
Para D = 0.65:
Z₁ = (0.65 - 0) / 0.2965 = 0.65 / 0.2965 = 2.1922
Para D = 0.83:
Z₂ = (0.83 - 0) / 0.2965 = 0.83 / 0.2965 =
2.7993
Por lo tanto:
P(0.65 < D < 0.83) = P(2.1922 < Z < 2.7993)
= P(Z <
2.7993) - P(Z < 2.1922)
Para Z = 2.1922:
• Z = 2.19 → área acumulada =
0.9857
• Z = 2.20 → área acumulada = 0.9861
Interpolación:
Diferencia = 0.0004
Proporción = (2.1922 -
2.19)/0.01 = 0.22
Ajuste = 0.22 × 0.0004 = 0.000088
Φ(2.1922) ≈
0.9857 + 0.0001 = 0.9858
Para Z =
2.7993:
• Z = 2.79 → área acumulada = 0.9974
• Z = 2.80
→ área acumulada = 0.9974 (¡cuidado! para Z=2.8 es 0.9974)
Verificando tabla más precisa:
• Z = 2.79 → 0.9974
• Z = 2.80 →
0.9974 (en tablas de 4 decimales, ambos dan 0.9974)
• Z = 2.81 →
0.9975
Para mayor precisión, usemos:
Z = 2.7993 está muy
cerca de 2.80
Φ(2.7993) ≈ 0.9974
Por lo tanto:
P(0.65 < D < 0.83) = 0.9974 -
0.9858 = 0.0116
Parte (a) - 0.0646 (6.46%):
• Bajo el supuesto de
igualdad de medias poblacionales,
hay solo un 6.46% de probabilidad
de que la diferencia
muestral supere 0.45 km/l a favor de la primera
gasolina
• Es un evento relativamente improbable
Parte (b) - 0.0116 (1.16%):
• La probabilidad de
que la diferencia muestral esté
entre 0.65 y 0.83 km/l es muy baja
(1.16%)
• Estos valores están en la cola extrema de la
distribución
Observación importante:
Ambas
probabilidades son pequeñas porque los valores
(0.45, 0.65, 0.83)
están muy alejados de la media cero,
a más de 1.5 y 2.8 desviaciones
estándar respectivamente.
Valores más precisos:
σD =
√(1.23²/35 + 1.37²/42)
= √(1.5129/35 + 1.8769/42)
= √(0.043226 +
0.044688)
= √0.087914 = 0.296503
Parte
(a):
Z = 0.45 / 0.296503 = 1.5177
P(Z > 1.5177) =
0.0646 (exacto)
Parte (b):
Z₁ = 0.65 / 0.296503 = 2.1922
Φ(2.1922) = 0.9858
Z₂ = 0.83 / 0.296503 = 2.7993
Φ(2.7993)
= 0.99744
Diferencia = 0.99744 - 0.9858 = 0.01164
Resultados finales:
(a) P(D > 0.45) = 0.0646
(b) P(0.65 < D < 0.83) = 0.0116
Distribución de D = x̄₁ - x̄₂:
• Distribución
normal con media 0 y desviación 0.2965
Ubicación de los
valores:
• 0.45 está a 1.52σ → probabilidad en cola
derecha: 6.46%
• 0.65 está a 2.19σ → percentil 98.58
• 0.83 está
a 2.80σ → percentil 99.74
• El intervalo [0.65, 0.83] cubre solo el
1.16% central de la cola derecha
Interpretación en
términos de percentiles:
• El valor 0.65 es el percentil
98.58
• El valor 0.83 es el percentil 99.74
• La diferencia
entre estos percentiles es 1.16 puntos porcentuales,
que corresponde
a la probabilidad del intervalo
⛽
Parte (a):
P(D > 0.45) = 0.0646 (6.46%)
Parte (b):
P(0.65 < D < 0.83) = 0.0116
(1.16%)
Conclusión clave: Bajo el supuesto de que las medias poblacionales de rendimiento son iguales (μ₁ = μ₂), la diferencia de medias muestrales D = x̄₁ - x̄₂ sigue una distribución normal con media 0 y desviación estándar 0.2965 km/l. La probabilidad de que la primera gasolina supere a la segunda por más de 0.45 km/l es de 6.46%, mientras que la probabilidad de que la diferencia esté entre 0.65 y 0.83 km/l es de solo 1.16%. Estos resultados indican que valores como 0.45, 0.65 y 0.83 son relativamente extremos bajo la hipótesis de igualdad, lo que podría llevar a cuestionar dicha hipótesis si se observaran diferencias muestrales de esa magnitud.
✅ RESPUESTAS: (a) 0.0646 | (b) 0.0116
Probabilidad de D > 0.45: 6.46% | Probabilidad de 0.65 < D < 0.83: 1.16%