Intervalos de confianza de la diferencia de dos promedios poblacionales (μ1−μ2)

Cuando se requiere saber si los promedios de dos poblaciones (\(\mu_{1}\) y \(\mu_{2}\))son iguales o no, por ejemplo, la estatura promedio de las mujeres (\(\mu_{1}\)) y la estatura promedio de los hombres (\(\mu_{2}\)), se construirá un intervalo de confianza para la diferencia de éstos promedios como sigue:

\((\bar{x}_{1} - \bar{x}_{2}) - z_{\alpha /2} \sqrt{ \frac{s^{2}_{1}}{n_{1}}+\frac{s^{2}_{2}}{n_{2}} } \leq \mu _{1}-\mu _{2} \leq (\bar{x}_{1} - \bar{x}_{2}) + z_{\alpha /2} \sqrt{ \frac{s^{2}_{1}}{n_{1}}+\frac{s^{2}_{2}}{n_{2}}}\)

o de manera breve

\((\bar{x}_{1} - \bar{x}_{2}) \pm z_{\alpha /2} \sqrt{ \frac{s^{2}_{1}}{n_{1}}+\frac{s^{2}_{2}}{n_{2}}}\)

Si el intervalo construido contiene al 0 (es decir que un límite sea negativo y el otro positivo) se concluye que los dos promedios poblacionales son iguales.

Cuando el 0 no este contenido habrá dos maneras de interpretar:

* Si los dos límites son positivos se dice que el promedio en la población 1 es mayor que el promedio en la población 2.

* Si los dos límites son negativos se dice que el promedio en la población 1 es menor que el promedio en la población 2.


Ejemplos


Ejemplo 1. Se quiere saber si la estatura promedio de las mujeres (\(\mu_{1}\)) ITSON es igual o difiere de la estatura promedio de los hombres ITSON (\(\mu_{2}\))

Para poder responder a ese cuestionamiento deben seleccionarse muestras aleatorias de hombres y mujeres. Suponga que se seleccionaron 35 hombres y 35 mujeres. La información se muestra a continuación:

# Mujeres
mujeres <- c(1.54, 1.57, 1.60, 1.60, 1.60, 1.60, 1.61, 1.61, 1.61, 1.61, 1.61, 1.62, 1.62, 1.62, 1.63, 1.63, 1.63, 1.63, 1.63, 1.63, 1.64, 1.64, 1.65, 1.65, 1.65, 1.65, 1.66, 1.66, 1.67, 1.69, 1.70, 1.70, 1.70, 1.70, 1.73)

# Hombres
hombres <- c(1.65, 1.67, 1.67, 1.69, 1.70, 1.70, 1.70, 1.72, 1.72, 1.72, 1.72, 1.73, 1.73, 1.74, 1.74, 1.74, 1.74, 1.75, 1.75, 1.76, 1.76, 1.76, 1.76, 1.76, 1.77, 1.77, 1.78, 1.78, 1.78, 1.78, 1.80, 1.80, 1.80, 1.80, 1.86)

Los cálculos para hacer el intervalo:

  1. Calcular los promedios y desviaciones estándar de las muestras ( \(\bar{x}_{1}\) , \(\bar{x}_{2}\) , \(s_{2}\) y \(s_{1}\) )

Las mujeres de la muestra tienen un promedio y desviación estándar (valores redondeados a dos décimas):

\(\bar{x}_{1}=1.64\) y \(s_{1}=0.04\)
eex1 <- mean(mujeres)
eex1
[1] 1.636857
ees1 <- sd(mujeres)
ees1
[1] 0.03998319

Los hombres de la muestra tienen un promedio y desviación estándar:

\(\bar{x}_{2}=1.75\) y \(s_{2}=0.04\)
eex2 <- mean(hombres)
eex2
[1] 1.745714
ees2 <- sd(hombres)
ees2
[1] 0.04374295

Note que los tamaños de muestra son \(n_{1}=n_{2}=35\)

  1. Según la confianza el valor de \(Z_{α/2}\) será cómo sigue:
  • 99% ——— 2.58
  • 95% ——— 1.96
  • 90% ——— 1.65

En este caso si se establece la confianza en 95% el valor de z será 1.96.

  1. Luego sustituimos en la fórmula del intervalo:
\((\bar{x}_{1} - \bar{x}_{2}) \pm z_{\alpha /2} \sqrt{ \frac{s^{2}_{1}}{n_{1}}+\frac{s^{2}_{2}}{n_{2}}}\)

Observe que en el intervalo está la varianza y cómo se había calculado la desviación estándar, solo se eleva al cuadrado:

emli <- (1.64 - 1.75) - 1.96 * sqrt( (0.04^2/35) + (0.04^2/35) )
emli 
[1] -0.1287412

Ahora el límite superior:

emls <- (1.64 - 1.75) + 1.96 * sqrt( (0.04^2/35) + (0.04^2/35) )
emls 
[1] -0.09125882
  1. Finalmente la interpretación será:

El intervalo va de -0.13 m a -0.09 m o de -13 cm hasta -9 cm. Note que el 0 (cero) NO esta contenido en el intervalo y además los límites son negativos, por lo que se puede decir que:

Al 95% de confianza, el promedio de las estaturas de las mujeres ITSON es menor, desde 9 cm hasta 13 cm, que la estatura promedio de los hombres ITSON.

Note que la conclusión fue hecha considerando a la población.


Ejemplo 2. Para saber si el promedio de calificaciones de alumnos de dos universidades son iguales, se seleccionan a 45 alumnos de la universidad A y a 50 alumnos de la universidad B.

Se obtuvo la siguiente información:

\(\bar{x}_{A1}=8.9\) \(\bar{x}_{B2}=9\) \(s_{A1}=0.35\) \(s_{B2}=0.40\)

Los cálculos para hacer el intervalo:

  1. Según la confianza el valor de \(Z_{α/2}\) será cómo sigue:
  • 99% ——— 2.58
  • 95% ——— 1.96
  • 90% ——— 1.65

En este caso si se establece la confianza en 95% el valor de z será 1.96.

2.Luego sustituimos en la fórmula del intervalo:

Primero, el límite inferior del intervalo:

ecli <- (8.9 - 9) - 1.96 * sqrt( (0.35^2/45) + (0.40^2/50) )
ecli 
[1] -0.2508337

Ahora el límite superior:

ecls <- (8.9 - 9) + 1.96 * sqrt( (0.35^2/45) + (0.40^2/50) )
ecls 
[1] 0.05083371
  1. Finalmente la interpretación será:

El intervalo va de -0.051 puntos a 0.251 puntos. Note que el 0 (cero) esta contenido en el intervalo, por lo que se puede decir que:

Al 95% de confianza, el promedio de las calificaciones de TODOS los alumnos de la universidad A y de TODOS los alumnos de la universidad B son iguales.


Asignación


1. Los siguientes datos son sobre el peso de pollitos alimentados con el alimento A

a1a <- c(293.90, 295.48, 295.64, 295.68, 295.77, 295.97, 296.06, 296.48, 296.53, 296.56, 297.44, 298.67, 298.71, 298.95, 299.08, 299.68, 300.11, 300.49, 300.62, 300.65, 300.66, 300.93, 301.77, 301.93, 302.27, 302.39, 302.52, 302.72, 303.66, 304.07)
length(a1a)
[1] 30

y éstos otros los pesos de pollitos alimentados con el alimento B.

a1b <- c(342.41, 344.24, 345.35, 345.80, 346.14, 347.37, 347.71, 347.98, 348.47, 348.67, 349.06, 349.20, 349.76, 349.85, 350.26, 350.32, 350.37, 350.38, 351.04, 351.15, 351.30, 351.75, 351.88, 352.25, 352.91, 353.05, 353.16, 353.26, 354.00, 354.27, 354.48, 354.67)
length(a1b)
[1] 32

¿Los pesos promedios de los pollos son iguales? si no son iguales ¿cuál alimento es mejor?. Use 95% de confianza.

  1. Obtener la media y la desviación estándar de ambas muestras
# Promedio Pollos alimento A
a1x1 <- mean(a1a)
a1x1
[1] 299.1797
# Des. Est Alimento A
a1s1 <- sd(a1a)
a1s1
[1] 2.857995
# Promedio Pollos alimento B
a1x2 <- mean(a1b)
a1x2
[1] 350.0784
# Des. Est Alimento B
a1s2 <- sd(a1b)
a1s2
[1] 3.09738

El valor de \(Z_{α/2}\) es de 1.96 debido a que la confianza es del 95%.

  1. Obtener los límites del intervalo
# Límite Inferior
a1li <- (a1x1 - a1x2) - 1.96 * sqrt( (a1s1^2/30)  + (a1s2^2/32) )
a1li
[1] -52.38123
# Límite superior
a1ls <- (a1x1 - a1x2) + 1.96 * sqrt( (a1s1^2/30)  + (a1s2^2/32) )
a1ls
[1] -49.41631
  1. Conclusión Ejercicio 1: Los pesos de los pollos con un 95% de confianza se encuentran entre -52.38 y -49.42, esto indica que el promedio del peso de los pollos es mayor cuando son alimentados con el alimento B.

2. Las ganancias promedio del artículo 1 en una muestra de 100 artículos son 1500 pesos con una desviación estándar de 100 pesos. Mientras que en una muestra de tamaño 120 del artículo 2 el promedio es 1600 pesos con una desviación estándar de 150 pesos.

Use una confianza de 90% para decir con cual artículo las ganancias promedio son mayores.

  1. Se calculan los límites.

El valor de \(Z_{α/2}\) es de 1.65 porque la confianza es del 90%

# x1 = 1500 pesos, n1 = 100 artículos , s1 = 100 pesos

# x2 = 1600 pesos, n2 = 120 artículos , s2 = 150 pesos

# Límite Inferior
a2li <- (1500 - 1600) - 1.65 * sqrt( 100^2/100 + 150^2/1600 )
a2li
[1] -117.622
# Límite Superior 
a2ls <- (1500 - 1600) + 1.65 * sqrt( 100^2/100 + 150^2/1600 )
a2ls
[1] -82.37799
  1. Conclusión Ejercicio 2: Con un 90% el intervalo de confianza se encuentra comprendido entre -117.62 y -82.38 pesos por lo que el promedio de las ganancias del artículo 2 es mayor que el del artículo 2.

3. Investigue una situación en donde se deba hacer un intervalo para comparar dos promedios. Con datos inventados o investigados en internet. Realice el intervalo al 99% de confianza y haga sus conclusiones.

NOTA. En éste último ejercicio puede buscar en internet: “ ejercicios de intervalos de confianza de la diferencia de dos promedios”

Se observa la eficiencia de dos departamentos asignándole a cada uno de ellos diez tareas y midiendo su rendimiento en ellas. Los resultados están a continuación:

  • Departamento 1 0,6 - 1,2 - 0,9 - 1,9 - 2 - 0,6 - 0,9 - 2 - 0,8 - 1
  • Departamento 2 0,4 - 1,3 - 1,1 - 2,1 - 1,9 - 0,5 - 1,1 - 1,7 - 0,8 - 1,1

Suponiendo las puntuaciones como variables normales, determinar un intervalo de confianza de 0.9 para la diferencia media de eficiencia.

  1. Calcular la media y la desviación estándar de las poblaciones
# Departamento 1
desp1 <- c(0.6, 1.2, 0.9, 1.9, 2, 0.6, 0.9, 2, 0.8, 1)

  # Media
x1 <- mean(desp1)
x1
[1] 1.19
  # Desviación Estándar
s1 <- sd(desp1)
s1
[1] 0.5646041
#Departamento
desp2 <- c(0.4, 1.3, 1.1, 2.1, 1.9, 0.5, 1.1, 1.7, 0.8, 1.1)

  # Media
x2 <- mean(desp2)
x2
[1] 1.2
  # Desviación Estándar
s2 <- sd(desp2)
s2
[1] 0.5656854
  1. Calcular los limites del intervalo

Como el nivel de confianza es del 90% (0.9) el valor de \(Z_{α/2}\) es de 1.65.

li <- (x1 - x2) - 1.65 * sqrt( s1^2/10 + s2^2/10)
li
[1] -0.4270219
ls <- (x1 - x2) + 1.65 * sqrt( s1^2/10 + s2^2/10)
ls
[1] 0.4070219
  1. Conclusión Ejercicio 3: El intervalo está comprendido entre -0.42 hasta 0.40. Que este incluido el o indica que los promedios poblacionales son iguales, este resultado es obtenido con un 90% de confianza.

Datos Ejercicio 3

……………. Melanie Icedo Félix …………….

