Cuando se requiere saber si los promedios de dos poblaciones (\(\mu_{1}\) y \(\mu_{2}\))son iguales o no, por ejemplo, la estatura promedio de las mujeres (\(\mu_{1}\)) y la estatura promedio de los hombres (\(\mu_{2}\)), se construirá un intervalo de confianza para la diferencia de éstos promedios como sigue:
\((\bar{x}_{1} - \bar{x}_{2}) - z_{\alpha /2} \sqrt{ \frac{s^{2}_{1}}{n_{1}}+\frac{s^{2}_{2}}{n_{2}} } \leq \mu _{1}-\mu _{2} \leq (\bar{x}_{1} - \bar{x}_{2}) + z_{\alpha /2} \sqrt{ \frac{s^{2}_{1}}{n_{1}}+\frac{s^{2}_{2}}{n_{2}}}\)
o de manera breve
\((\bar{x}_{1} - \bar{x}_{2}) \pm z_{\alpha /2} \sqrt{ \frac{s^{2}_{1}}{n_{1}}+\frac{s^{2}_{2}}{n_{2}}}\)
Ejemplo 1. Se quiere saber si la estatura promedio de las mujeres (\(\mu_{1}\)) ITSON es igual o difiere de la estatura promedio de los hombres ITSON (\(\mu_{2}\))
Para poder responder a ese cuestionamiento deben seleccionarse muestras aleatorias de hombres y mujeres. Suponga que se seleccionaron 35 hombres y 35 mujeres. La información se muestra a continuación:
# Mujeres
mujeres <- c(1.54, 1.57, 1.60, 1.60, 1.60, 1.60, 1.61, 1.61, 1.61, 1.61, 1.61, 1.62, 1.62, 1.62, 1.63, 1.63, 1.63, 1.63, 1.63, 1.63, 1.64, 1.64, 1.65, 1.65, 1.65, 1.65, 1.66, 1.66, 1.67, 1.69, 1.70, 1.70, 1.70, 1.70, 1.73)
# Hombres
hombres <- c(1.65, 1.67, 1.67, 1.69, 1.70, 1.70, 1.70, 1.72, 1.72, 1.72, 1.72, 1.73, 1.73, 1.74, 1.74, 1.74, 1.74, 1.75, 1.75, 1.76, 1.76, 1.76, 1.76, 1.76, 1.77, 1.77, 1.78, 1.78, 1.78, 1.78, 1.80, 1.80, 1.80, 1.80, 1.86)
Los cálculos para hacer el intervalo:
Las mujeres de la muestra tienen un promedio y desviación estándar (valores redondeados a dos décimas):
eex1 <- mean(mujeres)
eex1
[1] 1.636857
ees1 <- sd(mujeres)
ees1
[1] 0.03998319
Los hombres de la muestra tienen un promedio y desviación estándar:
eex2 <- mean(hombres)
eex2
[1] 1.745714
ees2 <- sd(hombres)
ees2
[1] 0.04374295
Note que los tamaños de muestra son \(n_{1}=n_{2}=35\)
En este caso si se establece la confianza en 95% el valor de z será 1.96.
Observe que en el intervalo está la varianza y cómo se había calculado la desviación estándar, solo se eleva al cuadrado:
emli <- (1.64 - 1.75) - 1.96 * sqrt( (0.04^2/35) + (0.04^2/35) )
emli
[1] -0.1287412
Ahora el límite superior:
emls <- (1.64 - 1.75) + 1.96 * sqrt( (0.04^2/35) + (0.04^2/35) )
emls
[1] -0.09125882
El intervalo va de -0.13 m a -0.09 m o de -13 cm hasta -9 cm. Note que el 0 (cero) NO esta contenido en el intervalo y además los límites son negativos, por lo que se puede decir que:
Al 95% de confianza, el promedio de las estaturas de las mujeres ITSON es menor, desde 9 cm hasta 13 cm, que la estatura promedio de los hombres ITSON.
Note que la conclusión fue hecha considerando a la población.
Ejemplo 2. Para saber si el promedio de calificaciones de alumnos de dos universidades son iguales, se seleccionan a 45 alumnos de la universidad A y a 50 alumnos de la universidad B.
Se obtuvo la siguiente información:
Los cálculos para hacer el intervalo:
En este caso si se establece la confianza en 95% el valor de z será 1.96.
2.Luego sustituimos en la fórmula del intervalo:
Primero, el límite inferior del intervalo:
ecli <- (8.9 - 9) - 1.96 * sqrt( (0.35^2/45) + (0.40^2/50) )
ecli
[1] -0.2508337
Ahora el límite superior:
ecls <- (8.9 - 9) + 1.96 * sqrt( (0.35^2/45) + (0.40^2/50) )
ecls
[1] 0.05083371
El intervalo va de -0.051 puntos a 0.251 puntos. Note que el 0 (cero) esta contenido en el intervalo, por lo que se puede decir que:
Al 95% de confianza, el promedio de las calificaciones de TODOS los alumnos de la universidad A y de TODOS los alumnos de la universidad B son iguales.
1. Los siguientes datos son sobre el peso de pollitos alimentados con el alimento A
a1a <- c(293.90, 295.48, 295.64, 295.68, 295.77, 295.97, 296.06, 296.48, 296.53, 296.56, 297.44, 298.67, 298.71, 298.95, 299.08, 299.68, 300.11, 300.49, 300.62, 300.65, 300.66, 300.93, 301.77, 301.93, 302.27, 302.39, 302.52, 302.72, 303.66, 304.07)
length(a1a)
[1] 30
y éstos otros los pesos de pollitos alimentados con el alimento B.
a1b <- c(342.41, 344.24, 345.35, 345.80, 346.14, 347.37, 347.71, 347.98, 348.47, 348.67, 349.06, 349.20, 349.76, 349.85, 350.26, 350.32, 350.37, 350.38, 351.04, 351.15, 351.30, 351.75, 351.88, 352.25, 352.91, 353.05, 353.16, 353.26, 354.00, 354.27, 354.48, 354.67)
length(a1b)
[1] 32
¿Los pesos promedios de los pollos son iguales? si no son iguales ¿cuál alimento es mejor?. Use 95% de confianza.
# Promedio Pollos alimento A
a1x1 <- mean(a1a)
a1x1
[1] 299.1797
# Des. Est Alimento A
a1s1 <- sd(a1a)
a1s1
[1] 2.857995
# Promedio Pollos alimento B
a1x2 <- mean(a1b)
a1x2
[1] 350.0784
# Des. Est Alimento B
a1s2 <- sd(a1b)
a1s2
[1] 3.09738
El valor de \(Z_{α/2}\) es de 1.96 debido a que la confianza es del 95%.
# Límite Inferior
a1li <- (a1x1 - a1x2) - 1.96 * sqrt( (a1s1^2/30) + (a1s2^2/32) )
a1li
[1] -52.38123
# Límite superior
a1ls <- (a1x1 - a1x2) + 1.96 * sqrt( (a1s1^2/30) + (a1s2^2/32) )
a1ls
[1] -49.41631
2. Las ganancias promedio del artículo 1 en una muestra de 100 artículos son 1500 pesos con una desviación estándar de 100 pesos. Mientras que en una muestra de tamaño 120 del artículo 2 el promedio es 1600 pesos con una desviación estándar de 150 pesos.
Use una confianza de 90% para decir con cual artículo las ganancias promedio son mayores.
El valor de \(Z_{α/2}\) es de 1.65 porque la confianza es del 90%
# x1 = 1500 pesos, n1 = 100 artículos , s1 = 100 pesos
# x2 = 1600 pesos, n2 = 120 artículos , s2 = 150 pesos
# Límite Inferior
a2li <- (1500 - 1600) - 1.65 * sqrt( 100^2/100 + 150^2/1600 )
a2li
[1] -117.622
# Límite Superior
a2ls <- (1500 - 1600) + 1.65 * sqrt( 100^2/100 + 150^2/1600 )
a2ls
[1] -82.37799
3. Investigue una situación en donde se deba hacer un intervalo para comparar dos promedios. Con datos inventados o investigados en internet. Realice el intervalo al 99% de confianza y haga sus conclusiones.
NOTA. En éste último ejercicio puede buscar en internet: “ ejercicios de intervalos de confianza de la diferencia de dos promedios”
Se observa la eficiencia de dos departamentos asignándole a cada uno de ellos diez tareas y midiendo su rendimiento en ellas. Los resultados están a continuación:
Suponiendo las puntuaciones como variables normales, determinar un intervalo de confianza de 0.9 para la diferencia media de eficiencia.
# Departamento 1
desp1 <- c(0.6, 1.2, 0.9, 1.9, 2, 0.6, 0.9, 2, 0.8, 1)
# Media
x1 <- mean(desp1)
x1
[1] 1.19
# Desviación Estándar
s1 <- sd(desp1)
s1
[1] 0.5646041
#Departamento
desp2 <- c(0.4, 1.3, 1.1, 2.1, 1.9, 0.5, 1.1, 1.7, 0.8, 1.1)
# Media
x2 <- mean(desp2)
x2
[1] 1.2
# Desviación Estándar
s2 <- sd(desp2)
s2
[1] 0.5656854
Como el nivel de confianza es del 90% (0.9) el valor de \(Z_{α/2}\) es de 1.65.
li <- (x1 - x2) - 1.65 * sqrt( s1^2/10 + s2^2/10)
li
[1] -0.4270219
ls <- (x1 - x2) + 1.65 * sqrt( s1^2/10 + s2^2/10)
ls
[1] 0.4070219
……………. Melanie Icedo Félix …………….