En un laboratorio bajo condiciones controladas, se evaluó, para 10 hombres y 10 mujeres, la temperatura que cada persona encontró más confortable. Los resultados en grados Fahrenheit fueron los siguientes:
Entrada de Datos:
Mujer=c(75, 77, 78, 79, 77, 73, 78, 79, 78, 80)
Hombre=c(74, 72, 77, 76, 76, 73, 75, 73, 74, 75)
Hipótesis nula:
\(H_0: \mu = \mu_0\)
\(H_a: \mu \neq \mu_0\)
df=data.frame(Mujer=Mujer,Hombre=Hombre)
df
## Mujer Hombre
## 1 75 74
## 2 77 72
## 3 78 77
## 4 79 76
## 5 77 76
## 6 73 73
## 7 78 75
## 8 79 73
## 9 78 74
## 10 80 75
Aplicamos la prueba t para la diferencia de medias de dos muestras indepensientes y obtenemos:
t.test(df$Mujer,df$Hombre)
##
## Welch Two Sample t-test
##
## data: df$Mujer and df$Hombre
## t = 3.5254, df = 16.851, p-value = 0.002626
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 1.163304 4.636696
## sample estimates:
## mean of x mean of y
## 77.4 74.5
El valor del estadístico \(p=0.002626<0.05\) indica que las dos muestras son estadísticamente diferentes a un grado de significancia \(\alpha=0.05\).
Con el fin de visualizar el comportamiento de los datos utilizaremos la función boxplot() . Para ello debemos colocar los datos en el formato apilado con la función stack() y le cambiamos los nombres a los encabezados de cada columna:
df2=stack(df)
names(df2)=c("Y","Genero")
df2
## Y Genero
## 1 75 Mujer
## 2 77 Mujer
## 3 78 Mujer
## 4 79 Mujer
## 5 77 Mujer
## 6 73 Mujer
## 7 78 Mujer
## 8 79 Mujer
## 9 78 Mujer
## 10 80 Mujer
## 11 74 Hombre
## 12 72 Hombre
## 13 77 Hombre
## 14 76 Hombre
## 15 76 Hombre
## 16 73 Hombre
## 17 75 Hombre
## 18 73 Hombre
## 19 74 Hombre
## 20 75 Hombre
boxplot(Y~Genero,data=df2,col=c("orange","green"))
Tanto el valor del \(p_{valor}=0.002626\) como el gráfico de caja nos muestra que existe diferencias significativas entre el grupo de mujeres y hombres respecto a la temperatura promedio en que siente confortable