La altura media de los alumnos de un centro educativo se distribuye
como una distribución Normal con desviación estándar de 15 cm, y la de
las alumnas como una Normal con desviación estándar de 18 cm. Para
estimar las diferencias de altura media de los hombres y de las mujeres,
se elige una muestra al azar de 40 alumnos y 35 alumnas. Las alturas
medias son: \(\bar{x}_{alumnos}=170\)cm
y \(\bar{x}_{alumnas}=160\).
Estimar mediante un intervalo de confianza la diferencia de altura media
de hombres y mujeres. Utilice un nivel de confianza del \(95\%\).
RESPUESTA (No es igual al ejercico resuelto ya que aquí suponemos que las varianzas poblacionales no son conocidas) ¿Varianzas muestrales son iguales?
Evidencia muestral: \(n_{alumnos}=40\) y \(n_{alumnas}= 35\) , \(\bar{X}_{alumnos}=170\) , \(\bar{X}_{alumnas}=160\), \(s^{2}_{alumnos}= (15)^2\), \(s^{2}_{alumnas}= (18)^2\), \(\bar{X}_{alumnos}-\bar{X}_{alumnas}=10 cm\)
xbar1<-170
n1<-40
var1<-15^2
xbar2<-160
n2<-35
var2<-18^2
alfa<-0.05
inf_var<-(var1/var2)*(1/(qf(alfa/2,n1-1,n2-2,lower.tail=FALSE)))
sup_var<-(var1/var2)*(1/(qf(1-(alfa/2),n1-1,n2-2,lower.tail = FALSE)))
inf_var
## [1] 0.3533861
sup_var
## [1] 1.339442
if(inf_var<1 && sup_var>1){"Varianzas iguales"}else{"Varianzas no iguales"}
## [1] "Varianzas iguales"
¿El intervalo contiene el valor de 1 ? ¡¡Sí!! Por lo que se debe de utilizar la fórmula donde se consideran las varianzas poblacionales desconocidas, pero con varianzas iguales.
esep2<-(((n1-1)*(var1))+((n1-1)*(var1))) / (n1+n2-2)
lim_infe<-(xbar1-xbar2)-qt(alfa/2,n1+n2-2,lower.tail = FALSE)*
(sqrt(esep2)*sqrt((1/n1)+(1/n2)))
lim_sup<-(xbar1-xbar2)+qt(alfa/2,n1+n2-2,lower.tail = FALSE)*
(sqrt(esep2)*sqrt((1/n1)+(1/n2)))
lim_infe
## [1] 2.847623
lim_sup
## [1] 17.15238
La estimación de \(S^{2}_{p}\) 240.41. El intervalo para dicho problema va de 2.85 a 17.15
Ahora, supongamos que de la prueba de igualdad de varianzas, nos hubiera resultado el “no son iguales”, entonces:
#Grados de libertad ponderados
gra_liver<-(((var1/n1)+(var2/n2))^2)/
((((var1/n1)^2)/(n1-1))+(((var2/n2)^2)/(n2-1)))
lim_infe_dife<-(xbar1-xbar2)-qt(alfa,round(gra_liver),lower.tail = FALSE)*sqrt((var1/n1)/(var1/n2))
lim_sup_dife<-(xbar1-xbar2)+qt(alfa,round(gra_liver),lower.tail = FALSE)*sqrt((var1/n1)/(var1/n2))
lim_infe_dife
## [1] 8.439476
lim_sup_dife
## [1] 11.56052
El intervalo de confianza para la diferencia de estaturas va de 8.44 a 11.56 lo que nos indica que los hombres siempre son más altos que las mujeres
Ejemplo. Vestigios de metales en el agua potable afectan su sabor, y concentraciones demasiadas altas pueden representar un riesgo para la salud. Para la realización de un artículo científico, se estudió el suministro de agua de 6 localidades (objetos experimentales) y se midió la concentración de zinc (en mg/L) de la superficie y del fondo del agua. Los seis pares de observaciones se muestran en la tabla siguiente. Calcule un intervalo de confianza del 95% para la diferencia entre medias de la concentración de zinc en el agua del fondo y concentración de zinc en el agua de la superficie.
alfa2<-0.05
datos_zinc<-as.data.frame(matrix(
c(0.43, 0.415,
0.266, 0.238,
0.567, 0.39,
0.531, 0.41,
0.707, 0.605,
0.716, 0.609),byrow=TRUE,ncol=2) )
colnames(datos_zinc)<-c("Fondo","Superficie")
de_datos<-datos_zinc$Fondo-datos_zinc$Superficie #di
de_media<-mean(de_datos) #Media de d
de_var<-var(de_datos) #Varianza de d
de_cuanti<-qt(alfa2/2,nrow(datos_zinc)-1,lower.tail = FALSE)
lim_inf_di<-de_media-de_cuanti*sqrt((de_var/nrow(datos_zinc)))
lim_sup_di<-de_media+de_cuanti*sqrt((de_var/nrow(datos_zinc)))
lim_inf_di
## [1] 0.02797823
lim_sup_di
## [1] 0.1553551
Ya que intervalo va de 0.0280 a 0.1554, se puede afirmar que la concentración de zinc es mayor al fondo que en la superficie.