1 Ejercicio sobre diferencia de medias y diferencia de varianzas

La altura media de los alumnos de un centro educativo se distribuye como una distribución Normal con desviación estándar de 15 cm, y la de las alumnas como una Normal con desviación estándar de 18 cm. Para estimar las diferencias de altura media de los hombres y de las mujeres, se elige una muestra al azar de 40 alumnos y 35 alumnas. Las alturas medias son: \(\bar{x}_{alumnos}=170\)cm y \(\bar{x}_{alumnas}=160\).
Estimar mediante un intervalo de confianza la diferencia de altura media de hombres y mujeres. Utilice un nivel de confianza del \(95\%\).

RESPUESTA (No es igual al ejercico resuelto ya que aquí suponemos que las varianzas poblacionales NO son conocidas) ¿Varianzas muestrales son iguales?

Evidencia muestral: \(n_{alumnos}=40\) y \(n_{alumnas}= 35\) , \(\bar{X}_{alumnos}=170\) , \(\bar{X}_{alumnas}=160\), \(s^{2}_{alumnos}= (15)^2\), \(s^{2}_{alumnas}= (18)^2\), \(\bar{X}_{alumnos}-\bar{X}_{alumnas}=10 cm\)

xbar1<-170
n1<-40
var1<-15^2

xbar2<-160
n2<-35
var2<-18^2

alfa<-0.05

inf_var<-(var2/var1)*(1/(qf(alfa/2,n2-1,n1-1,lower.tail=FALSE)))
sup_var<-(var2/var1)*(1/(qf(1-(alfa/2),n2-1,n1-1,lower.tail = FALSE)))

inf_var
## [1] 0.7493687
sup_var
## [1] 2.80918
if(inf_var<1 && sup_var>1){"Varianzas iguales"}else{"Varianzas no iguales"}
## [1] "Varianzas iguales"

¿El intervalo contiene el valor de 1 ? ¡¡Sí!! Por lo que se debe de utilizar la fórmula donde se consideran las varianzas poblacionales desconocidas, pero con varianzas iguales.

esep2<-(((n1-1)*(var1))+((n1-1)*(var1))) / (n1+n2-2)

lim_infe<-(xbar1-xbar2)-qt(alfa/2,n1+n2-2,lower.tail = FALSE)*
  (sqrt(esep2)*sqrt((1/n1)+(1/n2)))
lim_sup<-(xbar1-xbar2)+qt(alfa/2,n1+n2-2,lower.tail = FALSE)*
  (sqrt(esep2)*sqrt((1/n1)+(1/n2)))

lim_infe
## [1] 2.847623
lim_sup
## [1] 17.15238

La estimación de \(S^{2}_{p}\) 240.41. El intervalo para dicho problema va de 2.85 a 17.15

Ahora, supongamos que de la prueba de igualdad de varianzas, nos hubiera resultado el “no son iguales”, entonces:

#Grados de libertad ponderados
gra_liver<-(((var1/n1)+(var2/n2))^2)/
  ((((var1/n1)^2)/(n1-1))+(((var2/n2)^2)/(n2-1)))

lim_infe_dife<-(xbar1-xbar2)-qt(alfa,round(gra_liver),lower.tail = FALSE)*sqrt((var1/n1)/(var1/n2))
lim_sup_dife<-(xbar1-xbar2)+qt(alfa,round(gra_liver),lower.tail = FALSE)*sqrt((var1/n1)/(var2/n2))

lim_infe_dife
## [1] 8.439476
lim_sup_dife
## [1] 11.30044

El intervalo de confianza para la diferencia de estaturas va de 8.44 a 11.30 lo que nos indica que los hombres siempre son más altos que las mujeres

2 Ejemplo sobre diferencia de medias (pareadas)

Ejemplo. Vestigios de metales en el agua potable afectan su sabor, y concentraciones demasiadas altas pueden representar un riesgo para la salud. Para la realización de un artículo científico, se estudió el suministro de agua de 6 localidades (objetos experimentales) y se midió la concentración de zinc (en mg/L) de la superficie y del fondo del agua. Los seis pares de observaciones se muestran en la tabla siguiente. Calcule un intervalo de confianza del 95% para la diferencia entre medias de la concentración de zinc en el agua del fondo y concentración de zinc en el agua de la superficie.

alfa2<-0.05
datos_zinc<-as.data.frame(matrix(
c(0.43, 0.415,
0.266,  0.238,
0.567,  0.39,
0.531,  0.41,
0.707,  0.605,
0.716,  0.609),byrow=TRUE,ncol=2) )
colnames(datos_zinc)<-c("Fondo","Superficie")

de_datos<-datos_zinc$Fondo-datos_zinc$Superficie #di
de_media<-mean(de_datos) #Media de d
de_var<-var(de_datos) #Varianza de d
de_cuanti<-qt(alfa2/2,nrow(datos_zinc)-1,lower.tail = FALSE)

lim_inf_di<-de_media-de_cuanti*sqrt((de_var/nrow(datos_zinc)))
lim_sup_di<-de_media+de_cuanti*sqrt((de_var/nrow(datos_zinc)))

lim_inf_di
## [1] 0.02797823
lim_sup_di
## [1] 0.1553551

Ya que intervalo va de 0.0280 a 0.1554, se puede afirmar que la concentración de zinc es mayor al fondo que en la superficie.