- Prueba de hipótesis para media de una sola población
- Usando Z-test (Distribución normal con varianza conocida)
- Usando t-test (Distribución normal con varianza desconocida)
- Población sin distribución normal
2020A
\(z= \frac{ \bar{x}- \mu_0}{\sigma/ \sqrt{n}}\)
Un grupo de investigadores desean conocer la edad media de cierta población. Saben por estudios anteriores, que la edad de los individuos en la población se distribuye normalmente con \(\sigma^2=27\). Para iniciar su estudio se preguntan ¿Si la media de edad de la población es diferente de 30?. Los investigadores quieren realizar su estudio con un 95% de confianza
Los investigadores tomaron una muestra 50 sujetos con las siguiente edades:
edades: 19, 29, 41, 18, 55, 24, 52, 41, 37, 41, 31, 50, 40, 39, 46, 44, 54, 42, 47, 36, 50, 26, 39, 51, 41, 37, 35, 49, 44, 19, 35, 36, 47, 30, 47, 30, 30, 22, 34, 45, 24, 25, 22, 43, 47, 39, 55, 55, 50, 39
Para solucionar este ejercicio seguiremos los pasos planteados en la clase anterior:
edades<-c(32, 44, 35, 40, 42, 31, 38, 27, 23, 30, 39, 20, 30, 43, 26, 23, 22, 20, 36, 35, 25, 27, 27, 43, 22, 30, 26, 27, 32, 41, 42, 30, 43, 22, 42, 24, 22, 30, 27, 45, 26, 29, 45, 32, 31, 38, 25, 37, 31, 44)# Hice un objeto con las edades summary(edades)
## Min. 1st Qu. Median Mean 3rd Qu. Max. ## 20.00 26.00 30.50 32.02 38.75 45.00
hist(edades)
boxplot(edades)
r
lo podemos estimar con la función qnorm
qnorm(0.025)#para la cola superior
## [1] -1.959964
qnorm(-0.025)# para la cola inferior
## [1] NaN
Con base en la regla de decisión, se puede rechazar la hipótesis nula porque 2.7489 está en la región de rechazo. Se puede decir que el valor calculado de la prueba estadística tiene un nivel de significación de .05 a dos colas
El valor que estimamos es mayor al valor de referencia de tablas
Con un 95% de confianza podemos decir que la media es distinta de 30
r
lo podemos calcular con la función pnorm
pnorm(2.7489, lower.tail = F)# para el valor de la cola superior. Se debe de cambiar el valor el parámetro lower.tail para que nos de el valor superior
## [1] 0.002989781
pnorm(-2.7489)# para la cola inferior
## [1] 0.002989781
Si el valor \(p\) es menor o igual que \(\alpha\), es posible rechazar la hipótesis nula; si el valor p es mayor que \(\alpha\) no es posible rechazar la hipótesis nula.
Otro grupo de investigadores decidió replicar el estudio con el siguiente conjunto de datos:
edades2<-c(25, 29, 26, 34, 34, 35, 34, 29, 27, 31, 35, 35, 34, 33, 29, 33, 30, 30, 26, 33, 27, 26, 30, 25, 28, 32, 27, 30, 27, 35, 32, 33, 25, 29, 30, 32, 34, 33, 32, 27, 33, 32, 25, 33, 34, 27, 29, 34, 32, 32)
Todos los pasos del 1 al 5 son iguales al problema anterior
Con base en la regla de decisión, NO existen argumentos para rechazar la \(H_0\) 0.73 está en la región de aceptación.
El valor que estimamos es mayor al valor de referencia de tablas
No existen argumentos para decir que la media es distinta de 30 con un 95% de confianza
r
lo podemos calcular con la función pnorm
pnorm(0.74, lower.tail = F)# para el valor de la cola superior.
## [1] 0.22965
#Se debe de cambiar el valor el parámetro lower.tail para que nos de el valor superior pnorm(-0.74)# para la cola inferior
## [1] 0.22965
R
lo podemos calcular de la siguiente manera:qnorm(0.05, lower.tail = F)
## [1] 1.644854
Con base en la regla de decisión, podemos rechazar la \(H_0\)
Existe evidencia con un 95% de confianza de que la media es mayor que 30
El valor de \(p\) quedaría repartido en un solo lado
pnorm(2.7489, lower.tail = F)
## [1] 0.002989781
R
?install.packages("BSDA")
z.test(x, y = NULL, alternative = "two.sided", mu = 0, sigma.x = NULL, sigma.y = NULL, conf.level = 0.95)
R
?R
?R
?z.test(edades, alternative = "two.sided", mu=30, sigma.x = sqrt(27))
## ## One-sample z-Test ## ## data: edades ## z = 2.7489, p-value = 0.00598 ## alternative hypothesis: true mean is not equal to 30 ## 95 percent confidence interval: ## 30.57973 33.46027 ## sample estimates: ## mean of x ## 32.02
R
?Si buscamos \(H_A: \mu>30\)
z.test(edades, alternative = "greater", mu=30, sigma.x = sqrt(27))
## ## One-sample z-Test ## ## data: edades ## z = 2.7489, p-value = 0.00299 ## alternative hypothesis: true mean is greater than 30 ## 95 percent confidence interval: ## 30.81128 NA ## sample estimates: ## mean of x ## 32.02
R
?z.test(edades2, alternative = "two.sided", mu=30, sigma.x = sqrt(27))
## ## One-sample z-Test ## ## data: edades2 ## z = 0.73485, p-value = 0.4624 ## alternative hypothesis: true mean is not equal to 30 ## 95 percent confidence interval: ## 29.09973 31.98027 ## sample estimates: ## mean of x ## 30.54