###Prueba de hipótesis para μ de una población norma con variancia \(\sigma^2\) desconocida
Ejemplo
Para verificar si el proceso de llenado de bolsas de café con 500 gramos está operando correctamente se toman aleatoriamente muestras de tamaño diez cada cuatro horas. Una muestra de bolsas está compuesta por las siguientes observaciones: 510, 492, 494, 498, 492, 496, 502, 491, 507, 496.
¿Está el proceso llenando bolsas conforme lo dice la envoltura? Use un nivel de significancia del 5%.
Solucion
\[ \small H_0 \mu = 500\\ \small H_1 \mu \neq 500\\ \small \alpha = 5% \]
library(nortest)
## Warning: package 'nortest' was built under R version 4.5.2
muestra <- c(510, 492, 494, 498, 492, 496, 502, 491, 507, 496)
#verificar normalidad
l<- lillie.test(muestra)$p.value
cat("Como el valor p es mayor a 10%, la muestra proviene de una muestra normal",l)
## Como el valor p es mayor a 10%, la muestra proviene de una muestra normal 0.2515366
Ahora se usa la funcion t.text para desarrollar la prueba de hipotesis.
pr_1 <- t.test(muestra, alternative='two.sided', conf.level=0.95, mu=500)
pr_1
##
## One Sample t-test
##
## data: muestra
## t = -1.0629, df = 9, p-value = 0.3155
## alternative hypothesis: true mean is not equal to 500
## 95 percent confidence interval:
## 493.1176 502.4824
## sample estimates:
## mean of x
## 497.8
Conclusion
Como el valor-P es 0.3155 y mayor que el nivel de significancia 5%,no se rechaza la hipótesis nula, es decir, las evidencias no son suficientes para afirmar que el proceso de llenando no está cumpliendo con lo impreso en la envoltura.
Existen varias pruebas para estudiar la propoción p de una distribución binomial, a continuación el listado de las más comunes.
Prueba de Wald, Prueba
\(χ2\) de Pearson, Prueba binomial
exacta.
Ejemplo
Un fabricante de un quitamanchas afirma que su producto quita 90% de
todas las manchas. Para poner a prueba esta afirmación se toman 200
camisetas manchadas de las cuales a solo 174 les desapareció la mancha.
Pruebe la afirmación del fabricante a un nivel
α = 0.05 .
Solución
En este problema interesa probar lo siguiente:
\[ \small H_0: p = 0.9\\ \small H_1: p< 0.9 \]
prop.test(x=174, n=200, p=0.9, alternative='less',
conf.level=0.95, correct=FALSE)
##
## 1-sample proportions test without continuity correction
##
## data: 174 out of 200, null probability 0.9
## X-squared = 2, df = 1, p-value = 0.07865
## alternative hypothesis: true p is less than 0.9
## 95 percent confidence interval:
## 0.0000000 0.9042273
## sample estimates:
## p
## 0.87
EJEMPLO Para verificar si el proceso de llenado de bolsas de café está operando con la variabilidad permitida se toman aleatoriamente muestras de tamaño diez cada cuatro horas. Una muestra de bolsas está compuesta por las siguientes observaciones: 502, 501, 497, 491, 496, 501, 502, 500, 489, 490. El proceso de llenado está bajo control si presenta un varianza de 40 o menos. ¿Está el proceso llenando bolsas conforme lo dice la envoltura? Use un nivel de significancia del 5%.
SOLUCION
contenido <- c(510, 492, 494, 498, 492,
496, 502, 491, 507, 496)
stests::var.test(x=contenido, alternative='greater',
null.value=40, conf.level=0.95)
##
## X-squared test for variance
##
## data: contenido
## X-squared = 9.64, df = 9, p-value = 0.3804
## alternative hypothesis: true variance is greater than 40
## 95 percent confidence interval:
## 0.000 115.966
## sample estimates:
## variance of x
## 42.84444
EJEMPLO
Se realiza un estudio para comparar dos tratamientos que se aplicarán
a frijoles crudos con el objetivo de reducir el tiempo de cocción. El
tratamiento T1 es a base de bicarbonato de sodio, el T2 es a base de
cloruro de sodio o sal común. La variable respuesta es el tiempo de
cocción en minutos. Los datos se muestran abajo. ¿Son las varianzas de
los tiempos iguales o diferentes? Usar
α = 0.05 .
T1: 76, 85, 74, 78, 82, 75, 82.
T2: 57, 67, 55, 64, 61, 63, 63.
##SOLUCION
T1 <- c(76, 85, 74,78, 82, 75, 82)
T2 <- c(57, 67, 55, 64, 61, 63, 63)
q1 <- qqnorm(T1, plot.it=FALSE)
q2 <- qqnorm(T2, plot.it=FALSE)
plot(range(q1$x, q2$x), range(q1$y, q2$y), type="n", las=1,
xlab='Theoretical Quantiles', ylab='Sample Quantiles')
points(q1, pch=19)
points(q2, col="blue", pch=19)
qqline(T1, lty='dashed')
qqline(T2, col="blue", lty="dashed")
legend('topleft', legend=c('T1', 'T2'), bty='n',
col=c('black', 'blue'), pch=19)
require(nortest)
lillie.test(T1)$p.value
## [1] 0.520505
lillie.test(T2)$p.value
## [1] 0.3952748
stats::var.test(x=T1, y=T2, null.value=1,
alternative="two.sided",
conf.level=0.95)
##
## F test to compare two variances
##
## data: T1 and T2
## F = 1.011, num df = 6, denom df = 6, p-value = 0.9897
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.1737219 5.8838861
## sample estimates:
## ratio of variances
## 1.011019
ejemplo2 El arsénico en agua potable es un posible riesgo para la salud. Un artículo reciente reportó concentraciones de arsénico en agua potable en partes por billón (ppb) para diez comunidades urbanas y diez comunidades rurales. Los datos son los siguientes:
Urbana: 3, 7, 25, 10, 15, 6, 12, 25, 15, 7
Rural: 48, 44, 40, 38, 33, 21, 20, 12, 1, 18
##SOLUCION
urb <- c(3, 7, 25, 10, 15, 6, 12, 25, 15, 7)
rur <- c(48, 44, 40, 38, 33, 21, 20, 12, 1, 18)
require(nortest)
lillie.test(urb)$p.value
## [1] 0.5522105
lillie.test(rur)$p.value
## [1] 0.6249628
stests::var.test(x=urb, y=rur, null.value=1,
alternative="two.sided",
conf.level=0.95)
##
## F test to compare two variances
##
## data: urb and rur
## F = 0.24735, num df = 9, denom df = 9, p-value = 0.04936
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.06143758 0.99581888
## sample estimates:
## ratio of variances
## 0.2473473
ejemplo
Retomando el ejemplo de los fríjoles, ¿existen diferencias entre los tiempos de cocción de los fríjoles con T1 y T2? Usar un nivel de significancia del 5%.
Primero se construirá un boxplot comparativo para los tiempos de
cocción diferenciando por el tratamiento que recibieron. Abajo el código
para obtener en este caso el boxplot. En la Figura 24.4 se muestra el
boxplot, de esta figura se observa que las cajas de los boxplot no se
traslapan, esto es un indicio de que las medias poblacionales,
μ1 y μ2, son diferentes, se observa también que el boxplot para el
tratamiento T1 está por encima del T2.
##SOLUCION
datos <- data.frame(tiempo=c(T1, T2), trat=rep(1:2, each=7))
boxplot(tiempo ~ trat, data=datos, las=1,
xlab='Tratamiento', ylab='Tiempo (min)')
t.test(x=T1, y=T2, alternative="two.sided", mu=0,
paired=FALSE, var.equal=TRUE, conf.level=0.97)
##
## Two Sample t-test
##
## data: T1 and T2
## t = 7.8209, df = 12, p-value = 4.737e-06
## alternative hypothesis: true difference in means is not equal to 0
## 97 percent confidence interval:
## 11.94503 22.91212
## sample estimates:
## mean of x mean of y
## 78.85714 61.42857
EJEMPLO
Retomando el ejemplo de la concentración de arsénico en el agua, ¿existen diferencias entre las concentraciones de arsénico de la zona urbana y rural? Usar un nivel de significancia del 5%.
Primero se construirá un boxplot comparativo para las concentraciones de arsénico diferenciando por la zona donde se tomaron las muestras. Abajo el código para obtener en este caso el boxplot. En la Figura 24.5 se muestra el boxplot, de esta figura se observa que las cajas de los boxplot no se traslapan, esto es un indicio de que las medias poblacionales, μ1y μ2, son diferentes, se observa también que el boxplot para la zona rural está por encima del de la zona urbana.
datos <- data.frame(Concentracion=c(urb, rur),
Zona=rep(c('Urbana', 'Rural'), each=10))
boxplot(Concentracion ~ Zona, data=datos, las=1,
xlab='Zona', ylab='Concentración arsénico (ppb)')
t.test(x=urb, y=rur, alternative="two.sided", mu=0,
paired=FALSE, var.equal=FALSE, conf.level=0.95)
##
## Welch Two Sample t-test
##
## data: urb and rur
## t = -2.7669, df = 13.196, p-value = 0.01583
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -26.694067 -3.305933
## sample estimates:
## mean of x mean of y
## 12.5 27.5
ejemplo Se quiere determinar si un cambio en el método de fabricación de una piezas ha sido efectivo o no. Para esta comparación se tomaron 2 muestras, una antes y otra después del cambio en el proceso y los resultados obtenidos son los siguientes.
Num piezas Antes Después Defectuosas 75 80 Analizadas 1500 2000 Realizar una prueba de hipótesis con un nivel de significancia del 10%.
prop.test(x=c(75, 80), n=c(1500, 2000),
alternative='greater', conf.level=0.90)
##
## 2-sample test for equality of proportions with continuity correction
##
## data: c(75, 80) out of c(1500, 2000)
## X-squared = 1.7958, df = 1, p-value = 0.09011
## alternative hypothesis: greater
## 90 percent confidence interval:
## 0.0002765293 1.0000000000
## sample estimates:
## prop 1 prop 2
## 0.05 0.04