###Prueba de hipótesis para μ de una población norma con variancia \(\sigma^2\) desconocida

Ejemplo

Para verificar si el proceso de llenado de bolsas de café con 500 gramos está operando correctamente se toman aleatoriamente muestras de tamaño diez cada cuatro horas. Una muestra de bolsas está compuesta por las siguientes observaciones: 510, 492, 494, 498, 492, 496, 502, 491, 507, 496.

¿Está el proceso llenando bolsas conforme lo dice la envoltura? Use un nivel de significancia del 5%.

Solucion

\[ \small H_0 \mu = 500\\ \small H_1 \mu \neq 500\\ \small \alpha = 5% \]

library(nortest)
## Warning: package 'nortest' was built under R version 4.5.2
muestra <- c(510, 492, 494, 498, 492, 496, 502, 491, 507, 496)

#verificar normalidad
 l<- lillie.test(muestra)$p.value

cat("Como el valor p es mayor a 10%, la muestra proviene de una muestra normal",l)
## Como el valor p es mayor a 10%, la muestra proviene de una muestra normal 0.2515366

Ahora se usa la funcion t.text para desarrollar la prueba de hipotesis.

pr_1 <- t.test(muestra, alternative='two.sided', conf.level=0.95, mu=500)

pr_1 
## 
##  One Sample t-test
## 
## data:  muestra
## t = -1.0629, df = 9, p-value = 0.3155
## alternative hypothesis: true mean is not equal to 500
## 95 percent confidence interval:
##  493.1176 502.4824
## sample estimates:
## mean of x 
##     497.8

Conclusion

Como el valor-P es 0.3155 y mayor que el nivel de significancia 5%,no se rechaza la hipótesis nula, es decir, las evidencias no son suficientes para afirmar que el proceso de llenando no está cumpliendo con lo impreso en la envoltura.

Prueba de hipótesis para la proporción p

Existen varias pruebas para estudiar la propoción p de una distribución binomial, a continuación el listado de las más comunes.

Prueba de Wald, Prueba
\(χ2\) de Pearson, Prueba binomial exacta.

Ejemplo

Un fabricante de un quitamanchas afirma que su producto quita 90% de todas las manchas. Para poner a prueba esta afirmación se toman 200 camisetas manchadas de las cuales a solo 174 les desapareció la mancha. Pruebe la afirmación del fabricante a un nivel
α = 0.05 .

Solución

En este problema interesa probar lo siguiente:

\[ \small H_0: p = 0.9\\ \small H_1: p< 0.9 \]

prop.test(x=174, n=200, p=0.9, alternative='less',
          conf.level=0.95, correct=FALSE)
## 
##  1-sample proportions test without continuity correction
## 
## data:  174 out of 200, null probability 0.9
## X-squared = 2, df = 1, p-value = 0.07865
## alternative hypothesis: true p is less than 0.9
## 95 percent confidence interval:
##  0.0000000 0.9042273
## sample estimates:
##    p 
## 0.87

24.4 Prueba de hipótesis para la varianza σ2 de una población normal

EJEMPLO Para verificar si el proceso de llenado de bolsas de café está operando con la variabilidad permitida se toman aleatoriamente muestras de tamaño diez cada cuatro horas. Una muestra de bolsas está compuesta por las siguientes observaciones: 502, 501, 497, 491, 496, 501, 502, 500, 489, 490. El proceso de llenado está bajo control si presenta un varianza de 40 o menos. ¿Está el proceso llenando bolsas conforme lo dice la envoltura? Use un nivel de significancia del 5%.

SOLUCION

contenido <- c(510, 492, 494, 498, 492,
               496, 502, 491, 507, 496)

stests::var.test(x=contenido, alternative='greater',
                 null.value=40, conf.level=0.95)
## 
##  X-squared test for variance
## 
## data:  contenido
## X-squared = 9.64, df = 9, p-value = 0.3804
## alternative hypothesis: true variance is greater than 40
## 95 percent confidence interval:
##    0.000 115.966
## sample estimates:
## variance of x 
##      42.84444

24.5 Prueba de hipótesis para el cociente de varianzas σ21/σ22

EJEMPLO

Se realiza un estudio para comparar dos tratamientos que se aplicarán a frijoles crudos con el objetivo de reducir el tiempo de cocción. El tratamiento T1 es a base de bicarbonato de sodio, el T2 es a base de cloruro de sodio o sal común. La variable respuesta es el tiempo de cocción en minutos. Los datos se muestran abajo. ¿Son las varianzas de los tiempos iguales o diferentes? Usar
α = 0.05 .

T1: 76, 85, 74, 78, 82, 75, 82.

T2: 57, 67, 55, 64, 61, 63, 63.

##SOLUCION

T1 <- c(76, 85, 74,78, 82, 75, 82) 
T2 <- c(57, 67, 55, 64, 61, 63, 63)

q1 <- qqnorm(T1, plot.it=FALSE)
q2 <- qqnorm(T2, plot.it=FALSE)
plot(range(q1$x, q2$x), range(q1$y, q2$y), type="n", las=1,
     xlab='Theoretical Quantiles', ylab='Sample Quantiles')
points(q1, pch=19)
points(q2, col="blue", pch=19)
qqline(T1, lty='dashed')
qqline(T2, col="blue", lty="dashed")
legend('topleft', legend=c('T1', 'T2'), bty='n',
       col=c('black', 'blue'), pch=19)

require(nortest)  
lillie.test(T1)$p.value
## [1] 0.520505
lillie.test(T2)$p.value
## [1] 0.3952748
stats::var.test(x=T1, y=T2, null.value=1, 
                alternative="two.sided",
                conf.level=0.95)
## 
##  F test to compare two variances
## 
## data:  T1 and T2
## F = 1.011, num df = 6, denom df = 6, p-value = 0.9897
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.1737219 5.8838861
## sample estimates:
## ratio of variances 
##           1.011019

ejemplo2 El arsénico en agua potable es un posible riesgo para la salud. Un artículo reciente reportó concentraciones de arsénico en agua potable en partes por billón (ppb) para diez comunidades urbanas y diez comunidades rurales. Los datos son los siguientes:

Urbana: 3, 7, 25, 10, 15, 6, 12, 25, 15, 7

Rural: 48, 44, 40, 38, 33, 21, 20, 12, 1, 18

##SOLUCION

urb <- c(3, 7, 25, 10, 15, 6, 12, 25, 15, 7)
rur <- c(48, 44, 40, 38, 33, 21, 20, 12, 1, 18)

require(nortest)  
lillie.test(urb)$p.value
## [1] 0.5522105
lillie.test(rur)$p.value
## [1] 0.6249628
stests::var.test(x=urb, y=rur, null.value=1, 
                 alternative="two.sided",
                 conf.level=0.95)
## 
##  F test to compare two variances
## 
## data:  urb  and  rur
## F = 0.24735, num df = 9, denom df = 9, p-value = 0.04936
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.06143758 0.99581888
## sample estimates:
## ratio of variances 
##          0.2473473

24.6 Prueba de hipótesis para la diferencia de medias μ1−μ2 con varianzas iguales

ejemplo

Retomando el ejemplo de los fríjoles, ¿existen diferencias entre los tiempos de cocción de los fríjoles con T1 y T2? Usar un nivel de significancia del 5%.

Primero se construirá un boxplot comparativo para los tiempos de cocción diferenciando por el tratamiento que recibieron. Abajo el código para obtener en este caso el boxplot. En la Figura 24.4 se muestra el boxplot, de esta figura se observa que las cajas de los boxplot no se traslapan, esto es un indicio de que las medias poblacionales,
μ1 y μ2, son diferentes, se observa también que el boxplot para el tratamiento T1 está por encima del T2.

##SOLUCION

datos <- data.frame(tiempo=c(T1, T2), trat=rep(1:2, each=7))
boxplot(tiempo ~ trat, data=datos, las=1,
        xlab='Tratamiento', ylab='Tiempo (min)')

t.test(x=T1, y=T2, alternative="two.sided", mu=0, 
       paired=FALSE, var.equal=TRUE, conf.level=0.97)
## 
##  Two Sample t-test
## 
## data:  T1 and T2
## t = 7.8209, df = 12, p-value = 4.737e-06
## alternative hypothesis: true difference in means is not equal to 0
## 97 percent confidence interval:
##  11.94503 22.91212
## sample estimates:
## mean of x mean of y 
##  78.85714  61.42857

24.7 Prueba de hipótesis para la diferencia de medias μ1−μ2 con varianzas diferentes

EJEMPLO

Retomando el ejemplo de la concentración de arsénico en el agua, ¿existen diferencias entre las concentraciones de arsénico de la zona urbana y rural? Usar un nivel de significancia del 5%.

Primero se construirá un boxplot comparativo para las concentraciones de arsénico diferenciando por la zona donde se tomaron las muestras. Abajo el código para obtener en este caso el boxplot. En la Figura 24.5 se muestra el boxplot, de esta figura se observa que las cajas de los boxplot no se traslapan, esto es un indicio de que las medias poblacionales, μ1y μ2, son diferentes, se observa también que el boxplot para la zona rural está por encima del de la zona urbana.

Solucion

datos <- data.frame(Concentracion=c(urb, rur),
                    Zona=rep(c('Urbana', 'Rural'), each=10))
boxplot(Concentracion ~ Zona, data=datos, las=1,
        xlab='Zona', ylab='Concentración arsénico (ppb)')

t.test(x=urb, y=rur, alternative="two.sided", mu=0, 
       paired=FALSE, var.equal=FALSE, conf.level=0.95)
## 
##  Welch Two Sample t-test
## 
## data:  urb and rur
## t = -2.7669, df = 13.196, p-value = 0.01583
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -26.694067  -3.305933
## sample estimates:
## mean of x mean of y 
##      12.5      27.5

24.8 Prueba de hipótesis para la diferencia de proporciones p1−p2

ejemplo Se quiere determinar si un cambio en el método de fabricación de una piezas ha sido efectivo o no. Para esta comparación se tomaron 2 muestras, una antes y otra después del cambio en el proceso y los resultados obtenidos son los siguientes.

Num piezas Antes Después Defectuosas 75 80 Analizadas 1500 2000 Realizar una prueba de hipótesis con un nivel de significancia del 10%.

SOLUCION

prop.test(x=c(75, 80), n=c(1500, 2000),
          alternative='greater', conf.level=0.90)
## 
##  2-sample test for equality of proportions with continuity correction
## 
## data:  c(75, 80) out of c(1500, 2000)
## X-squared = 1.7958, df = 1, p-value = 0.09011
## alternative hypothesis: greater
## 90 percent confidence interval:
##  0.0002765293 1.0000000000
## sample estimates:
## prop 1 prop 2 
##   0.05   0.04