Ejercicio 4-1 Bloques aleatorizados

Ejercicio 4-1

Un químico quiere probar el efecto de cuatro agentes químicos sobre la resistencia de un tipo particular de tela. Debido a que podría haber variabilidad de un rollo de tela a otro, el químico decide usar un diseño de bloques aleatorizados, con los rollos de tela considerados como bloques. Selecciona cinco rollos y aplica los cuatro agentes químicos de manera aleatoria a cada rollo. A continuación se presentan las resistencias a la tensión resultantes. Analizar los datos de este experimento (utilizar \(\alpha = 0.05\)) y sacar las conclusiones apropiadas.

Nuestras hipótesis a considerar serán las siguientes: Para el agente químico, nuestra hipótesis nula será que sus medias son iguales y la hipótesis alternativa será que al menos una de ellas difiere. Para el rollo de tela, la hipótesis nula será que sus medias son iguales y la hipótesis alternativa es que al menos una de ellas difiere.

Datos del estudio:

resistencia<-c(73,68,74,71,67,
               73,67,75,72,70,
               75,68,78,73,68,
               73,71,75,75,69)

agen_qui<-c(rep(1:4,rep(5,4)))
bloque<-c(rep(1:5))
rollo<-c(rep(bloque,4))
datos<-data.frame(agen_qui=factor(agen_qui,labels=c("I","II","III","IV")),
                  rollo=factor(rollo),resistencia)
resistencia<-as.numeric(resistencia)
agen_qui<-as.factor(agen_qui)
datos

##    agen_qui rollo resistencia
## 1         I     1          73
## 2         I     2          68
## 3         I     3          74
## 4         I     4          71
## 5         I     5          67
## 6        II     1          73
## 7        II     2          67
## 8        II     3          75
## 9        II     4          72
## 10       II     5          70
## 11      III     1          75
## 12      III     2          68
## 13      III     3          78
## 14      III     4          73
## 15      III     5          68
## 16       IV     1          73
## 17       IV     2          71
## 18       IV     3          75
## 19       IV     4          75
## 20       IV     5          69

A continuación, mostraremos la gráfica de caja y bigote de los datos anteriores.

par(mfrow=c(1,1))
boxplot(split(resistencia,agen_qui),xlab="Agente químico", ylab="Nivel de resistecia", sub="Figura_1", cex.sub=0.5)

Mostraremos la tabla de ANOVA correspondiente a los datos anteriores

modelo <- aov(resistencia ~ agen_qui + rollo, data = datos)
anova(modelo)

## Analysis of Variance Table
## 
## Response: resistencia
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## agen_qui   3  12.95   4.317  2.3761    0.1211    
## rollo      4 157.00  39.250 21.6055 2.059e-05 ***
## Residuals 12  21.80   1.817                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Teniendo en cuenta los datos obtenidos de la tabla de ANOVA, podemos hacer las siguientes afirmaciones:

Teniendo en cuenta que el valor p (del agente químico) obtenido en la tabla de ANOVA es mayor que el \(\alpha\) considerado en el problema, no hay suficiente evidencia para rechazar la hipótesis nula.
Teniendo en cuenta que el valor p (del rollo) obtenido en la tabla de ANOVA es menor que el \(\alpha\) considerado en el problema, entonces rechazamos la hipótesis nula y consideramos que al menos una de sus medias difiere

Validación del modelo ANOVA

A partir de los residuos del modelo, comprobaremos si el modelo ANOVA es adecuado. Los tres supuestos que se deben cumplir son: independencia, homocedasticidad y normalidad.

Independencia

Probaremos la independencia con la siguiente gráfica:

fitb <- fitted(modelo) 
res_stb <- rstandard(modelo)
plot(fitb,res_stb,xlab="Valores predichos", 
     ylab="Residuos estandarizados",abline(h=0),sub="Figura_2", cex.sub=0.5)

Como se puede observar en la figura 2, al ver que los datos están dispersos y no tienen una forma específica, podemos afirmar que son independientes.

Normalidad

Para probar la normalidad en el estudio, lo haremos a través de gráficas y utilizando el test de Shapiro-Wilk.

hist(modelo$res,sub="Figura_3", cex.sub=0.5)

Como podemos observar en la figura 3, el histograma no intenta tomar forma de campana de Gauss, lo cual es una indicación de que no hay normalidad en los datos.

library(car)

## Loading required package: carData

"Gráfico de QQ plot"

## [1] "Gráfico de QQ plot"

qqPlot(modelo,sub="Figura_4", cex.sub=0.5)

## [1] 10 13

Como podemos observar en la figura 4, algunos datos salen del límite de la zona azul, por lo tanto, no está siguiendo una distribución normal.

Si utilizamos el test de Shapiro-Wilk, tendremos lo siguiente:

shapiro.test(modelo$res)

## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$res
## W = 0.8996, p-value = 0.04054

Con lo cual podemos ver que el valor p es de 0.04054, lo cual es menor que el nivel de significancia (\(\alpha\)) escogido. Con esto podemos afirmar que se rechaza la hipótesis nula, la cual nos dice que existe una normalidad, y escogemos la hipótesis alternativa, la cual nos dice que no hay normalidad.

Homocedasticidad

Para demostrar si las varianzas son iguales o difieren, utilizaremos el test de Levene, ya que estamos en una distribución que no es normal.

leveneTest(resistencia ~ agen_qui)

## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.5815 0.6357
##       16

Observando los datos obtenidos del test de Levene, podemos decir que la hipótesis nula de que las varianzas son iguales se cumple, ya que el valor p es de 0.6357, lo que es mayor que \(\alpha\).

A continuación, analizaremos si existe una diferencia en la técnica de mezclado por pares. Mostraremos una tabla de datos y un gráfico para ilustrar.

intervals = TukeyHSD(modelo)
intervals

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = resistencia ~ agen_qui + rollo, data = datos)
## 
## $agen_qui
##        diff        lwr      upr     p adj
## II-I    0.8 -1.7308322 3.330832 0.7852734
## III-I   1.8 -0.7308322 4.330832 0.2042593
## IV-I    2.0 -0.5308322 4.530832 0.1417326
## III-II  1.0 -1.5308322 3.530832 0.6540138
## IV-II   1.2 -1.3308322 3.730832 0.5182726
## IV-III  0.2 -2.3308322 2.730832 0.9952030
## 
## $rollo
##      diff        lwr        upr     p adj
## 2-1 -5.00  -8.037831 -1.9621691 0.0015656
## 3-1  2.00  -1.037831  5.0378309 0.2814173
## 4-1 -0.75  -3.787831  2.2878309 0.9295872
## 5-1 -5.00  -8.037831 -1.9621691 0.0015656
## 3-2  7.00   3.962169 10.0378309 0.0000717
## 4-2  4.25   1.212169  7.2878309 0.0056966
## 5-2  0.00  -3.037831  3.0378309 1.0000000
## 4-3 -2.75  -5.787831  0.2878309 0.0830636
## 5-3 -7.00 -10.037831 -3.9621691 0.0000717
## 5-4 -4.25  -7.287831 -1.2121691 0.0056966

plot(intervals, sub="Figura 5", cex.sub=0.5)

Conclusión

Teniendo en cuenta todos los datos obtenidos, ahora de la tabla anterior y la primera figura 5, podemos decir que no hay diferencia entre los agentes químicos. Sin embargo, en la segunda gráfica de la figura 5 se nota que el tipo de rollo sí influye en la resistencia de la tela. Por otro lado, podemos ver que el rollo 5 y 2 difieren más que los otros, lo que significa que generan más ruido en el análisis, afectando el estudio. Se recomienda quitar los ruidos para ver con más claridad la relación en el estudio.