Resolución del Problema 3.12

En un centro de investigación se realiza un estudio para comparar varios tratamientos que, al aplicarse previamente a los frijoles crudos, reducen su tiempo de cocción. Estos tratamientos son a base de bicarbonato de sodio (NaHCO3) y cloruro de sodio o sal común (NaCl). El primer tratamiento es el de control, que consiste en no aplicar ningún tratamiento. El tratamiento T2 es el remojo en agua con bicarbonato de sodio, el T3 es remojar en agua con sal común y el T4 es remojar en agua con una combinación de ambos ingredientes en proporciones iguales. La variable de respuesta es el tiempo de cocción en minutos. Los datos se muestran en la siguiente tabla:

Problema 3-12: Tratamiento de remojo de frijoles

Entrada de los datos

df=read.csv("https://raw.githubusercontent.com/PGBeermann/DisenoExperimental/main/ProbCap3-12.csv")

str(df)
## 'data.frame':    28 obs. of  2 variables:
##  $ Tratamiento: chr  "Control" "Control" "Control" "Control" ...
##  $ Tiempo     : int  213 214 204 208 212 200 207 76 85 74 ...
df$Tratamiento=factor(df$Tratamiento)

Boxplot: Comparación de tratamientos

boxplot(Tiempo~Tratamiento,data=df,main="Comparacion del tiempo de cocción con\n diferentes tratamientos")

Análisis de ANOVA

modelo=aov(Tiempo~Tratamiento,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value Pr(>F)    
## Tratamiento  3  95041   31680    1559 <2e-16 ***
## Residuals   24    488      20                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El p_valor=2e-16<0.05 sugiere diferencias significativas entre las medias de los diferentes tratamientos.

Prueba de comparaciones múltiples: TukeyHSD

tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Tiempo ~ Tratamiento, data = df)
## 
## $Tratamiento
##                   diff           lwr        upr     p adj
## T2-Control -129.428571 -136.07568671 -122.78146 0.0000000
## T3-Control -146.857143 -153.50425813 -140.21003 0.0000000
## T4-Control -122.714286 -129.36140099 -116.06717 0.0000000
## T3-T2       -17.428571  -24.07568671  -10.78146 0.0000010
## T4-T2         6.714286    0.06717044   13.36140 0.0471059
## T4-T3        24.142857   17.49574187   30.78997 0.0000000
plot(tk)

Al comprar las medias de los diferentes valores obtenemos p_valores<0.05 por lo que existe diferencias significativas entre todos los tratamientos.

Prueba de normalidad de los datos del ANOVA: Shapiro-Wilks

qqnorm(modelo$residuals)
qqline(modelo$residuals)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.95991, p-value = 0.3469

La prueba de Shapiro-Wilks arroja un valor de p=0.3469 por lo que se acepta Ho: los datos siguen una distribución normal

Prueba de Levene para la igualdad de varianzas: homoscedasticidad

library(car)
## Loading required package: carData
leveneTest(df$Tiempo~df$Tratamiento)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.1631 0.9201
##       24

La prueba de Levene indica que las varianzas son iguales a un nivel de significancia de 95%

Prueba de independencia de los error de los datos

plot(modelo$residuals)
abline(h=0)

plot(df$Tratamiento,modelo$residuals)
abline(h=0)

plot(modelo$fitted.values,modelo$residuals)
abline(h=0)

CONCLUSIÓN