Resolución del Problema 3-12

En un centro de investigación se realiza un estudio para comparar varios tratamientos que, al aplicarse previamente a los frijoles crudos, reducen su tiempo de cocción. Estos tratamientos son a base de bicarbonato de sodio (NaHCO3) y cloruro de sodio o sal común (NaCl). El primer tratamiento es el de control, que consiste en no aplicar ningún tratamiento. El tratamiento T2 es el remojo en agua con bicarbonato de sodio, el T3 es remojar en agua con sal común y el T4 es remojar en agua con una combinación de ambos ingredientes en proporciones iguales. La variable de respuesta es el tiempo de cocción en minutos. Los datos se muestran en la siguiente tabla: getwd()

Entrada de datos

df=read.csv("https://raw.githubusercontent.com/mylenats/TareasDExperimental/main/cap3p12.csv",sep=";")
df
##    Tratamiento tiempo
## 1      Control    213
## 2      Control    214
## 3      Control    204
## 4      Control    208
## 5      Control    212
## 6      Control    200
## 7      Control    207
## 8           T2     76
## 9           T2     85
## 10          T2     74
## 11          T2     78
## 12          T2     82
## 13          T2     75
## 14          T2     82
## 15          T3     57
## 16          T3     67
## 17          T3     55
## 18          T3     64
## 19          T3     61
## 20          T3     63
## 21          T3     63
## 22          T4     82
## 23          T4     85
## 24          T4     92
## 25          T4     87
## 26          T4     79
## 27          T4     90
df$Tratamiento=factor(df$Tratamiento)

Boxplot

boxplot(tiempo~Tratamiento,data=df)

Análisis de ANOVA

modelo=aov(tiempo~Tratamiento,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value Pr(>F)    
## Tratamiento  3  94420   31473    1493 <2e-16 ***
## Residuals   23    485      21                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El valor de P_valor=2e-16<0.05 sugiere diferencias entre las medias de los diferentes tratamientos.

Pruebas de comparaciones múltiples: TukeyHSD

tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = tiempo ~ Tratamiento, data = df)
## 
## $Tratamiento
##                  diff           lwr        upr     p adj
## T2-Control -129.42857 -136.21990802 -122.63723 0.0000000
## T3-Control -146.85714 -153.64847945 -140.06581 0.0000000
## T4-Control -122.45238 -129.52102819 -115.38373 0.0000000
## T3-T2       -17.42857  -24.21990802  -10.63723 0.0000018
## T4-T2         6.97619   -0.09245676   14.04484 0.0539588
## T4-T3        24.40476   17.33611467   31.47341 0.0000000
plot(tk)

A diferentes valores obtenemos p_valores<0.05 por lo que existe diferencias significativas entre todos los tratamientos

Prueba de Shapiro-Wilks

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.95141, p-value = 0.232

La prueba de Shapiro Wilkins arroja un valor de p=0.232, por lo que se acepta Ho.= los datos siguen una distribución normal

Prueba de Levene para la igualdad de varianzas: Homoscedasticidad

library(car)
## Loading required package: carData
leveneTest(tiempo~Tratamiento,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.1943 0.8992
##       23

La prueba de Levene indica que las varianzas son iguales a un nivel de significancia de 95%

Prueba de independencia de error de los datos

plot(modelo$residuals)
abline(h=0)

plot(df$Tratamiento,modelo$residuals)
abline(h=0)

plot(modelo$fitted.values, modelo$residuals)
abline(h=0)

Conclusiones