Problema 12 capitulo 3

En un centro de investigación se realiza un estudio para comparar varios tratamientos que, al aplicarse previamente a los frijoles crudos, reducen su tiempo de cocción. Estos tratamientos son a base de bicarbonato de sodio (NaHCO3) y cloruro de sodio o sal común (NaCl). El primer tratamiento es el de control, que consiste en no aplicar ningún tratamiento. El tratamiento T2 es el remojo en agua con bicarbonato de sodio, el T3 es remojar en agua con sal común y el T4 es remojar en agua con una combinacion de ambos ingredientes en proporciones iguales. La variable de respuesta es el tiempo de cocción en minutos. Los datos se muestran en la siguiente tabla

Lectura de datos

df=read.csv("https://raw.githubusercontent.com/leslyrodriguez/DisenoExperimental/main/problema%2012.csv",sep = ";")
df
##          T   Y
## 1  Control 213
## 2  Control 214
## 3  Control 204
## 4  Control 208
## 5  Control 212
## 6  Control 200
## 7  Control 207
## 8       T2  76
## 9       T2  85
## 10      T2  74
## 11      T2  78
## 12      T2  82
## 13      T2  75
## 14      T2  82
## 15      T3  57
## 16      T3  67
## 17      T3  55
## 18      T3  64
## 19      T3  61
## 20      T3  63
## 21      T3  63
## 22      T4  84
## 23      T4  82
## 24      T4  85
## 25      T4  92
## 26      T4  87
## 27      T4  79
## 28      T4  90
df$T=factor(df$T)
str(df)
## 'data.frame':    28 obs. of  2 variables:
##  $ T: Factor w/ 4 levels "Control","T2",..: 1 1 1 1 1 1 1 2 2 2 ...
##  $ Y: int  213 214 204 208 212 200 207 76 85 74 ...

Boxplot:Comparación de tratamientos

boxplot(Y~T,data=df,main="Comparación de tratamientos")

## Análisis de varianza (ANOVA)

modelo=aov(Y~T,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value Pr(>F)    
## T            3  95041   31680    1559 <2e-16 ***
## Residuals   24    488      20                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El valor de p=2e-16<0.05 sugiere diferencia significativa entre las medias de los diferentes tratamientos

Prueba de TukeyHSD (pueba de comparaciones múltiples)

tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ T, data = df)
## 
## $T
##                   diff           lwr        upr     p adj
## T2-Control -129.428571 -136.07568671 -122.78146 0.0000000
## T3-Control -146.857143 -153.50425813 -140.21003 0.0000000
## T4-Control -122.714286 -129.36140099 -116.06717 0.0000000
## T3-T2       -17.428571  -24.07568671  -10.78146 0.0000010
## T4-T2         6.714286    0.06717044   13.36140 0.0471059
## T4-T3        24.142857   17.49574187   30.78997 0.0000000
plot(tk)

Al comparar las medias de los diferentes valores p-valores <0.05 existe diferencia significativa entre los tratamientos ## Prueba de Shapiro (Normalidad)

qqnorm(modelo$residuals)
qqline(modelo$residuals)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.95991, p-value = 0.3469

La prueba de Shapiro Wilks arroja un valor de p=0.3469 por lo que se acepta H0,los datos siguen una distribucion normal

Prueba de leveneTest (Varianza de los grupos)

library("car")
## Loading required package: carData
leveneTest(Y~T,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.1631 0.9201
##       24

Esta prueba indica que las varianzas son iguales a un nivel de significancia del 95%

Prueba de independencia de los errores de los datos

plot(modelo$residuals)
abline(h=0)

plot(df$T,modelo$residuals)
abline(h=0)

plot(modelo$fitted.values, modelo$residuals)
abline(h=0)

Estan balanceado los datos con respecto a la linea. Los datos son independientes.