Problema 4-14

Se estudia el efecto de cinco ingredientes diferentes (A,B,C,D y E) sobre el tiempo de reacción de un proceso químico. Cada lote de material nuevo sólo alcanza para permitir la realización de cinco corridas. Además cada corrida requiere aproximadamente una hora y media, por lo que sólo pueden realizarse cinco corridas en un día. El experimentador decide realizar el experimento como un cuadrado latino para que los efectos del día y el lote puedan controlarse sistemáticamente. Obtiene los datos que se muestran enseguida. Analizar los datos de este experimento (utilizar alfa =0.05) y sacar conclusiones.

Datos

df=read.csv("https://raw.githubusercontent.com/HSolis08/D.experimental/main/datos4-14.csv")
df$Lote=factor(df$Lote)
df$Dia=factor(df$Dia)
df$Ing=factor(df$Ing)
df$Y=as.numeric(df$Y)
df
##    Lote Dia Ing  Y
## 1     1   1   A  8
## 2     1   2   B  7
## 3     1   3   D  1
## 4     1   4   C  7
## 5     1   5   E  3
## 6     2   1   C 11
## 7     2   2   E  2
## 8     2   3   A  7
## 9     2   4   D  3
## 10    2   5   B  8
## 11    3   1   B  4
## 12    3   2   A  9
## 13    3   3   C 10
## 14    3   4   E  1
## 15    3   5   D  5
## 16    4   1   D  6
## 17    4   2   C  8
## 18    4   3   E  6
## 19    4   4   B  6
## 20    4   5   A 10
## 21    5   1   E  4
## 22    5   2   D  2
## 23    5   3   B  3
## 24    5   4   A  8
## 25    5   5   C  8

Prueba de ANOVA

modelo<-lm(Y~Lote+Dia+Ing,data=df)
anova=aov(modelo)
summary(anova)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Lote         4  15.44    3.86   1.235 0.347618    
## Dia          4  12.24    3.06   0.979 0.455014    
## Ing          4 141.44   35.36  11.309 0.000488 ***
## Residuals   12  37.52    3.13                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Análisis: En la prueba de anova a un 95 % de confianza el lote y el día no influyen en el tiempo de reacción del proceso químico porque su valor de p es mayor a 0.05; pero en el caso de los ingredientes, si influye a 95 % de confianza en el tiempo de reacción del proceso químico porque su valor de p es menor a 0.05.

Pruebas para identificar la diferencia en las media de ingredientes

boxplot(Y~Ing,data=df)

library(agricolae)
LSD<-LSD.test(anova,"Ing",group=T,console=T)
## 
## Study: anova ~ "Ing"
## 
## LSD t Test for Y 
## 
## Mean Square Error:  3.126667 
## 
## Ing,  means and individual ( 95 %) CI
## 
##     Y      std r      LCL       UCL Min Max
## A 8.4 1.140175 5 6.677038 10.122962   7  10
## B 5.6 2.073644 5 3.877038  7.322962   3   8
## C 8.8 1.643168 5 7.077038 10.522962   7  11
## D 3.4 2.073644 5 1.677038  5.122962   1   6
## E 3.2 1.923538 5 1.477038  4.922962   1   6
## 
## Alpha: 0.05 ; DF Error: 12
## Critical Value of t: 2.178813 
## 
## least Significant Difference: 2.436636 
## 
## Treatments with the same letter are not significantly different.
## 
##     Y groups
## C 8.8      a
## A 8.4      a
## B 5.6      b
## D 3.4      b
## E 3.2      b
bar.group(x=LSD$groups,horiz=T,col="skyblue",xlim=c(0,10),xlab="Tiempo de reacción",ylab="Ingrediente",main="Proceso químico")

Análisis: Entre los ingredientes B, D y E no existe diferencia significativa y en los A y C no existe diferencia significativa. Pero entre estos dos grupos de ingredientes si existe diferencia significativa a un 95% de confianza. Lo que se puede observar cualitativamente en la gráfica de cajas donde los ingredientes B, D y E presentaron menos tiempo de reacción y en la prueba LSD, donde cada grupo esta simbolizado con una letra minuscula la cual si es igual significa que no hay diferencia pero si es diferente hay diferencias significativa.

Prueba de normalidad

Gráficos de residuales
qqnorm(anova$residuals)
qqline(anova$residuals,col="blue",lwd=2)

Prueba de Shapiro
shapiro.test(anova$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  anova$residuals
## W = 0.96606, p-value = 0.5476

Análisis: Según el gráfico de residuales se puede observar una distribución, de los residuales, cercana a la línea diagonal, lo cual supone normalidad de los datos y en la prueba de shapiro, al ser el valor de p mayor de 0.05 se acepta que los datos son normales.

Prueba de varianza

library(car)
## Loading required package: carData
leveneTest(df$Y~df$Ing)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  4  0.4444 0.7751
##       20

Análisis: Los datos poseen valores con varianzas significativamente iguales debido al valor de p mayor a 0.05.

Prueba de independencia

plot(anova$residuals)
abline(h=0)

plot(df$Ing,anova$residuals)

Análisis: En los gráficos se puede observar una distribución equitativa de los residuales y todas las cajas de los datos se encuentran enlazadas por la línea media, se concluye que los datos son independientes.

Conclusión

El efecto del lote y día en el proceso no es significativo a un 95 % de confianza; por tanto, los ingredientes son el único factor que afecta el tiempo de reacción del proceso químico. Además, las diferencias significativas encontradas en los ingredientes son entre B, D y E, los cuales presentaron menores tiempos de reacción respecto a los A y C. Los resultados cumplen con la homocedasticidad, normalidad e independencia para la realización de la prueba de ANOVA.