Se estudia el efecto de cinco ingredientes diferentes (A,B,C,D y E) sobre el tiempo de reacción de un proceso químico. Cada lote de material nuevo sólo alcanza para permitir la realización de cinco corridas. Además cada corrida requiere aproximadamente una hora y media, por lo que sólo pueden realizarse cinco corridas en un día. El experimentador decide realizar el experimento como un cuadrado latino para que los efectos del día y el lote puedan controlarse sistemáticamente. Obtiene los datos que se muestran enseguida. Analizar los datos de este experimento (utilizar alfa =0.05) y sacar conclusiones.
df=read.csv("https://raw.githubusercontent.com/HSolis08/D.experimental/main/datos4-14.csv")
df$Lote=factor(df$Lote)
df$Dia=factor(df$Dia)
df$Ing=factor(df$Ing)
df$Y=as.numeric(df$Y)
df
## Lote Dia Ing Y
## 1 1 1 A 8
## 2 1 2 B 7
## 3 1 3 D 1
## 4 1 4 C 7
## 5 1 5 E 3
## 6 2 1 C 11
## 7 2 2 E 2
## 8 2 3 A 7
## 9 2 4 D 3
## 10 2 5 B 8
## 11 3 1 B 4
## 12 3 2 A 9
## 13 3 3 C 10
## 14 3 4 E 1
## 15 3 5 D 5
## 16 4 1 D 6
## 17 4 2 C 8
## 18 4 3 E 6
## 19 4 4 B 6
## 20 4 5 A 10
## 21 5 1 E 4
## 22 5 2 D 2
## 23 5 3 B 3
## 24 5 4 A 8
## 25 5 5 C 8
modelo<-lm(Y~Lote+Dia+Ing,data=df)
anova=aov(modelo)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## Lote 4 15.44 3.86 1.235 0.347618
## Dia 4 12.24 3.06 0.979 0.455014
## Ing 4 141.44 35.36 11.309 0.000488 ***
## Residuals 12 37.52 3.13
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Análisis: En la prueba de anova a un 95 % de confianza el lote y el día no influyen en el tiempo de reacción del proceso químico porque su valor de p es mayor a 0.05; pero en el caso de los ingredientes, si influye a 95 % de confianza en el tiempo de reacción del proceso químico porque su valor de p es menor a 0.05.
boxplot(Y~Ing,data=df)
library(agricolae)
LSD<-LSD.test(anova,"Ing",group=T,console=T)
##
## Study: anova ~ "Ing"
##
## LSD t Test for Y
##
## Mean Square Error: 3.126667
##
## Ing, means and individual ( 95 %) CI
##
## Y std r LCL UCL Min Max
## A 8.4 1.140175 5 6.677038 10.122962 7 10
## B 5.6 2.073644 5 3.877038 7.322962 3 8
## C 8.8 1.643168 5 7.077038 10.522962 7 11
## D 3.4 2.073644 5 1.677038 5.122962 1 6
## E 3.2 1.923538 5 1.477038 4.922962 1 6
##
## Alpha: 0.05 ; DF Error: 12
## Critical Value of t: 2.178813
##
## least Significant Difference: 2.436636
##
## Treatments with the same letter are not significantly different.
##
## Y groups
## C 8.8 a
## A 8.4 a
## B 5.6 b
## D 3.4 b
## E 3.2 b
bar.group(x=LSD$groups,horiz=T,col="skyblue",xlim=c(0,10),xlab="Tiempo de reacción",ylab="Ingrediente",main="Proceso químico")
Análisis: Entre los ingredientes B, D y E no existe diferencia significativa y en los A y C no existe diferencia significativa. Pero entre estos dos grupos de ingredientes si existe diferencia significativa a un 95% de confianza. Lo que se puede observar cualitativamente en la gráfica de cajas donde los ingredientes B, D y E presentaron menos tiempo de reacción y en la prueba LSD, donde cada grupo esta simbolizado con una letra minuscula la cual si es igual significa que no hay diferencia pero si es diferente hay diferencias significativa.
qqnorm(anova$residuals)
qqline(anova$residuals,col="blue",lwd=2)
shapiro.test(anova$residuals)
##
## Shapiro-Wilk normality test
##
## data: anova$residuals
## W = 0.96606, p-value = 0.5476
Análisis: Según el gráfico de residuales se puede observar una distribución, de los residuales, cercana a la línea diagonal, lo cual supone normalidad de los datos y en la prueba de shapiro, al ser el valor de p mayor de 0.05 se acepta que los datos son normales.
library(car)
## Loading required package: carData
leveneTest(df$Y~df$Ing)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 4 0.4444 0.7751
## 20
Análisis: Los datos poseen valores con varianzas significativamente iguales debido al valor de p mayor a 0.05.
plot(anova$residuals)
abline(h=0)
plot(df$Ing,anova$residuals)
Análisis: En los gráficos se puede observar una distribución equitativa de los residuales y todas las cajas de los datos se encuentran enlazadas por la línea media, se concluye que los datos son independientes.
El efecto del lote y día en el proceso no es significativo a un 95 % de confianza; por tanto, los ingredientes son el único factor que afecta el tiempo de reacción del proceso químico. Además, las diferencias significativas encontradas en los ingredientes son entre B, D y E, los cuales presentaron menores tiempos de reacción respecto a los A y C. Los resultados cumplen con la homocedasticidad, normalidad e independencia para la realización de la prueba de ANOVA.