Problema 4-22

El rendimiento de un proceso químico se midió utilizando cinco lotes de materia prima, cinco concentraciones del ácido, cinco tiempos de procesamiento (A,B,C,D y E) y cinco concentraciones del catalizador (alpha, beta, gamma, delta y epsilon). Se usó el cuadrado grecolatino siguiente. Analizar los datos de este experimento (utilizar alfa=0.05) y sacar conclusiones.

Datos

df=read.csv("https://raw.githubusercontent.com/HSolis08/D.experimental/main/datos4-22.csv")
df$lote=factor(df$lote)
df$ac=factor(df$ac)
df$tiempo=factor(df$tiempo)
df$cat=factor(df$cat)
df$Y=as.numeric(df$Y)
df
##    lote ac tiempo cat  Y
## 1     1  1      A   1 26
## 2     1  2      B   2 16
## 3     1  3      C   3 19
## 4     1  4      D   4 16
## 5     1  5      E   5 13
## 6     2  1      B   3 18
## 7     2  2      C   4 21
## 8     2  3      D   5 18
## 9     2  4      E   1 11
## 10    2  5      A   2 21
## 11    3  1      C   5 20
## 12    3  2      D   1 12
## 13    3  3      E   2 16
## 14    3  4      A   3 25
## 15    3  5      B   4 13
## 16    4  1      D   2 15
## 17    4  2      E   3 15
## 18    4  3      A   4 22
## 19    4  4      B   5 14
## 20    4  5      C   1 17
## 21    5  1      E   4 10
## 22    5  2      A   5 24
## 23    5  3      B   1 17
## 24    5  4      C   2 17
## 25    5  5      D   3 14
griegas=c("$\\alpha$","$\\beta$","$\\gamma$","$\\delta$","$\\epsilon$")
i=df$cat
df$cat=sapply(i,function(i)griegas[i])
knitr::kable(df, align = "lccc",caption = "Diseño de Cuadrado Greco-Latino")
Diseño de Cuadrado Greco-Latino
lote ac tiempo cat Y
1 1 A \(\alpha\) 26
1 2 B \(\beta\) 16
1 3 C \(\gamma\) 19
1 4 D \(\delta\) 16
1 5 E \(\epsilon\) 13
2 1 B \(\gamma\) 18
2 2 C \(\delta\) 21
2 3 D \(\epsilon\) 18
2 4 E \(\alpha\) 11
2 5 A \(\beta\) 21
3 1 C \(\epsilon\) 20
3 2 D \(\alpha\) 12
3 3 E \(\beta\) 16
3 4 A \(\gamma\) 25
3 5 B \(\delta\) 13
4 1 D \(\beta\) 15
4 2 E \(\gamma\) 15
4 3 A \(\delta\) 22
4 4 B \(\epsilon\) 14
4 5 C \(\alpha\) 17
5 1 E \(\delta\) 10
5 2 A \(\epsilon\) 24
5 3 B \(\alpha\) 17
5 4 C \(\beta\) 17
5 5 D \(\gamma\) 14

Prueba de ANOVA

modelo<-lm(Y~lote+ac+tiempo+cat,data=df)
anova=aov(modelo)
summary(anova)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## lote         4   10.0    2.50   0.427 0.785447    
## ac           4   24.4    6.10   1.043 0.442543    
## tiempo       4  342.8   85.70  14.650 0.000941 ***
## cat          4   12.0    3.00   0.513 0.728900    
## Residuals    8   46.8    5.85                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Análisis: Solo el tiempo de procesamiento influye significativamente sobre el rendimiento de un proceso químico a un 95 % de confianza, debido al valor de p inferior al 0.05; mientras que el lote, la concentración de ácido y catalizador no infuyen en el proceso.

boxplot(Y~tiempo,data=df,col=c("red","violet","purple","skyblue","blue"))

Prueba LSD

library(agricolae)
LSD<-LSD.test(anova,"tiempo",group=T,console=T)
## 
## Study: anova ~ "tiempo"
## 
## LSD t Test for Y 
## 
## Mean Square Error:  5.85 
## 
## tiempo,  means and individual ( 95 %) CI
## 
##      Y      std r      LCL      UCL Min Max
## A 23.6 2.073644 5 21.10568 26.09432  21  26
## B 15.6 2.073644 5 13.10568 18.09432  13  18
## C 18.8 1.788854 5 16.30568 21.29432  17  21
## D 15.0 2.236068 5 12.50568 17.49432  12  18
## E 13.0 2.549510 5 10.50568 15.49432  10  16
## 
## Alpha: 0.05 ; DF Error: 8
## Critical Value of t: 2.306004 
## 
## least Significant Difference: 3.527508 
## 
## Treatments with the same letter are not significantly different.
## 
##      Y groups
## A 23.6      a
## C 18.8      b
## B 15.6     bc
## D 15.0      c
## E 13.0      c
bar.group(x=LSD$groups,horiz=T,col="violet",xlim=c(0,27),xlab="Rendimiento del proceso",ylab="Tiempo de procesamiento",main="Proceso químico")

Análisis: En el gráfico de caja el tiempo A posee el mayor rendimiento, lo que se corrobora en la prueba LSD donde el tiempo A es significativamente diferente a los demás, mientras que entre el C y el B no existe diferencia significativa al igual que entre el B, D y E.

Prueba de normalidad

Gráficos de residuales
qqnorm(anova$residuals)
qqline(anova$residuals,col="blue",lwd=2)

Prueba de Shapiro
shapiro.test(anova$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  anova$residuals
## W = 0.94721, p-value = 0.2167

Análisis: En el gráfico de residuales, la dispersión es homogenea y cercana a la diagonal, lo cual es indicativo de datos normales; mientras que el valor de p mayor a 0.05 en la prueba de shapiro es indicativo de normalidad.

Prueba de varianza

library(car)
## Loading required package: carData
leveneTest(df$Y~df$tiempo)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  4  0.1791 0.9465
##       20

Análisis: De acuerdo al valor p de la prueba mayor a 0.05, no hay diferencias significativa en la varianza de los datos.

Prueba de independencia

plot(anova$residuals)
abline(h=0)

plot(df$tiempo,anova$residuals,col=c("red","violet","purple","skyblue","blue") )

Análisis: En los tiempos de procesamiento B, C y D, hay residuales atípicos. En el gráfico de residuos la distribución es aleatoria.

Conclusión

El único factor de este estudio que influye en el rendimiento de un proceso químico es el tiempo de procesamiento, a un 95 % de confianza. Los datos cumplen con los supuestos de normalidad y homocedasticidad. En cuanto al tiempo de procesamiento el A presentó el mejor rendimiento.