El rendimiento de un proceso químico se midió utilizando cinco lotes de materia prima, cinco concentraciones del ácido, cinco tiempos de procesamiento (A,B,C,D y E) y cinco concentraciones del catalizador (alpha, beta, gamma, delta y epsilon). Se usó el cuadrado grecolatino siguiente. Analizar los datos de este experimento (utilizar alfa=0.05) y sacar conclusiones.
df=read.csv("https://raw.githubusercontent.com/HSolis08/D.experimental/main/datos4-22.csv")
df$lote=factor(df$lote)
df$ac=factor(df$ac)
df$tiempo=factor(df$tiempo)
df$cat=factor(df$cat)
df$Y=as.numeric(df$Y)
df
## lote ac tiempo cat Y
## 1 1 1 A 1 26
## 2 1 2 B 2 16
## 3 1 3 C 3 19
## 4 1 4 D 4 16
## 5 1 5 E 5 13
## 6 2 1 B 3 18
## 7 2 2 C 4 21
## 8 2 3 D 5 18
## 9 2 4 E 1 11
## 10 2 5 A 2 21
## 11 3 1 C 5 20
## 12 3 2 D 1 12
## 13 3 3 E 2 16
## 14 3 4 A 3 25
## 15 3 5 B 4 13
## 16 4 1 D 2 15
## 17 4 2 E 3 15
## 18 4 3 A 4 22
## 19 4 4 B 5 14
## 20 4 5 C 1 17
## 21 5 1 E 4 10
## 22 5 2 A 5 24
## 23 5 3 B 1 17
## 24 5 4 C 2 17
## 25 5 5 D 3 14
griegas=c("$\\alpha$","$\\beta$","$\\gamma$","$\\delta$","$\\epsilon$")
i=df$cat
df$cat=sapply(i,function(i)griegas[i])
knitr::kable(df, align = "lccc",caption = "Diseño de Cuadrado Greco-Latino")
| lote | ac | tiempo | cat | Y |
|---|---|---|---|---|
| 1 | 1 | A | \(\alpha\) | 26 |
| 1 | 2 | B | \(\beta\) | 16 |
| 1 | 3 | C | \(\gamma\) | 19 |
| 1 | 4 | D | \(\delta\) | 16 |
| 1 | 5 | E | \(\epsilon\) | 13 |
| 2 | 1 | B | \(\gamma\) | 18 |
| 2 | 2 | C | \(\delta\) | 21 |
| 2 | 3 | D | \(\epsilon\) | 18 |
| 2 | 4 | E | \(\alpha\) | 11 |
| 2 | 5 | A | \(\beta\) | 21 |
| 3 | 1 | C | \(\epsilon\) | 20 |
| 3 | 2 | D | \(\alpha\) | 12 |
| 3 | 3 | E | \(\beta\) | 16 |
| 3 | 4 | A | \(\gamma\) | 25 |
| 3 | 5 | B | \(\delta\) | 13 |
| 4 | 1 | D | \(\beta\) | 15 |
| 4 | 2 | E | \(\gamma\) | 15 |
| 4 | 3 | A | \(\delta\) | 22 |
| 4 | 4 | B | \(\epsilon\) | 14 |
| 4 | 5 | C | \(\alpha\) | 17 |
| 5 | 1 | E | \(\delta\) | 10 |
| 5 | 2 | A | \(\epsilon\) | 24 |
| 5 | 3 | B | \(\alpha\) | 17 |
| 5 | 4 | C | \(\beta\) | 17 |
| 5 | 5 | D | \(\gamma\) | 14 |
modelo<-lm(Y~lote+ac+tiempo+cat,data=df)
anova=aov(modelo)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## lote 4 10.0 2.50 0.427 0.785447
## ac 4 24.4 6.10 1.043 0.442543
## tiempo 4 342.8 85.70 14.650 0.000941 ***
## cat 4 12.0 3.00 0.513 0.728900
## Residuals 8 46.8 5.85
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Análisis: Solo el tiempo de procesamiento influye significativamente sobre el rendimiento de un proceso químico a un 95 % de confianza, debido al valor de p inferior al 0.05; mientras que el lote, la concentración de ácido y catalizador no infuyen en el proceso.
boxplot(Y~tiempo,data=df,col=c("red","violet","purple","skyblue","blue"))
library(agricolae)
LSD<-LSD.test(anova,"tiempo",group=T,console=T)
##
## Study: anova ~ "tiempo"
##
## LSD t Test for Y
##
## Mean Square Error: 5.85
##
## tiempo, means and individual ( 95 %) CI
##
## Y std r LCL UCL Min Max
## A 23.6 2.073644 5 21.10568 26.09432 21 26
## B 15.6 2.073644 5 13.10568 18.09432 13 18
## C 18.8 1.788854 5 16.30568 21.29432 17 21
## D 15.0 2.236068 5 12.50568 17.49432 12 18
## E 13.0 2.549510 5 10.50568 15.49432 10 16
##
## Alpha: 0.05 ; DF Error: 8
## Critical Value of t: 2.306004
##
## least Significant Difference: 3.527508
##
## Treatments with the same letter are not significantly different.
##
## Y groups
## A 23.6 a
## C 18.8 b
## B 15.6 bc
## D 15.0 c
## E 13.0 c
bar.group(x=LSD$groups,horiz=T,col="violet",xlim=c(0,27),xlab="Rendimiento del proceso",ylab="Tiempo de procesamiento",main="Proceso químico")
Análisis: En el gráfico de caja el tiempo A posee el mayor rendimiento, lo que se corrobora en la prueba LSD donde el tiempo A es significativamente diferente a los demás, mientras que entre el C y el B no existe diferencia significativa al igual que entre el B, D y E.
qqnorm(anova$residuals)
qqline(anova$residuals,col="blue",lwd=2)
shapiro.test(anova$residuals)
##
## Shapiro-Wilk normality test
##
## data: anova$residuals
## W = 0.94721, p-value = 0.2167
Análisis: En el gráfico de residuales, la dispersión es homogenea y cercana a la diagonal, lo cual es indicativo de datos normales; mientras que el valor de p mayor a 0.05 en la prueba de shapiro es indicativo de normalidad.
library(car)
## Loading required package: carData
leveneTest(df$Y~df$tiempo)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 4 0.1791 0.9465
## 20
Análisis: De acuerdo al valor p de la prueba mayor a 0.05, no hay diferencias significativa en la varianza de los datos.
plot(anova$residuals)
abline(h=0)
plot(df$tiempo,anova$residuals,col=c("red","violet","purple","skyblue","blue") )
Análisis: En los tiempos de procesamiento B, C y D, hay residuales atípicos. En el gráfico de residuos la distribución es aleatoria.
El único factor de este estudio que influye en el rendimiento de un proceso químico es el tiempo de procesamiento, a un 95 % de confianza. Los datos cumplen con los supuestos de normalidad y homocedasticidad. En cuanto al tiempo de procesamiento el A presentó el mejor rendimiento.