df<-read.csv("https://raw.githubusercontent.com/gidasan08/DExperimental/main/Taller%204-22.csv")
df

##    ï..Lote ConcAc Tiempo ConcCat  Y
## 1        1      1      A       a 26
## 2        2      1      B       c 18
## 3        3      1      C       e 20
## 4        4      1      D       b 15
## 5        5      1      E       d 10
## 6        1      2      B       b 16
## 7        2      2      C       d 21
## 8        3      2      D       a 12
## 9        4      2      E       c 15
## 10       5      2      A       e 24
## 11       1      3      C       c 19
## 12       2      3      D       e 18
## 13       3      3      E       b 16
## 14       4      3      A       d 22
## 15       5      3      B       a 17
## 16       1      4      D       d 16
## 17       2      4      E       a 11
## 18       3      4      A       c 25
## 19       4      4      B       e 14
## 20       5      4      C       b 17
## 21       1      5      E       e 13
## 22       2      5      A       b 21
## 23       3      5      B       d 13
## 24       4      5      C       a 17
## 25       5      5      D       c 14

df$ï..Lote=factor(df$ï..Lote)
df$ConcAc=factor(df$ConcAc)
df$Tiempo=factor(df$Tiempo)
df$ConcCat=factor(df$ConcCat)
df$Y=as.numeric(df$Y)
df

##    ï..Lote ConcAc Tiempo ConcCat  Y
## 1        1      1      A       a 26
## 2        2      1      B       c 18
## 3        3      1      C       e 20
## 4        4      1      D       b 15
## 5        5      1      E       d 10
## 6        1      2      B       b 16
## 7        2      2      C       d 21
## 8        3      2      D       a 12
## 9        4      2      E       c 15
## 10       5      2      A       e 24
## 11       1      3      C       c 19
## 12       2      3      D       e 18
## 13       3      3      E       b 16
## 14       4      3      A       d 22
## 15       5      3      B       a 17
## 16       1      4      D       d 16
## 17       2      4      E       a 11
## 18       3      4      A       c 25
## 19       4      4      B       e 14
## 20       5      4      C       b 17
## 21       1      5      E       e 13
## 22       2      5      A       b 21
## 23       3      5      B       d 13
## 24       4      5      C       a 17
## 25       5      5      D       c 14

modelo<-lm(Y~ï..Lote+ConcAc+Tiempo+ConcCat,data=df)
anova=aov(modelo)
summary(anova)

##             Df Sum Sq Mean Sq F value   Pr(>F)    
## ï..Lote      4   10.0    2.50   0.427 0.785447    
## ConcAc       4   24.4    6.10   1.043 0.442543    
## Tiempo       4  342.8   85.70  14.650 0.000941 ***
## ConcCat      4   12.0    3.00   0.513 0.728900    
## Residuals    8   46.8    5.85                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Anova

En el analisis de varianzas (anova) vemos que el efecto del Tiempo de procesamiento es significativo sobre el método empleado para el proceso químico, esto debido a que el valor de Pr es menor a 0.05. Por lo tanto esto indica que para el lote, concentración del ácido y concentración del catalizador, no hay diferencia estadíatica que indique influencia significativa sobre el proceso químico, con un 95% de confianza.

Normalidad de Residuales

qqnorm(anova$residuals)
qqline(anova$residuals)

Prueba de Shapiro

shapiro.test(anova$residuals)

## 
##  Shapiro-Wilk normality test
## 
## data:  anova$residuals
## W = 0.94721, p-value = 0.2167

Evaluando la gráfica de Quantiles y la prueba de Shapiro-wilk, se acepta la normalidad de los datos ya que P>0.05 con 95% de confianza.

library(car)

## Loading required package: carData

## Loading required package: carData
leveneTest(df$Y~df$Tiempo)

## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  4  0.1791 0.9465
##       20

Debido a que el valor de Pr>0.05 en la prueba de Levene, Se acepta igualdad en las varianzas con 95% de confianza.

boxplot(Y~Tiempo,data=df)

Basándonos en este boxplot, se acepta la homogeneidad de las varianzas, debido al ancho similar entre las cajas. Por otro lado podemos observar que el mejor tiempo de procesamiento es el A ya que proporciona un mayor rendimiento al proceso químico, mientras que el B,C,D y E no tienen un aporte significativo en el rendimiento, con un 95% de confianza.

plot(anova$residuals)

plot(df$Tiempo,anova$residuals)

En la caja de bigotes evidencia una buena distribución de todos los residuales, tanto arriba y abajo, con excepción en la D, ya que presenta mayor cantidad de datos anómalos ; de este mismo modo todas las cajas, menos la D contienen al cero. Por último se observa la variabilidad de la media, ya que no hay traslape entre las lineas centrales de cada caja. Con un 95% de confianza.

library(agricolae)
LSD<-LSD.test(anova,"Tiempo", group=T,console=T)

## 
## Study: anova ~ "Tiempo"
## 
## LSD t Test for Y 
## 
## Mean Square Error:  5.85 
## 
## Tiempo,  means and individual ( 95 %) CI
## 
##      Y      std r      LCL      UCL Min Max
## A 23.6 2.073644 5 21.10568 26.09432  21  26
## B 15.6 2.073644 5 13.10568 18.09432  13  18
## C 18.8 1.788854 5 16.30568 21.29432  17  21
## D 15.0 2.236068 5 12.50568 17.49432  12  18
## E 13.0 2.549510 5 10.50568 15.49432  10  16
## 
## Alpha: 0.05 ; DF Error: 8
## Critical Value of t: 2.306004 
## 
## least Significant Difference: 3.527508 
## 
## Treatments with the same letter are not significantly different.
## 
##      Y groups
## A 23.6      a
## C 18.8      b
## B 15.6     bc
## D 15.0      c
## E 13.0      c

bar.group(x=LSD$groups,horiz=T,col="yellow",xlab="Rendimiento",ylab="tiempo de procesamiento",xlim=c(0,28),main="Efecto del tiempo de procesamiento\n sobre el rendimiento del proceso químico")

Consideraciones

Según los analisis estadísticos realizados, pude concluir que uno de los factores estudiados que posee mayor influencia sobre el rendimiento eficiente del proceso químico es el tiempo de procesamiento. Puntualmente en el anova podemos observar que los demás factores como por ejemplo, Lote, Concentración del ácido o Concentración del catalizador influyen sobre el proceso con 95% de confianza, por lo tanto su uso queda a discreción del analista o laboratorio.

library(agricolae)
str(design.graeco)

## function (trt1, trt2, serie = 2, seed = 0, kinds = "Super-Duper", randomization = TRUE)

## function (t1, t2, serie = 2, seed = 0, kinds = "Super-Duper", randomization = TRUE)
Tiempo=1:5
ConcCat=1:5
outdesign=design.graeco(Tiempo,ConcCat,seed=543,serie=2)
print(outdesign$sketch)

##      [,1]  [,2]  [,3]  [,4]  [,5] 
## [1,] "4 3" "2 1" "3 5" "5 2" "1 4"
## [2,] "2 5" "3 2" "5 4" "1 3" "4 1"
## [3,] "3 4" "5 3" "1 1" "4 5" "2 2"
## [4,] "5 1" "1 5" "4 2" "2 4" "3 3"
## [5,] "1 2" "4 4" "2 3" "3 1" "5 5"

book=outdesign$book
book

##    plots row col Tiempo ConcCat
## 1    101   1   1      4       3
## 2    102   1   2      2       1
## 3    103   1   3      3       5
## 4    104   1   4      5       2
## 5    105   1   5      1       4
## 6    201   2   1      2       5
## 7    202   2   2      3       2
## 8    203   2   3      5       4
## 9    204   2   4      1       3
## 10   205   2   5      4       1
## 11   301   3   1      3       4
## 12   302   3   2      5       3
## 13   303   3   3      1       1
## 14   304   3   4      4       5
## 15   305   3   5      2       2
## 16   401   4   1      5       1
## 17   402   4   2      1       5
## 18   403   4   3      4       2
## 19   404   4   4      2       4
## 20   405   4   5      3       3
## 21   501   5   1      1       2
## 22   502   5   2      4       4
## 23   503   5   3      2       3
## 24   504   5   4      3       1
## 25   505   5   5      5       5

ConcCat<-c("$\\alpha$","$\\beta$","$\\gamma$","$\\delta$","$\\epsilon$")
Tiempo<-LETTERS[1:5]
i=outdesign$book$ConcCat
j=outdesign$book$Tiempo
book$ConcCat=sapply(i,function(i) ConcCat[i])
book$Tiempo=sapply(j,function(j) Tiempo[j])
knitr::kable(book, align = "lcccc",caption = "Diseño de Cuadrado Latino")

Diseño de Cuadrado Latino
plots	row	col	Tiempo	ConcCat
101	1	1	D	\(\gamma\)
102	1	2	B	\(\alpha\)
103	1	3	C	\(\epsilon\)
104	1	4	E	\(\beta\)
105	1	5	A	\(\delta\)
201	2	1	B	\(\epsilon\)
202	2	2	C	\(\beta\)
203	2	3	E	\(\delta\)
204	2	4	A	\(\gamma\)
205	2	5	D	\(\alpha\)
301	3	1	C	\(\delta\)
302	3	2	E	\(\gamma\)
303	3	3	A	\(\alpha\)
304	3	4	D	\(\epsilon\)
305	3	5	B	\(\beta\)
401	4	1	E	\(\alpha\)
402	4	2	A	\(\epsilon\)
403	4	3	D	\(\beta\)
404	4	4	B	\(\delta\)
405	4	5	C	\(\gamma\)
501	5	1	A	\(\beta\)
502	5	2	D	\(\delta\)
503	5	3	B	\(\gamma\)
504	5	4	C	\(\alpha\)
505	5	5	E	\(\epsilon\)

Problema 4.22

Giancarlos Santos

10/10/2021

Anova

Normalidad de Residuales

Prueba de Shapiro

Consideraciones