Se estudia el efecto de cinco ingredientes diferentes (A,B,C,D y E) sobre el tiempo de reacción de un proceso químico. Cada lote de material nuevo sólo alcanza para permitir la realización de cinco corridas. Además cada corrida requiere aproximadamente una hora y media, por lo que sólo pueden realizarse cinco corridas en un día. El experimentador decide realizar el experimento como un cuadrado latino para que los efectos del día y el lote puedan controlarse sistemáticamente. Obtiene los datos que se muestran enseguida. Analizar los datos de este experimento (utilizar alfa =0.05) y sacar conclusiones.

tratamiento <- factor(c("A","B","C","D","E","B","E","A","C","D","D","A","C","E","B","C","D","E","B","A","E","B","D","A","C"))
dias <- factor(c(rep(1:5,rep(5,5))))
lotes_mat_p <- factor(c(rep(c(rep(1:5)),5)))
carga_prop <- c(8,11,4,6,4,7,2,9,8,2,1,7,10,6,3,7,3,1,6,8,3,8,5,10,8)
datos <- data.frame(tratamiento, dias, lotes_mat_p, carga_prop)
datos
##    tratamiento dias lotes_mat_p carga_prop
## 1            A    1           1          8
## 2            B    1           2         11
## 3            C    1           3          4
## 4            D    1           4          6
## 5            E    1           5          4
## 6            B    2           1          7
## 7            E    2           2          2
## 8            A    2           3          9
## 9            C    2           4          8
## 10           D    2           5          2
## 11           D    3           1          1
## 12           A    3           2          7
## 13           C    3           3         10
## 14           E    3           4          6
## 15           B    3           5          3
## 16           C    4           1          7
## 17           D    4           2          3
## 18           E    4           3          1
## 19           B    4           4          6
## 20           A    4           5          8
## 21           E    5           1          3
## 22           B    5           2          8
## 23           D    5           3          5
## 24           A    5           4         10
## 25           C    5           5          8

Análisis de varianza

modelo <- aov(carga_prop~tratamiento+lotes_mat_p+dias)
anova=aov(modelo)
summary(anova)
##             Df Sum Sq Mean Sq F value Pr(>F)   
## tratamiento  4 116.24  29.060   5.608 0.0088 **
## lotes_mat_p  4  15.97   3.993   0.771 0.5647   
## dias         4  12.24   3.060   0.590 0.6760   
## Residuals   12  62.19   5.182                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

En la prueba de anova el lote y el dia no influyen en el tiempo de reacción del proceso químico porque su valor de p es mayor a 0.05.En el caso de los ingredientes si influye en el tiempo de reacción del proceso químico porque su valor de p es menor a 0.05.

Prueba DMS

library(agricolae)



prueba_DMS <- TukeyHSD(modelo)


prueba_DMS
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = carga_prop ~ tratamiento + lotes_mat_p + dias)
## 
## $tratamiento
##     diff       lwr        upr     p adj
## B-A -1.4 -5.989115  3.1891154 0.8624262
## C-A -1.0 -5.589115  3.5891154 0.9538446
## D-A -5.0 -9.589115 -0.4108846 0.0307024
## E-A -5.2 -9.789115 -0.6108846 0.0241848
## C-B  0.4 -4.189115  4.9891154 0.9984985
## D-B -3.6 -8.189115  0.9891154 0.1547403
## E-B -3.8 -8.389115  0.7891154 0.1241573
## D-C -4.0 -8.589115  0.5891154 0.0991137
## E-C -4.2 -8.789115  0.3891154 0.0787973
## E-D -0.2 -4.789115  4.3891154 0.9999027
## 
## $lotes_mat_p
##      diff       lwr      upr     p adj
## 2-1  1.08 -3.509115 5.669115 0.9399956
## 3-1  0.52 -4.069115 5.109115 0.9958488
## 4-1  2.00 -2.589115 6.589115 0.6452941
## 5-1 -0.20 -4.789115 4.389115 0.9999027
## 3-2 -0.56 -5.149115 4.029115 0.9944866
## 4-2  0.92 -3.669115 5.509115 0.9654984
## 5-2 -1.28 -5.869115 3.309115 0.8955719
## 4-3  1.48 -3.109115 6.069115 0.8378649
## 5-3 -0.72 -5.309115 3.869115 0.9858005
## 5-4 -2.20 -6.789115 2.389115 0.5651189
## 
## $dias
##     diff       lwr      upr     p adj
## 2-1 -1.0 -5.589115 3.589115 0.9538446
## 3-1 -1.2 -5.789115 3.389115 0.9150122
## 4-1 -1.6 -6.189115 2.989115 0.7977728
## 5-1  0.2 -4.389115 4.789115 0.9999027
## 3-2 -0.2 -4.789115 4.389115 0.9999027
## 4-2 -0.6 -5.189115 3.989115 0.9928319
## 5-2  1.2 -3.389115 5.789115 0.9150122
## 4-3 -0.4 -4.989115 4.189115 0.9984985
## 5-3  1.4 -3.189115 5.989115 0.8624262
## 5-4  1.8 -2.789115 6.389115 0.7241298
intervals = TukeyHSD(modelo)
intervals
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = carga_prop ~ tratamiento + lotes_mat_p + dias)
## 
## $tratamiento
##     diff       lwr        upr     p adj
## B-A -1.4 -5.989115  3.1891154 0.8624262
## C-A -1.0 -5.589115  3.5891154 0.9538446
## D-A -5.0 -9.589115 -0.4108846 0.0307024
## E-A -5.2 -9.789115 -0.6108846 0.0241848
## C-B  0.4 -4.189115  4.9891154 0.9984985
## D-B -3.6 -8.189115  0.9891154 0.1547403
## E-B -3.8 -8.389115  0.7891154 0.1241573
## D-C -4.0 -8.589115  0.5891154 0.0991137
## E-C -4.2 -8.789115  0.3891154 0.0787973
## E-D -0.2 -4.789115  4.3891154 0.9999027
## 
## $lotes_mat_p
##      diff       lwr      upr     p adj
## 2-1  1.08 -3.509115 5.669115 0.9399956
## 3-1  0.52 -4.069115 5.109115 0.9958488
## 4-1  2.00 -2.589115 6.589115 0.6452941
## 5-1 -0.20 -4.789115 4.389115 0.9999027
## 3-2 -0.56 -5.149115 4.029115 0.9944866
## 4-2  0.92 -3.669115 5.509115 0.9654984
## 5-2 -1.28 -5.869115 3.309115 0.8955719
## 4-3  1.48 -3.109115 6.069115 0.8378649
## 5-3 -0.72 -5.309115 3.869115 0.9858005
## 5-4 -2.20 -6.789115 2.389115 0.5651189
## 
## $dias
##     diff       lwr      upr     p adj
## 2-1 -1.0 -5.589115 3.589115 0.9538446
## 3-1 -1.2 -5.789115 3.389115 0.9150122
## 4-1 -1.6 -6.189115 2.989115 0.7977728
## 5-1  0.2 -4.389115 4.789115 0.9999027
## 3-2 -0.2 -4.789115 4.389115 0.9999027
## 4-2 -0.6 -5.189115 3.989115 0.9928319
## 5-2  1.2 -3.389115 5.789115 0.9150122
## 4-3 -0.4 -4.989115 4.189115 0.9984985
## 5-3  1.4 -3.189115 5.989115 0.8624262
## 5-4  1.8 -2.789115 6.389115 0.7241298
plot(intervals)

Pruebas para identificar la diferencia en las media de ingredientes

library(agricolae)
LSD<-LSD.test(anova,"tratamiento",group=T,console=T)
## 
## Study: anova ~ "tratamiento"
## 
## LSD t Test for carga_prop 
## 
## Mean Square Error:  5.182222 
## 
## tratamiento,  means and individual ( 95 %) CI
## 
##   carga_prop      std r       LCL      UCL Min Max
## A        8.4 1.140175 5 6.1818397 10.61816   7  10
## B        7.0 2.915476 5 4.7818397  9.21816   3  11
## C        7.4 2.190890 5 5.1818397  9.61816   4  10
## D        3.4 2.073644 5 1.1818397  5.61816   1   6
## E        3.2 1.923538 5 0.9818397  5.41816   1   6
## 
## Alpha: 0.05 ; DF Error: 12
## Critical Value of t: 2.178813 
## 
## least Significant Difference: 3.136952 
## 
## Treatments with the same letter are not significantly different.
## 
##   carga_prop groups
## A        8.4      a
## C        7.4      a
## B        7.0      a
## D        3.4      b
## E        3.2      b
bar.group(x=LSD$groups,horiz=T,col="skyblue",xlim=c(0,10),xlab="Tiempo de reacción",ylab="Ingrediente",main="Proceso químico")

Entre los ingredientes A, C y B no existe diferencia significativa y en los D y E tampoco. Pero entre estos dos grupos de ingredientes si existe diferencia significativa. podemos ver en la gráfica que los ingredientes D y E presentaron menor tiempo de reacción que los ingredientes A, C y B que presentaron un mayor tiempo de reacción en la prueba LSD.

Prueba de normalidad Shapiro-Wilk

Hipótesis

Ho: Los residuos siguen la distribución normal

Ha: Los residuos no siguen la distribución normal

shapiro.test(modelo$res)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$res
## W = 0.97297, p-value = 0.7209
hist(modelo$res)

Como el p valor es mayor a 0.05 se acepta la hipotesis nula, es decir Los residuos siguen la distribución normal.

library(car)
## Loading required package: carData
qqPlot(modelo)

## [1]  3 13
fitb <- fitted(modelo) 



res_stb <- rstandard(modelo)

plot(fitb,res_stb,xlab="Valores predichos", 
     ylab="Residuos estandarizados",abline(h=0))

En los gráficos se puede ver una distribución equitativa de los residuales por lo que se concluye que los datos son independientes.

Prueba de Bartlett

Hipótesis

Ho: Los tratamientos tienen varianzas iguales

Ha: Los tratamientos tienen varianzas diferentes

bartlett.test(carga_prop ~lotes_mat_p)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  carga_prop by lotes_mat_p
## Bartlett's K-squared = 2.1504, df = 4, p-value = 0.7081
bartlett.test(carga_prop ~dias)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  carga_prop by dias
## Bartlett's K-squared = 0.29268, df = 4, p-value = 0.9903
bartlett.test(carga_prop ~tratamiento)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  carga_prop by tratamiento
## Bartlett's K-squared = 2.9257, df = 4, p-value = 0.5703

Los datos poseen varianzas iguales debido al valor de p valor es mayor a 0.05.

Conclusión

El efecto del lote y día en el proceso no es significativo. Sin embargo, los ingredientes afectan el tiempo de reacción del proceso químico. Además, hay diferencias significativas encontradas en los ingredientes entre el grupo A, C y B, los cuales presentaron mayor tiempos de reacción respecto al grupo D y E que fueron los que presentaron menor tiempo de reacción. Los resultados cumplen con la homocedasticidad, normalidad e independencia para la realización de la prueba de ANOVA.