df<-read.csv("https://raw.githubusercontent.com/gidasan08/DExperimental/main/Taller%204-14.csv")
df
## ï..Lote Dia Trat Y
## 1 1 1 A 8
## 2 2 1 C 11
## 3 3 1 B 4
## 4 4 1 D 6
## 5 5 1 E 4
## 6 1 2 B 7
## 7 2 2 E 2
## 8 3 2 A 9
## 9 4 2 C 8
## 10 5 2 D 2
## 11 1 3 D 1
## 12 2 3 A 7
## 13 3 3 C 10
## 14 4 3 E 6
## 15 5 3 B 3
## 16 1 4 C 7
## 17 2 4 D 3
## 18 3 4 E 1
## 19 4 4 B 6
## 20 5 4 A 8
## 21 1 5 E 3
## 22 2 5 B 8
## 23 3 5 D 5
## 24 4 5 A 10
## 25 5 5 C 8
df$ï..Lote=factor(df$ï..Lote)
df$Dia=factor(df$Dia)
df$Trat=factor(df$Trat)
df$Y=as.numeric(df$Y)
df
## ï..Lote Dia Trat Y
## 1 1 1 A 8
## 2 2 1 C 11
## 3 3 1 B 4
## 4 4 1 D 6
## 5 5 1 E 4
## 6 1 2 B 7
## 7 2 2 E 2
## 8 3 2 A 9
## 9 4 2 C 8
## 10 5 2 D 2
## 11 1 3 D 1
## 12 2 3 A 7
## 13 3 3 C 10
## 14 4 3 E 6
## 15 5 3 B 3
## 16 1 4 C 7
## 17 2 4 D 3
## 18 3 4 E 1
## 19 4 4 B 6
## 20 5 4 A 8
## 21 1 5 E 3
## 22 2 5 B 8
## 23 3 5 D 5
## 24 4 5 A 10
## 25 5 5 C 8
Ho= μ1=μ2=μ3=μ4 HA= μ1≠μ2
modelo<-lm(Y~ï..Lote+Dia+Trat,data=df)
anova=aov(modelo)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## ï..Lote 4 15.44 3.86 1.235 0.347618
## Dia 4 12.24 3.06 0.979 0.455014
## Trat 4 141.44 35.36 11.309 0.000488 ***
## Residuals 12 37.52 3.13
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El anova nos demuestra que el efecto de los ingredientes(Trat) es significativo sobre el tiempo de reacción, ya que el valor de Pr menor a 0.05. Mientras que para el día y lote no hay diferencia estadíatica que indique que exista influencia de reacción sobre el proceso químico.
qqnorm(anova$residuals)
qqline(anova$residuals)
shapiro.test(anova$residuals)
##
## Shapiro-Wilk normality test
##
## data: anova$residuals
## W = 0.96606, p-value = 0.5476
Basado en la distribución de normalidad de la gráfica de Quantiles , como en la prueba de Shapiro, se acepta la normalidad de los datos ya que P>0.05
library(car)
## Loading required package: carData
## Loading required package: carData
leveneTest(df$Y~df$Trat)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 4 0.4444 0.7751
## 20
Se acepta que son varianzas iguales ya que P>0.05
boxplot(Y~Trat,data=df)
En este boxplot, podemos aceptar la homogeneidad de las varianzas, ya que presentan particularmente el mismo ancho. Por otro lado podemos observar que los mejores ingredientes son el D,B y E, ya que presentan un menor tiempo de reacción, mientras que el A y C un tiempo de reacción mayor.
plot(anova$residuals)
Existe buena distribución de los datos, sin sesgo, con 95% de confianza
plot(df$Trat,anova$residuals)
En el analisis de caja y bigotes tenemos una buena distribución de los datos,hacia arriba y hacia abajo; de igual forma todas las cajas contienen al cero y también se observa la variabilidad de la media, ya que ninguna linea se traslapa.
library(agricolae)
LSD<-LSD.test(anova,"Trat", group=T,console=T)
##
## Study: anova ~ "Trat"
##
## LSD t Test for Y
##
## Mean Square Error: 3.126667
##
## Trat, means and individual ( 95 %) CI
##
## Y std r LCL UCL Min Max
## A 8.4 1.140175 5 6.677038 10.122962 7 10
## B 5.6 2.073644 5 3.877038 7.322962 3 8
## C 8.8 1.643168 5 7.077038 10.522962 7 11
## D 3.4 2.073644 5 1.677038 5.122962 1 6
## E 3.2 1.923538 5 1.477038 4.922962 1 6
##
## Alpha: 0.05 ; DF Error: 12
## Critical Value of t: 2.178813
##
## least Significant Difference: 2.436636
##
## Treatments with the same letter are not significantly different.
##
## Y groups
## C 8.8 a
## A 8.4 a
## B 5.6 b
## D 3.4 b
## E 3.2 b
Los tratamientos con el grupo de letras A, c; E, D y B no presentan diferencias significativas con 95% de confianza.
bar.group(x=LSD$groups,horiz=T,col="green",xlab="Tiempo de reacción",ylab="Ingredientes",xlim=c(0,12),main="Efecto de ingredientes\n sobre el tiempo de reacción")
EL efecto de cada ingrediente fue interesante, ya que que los ingredientes C y A presentaron similitud en el tiempo de reacción, asi mismo los ingredientes D y E, sin embargo el B difiere de los otros 4 ingredientes.
En el analisis de las diferentes pruebas estadisticas, podemos observar un efecto significativo de los ingredientes sobre el tiempo de reacción del proceso químico, por ejemplo en los residuales vemos una distribución normal y homogeneidad en el conjunto de datos. La gráfica horizontal nos muestra el efecto de los ingredientes en dos grupos: el mayor tiempo de reacción es debido a los ingredientes A y C como se muestra en el ultimo gráfico, mientras que los ingredientes D y E poseen un efecto similar entre en el tiempo de reacción del proceso químico, en cambio el B otorga una interaccion intermedia entre ambos grupos, por lo tanto se puede decir con un 95% de confianza que es posible utilizarlos, sin embargo su selección podría estar relacionada al costo - beneficio.