Una joven, que acababa de seguir un curso de tres días en diseño experimental decidió intentar aplicar su conocimiento adquirido para analizar el efecto de los reactivos sobre la viscosidad de una mezcla de reacción. En primer momento detectó tres variables que podrían haber sido relevantes: eran las cantidades de tres reactivos (llamémoslos A, B y C). La formulación original era de 10 g de A, 4 g de B y 10 g de C. Decidió mantener este escenario experimental como punto de partida y para explorar sus alrededores. Dado que el número de experimentos posibles fue bastante limitado, decidió aplicar un Diseño Factorial 2^3, requiriendo un total de ocho experimentos. Realice el análisis de anova de estos datos experimentales y redacte un informe con las conclusiones pertinentes.
df=read.csv("https://raw.githubusercontent.com/HSolis08/D.experimental/main/p-1.csv")
df$A=factor(df$A)
df$B=factor(df$B)
df$C=factor(df$C)
df
## A B C V
## 1 -1 -1 -1 51.8
## 2 1 -1 -1 51.6
## 3 -1 1 -1 51.0
## 4 1 1 -1 42.4
## 5 -1 -1 1 50.2
## 6 1 -1 1 46.6
## 7 -1 1 1 52.0
## 8 1 1 1 50.0
A=rep(c(-1,1),4)
B=rep(c(-1,-1,1,1),2)
C=rep(c(rep(-1,4),rep(1,4)))
AB=A*B
AC=A*C
BC=B*C
ABC=A*B*C
run=1:8
names=c("run","A","B","C","AB","AC","BC","ABC")
knitr::kable(cbind(run,A,B,C,AB,AC,BC,ABC),colnames=names)
| run | A | B | C | AB | AC | BC | ABC |
|---|---|---|---|---|---|---|---|
| 1 | -1 | -1 | -1 | 1 | 1 | 1 | -1 |
| 2 | 1 | -1 | -1 | -1 | -1 | 1 | 1 |
| 3 | -1 | 1 | -1 | -1 | 1 | -1 | 1 |
| 4 | 1 | 1 | -1 | 1 | -1 | -1 | -1 |
| 5 | -1 | -1 | 1 | 1 | -1 | -1 | 1 |
| 6 | 1 | -1 | 1 | -1 | 1 | -1 | -1 |
| 7 | -1 | 1 | 1 | -1 | -1 | 1 | -1 |
| 8 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
modelo=lm(V~A*B*C,data=df)
anova=aov(modelo)
summary(anova)
## Df Sum Sq Mean Sq
## A 1 25.92 25.92
## B 1 2.88 2.88
## C 1 0.50 0.50
## A:B 1 5.78 5.78
## A:C 1 1.28 1.28
## B:C 1 28.88 28.88
## A:B:C 1 12.50 12.50
modelo2=lm(V~A+B+C+AB+AC+BC,data=df)
anova2=aov(modelo2)
summary(anova2)
## Df Sum Sq Mean Sq F value Pr(>F)
## A 1 25.92 25.92 2.074 0.386
## B 1 2.88 2.88 0.230 0.715
## C 1 0.50 0.50 0.040 0.874
## AB 1 5.78 5.78 0.462 0.620
## AC 1 1.28 1.28 0.102 0.803
## BC 1 28.88 28.88 2.310 0.370
## Residuals 1 12.50 12.50
R/. Según la prueba de anova no existe diferencia significativa de los efectos principales A, B y C y de las interacciones entre estos efectos, debido a que presenta un valor de p mayor a 0.05.
library(pid)
## Registered S3 method overwritten by 'DoE.base':
## method from
## factorize.factor conf.design
paretoPlot(anova2)
R/. Según la gráfica de pareto el factor A posee una mayor influencia negativa sobre la viscocidad y la interacción B:C influye positivamente sobre la viscocidad; sin embargo, no es significativo según anova.
interaction.plot(df$A,df$B,df$V)
interaction.plot(df$A,df$C,df$V)
interaction.plot(df$B,df$C,df$V)
R/. En los tres gráficos de interacción se puede observar que existe interacción entre los factores A, B y C.
qqnorm(anova2$residuals)
qqline(anova2$residuals)
shapiro.test(anova2$residuals)
##
## Shapiro-Wilk normality test
##
## data: anova2$residuals
## W = 0.66466, p-value = 0.0008917
R/. En el gráfico se puede observar cualitativamente la no distribución normal de los datos, lo cual se corrobora con la prueba de shapiro donde el valor de p es menor a 0.05; por tanto la distribución no es normal.
library(car)
## Loading required package: carData
leveneTest(df$V~df$A)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 6.1375 0.04797 *
## 6
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
leveneTest(df$V~df$B)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.2416 0.6405
## 6
leveneTest(df$V~df$C)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.2317 0.6474
## 6
R/. Solo hay diferencia significativa en la varianza para el factor A, con un valor levemente por debajo de 0.05, por tanto puede con una prueba más robusta ser no significativa.
plot(anova2$residuals)
abline(h=0)
R/. Los datos visualmente no parecen ser aleatorios, por tanto no hay independencia.
Según los resultados obtenidos la prueba de anova no sería válida debido a la violación del supuesto de normalidad; sin embargo, con esos resultados se puede decir que ningún factor y ninguna interacción influyen sobre la viscosidad de una mezcla de reacción. Para mejorar el diseño se deben realizar dos o más réplicas de cada experimento, según lo recomendado para este diseño.
Se desea comparar dos tratamientos para reducir el nivel de colesterol en la sangre. Se seleccionan 20 individuos y se asignan al azar a dos tipos de dietas: A y B. La tabla muestra la reducción conseguida después de dos meses.
A=c(51.3,39.4,26.3,39.0,48.1,34.2,69.8,31.3,45.2,46.4)
B=c(29.6,47.0,25.9,13.0,33.1,22.1,34.1,19.5,43.8,24.9)
Reduc=data.frame(A=A,B=B)
Reduc
## A B
## 1 51.3 29.6
## 2 39.4 47.0
## 3 26.3 25.9
## 4 39.0 13.0
## 5 48.1 33.1
## 6 34.2 22.1
## 7 69.8 34.1
## 8 31.3 19.5
## 9 45.2 43.8
## 10 46.4 24.9
df2<-stack(Reduc)
names(df2)<-c("Y","Dieta")
df2
## Y Dieta
## 1 51.3 A
## 2 39.4 A
## 3 26.3 A
## 4 39.0 A
## 5 48.1 A
## 6 34.2 A
## 7 69.8 A
## 8 31.3 A
## 9 45.2 A
## 10 46.4 A
## 11 29.6 B
## 12 47.0 B
## 13 25.9 B
## 14 13.0 B
## 15 33.1 B
## 16 22.1 B
## 17 34.1 B
## 18 19.5 B
## 19 43.8 B
## 20 24.9 B
boxplot(Y~Dieta,data=df2,col=c("red","violet"))
### Prueba t no pareada Ho:mA=mB Ha:mA no es igual a mB
t.test(A,B,alternative="two.sided", paired=FALSE,conf.level = 0.95)
##
## Welch Two Sample t-test
##
## data: A and B
## t = 2.6965, df = 17.62, p-value = 0.01495
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 3.031382 24.568618
## sample estimates:
## mean of x mean of y
## 43.1 29.3
qt(0.975,df=18)
## [1] 2.100922
R/. Al ser el valor de t calculada (2.696) mayor al t critico (2.10), a un 95 % de confianza se acepta la hipótesis alterna que hace referencia a diferencia significativa entre las medias de las dietas.
modelo3<-aov(Y~Dieta,data=df2)
summary(modelo3)
## Df Sum Sq Mean Sq F value Pr(>F)
## Dieta 1 952.2 952.2 7.271 0.0148 *
## Residuals 18 2357.2 131.0
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
R/. Hipótesis: Ho:mA=mB Ha:mA no es igual a mB
Se rechaza la hipótesis nula, por tanto existe diferencia significativa en el nivel de colesterol entre las dietas A y B a un 95 % de confianza.
shapiro.test(modelo3$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo3$residuals
## W = 0.96153, p-value = 0.5749
R/. Por el valor de p mayor a 0.05 se dice que los datos son normales.
library(car)
leveneTest(df2$Y~df2$Dieta)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.0713 0.7925
## 18
R/. Por el valor de p mayor a 0.05, hay homocedasticidad en los valores.
plot(modelo3$residuals)
abline(h=0)
R/. Los datos estan distribuidos de forma aleatoria, evidencia cualitativa de independencia.
Las dietas para disminuir el colesterol en sangre presentan diferencias significativas a un 95 % de confianza según la prueba t no pareada y anova. Además en la gráfica de caja y bigote se puede observar que la dieta B presenta menores valores de colesterol respecto a la dieta A, sin embargo presenta una mayor dispersión en los resultados obtenidos. Cabe señalar que los datos cumplen los supuestos de normalidad, homocedasticidad e independencia,
Se desea comparar el rendimiento de cuatro semillas A,B,C y D. Un terreno se divide en 24 parcelas similares y se asigna al azar cada semilla a 6 parcelas.
Rend<-c(229.1,233.4,211.1,270.4,253.7,233.0,223.1,248.6,241.3,219.2,217.5,230.0,254.7,200.0,211.8,250.7,237.2,224.3,207.6,230.0,241.3,202.0,213.7,245.8)
Sem<-rep(rep(c("A","B","C","D")),6)
df3<-data.frame(Sem,Rend)
df3$Sem<-factor(df3$Sem)
df3$Rend<-as.numeric(df3$Rend)
df3
## Sem Rend
## 1 A 229.1
## 2 B 233.4
## 3 C 211.1
## 4 D 270.4
## 5 A 253.7
## 6 B 233.0
## 7 C 223.1
## 8 D 248.6
## 9 A 241.3
## 10 B 219.2
## 11 C 217.5
## 12 D 230.0
## 13 A 254.7
## 14 B 200.0
## 15 C 211.8
## 16 D 250.7
## 17 A 237.2
## 18 B 224.3
## 19 C 207.6
## 20 D 230.0
## 21 A 241.3
## 22 B 202.0
## 23 C 213.7
## 24 D 245.8
boxplot(Rend~Sem,data=df3,col=c("red","violet","skyblue","blue"))
R/. En este gráfico se puede observar que las semillas B y C son las que presentan menos rendimiento y las A y D son las que presentan mayor rendimiento.
Ho: no hay diferencia significativa entre las media. Ha: Al menos una media es diferente.
modelo3<-aov(Rend~Sem,data=df3)
summary(modelo3)
## Df Sum Sq Mean Sq F value Pr(>F)
## Sem 3 4796 1598.5 11.22 0.000156 ***
## Residuals 20 2850 142.5
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
R/. Según el resultado obtenido de p menor a 0.05 se rechaza la Ho; por tanto, al menos una media es diferente a las demás.
tk<-TukeyHSD(modelo3)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Rend ~ Sem, data = df3)
##
## $Sem
## diff lwr upr p adj
## B-A -24.233333 -43.52416 -4.942506 0.0107428
## C-A -28.750000 -48.04083 -9.459173 0.0024478
## D-A 3.033333 -16.25749 22.324160 0.9707614
## C-B -4.516667 -23.80749 14.774160 0.9124326
## D-B 27.266667 7.97584 46.557494 0.0039938
## D-C 31.783333 12.49251 51.074160 0.0008966
plot(tk)
library(agricolae)
LSD<-LSD.test(y=modelo3,trt="Sem",group=T)
bar.group(x=LSD$groups,horiz=TRUE,col="blue",xlim=c(0,275),xlab="Rendimiento", ylab="Semilla", main="Rendimiento de las semillas")
R/. Con la prueba de Tukey y LSD, se utilizan para identificar cuales medias son significativamente diferentes. En ambas las semillas D-A y B-C poseen medias iguales mientras que A-B, C-D, A-C y B-D, presentan diferencias significativas en sus medias.
qqnorm(modelo3$residuals)
qqline(modelo3$residuals)
shapiro.test(modelo3$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo3$residuals
## W = 0.96731, p-value = 0.6012
R/. Gráficamente se puede observar de forma cualitativa la distribución normal de los datos sobre la diagonal, y en la prueba de shapiro se corrobora la distribución normal con un valor de p mayor a 0.05.
library(car)
leveneTest(modelo3)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 3 1.3745 0.2793
## 20
R/. Con un valor de p mayor a 0.05 en la prueba de Levene, no hay diferencia significativa en las varianzas.
plot(modelo3$residuals)
abline(h=0)
plot(df3$Rend,modelo3$residuals,col="purple")
abline(h=0)
plot(modelo3$fitted.values,modelo3$residuals)
abline(h=0)
R/. Cualitativamente se puede observar en las gráficas la independencia de los resultados por medio de los residuales, porque se encuentran distribuidos de forma aleatoria.
El rendimiento de las cuatro semillas presenta diferencia significativa a un 95 % de confianza, según la prueba de Anova, encontrandose la semilla A y D en un grupo con medias iguales y presentan el mayor redimiento en en otro grupo las semillas C y B con rendimientos menores. Los resultados cumplen los supuestos de normalidad, homocedasticidad e independencia necesarios para la realización de la prueba de ANOVA.
Se ha realizado un experimento para medir el tiempo de combustión de unas muestras de cuatro fibras diferentes. En la tabla siguiente se proporcionan los resultados obtenidos (en segundos). Haga un análisis de anova de estos resultados.
df4=read.csv("https://raw.githubusercontent.com/HSolis08/D.experimental/main/P-4.csv")
df4$Fibra<-factor(df4$Fibra)
df4$tc<-as.numeric(df4$tc)
df4
## Fibra tc
## 1 F1 17.8
## 2 F1 16.2
## 3 F1 17.5
## 4 F1 17.4
## 5 F1 15.0
## 6 F2 11.2
## 7 F2 11.4
## 8 F2 15.8
## 9 F2 10.0
## 10 F2 10.4
## 11 F3 11.8
## 12 F3 11.0
## 13 F3 10.0
## 14 F3 9.2
## 15 F3 9.2
## 16 F4 14.9
## 17 F4 10.8
## 18 F4 12.8
## 19 F4 10.7
## 20 F4 10.7
boxplot(tc~Fibra,data=df4,col=c("red","violet","skyblue","blue"))
R/. En este gráfico se puede observar que Fibra F1 presenta el mayor tiempo de combustión, además visualmente difiere de las otras tres fibras. Además para la F2 se observa un posible valor outlier.
Ho: no hay diferencia significativa entre las media. Ha: Al menos una media es diferente.
modelo4<-aov(tc~Fibra,data=df4)
summary(modelo4)
## Df Sum Sq Mean Sq F value Pr(>F)
## Fibra 3 120.50 40.17 13.89 0.000102 ***
## Residuals 16 46.26 2.89
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
R/. Según el resultado obtenido de p menor a 0.05 se rechaza la Ho; por tanto, al menos una media es diferente a las demás.
tk<-TukeyHSD(modelo4)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = tc ~ Fibra, data = df4)
##
## $Fibra
## diff lwr upr p adj
## F2-F1 -5.02 -8.09676 -1.94324 0.0013227
## F3-F1 -6.54 -9.61676 -3.46324 0.0000851
## F4-F1 -4.80 -7.87676 -1.72324 0.0019981
## F3-F2 -1.52 -4.59676 1.55676 0.5094118
## F4-F2 0.22 -2.85676 3.29676 0.9968426
## F4-F3 1.74 -1.33676 4.81676 0.3968476
plot(tk)
R/. Según la prueba de Tukey, las fibras que presentan valores de p menores a 0.05 y en la gráfica las que no pasan por cero presentan diferencias significativas entre ellas.
library(agricolae)
LSD<-LSD.test(y=modelo4,trt="Fibra",group=T)
bar.group(x=LSD$groups,horiz=TRUE,col="blue",xlim=c(0,20),xlab="tiempo de combustion", ylab="Fibra", main="tiempo de combustión vs fibra")
R/. Con la prueba LSD, las fibras que presentan letras iguales poseen medias sin diferencia significativa. Por tanto, se corroborra lo observado en el gráfico de caja y bigote, que F1 es diferente a las demás fibras.
qqnorm(modelo4$residuals)
qqline(modelo4$residuals)
shapiro.test(modelo4$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo4$residuals
## W = 0.88926, p-value = 0.02606
R/. Según la prueba de shapiro con un valor de p menor a 0.05, la distribución no es normal.
library(car)
leveneTest(modelo4)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 3 0.1788 0.9092
## 16
R/. Con un valor de p mayor a 0.05 en la prueba de Levene, no hay diferencia significativa en las varianzas.
plot(modelo4$residuals)
abline(h=0)
plot(df4$tc,modelo4$residuals,col="purple")
abline(h=0)
plot(modelo4$fitted.values,modelo4$residuals)
abline(h=0)
R/. Cualitativamente se puede observar en las gráficas la no independencia de los resultados por medio de los residuales, porque se encuentran distribuidos de forma no aleatoria, además con una mayor dispersión hacia la zona positiva de la gráfica y se observan posibles sesgos.
Los resultados no cumplen el supuesto de independencia y normalidad; por tanto es recomendable hacer prueba de outlier, repetir algún experimento en el caso de la fibra 2 y la F4. Según los resultados, hay diferencia significativa entre al menos la media de una fibra respecto a las demás, en este caso la F1 presentó tiempos de combustión significativamente mayores a las demás.
Se ha medido el tiempo hasta la descarga de dos marcas de pilas y se desea contrastar si en base a esta variable las dos marcas son distintas.
E=c(1.40,1.39,1.35,1.38,1.35,1.36,1.31,1.26,1.37)
U=c(1.56,1.54,1.53,1.54,1.54,1.47,1.49,1.54,1.50)
df5=data.frame(E=E,U=U)
df5
## E U
## 1 1.40 1.56
## 2 1.39 1.54
## 3 1.35 1.53
## 4 1.38 1.54
## 5 1.35 1.54
## 6 1.36 1.47
## 7 1.31 1.49
## 8 1.26 1.54
## 9 1.37 1.50
df5=stack(df5)
names(df5)=c("desc","Pila")
df5
## desc Pila
## 1 1.40 E
## 2 1.39 E
## 3 1.35 E
## 4 1.38 E
## 5 1.35 E
## 6 1.36 E
## 7 1.31 E
## 8 1.26 E
## 9 1.37 E
## 10 1.56 U
## 11 1.54 U
## 12 1.53 U
## 13 1.54 U
## 14 1.54 U
## 15 1.47 U
## 16 1.49 U
## 17 1.54 U
## 18 1.50 U
boxplot(E,U,col=c("red","violet"))
R/. Las pilas U (2) son las que presentan mayor tiempo de descarga y en el gráfico se observa que no hay igualdad en las mediciones de las pilas; es decir, posiblemente son diferentes. Para ello se realizan pruebas de comparación de medias como Anova y pruebas de varianzas para corroborar igualdad en las varianzas.
Ho:mE=mU Ha:mE no es igual a mU
modelo5<-aov(desc~Pila,data=df5)
summary(modelo5)
## Df Sum Sq Mean Sq F value Pr(>F)
## Pila 1 0.13176 0.13176 95.15 3.88e-08 ***
## Residuals 16 0.02216 0.00138
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
R/. Se rechaza la hipótesis nula porque el valor de p es menor a 0.05, por tanto existe diferencia significativa en los tiempos de descarga de las pilas E y U, a un 95 % de confianza.
qqnorm(modelo5$residuals)
qqline(modelo5$residuals)
shapiro.test(modelo5$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo5$residuals
## W = 0.90446, p-value = 0.06874
R/. Con un valor de p mayor a 0.05 se acepta la normalidad de los datos obtenidos en el experimento.
leveneTest(df5$desc~df5$Pila)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.4346 0.5191
## 16
R/. Por el valor de p mayor a 0.05, hay homocedasticidad en los valores.
plot(modelo5$residuals)
abline(h=0)
R/. Los datos se ven distribuidos al azar por tanto hay independencia.
Las pilas Energizer (E) y Ultracell (U), presentan diferencias significativas en sus tiempos de descarga, siendo la pila Ultracell mejor respecto al tiempo de descarga.Además, se cumplen los supuestos de normalidad, homocedasticidad e independencia.
Un fabricante sospecha que los lotes de materia prima recibidos de un proveedor difieren significativamente de su contenido en calcio. Elige al azar 5 lotes diferentes y un químico hace cinco determinaciones del contenido en calcio de cada lote. Los resultados obtenidos han sido
df6=read.csv("https://raw.githubusercontent.com/HSolis08/D.experimental/main/P-6.csv")
df6=data.frame(df6)
df6$Lote<-factor(df6$Lote)
df6
## Lote Ca
## 1 L1 23.46
## 2 L1 23.48
## 3 L1 23.56
## 4 L1 23.39
## 5 L1 23.40
## 6 L2 23.59
## 7 L2 23.46
## 8 L2 23.42
## 9 L2 23.49
## 10 L2 23.50
## 11 L3 23.51
## 12 L3 23.64
## 13 L3 23.46
## 14 L3 23.52
## 15 L3 23.49
## 16 L4 23.28
## 17 L4 23.40
## 18 L4 23.37
## 19 L4 23.46
## 20 L4 23.29
## 21 L5 23.29
## 22 L5 23.46
## 23 L5 23.37
## 24 L5 23.32
## 25 L5 23.38
boxplot(Ca~Lote,data=df6,col=c("red","violet","skyblue","blue","purple"))
Ho:no hay diferencia entre las medias de los cinco lotes. Ha:Al menos una media es diferente
modelo6<-aov(Ca~Lote,data=df6)
summary(modelo6)
## Df Sum Sq Mean Sq F value Pr(>F)
## Lote 4 0.1113 0.02782 5.945 0.00255 **
## Residuals 20 0.0936 0.00468
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
R/. Se rechaza la hipótesis nula porque el valor de p es menor a 0.05, por tanto existe diferencia significativa en el contenido de calcio de los lotes, a un 95 % de confianza.
tk<-TukeyHSD(modelo6)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Ca ~ Lote, data = df6)
##
## $Lote
## diff lwr upr p adj
## L2-L1 0.034 -0.09546992 0.163469919 0.9317655
## L3-L1 0.066 -0.06346992 0.195469919 0.5588335
## L4-L1 -0.098 -0.22746992 0.031469919 0.1973481
## L5-L1 -0.094 -0.22346992 0.035469919 0.2301147
## L3-L2 0.032 -0.09746992 0.161469919 0.9444731
## L4-L2 -0.132 -0.26146992 -0.002530081 0.0443369
## L5-L2 -0.128 -0.25746992 0.001469919 0.0535881
## L4-L3 -0.164 -0.29346992 -0.034530081 0.0089982
## L5-L3 -0.160 -0.28946992 -0.030530081 0.0110449
## L5-L4 0.004 -0.12546992 0.133469919 0.9999819
plot(tk)
R/. Según Tukey las diferencias significativas son entre los lotes L4-L2, L4-L3, L5-L3
qqnorm(modelo6$residuals)
qqline(modelo6$residuals)
R/. Se observa sesgo en los resultados y una posible distribución no normal, que se corrobora con la prueba de shapiro.
shapiro.test(modelo6$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo6$residuals
## W = 0.90316, p-value = 0.02151
R/. Con un valor de p menor a 0.05 se rechaza la normalidad de los datos obtenidos en el experimento.
leveneTest(df6$Ca~df6$Lote)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 4 0.1186 0.9743
## 20
R/. Por el valor de p mayor a 0.05, hay homocedasticidad en los valores.
plot(modelo6$residuals)
abline(h=0)
R/. Se observa una distribución aleatoria de los resultados, por tanto hay cualitativamente independencia.
Existe diferencia significativa en el contenido de Calcio entre los lotes de materia prima recibida; siendo el lote 3 el que presenta mayor contenido de calcio. Cabe señalar que los datos no presentan normalidad por tanto es recomendable repetir algunos experimentos o analizar datos oulier y en última instancia realizar transformaciones a los resultados para que se ajusten a la distribución normal.
Se analiza el efecto de tres venenos y cuatro antídotos en el tiempo de supervivencia de unas ratas. A partir de los siguientes resultados, realice un análisis de anova.
df7=read.csv("https://raw.githubusercontent.com/HSolis08/D.experimental/main/P-7.csv")
df7$Ant=factor(df7$Ant)
df7$Ven=factor(df7$Ven)
df7
## Ant Ven Ef
## 1 A 1 0.31
## 2 A 1 0.45
## 3 A 1 0.46
## 4 A 1 0.43
## 5 B 1 0.82
## 6 B 1 1.10
## 7 B 1 0.88
## 8 B 1 0.72
## 9 C 1 0.43
## 10 C 1 0.45
## 11 C 1 0.63
## 12 C 1 0.72
## 13 D 1 0.45
## 14 D 1 0.71
## 15 D 1 0.66
## 16 D 1 0.62
## 17 A 2 0.36
## 18 A 2 0.29
## 19 A 2 0.40
## 20 A 2 0.23
## 21 B 2 0.92
## 22 B 2 0.61
## 23 B 2 0.49
## 24 B 2 1.24
## 25 C 2 0.44
## 26 C 2 0.35
## 27 C 2 0.31
## 28 C 2 0.40
## 29 D 2 0.56
## 30 D 2 1.02
## 31 D 2 0.71
## 32 D 2 0.38
## 33 A 3 0.22
## 34 A 3 0.21
## 35 A 3 0.18
## 36 A 3 0.23
## 37 B 3 0.30
## 38 B 3 0.37
## 39 B 3 0.38
## 40 B 3 0.29
## 41 C 3 0.23
## 42 C 3 0.25
## 43 C 3 0.24
## 44 C 3 0.22
## 45 D 3 0.30
## 46 D 3 0.36
## 47 D 3 0.31
## 48 D 3 0.33
Ho : Efecto de antidoto (Ant) = 0 Ha : Efecto de antídoto (Ant) no es igual a 0 Ho : Efecto de veneno (Ven) = 0 Ha : Efecto de veneno (Ven) no es igual a 0 Ho : antídoto × veneno (AntVen) = 0 Ha : antídoto × veneno (AntVen) no es igual a 0
modelo7=lm(Ef~Ant*Ven,data=df7)
anova7=aov(modelo7)
summary(anova7)
## Df Sum Sq Mean Sq F value Pr(>F)
## Ant 3 0.9283 0.3094 14.162 2.97e-06 ***
## Ven 2 1.0220 0.5110 23.390 3.10e-07 ***
## Ant:Ven 6 0.2474 0.0412 1.887 0.11
## Residuals 36 0.7865 0.0218
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
R/. Existe diferencia significativa entre los efectos de antídolo y los efectos de veneno, a un 95 % de confianza; por tanto para ambos se acpta la hipótesis alterna.
model7=aov(Ef~Ant+Ven,data=df7)
summary(model7)
## Df Sum Sq Mean Sq F value Pr(>F)
## Ant 3 0.9283 0.3094 12.57 5.32e-06 ***
## Ven 2 1.0220 0.5110 20.76 5.38e-07 ***
## Residuals 42 1.0339 0.0246
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
tk<-TukeyHSD(model7)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Ef ~ Ant + Ven, data = df7)
##
## $Ant
## diff lwr upr p adj
## B-A 0.3625 0.19116012 0.53383988 0.0000072
## C-A 0.0750 -0.09633988 0.24633988 0.6482439
## D-A 0.2200 0.04866012 0.39133988 0.0070988
## C-B -0.2875 -0.45883988 -0.11616012 0.0003110
## D-B -0.1425 -0.31383988 0.02883988 0.1331760
## D-C 0.1450 -0.02633988 0.31633988 0.1230979
##
## $Ven
## diff lwr upr p adj
## 2-1 -0.070625 -0.2053934 0.06414339 0.4179887
## 3-1 -0.338750 -0.4735184 -0.20398161 0.0000008
## 3-2 -0.268125 -0.4028934 -0.13335661 0.0000534
R/. Los valores de p menores a 0.05 refieren diferencia significativa entre los antídotos o los venenos empleados.
plot(tk)
par(mfrow=c(1,2))
interaction.plot(df7$Ant,df7$Ven,df7$Ef)
interaction.plot(df7$Ven,df7$Ant,df7$Ef)
R/. Existe interacción entre veneno y antídoto, observandose mayores tiempo de vida para el veneno 1 y el antídoto B.
qqnorm(model7$residuals)
qqline(model7$residuals)
shapiro.test(model7$residuals)
##
## Shapiro-Wilk normality test
##
## data: model7$residuals
## W = 0.92297, p-value = 0.003788
R/. en la gráfica se puede observar datos sesgados, y en la prueba de shapiro con un valor de p menor a 0.05 representa la no normalidad de los valores obtenidos en el experimento.
leveneTest(anova7)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 11 4.2056 0.0005041 ***
## 36
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
R/. El valor de p menor a 0.05 indica que hay diferencia significativa en las varianzas.
plot(anova7$residuals)
abline(h=0)
plot(anova7$fitted.values,anova7$residuals)
abline(h=0)
R/. En las gráficas se observa cualitativamente un comportamiento no aleatorio de los datos ya que parecen seguir un comportamiento dado.
paretoPlot(model7)
R/. En este gráfico podemos observar que el Antídoto B tiene un efecto positivo, mientras que el veneno 3 presentra un fuerte efecto negativo.
En la supervivencia de las ratas hay diferencia significativa en los efectos antídoto y veneno, mientras que no es significativa para la interacción veneno antídoto. Además, el antídoto B aumenta el tiempo de supervivencia de las ratas y el veneno 3 la disminuye. Cabe señalar que los resultados de tiempo de supervivencia obtenidos no presentan una distribución normal, tampoco homocedasticidad, por tanto se debe revisar el diseño empleado o realizar algún tratamiento de los datos para que se ajuste a la normalidad.
Se ha realizado un experimento para estudiar el efecto de la temperatura (Te) y tiempo de exposición (E) sobre la cantidad absorbida de un compuesto químico por un material sumergido en él. En el estudio se han empleado tres temperaturas (T1, T2, T3) y tres tiempos de exposición (E1, E2, E3): cada tratamiento se ha replicado tres veces.
Y2=c(35.5,29.7,31.5,91.2,100.7,82.4,70.1,64.1,70.1,52.5,53.3,55.0,71.0,77.0,75.6,79.4,77.7,75.1,85.9,85.2,80.2,87.0,86.1,88.1,83.0,87.0,78.5)
Te=rep(rep(1:3,each=3),3)
E=rep(1:3,each=9)
df8=data.frame(Te,E,Y2)
df8$Te=factor(df8$Te)
df8$E=factor(df8$E)
df8
## Te E Y2
## 1 1 1 35.5
## 2 1 1 29.7
## 3 1 1 31.5
## 4 2 1 91.2
## 5 2 1 100.7
## 6 2 1 82.4
## 7 3 1 70.1
## 8 3 1 64.1
## 9 3 1 70.1
## 10 1 2 52.5
## 11 1 2 53.3
## 12 1 2 55.0
## 13 2 2 71.0
## 14 2 2 77.0
## 15 2 2 75.6
## 16 3 2 79.4
## 17 3 2 77.7
## 18 3 2 75.1
## 19 1 3 85.9
## 20 1 3 85.2
## 21 1 3 80.2
## 22 2 3 87.0
## 23 2 3 86.1
## 24 2 3 88.1
## 25 3 3 83.0
## 26 3 3 87.0
## 27 3 3 78.5
Ho : Efecto de temperatura (Te) = 0 Ha : Efecto de temperatura (Te) no es igual a 0 Ho : Efecto de tiempo de exposición (E) = 0 Ha : Efecto de tiempo de exposición (E) no es igual a 0 Ho : temperatura × tiempo de exposición (TeE) = 0 Ha : temperatura × tiempo de exposición (TeE) no es igual a 0
modelo8=lm(Y2~Te*E,data=df8)
anova8=aov(modelo8)
summary(anova8)
## Df Sum Sq Mean Sq F value Pr(>F)
## Te 2 3674 1836.8 110.58 7.75e-11 ***
## E 2 2113 1056.3 63.59 6.92e-09 ***
## Te:E 4 2704 676.1 40.70 8.74e-09 ***
## Residuals 18 299 16.6
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
R/. Existe diferencia significativa, porque los valores de p son menores a 0.05; por tanto, se rechazan las tres hipótesis nulas.
par(mfrow=c(1,2))
interaction.plot(df8$Te,df8$E,df8$Y2)
interaction.plot(df8$E,df8$Te,df8$Y2)
R/. En estas gráficas se pueden observar las interacciones entre la temperatura y el tiempo de exposición.
tk<-TukeyHSD(anova8)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = modelo8)
##
## $Te
## diff lwr upr p adj
## 2-1 27.811111 22.90766 32.714558 0.0000000
## 3-1 19.577778 14.67433 24.481225 0.0000000
## 3-2 -8.233333 -13.13678 -3.329886 0.0012324
##
## $E
## diff lwr upr p adj
## 2-1 4.588889 -0.3145585 9.492336 0.0688632
## 3-1 20.633333 15.7298860 25.536781 0.0000000
## 3-2 16.044444 11.1409971 20.947892 0.0000004
##
## $`Te:E`
## diff lwr upr p adj
## 2:1-1:1 59.2000000 47.5399419 70.860058 0.0000000
## 3:1-1:1 35.8666667 24.2066086 47.526725 0.0000001
## 1:2-1:1 21.3666667 9.7066086 33.026725 0.0001338
## 2:2-1:1 42.3000000 30.6399419 53.960058 0.0000000
## 3:2-1:1 45.1666667 33.5066086 56.826725 0.0000000
## 1:3-1:1 51.5333333 39.8732753 63.193391 0.0000000
## 2:3-1:1 54.8333333 43.1732753 66.493391 0.0000000
## 3:3-1:1 50.6000000 38.9399419 62.260058 0.0000000
## 3:1-2:1 -23.3333333 -34.9933914 -11.673275 0.0000432
## 1:2-2:1 -37.8333333 -49.4933914 -26.173275 0.0000000
## 2:2-2:1 -16.9000000 -28.5600581 -5.239942 0.0019939
## 3:2-2:1 -14.0333333 -25.6933914 -2.373275 0.0118597
## 1:3-2:1 -7.6666667 -19.3267247 3.993391 0.3885398
## 2:3-2:1 -4.3666667 -16.0267247 7.293391 0.9149019
## 3:3-2:1 -8.6000000 -20.2600581 3.060058 0.2583582
## 1:2-3:1 -14.5000000 -26.1600581 -2.839942 0.0088788
## 2:2-3:1 6.4333333 -5.2267247 18.093391 0.6020280
## 3:2-3:1 9.3000000 -2.3600581 20.960058 0.1837454
## 1:3-3:1 15.6666667 4.0066086 27.326725 0.0042938
## 2:3-3:1 18.9666667 7.3066086 30.626725 0.0005602
## 3:3-3:1 14.7333333 3.0732753 26.393391 0.0076797
## 2:2-1:2 20.9333333 9.2732753 32.593391 0.0001726
## 3:2-1:2 23.8000000 12.1399419 35.460058 0.0000332
## 1:3-1:2 30.1666667 18.5066086 41.826725 0.0000012
## 2:3-1:2 33.4666667 21.8066086 45.126725 0.0000002
## 3:3-1:2 29.2333333 17.5732753 40.893391 0.0000019
## 3:2-2:2 2.8666667 -8.7933914 14.526725 0.9925270
## 1:3-2:2 9.2333333 -2.4267247 20.893391 0.1900190
## 2:3-2:2 12.5333333 0.8732753 24.193391 0.0297173
## 3:3-2:2 8.3000000 -3.3600581 19.960058 0.2964189
## 1:3-3:2 6.3666667 -5.2933914 18.026725 0.6141282
## 2:3-3:2 9.6666667 -1.9933914 21.326725 0.1521856
## 3:3-3:2 5.4333333 -6.2267247 17.093391 0.7760926
## 2:3-1:3 3.3000000 -8.3600581 14.960058 0.9819392
## 3:3-1:3 -0.9333333 -12.5933914 10.726725 0.9999981
## 3:3-2:3 -4.2333333 -15.8933914 7.426725 0.9271837
R/. Existe diferencia significativa entre todos los factores e interacciones con valores p menores a 0.05.
plot(tk)
R/. Todas las interacciones que no pasan por cero, presentan diferencia significativa.
paretoPlot(anova8)
R/. La temperatura 2 presenta un efecto positivo sobre la cantidad absorbida de un compuesto químico.
qqnorm(anova8$residuals)
qqline(anova8$residuals)
shapiro.test(anova8$residuals)
##
## Shapiro-Wilk normality test
##
## data: anova8$residuals
## W = 0.94945, p-value = 0.2079
R/. en la gráfica se puede observar los datos distribuidos alrededor de la diagonal, y en la prueba de shapiro con un valor de p mayor a 0.05 representa la distribución normal de los valores obtenidos en el experimento.
leveneTest(anova8)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 8 1.0591 0.4318
## 18
R/. El valor de p mayor a 0.05 indica que no hay diferencia significativa en las varianzas.
plot(anova8$residuals)
abline(h=0)
plot(anova8$fitted.values,anova8$residuals)
abline(h=0)
R/. Los datos se encuentran distribuidos al azar lo que significa que hay independencia.
Los efectos de la temperatura, el tiempo de exposición y la interacción de ellos se encuentra activo en la cantidad absorbida de un compuesto químico por un material sumergido en el. Además, la combinación de temperatura 2 y tiempo de exposición 1 presenta la mayor cantidad absorvida de compuesto, sin embargo la Temperatura 2 tiene la mayor influencia positiva sobre el experimento. Cabe señalar que se cumplen los supuestos de normalidad, homocedasticidad e independencia.