Problema 1

Una joven, que acababa de seguir un curso de tres días en diseño experimental decidió intentar aplicar su conocimiento adquirido para analizar el efecto de los reactivos sobre la viscosidad de una mezcla de reacción. En primer momento detectó tres variables que podrían haber sido relevantes: eran las cantidades de tres reactivos (llamémoslos A, B y C). La formulación original era de 10 g de A, 4 g de B y 10 g de C. Decidió mantener este escenario experimental como punto de partida y para explorar sus alrededores. Dado que el número de experimentos posibles fue bastante limitado, decidió aplicar un Diseño Factorial 2^3, requiriendo un total de ocho experimentos. Realice el análisis de anova de estos datos experimentales y redacte un informe con las conclusiones pertinentes.

Datos

df=read.csv("https://raw.githubusercontent.com/HSolis08/D.experimental/main/p-1.csv")
df$A=factor(df$A)
df$B=factor(df$B)
df$C=factor(df$C)
df
##    A  B  C    V
## 1 -1 -1 -1 51.8
## 2  1 -1 -1 51.6
## 3 -1  1 -1 51.0
## 4  1  1 -1 42.4
## 5 -1 -1  1 50.2
## 6  1 -1  1 46.6
## 7 -1  1  1 52.0
## 8  1  1  1 50.0

Tabla de signos del diseño factorial

A=rep(c(-1,1),4)
B=rep(c(-1,-1,1,1),2)
C=rep(c(rep(-1,4),rep(1,4)))
AB=A*B
AC=A*C
BC=B*C
ABC=A*B*C
run=1:8
names=c("run","A","B","C","AB","AC","BC","ABC")
knitr::kable(cbind(run,A,B,C,AB,AC,BC,ABC),colnames=names)
run A B C AB AC BC ABC
1 -1 -1 -1 1 1 1 -1
2 1 -1 -1 -1 -1 1 1
3 -1 1 -1 -1 1 -1 1
4 1 1 -1 1 -1 -1 -1
5 -1 -1 1 1 -1 -1 1
6 1 -1 1 -1 1 -1 -1
7 -1 1 1 -1 -1 1 -1
8 1 1 1 1 1 1 1

ANOVA

modelo=lm(V~A*B*C,data=df)
anova=aov(modelo)
summary(anova)
##             Df Sum Sq Mean Sq
## A            1  25.92   25.92
## B            1   2.88    2.88
## C            1   0.50    0.50
## A:B          1   5.78    5.78
## A:C          1   1.28    1.28
## B:C          1  28.88   28.88
## A:B:C        1  12.50   12.50
modelo2=lm(V~A+B+C+AB+AC+BC,data=df)
anova2=aov(modelo2)
summary(anova2)
##             Df Sum Sq Mean Sq F value Pr(>F)
## A            1  25.92   25.92   2.074  0.386
## B            1   2.88    2.88   0.230  0.715
## C            1   0.50    0.50   0.040  0.874
## AB           1   5.78    5.78   0.462  0.620
## AC           1   1.28    1.28   0.102  0.803
## BC           1  28.88   28.88   2.310  0.370
## Residuals    1  12.50   12.50

R/. Según la prueba de anova no existe diferencia significativa de los efectos principales A, B y C y de las interacciones entre estos efectos, debido a que presenta un valor de p mayor a 0.05.

Pareto (estimación de efectos)

library(pid)
## Registered S3 method overwritten by 'DoE.base':
##   method           from       
##   factorize.factor conf.design
paretoPlot(anova2)

R/. Según la gráfica de pareto el factor A posee una mayor influencia negativa sobre la viscocidad y la interacción B:C influye positivamente sobre la viscocidad; sin embargo, no es significativo según anova.

Interacciones

interaction.plot(df$A,df$B,df$V)

interaction.plot(df$A,df$C,df$V)

interaction.plot(df$B,df$C,df$V)

R/. En los tres gráficos de interacción se puede observar que existe interacción entre los factores A, B y C.

Supuestos de normalidad

qqnorm(anova2$residuals)
qqline(anova2$residuals)

shapiro.test(anova2$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  anova2$residuals
## W = 0.66466, p-value = 0.0008917

R/. En el gráfico se puede observar cualitativamente la no distribución normal de los datos, lo cual se corrobora con la prueba de shapiro donde el valor de p es menor a 0.05; por tanto la distribución no es normal.

Homocedasticidad

library(car)
## Loading required package: carData
leveneTest(df$V~df$A)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value  Pr(>F)  
## group  1  6.1375 0.04797 *
##        6                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
leveneTest(df$V~df$B)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1  0.2416 0.6405
##        6
leveneTest(df$V~df$C)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1  0.2317 0.6474
##        6

R/. Solo hay diferencia significativa en la varianza para el factor A, con un valor levemente por debajo de 0.05, por tanto puede con una prueba más robusta ser no significativa.

Gráfico de independencia

plot(anova2$residuals)
abline(h=0)

R/. Los datos visualmente no parecen ser aleatorios, por tanto no hay independencia.

Conclusión

Según los resultados obtenidos la prueba de anova no sería válida debido a la violación del supuesto de normalidad; sin embargo, con esos resultados se puede decir que ningún factor y ninguna interacción influyen sobre la viscosidad de una mezcla de reacción. Para mejorar el diseño se deben realizar dos o más réplicas de cada experimento, según lo recomendado para este diseño.

Problema 2

Se desea comparar dos tratamientos para reducir el nivel de colesterol en la sangre. Se seleccionan 20 individuos y se asignan al azar a dos tipos de dietas: A y B. La tabla muestra la reducción conseguida después de dos meses.

Datos

A=c(51.3,39.4,26.3,39.0,48.1,34.2,69.8,31.3,45.2,46.4)
B=c(29.6,47.0,25.9,13.0,33.1,22.1,34.1,19.5,43.8,24.9)
Reduc=data.frame(A=A,B=B)
Reduc
##       A    B
## 1  51.3 29.6
## 2  39.4 47.0
## 3  26.3 25.9
## 4  39.0 13.0
## 5  48.1 33.1
## 6  34.2 22.1
## 7  69.8 34.1
## 8  31.3 19.5
## 9  45.2 43.8
## 10 46.4 24.9
df2<-stack(Reduc)
names(df2)<-c("Y","Dieta")
df2
##       Y Dieta
## 1  51.3     A
## 2  39.4     A
## 3  26.3     A
## 4  39.0     A
## 5  48.1     A
## 6  34.2     A
## 7  69.8     A
## 8  31.3     A
## 9  45.2     A
## 10 46.4     A
## 11 29.6     B
## 12 47.0     B
## 13 25.9     B
## 14 13.0     B
## 15 33.1     B
## 16 22.1     B
## 17 34.1     B
## 18 19.5     B
## 19 43.8     B
## 20 24.9     B

Gráfico

boxplot(Y~Dieta,data=df2,col=c("red","violet"))

### Prueba t no pareada Ho:mA=mB Ha:mA no es igual a mB

t.test(A,B,alternative="two.sided", paired=FALSE,conf.level = 0.95)
## 
##  Welch Two Sample t-test
## 
## data:  A and B
## t = 2.6965, df = 17.62, p-value = 0.01495
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##   3.031382 24.568618
## sample estimates:
## mean of x mean of y 
##      43.1      29.3
qt(0.975,df=18)
## [1] 2.100922

R/. Al ser el valor de t calculada (2.696) mayor al t critico (2.10), a un 95 % de confianza se acepta la hipótesis alterna que hace referencia a diferencia significativa entre las medias de las dietas.

Prueba de ANOVA

modelo3<-aov(Y~Dieta,data=df2)
summary(modelo3)
##             Df Sum Sq Mean Sq F value Pr(>F)  
## Dieta        1  952.2   952.2   7.271 0.0148 *
## Residuals   18 2357.2   131.0                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R/. Hipótesis: Ho:mA=mB Ha:mA no es igual a mB

Se rechaza la hipótesis nula, por tanto existe diferencia significativa en el nivel de colesterol entre las dietas A y B a un 95 % de confianza.

Prueba de normalidad

shapiro.test(modelo3$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo3$residuals
## W = 0.96153, p-value = 0.5749

R/. Por el valor de p mayor a 0.05 se dice que los datos son normales.

Prueba de varianza

library(car)
leveneTest(df2$Y~df2$Dieta)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1  0.0713 0.7925
##       18

R/. Por el valor de p mayor a 0.05, hay homocedasticidad en los valores.

Prueba de independencia

plot(modelo3$residuals)
abline(h=0)

R/. Los datos estan distribuidos de forma aleatoria, evidencia cualitativa de independencia.

Conclusión

Las dietas para disminuir el colesterol en sangre presentan diferencias significativas a un 95 % de confianza según la prueba t no pareada y anova. Además en la gráfica de caja y bigote se puede observar que la dieta B presenta menores valores de colesterol respecto a la dieta A, sin embargo presenta una mayor dispersión en los resultados obtenidos. Cabe señalar que los datos cumplen los supuestos de normalidad, homocedasticidad e independencia,

Problema 3

Se desea comparar el rendimiento de cuatro semillas A,B,C y D. Un terreno se divide en 24 parcelas similares y se asigna al azar cada semilla a 6 parcelas.

Datos

Rend<-c(229.1,233.4,211.1,270.4,253.7,233.0,223.1,248.6,241.3,219.2,217.5,230.0,254.7,200.0,211.8,250.7,237.2,224.3,207.6,230.0,241.3,202.0,213.7,245.8)
Sem<-rep(rep(c("A","B","C","D")),6)
df3<-data.frame(Sem,Rend)
df3$Sem<-factor(df3$Sem)
df3$Rend<-as.numeric(df3$Rend)
df3
##    Sem  Rend
## 1    A 229.1
## 2    B 233.4
## 3    C 211.1
## 4    D 270.4
## 5    A 253.7
## 6    B 233.0
## 7    C 223.1
## 8    D 248.6
## 9    A 241.3
## 10   B 219.2
## 11   C 217.5
## 12   D 230.0
## 13   A 254.7
## 14   B 200.0
## 15   C 211.8
## 16   D 250.7
## 17   A 237.2
## 18   B 224.3
## 19   C 207.6
## 20   D 230.0
## 21   A 241.3
## 22   B 202.0
## 23   C 213.7
## 24   D 245.8

Gráfico

boxplot(Rend~Sem,data=df3,col=c("red","violet","skyblue","blue"))

R/. En este gráfico se puede observar que las semillas B y C son las que presentan menos rendimiento y las A y D son las que presentan mayor rendimiento.

Análisis de varianzas para comparar múltiples medias (ANOVA)

Ho: no hay diferencia significativa entre las media. Ha: Al menos una media es diferente.

modelo3<-aov(Rend~Sem,data=df3)
summary(modelo3)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Sem          3   4796  1598.5   11.22 0.000156 ***
## Residuals   20   2850   142.5                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R/. Según el resultado obtenido de p menor a 0.05 se rechaza la Ho; por tanto, al menos una media es diferente a las demás.

Prueba Tukey y LSD

tk<-TukeyHSD(modelo3)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Rend ~ Sem, data = df3)
## 
## $Sem
##           diff       lwr       upr     p adj
## B-A -24.233333 -43.52416 -4.942506 0.0107428
## C-A -28.750000 -48.04083 -9.459173 0.0024478
## D-A   3.033333 -16.25749 22.324160 0.9707614
## C-B  -4.516667 -23.80749 14.774160 0.9124326
## D-B  27.266667   7.97584 46.557494 0.0039938
## D-C  31.783333  12.49251 51.074160 0.0008966
plot(tk)

library(agricolae)
LSD<-LSD.test(y=modelo3,trt="Sem",group=T)
bar.group(x=LSD$groups,horiz=TRUE,col="blue",xlim=c(0,275),xlab="Rendimiento", ylab="Semilla", main="Rendimiento de las semillas")

R/. Con la prueba de Tukey y LSD, se utilizan para identificar cuales medias son significativamente diferentes. En ambas las semillas D-A y B-C poseen medias iguales mientras que A-B, C-D, A-C y B-D, presentan diferencias significativas en sus medias.

Normalidad

qqnorm(modelo3$residuals)
qqline(modelo3$residuals)

shapiro.test(modelo3$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo3$residuals
## W = 0.96731, p-value = 0.6012

R/. Gráficamente se puede observar de forma cualitativa la distribución normal de los datos sobre la diagonal, y en la prueba de shapiro se corrobora la distribución normal con un valor de p mayor a 0.05.

Homocedasticidad

library(car)
leveneTest(modelo3)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  1.3745 0.2793
##       20

R/. Con un valor de p mayor a 0.05 en la prueba de Levene, no hay diferencia significativa en las varianzas.

Independencia de residuales

plot(modelo3$residuals)
abline(h=0)

plot(df3$Rend,modelo3$residuals,col="purple")
abline(h=0)

plot(modelo3$fitted.values,modelo3$residuals)
abline(h=0)

R/. Cualitativamente se puede observar en las gráficas la independencia de los resultados por medio de los residuales, porque se encuentran distribuidos de forma aleatoria.

Conclusión

El rendimiento de las cuatro semillas presenta diferencia significativa a un 95 % de confianza, según la prueba de Anova, encontrandose la semilla A y D en un grupo con medias iguales y presentan el mayor redimiento en en otro grupo las semillas C y B con rendimientos menores. Los resultados cumplen los supuestos de normalidad, homocedasticidad e independencia necesarios para la realización de la prueba de ANOVA.

Problema 4

Se ha realizado un experimento para medir el tiempo de combustión de unas muestras de cuatro fibras diferentes. En la tabla siguiente se proporcionan los resultados obtenidos (en segundos). Haga un análisis de anova de estos resultados.

df4=read.csv("https://raw.githubusercontent.com/HSolis08/D.experimental/main/P-4.csv")
df4$Fibra<-factor(df4$Fibra)
df4$tc<-as.numeric(df4$tc)
df4
##    Fibra   tc
## 1     F1 17.8
## 2     F1 16.2
## 3     F1 17.5
## 4     F1 17.4
## 5     F1 15.0
## 6     F2 11.2
## 7     F2 11.4
## 8     F2 15.8
## 9     F2 10.0
## 10    F2 10.4
## 11    F3 11.8
## 12    F3 11.0
## 13    F3 10.0
## 14    F3  9.2
## 15    F3  9.2
## 16    F4 14.9
## 17    F4 10.8
## 18    F4 12.8
## 19    F4 10.7
## 20    F4 10.7

Gráfico

boxplot(tc~Fibra,data=df4,col=c("red","violet","skyblue","blue"))

R/. En este gráfico se puede observar que Fibra F1 presenta el mayor tiempo de combustión, además visualmente difiere de las otras tres fibras. Además para la F2 se observa un posible valor outlier.

Análisis de varianzas para comparar múltiples medias (ANOVA)

Ho: no hay diferencia significativa entre las media. Ha: Al menos una media es diferente.

modelo4<-aov(tc~Fibra,data=df4)
summary(modelo4)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Fibra        3 120.50   40.17   13.89 0.000102 ***
## Residuals   16  46.26    2.89                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R/. Según el resultado obtenido de p menor a 0.05 se rechaza la Ho; por tanto, al menos una media es diferente a las demás.

Prueba Tukey y LSD

tk<-TukeyHSD(modelo4)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = tc ~ Fibra, data = df4)
## 
## $Fibra
##        diff      lwr      upr     p adj
## F2-F1 -5.02 -8.09676 -1.94324 0.0013227
## F3-F1 -6.54 -9.61676 -3.46324 0.0000851
## F4-F1 -4.80 -7.87676 -1.72324 0.0019981
## F3-F2 -1.52 -4.59676  1.55676 0.5094118
## F4-F2  0.22 -2.85676  3.29676 0.9968426
## F4-F3  1.74 -1.33676  4.81676 0.3968476
plot(tk)

R/. Según la prueba de Tukey, las fibras que presentan valores de p menores a 0.05 y en la gráfica las que no pasan por cero presentan diferencias significativas entre ellas.

library(agricolae)
LSD<-LSD.test(y=modelo4,trt="Fibra",group=T)
bar.group(x=LSD$groups,horiz=TRUE,col="blue",xlim=c(0,20),xlab="tiempo de combustion", ylab="Fibra", main="tiempo de combustión vs fibra")

R/. Con la prueba LSD, las fibras que presentan letras iguales poseen medias sin diferencia significativa. Por tanto, se corroborra lo observado en el gráfico de caja y bigote, que F1 es diferente a las demás fibras.

Normalidad

qqnorm(modelo4$residuals)
qqline(modelo4$residuals)

shapiro.test(modelo4$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo4$residuals
## W = 0.88926, p-value = 0.02606

R/. Según la prueba de shapiro con un valor de p menor a 0.05, la distribución no es normal.

Homocedasticidad

library(car)
leveneTest(modelo4)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.1788 0.9092
##       16

R/. Con un valor de p mayor a 0.05 en la prueba de Levene, no hay diferencia significativa en las varianzas.

Independencia de residuales

plot(modelo4$residuals)
abline(h=0)

plot(df4$tc,modelo4$residuals,col="purple")
abline(h=0)

plot(modelo4$fitted.values,modelo4$residuals)
abline(h=0)

R/. Cualitativamente se puede observar en las gráficas la no independencia de los resultados por medio de los residuales, porque se encuentran distribuidos de forma no aleatoria, además con una mayor dispersión hacia la zona positiva de la gráfica y se observan posibles sesgos.

Conclusión

Los resultados no cumplen el supuesto de independencia y normalidad; por tanto es recomendable hacer prueba de outlier, repetir algún experimento en el caso de la fibra 2 y la F4. Según los resultados, hay diferencia significativa entre al menos la media de una fibra respecto a las demás, en este caso la F1 presentó tiempos de combustión significativamente mayores a las demás.

PROBLEMA 5

Se ha medido el tiempo hasta la descarga de dos marcas de pilas y se desea contrastar si en base a esta variable las dos marcas son distintas.

E=c(1.40,1.39,1.35,1.38,1.35,1.36,1.31,1.26,1.37)
U=c(1.56,1.54,1.53,1.54,1.54,1.47,1.49,1.54,1.50)
df5=data.frame(E=E,U=U)
df5
##      E    U
## 1 1.40 1.56
## 2 1.39 1.54
## 3 1.35 1.53
## 4 1.38 1.54
## 5 1.35 1.54
## 6 1.36 1.47
## 7 1.31 1.49
## 8 1.26 1.54
## 9 1.37 1.50
df5=stack(df5)
names(df5)=c("desc","Pila")
df5
##    desc Pila
## 1  1.40    E
## 2  1.39    E
## 3  1.35    E
## 4  1.38    E
## 5  1.35    E
## 6  1.36    E
## 7  1.31    E
## 8  1.26    E
## 9  1.37    E
## 10 1.56    U
## 11 1.54    U
## 12 1.53    U
## 13 1.54    U
## 14 1.54    U
## 15 1.47    U
## 16 1.49    U
## 17 1.54    U
## 18 1.50    U

Gráfico

boxplot(E,U,col=c("red","violet"))

R/. Las pilas U (2) son las que presentan mayor tiempo de descarga y en el gráfico se observa que no hay igualdad en las mediciones de las pilas; es decir, posiblemente son diferentes. Para ello se realizan pruebas de comparación de medias como Anova y pruebas de varianzas para corroborar igualdad en las varianzas.

Prueba de ANOVA

Ho:mE=mU Ha:mE no es igual a mU

Prueba de ANOVA

modelo5<-aov(desc~Pila,data=df5)
summary(modelo5)
##             Df  Sum Sq Mean Sq F value   Pr(>F)    
## Pila         1 0.13176 0.13176   95.15 3.88e-08 ***
## Residuals   16 0.02216 0.00138                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R/. Se rechaza la hipótesis nula porque el valor de p es menor a 0.05, por tanto existe diferencia significativa en los tiempos de descarga de las pilas E y U, a un 95 % de confianza.

Prueba de normalidad

qqnorm(modelo5$residuals)
qqline(modelo5$residuals)

shapiro.test(modelo5$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo5$residuals
## W = 0.90446, p-value = 0.06874

R/. Con un valor de p mayor a 0.05 se acepta la normalidad de los datos obtenidos en el experimento.

Prueba de varianza

leveneTest(df5$desc~df5$Pila)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1  0.4346 0.5191
##       16

R/. Por el valor de p mayor a 0.05, hay homocedasticidad en los valores.

Prueba de independencia

plot(modelo5$residuals)
abline(h=0)

R/. Los datos se ven distribuidos al azar por tanto hay independencia.

Conclusión

Las pilas Energizer (E) y Ultracell (U), presentan diferencias significativas en sus tiempos de descarga, siendo la pila Ultracell mejor respecto al tiempo de descarga.Además, se cumplen los supuestos de normalidad, homocedasticidad e independencia.

PROBLEMA 6

Un fabricante sospecha que los lotes de materia prima recibidos de un proveedor difieren significativamente de su contenido en calcio. Elige al azar 5 lotes diferentes y un químico hace cinco determinaciones del contenido en calcio de cada lote. Los resultados obtenidos han sido

df6=read.csv("https://raw.githubusercontent.com/HSolis08/D.experimental/main/P-6.csv")
df6=data.frame(df6)
df6$Lote<-factor(df6$Lote)
df6
##    Lote    Ca
## 1    L1 23.46
## 2    L1 23.48
## 3    L1 23.56
## 4    L1 23.39
## 5    L1 23.40
## 6    L2 23.59
## 7    L2 23.46
## 8    L2 23.42
## 9    L2 23.49
## 10   L2 23.50
## 11   L3 23.51
## 12   L3 23.64
## 13   L3 23.46
## 14   L3 23.52
## 15   L3 23.49
## 16   L4 23.28
## 17   L4 23.40
## 18   L4 23.37
## 19   L4 23.46
## 20   L4 23.29
## 21   L5 23.29
## 22   L5 23.46
## 23   L5 23.37
## 24   L5 23.32
## 25   L5 23.38

Gráfico

boxplot(Ca~Lote,data=df6,col=c("red","violet","skyblue","blue","purple"))

Prueba de ANOVA

Ho:no hay diferencia entre las medias de los cinco lotes. Ha:Al menos una media es diferente

modelo6<-aov(Ca~Lote,data=df6)
summary(modelo6)
##             Df Sum Sq Mean Sq F value  Pr(>F)   
## Lote         4 0.1113 0.02782   5.945 0.00255 **
## Residuals   20 0.0936 0.00468                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R/. Se rechaza la hipótesis nula porque el valor de p es menor a 0.05, por tanto existe diferencia significativa en el contenido de calcio de los lotes, a un 95 % de confianza.

Prueba Tukey

tk<-TukeyHSD(modelo6)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Ca ~ Lote, data = df6)
## 
## $Lote
##         diff         lwr          upr     p adj
## L2-L1  0.034 -0.09546992  0.163469919 0.9317655
## L3-L1  0.066 -0.06346992  0.195469919 0.5588335
## L4-L1 -0.098 -0.22746992  0.031469919 0.1973481
## L5-L1 -0.094 -0.22346992  0.035469919 0.2301147
## L3-L2  0.032 -0.09746992  0.161469919 0.9444731
## L4-L2 -0.132 -0.26146992 -0.002530081 0.0443369
## L5-L2 -0.128 -0.25746992  0.001469919 0.0535881
## L4-L3 -0.164 -0.29346992 -0.034530081 0.0089982
## L5-L3 -0.160 -0.28946992 -0.030530081 0.0110449
## L5-L4  0.004 -0.12546992  0.133469919 0.9999819
plot(tk)

R/. Según Tukey las diferencias significativas son entre los lotes L4-L2, L4-L3, L5-L3

Prueba de normalidad

qqnorm(modelo6$residuals)
qqline(modelo6$residuals)

R/. Se observa sesgo en los resultados y una posible distribución no normal, que se corrobora con la prueba de shapiro.

shapiro.test(modelo6$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo6$residuals
## W = 0.90316, p-value = 0.02151

R/. Con un valor de p menor a 0.05 se rechaza la normalidad de los datos obtenidos en el experimento.

Prueba de varianza

leveneTest(df6$Ca~df6$Lote)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  4  0.1186 0.9743
##       20

R/. Por el valor de p mayor a 0.05, hay homocedasticidad en los valores.

Prueba de independencia

plot(modelo6$residuals)
abline(h=0)

R/. Se observa una distribución aleatoria de los resultados, por tanto hay cualitativamente independencia.

Conclusión

Existe diferencia significativa en el contenido de Calcio entre los lotes de materia prima recibida; siendo el lote 3 el que presenta mayor contenido de calcio. Cabe señalar que los datos no presentan normalidad por tanto es recomendable repetir algunos experimentos o analizar datos oulier y en última instancia realizar transformaciones a los resultados para que se ajusten a la distribución normal.

PROBLEMA 07

Se analiza el efecto de tres venenos y cuatro antídotos en el tiempo de supervivencia de unas ratas. A partir de los siguientes resultados, realice un análisis de anova.

Datos

df7=read.csv("https://raw.githubusercontent.com/HSolis08/D.experimental/main/P-7.csv")
df7$Ant=factor(df7$Ant)
df7$Ven=factor(df7$Ven)
df7
##    Ant Ven   Ef
## 1    A   1 0.31
## 2    A   1 0.45
## 3    A   1 0.46
## 4    A   1 0.43
## 5    B   1 0.82
## 6    B   1 1.10
## 7    B   1 0.88
## 8    B   1 0.72
## 9    C   1 0.43
## 10   C   1 0.45
## 11   C   1 0.63
## 12   C   1 0.72
## 13   D   1 0.45
## 14   D   1 0.71
## 15   D   1 0.66
## 16   D   1 0.62
## 17   A   2 0.36
## 18   A   2 0.29
## 19   A   2 0.40
## 20   A   2 0.23
## 21   B   2 0.92
## 22   B   2 0.61
## 23   B   2 0.49
## 24   B   2 1.24
## 25   C   2 0.44
## 26   C   2 0.35
## 27   C   2 0.31
## 28   C   2 0.40
## 29   D   2 0.56
## 30   D   2 1.02
## 31   D   2 0.71
## 32   D   2 0.38
## 33   A   3 0.22
## 34   A   3 0.21
## 35   A   3 0.18
## 36   A   3 0.23
## 37   B   3 0.30
## 38   B   3 0.37
## 39   B   3 0.38
## 40   B   3 0.29
## 41   C   3 0.23
## 42   C   3 0.25
## 43   C   3 0.24
## 44   C   3 0.22
## 45   D   3 0.30
## 46   D   3 0.36
## 47   D   3 0.31
## 48   D   3 0.33

Hipótesis

Ho : Efecto de antidoto (Ant) = 0 Ha : Efecto de antídoto (Ant) no es igual a 0 Ho : Efecto de veneno (Ven) = 0 Ha : Efecto de veneno (Ven) no es igual a 0 Ho : antídoto × veneno (AntVen) = 0 Ha : antídoto × veneno (AntVen) no es igual a 0

Modelo estadístico

modelo7=lm(Ef~Ant*Ven,data=df7)

Prueba de ANOVA

anova7=aov(modelo7)
summary(anova7)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Ant          3 0.9283  0.3094  14.162 2.97e-06 ***
## Ven          2 1.0220  0.5110  23.390 3.10e-07 ***
## Ant:Ven      6 0.2474  0.0412   1.887     0.11    
## Residuals   36 0.7865  0.0218                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R/. Existe diferencia significativa entre los efectos de antídolo y los efectos de veneno, a un 95 % de confianza; por tanto para ambos se acpta la hipótesis alterna.

model7=aov(Ef~Ant+Ven,data=df7)
summary(model7)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Ant          3 0.9283  0.3094   12.57 5.32e-06 ***
## Ven          2 1.0220  0.5110   20.76 5.38e-07 ***
## Residuals   42 1.0339  0.0246                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Prueba de Tukey

tk<-TukeyHSD(model7)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Ef ~ Ant + Ven, data = df7)
## 
## $Ant
##        diff         lwr         upr     p adj
## B-A  0.3625  0.19116012  0.53383988 0.0000072
## C-A  0.0750 -0.09633988  0.24633988 0.6482439
## D-A  0.2200  0.04866012  0.39133988 0.0070988
## C-B -0.2875 -0.45883988 -0.11616012 0.0003110
## D-B -0.1425 -0.31383988  0.02883988 0.1331760
## D-C  0.1450 -0.02633988  0.31633988 0.1230979
## 
## $Ven
##          diff        lwr         upr     p adj
## 2-1 -0.070625 -0.2053934  0.06414339 0.4179887
## 3-1 -0.338750 -0.4735184 -0.20398161 0.0000008
## 3-2 -0.268125 -0.4028934 -0.13335661 0.0000534

R/. Los valores de p menores a 0.05 refieren diferencia significativa entre los antídotos o los venenos empleados.

plot(tk)

Gráfica de interacciones

par(mfrow=c(1,2))
interaction.plot(df7$Ant,df7$Ven,df7$Ef)
interaction.plot(df7$Ven,df7$Ant,df7$Ef)

R/. Existe interacción entre veneno y antídoto, observandose mayores tiempo de vida para el veneno 1 y el antídoto B.

Normalidad

qqnorm(model7$residuals)
qqline(model7$residuals)

shapiro.test(model7$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  model7$residuals
## W = 0.92297, p-value = 0.003788

R/. en la gráfica se puede observar datos sesgados, y en la prueba de shapiro con un valor de p menor a 0.05 representa la no normalidad de los valores obtenidos en el experimento.

Homocedasticidad

leveneTest(anova7)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value    Pr(>F)    
## group 11  4.2056 0.0005041 ***
##       36                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R/. El valor de p menor a 0.05 indica que hay diferencia significativa en las varianzas.

Independencia

plot(anova7$residuals)
abline(h=0)

plot(anova7$fitted.values,anova7$residuals)
abline(h=0)

R/. En las gráficas se observa cualitativamente un comportamiento no aleatorio de los datos ya que parecen seguir un comportamiento dado.

Pareto

paretoPlot(model7)

R/. En este gráfico podemos observar que el Antídoto B tiene un efecto positivo, mientras que el veneno 3 presentra un fuerte efecto negativo.

Conclusión

En la supervivencia de las ratas hay diferencia significativa en los efectos antídoto y veneno, mientras que no es significativa para la interacción veneno antídoto. Además, el antídoto B aumenta el tiempo de supervivencia de las ratas y el veneno 3 la disminuye. Cabe señalar que los resultados de tiempo de supervivencia obtenidos no presentan una distribución normal, tampoco homocedasticidad, por tanto se debe revisar el diseño empleado o realizar algún tratamiento de los datos para que se ajuste a la normalidad.

PROBLEMA 8

Se ha realizado un experimento para estudiar el efecto de la temperatura (Te) y tiempo de exposición (E) sobre la cantidad absorbida de un compuesto químico por un material sumergido en él. En el estudio se han empleado tres temperaturas (T1, T2, T3) y tres tiempos de exposición (E1, E2, E3): cada tratamiento se ha replicado tres veces.

Y2=c(35.5,29.7,31.5,91.2,100.7,82.4,70.1,64.1,70.1,52.5,53.3,55.0,71.0,77.0,75.6,79.4,77.7,75.1,85.9,85.2,80.2,87.0,86.1,88.1,83.0,87.0,78.5)
Te=rep(rep(1:3,each=3),3)
E=rep(1:3,each=9)
df8=data.frame(Te,E,Y2)
df8$Te=factor(df8$Te)
df8$E=factor(df8$E)
df8
##    Te E    Y2
## 1   1 1  35.5
## 2   1 1  29.7
## 3   1 1  31.5
## 4   2 1  91.2
## 5   2 1 100.7
## 6   2 1  82.4
## 7   3 1  70.1
## 8   3 1  64.1
## 9   3 1  70.1
## 10  1 2  52.5
## 11  1 2  53.3
## 12  1 2  55.0
## 13  2 2  71.0
## 14  2 2  77.0
## 15  2 2  75.6
## 16  3 2  79.4
## 17  3 2  77.7
## 18  3 2  75.1
## 19  1 3  85.9
## 20  1 3  85.2
## 21  1 3  80.2
## 22  2 3  87.0
## 23  2 3  86.1
## 24  2 3  88.1
## 25  3 3  83.0
## 26  3 3  87.0
## 27  3 3  78.5

Hipótesis

Ho : Efecto de temperatura (Te) = 0 Ha : Efecto de temperatura (Te) no es igual a 0 Ho : Efecto de tiempo de exposición (E) = 0 Ha : Efecto de tiempo de exposición (E) no es igual a 0 Ho : temperatura × tiempo de exposición (TeE) = 0 Ha : temperatura × tiempo de exposición (TeE) no es igual a 0

ANOVA

modelo8=lm(Y2~Te*E,data=df8)
anova8=aov(modelo8)
summary(anova8)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Te           2   3674  1836.8  110.58 7.75e-11 ***
## E            2   2113  1056.3   63.59 6.92e-09 ***
## Te:E         4   2704   676.1   40.70 8.74e-09 ***
## Residuals   18    299    16.6                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R/. Existe diferencia significativa, porque los valores de p son menores a 0.05; por tanto, se rechazan las tres hipótesis nulas.

Gráfico de interacciones

par(mfrow=c(1,2))
interaction.plot(df8$Te,df8$E,df8$Y2)
interaction.plot(df8$E,df8$Te,df8$Y2)

R/. En estas gráficas se pueden observar las interacciones entre la temperatura y el tiempo de exposición.

Prueba de Tukey

tk<-TukeyHSD(anova8)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = modelo8)
## 
## $Te
##          diff       lwr       upr     p adj
## 2-1 27.811111  22.90766 32.714558 0.0000000
## 3-1 19.577778  14.67433 24.481225 0.0000000
## 3-2 -8.233333 -13.13678 -3.329886 0.0012324
## 
## $E
##          diff        lwr       upr     p adj
## 2-1  4.588889 -0.3145585  9.492336 0.0688632
## 3-1 20.633333 15.7298860 25.536781 0.0000000
## 3-2 16.044444 11.1409971 20.947892 0.0000004
## 
## $`Te:E`
##                diff         lwr        upr     p adj
## 2:1-1:1  59.2000000  47.5399419  70.860058 0.0000000
## 3:1-1:1  35.8666667  24.2066086  47.526725 0.0000001
## 1:2-1:1  21.3666667   9.7066086  33.026725 0.0001338
## 2:2-1:1  42.3000000  30.6399419  53.960058 0.0000000
## 3:2-1:1  45.1666667  33.5066086  56.826725 0.0000000
## 1:3-1:1  51.5333333  39.8732753  63.193391 0.0000000
## 2:3-1:1  54.8333333  43.1732753  66.493391 0.0000000
## 3:3-1:1  50.6000000  38.9399419  62.260058 0.0000000
## 3:1-2:1 -23.3333333 -34.9933914 -11.673275 0.0000432
## 1:2-2:1 -37.8333333 -49.4933914 -26.173275 0.0000000
## 2:2-2:1 -16.9000000 -28.5600581  -5.239942 0.0019939
## 3:2-2:1 -14.0333333 -25.6933914  -2.373275 0.0118597
## 1:3-2:1  -7.6666667 -19.3267247   3.993391 0.3885398
## 2:3-2:1  -4.3666667 -16.0267247   7.293391 0.9149019
## 3:3-2:1  -8.6000000 -20.2600581   3.060058 0.2583582
## 1:2-3:1 -14.5000000 -26.1600581  -2.839942 0.0088788
## 2:2-3:1   6.4333333  -5.2267247  18.093391 0.6020280
## 3:2-3:1   9.3000000  -2.3600581  20.960058 0.1837454
## 1:3-3:1  15.6666667   4.0066086  27.326725 0.0042938
## 2:3-3:1  18.9666667   7.3066086  30.626725 0.0005602
## 3:3-3:1  14.7333333   3.0732753  26.393391 0.0076797
## 2:2-1:2  20.9333333   9.2732753  32.593391 0.0001726
## 3:2-1:2  23.8000000  12.1399419  35.460058 0.0000332
## 1:3-1:2  30.1666667  18.5066086  41.826725 0.0000012
## 2:3-1:2  33.4666667  21.8066086  45.126725 0.0000002
## 3:3-1:2  29.2333333  17.5732753  40.893391 0.0000019
## 3:2-2:2   2.8666667  -8.7933914  14.526725 0.9925270
## 1:3-2:2   9.2333333  -2.4267247  20.893391 0.1900190
## 2:3-2:2  12.5333333   0.8732753  24.193391 0.0297173
## 3:3-2:2   8.3000000  -3.3600581  19.960058 0.2964189
## 1:3-3:2   6.3666667  -5.2933914  18.026725 0.6141282
## 2:3-3:2   9.6666667  -1.9933914  21.326725 0.1521856
## 3:3-3:2   5.4333333  -6.2267247  17.093391 0.7760926
## 2:3-1:3   3.3000000  -8.3600581  14.960058 0.9819392
## 3:3-1:3  -0.9333333 -12.5933914  10.726725 0.9999981
## 3:3-2:3  -4.2333333 -15.8933914   7.426725 0.9271837

R/. Existe diferencia significativa entre todos los factores e interacciones con valores p menores a 0.05.

plot(tk)

R/. Todas las interacciones que no pasan por cero, presentan diferencia significativa.

Pareto

paretoPlot(anova8)

R/. La temperatura 2 presenta un efecto positivo sobre la cantidad absorbida de un compuesto químico.

Normalidad

qqnorm(anova8$residuals)
qqline(anova8$residuals)

shapiro.test(anova8$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  anova8$residuals
## W = 0.94945, p-value = 0.2079

R/. en la gráfica se puede observar los datos distribuidos alrededor de la diagonal, y en la prueba de shapiro con un valor de p mayor a 0.05 representa la distribución normal de los valores obtenidos en el experimento.

Homocedasticidad

leveneTest(anova8)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  8  1.0591 0.4318
##       18

R/. El valor de p mayor a 0.05 indica que no hay diferencia significativa en las varianzas.

Independencia

plot(anova8$residuals)
abline(h=0)

plot(anova8$fitted.values,anova8$residuals)
abline(h=0)

R/. Los datos se encuentran distribuidos al azar lo que significa que hay independencia.

Conclusión

Los efectos de la temperatura, el tiempo de exposición y la interacción de ellos se encuentra activo en la cantidad absorbida de un compuesto químico por un material sumergido en el. Además, la combinación de temperatura 2 y tiempo de exposición 1 presenta la mayor cantidad absorvida de compuesto, sin embargo la Temperatura 2 tiene la mayor influencia positiva sobre el experimento. Cabe señalar que se cumplen los supuestos de normalidad, homocedasticidad e independencia.