library(readxl)

 library(summarytools)

 library(rmarkdown)

library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
library(table1)
## 
## Attaching package: 'table1'
## The following objects are masked from 'package:summarytools':
## 
##     label, label<-
## The following objects are masked from 'package:base':
## 
##     units, units<-
library(agricolae)

Ejercicio 1

En un experimento se consideran 3 especies de plantas y 2 tipos de reactivos para llevar el ciclo de floración de las plantas. se miden cada planta la supervivencia de la flor, es decir, el tiempo en días en que aparece la flor hasta cuando presenta signos de marchitamiento.

datos1 <- read_excel("C:/Users/Usuario/Downloads/diseno/Datos ejercicio int 1.xlsx")
datos1
## # A tibble: 18 × 3
##    Especie Floracion Reactivo
##    <chr>       <dbl> <chr>   
##  1 A              12 r1      
##  2 A              13 r1      
##  3 A              15 r1      
##  4 B              13 r1      
##  5 B              15 r1      
##  6 B              15 r1      
##  7 C              16 r1      
##  8 C              18 r1      
##  9 C              20 r1      
## 10 A               9 r2      
## 11 A               8 r2      
## 12 A               9 r2      
## 13 B              10 r2      
## 14 B               8 r2      
## 15 B               9 r2      
## 16 C              12 r2      
## 17 C              10 r2      
## 18 C              13 r2

Análisis descriptivo

Hipótesis nula (H0): No hay diferencias significativas en el tiempo de supervivencia de la flor entre las tres especies de plantas. Hipótesis alternativa (H1): Existen diferencias significativas en el tiempo de supervivencia de la flor entre al menos dos de las tres especies de plantas.

conteo_valoresespecie<- table(datos1$Especie)
conteo_valoresespecie
## 
## A B C 
## 6 6 6

Como podemos observar por cada especie se observan 6 réplicas.

summarytools::descr(datos1[,2])
## Descriptive Statistics  
## datos1$Floracion  
## N: 18  
## 
##                     Floracion
## ----------------- -----------
##              Mean       12.50
##           Std.Dev        3.50
##               Min        8.00
##                Q1        9.00
##            Median       12.50
##                Q3       15.00
##               Max       20.00
##               MAD        3.71
##               IQR        5.75
##                CV        0.28
##          Skewness        0.43
##       SE.Skewness        0.54
##          Kurtosis       -0.90
##           N.Valid       18.00
##         Pct.Valid      100.00

A partir de los resultados arrojados por el programa podemos concluir que: la media de días de florecimiento de las especies de flores es de 12.50 donde el 50% de los datos se ubica entre 8 y 12.50 Por otro lado el 50% restante se ubicó entre 12.50 y 20. Finalmente la curtosis de -0.9 nos indica que los datos se distribuyen a la izquierda de la media (platicurtica) y presenta un coeficiente de asimetría de 0,43.

resultados_descriptivos1 <- aggregate(Floracion~ Especie, data = datos1, summary)

print(resultados_descriptivos1)
##   Especie Floracion.Min. Floracion.1st Qu. Floracion.Median Floracion.Mean
## 1       A        8.00000           9.00000         10.50000       11.00000
## 2       B        8.00000           9.25000         11.50000       11.66667
## 3       C       10.00000          12.25000         14.50000       14.83333
##   Floracion.3rd Qu. Floracion.Max.
## 1          12.75000       15.00000
## 2          14.50000       15.00000
## 3          17.50000       20.00000

LLevando a cabo el análisis descriptivo por especie se obtuvieron os sigueintes resultados:

Para la especie A: el promedio de días de floración fue de 10.5, el valor mínimo de días fue de 8, el valor máximo de de días fue de 15, el 50% de las observaciones (3) presentaron días de floración de entre 8 y 10.5, mientras que el restante 50% (3) presentaron días de floración de entre 10.5 y 15.

Para la especie B: el promedio de días de floración fue de 11.5, el valor mínimo de días fue de 8, el valor máximo de días fue de 15.0, el 50% de las observaciones (3) presentaron días de floración de entre 8 y 11.5, mientras que el restante 50% (3) presentaron días de floración de entre 11.5 y 15.0

Para la especie C: el promedio de días de floración fue de 14.5, el valor mínimo de días fue de 10.0, el valor máximo de de días fue de 20.0, el 50% de las observaciones (3) presentaron días de floración de entre 10.0 y 14.5, mientras que el restante 50% (3) presentaron días de floración de entre 14.5 y 20.0.

#ANOVA

Hipótesis nula (H0): No hay diferencias significativas en el tiempo de supervivencia de la flor entre las tres especies de plantas.

Hipótesis alternativa (H1): Existen diferencias significativas en el tiempo de supervivencia de la flor entre al menos dos de las tres especies de plantas.

modelo_anova1 <-aov(Floracion~Especie, data =datos1)
resumen_anova1 <-summary(modelo_anova1)

print(resumen_anova1)
##             Df Sum Sq Mean Sq F value Pr(>F)
## Especie      2  50.33   25.17   2.387  0.126
## Residuals   15 158.17   10.54

A partir de la prueba ANOVA, obtenemos un p valor de 0,126, por lo tanto, concluimos que hay evidencia estadística suficiente que permite indicar que no se rechaza la hipótesis nula.

Análisis descriptivo para el reactivo

Hipótesis nula (H0): No hay diferencias significativas en el tiempo de supervivencia de la flor entre los dos tipos de reactivos utilizados para el ciclo de floración. Hipótesis alternativa (H1): Existen diferencias significativas en el tiempo de supervivencia de la flor entre al menos dos de los dos tipos de reactivos utilizados para el ciclo de floración.

conteo_valoresreactivo<- table(datos1$Reactivo)
conteo_valoresreactivo
## 
## r1 r2 
##  9  9

Como podemos observar por cada reactivo se observan 9 réplicas.

summarytools::descr(datos1[,2])
## Descriptive Statistics  
## datos1$Floracion  
## N: 18  
## 
##                     Floracion
## ----------------- -----------
##              Mean       12.50
##           Std.Dev        3.50
##               Min        8.00
##                Q1        9.00
##            Median       12.50
##                Q3       15.00
##               Max       20.00
##               MAD        3.71
##               IQR        5.75
##                CV        0.28
##          Skewness        0.43
##       SE.Skewness        0.54
##          Kurtosis       -0.90
##           N.Valid       18.00
##         Pct.Valid      100.00

A partir de los resultados arrojados por el programa podemos concluir que: la media de días de florecimiento de las flores por los reactivos es de 12.50 donde el 50% de los datos se ubica entre 8 y 12.50 Por otro lado el 50% restante se ubicó entre 12.50 y 20. Finalmente la curtosis de -0.9 nos indica que los datos se distribuyen a la izquierda de la media (platicurtica) y presenta un coeficiente de asimetría de 0,43.

modelo_anovaint1 <-aov(Floracion ~ Reactivo * Especie, data =datos1)
resumen_anovaint1 <-summary(modelo_anovaint1)
print(resumen_anovaint1)
##                  Df Sum Sq Mean Sq F value   Pr(>F)    
## Reactivo          1 133.39  133.39  70.618 2.26e-06 ***
## Especie           2  50.33   25.17  13.324 0.000896 ***
## Reactivo:Especie  2   2.11    1.06   0.559 0.586073    
## Residuals        12  22.67    1.89                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

A partir de los resultados del ANOVA, se puede concluir que:

Para el factor α hay evidencia estadísticamente significativa para rechazar la hipótesis nula, pues p-valor = 2.26e-06, es menor al nivel de significancia de 0.05. Esto sugiere que hay diferencias significativas en la sobrevivencia de la flor entre los dos tipos de reactivos utilizados en el experimento.

para el efecto del factor β hay evidencia estadísticamente significativa, pues= p-valor 0.000896 es menor a 0.05. Este sugiere que se presentan diferencias significativas en la sobrevivencia de la flor entre al menos dos de las tres especies de plantas consideradas en el experimento.

La interacción entre el tipo de reactivo y la especie de planta (αβ) no es estadísticamente significativa, pues p-valor = 0.586073 mayor a 0.05 por lo que se acepta H0. Por lo tanto, se sugiere que el efecto del tipo de reactivo en la sobrevivencia de la flor no está influenciado por la especie de planta. Es decir, no se observa una interacción significativa entre estos dos factores, lo que sugiere que sus efectos son independientes entre sí.

#Diagrama de cajas y bigotes

boxplot(datos1$Floracion ~ datos1$Reactivo * datos1$Especie, 
        main = "Diagrama de Cajas de Sobrevivencia",
        xlab = "Combinacion de Reactivo y Especie",
        ylab = "Sobrevivencia", 
        col = c("green", "yellow", "blue","orange","pink","purple"))

Finalmente, para complementar esto, como podemos observar en la gráfica, los bloques en los cuales se distribuyen los datos bajo los diferentes tratamientos se ubican de manera heterogénea, no obstante, algunos bloques como r1. A, r1. B y r2. A, r2. B se llegan a sobreponer uno encima del otro.

#Metodos de comparaciones multiple post hoc

#LSD

modelo_anova <- aov(Floracion ~ Reactivo + Especie + Reactivo:Especie, data = datos1)
LSD_result1 <- TukeyHSD(modelo_anova)
print(LSD_result1)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Floracion ~ Reactivo + Especie + Reactivo:Especie, data = datos1)
## 
## $Reactivo
##            diff       lwr       upr   p adj
## r2-r1 -5.444444 -6.856061 -4.032827 2.3e-06
## 
## $Especie
##          diff       lwr      upr     p adj
## B-A 0.6666667 -1.450262 2.783595 0.6862717
## C-A 3.8333333  1.716405 5.950262 0.0011057
## C-B 3.1666667  1.049738 5.283595 0.0047100
## 
## $`Reactivo:Especie`
##                 diff         lwr        upr     p adj
## r2:A-r1:A -4.6666667  -8.4359375 -0.8973958 0.0129801
## r1:B-r1:A  1.0000000  -2.7692709  4.7692709 0.9415283
## r2:B-r1:A -4.3333333  -8.1026042 -0.5640625 0.0214217
## r1:C-r1:A  4.6666667   0.8973958  8.4359375 0.0129801
## r2:C-r1:A -1.6666667  -5.4359375  2.1026042 0.6791464
## r1:B-r2:A  5.6666667   1.8973958  9.4359375 0.0029859
## r2:B-r2:A  0.3333333  -3.4359375  4.1026042 0.9995991
## r1:C-r2:A  9.3333333   5.5640625 13.1026042 0.0000291
## r2:C-r2:A  3.0000000  -0.7692709  6.7692709 0.1523873
## r2:B-r1:B -5.3333333  -9.1026042 -1.5640625 0.0048364
## r1:C-r1:B  3.6666667  -0.1026042  7.4359375 0.0582517
## r2:C-r1:B -2.6666667  -6.4359375  1.1026042 0.2380136
## r1:C-r2:B  9.0000000   5.2307291 12.7692709 0.0000421
## r2:C-r2:B  2.6666667  -1.1026042  6.4359375 0.2380136
## r2:C-r1:C -6.3333333 -10.1026042 -2.5640625 0.0011711

Como podemos observar hay una diferencia significativa en la sobrevivencia de las flores entre los reactivos R1 y R2. El valor p presenta un valor de 2.3e-06 menor ak nivel de significancia.

No se encontraron diferencias significativas en la sobrevivencia de las flores entre las especies A y B pues se presentó un p valor = 0.6862717 mayor al nivel de significancia. Por otro lado, se encontraron diferencias significativas en la sobrevivencia de las flores al comparar las especies A y C, así como las especies B y C obteniendo los valores p = 0.0011057 y 0.0047100, respectivamente. Esto sugiere que las especies A y B son significativamente diferentes de la especie C en términos de sobrevivencia de las flores.

En el análisis por interacción se encontraron diferencias significativas en la sobrevivencia de las flores en algunas combinaciones: R2: A-R1: A, R1: B-R1: A, R2: B-R1: A, R1:C-R1: A, R2:C-R1: A, R2: B-R2: A, R2:C-R2: A, R1:C-R1: B, R2:C-R1: B, R2:C-R2: B con p valor < 0.05.

Sin embargo, algunas combinaciones presentaron un p valor menor al nivel de significancia: R1: B-R2: A, R1:C-R2: A: A, R2: B-R1: B, R1:C-R2: B y R2:C-R1: C.

Método de Tukey

resultado_tukey1 <- TukeyHSD(modelo_anova)
print(resultado_tukey1)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Floracion ~ Reactivo + Especie + Reactivo:Especie, data = datos1)
## 
## $Reactivo
##            diff       lwr       upr   p adj
## r2-r1 -5.444444 -6.856061 -4.032827 2.3e-06
## 
## $Especie
##          diff       lwr      upr     p adj
## B-A 0.6666667 -1.450262 2.783595 0.6862717
## C-A 3.8333333  1.716405 5.950262 0.0011057
## C-B 3.1666667  1.049738 5.283595 0.0047100
## 
## $`Reactivo:Especie`
##                 diff         lwr        upr     p adj
## r2:A-r1:A -4.6666667  -8.4359375 -0.8973958 0.0129801
## r1:B-r1:A  1.0000000  -2.7692709  4.7692709 0.9415283
## r2:B-r1:A -4.3333333  -8.1026042 -0.5640625 0.0214217
## r1:C-r1:A  4.6666667   0.8973958  8.4359375 0.0129801
## r2:C-r1:A -1.6666667  -5.4359375  2.1026042 0.6791464
## r1:B-r2:A  5.6666667   1.8973958  9.4359375 0.0029859
## r2:B-r2:A  0.3333333  -3.4359375  4.1026042 0.9995991
## r1:C-r2:A  9.3333333   5.5640625 13.1026042 0.0000291
## r2:C-r2:A  3.0000000  -0.7692709  6.7692709 0.1523873
## r2:B-r1:B -5.3333333  -9.1026042 -1.5640625 0.0048364
## r1:C-r1:B  3.6666667  -0.1026042  7.4359375 0.0582517
## r2:C-r1:B -2.6666667  -6.4359375  1.1026042 0.2380136
## r1:C-r2:B  9.0000000   5.2307291 12.7692709 0.0000421
## r2:C-r2:B  2.6666667  -1.1026042  6.4359375 0.2380136
## r2:C-r1:C -6.3333333 -10.1026042 -2.5640625 0.0011711

La prueba de Tukey presenta resultado similares a los observados anteriormente.

plot(resultado_tukey1)

Con base en las gráficas podemos corroborar que existe interacción en el tipo de especie por lo tanto confirmamos lo anterior

Supuestos del modelo

Normalidad

residuos<-residuals(modelo_anova)
par(mfrow=c(1,3))

# Gráfico Q-Q de los residuos con color
qqnorm(residuos, col = "blue", main = "Gráfico Q-Q de Residuos")
qqline(residuos, col = "black")  

# Curva de densidad de los residuos
densidad_residuos <- density(residuos)
plot(densidad_residuos, main = "Curva de Densidad de Residuos", xlab = "Residuos", col = "blue")
polygon(densidad_residuos, col = "green", border = "black")

# Boxplot de residuos
boxplot(residuos, col = "pink",
        main = "Boxplot de Residuos",
        xlab = "Combinación de Reactivo y Especie",
        ylab = "Residuos")

Como prueba confirmatoria se procede a realizar la prueba de Shapiro-Wilk.

H0: Los residuos de la variable sobrevivencia de la flor se distribuyen normalmente con media cero y varianza constante.

Ha: Los residuos de la variable sobrevivencia de la flor no siguen la distribución normal.

modelo_anova <- aov(Floracion ~ Reactivo + Especie + Reactivo:Especie, data = datos1)
shapiro.test(residuals(modelo_anova)) 
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(modelo_anova)
## W = 0.9721, p-value = 0.8361

Como P valor = 0.8361 no hay evidencia estadística que permite rechazar la hipótesis nula (h0), por lo tanto, se acepta la hipótesis nula que concluye que residuos de la variable sobrevivencia de la flor presentan una distribución normal.

#Homogeneidad de varianzas

# Boxplot de los residuos
boxplot(residuos ~ datos1$Reactivo:datos1$Especie,
        col = "blue",
        xlab = "Combinación de Reactivo y Especie",
        ylab = "Residuos",
        main = "Boxplot de Residuos por Combinación de Reactivo y Especie")

En la siguiente gráfica, se representan los valores predichos por el modelo para la variable concentración del material en función de la raíz cuadrada de los residuos estandarizados. En esta gráfica, no se observa ninguna tendencia aparente en la distribución de los valores, lo que sugiere que no hay evidencia de incumplimiento del supuesto de homogeneidad de varianzas.

color_palette <- colorRampPalette(c("red", "black", "red"))
plot(residuos, main = "Prueba de independencia", pch = 20, cex = 2, col = color_palette(120), ylab = "Residuos", xlab = " ")

En la grafica anterior se observan dispersos los puntos sin seguir un patron, esto es un indicio de homogeneidad de varianzas

Para terminar de corroborar esto se hace la prueba de Barlett

H0: La varianza es constante en todos los grupos.

Ha: La varianza no es constante en al menos en un grupo.

grupos <- with(datos1, interaction(Reactivo, Especie))
# Prueba de Bartlett
resultado_bartlett <- bartlett.test(residuals(modelo_anova), grupos)
print(resultado_bartlett)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  residuals(modelo_anova) and grupos
## Bartlett's K-squared = 2.5886, df = 5, p-value = 0.7631

Como P valor = a 0.7631 mayor a 0.05 se acepta la hipótesis nula que indica que hay homogeneidad de varianzas.

Independiencia de los residuos

Prueba de Durbin Watson

H0: Los residuos entre los tratamientos son independientes.

Ha:Los residuos entre los tratamientos no son independientes.

resultado_durbin_watson <- dwtest(modelo_anova)
print(resultado_durbin_watson)
## 
##  Durbin-Watson test
## 
## data:  modelo_anova
## DW = 2.4902, p-value = 0.4146
## alternative hypothesis: true autocorrelation is greater than 0

Al realizar la prueba de independencia de residuos para la variable floración, se determinó que los residuos no están correlacionados, debido a que el DW está próximo a 2 y el valor de p (p-value = 0.4146) es superior al nivel de significancia de 5% (α=0.05) por lo que se concluye que existe independencia de los residuos.

#Post anova

mod1=lm(Floracion~Especie+Reactivo,data=datos1)
anova(mod1)
## Analysis of Variance Table
## 
## Response: Floracion
##           Df  Sum Sq Mean Sq F value    Pr(>F)    
## Especie    2  50.333  25.167  14.220 0.0004251 ***
## Reactivo   1 133.389 133.389  75.368 5.222e-07 ***
## Residuals 14  24.778   1.770                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Con esta prueba de Anova , nuevamente confirmamos los resultados del primer Anova realizado. donde Para el factor α hay evidencia estadísticamente significativa para rechazar la hipótesis nula, ya que el p-valor es menor al nivel de significancia establecido (0.05). Esto indica que hay diferencias significativas en la sobrevivencia de la flor entre los dos tipos de reactivos utilizados en el experimento.

El efecto del factor β se considera estadísticamente significativo, ya que se obtuvo un p-valor inferior a 0.05. Estos resultados indican que se presentan diferencias significativas en la sobrevivencia de la flor entre al menos dos de las tres especies de plantas consideradas en el experimento.

compara1=LSD.test(mod1,"Especie")
compara1
## $statistics
##    MSerror Df Mean       CV  t.value      LSD
##   1.769841 14 12.5 10.64283 2.144787 1.647368
## 
## $parameters
##         test p.ajusted  name.t ntr alpha
##   Fisher-LSD      none Especie   3  0.05
## 
## $means
##   Floracion      std r        se       LCL      UCL Min Max   Q25  Q50   Q75
## A  11.00000 2.756810 6 0.5431147  9.835135 12.16487   8  15  9.00 10.5 12.75
## B  11.66667 3.076795 6 0.5431147 10.501802 12.83153   8  15  9.25 11.5 14.50
## C  14.83333 3.816630 6 0.5431147 13.668468 15.99820  10  20 12.25 14.5 17.50
## 
## $comparison
## NULL
## 
## $groups
##   Floracion groups
## C  14.83333      a
## B  11.66667      b
## A  11.00000      b
## 
## attr(,"class")
## [1] "group"
plot(mod1)

shapiro.test(mod1$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  mod1$residuals
## W = 0.96255, p-value = 0.6516

Esta tabla resume el modelo del experimento donde podemos observar los valores mínimos, máximos, los cuartiles y si existe interacción. en este caso como lo indica la tabla, no hay interacción entre los factores de tratamiento. Por otro lado, las gráficas nos permiten corroborar que los supuestos de Normalidad, Homogeneidad de varianza e independencia si se cumplen.

-Ejercicio 2

En unos laboratorios se estan estudiando los factores que influyen en la resistencia de un tipo particular de fibra. Si se eligen al azar cuatro máquinas tres operarios y se realiza un experimento factorial usando fibras de un mismo lote de producción.

datos2 <- read_excel("C:/Users/Usuario/Downloads/diseno/Datos ejercicio int 2.xlsx")
datos2
## # A tibble: 24 × 3
##    resistencia operario maquina
##          <dbl> <chr>    <chr>  
##  1         109 OP1      A      
##  2         110 OP1      A      
##  3         110 OP1      B      
##  4         115 OP1      B      
##  5         108 OP1      C      
##  6         109 OP1      C      
##  7         110 OP1      D      
##  8         108 OP1      D      
##  9         110 OP2      A      
## 10         112 OP2      A      
## # ℹ 14 more rows

#Análisis descriptivo

conteo_valores_tratamiento <- table(datos2$operario, datos2$maquina)
print(conteo_valores_tratamiento)
##      
##       A B C D
##   OP1 2 2 2 2
##   OP2 2 2 2 2
##   OP3 2 2 2 2

Como podemos observar se presentan 2 replicas por cada tratamiento

summarytools::descr(datos2 [,1])
## Descriptive Statistics  
## datos2$resistencia  
## N: 24  
## 
##                     resistencia
## ----------------- -------------
##              Mean        112.29
##           Std.Dev          3.38
##               Min        108.00
##                Q1        110.00
##            Median        111.50
##                Q3        114.50
##               Max        120.00
##               MAD          3.71
##               IQR          4.25
##                CV          0.03
##          Skewness          0.69
##       SE.Skewness          0.47
##          Kurtosis         -0.60
##           N.Valid         24.00
##         Pct.Valid        100.00

A partir de la tabla podemos concluir que: el promedio de la variable resistencia es de 112.29. El valor mínimo observado en esta variable es de 108.00, mientras que el valor máximo fue de 120.00. El 50% de las observaciones se sitúan entre 110.00 y 114.50, mientras el 50% de las observaciones se ubica entre 111.5 y 120.00. Se observa una asimetría positiva leve, con un coeficiente de asimetría de 0.69. Además, el coeficiente de curtosis es de -0.60, lo que sugiere que la distribución de los datos es platicúrtica. Los datos presentan una desviación estándar de 3.38.

Medidas descriptivas por tratamientos

resultados_descriptivos <- aggregate(resistencia ~ operario + maquina + operario:maquina, data = datos2, summary)
print(resultados_descriptivos)
##    operario maquina resistencia.Min. resistencia.1st Qu. resistencia.Median
## 1       OP1       A           109.00              109.25             109.50
## 2       OP2       A           110.00              110.50             111.00
## 3       OP3       A           114.00              114.50             115.00
## 4       OP1       B           110.00              111.25             112.50
## 5       OP2       B           110.00              110.25             110.50
## 6       OP3       B           112.00              112.75             113.50
## 7       OP1       C           108.00              108.25             108.50
## 8       OP2       C           109.00              109.50             110.00
## 9       OP3       C           114.00              115.25             116.50
## 10      OP1       D           108.00              108.50             109.00
## 11      OP2       D           112.00              112.50             113.00
## 12      OP3       D           117.00              117.75             118.50
##    resistencia.Mean resistencia.3rd Qu. resistencia.Max.
## 1            109.50              109.75           110.00
## 2            111.00              111.50           112.00
## 3            115.00              115.50           116.00
## 4            112.50              113.75           115.00
## 5            110.50              110.75           111.00
## 6            113.50              114.25           115.00
## 7            108.50              108.75           109.00
## 8            110.00              110.50           111.00
## 9            116.50              117.75           119.00
## 10           109.00              109.50           110.00
## 11           113.00              113.50           114.00
## 12           118.50              119.25           120.00

A partir de la tabla podemos sacar lo siguiente:

Para el operario OP1 y la máquina A: La resistencia promedio es de 109.50.El 50% de las observaciones presentaron una resistencia entre 109.00 y 109.50, mientras que el restante 50% presentó una resistencia entre 109.50 y 110.00.

Para el operario OP2 y la máquina A: La resistencia promedio es de 111.00.El 50% de las observaciones presentaron una resistencia entre 110.00 y 111.00, mientras que el restante 50% presentó una resistencia entre 111.00 y 112.00.

Para el operario OP3 y la máquina A: La resistencia promedio es de 115.00.El 50% de las observaciones presentaron una resistencia entre 114.00 y 115.00, mientras que el restante 50% presentó una resistencia entre 115.00 y 116.00.

Para el operario OP1 y la máquina B: La resistencia promedio es de 112.50.El 50% de las observaciones presentaron una resistencia entre 110.00 y 112.50, mientras que el restante 50% presentó una resistencia entre 112.50 y 115.00.

Para el operario OP2 y la máquina B: La resistencia promedio es de 110.50.El 50% de las observaciones presentaron una resistencia entre 110.00 y 110.50, mientras que el restante 50% presentó una resistencia entre 110.50 y 111.00.

Para el operario OP3 y la máquina B: La resistencia promedio es de 113.50. El valor mínimo de resistencia es 112.00, y el valor máximo de resistencia es 115.00. El 50% de las observaciones presentaron una resistencia entre 112.00 y 113.50, mientras que el restante 50% presentó una resistencia entre 113.50 y 115.00.

Para el operario OP1 y la máquina C: La resistencia promedio es de 108.50.El 50% de las observaciones presentaron una resistencia entre 108.00 y 108.50, mientras que el restante 50% presentó una resistencia entre 108.50 y 109.00.

Para el operario OP2 y la máquina C: La resistencia promedio es de 110.00.El 50% de las observaciones presentaron una resistencia entre 109.00 y 110.00, mientras que el restante 50% presentó una resistencia entre 110.00 y 111.00.

Para el operario OP3 y la máquina C: La resistencia promedio es de 116.50.El 50% de las observaciones presentaron una resistencia entre 114.00 y 116.50, mientras que el restante 50% presentó una resistencia entre 116.50 y 119.00.

Para el operario OP1 y la máquina D: La resistencia promedio es de 109.00.El 50% de las observaciones presentaron una resistencia entre 108.00 y 109.00, mientras que el restante 50% presentó una resistencia entre 109.00 y 110.00.

Para el operario OP2 y la máquina D: La resistencia promedio es de 113.00.El 50% de las observaciones presentaron una resistencia entre 112.00 y 113.00, mientras que el restante 50% presentó una resistencia entre 113.00 y 114.00.

Para el operario OP3 y la máquina D: La resistencia promedio es de 118.50.El 50% de las observaciones presentaron una resistencia entre 117.00 y 118.50, mientras que el restante 50% presentó una resistencia entre 118.50 y 120.00.

#Prueba Anova

Factor 1 (α): Operario

H0: No hay diferencias significativas en la resistencia promedio de las fibras entre los operarios que realizan el trabajo.

Ha: Existen diferencias significativas en la resistencia promedio de la fibra debido al operario que realiza el trabajo.

H0:α1=α2=…=αa=0

Ha:α1≠0 para algún i

Factor 2 (β): Tipo de máquina

H0: No hay diferencias significativas en la resistencia promedio de las fibras debido al tipo de máquina utilizada.

Ha: Existen diferencias significativas en la resistencia promedio de las fibras debido al tipo de máquina utilizada.

H0:β1=β2=…=βb=0

Ha:βj≠0 para algún j

Interacción entre (αβ)

H0: No hay interacción significativa entre el operario y el tipo de máquina en lo que respecta a la resistencia de la fibra.

Ha: Existe una interacción significativa entre el operario y el tipo de máquina en relación con la resistencia de la fibra, lo que implica que el efecto de la resistencia de la fibra debido al tipo de máquina depende del operario, y viceversa.

H0:(αβ)ij=0 para todo ij

Ha:(αβ)ij≠0 para algún ij

 modelo_anova <- aov(resistencia ~ operario * maquina, data = datos2)
resultado_anova <- summary(modelo_anova)
print(resultado_anova)
##                  Df Sum Sq Mean Sq F value   Pr(>F)    
## operario          2 160.33   80.17  21.143 0.000117 ***
## maquina           3  12.46    4.15   1.095 0.388753    
## operario:maquina  6  44.67    7.44   1.963 0.150681    
## Residuals        12  45.50    3.79                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Para el factor α:se encontró evidencia estadísticamente significativa para rechazar la hipótesis nula, pues p-valor =0.000117 es menor al nivel de significancia 0.05. Por lo tanto, se rechaza la hipótesis nula que indica que no existen diferencias significativas en la resistencia promedio de la fibra entre los operarios que realizan el trabajo.

En cuanto al factor β:no hay evidencia estadísticamente significativa para rechazar la hipótesis nula, pues el p-valor = 0.388753 es mayor a 0.05. Por lo tanto, se sugiere que no existen diferencias significativas en la resistencia promedio de la fibra debidas al tipo de máquina utilizada en el experimento.

Respecto a la interacción entre el tipo de máquina y el operario (αβ):no hay evidencia estadísticamente significativa para rechazar la H0, pues el p-valor =0.150681 es mayor a 0.05. Por lo tanto, se acepta la hipótesis nula, lo que indica que el efecto del tipo de máquina en la resistencia de la fibra no está influenciado por el operario y el efecto del operario en la resistencia no está influenciado por el tipo de máquina. Es decir que no se observa una interacción significativa entre estos dos factores, lo que sugiere que sus efectos son independientes entre sí.

Diagrama de cajas y bigotes

boxplot(datos2$resistencia ~ datos2$operario * datos2$maquina, 
        main = "Diagrama de Cajas de Resistencia",
        xlab = "Combinación de operario y tipo de máquina",
        ylab = "Resistencia", 
        col = c("green", "gray", "cyan","blue","pink","purple", "yellow","magenta", "orange","brown", "white","lightgreen"))

Finalmente, para complementar esto, como podemos observar en la gráfica, los bloques en los cuales se distribuyen los datos bajo los diferentes tratamientos se ubican de manera heterogénea. No obstante, se observa algunos solapamientos entre tratamientos.

#Métodos de comparaciones multiple post hoc

#LSD

modelo_anova <- aov(resistencia ~ operario * maquina, data = datos2)
LSD_result <- TukeyHSD(modelo_anova)
print(LSD_result)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = resistencia ~ operario * maquina, data = datos2)
## 
## $operario
##         diff       lwr      upr     p adj
## OP2-OP1 1.25 -1.347459 3.847459 0.4302092
## OP3-OP1 6.00  3.402541 8.597459 0.0001330
## OP3-OP2 4.75  2.152541 7.347459 0.0010207
## 
## $maquina
##           diff       lwr      upr     p adj
## B-A  0.3333333 -3.004389 3.671055 0.9904645
## C-A -0.1666667 -3.504389 3.171055 0.9987710
## D-A  1.6666667 -1.671055 5.004389 0.4766928
## C-B -0.5000000 -3.837722 2.837722 0.9693945
## D-B  1.3333333 -2.004389 4.671055 0.6465008
## D-C  1.8333333 -1.504389 5.171055 0.3989736
## 
## $`operario:maquina`
##             diff        lwr       upr     p adj
## OP2:A-OP1:A  1.5  -6.230766  9.230766 0.9993833
## OP3:A-OP1:A  5.5  -2.230766 13.230766 0.2769269
## OP1:B-OP1:A  3.0  -4.730766 10.730766 0.9013973
## OP2:B-OP1:A  1.0  -6.730766  8.730766 0.9999870
## OP3:B-OP1:A  4.0  -3.730766 11.730766 0.6575431
## OP1:C-OP1:A -1.0  -8.730766  6.730766 0.9999870
## OP2:C-OP1:A  0.5  -7.230766  8.230766 1.0000000
## OP3:C-OP1:A  7.0  -0.730766 14.730766 0.0898750
## OP1:D-OP1:A -0.5  -8.230766  7.230766 1.0000000
## OP2:D-OP1:A  3.5  -4.230766 11.230766 0.7937754
## OP3:D-OP1:A  9.0   1.269234 16.730766 0.0178460
## OP3:A-OP2:A  4.0  -3.730766 11.730766 0.6575431
## OP1:B-OP2:A  1.5  -6.230766  9.230766 0.9993833
## OP2:B-OP2:A -0.5  -8.230766  7.230766 1.0000000
## OP3:B-OP2:A  2.5  -5.230766 10.230766 0.9664165
## OP1:C-OP2:A -2.5 -10.230766  5.230766 0.9664165
## OP2:C-OP2:A -1.0  -8.730766  6.730766 0.9999870
## OP3:C-OP2:A  5.5  -2.230766 13.230766 0.2769269
## OP1:D-OP2:A -2.0  -9.730766  5.730766 0.9931505
## OP2:D-OP2:A  2.0  -5.730766  9.730766 0.9931505
## OP3:D-OP2:A  7.5  -0.230766 15.230766 0.0602463
## OP1:B-OP3:A -2.5 -10.230766  5.230766 0.9664165
## OP2:B-OP3:A -4.5 -12.230766  3.230766 0.5149555
## OP3:B-OP3:A -1.5  -9.230766  6.230766 0.9993833
## OP1:C-OP3:A -6.5 -14.230766  1.230766 0.1328994
## OP2:C-OP3:A -5.0 -12.730766  2.730766 0.3847296
## OP3:C-OP3:A  1.5  -6.230766  9.230766 0.9993833
## OP1:D-OP3:A -6.0 -13.730766  1.730766 0.1938021
## OP2:D-OP3:A -2.0  -9.730766  5.730766 0.9931505
## OP3:D-OP3:A  3.5  -4.230766 11.230766 0.7937754
## OP2:B-OP1:B -2.0  -9.730766  5.730766 0.9931505
## OP3:B-OP1:B  1.0  -6.730766  8.730766 0.9999870
## OP1:C-OP1:B -4.0 -11.730766  3.730766 0.6575431
## OP2:C-OP1:B -2.5 -10.230766  5.230766 0.9664165
## OP3:C-OP1:B  4.0  -3.730766 11.730766 0.6575431
## OP1:D-OP1:B -3.5 -11.230766  4.230766 0.7937754
## OP2:D-OP1:B  0.5  -7.230766  8.230766 1.0000000
## OP3:D-OP1:B  6.0  -1.730766 13.730766 0.1938021
## OP3:B-OP2:B  3.0  -4.730766 10.730766 0.9013973
## OP1:C-OP2:B -2.0  -9.730766  5.730766 0.9931505
## OP2:C-OP2:B -0.5  -8.230766  7.230766 1.0000000
## OP3:C-OP2:B  6.0  -1.730766 13.730766 0.1938021
## OP1:D-OP2:B -1.5  -9.230766  6.230766 0.9993833
## OP2:D-OP2:B  2.5  -5.230766 10.230766 0.9664165
## OP3:D-OP2:B  8.0   0.269234 15.730766 0.0401932
## OP1:C-OP3:B -5.0 -12.730766  2.730766 0.3847296
## OP2:C-OP3:B -3.5 -11.230766  4.230766 0.7937754
## OP3:C-OP3:B  3.0  -4.730766 10.730766 0.9013973
## OP1:D-OP3:B -4.5 -12.230766  3.230766 0.5149555
## OP2:D-OP3:B -0.5  -8.230766  7.230766 1.0000000
## OP3:D-OP3:B  5.0  -2.730766 12.730766 0.3847296
## OP2:C-OP1:C  1.5  -6.230766  9.230766 0.9993833
## OP3:C-OP1:C  8.0   0.269234 15.730766 0.0401932
## OP1:D-OP1:C  0.5  -7.230766  8.230766 1.0000000
## OP2:D-OP1:C  4.5  -3.230766 12.230766 0.5149555
## OP3:D-OP1:C 10.0   2.269234 17.730766 0.0080049
## OP3:C-OP2:C  6.5  -1.230766 14.230766 0.1328994
## OP1:D-OP2:C -1.0  -8.730766  6.730766 0.9999870
## OP2:D-OP2:C  3.0  -4.730766 10.730766 0.9013973
## OP3:D-OP2:C  8.5   0.769234 16.230766 0.0267714
## OP1:D-OP3:C -7.5 -15.230766  0.230766 0.0602463
## OP2:D-OP3:C -3.5 -11.230766  4.230766 0.7937754
## OP3:D-OP3:C  2.0  -5.730766  9.730766 0.9931505
## OP2:D-OP1:D  4.0  -3.730766 11.730766 0.6575431
## OP3:D-OP1:D  9.5   1.769234 17.230766 0.0119280
## OP3:D-OP2:D  5.5  -2.230766 13.230766 0.2769269

En el análisis de interacción entre operario y máquina se observan algunas diferencias significativas. Entre los operarios OP1:OP3 y OP2:OP3, donde hubo una diferencia significativa en la resistencia, con un valor de p de 0.0001330 y 0.0010207 respectivamente. En cuanto a la máquina, no se encontraron diferencias significativas entre las máquinas A, B, C y D, ya que los valores p para todas las comparaciones fueron mayores al nivel de significancia.

En las comparaciones de interacción, se observan diferencias significativas en algunos valores del operario 3. Sin embargo, El resto de las comparaciones de interacción, no se observan diferencias significativas, indicando similitud en las relaciones entre operarios y máquinas en términos de resistencia.

#Método de Tukey

resultado_tukey <- TukeyHSD(modelo_anova)
print(resultado_tukey)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = resistencia ~ operario * maquina, data = datos2)
## 
## $operario
##         diff       lwr      upr     p adj
## OP2-OP1 1.25 -1.347459 3.847459 0.4302092
## OP3-OP1 6.00  3.402541 8.597459 0.0001330
## OP3-OP2 4.75  2.152541 7.347459 0.0010207
## 
## $maquina
##           diff       lwr      upr     p adj
## B-A  0.3333333 -3.004389 3.671055 0.9904645
## C-A -0.1666667 -3.504389 3.171055 0.9987710
## D-A  1.6666667 -1.671055 5.004389 0.4766928
## C-B -0.5000000 -3.837722 2.837722 0.9693945
## D-B  1.3333333 -2.004389 4.671055 0.6465008
## D-C  1.8333333 -1.504389 5.171055 0.3989736
## 
## $`operario:maquina`
##             diff        lwr       upr     p adj
## OP2:A-OP1:A  1.5  -6.230766  9.230766 0.9993833
## OP3:A-OP1:A  5.5  -2.230766 13.230766 0.2769269
## OP1:B-OP1:A  3.0  -4.730766 10.730766 0.9013973
## OP2:B-OP1:A  1.0  -6.730766  8.730766 0.9999870
## OP3:B-OP1:A  4.0  -3.730766 11.730766 0.6575431
## OP1:C-OP1:A -1.0  -8.730766  6.730766 0.9999870
## OP2:C-OP1:A  0.5  -7.230766  8.230766 1.0000000
## OP3:C-OP1:A  7.0  -0.730766 14.730766 0.0898750
## OP1:D-OP1:A -0.5  -8.230766  7.230766 1.0000000
## OP2:D-OP1:A  3.5  -4.230766 11.230766 0.7937754
## OP3:D-OP1:A  9.0   1.269234 16.730766 0.0178460
## OP3:A-OP2:A  4.0  -3.730766 11.730766 0.6575431
## OP1:B-OP2:A  1.5  -6.230766  9.230766 0.9993833
## OP2:B-OP2:A -0.5  -8.230766  7.230766 1.0000000
## OP3:B-OP2:A  2.5  -5.230766 10.230766 0.9664165
## OP1:C-OP2:A -2.5 -10.230766  5.230766 0.9664165
## OP2:C-OP2:A -1.0  -8.730766  6.730766 0.9999870
## OP3:C-OP2:A  5.5  -2.230766 13.230766 0.2769269
## OP1:D-OP2:A -2.0  -9.730766  5.730766 0.9931505
## OP2:D-OP2:A  2.0  -5.730766  9.730766 0.9931505
## OP3:D-OP2:A  7.5  -0.230766 15.230766 0.0602463
## OP1:B-OP3:A -2.5 -10.230766  5.230766 0.9664165
## OP2:B-OP3:A -4.5 -12.230766  3.230766 0.5149555
## OP3:B-OP3:A -1.5  -9.230766  6.230766 0.9993833
## OP1:C-OP3:A -6.5 -14.230766  1.230766 0.1328994
## OP2:C-OP3:A -5.0 -12.730766  2.730766 0.3847296
## OP3:C-OP3:A  1.5  -6.230766  9.230766 0.9993833
## OP1:D-OP3:A -6.0 -13.730766  1.730766 0.1938021
## OP2:D-OP3:A -2.0  -9.730766  5.730766 0.9931505
## OP3:D-OP3:A  3.5  -4.230766 11.230766 0.7937754
## OP2:B-OP1:B -2.0  -9.730766  5.730766 0.9931505
## OP3:B-OP1:B  1.0  -6.730766  8.730766 0.9999870
## OP1:C-OP1:B -4.0 -11.730766  3.730766 0.6575431
## OP2:C-OP1:B -2.5 -10.230766  5.230766 0.9664165
## OP3:C-OP1:B  4.0  -3.730766 11.730766 0.6575431
## OP1:D-OP1:B -3.5 -11.230766  4.230766 0.7937754
## OP2:D-OP1:B  0.5  -7.230766  8.230766 1.0000000
## OP3:D-OP1:B  6.0  -1.730766 13.730766 0.1938021
## OP3:B-OP2:B  3.0  -4.730766 10.730766 0.9013973
## OP1:C-OP2:B -2.0  -9.730766  5.730766 0.9931505
## OP2:C-OP2:B -0.5  -8.230766  7.230766 1.0000000
## OP3:C-OP2:B  6.0  -1.730766 13.730766 0.1938021
## OP1:D-OP2:B -1.5  -9.230766  6.230766 0.9993833
## OP2:D-OP2:B  2.5  -5.230766 10.230766 0.9664165
## OP3:D-OP2:B  8.0   0.269234 15.730766 0.0401932
## OP1:C-OP3:B -5.0 -12.730766  2.730766 0.3847296
## OP2:C-OP3:B -3.5 -11.230766  4.230766 0.7937754
## OP3:C-OP3:B  3.0  -4.730766 10.730766 0.9013973
## OP1:D-OP3:B -4.5 -12.230766  3.230766 0.5149555
## OP2:D-OP3:B -0.5  -8.230766  7.230766 1.0000000
## OP3:D-OP3:B  5.0  -2.730766 12.730766 0.3847296
## OP2:C-OP1:C  1.5  -6.230766  9.230766 0.9993833
## OP3:C-OP1:C  8.0   0.269234 15.730766 0.0401932
## OP1:D-OP1:C  0.5  -7.230766  8.230766 1.0000000
## OP2:D-OP1:C  4.5  -3.230766 12.230766 0.5149555
## OP3:D-OP1:C 10.0   2.269234 17.730766 0.0080049
## OP3:C-OP2:C  6.5  -1.230766 14.230766 0.1328994
## OP1:D-OP2:C -1.0  -8.730766  6.730766 0.9999870
## OP2:D-OP2:C  3.0  -4.730766 10.730766 0.9013973
## OP3:D-OP2:C  8.5   0.769234 16.230766 0.0267714
## OP1:D-OP3:C -7.5 -15.230766  0.230766 0.0602463
## OP2:D-OP3:C -3.5 -11.230766  4.230766 0.7937754
## OP3:D-OP3:C  2.0  -5.730766  9.730766 0.9931505
## OP2:D-OP1:D  4.0  -3.730766 11.730766 0.6575431
## OP3:D-OP1:D  9.5   1.769234 17.230766 0.0119280
## OP3:D-OP2:D  5.5  -2.230766 13.230766 0.2769269

La prueba de Tukey presenta resultado similares a los observados anteriormente.

#Verificacion de los supuestos

#Normalidad

residuos<-residuals(modelo_anova)
par(mfrow=c(1,3))

# Gráfico Q-Q de los residuos 
qqnorm(residuos, col = "blue", main = "Gráfico Q-Q de Residuos")
qqline(residuos, col = "black")  

# Curva de densidad de los residuos
densidad_residuos <- density(residuos)
plot(densidad_residuos, main = "Curva de Densidad de Residuos", xlab = "Residuos", col = "skyblue")
polygon(densidad_residuos, col = "cyan", border = "black")

# Boxplot de residuos
boxplot(residuos, col = "lightgreen",
        main = "Boxplot de Residuos",
        xlab = "Combinación de Operario y máquina",
        ylab = "Residuos")

Como prueba confirmatorio se procede a realizar la prueba de Shapiro-Wilk.

H0: Los residuos de la variable resistencia de la fibra sigue una distribucion normal.

Ha: Los residuos de la variable resistencia de la fibra no siguen la distribución normal.

shapiro.test(residuals(modelo_anova)) 
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(modelo_anova)
## W = 0.94926, p-value = 0.2611

Como P valor = 0.2611 no hay evidencia estadistica que permite rechazar la hipotesis nula (h0), por lo tanto se acepta la hipotesis nula que concluye que residuos de la variable sobrevivencia de la flor presentan una distribución normal.

#Homogeneidad de varianzas

boxplot(residuos ~ datos2$operario:datos2$maquina,
        col = "blue",
        xlab = "Combinación de operario y máquina",
        ylab = "Residuos",
        main = "Boxplot de Residuos por Combinación de operario y máquina")

En la siguiente gráfica, se representan los valores predichos por el modelo para la variable concentración del material en función de la raíz cuadrada de los residuos estandarizados. En esta gráfica, no se observa ninguna tendencia aparente en la distribución de los valores, lo que sugiere que no hay evidencia de incumplimiento del supuesto de homogeneidad de varianzas.

color_palette <- colorRampPalette(c("blue", "black", "blue"))
plot(residuos, main = "Prueba de independencia", pch = 20, cex = 2, col = color_palette(120), ylab = "Residuos", xlab = " ")

En la grafica anterior se observan dispersos los puntos sin seguir un patron, esto es un indicio de homogeneidad de varianzas

Para terminar de corroborar esto se hace la prueba de Barlett

H0: La varianza es constante en todos los grupos.

Ha: La varianza no es constante en al menos en un grupo.

grupos <- with(datos2, interaction(operario, maquina))

resultado_bartlett <- bartlett.test(residuals(modelo_anova), grupos)
print(resultado_bartlett)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  residuals(modelo_anova) and grupos
## Bartlett's K-squared = 4.8106, df = 11, p-value = 0.94

Como P valor = a 0.94 mayor a 0.05 se acepta la hipotesis nula que indica que hay homogeneidad de varianzas.

#Independencia

H0: Los residuos entre los tratamientos son independientes.

Ha:Los residuos entre los tratamientos no son independientes.

resultado_durbin_watson <- dwtest(modelo_anova)
print(resultado_durbin_watson)
## 
##  Durbin-Watson test
## 
## data:  modelo_anova
## DW = 3.011, p-value = 0.6366
## alternative hypothesis: true autocorrelation is greater than 0

Al realizar la prueba de independencia de residuos para la variable resistencia, se determinó que los residuos no están correlacionados, debido a que el DW está próximo a 2 y el valor de p (p-value = 0.6366) es superior al nivel de significancia de 5% (α=0.05) por lo que se concluye que existe independencia de los residuos.

#Post anova

mod1=lm(resistencia~operario+maquina,data=datos2)
anova(mod1)
## Analysis of Variance Table
## 
## Response: resistencia
##           Df  Sum Sq Mean Sq F value    Pr(>F)    
## operario   2 160.333  80.167  16.004 0.0001014 ***
## maquina    3  12.458   4.153   0.829 0.4950978    
## Residuals 18  90.167   5.009                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Con esta prueba de Anova , nuevamente confirmamos los resultados del primer Anova realizado. donde Para el factor α hay evidencia estadísticamente significativa para rechazar la hipótesis nula, ya que el p-valor es menor al nivel de significancia establecido (0.05). Esto indica que hay diferencias significativas en la sobrevivencia de la flor entre los dos tipos de reactivos utilizados en el experimento.

El efecto del factor β no se considera estadísticamente significativo, ya que se obtuvo un p-valor superior a 0.05.

compara1=LSD.test(mod1,"Especie")
compara1
## NULL
plot(mod1)

shapiro.test(mod1$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  mod1$residuals
## W = 0.93429, p-value = 0.1216

Esta tabla resume el modelo del experimento donde podemos observar los valores mínimos, máximos, los cuartiles y si existe interacción. en este caso como lo indica la tabla, no hay interacción entre los factores de tratamiento. Por otro lado, las gráficas nos permiten corroborar que los supuestos de Normalidad, Homogeneidad de varianza e independencia si se cumplen.

Ejercicio 3

Supongamos que estás realizando un experimento en el que se investiga el rendimiento de diferentes tipos de fertilizantes (Factor A: A1, A2, A3) y diferentes condiciones de riego (Factor B: B1, B2) en el crecimiento de plantas. El resultado que se mide es la altura de las plantas después de un período de tiempo. Se quiere saber si hay una interacción significativa entre el tipo de fertilizante y la condición de riego.

set.seed(123) 
fertilizante <- factor(rep(c("A1", "A2", "A3"), each = 2, times = 2))
riego <- factor(rep(c("B1", "B2"), each = 6))
altura <- c(45, 47, 50, 52, 55, 57, 58, 60, 63, 66, 61, 64)
datos3 <- data.frame(fertilizante, riego, altura)
datos3
##    fertilizante riego altura
## 1            A1    B1     45
## 2            A1    B1     47
## 3            A2    B1     50
## 4            A2    B1     52
## 5            A3    B1     55
## 6            A3    B1     57
## 7            A1    B2     58
## 8            A1    B2     60
## 9            A2    B2     63
## 10           A2    B2     66
## 11           A3    B2     61
## 12           A3    B2     64

#Análisis descriptivos

conteo_valores_tratamiento <- table(datos3$riego, datos3$fertilizante)
print(conteo_valores_tratamiento)
##     
##      A1 A2 A3
##   B1  2  2  2
##   B2  2  2  2

Como podemos observar por cada tratamiento se observan dos replicas.

summarytools::descr(datos3[,3])
## Descriptive Statistics  
## datos3$altura  
## N: 12  
## 
##                     altura
## ----------------- --------
##              Mean    56.50
##           Std.Dev     6.82
##               Min    45.00
##                Q1    51.00
##            Median    57.50
##                Q3    62.00
##               Max    66.00
##               MAD     8.15
##               IQR    10.00
##                CV     0.12
##          Skewness    -0.28
##       SE.Skewness     0.64
##          Kurtosis    -1.40
##           N.Valid    12.00
##         Pct.Valid   100.00

A partir de los resultados arrojados por el programa podemos concluir que: la media de la altura es de 56.50 donde el 50% de los datos se ubica entre45.00 y 57.50 Por otro lado el 50% restante se ubicó entre 57.50 y 66. Finalmente la curtosis de -1.40 nos indica que los datos se distribuyen a la izquierda de la media (platicurtica) y presenta un coeficiente de asimetría de -0.28.

resultados_descriptivos2 <- aggregate(altura~ fertilizante, data = datos3, summary)

print(resultados_descriptivos2)
##   fertilizante altura.Min. altura.1st Qu. altura.Median altura.Mean
## 1           A1       45.00          46.50         52.50       52.50
## 2           A2       50.00          51.50         57.50       57.75
## 3           A3       55.00          56.50         59.00       59.25
##   altura.3rd Qu. altura.Max.
## 1          58.50       60.00
## 2          63.75       66.00
## 3          61.75       64.00

Llevando a cabo el análisis descriptivo por especie se obtuvieron los siguientes resultados:

Para el fertilizante A1: el promedio de altura fue de 52.50, el valor mínimo de altura fue de 45.00, el valor máximo de altura fue de 60.00, el 50% de las observaciones presentaron una altura de entre 45.00 y 52.50, mientras que el restante 50% presentaron días de floración de entre 52.50 y 60.00.

Para el fertilizante B: el promedio de altura fue de 57.75, el valor mínimo de altura fue de 50.00, el valor máximo de altura fue de 66.00, el 50% de las observaciones presentaron una altura de entre 50.00 y 57.50, mientras que el restante 50% presentaron días de floración de entre 57.50 y 66.00.

Para el fertilizante C: el promedio de altura fue de 59.25, el valor mínimo de altura fue de 55.00, el valor máximo de de altura fue de 64.00, el 50% de las observaciones presentaron una altura de entre 55.00 y 59.00, mientras que el restante 50% presentaron días de floración de entre 59.00 y 64.00.

#ANOVA

H0: No hay diferencias significativas en el crecimiento de las plantas debido al tipo de fertilizante (Factor A) o al tipo de riego (Factor B) ni existe interacción entre el tipo de fertilizante y el tipo de riego.

En otras palabras, la hipótesis nula postula que no hay efectos significativos ni interacción entre los factores A y B en el crecimiento de las plantas. Las diferencias observadas en el crecimiento de las plantas se deben al azar y no son atribuibles a ninguno de los factores o su interacción.

modelo_anova1 <-aov(altura~fertilizante, data =datos3)
resumen_anova1 <-summary(modelo_anova1)

print(resumen_anova1)
##              Df Sum Sq Mean Sq F value Pr(>F)
## fertilizante  2  100.5   50.25   1.102  0.373
## Residuals     9  410.5   45.61

A partir de la prueba ANOVA, obtenemos un p valor de 0,373, por lo tanto concluimos que hay evidencia estadística suficiente que permite indicar que no se rechaza la hipotesis nula

modelo_anovaint3 <-aov(altura ~ riego* fertilizante, data =datos3)
resumen_anovaint3 <-summary(modelo_anovaint3)
print(resumen_anovaint3)
##                    Df Sum Sq Mean Sq F value   Pr(>F)    
## riego               1  363.0   363.0 128.118 2.85e-05 ***
## fertilizante        2  100.5    50.2  17.735  0.00303 ** 
## riego:fertilizante  2   30.5    15.2   5.382  0.04584 *  
## Residuals           6   17.0     2.8                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

A partir de los resultados del ANOVA, se puede concluir que:

Para el factor α hay evidencia estadísticamente significativa para rechazar la hipótesis nula, pues p-valor = 2.85e-05, es menor al nivel de significancia de 0.05.Esto sugiere que hay diferencias significativas en la altura de las plantas entre los dos tipos de riego utilizados en el experimento.

para el efecto del factor β hay evidencia estadísticamente significativa, pues= p-valor 0.00303 es menor a 0.05. Estos sugiere que se presentan diferencias significativas en la altura de la planta entre al menos dos de los tres fertilizantes considerados en el experimento.

La interacción entre el tipo de reactivo y la especie de planta (αβ) es estadísticamente significativa, pues p-valor = 0.04584 menor a 0.05 por lo que se rechaza H0.Por lo tanto, se sugiere que el efecto del tipo de fertilizante en la altura de la planta está influenciado por el riego.

#Diagrama de cajas y bigotes

boxplot(datos3$altura~ datos3$fertilizante * datos3$riego, 
        main = "Diagrama de Cajas de Sobrevivencia",
        xlab = "Combinacion de fertilizante y riego",
        ylab = "Saltura", 
        col = c("green", "yellow", "blue","orange","pink","purple"))

Finalmente para complementar esto, como podemos observar en la gráfica , los bloques en los cuales se distribuyen los datos bajo los diferentes tratamientos se ubican de manera heterogenea.

#Metodos de comparaciones multiple post hoc

#LSD

modelo_anova <- aov(altura ~ riego + fertilizante + riego:fertilizante, data = datos3)
LSD_result2 <- TukeyHSD(modelo_anova)
print(LSD_result2)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = altura ~ riego + fertilizante + riego:fertilizante, data = datos3)
## 
## $riego
##       diff      lwr      upr    p adj
## B2-B1   11 8.622029 13.37797 2.84e-05
## 
## $fertilizante
##       diff       lwr       upr     p adj
## A2-A1 5.25  1.598023  8.901977 0.0107141
## A3-A1 6.75  3.098023 10.401977 0.0031252
## A3-A2 1.50 -2.151977  5.151977 0.4648668
## 
## $`riego:fertilizante`
##             diff         lwr      upr     p adj
## B2:A1-B1:A1 13.0   6.3009197 19.69908 0.0019361
## B1:A2-B1:A1  5.0  -1.6990803 11.69908 0.1514864
## B2:A2-B1:A1 18.5  11.8009197 25.19908 0.0002715
## B1:A3-B1:A1 10.0   3.3009197 16.69908 0.0076833
## B2:A3-B1:A1 16.5   9.8009197 23.19908 0.0005183
## B1:A2-B2:A1 -8.0 -14.6990803 -1.30092 0.0227567
## B2:A2-B2:A1  5.5  -1.1990803 12.19908 0.1086339
## B1:A3-B2:A1 -3.0  -9.6990803  3.69908 0.5346982
## B2:A3-B2:A1  3.5  -3.1990803 10.19908 0.4009589
## B2:A2-B1:A2 13.5   6.8009197 20.19908 0.0015770
## B1:A3-B1:A2  5.0  -1.6990803 11.69908 0.1514864
## B2:A3-B1:A2 11.5   4.8009197 18.19908 0.0037289
## B1:A3-B2:A2 -8.5 -15.1990803 -1.80092 0.0171057
## B2:A3-B2:A2 -2.0  -8.6990803  4.69908 0.8286984
## B2:A3-B1:A3  6.5  -0.1990803 13.19908 0.0567072

como podemos observar hay una diferencia significativa en la altura de las plantas entre los riegos B1 y B2. El valor p presenta un valor de 2.84e-05 menor ak nivel de significancia.

Se encontraron diferencias significativas en la altura de las plantas entre los fertilizantes A1:A2 y A3:A1 pues se presento un p valor =0.0107141 y 0.0031252 menor al nivel de significancia.

En el análisis por interacción se encontraron diferencias significativas en la altura de las plantasen algunas combinaciones.

Sin embargo, algunas combinaciones presentaron un p valor menor al nivel de significancia: R1:B-R2:A, R1:C-R2:A:A, R2:B-R1:B , R1:C-R2:B y R2:C-R1:C.

#Método de Tukey

resultado_tukey1 <- TukeyHSD(modelo_anova)
print(resultado_tukey1)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = altura ~ riego + fertilizante + riego:fertilizante, data = datos3)
## 
## $riego
##       diff      lwr      upr    p adj
## B2-B1   11 8.622029 13.37797 2.84e-05
## 
## $fertilizante
##       diff       lwr       upr     p adj
## A2-A1 5.25  1.598023  8.901977 0.0107141
## A3-A1 6.75  3.098023 10.401977 0.0031252
## A3-A2 1.50 -2.151977  5.151977 0.4648668
## 
## $`riego:fertilizante`
##             diff         lwr      upr     p adj
## B2:A1-B1:A1 13.0   6.3009197 19.69908 0.0019361
## B1:A2-B1:A1  5.0  -1.6990803 11.69908 0.1514864
## B2:A2-B1:A1 18.5  11.8009197 25.19908 0.0002715
## B1:A3-B1:A1 10.0   3.3009197 16.69908 0.0076833
## B2:A3-B1:A1 16.5   9.8009197 23.19908 0.0005183
## B1:A2-B2:A1 -8.0 -14.6990803 -1.30092 0.0227567
## B2:A2-B2:A1  5.5  -1.1990803 12.19908 0.1086339
## B1:A3-B2:A1 -3.0  -9.6990803  3.69908 0.5346982
## B2:A3-B2:A1  3.5  -3.1990803 10.19908 0.4009589
## B2:A2-B1:A2 13.5   6.8009197 20.19908 0.0015770
## B1:A3-B1:A2  5.0  -1.6990803 11.69908 0.1514864
## B2:A3-B1:A2 11.5   4.8009197 18.19908 0.0037289
## B1:A3-B2:A2 -8.5 -15.1990803 -1.80092 0.0171057
## B2:A3-B2:A2 -2.0  -8.6990803  4.69908 0.8286984
## B2:A3-B1:A3  6.5  -0.1990803 13.19908 0.0567072

La prueba de Tukey presenta resultado similares a los observados anteriormente.

plot(resultado_tukey1)

Con base en las gráficas podemos corroborar que existe interacción en el tipo de especie por lo tanto confirmamos lo anterior

#Supuestos del modelo

#Normalidad

residuos<-residuals(modelo_anova)
par(mfrow=c(1,3))

# Gráfico Q-Q de los residuos con color
qqnorm(residuos, col = "blue", main = "Gráfico Q-Q de Residuos")
qqline(residuos, col = "black")  

# Curva de densidad de los residuos
densidad_residuos <- density(residuos)
plot(densidad_residuos, main = "Curva de Densidad de Residuos", xlab = "Residuos", col = "blue")
polygon(densidad_residuos, col = "green", border = "black")

# Boxplot de residuos
boxplot(residuos, col = "pink",
        main = "Boxplot de Residuos",
        xlab = "Combinación de riego y fertilizante",
        ylab = "Residuos")

Como prueba confirmatorio se procede a realizar la prueba de Shapiro-Wilk.

H0: Los residuos de la variablealtura de las plantas se distribuyen normalmente con media cero y varianza constante.

Ha: Los residuos de la variable altura de las plantas no siguen la distribución normal.

modelo_anova <- aov(altura ~ riego + fertilizante + riego:fertilizante, data = datos3)
shapiro.test(residuals(modelo_anova)) 
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(modelo_anova)
## W = 0.79332, p-value = 0.007874

Como P valor = 0.007874 no hay evidencia estadistica que permite rechazar la hipotesis nula (h0), por lo tanto se acepta la hipotesis nula que concluye que residuos de la variable altura de las plantas presentan una distribución normal.

#Homogeneidad de varianzas

# Boxplot de los residuos
boxplot(residuos ~ datos3$riego:datos3$fertilizante,
        col = "blue",
        xlab = "Combinación de riego y fertilizante",
        ylab = "Residuos",
        main = "Boxplot de Residuos por Combinación de riego y fertilizante")

En la siguiente gráfica, se representan los valores predichos por el modelo para la variable concentración del material en función de la raíz cuadrada de los residuos estandarizados. En esta gráfica, no se observa ninguna tendencia aparente en la distribución de los valores, lo que sugiere que no hay evidencia de incumplimiento del supuesto de homogeneidad de varianzas.

color_palette <- colorRampPalette(c("red", "black", "red"))
plot(residuos, main = "Prueba de independencia", pch = 20, cex = 2, col = color_palette(120), ylab = "Residuos", xlab = " ")

En la grafica anterior se observan dispersos los puntos sin seguir un patron, esto es un indicio de homogeneidad de varianzas

Para terminar de corroborar esto se hace la prueba de Barlett

H0: La varianza es constante en todos los grupos.

Ha: La varianza no es constante en al menos en un grupo.

grupos <- with(datos3, interaction(riego, fertilizante))
# Prueba de Bartlett
resultado_bartlett <- bartlett.test(residuals(modelo_anova), grupos)
print(resultado_bartlett)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  residuals(modelo_anova) and grupos
## Bartlett's K-squared = 0.33695, df = 5, p-value = 0.9969

Como P valor = a 0.9969 mayor a 0.05 se acepta la hipotesis nula que indica que hay homogeneidad de varianzas.

#Independiencia de los residuos

#Prueba de Durbin Watson

H0: Los residuos entre los tratamientos son independientes.

Ha:Los residuos entre los tratamientos no son independientes.

resultado_durbin_watson <- dwtest(modelo_anova)
print(resultado_durbin_watson)
## 
##  Durbin-Watson test
## 
## data:  modelo_anova
## DW = 3.6029, p-value = 0.9884
## alternative hypothesis: true autocorrelation is greater than 0

Al realizar la prueba de independencia de residuos para la variable altura, se determinó que los residuos no están correlacionados, debido a que el DW está próximo a 2 y el valor de p (p-value = 0.9884) es superior al nivel de significancia de 5% (α=0.05) por lo que se concluye que existe independencia de los residuos.

#Post anova

mod1=lm(altura~fertilizante+riego,data=datos3)
anova(mod1)
## Analysis of Variance Table
## 
## Response: altura
##              Df Sum Sq Mean Sq F value    Pr(>F)    
## fertilizante  2  100.5   50.25  8.4632   0.01061 *  
## riego         1  363.0  363.00 61.1368 5.147e-05 ***
## Residuals     8   47.5    5.94                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Con esta prueba de Anova , nuevamente confirmamos los resultados del primer Anova realizado. donde Para el factor α hay evidencia estadísticamente significativa para rechazar la hipótesis nula, ya que el p-valor es menor al nivel de significancia establecido (0.05).Esto indica que hay diferencias significativas en la sobrevivencia de la flor entre los dos tipos de reactivos utilizados en el experimento.

El efecto del factor β se considera estadísticamente significativo, ya que se obtuvo un p-valor inferior a 0.05. Estos resultados indican que se presentan diferencias significativas en la sobrevivencia de la flor entre al menos dos de las tres especies de plantas consideradas en el experimento.

compara1=LSD.test(mod1,"Especie")
compara1
## NULL
plot(mod1)

shapiro.test(mod1$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  mod1$residuals
## W = 0.96819, p-value = 0.8909

Esta tabla resume el modelo del experimento donde podemos observar los valores minimos, máximos, los cuartiles y si existe interacción. en este caso como lo indica la tabla, no hay interacción entre los factores de tratamiento. Por otro lado las gráficas nos permiten corroborar que los supuestos de Normalidad, Homogeneidad de varianza e independencia si se cumplen.