En un experimento se consideran tres especies de plantas y dos tipos de reactivos para activar el ciclo de florescencia de las plantas. Se mide en cada planta la sobrevivencia de la flor,es decir, el tiempo en días en que aparece la flor hasta cuando presenta signos de marchitamiento. Los resultados se indican en las siguiente tabla:
library(readxl)
datos <- read_excel("C:/Users/LENOVO/Desktop/Ejercicio1.xlsx")
datos
## # A tibble: 18 × 3
## sobrevivencia reactivo especie
## <dbl> <chr> <chr>
## 1 12 R1 A
## 2 13 R1 A
## 3 15 R1 A
## 4 13 R1 B
## 5 15 R1 B
## 6 15 R1 B
## 7 16 R1 C
## 8 18 R1 C
## 9 20 R1 C
## 10 9 R2 A
## 11 8 R2 A
## 12 9 R2 A
## 13 10 R2 B
## 14 8 R2 B
## 15 9 R2 B
## 16 12 R2 C
## 17 10 R2 C
## 18 13 R2 C
-Número de observaciones (réplicas) por tratamiento
conteo_valores_tratamiento <- table(datos$reactivo, datos$especie)
print("Número de observaciones (réplicas) por tratamiento:")
## [1] "Número de observaciones (réplicas) por tratamiento:"
print(conteo_valores_tratamiento)
##
## A B C
## R1 3 3 3
## R2 3 3 3
Análisis Descriptivo
Medidas descriptivas de la variable dependiente (sobrevivencia de la flor)
summarytools::descr(datos [,1])
## Descriptive Statistics
## datos$sobrevivencia
## N: 18
##
## sobrevivencia
## ----------------- ---------------
## Mean 12.50
## Std.Dev 3.50
## Min 8.00
## Q1 9.00
## Median 12.50
## Q3 15.00
## Max 20.00
## MAD 3.71
## IQR 5.75
## CV 0.28
## Skewness 0.43
## SE.Skewness 0.54
## Kurtosis -0.90
## N.Valid 18.00
## Pct.Valid 100.00
A partir de los resultados proporcionados, se puede concluir que el promedio de la variable sobrevivencia de la flor es de 12.50, con una desviación estándar de 3.50. El valor mínimo observado en esta variable es de 8.00, mientras que el valor máximo alcanza los 20.00. El 50% de las observaciones se sitúan en un rango que va desde 9.00 hasta 15.00, lo que refleja la mediana de 12.50 como medida central. Asimismo, se observa una asimetría positiva leve, con un coeficiente de asimetría de 0.43. Además, el coeficiente de curtosis es de -0.90, lo que sugiere que la distribución de los datos es platicúrtica.
-Medidas descriptivas por Tratamientos
resultados_descriptivos <- aggregate(sobrevivencia ~ reactivo + especie + reactivo:especie, data = datos, summary)
print(resultados_descriptivos)
## reactivo especie sobrevivencia.Min. sobrevivencia.1st Qu.
## 1 R1 A 12.000000 12.500000
## 2 R2 A 8.000000 8.500000
## 3 R1 B 13.000000 14.000000
## 4 R2 B 8.000000 8.500000
## 5 R1 C 16.000000 17.000000
## 6 R2 C 10.000000 11.000000
## sobrevivencia.Median sobrevivencia.Mean sobrevivencia.3rd Qu.
## 1 13.000000 13.333333 14.000000
## 2 9.000000 8.666667 9.000000
## 3 15.000000 14.333333 15.000000
## 4 9.000000 9.000000 9.500000
## 5 18.000000 18.000000 19.000000
## 6 12.000000 11.666667 12.500000
## sobrevivencia.Max.
## 1 15.000000
## 2 9.000000
## 3 15.000000
## 4 10.000000
## 5 20.000000
## 6 13.000000
LLevando a cabo el análisis descriptivo por tratamiento se obtuvieron los siguientes resultados:
Para el reactivo R1 y la especie A: La sobrevivencia promedio es de 13.33. El valor mínimo de sobrevivencia es 12.00, el valor máximo de sobrevivencia es 15.00. El 50% de las observaciones presentaron un sobrevivencia entre 12.00 y 13.00, mientras que el restante 50% presentó una sobrevivencia entre 13.00 y 15.00.
Para el reactivo R2 y la especie A: La sobrevivencia promedio es de 8.67. El valor mínimo de sobrevivencia es 8.00, el valor máximo de sobrevivencia es 9.00. El 50% de las observaciones presentaron un sobrevivencia entre 8.00 y 9.00.
Para el reactivo R1 y la especie B: La sobrevivencia promedio es de 14.33. El valor mínimo de sobrevivencia es 13.00, el valor máximo de sobrevivencia es 15.00. El 50% de las observaciones presentaron un sobrevivencia entre 13.00 y 15.00.
Para el reactivo R2 y la especie B: La sobrevivencia promedio es de 9.00. El valor mínimo de sobrevivencia es 8.00, el valor máximo de sobrevivencia es 10.00. El 50% de las observaciones presentaron un sobrevivencia entre 8.00 y 9.00.
Para el reactivo R1 y la especie C: La sobrevivencia promedio es de 18.00. El valor mínimo de sobrevivencia es 16.00, el valor máximo de sobrevivencia es 20.00. El 50% de las observaciones presentaron un sobrevivencia entre 16.00 y 18.00.
Para el reactivo R2 y la especie C: La sobrevivencia promedio es de 11.67. El valor mínimo de sobrevivencia es 10.00, el valor máximo de sobrevivencia es 13.00. El 50% de las observaciones presentaron un sobrevivencia entre 10.00 y 11.67.
-Realización del ANOVA
Las hipótesis contrastadas en el ANOVA son:
Factor 1 (α):Tipo de reactivo
\(H_0:\) No hay diferencias significativas entre los dos tipos de reactivos utilizados en la sobrevivencia de la flor.
\(H_a:\) Existen por lo menos dos de los tipos de reactivos utilizados con diferencias significativas en la sobrevivencia de la flor.
\(H_0:α_1=α_2=...=α_a=0\)
\(H_a:α_1≠0\) para algún i
Factor 2 (β):Especie de planta
\(H_0:\) No hay diferencias significativas entre las diferentes especies de plantas en la sobrevivencia de la flor.
\(H_a:\) Existen por lo menos dos de las especies de plantas con diferencias significativas en la sobrevivencia de la flor.
\(H_0:β_1=β_2=...=β_b=0\)
\(H_a:β_j≠0\) para algún j
Interacción entre (αβ)
\(H_0:\) No hay una interacción significativa entre la especie de planta y el tipo de reactivo en la sobrevivencia de la flor.
\(H_a:\) Existe una interacción significativa entre la especie de planta y el tipo de reactivo en la sobrevivencia de la flor.
\(H_0:(αβ)_ij=0\) para todo ij
\(H_a:(αβ)_ij≠0\) para algún ij
modelo_anova <- aov(sobrevivencia ~ reactivo * especie, data = datos)
resultado_anova <- summary(modelo_anova)
print(resultado_anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## reactivo 1 133.39 133.39 70.618 2.26e-06 ***
## especie 2 50.33 25.17 13.324 0.000896 ***
## reactivo:especie 2 2.11 1.06 0.559 0.586073
## Residuals 12 22.67 1.89
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
A partir de los resultados del análisis de varianza (ANOVA), se puede concluir que:
Para el factor α hay evidencia estadísticamente significativa para rechazar la hipótesis nula, ya que el p-valor 2.26e-06, es menor al nivel de significancia establecido (0.05).Esto indica que hay diferencias significativas en la sobrevivencia de la flor entre los dos tipos de reactivos utilizados en el experimento.
El efecto del factor β se considera estadísticamente significativo, ya que se obtuvo un valor de F igual a 13.324 con un p-valor 0.000896 inferior a 0.05. Estos resultados indican que se presentan diferencias significativas en la sobrevivencia de la flor entre al menos dos de las tres especies de plantas consideradas en el experimento.
La interacción entre el tipo de reactivo y la especie de planta (αβ) no es estadísticamente significativa, ya que se obtuvo un valor de F igual a 0.559 con un p-valor 0.586073 mayor a 0.05 por lo que se acepta \(H_0\). En consecuencia, se deduce que el efecto del tipo de reactivo en la sobrevivencia de la flor no está influenciado por la especie de planta, y viceversa.En pocas palabras, no se observa una interacción significativa entre estos dos factores, lo que sugiere que sus efectos son independientes entre sí.
-Diagrama de cajas y bigotes por tratamiento
boxplot(datos$sobrevivencia ~ datos$reactivo * datos$especie,
main = "Diagrama de Cajas de Sobrevivencia",
xlab = "Combinacion de Reactivo y Especie",
ylab = "Sobrevivencia",
col = c("lightgreen", "yellow", "lightblue","orange","pink","purple"))
En el diagrama de cajas se puede observar algunas de las combinaciones con diferencias significativas (p < 0.05) en la sobrevivencia de las flores como R2:A y R1:A, R2:B y R1:A, R1:C y R1:A, R1:C y R2:C, R1:B y R1:A, entre otras (no se traslapan las gráficas) caso contrario en el caso de R1:B y R1:A, R2:B y R2:A (donde se solapan).
Métodos de comparaciones múltiples o pruebas de rango múltiple (pruebas post hoc)
-Método de la diferencia mínima significativa (LSD)
modelo_anova <- aov(sobrevivencia ~ reactivo + especie + reactivo:especie, data = datos)
LSD_result <- TukeyHSD(modelo_anova)
print(LSD_result)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = sobrevivencia ~ reactivo + especie + reactivo:especie, data = datos)
##
## $reactivo
## diff lwr upr p adj
## R2-R1 -5.444444 -6.856061 -4.032827 2.3e-06
##
## $especie
## diff lwr upr p adj
## B-A 0.6666667 -1.450262 2.783595 0.6862717
## C-A 3.8333333 1.716405 5.950262 0.0011057
## C-B 3.1666667 1.049738 5.283595 0.0047100
##
## $`reactivo:especie`
## diff lwr upr p adj
## R2:A-R1:A -4.6666667 -8.4359375 -0.8973958 0.0129801
## R1:B-R1:A 1.0000000 -2.7692709 4.7692709 0.9415283
## R2:B-R1:A -4.3333333 -8.1026042 -0.5640625 0.0214217
## R1:C-R1:A 4.6666667 0.8973958 8.4359375 0.0129801
## R2:C-R1:A -1.6666667 -5.4359375 2.1026042 0.6791464
## R1:B-R2:A 5.6666667 1.8973958 9.4359375 0.0029859
## R2:B-R2:A 0.3333333 -3.4359375 4.1026042 0.9995991
## R1:C-R2:A 9.3333333 5.5640625 13.1026042 0.0000291
## R2:C-R2:A 3.0000000 -0.7692709 6.7692709 0.1523873
## R2:B-R1:B -5.3333333 -9.1026042 -1.5640625 0.0048364
## R1:C-R1:B 3.6666667 -0.1026042 7.4359375 0.0582517
## R2:C-R1:B -2.6666667 -6.4359375 1.1026042 0.2380136
## R1:C-R2:B 9.0000000 5.2307291 12.7692709 0.0000421
## R2:C-R2:B 2.6666667 -1.1026042 6.4359375 0.2380136
## R2:C-R1:C -6.3333333 -10.1026042 -2.5640625 0.0011711
Existe una diferencia significativa en la sobrevivencia de las flores entre los reactivos R1 y R2. El valor p ajustado es muy bajo 2.3e-06.
No se encontraron diferencias significativas en la sobrevivencia de las flores entre las especies A y B (p adj = 0.6862717). Sin embargo, se encontraron diferencias significativas en la sobrevivencia de las flores al comparar las especies A y C, así como las especies B y C (p adj = 0.0011057 y 0.0047100, respectivamente). Esto sugiere que las especies A y B son significativamente diferentes de la especie C en términos de sobrevivencia de las flores.
En el análisis de interacción se encontraron diferencias significativas en la sobrevivencia de las flores en varias combinaciones.Las combinaciones significativamente diferentes en términos de sobrevivencia de las flores son R2:A y R1:A, R2:B y R1:A, R1:C y R1:A, R1:B y R2:A, R1:C y R2:A, R2:B y R1:B, R1:C y R2:B, R2:C y R1:C (p adj < 0.05).
Sin embargo, algunas combinaciones, como R1:B con R1:A, R2:B con R2:A, R1:C con R1:B, R2:C con R1:B entre otras no mostraron diferencias significativas.
-Método de Tukey
resultado_tukey <- TukeyHSD(modelo_anova)
print(resultado_tukey)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = sobrevivencia ~ reactivo + especie + reactivo:especie, data = datos)
##
## $reactivo
## diff lwr upr p adj
## R2-R1 -5.444444 -6.856061 -4.032827 2.3e-06
##
## $especie
## diff lwr upr p adj
## B-A 0.6666667 -1.450262 2.783595 0.6862717
## C-A 3.8333333 1.716405 5.950262 0.0011057
## C-B 3.1666667 1.049738 5.283595 0.0047100
##
## $`reactivo:especie`
## diff lwr upr p adj
## R2:A-R1:A -4.6666667 -8.4359375 -0.8973958 0.0129801
## R1:B-R1:A 1.0000000 -2.7692709 4.7692709 0.9415283
## R2:B-R1:A -4.3333333 -8.1026042 -0.5640625 0.0214217
## R1:C-R1:A 4.6666667 0.8973958 8.4359375 0.0129801
## R2:C-R1:A -1.6666667 -5.4359375 2.1026042 0.6791464
## R1:B-R2:A 5.6666667 1.8973958 9.4359375 0.0029859
## R2:B-R2:A 0.3333333 -3.4359375 4.1026042 0.9995991
## R1:C-R2:A 9.3333333 5.5640625 13.1026042 0.0000291
## R2:C-R2:A 3.0000000 -0.7692709 6.7692709 0.1523873
## R2:B-R1:B -5.3333333 -9.1026042 -1.5640625 0.0048364
## R1:C-R1:B 3.6666667 -0.1026042 7.4359375 0.0582517
## R2:C-R1:B -2.6666667 -6.4359375 1.1026042 0.2380136
## R1:C-R2:B 9.0000000 5.2307291 12.7692709 0.0000421
## R2:C-R2:B 2.6666667 -1.1026042 6.4359375 0.2380136
## R2:C-R1:C -6.3333333 -10.1026042 -2.5640625 0.0011711
plot(resultado_tukey)
Lo mencionado anteriormente se confirma con la gráfica de la diferencia de medias(intervalos de confianza) en la interacción de el tipo de reactivo con la especie.
Verificación de los supuestos del modelo
La validez de los resultados obtenidos en cualquier análisis de varianza queda condicionado a que los supuestos del modelo se cumplan. Estos supuestos son: normalidad, varianza constante (igual varianza de los tratamientos) e independencia.
-Distribución normal de los residuos
residuos<-residuals(modelo_anova)
par(mfrow=c(1,3))
# Gráfico Q-Q de los residuos con color
qqnorm(residuos, col = "blue", main = "Gráfico Q-Q de Residuos")
qqline(residuos, col = "black")
# Curva de densidad de los residuos
densidad_residuos <- density(residuos)
plot(densidad_residuos, main = "Curva de Densidad de Residuos", xlab = "Residuos", col = "blue")
polygon(densidad_residuos, col = "green", border = "black")
# Boxplot de residuos
boxplot(residuos, col = "pink",
main = "Boxplot de Residuos",
xlab = "Combinación de Reactivo y Especie",
ylab = "Residuos")
Sin embargo, para confirmar de manera más sólida que los residuos siguen una distribución normal, se realiza la prueba de Shapiro-Wilk. Para la prueba Shapiro-Wilk para ratificar el cumplimiento del supuesto de normalidad de los residuos, evaluando las hipótesis:
\(H_0\): Los residuos de la variable sobrevivencia de la flor se distribuyen normalmente con media cero y varianza constante.
\(H_a\): Los residuos de la variable sobrevivencia de la flor no siguen la distribución normal.
modelo_anova <- aov(sobrevivencia ~ reactivo + especie + reactivo:especie, data = datos)
shapiro.test(residuals(modelo_anova))
##
## Shapiro-Wilk normality test
##
## data: residuals(modelo_anova)
## W = 0.9721, p-value = 0.8361
Por lo tanto, no hay evidencia estadística suficiente para rechazar la hipótesis nula (\(H_0\)). En otras palabras, se acepta la hipótesis nula, ya que el valor de p (p-value = 0.8361) es mayor que el valor del nivel de significancia (α = 0.05). Por lo tanto, se concluye que los residuos de la variable sobrevivencia de la flor están normalmente distribuidos con media cero y varianza constante.
# Boxplot de los residuos
boxplot(residuos ~ datos$reactivo:datos$especie,
col = "lightblue",
xlab = "Combinación de Reactivo y Especie",
ylab = "Residuos",
main = "Boxplot de Residuos por Combinación de Reactivo y Especie")
En el diagrama de cajas se representan los valores predichos por el modelo para la variable sobrevivencia de la flor en función de la raíz cuadrada de los residuos estandarizados. En esta gráfica, no se observa ninguna tendencia aparente en la distribución de los valores, lo que sugiere que no hay evidencia de incumplimiento del supuesto de homogeneidad de varianzas.
Ahora graficamos los residuos:
color_palette <- colorRampPalette(c("blue", "black", "blue"))
plot(residuos, main = "Prueba de independencia", pch = 20, cex = 2, col = color_palette(120), ylab = "Residuos", xlab = " ")
En la gráfica anterior, los puntos se presentan dispersos y no siguen un patrón claro, lo cual sugiere indicios de homogeneidad de varianzas (mayor dispersión implica una menor correlación entre los puntos).
No obstante, para confirmar de manera más rigurosa la homogeneidad de varianzas, se procede a realizar la prueba de Bartlett, donde se evalúan las hipótesis pertinentes:
\(H_0\): La varianza es constante en todos los grupos.
\(H_a\): La varianza no es constante en al menos en un grupo.
grupos <- with(datos, interaction(reactivo, especie))
# Prueba de Bartlett
resultado_bartlett <- bartlett.test(residuals(modelo_anova), grupos)
print("Prueba de Bartlett:")
## [1] "Prueba de Bartlett:"
print(resultado_bartlett)
##
## Bartlett test of homogeneity of variances
##
## data: residuals(modelo_anova) and grupos
## Bartlett's K-squared = 2.5886, df = 5, p-value = 0.7631
De acuerdo al valor arrojado por la prueba de bartlett, valor de p (0.7631) mayor a 0.05 se acepta la hipótesis nula, por lo que existe homogeneidad de varianzas, llegando a la misma conclusión anterior (gráfica anterior).
Independencia de los residuos
Donde las hipótesis son:
\(H_0\): Los residuos entre los tratamientos son independientes.
\(H_a\):Los residuos entre los tratamientos no son independientes.
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
# Realiza la prueba de Durbin-Watson en los residuos
resultado_durbin_watson <- dwtest(modelo_anova)
print(resultado_durbin_watson)
##
## Durbin-Watson test
##
## data: modelo_anova
## DW = 2.4902, p-value = 0.4146
## alternative hypothesis: true autocorrelation is greater than 0
Al realizar la prueba de independencia de residuos para la variable sobrevivencia de la flor, se determinó que los residuos no están correlacionados. Esto se basa en el hecho de que el valor de Durbin-Watson (DW) es cercano a 2 (DW = 2.4902), y el valor de p (p-value) es 0.4146, lo cual es superior al nivel de significancia (α = 0.05). Por lo tanto, se concluye que existe independencia de los residuos en el modelo, lo que sugiere que no hay autocorrelación significativa en los residuos.
En unos laboratorios se estan estudiando los factores que influyen en la resistencia de un tipo particular de fibra. Si se eligen al azar cuatro máquinas tres operarios y se realiza un experimento factorial usando fibras de un mismo lote de producción. Los resultados obtenidos se muestran en la siguiente tabla:
library(readxl)
datos1 <- read_excel("C:/Users/LENOVO/Desktop/Ejercicio2.xlsx")
datos1
## # A tibble: 24 × 3
## resistencia operario maquina
## <dbl> <chr> <chr>
## 1 109 OP1 A
## 2 110 OP1 A
## 3 110 OP1 B
## 4 115 OP1 B
## 5 108 OP1 C
## 6 109 OP1 C
## 7 110 OP1 D
## 8 108 OP1 D
## 9 110 OP2 A
## 10 112 OP2 A
## # ℹ 14 more rows
-Número de observaciones (réplicas) por tratamiento
conteo_valores_tratamiento <- table(datos1$operario, datos1$maquina)
print("Número de observaciones (réplicas) por tratamiento:")
## [1] "Número de observaciones (réplicas) por tratamiento:"
print(conteo_valores_tratamiento)
##
## A B C D
## OP1 2 2 2 2
## OP2 2 2 2 2
## OP3 2 2 2 2
Análisis Descriptivo
Medidas descriptivas de la variable dependiente (resistencia de fibra)
summarytools::descr(datos1 [,1])
## Descriptive Statistics
## datos1$resistencia
## N: 24
##
## resistencia
## ----------------- -------------
## Mean 112.29
## Std.Dev 3.38
## Min 108.00
## Q1 110.00
## Median 111.50
## Q3 114.50
## Max 120.00
## MAD 3.71
## IQR 4.25
## CV 0.03
## Skewness 0.69
## SE.Skewness 0.47
## Kurtosis -0.60
## N.Valid 24.00
## Pct.Valid 100.00
Tomando como referencia los resultados proporcionados, se determina que el promedio de la variable resistencia es de 112.29, con una desviación estándar de 3.38. El valor mínimo observado en esta variable es de 108.00, mientras que el valor máximo alcanza los 120.00. El 50% de las observaciones se sitúan en un rango que va desde 110.00 hasta 114.50, lo que refleja la mediana de 111.50 como medida central. Asimismo, se observa una asimetría positiva leve, con un coeficiente de asimetría de 0.69. Además, el coeficiente de curtosis es de -0.60, lo que sugiere que la distribución de los datos es platicúrtica.
-Medidas descriptivas por Tratamientos
resultados_descriptivos <- aggregate(resistencia ~ operario + maquina + operario:maquina, data = datos1, summary)
print(resultados_descriptivos)
## operario maquina resistencia.Min. resistencia.1st Qu. resistencia.Median
## 1 OP1 A 109.00 109.25 109.50
## 2 OP2 A 110.00 110.50 111.00
## 3 OP3 A 114.00 114.50 115.00
## 4 OP1 B 110.00 111.25 112.50
## 5 OP2 B 110.00 110.25 110.50
## 6 OP3 B 112.00 112.75 113.50
## 7 OP1 C 108.00 108.25 108.50
## 8 OP2 C 109.00 109.50 110.00
## 9 OP3 C 114.00 115.25 116.50
## 10 OP1 D 108.00 108.50 109.00
## 11 OP2 D 112.00 112.50 113.00
## 12 OP3 D 117.00 117.75 118.50
## resistencia.Mean resistencia.3rd Qu. resistencia.Max.
## 1 109.50 109.75 110.00
## 2 111.00 111.50 112.00
## 3 115.00 115.50 116.00
## 4 112.50 113.75 115.00
## 5 110.50 110.75 111.00
## 6 113.50 114.25 115.00
## 7 108.50 108.75 109.00
## 8 110.00 110.50 111.00
## 9 116.50 117.75 119.00
## 10 109.00 109.50 110.00
## 11 113.00 113.50 114.00
## 12 118.50 119.25 120.00
LLevando a cabo el análisis descriptivo por tratamiento se obtuvieron los siguientes resultados:
Para el operario OP1 y la máquina A: La resistencia promedio es de 109.50. El valor mínimo de resistencia es 109.00, y el valor máximo de resistencia es 110.00. El 50% de las observaciones presentaron una resistencia entre 109.00 y 109.50, mientras que el restante 50% presentó una resistencia entre 109.50 y 110.00.
Para el operario OP2 y la máquina A: La resistencia promedio es de 111.00. El valor mínimo de resistencia es 110.00, y el valor máximo de resistencia es 112.00. El 50% de las observaciones presentaron una resistencia entre 110.00 y 111.00, mientras que el restante 50% presentó una resistencia entre 111.00 y 112.00.
Para el operario OP3 y la máquina A: La resistencia promedio es de 115.00. El valor mínimo de resistencia es 114.00, y el valor máximo de resistencia es 116.00. El 50% de las observaciones presentaron una resistencia entre 114.00 y 115.00, mientras que el restante 50% presentó una resistencia entre 115.00 y 116.00.
Para el operario OP1 y la máquina B: La resistencia promedio es de 112.50. El valor mínimo de resistencia es 110.00, y el valor máximo de resistencia es 115.00. El 50% de las observaciones presentaron una resistencia entre 110.00 y 112.50, mientras que el restante 50% presentó una resistencia entre 112.50 y 115.00.
Para el operario OP2 y la máquina B: La resistencia promedio es de 110.50. El valor mínimo de resistencia es 110.00, y el valor máximo de resistencia es 111.00. El 50% de las observaciones presentaron una resistencia entre 110.00 y 110.50, mientras que el restante 50% presentó una resistencia entre 110.50 y 111.00.
Para el operario OP3 y la máquina B: La resistencia promedio es de 113.50. El valor mínimo de resistencia es 112.00, y el valor máximo de resistencia es 115.00. El 50% de las observaciones presentaron una resistencia entre 112.00 y 113.50, mientras que el restante 50% presentó una resistencia entre 113.50 y 115.00.
Para el operario OP1 y la máquina C: La resistencia promedio es de 108.50. El valor mínimo de resistencia es 108.00, y el valor máximo de resistencia es 109.00. El 50% de las observaciones presentaron una resistencia entre 108.00 y 108.50, mientras que el restante 50% presentó una resistencia entre 108.50 y 109.00.
Para el operario OP2 y la máquina C: La resistencia promedio es de 110.00. El valor mínimo de resistencia es 109.00, y el valor máximo de resistencia es 111.00. El 50% de las observaciones presentaron una resistencia entre 109.00 y 110.00, mientras que el restante 50% presentó una resistencia entre 110.00 y 111.00.
Para el operario OP3 y la máquina C: La resistencia promedio es de 116.50. El valor mínimo de resistencia es 114.00, y el valor máximo de resistencia es 119.00. El 50% de las observaciones presentaron una resistencia entre 114.00 y 116.50, mientras que el restante 50% presentó una resistencia entre 116.50 y 119.00.
Para el operario OP1 y la máquina D: La resistencia promedio es de 109.00. El valor mínimo de resistencia es 108.00, y el valor máximo de resistencia es 110.00. El 50% de las observaciones presentaron una resistencia entre 108.00 y 109.00, mientras que el restante 50% presentó una resistencia entre 109.00 y 110.00.
Para el operario OP2 y la máquina D: La resistencia promedio es de 113.00. El valor mínimo de resistencia es 112.00, y el valor máximo de resistencia es 114.00. El 50% de las observaciones presentaron una resistencia entre 112.00 y 113.00, mientras que el restante 50% presentó una resistencia entre 113.00 y 114.00.
Para el operario OP3 y la máquina D: La resistencia promedio es de 118.50. El valor mínimo de resistencia es 117.00, y el valor máximo de resistencia es 120.00. El 50% de las observaciones presentaron una resistencia entre 117.00 y 118.50, mientras que el restante 50% presentó una resistencia entre 118.50 y 120.00.
-Realización del ANOVA
Las hipótesis contrastadas en el ANOVA son:
Factor 1 (α): Operario
\(H_0:\) No hay diferencias significativas en la resistencia promedio de las fibras entre los operarios que realizan el trabajo.
\(H_a:\) Existen diferencias significativas en la resistencia promedio de la fibra debido al operario que realiza el trabajo.
\(H_0:α_1=α_2=...=α_a=0\)
\(H_a:α_1≠0\) para algún i
Factor 2 (β): Tipo de máquina
\(H_0:\) No hay diferencias significativas en la resistencia promedio de las fibras debido al tipo de máquina utilizada.
\(H_a:\) Existen diferencias significativas en la resistencia promedio de las fibras debido al tipo de máquina utilizada.
\(H_0:β_1=β_2=...=β_b=0\)
\(H_a:β_j≠0\) para algún j
Interacción entre (αβ)
\(H_0:\) No hay interacción significativa entre el operario y el tipo de máquina en lo que respecta a la resistencia de la fibra.
\(H_a:\) Existe una interacción significativa entre el operario y el tipo de máquina en relación con la resistencia de la fibra, lo que implica que el efecto de la resistencia de la fibra debido al tipo de máquina depende del operario, y viceversa.
\(H_0:(αβ)_ij=0\) para todo ij
\(H_a:(αβ)_ij≠0\) para algún ij
modelo_anova <- aov(resistencia ~ operario * maquina, data = datos1)
resultado_anova <- summary(modelo_anova)
print(resultado_anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## operario 2 160.33 80.17 21.143 0.000117 ***
## maquina 3 12.46 4.15 1.095 0.388753
## operario:maquina 6 44.67 7.44 1.963 0.150681
## Residuals 12 45.50 3.79
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
A partir de los resultados del análisis de varianza (ANOVA) se puede concluir que:
Para el factor α, se encontró evidencia estadísticamente significativa para rechazar la hipótesis nula, ya que el p-valor (0.000117) es menor al nivel de significancia establecido (0.05). Esto indica que existen diferencias significativas en la resistencia promedio de la fibra entre los operarios que realizan el trabajo.
En cuanto al factor β, no hay evidencia estadísticamente significativa para rechazar la hipótesis nula, ya que el p-valor (0.388753) es mayor a 0.05. Esto sugiere que no existen diferencias significativas en la resistencia promedio de la fibra debidas al tipo de máquina utilizada en el experimento.
Respecto a la interacción entre el tipo de máquina y el operario (αβ), no hay evidencia estadísticamente significativa para rechazar la \(H_0\), ya que el p-valor (0.150681) es mayor a 0.05. En consecuencia, se acepta la hipótesis nula, lo que indica que el efecto del tipo de máquina en la resistencia de la fibra no está influenciado por el operario y viceversa.En general,no se observa una interacción significativa entre estos dos factores, lo que sugiere que sus efectos son independientes entre sí.
-Diagrama de cajas y bigotes por tratamiento
boxplot(datos1$resistencia ~ datos1$operario * datos1$maquina,
main = "Diagrama de Cajas de Resistencia",
xlab = "Combinación de operario y tipo de máquina",
ylab = "Resistencia",
col = c("lightgreen", "gray", "cyan","skyblue","pink","purple", "yellow","magenta", "orange","brown", "white","lightgray"))
Métodos de comparaciones múltiples o pruebas de rango múltiple (pruebas post hoc)
-Método de la diferencia mínima significativa (LSD)
modelo_anova <- aov(resistencia ~ operario * maquina, data = datos1)
LSD_result <- TukeyHSD(modelo_anova)
print(LSD_result)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = resistencia ~ operario * maquina, data = datos1)
##
## $operario
## diff lwr upr p adj
## OP2-OP1 1.25 -1.347459 3.847459 0.4302092
## OP3-OP1 6.00 3.402541 8.597459 0.0001330
## OP3-OP2 4.75 2.152541 7.347459 0.0010207
##
## $maquina
## diff lwr upr p adj
## B-A 0.3333333 -3.004389 3.671055 0.9904645
## C-A -0.1666667 -3.504389 3.171055 0.9987710
## D-A 1.6666667 -1.671055 5.004389 0.4766928
## C-B -0.5000000 -3.837722 2.837722 0.9693945
## D-B 1.3333333 -2.004389 4.671055 0.6465008
## D-C 1.8333333 -1.504389 5.171055 0.3989736
##
## $`operario:maquina`
## diff lwr upr p adj
## OP2:A-OP1:A 1.5 -6.230766 9.230766 0.9993833
## OP3:A-OP1:A 5.5 -2.230766 13.230766 0.2769269
## OP1:B-OP1:A 3.0 -4.730766 10.730766 0.9013973
## OP2:B-OP1:A 1.0 -6.730766 8.730766 0.9999870
## OP3:B-OP1:A 4.0 -3.730766 11.730766 0.6575431
## OP1:C-OP1:A -1.0 -8.730766 6.730766 0.9999870
## OP2:C-OP1:A 0.5 -7.230766 8.230766 1.0000000
## OP3:C-OP1:A 7.0 -0.730766 14.730766 0.0898750
## OP1:D-OP1:A -0.5 -8.230766 7.230766 1.0000000
## OP2:D-OP1:A 3.5 -4.230766 11.230766 0.7937754
## OP3:D-OP1:A 9.0 1.269234 16.730766 0.0178460
## OP3:A-OP2:A 4.0 -3.730766 11.730766 0.6575431
## OP1:B-OP2:A 1.5 -6.230766 9.230766 0.9993833
## OP2:B-OP2:A -0.5 -8.230766 7.230766 1.0000000
## OP3:B-OP2:A 2.5 -5.230766 10.230766 0.9664165
## OP1:C-OP2:A -2.5 -10.230766 5.230766 0.9664165
## OP2:C-OP2:A -1.0 -8.730766 6.730766 0.9999870
## OP3:C-OP2:A 5.5 -2.230766 13.230766 0.2769269
## OP1:D-OP2:A -2.0 -9.730766 5.730766 0.9931505
## OP2:D-OP2:A 2.0 -5.730766 9.730766 0.9931505
## OP3:D-OP2:A 7.5 -0.230766 15.230766 0.0602463
## OP1:B-OP3:A -2.5 -10.230766 5.230766 0.9664165
## OP2:B-OP3:A -4.5 -12.230766 3.230766 0.5149555
## OP3:B-OP3:A -1.5 -9.230766 6.230766 0.9993833
## OP1:C-OP3:A -6.5 -14.230766 1.230766 0.1328994
## OP2:C-OP3:A -5.0 -12.730766 2.730766 0.3847296
## OP3:C-OP3:A 1.5 -6.230766 9.230766 0.9993833
## OP1:D-OP3:A -6.0 -13.730766 1.730766 0.1938021
## OP2:D-OP3:A -2.0 -9.730766 5.730766 0.9931505
## OP3:D-OP3:A 3.5 -4.230766 11.230766 0.7937754
## OP2:B-OP1:B -2.0 -9.730766 5.730766 0.9931505
## OP3:B-OP1:B 1.0 -6.730766 8.730766 0.9999870
## OP1:C-OP1:B -4.0 -11.730766 3.730766 0.6575431
## OP2:C-OP1:B -2.5 -10.230766 5.230766 0.9664165
## OP3:C-OP1:B 4.0 -3.730766 11.730766 0.6575431
## OP1:D-OP1:B -3.5 -11.230766 4.230766 0.7937754
## OP2:D-OP1:B 0.5 -7.230766 8.230766 1.0000000
## OP3:D-OP1:B 6.0 -1.730766 13.730766 0.1938021
## OP3:B-OP2:B 3.0 -4.730766 10.730766 0.9013973
## OP1:C-OP2:B -2.0 -9.730766 5.730766 0.9931505
## OP2:C-OP2:B -0.5 -8.230766 7.230766 1.0000000
## OP3:C-OP2:B 6.0 -1.730766 13.730766 0.1938021
## OP1:D-OP2:B -1.5 -9.230766 6.230766 0.9993833
## OP2:D-OP2:B 2.5 -5.230766 10.230766 0.9664165
## OP3:D-OP2:B 8.0 0.269234 15.730766 0.0401932
## OP1:C-OP3:B -5.0 -12.730766 2.730766 0.3847296
## OP2:C-OP3:B -3.5 -11.230766 4.230766 0.7937754
## OP3:C-OP3:B 3.0 -4.730766 10.730766 0.9013973
## OP1:D-OP3:B -4.5 -12.230766 3.230766 0.5149555
## OP2:D-OP3:B -0.5 -8.230766 7.230766 1.0000000
## OP3:D-OP3:B 5.0 -2.730766 12.730766 0.3847296
## OP2:C-OP1:C 1.5 -6.230766 9.230766 0.9993833
## OP3:C-OP1:C 8.0 0.269234 15.730766 0.0401932
## OP1:D-OP1:C 0.5 -7.230766 8.230766 1.0000000
## OP2:D-OP1:C 4.5 -3.230766 12.230766 0.5149555
## OP3:D-OP1:C 10.0 2.269234 17.730766 0.0080049
## OP3:C-OP2:C 6.5 -1.230766 14.230766 0.1328994
## OP1:D-OP2:C -1.0 -8.730766 6.730766 0.9999870
## OP2:D-OP2:C 3.0 -4.730766 10.730766 0.9013973
## OP3:D-OP2:C 8.5 0.769234 16.230766 0.0267714
## OP1:D-OP3:C -7.5 -15.230766 0.230766 0.0602463
## OP2:D-OP3:C -3.5 -11.230766 4.230766 0.7937754
## OP3:D-OP3:C 2.0 -5.730766 9.730766 0.9931505
## OP2:D-OP1:D 4.0 -3.730766 11.730766 0.6575431
## OP3:D-OP1:D 9.5 1.769234 17.230766 0.0119280
## OP3:D-OP2:D 5.5 -2.230766 13.230766 0.2769269
El análisis de interacción entre operario y máquina reveló varias diferencias significativas. Entre los operarios OP1 y OP3;entre OP2 Y OP3, hubo una diferencia significativa en la resistencia, con un valor de p de 0.0001330 y 0.0010207 respectivamente. En cuanto a la máquina, no se encontraron diferencias significativas entre las máquinas A, B, C y D, ya que los valores p ajustados para todas las comparaciones son elevados.
En las comparaciones de interacción, destacan diferencias significativas en el operario 3 en varias máquinas como en OP3:D y OP1:A, OP3:D y OP2:B, OP3:D y OP1:C entre otras.Sin embargo, en la mayoría de las otras comparaciones de interacción, no se observan diferencias significativas, indicando similitud en las relaciones entre operarios y máquinas en términos de resistencia.
-Método de Tukey
resultado_tukey <- TukeyHSD(modelo_anova)
print(resultado_tukey)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = resistencia ~ operario * maquina, data = datos1)
##
## $operario
## diff lwr upr p adj
## OP2-OP1 1.25 -1.347459 3.847459 0.4302092
## OP3-OP1 6.00 3.402541 8.597459 0.0001330
## OP3-OP2 4.75 2.152541 7.347459 0.0010207
##
## $maquina
## diff lwr upr p adj
## B-A 0.3333333 -3.004389 3.671055 0.9904645
## C-A -0.1666667 -3.504389 3.171055 0.9987710
## D-A 1.6666667 -1.671055 5.004389 0.4766928
## C-B -0.5000000 -3.837722 2.837722 0.9693945
## D-B 1.3333333 -2.004389 4.671055 0.6465008
## D-C 1.8333333 -1.504389 5.171055 0.3989736
##
## $`operario:maquina`
## diff lwr upr p adj
## OP2:A-OP1:A 1.5 -6.230766 9.230766 0.9993833
## OP3:A-OP1:A 5.5 -2.230766 13.230766 0.2769269
## OP1:B-OP1:A 3.0 -4.730766 10.730766 0.9013973
## OP2:B-OP1:A 1.0 -6.730766 8.730766 0.9999870
## OP3:B-OP1:A 4.0 -3.730766 11.730766 0.6575431
## OP1:C-OP1:A -1.0 -8.730766 6.730766 0.9999870
## OP2:C-OP1:A 0.5 -7.230766 8.230766 1.0000000
## OP3:C-OP1:A 7.0 -0.730766 14.730766 0.0898750
## OP1:D-OP1:A -0.5 -8.230766 7.230766 1.0000000
## OP2:D-OP1:A 3.5 -4.230766 11.230766 0.7937754
## OP3:D-OP1:A 9.0 1.269234 16.730766 0.0178460
## OP3:A-OP2:A 4.0 -3.730766 11.730766 0.6575431
## OP1:B-OP2:A 1.5 -6.230766 9.230766 0.9993833
## OP2:B-OP2:A -0.5 -8.230766 7.230766 1.0000000
## OP3:B-OP2:A 2.5 -5.230766 10.230766 0.9664165
## OP1:C-OP2:A -2.5 -10.230766 5.230766 0.9664165
## OP2:C-OP2:A -1.0 -8.730766 6.730766 0.9999870
## OP3:C-OP2:A 5.5 -2.230766 13.230766 0.2769269
## OP1:D-OP2:A -2.0 -9.730766 5.730766 0.9931505
## OP2:D-OP2:A 2.0 -5.730766 9.730766 0.9931505
## OP3:D-OP2:A 7.5 -0.230766 15.230766 0.0602463
## OP1:B-OP3:A -2.5 -10.230766 5.230766 0.9664165
## OP2:B-OP3:A -4.5 -12.230766 3.230766 0.5149555
## OP3:B-OP3:A -1.5 -9.230766 6.230766 0.9993833
## OP1:C-OP3:A -6.5 -14.230766 1.230766 0.1328994
## OP2:C-OP3:A -5.0 -12.730766 2.730766 0.3847296
## OP3:C-OP3:A 1.5 -6.230766 9.230766 0.9993833
## OP1:D-OP3:A -6.0 -13.730766 1.730766 0.1938021
## OP2:D-OP3:A -2.0 -9.730766 5.730766 0.9931505
## OP3:D-OP3:A 3.5 -4.230766 11.230766 0.7937754
## OP2:B-OP1:B -2.0 -9.730766 5.730766 0.9931505
## OP3:B-OP1:B 1.0 -6.730766 8.730766 0.9999870
## OP1:C-OP1:B -4.0 -11.730766 3.730766 0.6575431
## OP2:C-OP1:B -2.5 -10.230766 5.230766 0.9664165
## OP3:C-OP1:B 4.0 -3.730766 11.730766 0.6575431
## OP1:D-OP1:B -3.5 -11.230766 4.230766 0.7937754
## OP2:D-OP1:B 0.5 -7.230766 8.230766 1.0000000
## OP3:D-OP1:B 6.0 -1.730766 13.730766 0.1938021
## OP3:B-OP2:B 3.0 -4.730766 10.730766 0.9013973
## OP1:C-OP2:B -2.0 -9.730766 5.730766 0.9931505
## OP2:C-OP2:B -0.5 -8.230766 7.230766 1.0000000
## OP3:C-OP2:B 6.0 -1.730766 13.730766 0.1938021
## OP1:D-OP2:B -1.5 -9.230766 6.230766 0.9993833
## OP2:D-OP2:B 2.5 -5.230766 10.230766 0.9664165
## OP3:D-OP2:B 8.0 0.269234 15.730766 0.0401932
## OP1:C-OP3:B -5.0 -12.730766 2.730766 0.3847296
## OP2:C-OP3:B -3.5 -11.230766 4.230766 0.7937754
## OP3:C-OP3:B 3.0 -4.730766 10.730766 0.9013973
## OP1:D-OP3:B -4.5 -12.230766 3.230766 0.5149555
## OP2:D-OP3:B -0.5 -8.230766 7.230766 1.0000000
## OP3:D-OP3:B 5.0 -2.730766 12.730766 0.3847296
## OP2:C-OP1:C 1.5 -6.230766 9.230766 0.9993833
## OP3:C-OP1:C 8.0 0.269234 15.730766 0.0401932
## OP1:D-OP1:C 0.5 -7.230766 8.230766 1.0000000
## OP2:D-OP1:C 4.5 -3.230766 12.230766 0.5149555
## OP3:D-OP1:C 10.0 2.269234 17.730766 0.0080049
## OP3:C-OP2:C 6.5 -1.230766 14.230766 0.1328994
## OP1:D-OP2:C -1.0 -8.730766 6.730766 0.9999870
## OP2:D-OP2:C 3.0 -4.730766 10.730766 0.9013973
## OP3:D-OP2:C 8.5 0.769234 16.230766 0.0267714
## OP1:D-OP3:C -7.5 -15.230766 0.230766 0.0602463
## OP2:D-OP3:C -3.5 -11.230766 4.230766 0.7937754
## OP3:D-OP3:C 2.0 -5.730766 9.730766 0.9931505
## OP2:D-OP1:D 4.0 -3.730766 11.730766 0.6575431
## OP3:D-OP1:D 9.5 1.769234 17.230766 0.0119280
## OP3:D-OP2:D 5.5 -2.230766 13.230766 0.2769269
plot(resultado_tukey)
Lo mencionado anteriormente se confirma con la gráfica de la diferencia
de medias(intervalos de confianza) en la interacción de el operador con
el tipo de máquina.
Verificación de los supuestos del modelo
La validez de los resultados obtenidos en cualquier análisis de varianza queda condicionado a que los supuestos del modelo se cumplan. Estos supuestos son: normalidad, varianza constante (igual varianza de los tratamientos) e independencia.
-Distribución normal de los residuos
residuos<-residuals(modelo_anova)
par(mfrow=c(1,3))
# Gráfico Q-Q de los residuos
qqnorm(residuos, col = "blue", main = "Gráfico Q-Q de Residuos")
qqline(residuos, col = "black")
# Curva de densidad de los residuos
densidad_residuos <- density(residuos)
plot(densidad_residuos, main = "Curva de Densidad de Residuos", xlab = "Residuos", col = "skyblue")
polygon(densidad_residuos, col = "cyan", border = "black")
# Boxplot de residuos
boxplot(residuos, col = "lightgreen",
main = "Boxplot de Residuos",
xlab = "Combinación de Operario y máquina",
ylab = "Residuos")
No obstante, con el propósito de obtener una validación adicional acerca de la normalidad de los residuos, se procede a realizar el test de Shapiro-Wilk. Este análisis se lleva a cabo con el fin de verificar si los residuos cumplen con la suposición de una distribución normal, y para ello, se evalúan las hipótesis correspondientes.
\(H_0\): Los residuos de la variable resistencia de la fibra se distribuyen normalmente con media cero y varianza constante.
\(H_a\): Los residuos de la variable resistencia de la fibra no siguen la distribución normal.
shapiro.test(residuals(modelo_anova))
##
## Shapiro-Wilk normality test
##
## data: residuals(modelo_anova)
## W = 0.94926, p-value = 0.2611
Por lo tanto, no hay evidencia estadística suficiente para rechazar la hipótesis nula (\(H_0\)). En otras palabras, se acepta la hipótesis nula, ya que el valor de p (p-value = 0.2611) es mayor que el valor del nivel de significancia (α = 0.05). Por lo tanto, se concluye que los residuos de la variable de resistencia de la fibra están normalmente distribuidos con media cero y varianza constante.
# Boxplot de los residuos
boxplot(residuos ~ datos1$operario:datos1$maquina,
col = "skyblue",
xlab = "Combinación de operario y máquina",
ylab = "Residuos",
main = "Boxplot de Residuos por Combinación de operario y máquina")
En la siguiente gráfica, se representan los valores predichos por el
modelo para la variable resistencia de la fibra en función de la raíz
cuadrada de los residuos estandarizados. En esta gráfica, no se observa
ninguna tendencia aparente en la distribución de los valores, lo que
sugiere que no hay evidencia de incumplimiento del supuesto de
homogeneidad de varianzas.
Ahora graficamos los residuos:
color_palette <- colorRampPalette(c("green", "black", "green"))
plot(residuos, main = "Prueba de independencia", pch = 20, cex = 2, col = color_palette(120), ylab = "Residuos", xlab = " ")
En la gráfica anterior, los puntos se presentan dispersos y no siguen un patrón claro, lo cual sugiere indicios de homogeneidad de varianzas (mayor dispersión implica una menor correlación entre los puntos).
No obstante, para confirmar de manera más rigurosa la homogeneidad de varianzas, se procede a realizar la prueba de Bartlett, donde se evalúan las hipótesis pertinentes:
\(H_0\): La varianza es constante en todos los grupos.
\(H_a\): La varianza no es constante en al menos en un grupo.
grupos <- with(datos1, interaction(operario, maquina))
# Prueba de Bartlett
resultado_bartlett <- bartlett.test(residuals(modelo_anova), grupos)
print("Prueba de Bartlett:")
## [1] "Prueba de Bartlett:"
print(resultado_bartlett)
##
## Bartlett test of homogeneity of variances
##
## data: residuals(modelo_anova) and grupos
## Bartlett's K-squared = 4.8106, df = 11, p-value = 0.94
Según el resultado de la prueba de Bartlett, donde se obtiene un valor de p igual a 0.94, que es mayor que el nivel de significancia de 0.05, se procede a aceptar la hipótesis nula. Esto confirma la presencia de homogeneidad de varianzas, coincidiendo con la conclusión previamente extraída a partir de la gráfica anterior.
Independencia de los residuos
Donde las hipótesis son:
\(H_0\): Los residuos entre los tratamientos son independientes.
\(H_a\):Los residuos entre los tratamientos no son independientes.
library(lmtest)
modelo_anova <- aov(resistencia ~ operario * maquina, data = datos1)
# Realiza la prueba de Durbin-Watson en los residuos
resultado_durbin_watson <- dwtest(modelo_anova)
print(resultado_durbin_watson)
##
## Durbin-Watson test
##
## data: modelo_anova
## DW = 3.011, p-value = 0.6366
## alternative hypothesis: true autocorrelation is greater than 0
El análisis de independencia de los residuos en relación a la variable de supervivencia de la flor revela que no existe correlación significativa entre los residuos. Esto se respalda por el valor del estadístico Durbin-Watson (DW), que se aproxima a 2 (DW = 3.011), y el valor p (p-value) de 0.6366, superando el nivel de significancia (α = 0.05). En consecuencia, se concluye que los residuos son independientes en el modelo, lo que indica la ausencia de autocorrelación significativa en los mismos.
Se desea investigar de qué manera afecta el tiempo de curado y el tipo de acelerante a la resistencia del caucho vulcanizado. Se realiza un experimento y se obtienen los siguientes datos:
library(readxl)
datos2 <- read_excel("C:/Users/LENOVO/Desktop/Ejercicio3.xlsx")
datos2
## # A tibble: 18 × 3
## resistencia tiempo acelerante
## <dbl> <chr> <chr>
## 1 3900 T1 A
## 2 3600 T1 A
## 3 4300 T1 B
## 4 3700 T1 B
## 5 3700 T1 C
## 6 4100 T1 C
## 7 4100 T2 A
## 8 3500 T2 A
## 9 4200 T2 B
## 10 3900 T2 B
## 11 3900 T2 C
## 12 4000 T2 C
## 13 4000 T3 A
## 14 3800 T3 A
## 15 4300 T3 B
## 16 3600 T3 B
## 17 3600 T3 C
## 18 3800 T3 C
-Número de observaciones (réplicas) por tratamiento
conteo_valores_tratamiento <- table(datos2$tiempo, datos2$acelerante)
print("Número de observaciones (réplicas) por tratamiento:")
## [1] "Número de observaciones (réplicas) por tratamiento:"
print(conteo_valores_tratamiento)
##
## A B C
## T1 2 2 2
## T2 2 2 2
## T3 2 2 2
Análisis Descriptivo
Medidas descriptivas de la variable dependiente (resistencia)
summarytools::descr(datos2 [,1])
## Descriptive Statistics
## datos2$resistencia
## N: 18
##
## resistencia
## ----------------- -------------
## Mean 3888.89
## Std.Dev 247.07
## Min 3500.00
## Q1 3700.00
## Median 3900.00
## Q3 4100.00
## Max 4300.00
## MAD 296.52
## IQR 375.00
## CV 0.06
## Skewness 0.16
## SE.Skewness 0.54
## Kurtosis -1.25
## N.Valid 18.00
## Pct.Valid 100.00
A partir de los resultados obtenidos, se deduce que el promedio de la variable resistencia es de 3888.89, con una desviación estándar de 247.07. El valor mínimo observado en esta variable es 3500.00, mientras que el valor máximo alcanza los 4300.00. La mediana de 3900.00 representa la medida central, ya que el 50% de las observaciones se encuentran en un rango que va desde 3700.00 hasta 4100.00. Además, se observa una asimetría positiva leve, con un coeficiente de asimetría de 0.16. Por otro lado, el coeficiente de curtosis es de -1.25, lo que sugiere que la distribución de los datos es platicúrtica.
-Medidas descriptivas por Tratamientos
resultados_descriptivos <- aggregate(resistencia ~ tiempo + acelerante + tiempo:acelerante, data = datos2, summary)
print(resultados_descriptivos)
## tiempo acelerante resistencia.Min. resistencia.1st Qu. resistencia.Median
## 1 T1 A 3600 3675 3750
## 2 T2 A 3500 3650 3800
## 3 T3 A 3800 3850 3900
## 4 T1 B 3700 3850 4000
## 5 T2 B 3900 3975 4050
## 6 T3 B 3600 3775 3950
## 7 T1 C 3700 3800 3900
## 8 T2 C 3900 3925 3950
## 9 T3 C 3600 3650 3700
## resistencia.Mean resistencia.3rd Qu. resistencia.Max.
## 1 3750 3825 3900
## 2 3800 3950 4100
## 3 3900 3950 4000
## 4 4000 4150 4300
## 5 4050 4125 4200
## 6 3950 4125 4300
## 7 3900 4000 4100
## 8 3950 3975 4000
## 9 3700 3750 3800
LLevando a cabo el análisis descriptivo por tratamiento se obtuvieron los siguientes resultados:
Para el tiempo (T1) y el acelerante A: La resistencia promedio es de 3750. El valor mínimo de resistencia es 3600, y el valor máximo de resistencia es 3900. El 50% de las observaciones presentaron una resistencia entre 3600 y 3750, mientras que el restante 50% presentó una resistencia entre 3750 y 3900.
Para el tiempo (T2) y el acelerante A: La resistencia promedio es de 3800. El valor mínimo de resistencia es 3500, y el valor máximo de resistencia es 4100. El 50% de las observaciones presentaron una resistencia entre 3500 y 3800, mientras que el restante 50% presentó una resistencia entre 3800 y 4100.
Para el tiempo (T3) y el acelerante A: La resistencia promedio es de 3900. El valor mínimo de resistencia es 3800, y el valor máximo de resistencia es 4000. El 50% de las observaciones presentaron una resistencia entre 3800 y 3900, mientras que el restante 50% presentó una resistencia entre 3900 y 4000.
Para el tiempo (T1) y el acelerante B: La resistencia promedio es de 4000. El valor mínimo de resistencia es 3700, y el valor máximo de resistencia es 4300. El 50% de las observaciones presentaron una resistencia entre 3700 y 4000, mientras que el restante 50% presentó una resistencia entre 4000 y 4300.
Para el tiempo (T2) y el acelerante B: La resistencia promedio es de 4050. El valor mínimo de resistencia es 3900, y el valor máximo de resistencia es 4200. El 50% de las observaciones presentaron una resistencia entre 3900 y 4050, mientras que el restante 50% presentó una resistencia entre 4050 y 4200.
Para el tiempo (T3) y el acelerante B: La resistencia promedio es de 3950. El valor mínimo de resistencia es 3600, y el valor máximo de resistencia es 4300. El 50% de las observaciones presentaron una resistencia entre 3600 y 3950, mientras que el restante 50% presentó una resistencia entre 3950 y 4300.
Para el tiempo (T1) y el acelerante C: La resistencia promedio es de 3900. El valor mínimo de resistencia es 3700, y el valor máximo de resistencia es 4100. El 50% de las observaciones presentaron una resistencia entre 3700 y 3900, mientras que el restante 50% presentó una resistencia entre 3900 y 4100.
Para el tiempo (T2) y el acelerante C: La resistencia promedio es de 3950. El valor mínimo de resistencia es 3900, y el valor máximo de resistencia es 4000. El 50% de las observaciones presentaron una resistencia entre 3900 y 3950, mientras que el restante 50% presentó una resistencia entre 3950 y 4000.
Para el tiempo (T3) y el acelerante C: La resistencia promedio es de 3700. El valor mínimo de resistencia es 3600, y el valor máximo de resistencia es 3800. El 50% de las observaciones presentaron una resistencia entre 3600 y 3700, mientras que el restante 50% presentó una resistencia entre 3700 y 3800.
-Realización del ANOVA
Las hipótesis contrastadas en el ANOVA son:
Factor 1 (α): tiempo
\(H_0:\) No hay diferencias significativas en la resistencia promedio del caucho vulcanizado entre los diferentes tiempos de curado.
\(H_a:\) Existen diferencias significativas en la resistencia promedio del caucho vulcanizado debido al tiempo de curado.
\(H_0:α_1=α_2=...=α_a=0\)
\(H_a:α_1≠0\) para algún i
Factor 2 (β): acelerante
\(H_0:\) No hay diferencias significativas en la resistencia promedio del caucho vulcanizado entre los diferentes tipos de acelerante.
\(H_a:\) Existen diferencias significativas en la resistencia promedio del caucho vulcanizado debido al tipo de acelerante.
\(H_0:β_1=β_2=...=β_b=0\)
\(H_a:β_j≠0\) para algún j
Interacción entre (αβ)
\(H_0:\) No hay interacción significativa entre el tiempo de curado y el tipo de acelerante en lo respecta a la resistencia del caucho vulcanizado.
\(H_a:\) Existe interacción significativa entre el tiempo de curado y el tipo de acelerante en la resistencia del caucho vulcanizado.
\(H_0:(αβ)_ij=0\) para todo ij
\(H_a:(αβ)_ij≠0\) para algún ij
modelo_anova <- aov(resistencia ~ tiempo * acelerante, data = datos2)
resultado_anova <- summary(modelo_anova)
print(resultado_anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## tiempo 2 21111 10556 0.116 0.892
## acelerante 2 114444 57222 0.628 0.555
## tiempo:acelerante 4 82222 20556 0.226 0.917
## Residuals 9 820000 91111
A partir de los resultados del análisis de varianza (ANOVA) se puede concluir que: Para el factor de tiempo (α), no se encontró evidencia estadísticamente significativa para rechazar la hipótesis nula. El valor de p (0.892) es mayor que el nivel de significancia establecido (0.05). Esto sugiere que no existen diferencias significativas en la resistencia promedio del caucho vulcanizado debido a diferentes tiempos de curado.
En relación al factor de tipo de acelerante (β), nuevamente no se encontró evidencia estadísticamente significativa para rechazar la hipótesis nula. El valor de p (0.555) es mayor que 0.05, lo que indica que no existen diferencias significativas en la resistencia promedio del caucho vulcanizado debidas al tipo de acelerante utilizado en el experimento.
Respecto a la interacción entre el tiempo de curado y el tipo de acelerante (αβ), tampoco se encontró evidencia estadísticamente significativa para rechazar la hipótesis nula. El valor de p (0.917) es mayor que el nivel de significancia (0.05). Esto sugiere que el efecto del tiempo de curado en la resistencia del caucho vulcanizado no está influenciado por el tipo de acelerante, y viceversa.
-Diagrama de cajas y bigotes por tratamiento
boxplot(datos2$resistencia ~ datos2$tiempo * datos2$acelerante,
main = "Diagrama de Cajas de Resistencia",
xlab = "Combinación de tiempo y tipo de acelerante",
ylab = "Resistencia",
col = c("lightgreen", "gray", "cyan","skyblue","pink","purple", "yellow","magenta", "orange","brown", "white","lightgray"))
El diagrama de cajas muestra que no hay diferencias significativas en la resistencia del caucho vulcanizado en función del tiempo de curado y el tipo de acelerante. Las medianas y las distribuciones de los diferentes grupos son similares, con cierto solapamiento entre los valores.
Métodos de comparaciones múltiples o pruebas de rango múltiple (pruebas post hoc)
-Método de la diferencia mínima significativa (LSD)
modelo_anova <- aov(resistencia ~ tiempo * acelerante, data = datos2)
LSD_result <- TukeyHSD(modelo_anova)
print(LSD_result)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = resistencia ~ tiempo * acelerante, data = datos2)
##
## $tiempo
## diff lwr upr p adj
## T2-T1 50.00000 -436.5655 536.5655 0.9558570
## T3-T1 -33.33333 -519.8989 453.2322 0.9800775
## T3-T2 -83.33333 -569.8989 403.2322 0.8831481
##
## $acelerante
## diff lwr upr p adj
## B-A 183.33333 -303.2322 669.8989 0.5650392
## C-A 33.33333 -453.2322 519.8989 0.9800775
## C-B -150.00000 -636.5655 336.5655 0.6768414
##
## $`tiempo:acelerante`
## diff lwr upr p adj
## T2:A-T1:A 50 -1144.1212 1244.1212 1.0000000
## T3:A-T1:A 150 -1044.1212 1344.1212 0.9997663
## T1:B-T1:A 250 -944.1212 1444.1212 0.9922853
## T2:B-T1:A 300 -894.1212 1494.1212 0.9770489
## T3:B-T1:A 200 -994.1212 1394.1212 0.9982120
## T1:C-T1:A 150 -1044.1212 1344.1212 0.9997663
## T2:C-T1:A 200 -994.1212 1394.1212 0.9982120
## T3:C-T1:A -50 -1244.1212 1144.1212 1.0000000
## T3:A-T2:A 100 -1094.1212 1294.1212 0.9999889
## T1:B-T2:A 200 -994.1212 1394.1212 0.9982120
## T2:B-T2:A 250 -944.1212 1444.1212 0.9922853
## T3:B-T2:A 150 -1044.1212 1344.1212 0.9997663
## T1:C-T2:A 100 -1094.1212 1294.1212 0.9999889
## T2:C-T2:A 150 -1044.1212 1344.1212 0.9997663
## T3:C-T2:A -100 -1294.1212 1094.1212 0.9999889
## T1:B-T3:A 100 -1094.1212 1294.1212 0.9999889
## T2:B-T3:A 150 -1044.1212 1344.1212 0.9997663
## T3:B-T3:A 50 -1144.1212 1244.1212 1.0000000
## T1:C-T3:A 0 -1194.1212 1194.1212 1.0000000
## T2:C-T3:A 50 -1144.1212 1244.1212 1.0000000
## T3:C-T3:A -200 -1394.1212 994.1212 0.9982120
## T2:B-T1:B 50 -1144.1212 1244.1212 1.0000000
## T3:B-T1:B -50 -1244.1212 1144.1212 1.0000000
## T1:C-T1:B -100 -1294.1212 1094.1212 0.9999889
## T2:C-T1:B -50 -1244.1212 1144.1212 1.0000000
## T3:C-T1:B -300 -1494.1212 894.1212 0.9770489
## T3:B-T2:B -100 -1294.1212 1094.1212 0.9999889
## T1:C-T2:B -150 -1344.1212 1044.1212 0.9997663
## T2:C-T2:B -100 -1294.1212 1094.1212 0.9999889
## T3:C-T2:B -350 -1544.1212 844.1212 0.9473514
## T1:C-T3:B -50 -1244.1212 1144.1212 1.0000000
## T2:C-T3:B 0 -1194.1212 1194.1212 1.0000000
## T3:C-T3:B -250 -1444.1212 944.1212 0.9922853
## T2:C-T1:C 50 -1144.1212 1244.1212 1.0000000
## T3:C-T1:C -200 -1394.1212 994.1212 0.9982120
## T3:C-T2:C -250 -1444.1212 944.1212 0.9922853
En general, según el análisis estadístico realizado con un nivel de confianza del 95%, no se encontraron diferencias significativas en la resistencia del caucho vulcanizado en relación al tiempo de curado ni al tipo de acelerante utilizado. Los resultados sugieren que estos factores no tienen un impacto estadísticamente significativo en la resistencia del producto final.
-Método de Tukey
resultado_tukey <- TukeyHSD(modelo_anova)
print(resultado_tukey)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = resistencia ~ tiempo * acelerante, data = datos2)
##
## $tiempo
## diff lwr upr p adj
## T2-T1 50.00000 -436.5655 536.5655 0.9558570
## T3-T1 -33.33333 -519.8989 453.2322 0.9800775
## T3-T2 -83.33333 -569.8989 403.2322 0.8831481
##
## $acelerante
## diff lwr upr p adj
## B-A 183.33333 -303.2322 669.8989 0.5650392
## C-A 33.33333 -453.2322 519.8989 0.9800775
## C-B -150.00000 -636.5655 336.5655 0.6768414
##
## $`tiempo:acelerante`
## diff lwr upr p adj
## T2:A-T1:A 50 -1144.1212 1244.1212 1.0000000
## T3:A-T1:A 150 -1044.1212 1344.1212 0.9997663
## T1:B-T1:A 250 -944.1212 1444.1212 0.9922853
## T2:B-T1:A 300 -894.1212 1494.1212 0.9770489
## T3:B-T1:A 200 -994.1212 1394.1212 0.9982120
## T1:C-T1:A 150 -1044.1212 1344.1212 0.9997663
## T2:C-T1:A 200 -994.1212 1394.1212 0.9982120
## T3:C-T1:A -50 -1244.1212 1144.1212 1.0000000
## T3:A-T2:A 100 -1094.1212 1294.1212 0.9999889
## T1:B-T2:A 200 -994.1212 1394.1212 0.9982120
## T2:B-T2:A 250 -944.1212 1444.1212 0.9922853
## T3:B-T2:A 150 -1044.1212 1344.1212 0.9997663
## T1:C-T2:A 100 -1094.1212 1294.1212 0.9999889
## T2:C-T2:A 150 -1044.1212 1344.1212 0.9997663
## T3:C-T2:A -100 -1294.1212 1094.1212 0.9999889
## T1:B-T3:A 100 -1094.1212 1294.1212 0.9999889
## T2:B-T3:A 150 -1044.1212 1344.1212 0.9997663
## T3:B-T3:A 50 -1144.1212 1244.1212 1.0000000
## T1:C-T3:A 0 -1194.1212 1194.1212 1.0000000
## T2:C-T3:A 50 -1144.1212 1244.1212 1.0000000
## T3:C-T3:A -200 -1394.1212 994.1212 0.9982120
## T2:B-T1:B 50 -1144.1212 1244.1212 1.0000000
## T3:B-T1:B -50 -1244.1212 1144.1212 1.0000000
## T1:C-T1:B -100 -1294.1212 1094.1212 0.9999889
## T2:C-T1:B -50 -1244.1212 1144.1212 1.0000000
## T3:C-T1:B -300 -1494.1212 894.1212 0.9770489
## T3:B-T2:B -100 -1294.1212 1094.1212 0.9999889
## T1:C-T2:B -150 -1344.1212 1044.1212 0.9997663
## T2:C-T2:B -100 -1294.1212 1094.1212 0.9999889
## T3:C-T2:B -350 -1544.1212 844.1212 0.9473514
## T1:C-T3:B -50 -1244.1212 1144.1212 1.0000000
## T2:C-T3:B 0 -1194.1212 1194.1212 1.0000000
## T3:C-T3:B -250 -1444.1212 944.1212 0.9922853
## T2:C-T1:C 50 -1144.1212 1244.1212 1.0000000
## T3:C-T1:C -200 -1394.1212 994.1212 0.9982120
## T3:C-T2:C -250 -1444.1212 944.1212 0.9922853
plot(resultado_tukey)
Verificación de los supuestos del modelo
La validez de los resultados obtenidos en cualquier análisis de varianza queda condicionado a que los supuestos del modelo se cumplan. Estos supuestos son: normalidad, varianza constante (igual varianza de los tratamientos) e independencia.
-Distribución normal de los residuos
residuos<-residuals(modelo_anova)
par(mfrow=c(1,3))
# Gráfico Q-Q de los residuos
qqnorm(residuos, col = "black", main = "Gráfico Q-Q de Residuos")
qqline(residuos, col = "black")
# Curva de densidad de los residuos
densidad_residuos <- density(residuos)
plot(densidad_residuos, main = "Curva de Densidad de Residuos", xlab = "Residuos", col = "skyblue")
polygon(densidad_residuos, col = "cyan", border = "black")
# Boxplot de residuos
boxplot(residuos, col = "pink",
main = "Boxplot de Residuos",
xlab = "Combinación de tiempo y acelerante",
ylab = "Residuos")
Sin embargo, para fortalecer la evidencia de que los residuos siguen una distribución normal, se lleva a cabo el test de Shapiro-Wilk. Esta prueba se emplea para corroborar la adecuación de los residuos al supuesto de normalidad y evaluar las hipótesis correspondientes.
\(H_0\): Los residuos de la variable resistencia del caucho se distribuyen normalmente con media cero y varianza constante.
\(H_a\): Los residuos de la variable resistencia del caucho no siguen la distribución normal.
shapiro.test(residuals(modelo_anova))
##
## Shapiro-Wilk normality test
##
## data: residuals(modelo_anova)
## W = 0.95118, p-value = 0.4438
Por lo tanto, no hay evidencia estadística suficiente para rechazar la hipótesis nula (\(H_0\)). En otras palabras, se acepta la hipótesis nula, ya que el valor de p (p-value = 0.4438) es mayor que el valor del nivel de significancia (α = 0.05). Por lo tanto, se concluye que los residuos de la variable resistencia del caucho están normalmente distribuidos con media cero y varianza constante.
# Boxplot de los residuos
boxplot(residuos ~ datos2$tiempo:datos2$acelerante,
col = "lightgreen",
xlab = "Combinación de tiempo y acelerante",
ylab = "Residuos",
main = "Boxplot de Residuos por Combinación de tiempo y acelerante")
En la siguiente gráfica, se representan los valores predichos por el
modelo para la variable resistencia del caucho en función de la raíz
cuadrada de los residuos estandarizados. En esta gráfica, no se observa
ninguna tendencia aparente en la distribución de los valores, lo que
sugiere que no hay evidencia de incumplimiento del supuesto de
homogeneidad de varianzas.
Ahora graficamos los residuos:
color_palette <- colorRampPalette(c("purple", "black", "blue"))
plot(residuos, main = "Prueba de independencia", pch = 20, cex = 2, col = color_palette(120), ylab = "Residuos", xlab = " ")
En la gráfica anterior se observan dispersos los puntos sin seguir un patrón, esto es un indicio de homogeneidad de varianzas (entre más dispersos menos correlacionados).
Sin embargo, para validar de manera más sólida la homogeneidad de varianzas, se realiza la prueba de bartlett.Donde las hipótesis correspondientes son:
\(H_0\): La varianza es constante en todos los grupos.
\(H_a\): La varianza no es constante en al menos en un grupo.
grupos <- with(datos2, interaction(tiempo, acelerante))
# Prueba de Bartlett
resultado_bartlett <- bartlett.test(residuals(modelo_anova), grupos)
print("Prueba de Bartlett:")
## [1] "Prueba de Bartlett:"
print(resultado_bartlett)
##
## Bartlett test of homogeneity of variances
##
## data: residuals(modelo_anova) and grupos
## Bartlett's K-squared = 3.7401, df = 8, p-value = 0.8798
De acuerdo al valor arrojado por la prueba de bartlett, valor de p (0.8798) mayor a 0.05 se acepta la hipótesis nula, por lo que existe homogeneidad de varianzas, llegando a la misma conclusión anterior.
Independencia de los residuos
Donde las hipótesis son:
\(H_0\): Los residuos entre los tratamientos son independientes.
\(H_a\):Los residuos entre los tratamientos no son independientes.
library(lmtest)
modelo_anova <- aov(resistencia ~ tiempo * acelerante, data = datos2)
# Realiza la prueba de Durbin-Watson en los residuos
resultado_durbin_watson <- dwtest(modelo_anova)
print(resultado_durbin_watson)
##
## Durbin-Watson test
##
## data: modelo_anova
## DW = 2.8567, p-value = 0.4685
## alternative hypothesis: true autocorrelation is greater than 0
La prueba de independencia de residuos para la resistencia revela que los residuos no están correlacionados. Con un valor de Durbin-Watson (DW) cercano a 2 (DW = 2.8567) y un p-valor de 0.4685 (superior a α = 0.05), se concluye que los residuos son independientes, indicando una falta de autocorrelación significativa.