En un experimento se consideran tres especies de plantas y dos tipos de reactivos para activar el ciclo de florescencia de las plantas. Se mide en cada planta la supervivencia de la flor, es decir, el tiempo en días en que aparece la flor hasta cuando presenta signos de marchitamiento. Los resultados se muestran en la siguiente tabla:
library(readxl)
ANOVA2_EJ1 <- read_excel("C:/Users/nana_/OneDrive/Escritorio/Disenoexp/ANOVA2factores/ANOVA2_EJ1.xlsx")
(ANOVA2_EJ1)
## # A tibble: 18 × 3
## Reactivo Tiempo Especie
## <chr> <dbl> <chr>
## 1 A 12 SpA
## 2 A 13 SpA
## 3 A 15 SpA
## 4 A 13 SpB
## 5 A 15 SpB
## 6 A 15 SpB
## 7 A 16 SpC
## 8 A 18 SpC
## 9 A 20 SpC
## 10 B 9 SpA
## 11 B 8 SpA
## 12 B 9 SpA
## 13 B 10 SpB
## 14 B 8 SpB
## 15 B 9 SpB
## 16 B 12 SpC
## 17 B 10 SpC
## 18 B 13 SpC
A continuación se observa una tabla con el resumen de datos descriptivos como lo son la media, mediana, valor mínimo y valor máximo de las variables:
library(table1)
##
## Attaching package: 'table1'
## The following objects are masked from 'package:base':
##
## units, units<-
table1(~Tiempo|Reactivo+Especie,data=ANOVA2_EJ1)
A |
B |
Overall |
|||||||
|---|---|---|---|---|---|---|---|---|---|
| SpA (N=3) |
SpB (N=3) |
SpC (N=3) |
SpA (N=3) |
SpB (N=3) |
SpC (N=3) |
SpA (N=6) |
SpB (N=6) |
SpC (N=6) |
|
| Tiempo | |||||||||
| Mean (SD) | 13.3 (1.53) | 14.3 (1.15) | 18.0 (2.00) | 8.67 (0.577) | 9.00 (1.00) | 11.7 (1.53) | 11.0 (2.76) | 11.7 (3.08) | 14.8 (3.82) |
| Median [Min, Max] | 13.0 [12.0, 15.0] | 15.0 [13.0, 15.0] | 18.0 [16.0, 20.0] | 9.00 [8.00, 9.00] | 9.00 [8.00, 10.0] | 12.0 [10.0, 13.0] | 10.5 [8.00, 15.0] | 11.5 [8.00, 15.0] | 14.5 [10.0, 20.0] |
Se observa que la media de tiempo máximo que tarda en activarse el ciclo de florescencia con el reactivo A y B es de la especie 3 con un valor medio de 18.0. y de 11.7. respectivamente.
library(summarytools)
##
## Attaching package: 'summarytools'
## The following objects are masked from 'package:table1':
##
## label, label<-
summarytools::descr(ANOVA2_EJ1[,2])
## Descriptive Statistics
## ANOVA2_EJ1$Tiempo
## N: 18
##
## Tiempo
## ----------------- --------
## Mean 12.50
## Std.Dev 3.50
## Min 8.00
## Q1 9.00
## Median 12.50
## Q3 15.00
## Max 20.00
## MAD 3.71
## IQR 5.75
## CV 0.28
## Skewness 0.43
## SE.Skewness 0.54
## Kurtosis -0.90
## N.Valid 18.00
## Pct.Valid 100.00
Los datos descriptivos indican que la media del tiempo de activación del ciclo de florescencia, es de 12.50. El 50% de los datos se ubican entre 8.00 y 12.50, el otro 50% se ubica entre 12.50 y 20.00. La desviación estándar es de un valor bajo (3.50), además cuenta con una Kurtosis de -0.90, es decir que la distribución de datos es leptocúrtica, los datos se distribuyen de manera cercana a la media, no existen tantos valores atípicos.
#Factor 1
#Ho: M1= M2= M3=M4 #Analisis descriptivo
#Ho= la media del tiempo de activación de la florescencia de la flor de las tres especies no varía
Ha= la media del tiempo de activación de la florescencia de la flor de las tres especies varía en al menos una especie
#Factor 2
Ho= la media del tiempo de activación de la florescencia de la flor con los 2 reactivos no varía
Ha= la media del tiempo de activación de la florescencia de la flor con los 2 reactivos varía en al menos uno
#Factor 3 (Interacción)
Ho= No existe interacción entre la especie y el tipo de reactivo utilizado
Ha= Eexiste interacción entre la especie y el tipo de reactivo utilizado
mod1=lm(Tiempo~Reactivo+Especie,data=ANOVA2_EJ1)
anova(mod1)
## Analysis of Variance Table
##
## Response: Tiempo
## Df Sum Sq Mean Sq F value Pr(>F)
## Reactivo 1 133.389 133.389 75.368 5.222e-07 ***
## Especie 2 50.333 25.167 14.220 0.0004251 ***
## Residuals 14 24.778 1.770
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El p-valor del factor 1 es de 0.0004251, como el P-valor es menor que alpha (0.05), se rechaza la H0 que indica que la media del tiempo de floración en tres especies no varía.
El p-valor del factor 2 es de 5.222e-07. Como el P-valor es menor que alpha (0.05), se rechaza H0 que indica que la media del tiempo de floración cons los dos reactivos no varía.
summary(mod1)
##
## Call:
## lm(formula = Tiempo ~ Reactivo + Especie, data = ANOVA2_EJ1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.1111 -0.8889 0.2500 0.7222 2.4444
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 13.7222 0.6271 21.881 3.17e-12 ***
## ReactivoB -5.4444 0.6271 -8.681 5.22e-07 ***
## EspecieSpB 0.6667 0.7681 0.868 0.400047
## EspecieSpC 3.8333 0.7681 4.991 0.000198 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.33 on 14 degrees of freedom
## Multiple R-squared: 0.8812, Adjusted R-squared: 0.8557
## F-statistic: 34.6 on 3 and 14 DF, p-value: 9.955e-07
Como se rechaza H0 se tiene que realizar pruebas pos-hoc
#posanova
library(agricolae)
compara1=LSD.test(mod1,"Reactivo")
compara1
## $statistics
## MSerror Df Mean CV t.value LSD
## 1.769841 14 12.5 10.64283 2.144787 1.34507
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none Reactivo 2 0.05
##
## $means
## Tiempo std r se LCL UCL Min Max Q25 Q50 Q75
## A 15.222222 2.538591 9 0.4434513 14.271114 16.17333 12 20 13 15 16
## B 9.777778 1.715938 9 0.4434513 8.826669 10.72889 8 13 9 9 10
##
## $comparison
## NULL
##
## $groups
## Tiempo groups
## A 15.222222 a
## B 9.777778 b
##
## attr(,"class")
## [1] "group"
La media del cuadrado medio del error es de 1,77, con 14 grados de libertad y un coeficiente de vaiación de 10.64% que indica la variabilidad de los datos en relación con la muestra. Además se observan datos como intérvalos de confianza y diferencias entre medias.
residuos <- residuals(mod1)
# Boxplot de residuos
boxplot(residuos, col = "aquamarine",
main = "Boxplot de Residuos",
xlab = "Combinación de Reactivo y Especie",
ylab = "Residuos")
#P1 - normalidad
#H0: Los residuos siguen una distribución normal #Ha: Los residuos no siguen una distribución normal
plot(mod1)
shapiro.test(mod1$residuals)
##
## Shapiro-Wilk normality test
##
## data: mod1$residuals
## W = 0.96255, p-value = 0.6516
El valor p generado es de 0,6516, como es mayor que el nivel de significancia (0,05) no hay evidencia estadística suficiente para rechazar H0. Los residuos siguen una distribución normal.Los resultados evidenciados en las gráficas permiten corroborar que en efecto si se cumplen los supuestos de normalidad, homogeneidad e independencia en analisis de varianzas.
boxplot(Tiempo ~ interaction(Reactivo, Especie), data = ANOVA2_EJ1,
col = c("orange","darkorchid1","red", "blue", "green", "grey"),
ylab = "Tiempo", xlab = "Combinación de Reactivo y Especie")
En el diagrama de cajas se observa la interacción de las medias de tiempo de floración de especies y los reactivos utilizados. La que presenta una media diferente es la especie C con el reactivo A. Como los datos bajo los diferentes tratamientos se ubican de manera diferente si se puede aseverar que no hay igualdad en el tiempo de florescencia.
require(ggplot2)
## Loading required package: ggplot2
ggplot(ANOVA2_EJ1,aes(x=Reactivo,y=Tiempo))+geom_point()+
geom_smooth()+theme_classic()
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
Se observa el patrón de los datos y la relación entre las variables en el conjunto de datos, en este caso del reactivo y el tiempo en dias en que aparece la flor hasta cuando se presenta el marchitamiento. Se observa que el reactivo A es más eficiente.
ggplot(ANOVA2_EJ1,aes(x=Especie,y=Tiempo))+geom_point()+
geom_smooth()+theme_classic()
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
Se observa el patrón de los datos y la relación entre las variables en el conjunto de datos, en este caso de la especie y el tiempo en dias en que aparece la flor hasta cuando se presenta el marchitamiento. Se observa que la especie C toma más tiempo de floración.
require(TukeyC)
## Loading required package: TukeyC
TukeyC(mod1)
## Results
## Means G1 G2
## A 15.22 a
## B 9.78 b
##
## Sig.level
## 0.05
##
## Diff_Prob
## A B
## A 0 5.444
## B 0 0.000
##
## MSD
## A B
## A 0.000 1.345
## B 1.345 0.000
El grupo A tiene una media de supervivencia de flor significativamente mayor (15.22 días) que el grupo B (9.78 días). La diferencia entre medias de 5.444 días es superior a la MSD de 1.345. Por lo tanto el reactivo A es más efectivo para extender la supervivencia de la flor comparado con el reactivo B.
En unos laboratorios se estan estudiando los factores que influyen en la resistencia de un tipo de particulas de fibra. Si se eligen al azar 4 maquinas y 3 operarios y se realiza un experimento factorial. Los resultados oobtenidos se muestran en la siguiente tabla, analizar los resultados y obtene las conclusiones apropiadas.
library(readxl)
Ejercicio2 <- read_excel("C:/Users/nana_/OneDrive/Escritorio/Disenoexp/ANOVA2factores/Ejercicio2.xlsx")
(Ejercicio2)
## # A tibble: 24 × 3
## Operario Resistencia Maquinaria
## <dbl> <dbl> <chr>
## 1 1 109 A
## 2 1 110 B
## 3 1 108 C
## 4 1 110 D
## 5 1 110 A
## 6 1 115 B
## 7 1 109 C
## 8 1 108 D
## 9 2 110 A
## 10 2 110 B
## # ℹ 14 more rows
A continuación se observa una tabla con el resumen de datos descriptivos como lo son la media, mediana, valor mínimo y valor máximo de las variables:
library(table1)
table1(~Resistencia|Operario+Maquinaria,data=Ejercicio2)
## Warning in table1.formula(~Resistencia | Operario + Maquinaria, data =
## Ejercicio2): Terms to the right of '|' in formula 'x' define table columns and
## are expected to be factors with meaningful labels.
## Warning in .table1.internal(x = x, labels = labels, groupspan = groupspan, :
## Table has 16 columns. Are you sure this is what you want?
1 |
2 |
3 |
Overall |
|||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| A (N=2) |
B (N=2) |
C (N=2) |
D (N=2) |
A (N=2) |
B (N=2) |
C (N=2) |
D (N=2) |
A (N=2) |
B (N=2) |
C (N=2) |
D (N=2) |
A (N=6) |
B (N=6) |
C (N=6) |
D (N=6) |
|
| Resistencia | ||||||||||||||||
| Mean (SD) | 110 (0.707) | 113 (3.54) | 109 (0.707) | 109 (1.41) | 111 (1.41) | 111 (0.707) | 110 (1.41) | 113 (1.41) | 115 (1.41) | 114 (2.12) | 117 (3.54) | 119 (2.12) | 112 (2.71) | 112 (2.32) | 112 (4.18) | 114 (4.46) |
| Median [Min, Max] | 110 [109, 110] | 113 [110, 115] | 109 [108, 109] | 109 [108, 110] | 111 [110, 112] | 111 [110, 111] | 110 [109, 111] | 113 [112, 114] | 115 [114, 116] | 114 [112, 115] | 117 [114, 119] | 119 [117, 120] | 111 [109, 116] | 112 [110, 115] | 110 [108, 119] | 113 [108, 120] |
Se observa que la media de resistencia de las partículas de fibra con es mayor con el operario 3 y la máquina D (119). Por su parte se observa que la menor resistencia de la fibra se da con el operario 1 y las máquinas C y D.
library(summarytools)
summarytools::descr(Ejercicio2[,2])
## Descriptive Statistics
## Ejercicio2$Resistencia
## N: 24
##
## Resistencia
## ----------------- -------------
## Mean 112.29
## Std.Dev 3.38
## Min 108.00
## Q1 110.00
## Median 111.50
## Q3 114.50
## Max 120.00
## MAD 3.71
## IQR 4.25
## CV 0.03
## Skewness 0.69
## SE.Skewness 0.47
## Kurtosis -0.60
## N.Valid 24.00
## Pct.Valid 100.00
Los datos descriptivos indican que la media de resistencia de las partículas de fibra es de 112.29. El 50% de los datos se ubican entre 108.00 y 111.50, el otro 50% se ubica entre 111.50 y 120.00. La desviación estándar es de un valor bajo (3.38), además cuenta con una Kurtosis de -0.60, es decir que la distribución de datos es leptocúrtica, los datos se distribuyen de manera cercana a la media, no existen tantos valores atípicos.
#Factor 1
#Ho: M1= M2= M3=M4 #Analisis descriptivo
Ho= No existe diferencias significativas en la resistencia de fibra entre la maquinaria utilizada
Ha= Existe diferencias significativas en la resistencia de fibra entre la maquinaria utilizada
#Factor 2
Ho= No hay diferencias significativas en la resistencia de las partículas de fibra entre los operarios que las manejan
Ha= Hay diferencias significativas en la resistencia de las partículas de fibra entre los operarios que las manejan
#Factor 3 (Interacción)
Ho= No existe interacción entre la maquinaria y el operario
Ha= Existe interacción entre la maquinaria y el operario
mod2=lm(Resistencia~Operario+Maquinaria,data=Ejercicio2)
anova(mod2)
## Analysis of Variance Table
##
## Response: Resistencia
## Df Sum Sq Mean Sq F value Pr(>F)
## Operario 1 144.000 144.000 25.6901 6.823e-05 ***
## Maquinaria 3 12.458 4.153 0.7409 0.5408
## Residuals 19 106.500 5.605
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El p-valor del factor 1 es de 6.823e-05, como el P-valor es menor que alpha (0.05), se rechaza la H0 que indica que no existe diferencias significativas en la resistencia de fibra entre la maquinaria utilizada
El p-valor del factor 2 es de 0.5408. Como el P-valor es mayor que alpha (0.05), se acepta H0 que indica que No hay diferencias significativas en la resistencia de las partículas de fibra entre los operarios que las manejan. Es decir que el operario tiene un efecto significativo en la resistencia de fibra.
La suma residual/error de los cuadrados es 106,5, lo que refleja variabilidad en Resistencia no explicada por los factores Operario y Maquinaria.
Existe interacción entre el operario y la maquinaria empleada.
summary(mod2)
##
## Call:
## lm(formula = Resistencia ~ Operario + Maquinaria, data = Ejercicio2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.1667 -1.2500 -0.3333 0.5833 5.8333
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 105.8333 1.5282 69.252 < 2e-16 ***
## Operario 3.0000 0.5919 5.069 6.82e-05 ***
## MaquinariaB 0.3333 1.3669 0.244 0.810
## MaquinariaC -0.1667 1.3669 -0.122 0.904
## MaquinariaD 1.6667 1.3669 1.219 0.238
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.368 on 19 degrees of freedom
## Multiple R-squared: 0.595, Adjusted R-squared: 0.5097
## F-statistic: 6.978 on 4 and 19 DF, p-value: 0.001241
El coeficiente para Operario es es altamente significativo (p < 0.001). Esto indica que cambiar el nivel de Operario tiene un efecto significativo sobre la Resistencia promedio.
El p-valor del estadístico F es significativo, lo que apoya la conclusión de que el Operario tiene un efecto significativo en la variable de respuesta.
library(agricolae)
compara1=LSD.test(mod2,"Operario")
compara1
## $statistics
## MSerror Df Mean CV t.value LSD
## 5.605263 19 112.2917 2.108388 2.093024 2.477663
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none Operario 3 0.05
##
## $means
## Resistencia std r se LCL UCL Min Max Q25 Q50 Q75
## 1 109.875 2.232071 8 0.8370531 108.123 111.627 108 115 108.75 109.5 110.0
## 2 111.125 1.552648 8 0.8370531 109.373 112.877 109 114 110.00 111.0 112.0
## 3 115.875 2.695896 8 0.8370531 114.123 117.627 112 120 114.00 115.5 117.5
##
## $comparison
## NULL
##
## $groups
## Resistencia groups
## 3 115.875 a
## 2 111.125 b
## 1 109.875 b
##
## attr(,"class")
## [1] "group"
La media del cuadrado medio del error es de 5.605263, una media de resistencia de 112.2917. Un coeficiente de variación de 2.108333 que indica la variabilidad de los datos en relación con la muestra.
LSD, diferencia mínima significativa requerida entre dos medias de grupo de 2.477663, significativamente diferentes.
El operario 3 tiene la media más alta (115.875), luego el operario 2 (111.125), y el operario 1 la más baja (109.875). El operario 3 es significativamente diferente a los demás.
residuos <- residuals(mod2)
# Boxplot de residuos
boxplot(residuos, col = "lightpink",
main = "Boxplot de Residuos",
xlab = "Combinación de Operario y Maquina",
ylab = "Residuos")
#P1 - normalidad
#H0: Los residuos siguen una distribución normal #Ha: Los residuos no siguen una distribución normal
plot(mod2)
shapiro.test(mod2$residuals)
##
## Shapiro-Wilk normality test
##
## data: mod2$residuals
## W = 0.91097, p-value = 0.03703
El valor p generado es de 0,03703, como es menor que el nivel de significancia (0,05) hay evidencia estadística suficiente para rechazar H0. Los residuos no siguen una distribución normal.Los resultados evidenciados en las gráficas permiten corroborar que en efecto no se cumplen los supuestos de normalidad, homogeneidad e independencia en analisis de varianzas.
boxplot(Resistencia ~ interaction(Operario, Maquinaria), data = Ejercicio2,
col = c("red", "blue4", "green", "orange","darkorchid1", "lightsalmon", "chartreuse1","cornsilk","blue","palevioletred1","paleturquoise1", "darkgreen"),
ylab = "Resistencia", xlab = "Combinación de Operario y Maquinaria")
En el diagrama de cajas se observa la interacción de las medias de resistencia de la fibra, el operario y la maquinaria empleada.El diagrama de cajas corrobora que si existen diferencias significativas en el operario 3 con la maquinaria C y D.
require(ggplot2)
ggplot(Ejercicio2,aes(x=Operario,y=Resistencia))+geom_point()+
geom_smooth()+theme_classic()
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : pseudoinverse used at 0.99
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : neighborhood radius 2.01
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : reciprocal condition number 9.0213e-17
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : There are other near singularities as well. 4.0401
## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : pseudoinverse used at
## 0.99
## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : neighborhood radius
## 2.01
## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : reciprocal condition
## number 9.0213e-17
## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : There are other near
## singularities as well. 4.0401
Se observa el patrón de los datos y la relación entre las variables en el conjunto de datos, en este caso del operario y la resistencia de la fibra. Se observa que el operario 3 tiene valores de resistencia más altas que los demás.
require(ggplot2)
ggplot(Ejercicio2,aes(x=Maquinaria,y=Resistencia))+geom_point()+
geom_smooth()+theme_classic()
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
Se observa el patrón de los datos y la relación entre las variables en el conjunto de datos, en este caso de la maquinaria y la resistencia de la fibra. Se observa que la maquinaria C y D tienen valores de resistencia más altas que los demás.
Se diseñó un experimento para estudiar el rendimiento de cuatro detergentes. Las siguientes lecturas de “blancura” se obtuvieron con un equipo especial diseñado para 12 cargas de lavado, distribuidas en tres modelos de lavadoras:
library(readxl)
Ejercicio3 <- read_excel("C:/Users/nana_/OneDrive/Escritorio/Disenoexp/ANOVA2factores/Ejercicio3.xlsx")
(Ejercicio3)
## # A tibble: 12 × 3
## Detergente Blancura Lavadora
## <chr> <dbl> <dbl>
## 1 A 45 1
## 2 A 43 2
## 3 A 51 3
## 4 B 47 1
## 5 B 44 2
## 6 B 52 3
## 7 C 50 1
## 8 C 49 2
## 9 C 57 3
## 10 D 42 1
## 11 D 37 2
## 12 D 49 3
A continuación se observa una tabla con el resumen de datos descriptivos como lo son la media, mediana, valor mínimo y valor máximo de las variables:
library(table1)
table1(~Blancura|Detergente+Lavadora,data=Ejercicio3)
## Warning in table1.formula(~Blancura | Detergente + Lavadora, data =
## Ejercicio3): Terms to the right of '|' in formula 'x' define table columns and
## are expected to be factors with meaningful labels.
## Warning in .table1.internal(x = x, labels = labels, groupspan = groupspan, :
## Table has 15 columns. Are you sure this is what you want?
A |
B |
C |
D |
Overall |
|||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 (N=1) |
2 (N=1) |
3 (N=1) |
1 (N=1) |
2 (N=1) |
3 (N=1) |
1 (N=1) |
2 (N=1) |
3 (N=1) |
1 (N=1) |
2 (N=1) |
3 (N=1) |
1 (N=4) |
2 (N=4) |
3 (N=4) |
|
| Blancura | |||||||||||||||
| Mean (SD) | 45.0 (NA) | 43.0 (NA) | 51.0 (NA) | 47.0 (NA) | 44.0 (NA) | 52.0 (NA) | 50.0 (NA) | 49.0 (NA) | 57.0 (NA) | 42.0 (NA) | 37.0 (NA) | 49.0 (NA) | 46.0 (3.37) | 43.3 (4.92) | 52.3 (3.40) |
| Median [Min, Max] | 45.0 [45.0, 45.0] | 43.0 [43.0, 43.0] | 51.0 [51.0, 51.0] | 47.0 [47.0, 47.0] | 44.0 [44.0, 44.0] | 52.0 [52.0, 52.0] | 50.0 [50.0, 50.0] | 49.0 [49.0, 49.0] | 57.0 [57.0, 57.0] | 42.0 [42.0, 42.0] | 37.0 [37.0, 37.0] | 49.0 [49.0, 49.0] | 46.0 [42.0, 50.0] | 43.5 [37.0, 49.0] | 51.5 [49.0, 57.0] |
Se observa que la media de la lectura de blancura es mayor con el detergente C y la lavadora 3 (57). Por su parte se observa que la menor lectura de blancura se obtuvo con el detergente D y la lavadora 1.
library(summarytools)
summarytools::descr(Ejercicio3[,2])
## Descriptive Statistics
## Ejercicio3$Blancura
## N: 12
##
## Blancura
## ----------------- ----------
## Mean 47.17
## Std.Dev 5.32
## Min 37.00
## Q1 43.50
## Median 48.00
## Q3 50.50
## Max 57.00
## MAD 5.19
## IQR 6.50
## CV 0.11
## Skewness -0.08
## SE.Skewness 0.64
## Kurtosis -0.71
## N.Valid 12.00
## Pct.Valid 100.00
Los datos descriptivos indican que la media de la lectura de blancura es de 47.17. El 50% de los datos se ubican entre 37.00 y 48.00, el otro 50% se ubica entre 48.00 y 57.00. La desviación estándar es de un valor bajo (5.32), además cuenta con una Kurtosis de -0.71, es decir que la distribución de datos es leptocúrtica, los datos se distribuyen de manera cercana a la media, no existen tantos valores atípicos.
#Factor 1
#Ho: M1= M2= M3=M4 #Analisis descriptivo
Ho= No existen diferencias significativas en la lectura de blancura entre los 4 tipos de detergentes.
Ha= Al menos uno de los detergentes presenta lectura de blancura diferente.
#Factor 2
Ho= No existen diferencias significativas en blancura entre los 3 modelos de lavadoras.
Ha= Al menos uno de los modelos de lavadoras presenta lectura de blancura diferente.
#Factor 3 (Interacción)
Ho= No existe interacción entre el tipo de detergente y el modelo de lavadora sobre la lectura de blancura
Ha= Existe interacción entre el tipo de detergente y el modelo de lavadora sobre la lectura de blancura
mod3=lm(Blancura~Detergente+Lavadora,data=Ejercicio3)
anova(mod3)
## Analysis of Variance Table
##
## Response: Blancura
## Df Sum Sq Mean Sq F value Pr(>F)
## Detergente 3 133.667 44.556 3.1228 0.09713 .
## Lavadora 1 78.125 78.125 5.4756 0.05185 .
## Residuals 7 99.875 14.268
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El p-valor del factor 1 es de 0.09713, como el P-valor es mayor que alpha (0.05), se acepta H0 que indica que no existen diferencias significativas en la lectura de blancura entre los 4 tipos de detergentes.
El p-valor del factor 2 es de 0.05185. Como el P-valor es mayor que alpha (0.05), se acepta H0 que indica que No existen diferencias significativas en blancura entre los 3 modelos de lavadoras. Es decir que no hay diferencias en las medias de blancura.
El efecto de la lavadora explica más la variabilidad que se encuentra en la suma de cuadrados que es mayor a la que se encuetra en los detergentes.
Existe interacción entre el operario y la maquinaria empleada.
summary(mod3)
##
## Call:
## lm(formula = Blancura ~ Detergente + Lavadora, data = Ejercicio3)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.667 -3.083 1.375 2.021 3.208
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 40.083 3.448 11.625 7.87e-06 ***
## DetergenteB 1.333 3.084 0.432 0.6785
## DetergenteC 5.667 3.084 1.837 0.1088
## DetergenteD -3.667 3.084 -1.189 0.2732
## Lavadora 3.125 1.335 2.340 0.0518 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.777 on 7 degrees of freedom
## Multiple R-squared: 0.6795, Adjusted R-squared: 0.4964
## F-statistic: 3.711 on 4 and 7 DF, p-value: 0.06294
Ningún nivel de Detergente tiene coeficientes estadísticamente significativos, corroborando que este factor no influye significativamente en la Blancura. Mientra que el coeficiente para Lavadora de 3.125 es un poco significativo (p-value 0.0518), lo que indica un efecto moderado de este factor sobre la variable respuesta.
library(agricolae)
compara1=LSD.test(mod3,"Lavadora")
compara1
## $statistics
## MSerror Df Mean CV t.value LSD
## 14.26786 7 47.16667 8.008371 2.364624 6.315773
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none Lavadora 3 0.05
##
## $means
## Blancura std r se LCL UCL Min Max Q25 Q50 Q75
## 1 46.00 3.366502 4 1.888641 41.53407 50.46593 42 50 44.25 46.0 47.75
## 2 43.25 4.924429 4 1.888641 38.78407 47.71593 37 49 41.50 43.5 45.25
## 3 52.25 3.403430 4 1.888641 47.78407 56.71593 49 57 50.50 51.5 53.25
##
## $comparison
## NULL
##
## $groups
## Blancura groups
## 3 52.25 a
## 1 46.00 ab
## 2 43.25 b
##
## attr(,"class")
## [1] "group"
En esta comparación de medias de la variable blancura con los niveles del factor lavadora, se observa un error estándar de las medias de 1.888641. La media más alta ocurre en el nivel 3 de Lavadora (52.25), luego el nivel 1 (46.00) y finalmente el 2 (43.25). La diferencia mínima significativa (LSD) requerida entre dos medias es de 6.315773. La lavadora 3 presenta una blancura significativamente superior a Lavadora 1 y Lavadora 2, las cuales no difieren entre si.
residuos <- residuals(mod3)
# Boxplot de residuos
boxplot(residuos, col = "red",
main = "Boxplot de Residuos",
xlab = "Combinación de lavadora y detergente",
ylab = "Residuos")
Se observa el box plot correspondiente a los residuos de la combinación de la interacción entre lavadora y detergente.
#P1 - normalidad
#H0: Los residuos siguen una distribución normal #Ha: Los residuos no siguen una distribución normal
plot(mod3)
shapiro.test(mod3$residuals)
##
## Shapiro-Wilk normality test
##
## data: mod3$residuals
## W = 0.82915, p-value = 0.02049
El valor p generado es de 0.02049, como es menor que el nivel de significancia (0,05) hay evidencia estadística suficiente para rechazar H0. Los residuos no siguen una distribución normal.Los resultados evidenciados en las gráficas permiten corroborar que en efecto no se cumplen los supuestos de normalidad, homogeneidad e independencia en analisis de varianzas.
boxplot(Blancura ~ interaction(Lavadora, Detergente), data = Ejercicio3,
col = c("red", "blue4", "green", "orange","darkorchid1", "lightsalmon", "chartreuse1","cornsilk","blue","palevioletred1","paleturquoise1", "darkgreen"),
ylab = "Blancura", xlab = "Combinación de lavadora y detergente")
En el diagrama de cajas se observa la interacción de las medias de la lectura de blancura, las lavadoras y el detergente empleados.El diagrama de cajas corrobora que si existen diferencias significativas en la lavadora 3 y el detergente C, mostrando altos niveles de blancura, además la lavadora 2 y el detergente D mostrando los niveles de blancura más bajos.
require(ggplot2)
ggplot(Ejercicio3,aes(x=Lavadora,y=Blancura))+geom_point()+
geom_smooth()+theme_classic()
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : pseudoinverse used at 0.99
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : neighborhood radius 2.01
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : reciprocal condition number 9.5093e-17
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : There are other near singularities as well. 4.0401
## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : pseudoinverse used at
## 0.99
## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : neighborhood radius
## 2.01
## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : reciprocal condition
## number 9.5093e-17
## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : There are other near
## singularities as well. 4.0401
Se observa el patrón de los datos y la relación entre las variables en el conjunto de datos, en este caso de la lavadora y la lectura de blancura. Se observa que los niveles más altos de blancura se obtienen con la lavadora 3.
require(ggplot2)
ggplot(Ejercicio3,aes(x=Detergente,y=Blancura))+geom_point()+
geom_smooth()+theme_classic()
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
Se observa el patrón de los datos y la relación entre las variables en el conjunto de datos, en este caso del detergente y la lectura de blancura. Se observa que los niveles más altos de blancura se obtienen con la el detergente C.