Ejercicio 1

En un experimento se consideran tres especies de plantas y dos tipos de reactivos para activar el ciclo de florescencia de las plantas. Se mide en cada planta la supervivencia de la flor, es decir, el tiempo en días en que aparece la flor hasta cuando presenta signos de marchitamiento. Los resultados se muestran en la siguiente tabla:

library(readxl)
ANOVA2_EJ1 <- read_excel("C:/Users/nana_/OneDrive/Escritorio/Disenoexp/ANOVA2factores/ANOVA2_EJ1.xlsx")
(ANOVA2_EJ1)

## # A tibble: 18 × 3
##    Reactivo Tiempo Especie
##    <chr>     <dbl> <chr>  
##  1 A            12 SpA    
##  2 A            13 SpA    
##  3 A            15 SpA    
##  4 A            13 SpB    
##  5 A            15 SpB    
##  6 A            15 SpB    
##  7 A            16 SpC    
##  8 A            18 SpC    
##  9 A            20 SpC    
## 10 B             9 SpA    
## 11 B             8 SpA    
## 12 B             9 SpA    
## 13 B            10 SpB    
## 14 B             8 SpB    
## 15 B             9 SpB    
## 16 B            12 SpC    
## 17 B            10 SpC    
## 18 B            13 SpC

A continuación se observa una tabla con el resumen de datos descriptivos como lo son la media, mediana, valor mínimo y valor máximo de las variables:

library(table1)

## 
## Attaching package: 'table1'

## The following objects are masked from 'package:base':
## 
##     units, units<-

table1(~Tiempo|Reactivo+Especie,data=ANOVA2_EJ1)

	A			B			Overall
	SpA (N=3)	SpB (N=3)	SpC (N=3)	SpA (N=3)	SpB (N=3)	SpC (N=3)	SpA (N=6)	SpB (N=6)	SpC (N=6)
Tiempo
Mean (SD)	13.3 (1.53)	14.3 (1.15)	18.0 (2.00)	8.67 (0.577)	9.00 (1.00)	11.7 (1.53)	11.0 (2.76)	11.7 (3.08)	14.8 (3.82)
Median [Min, Max]	13.0 [12.0, 15.0]	15.0 [13.0, 15.0]	18.0 [16.0, 20.0]	9.00 [8.00, 9.00]	9.00 [8.00, 10.0]	12.0 [10.0, 13.0]	10.5 [8.00, 15.0]	11.5 [8.00, 15.0]	14.5 [10.0, 20.0]

Se observa que la media de tiempo máximo que tarda en activarse el ciclo de florescencia con el reactivo A y B es de la especie 3 con un valor medio de 18.0. y de 11.7. respectivamente.

library(summarytools)

## 
## Attaching package: 'summarytools'

## The following objects are masked from 'package:table1':
## 
##     label, label<-

summarytools::descr(ANOVA2_EJ1[,2])

## Descriptive Statistics  
## ANOVA2_EJ1$Tiempo  
## N: 18  
## 
##                     Tiempo
## ----------------- --------
##              Mean    12.50
##           Std.Dev     3.50
##               Min     8.00
##                Q1     9.00
##            Median    12.50
##                Q3    15.00
##               Max    20.00
##               MAD     3.71
##               IQR     5.75
##                CV     0.28
##          Skewness     0.43
##       SE.Skewness     0.54
##          Kurtosis    -0.90
##           N.Valid    18.00
##         Pct.Valid   100.00

Los datos descriptivos indican que la media del tiempo de activación del ciclo de florescencia, es de 12.50. El 50% de los datos se ubican entre 8.00 y 12.50, el otro 50% se ubica entre 12.50 y 20.00. La desviación estándar es de un valor bajo (3.50), además cuenta con una Kurtosis de -0.90, es decir que la distribución de datos es leptocúrtica, los datos se distribuyen de manera cercana a la media, no existen tantos valores atípicos.

ANOVA

#Factor 1

#Ho: M1= M2= M3=M4 #Analisis descriptivo

#Ho= la media del tiempo de activación de la florescencia de la flor de las tres especies no varía

Ha= la media del tiempo de activación de la florescencia de la flor de las tres especies varía en al menos una especie

#Factor 2

Ho= la media del tiempo de activación de la florescencia de la flor con los 2 reactivos no varía

Ha= la media del tiempo de activación de la florescencia de la flor con los 2 reactivos varía en al menos uno

#Factor 3 (Interacción)

Ho= No existe interacción entre la especie y el tipo de reactivo utilizado

Ha= Eexiste interacción entre la especie y el tipo de reactivo utilizado

mod1=lm(Tiempo~Reactivo+Especie,data=ANOVA2_EJ1)
anova(mod1)

## Analysis of Variance Table
## 
## Response: Tiempo
##           Df  Sum Sq Mean Sq F value    Pr(>F)    
## Reactivo   1 133.389 133.389  75.368 5.222e-07 ***
## Especie    2  50.333  25.167  14.220 0.0004251 ***
## Residuals 14  24.778   1.770                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El p-valor del factor 1 es de 0.0004251, como el P-valor es menor que alpha (0.05), se rechaza la H0 que indica que la media del tiempo de floración en tres especies no varía.

El p-valor del factor 2 es de 5.222e-07. Como el P-valor es menor que alpha (0.05), se rechaza H0 que indica que la media del tiempo de floración cons los dos reactivos no varía.

summary(mod1)

## 
## Call:
## lm(formula = Tiempo ~ Reactivo + Especie, data = ANOVA2_EJ1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.1111 -0.8889  0.2500  0.7222  2.4444 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  13.7222     0.6271  21.881 3.17e-12 ***
## ReactivoB    -5.4444     0.6271  -8.681 5.22e-07 ***
## EspecieSpB    0.6667     0.7681   0.868 0.400047    
## EspecieSpC    3.8333     0.7681   4.991 0.000198 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.33 on 14 degrees of freedom
## Multiple R-squared:  0.8812, Adjusted R-squared:  0.8557 
## F-statistic:  34.6 on 3 and 14 DF,  p-value: 9.955e-07

Como se rechaza H0 se tiene que realizar pruebas pos-hoc

#posanova

library(agricolae)
compara1=LSD.test(mod1,"Reactivo")
compara1

## $statistics
##    MSerror Df Mean       CV  t.value     LSD
##   1.769841 14 12.5 10.64283 2.144787 1.34507
## 
## $parameters
##         test p.ajusted   name.t ntr alpha
##   Fisher-LSD      none Reactivo   2  0.05
## 
## $means
##      Tiempo      std r        se       LCL      UCL Min Max Q25 Q50 Q75
## A 15.222222 2.538591 9 0.4434513 14.271114 16.17333  12  20  13  15  16
## B  9.777778 1.715938 9 0.4434513  8.826669 10.72889   8  13   9   9  10
## 
## $comparison
## NULL
## 
## $groups
##      Tiempo groups
## A 15.222222      a
## B  9.777778      b
## 
## attr(,"class")
## [1] "group"

La media del cuadrado medio del error es de 1,77, con 14 grados de libertad y un coeficiente de vaiación de 10.64% que indica la variabilidad de los datos en relación con la muestra. Además se observan datos como intérvalos de confianza y diferencias entre medias.

Residuos

residuos <- residuals(mod1)
# Boxplot de residuos
boxplot(residuos, col = "aquamarine",
        main = "Boxplot de Residuos",
        xlab = "Combinación de Reactivo y Especie",
        ylab = "Residuos")

validar los supuestos

#P1 - normalidad

#H0: Los residuos siguen una distribución normal #Ha: Los residuos no siguen una distribución normal

plot(mod1)

shapiro.test(mod1$residuals)

## 
##  Shapiro-Wilk normality test
## 
## data:  mod1$residuals
## W = 0.96255, p-value = 0.6516

El valor p generado es de 0,6516, como es mayor que el nivel de significancia (0,05) no hay evidencia estadística suficiente para rechazar H0. Los residuos siguen una distribución normal.Los resultados evidenciados en las gráficas permiten corroborar que en efecto si se cumplen los supuestos de normalidad, homogeneidad e independencia en analisis de varianzas.

boxplot(Tiempo ~ interaction(Reactivo, Especie), data = ANOVA2_EJ1,
        col = c("orange","darkorchid1","red", "blue", "green", "grey"),
        ylab = "Tiempo", xlab = "Combinación de Reactivo y Especie")

En el diagrama de cajas se observa la interacción de las medias de tiempo de floración de especies y los reactivos utilizados. La que presenta una media diferente es la especie C con el reactivo A. Como los datos bajo los diferentes tratamientos se ubican de manera diferente si se puede aseverar que no hay igualdad en el tiempo de florescencia.

require(ggplot2)

## Loading required package: ggplot2

ggplot(ANOVA2_EJ1,aes(x=Reactivo,y=Tiempo))+geom_point()+
  geom_smooth()+theme_classic()

## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

Se observa el patrón de los datos y la relación entre las variables en el conjunto de datos, en este caso del reactivo y el tiempo en dias en que aparece la flor hasta cuando se presenta el marchitamiento. Se observa que el reactivo A es más eficiente.

ggplot(ANOVA2_EJ1,aes(x=Especie,y=Tiempo))+geom_point()+
  geom_smooth()+theme_classic()

## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

Se observa el patrón de los datos y la relación entre las variables en el conjunto de datos, en este caso de la especie y el tiempo en dias en que aparece la flor hasta cuando se presenta el marchitamiento. Se observa que la especie C toma más tiempo de floración.

Post-Hoc

require(TukeyC)

## Loading required package: TukeyC

TukeyC(mod1)

## Results
##   Means G1 G2
## A 15.22  a   
## B  9.78     b
## 
## Sig.level
##  0.05
## 
## Diff_Prob
##   A     B
## A 0 5.444
## B 0 0.000
## 
## MSD
##       A     B
## A 0.000 1.345
## B 1.345 0.000

El grupo A tiene una media de supervivencia de flor significativamente mayor (15.22 días) que el grupo B (9.78 días). La diferencia entre medias de 5.444 días es superior a la MSD de 1.345. Por lo tanto el reactivo A es más efectivo para extender la supervivencia de la flor comparado con el reactivo B.

Ejercicio 2

En unos laboratorios se estan estudiando los factores que influyen en la resistencia de un tipo de particulas de fibra. Si se eligen al azar 4 maquinas y 3 operarios y se realiza un experimento factorial. Los resultados oobtenidos se muestran en la siguiente tabla, analizar los resultados y obtene las conclusiones apropiadas.

library(readxl)
Ejercicio2 <- read_excel("C:/Users/nana_/OneDrive/Escritorio/Disenoexp/ANOVA2factores/Ejercicio2.xlsx")
(Ejercicio2)

## # A tibble: 24 × 3
##    Operario Resistencia Maquinaria
##       <dbl>       <dbl> <chr>     
##  1        1         109 A         
##  2        1         110 B         
##  3        1         108 C         
##  4        1         110 D         
##  5        1         110 A         
##  6        1         115 B         
##  7        1         109 C         
##  8        1         108 D         
##  9        2         110 A         
## 10        2         110 B         
## # ℹ 14 more rows

A continuación se observa una tabla con el resumen de datos descriptivos como lo son la media, mediana, valor mínimo y valor máximo de las variables:

library(table1)
table1(~Resistencia|Operario+Maquinaria,data=Ejercicio2)

## Warning in table1.formula(~Resistencia | Operario + Maquinaria, data =
## Ejercicio2): Terms to the right of '|' in formula 'x' define table columns and
## are expected to be factors with meaningful labels.

## Warning in .table1.internal(x = x, labels = labels, groupspan = groupspan, :
## Table has 16 columns. Are you sure this is what you want?

	1				2				3				Overall
	A (N=2)	B (N=2)	C (N=2)	D (N=2)	A (N=2)	B (N=2)	C (N=2)	D (N=2)	A (N=2)	B (N=2)	C (N=2)	D (N=2)	A (N=6)	B (N=6)	C (N=6)	D (N=6)
Resistencia
Mean (SD)	110 (0.707)	113 (3.54)	109 (0.707)	109 (1.41)	111 (1.41)	111 (0.707)	110 (1.41)	113 (1.41)	115 (1.41)	114 (2.12)	117 (3.54)	119 (2.12)	112 (2.71)	112 (2.32)	112 (4.18)	114 (4.46)
Median [Min, Max]	110 [109, 110]	113 [110, 115]	109 [108, 109]	109 [108, 110]	111 [110, 112]	111 [110, 111]	110 [109, 111]	113 [112, 114]	115 [114, 116]	114 [112, 115]	117 [114, 119]	119 [117, 120]	111 [109, 116]	112 [110, 115]	110 [108, 119]	113 [108, 120]

Se observa que la media de resistencia de las partículas de fibra con es mayor con el operario 3 y la máquina D (119). Por su parte se observa que la menor resistencia de la fibra se da con el operario 1 y las máquinas C y D.

library(summarytools)
summarytools::descr(Ejercicio2[,2])

## Descriptive Statistics  
## Ejercicio2$Resistencia  
## N: 24  
## 
##                     Resistencia
## ----------------- -------------
##              Mean        112.29
##           Std.Dev          3.38
##               Min        108.00
##                Q1        110.00
##            Median        111.50
##                Q3        114.50
##               Max        120.00
##               MAD          3.71
##               IQR          4.25
##                CV          0.03
##          Skewness          0.69
##       SE.Skewness          0.47
##          Kurtosis         -0.60
##           N.Valid         24.00
##         Pct.Valid        100.00

Los datos descriptivos indican que la media de resistencia de las partículas de fibra es de 112.29. El 50% de los datos se ubican entre 108.00 y 111.50, el otro 50% se ubica entre 111.50 y 120.00. La desviación estándar es de un valor bajo (3.38), además cuenta con una Kurtosis de -0.60, es decir que la distribución de datos es leptocúrtica, los datos se distribuyen de manera cercana a la media, no existen tantos valores atípicos.

ANOVA

#Factor 1

#Ho: M1= M2= M3=M4 #Analisis descriptivo

Ho= No existe diferencias significativas en la resistencia de fibra entre la maquinaria utilizada

Ha= Existe diferencias significativas en la resistencia de fibra entre la maquinaria utilizada

#Factor 2

Ho= No hay diferencias significativas en la resistencia de las partículas de fibra entre los operarios que las manejan

Ha= Hay diferencias significativas en la resistencia de las partículas de fibra entre los operarios que las manejan

#Factor 3 (Interacción)

Ho= No existe interacción entre la maquinaria y el operario

Ha= Existe interacción entre la maquinaria y el operario

mod2=lm(Resistencia~Operario+Maquinaria,data=Ejercicio2)
anova(mod2)

## Analysis of Variance Table
## 
## Response: Resistencia
##            Df  Sum Sq Mean Sq F value    Pr(>F)    
## Operario    1 144.000 144.000 25.6901 6.823e-05 ***
## Maquinaria  3  12.458   4.153  0.7409    0.5408    
## Residuals  19 106.500   5.605                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El p-valor del factor 1 es de 6.823e-05, como el P-valor es menor que alpha (0.05), se rechaza la H0 que indica que no existe diferencias significativas en la resistencia de fibra entre la maquinaria utilizada

El p-valor del factor 2 es de 0.5408. Como el P-valor es mayor que alpha (0.05), se acepta H0 que indica que No hay diferencias significativas en la resistencia de las partículas de fibra entre los operarios que las manejan. Es decir que el operario tiene un efecto significativo en la resistencia de fibra.

La suma residual/error de los cuadrados es 106,5, lo que refleja variabilidad en Resistencia no explicada por los factores Operario y Maquinaria.

Existe interacción entre el operario y la maquinaria empleada.

summary(mod2)

## 
## Call:
## lm(formula = Resistencia ~ Operario + Maquinaria, data = Ejercicio2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.1667 -1.2500 -0.3333  0.5833  5.8333 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 105.8333     1.5282  69.252  < 2e-16 ***
## Operario      3.0000     0.5919   5.069 6.82e-05 ***
## MaquinariaB   0.3333     1.3669   0.244    0.810    
## MaquinariaC  -0.1667     1.3669  -0.122    0.904    
## MaquinariaD   1.6667     1.3669   1.219    0.238    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.368 on 19 degrees of freedom
## Multiple R-squared:  0.595,  Adjusted R-squared:  0.5097 
## F-statistic: 6.978 on 4 and 19 DF,  p-value: 0.001241

El coeficiente para Operario es es altamente significativo (p < 0.001). Esto indica que cambiar el nivel de Operario tiene un efecto significativo sobre la Resistencia promedio.

El p-valor del estadístico F es significativo, lo que apoya la conclusión de que el Operario tiene un efecto significativo en la variable de respuesta.

library(agricolae)
compara1=LSD.test(mod2,"Operario")
compara1

## $statistics
##    MSerror Df     Mean       CV  t.value      LSD
##   5.605263 19 112.2917 2.108388 2.093024 2.477663
## 
## $parameters
##         test p.ajusted   name.t ntr alpha
##   Fisher-LSD      none Operario   3  0.05
## 
## $means
##   Resistencia      std r        se     LCL     UCL Min Max    Q25   Q50   Q75
## 1     109.875 2.232071 8 0.8370531 108.123 111.627 108 115 108.75 109.5 110.0
## 2     111.125 1.552648 8 0.8370531 109.373 112.877 109 114 110.00 111.0 112.0
## 3     115.875 2.695896 8 0.8370531 114.123 117.627 112 120 114.00 115.5 117.5
## 
## $comparison
## NULL
## 
## $groups
##   Resistencia groups
## 3     115.875      a
## 2     111.125      b
## 1     109.875      b
## 
## attr(,"class")
## [1] "group"

La media del cuadrado medio del error es de 5.605263, una media de resistencia de 112.2917. Un coeficiente de variación de 2.108333 que indica la variabilidad de los datos en relación con la muestra.

LSD, diferencia mínima significativa requerida entre dos medias de grupo de 2.477663, significativamente diferentes.

El operario 3 tiene la media más alta (115.875), luego el operario 2 (111.125), y el operario 1 la más baja (109.875). El operario 3 es significativamente diferente a los demás.

Residuos

residuos <- residuals(mod2)
# Boxplot de residuos
boxplot(residuos, col = "lightpink",
        main = "Boxplot de Residuos",
        xlab = "Combinación de Operario y Maquina",
        ylab = "Residuos")

validar los supuestos

#P1 - normalidad

#H0: Los residuos siguen una distribución normal #Ha: Los residuos no siguen una distribución normal

plot(mod2)

shapiro.test(mod2$residuals)

## 
##  Shapiro-Wilk normality test
## 
## data:  mod2$residuals
## W = 0.91097, p-value = 0.03703

El valor p generado es de 0,03703, como es menor que el nivel de significancia (0,05) hay evidencia estadística suficiente para rechazar H0. Los residuos no siguen una distribución normal.Los resultados evidenciados en las gráficas permiten corroborar que en efecto no se cumplen los supuestos de normalidad, homogeneidad e independencia en analisis de varianzas.

boxplot(Resistencia ~ interaction(Operario, Maquinaria), data = Ejercicio2,
        col = c("red", "blue4", "green", "orange","darkorchid1", "lightsalmon", "chartreuse1","cornsilk","blue","palevioletred1","paleturquoise1", "darkgreen"),
        ylab = "Resistencia", xlab = "Combinación de Operario y Maquinaria")

En el diagrama de cajas se observa la interacción de las medias de resistencia de la fibra, el operario y la maquinaria empleada.El diagrama de cajas corrobora que si existen diferencias significativas en el operario 3 con la maquinaria C y D.

require(ggplot2)
ggplot(Ejercicio2,aes(x=Operario,y=Resistencia))+geom_point()+
  geom_smooth()+theme_classic()

## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : pseudoinverse used at 0.99

## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : neighborhood radius 2.01

## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : reciprocal condition number 9.0213e-17

## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : There are other near singularities as well. 4.0401

## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : pseudoinverse used at
## 0.99

## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : neighborhood radius
## 2.01

## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : reciprocal condition
## number 9.0213e-17

## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : There are other near
## singularities as well. 4.0401

Se observa el patrón de los datos y la relación entre las variables en el conjunto de datos, en este caso del operario y la resistencia de la fibra. Se observa que el operario 3 tiene valores de resistencia más altas que los demás.

require(ggplot2)
ggplot(Ejercicio2,aes(x=Maquinaria,y=Resistencia))+geom_point()+
  geom_smooth()+theme_classic()

## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

Se observa el patrón de los datos y la relación entre las variables en el conjunto de datos, en este caso de la maquinaria y la resistencia de la fibra. Se observa que la maquinaria C y D tienen valores de resistencia más altas que los demás.

Ejercicio 3

Se diseñó un experimento para estudiar el rendimiento de cuatro detergentes. Las siguientes lecturas de “blancura” se obtuvieron con un equipo especial diseñado para 12 cargas de lavado, distribuidas en tres modelos de lavadoras:

library(readxl)
Ejercicio3 <- read_excel("C:/Users/nana_/OneDrive/Escritorio/Disenoexp/ANOVA2factores/Ejercicio3.xlsx")
(Ejercicio3)

## # A tibble: 12 × 3
##    Detergente Blancura Lavadora
##    <chr>         <dbl>    <dbl>
##  1 A                45        1
##  2 A                43        2
##  3 A                51        3
##  4 B                47        1
##  5 B                44        2
##  6 B                52        3
##  7 C                50        1
##  8 C                49        2
##  9 C                57        3
## 10 D                42        1
## 11 D                37        2
## 12 D                49        3

A continuación se observa una tabla con el resumen de datos descriptivos como lo son la media, mediana, valor mínimo y valor máximo de las variables:

library(table1)
table1(~Blancura|Detergente+Lavadora,data=Ejercicio3)

## Warning in table1.formula(~Blancura | Detergente + Lavadora, data =
## Ejercicio3): Terms to the right of '|' in formula 'x' define table columns and
## are expected to be factors with meaningful labels.

## Warning in .table1.internal(x = x, labels = labels, groupspan = groupspan, :
## Table has 15 columns. Are you sure this is what you want?

	A			B			C			D			Overall
	1 (N=1)	2 (N=1)	3 (N=1)	1 (N=1)	2 (N=1)	3 (N=1)	1 (N=1)	2 (N=1)	3 (N=1)	1 (N=1)	2 (N=1)	3 (N=1)	1 (N=4)	2 (N=4)	3 (N=4)
Blancura
Mean (SD)	45.0 (NA)	43.0 (NA)	51.0 (NA)	47.0 (NA)	44.0 (NA)	52.0 (NA)	50.0 (NA)	49.0 (NA)	57.0 (NA)	42.0 (NA)	37.0 (NA)	49.0 (NA)	46.0 (3.37)	43.3 (4.92)	52.3 (3.40)
Median [Min, Max]	45.0 [45.0, 45.0]	43.0 [43.0, 43.0]	51.0 [51.0, 51.0]	47.0 [47.0, 47.0]	44.0 [44.0, 44.0]	52.0 [52.0, 52.0]	50.0 [50.0, 50.0]	49.0 [49.0, 49.0]	57.0 [57.0, 57.0]	42.0 [42.0, 42.0]	37.0 [37.0, 37.0]	49.0 [49.0, 49.0]	46.0 [42.0, 50.0]	43.5 [37.0, 49.0]	51.5 [49.0, 57.0]

Se observa que la media de la lectura de blancura es mayor con el detergente C y la lavadora 3 (57). Por su parte se observa que la menor lectura de blancura se obtuvo con el detergente D y la lavadora 1.

library(summarytools)
summarytools::descr(Ejercicio3[,2])

## Descriptive Statistics  
## Ejercicio3$Blancura  
## N: 12  
## 
##                     Blancura
## ----------------- ----------
##              Mean      47.17
##           Std.Dev       5.32
##               Min      37.00
##                Q1      43.50
##            Median      48.00
##                Q3      50.50
##               Max      57.00
##               MAD       5.19
##               IQR       6.50
##                CV       0.11
##          Skewness      -0.08
##       SE.Skewness       0.64
##          Kurtosis      -0.71
##           N.Valid      12.00
##         Pct.Valid     100.00

Los datos descriptivos indican que la media de la lectura de blancura es de 47.17. El 50% de los datos se ubican entre 37.00 y 48.00, el otro 50% se ubica entre 48.00 y 57.00. La desviación estándar es de un valor bajo (5.32), además cuenta con una Kurtosis de -0.71, es decir que la distribución de datos es leptocúrtica, los datos se distribuyen de manera cercana a la media, no existen tantos valores atípicos.

ANOVA

#Factor 1

#Ho: M1= M2= M3=M4 #Analisis descriptivo

Ho= No existen diferencias significativas en la lectura de blancura entre los 4 tipos de detergentes.

Ha= Al menos uno de los detergentes presenta lectura de blancura diferente.

#Factor 2

Ho= No existen diferencias significativas en blancura entre los 3 modelos de lavadoras.

Ha= Al menos uno de los modelos de lavadoras presenta lectura de blancura diferente.

#Factor 3 (Interacción)

Ho= No existe interacción entre el tipo de detergente y el modelo de lavadora sobre la lectura de blancura

Ha= Existe interacción entre el tipo de detergente y el modelo de lavadora sobre la lectura de blancura

mod3=lm(Blancura~Detergente+Lavadora,data=Ejercicio3)
anova(mod3)

## Analysis of Variance Table
## 
## Response: Blancura
##            Df  Sum Sq Mean Sq F value  Pr(>F)  
## Detergente  3 133.667  44.556  3.1228 0.09713 .
## Lavadora    1  78.125  78.125  5.4756 0.05185 .
## Residuals   7  99.875  14.268                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El p-valor del factor 1 es de 0.09713, como el P-valor es mayor que alpha (0.05), se acepta H0 que indica que no existen diferencias significativas en la lectura de blancura entre los 4 tipos de detergentes.

El p-valor del factor 2 es de 0.05185. Como el P-valor es mayor que alpha (0.05), se acepta H0 que indica que No existen diferencias significativas en blancura entre los 3 modelos de lavadoras. Es decir que no hay diferencias en las medias de blancura.

El efecto de la lavadora explica más la variabilidad que se encuentra en la suma de cuadrados que es mayor a la que se encuetra en los detergentes.

Existe interacción entre el operario y la maquinaria empleada.

summary(mod3)

## 
## Call:
## lm(formula = Blancura ~ Detergente + Lavadora, data = Ejercicio3)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -5.667 -3.083  1.375  2.021  3.208 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   40.083      3.448  11.625 7.87e-06 ***
## DetergenteB    1.333      3.084   0.432   0.6785    
## DetergenteC    5.667      3.084   1.837   0.1088    
## DetergenteD   -3.667      3.084  -1.189   0.2732    
## Lavadora       3.125      1.335   2.340   0.0518 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.777 on 7 degrees of freedom
## Multiple R-squared:  0.6795, Adjusted R-squared:  0.4964 
## F-statistic: 3.711 on 4 and 7 DF,  p-value: 0.06294

Ningún nivel de Detergente tiene coeficientes estadísticamente significativos, corroborando que este factor no influye significativamente en la Blancura. Mientra que el coeficiente para Lavadora de 3.125 es un poco significativo (p-value 0.0518), lo que indica un efecto moderado de este factor sobre la variable respuesta.

library(agricolae)
compara1=LSD.test(mod3,"Lavadora")
compara1

## $statistics
##    MSerror Df     Mean       CV  t.value      LSD
##   14.26786  7 47.16667 8.008371 2.364624 6.315773
## 
## $parameters
##         test p.ajusted   name.t ntr alpha
##   Fisher-LSD      none Lavadora   3  0.05
## 
## $means
##   Blancura      std r       se      LCL      UCL Min Max   Q25  Q50   Q75
## 1    46.00 3.366502 4 1.888641 41.53407 50.46593  42  50 44.25 46.0 47.75
## 2    43.25 4.924429 4 1.888641 38.78407 47.71593  37  49 41.50 43.5 45.25
## 3    52.25 3.403430 4 1.888641 47.78407 56.71593  49  57 50.50 51.5 53.25
## 
## $comparison
## NULL
## 
## $groups
##   Blancura groups
## 3    52.25      a
## 1    46.00     ab
## 2    43.25      b
## 
## attr(,"class")
## [1] "group"

En esta comparación de medias de la variable blancura con los niveles del factor lavadora, se observa un error estándar de las medias de 1.888641. La media más alta ocurre en el nivel 3 de Lavadora (52.25), luego el nivel 1 (46.00) y finalmente el 2 (43.25). La diferencia mínima significativa (LSD) requerida entre dos medias es de 6.315773. La lavadora 3 presenta una blancura significativamente superior a Lavadora 1 y Lavadora 2, las cuales no difieren entre si.

Residuos

residuos <- residuals(mod3)
# Boxplot de residuos
boxplot(residuos, col = "red",
        main = "Boxplot de Residuos",
        xlab = "Combinación de lavadora y detergente",
        ylab = "Residuos")

Se observa el box plot correspondiente a los residuos de la combinación de la interacción entre lavadora y detergente.

validar los supuestos

#P1 - normalidad

#H0: Los residuos siguen una distribución normal #Ha: Los residuos no siguen una distribución normal

plot(mod3)

shapiro.test(mod3$residuals)

## 
##  Shapiro-Wilk normality test
## 
## data:  mod3$residuals
## W = 0.82915, p-value = 0.02049

El valor p generado es de 0.02049, como es menor que el nivel de significancia (0,05) hay evidencia estadística suficiente para rechazar H0. Los residuos no siguen una distribución normal.Los resultados evidenciados en las gráficas permiten corroborar que en efecto no se cumplen los supuestos de normalidad, homogeneidad e independencia en analisis de varianzas.

boxplot(Blancura ~ interaction(Lavadora, Detergente), data = Ejercicio3,
        col = c("red", "blue4", "green", "orange","darkorchid1", "lightsalmon", "chartreuse1","cornsilk","blue","palevioletred1","paleturquoise1", "darkgreen"),
        ylab = "Blancura", xlab = "Combinación de lavadora y detergente")

En el diagrama de cajas se observa la interacción de las medias de la lectura de blancura, las lavadoras y el detergente empleados.El diagrama de cajas corrobora que si existen diferencias significativas en la lavadora 3 y el detergente C, mostrando altos niveles de blancura, además la lavadora 2 y el detergente D mostrando los niveles de blancura más bajos.

require(ggplot2)
ggplot(Ejercicio3,aes(x=Lavadora,y=Blancura))+geom_point()+
  geom_smooth()+theme_classic()

## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : pseudoinverse used at 0.99

## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : neighborhood radius 2.01

## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : reciprocal condition number 9.5093e-17

## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : There are other near singularities as well. 4.0401

## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : pseudoinverse used at
## 0.99

## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : neighborhood radius
## 2.01

## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : reciprocal condition
## number 9.5093e-17

## Warning in predLoess(object$y, object$x, newx = if (is.null(newdata)) object$x
## else if (is.data.frame(newdata))
## as.matrix(model.frame(delete.response(terms(object)), : There are other near
## singularities as well. 4.0401

Se observa el patrón de los datos y la relación entre las variables en el conjunto de datos, en este caso de la lavadora y la lectura de blancura. Se observa que los niveles más altos de blancura se obtienen con la lavadora 3.

require(ggplot2)
ggplot(Ejercicio3,aes(x=Detergente,y=Blancura))+geom_point()+
  geom_smooth()+theme_classic()

## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'

Se observa el patrón de los datos y la relación entre las variables en el conjunto de datos, en este caso del detergente y la lectura de blancura. Se observa que los niveles más altos de blancura se obtienen con la el detergente C.

ANOVA DE DOS FACTORES

Paula Sterling

25-10-2023

Ejercicio 1

ANOVA

Residuos

validar los supuestos

Post-Hoc

Ejercicio 2

ANOVA

Residuos

validar los supuestos

Ejercicio 3

ANOVA

Residuos

validar los supuestos