MSc.Javier De La Hoz Maestre

#Asignatura: Estadístca III (Diseño Experimental)
#Programa  : Ingeniería Industrial
#Facultad  : Ingeniería
#Universidad del Magdalena

Ejemplo tomado de:

#Devore, J.L.(2008). Probabilidad y estadística para Ingenierías y ciencias. Cengage Learning Editores.

Numerosos factores contribuyen al funcionamiento suave de un motor eléctrico (“Increasing Market Share Through Improved Product and Process Design: An Experimental Approach”, Quality Engineering, 1991: 361-369). En particular, es deseable mantener el ruido del motor y vibraciones a un mínimo. Para estudiar el efecto que la marca de los cojinetes tiene en la vibración del motor, se examinaron cinco marcas diferentes de cojinetes instalando cada tipo de cojinete en muestras aleatorias distintas de seis motores. Se registró la cantidad de vibración del motor (medida en micrones) cuando cada uno de los 30 motores estaba funcionando. Los datos de este estudio se dan a continuación. Formule y pruebe las hipótesis pertinentes a un nivel de significación de 0.05 y luego realice un análisis de comparaciones múltiples si es apropiado.

 DatosDCA <- read.csv2("~/Cursos 2016-I/Curso R y Rstudio/Datos/DatosDCA.csv")
##     Marca Vibración
## 1  Marca1      13.1
## 2  Marca1      15.0
## 3  Marca1      14.0
## 4  Marca1      14.4
## 5  Marca1      14.0
## 6  Marca1      11.6
## 7  Marca2      16.3
## 8  Marca2      15.7
## 9  Marca2      17.2
## 10 Marca2      14.9
## 11 Marca2      14.4
## 12 Marca2      17.2
## 13 Marca3      13.7
## 14 Marca3      13.9
## 15 Marca3      12.4
## 16 Marca3      13.8
## 17 Marca3      14.9
## 18 Marca3      13.3
## 19 Marca4      15.7
## 20 Marca4      13.7
## 21 Marca4      14.4
## 22 Marca4      16.0
## 23 Marca4      13.9
## 24 Marca4      14.7
## 25 Marca5      13.5
## 26 Marca5      13.4
## 27 Marca5      13.2
## 28 Marca5      12.7
## 29 Marca5      13.4
## 30 Marca5      12.3
#Las hipótesis a evaluar son las siguientes:
#H0: Las cinco marca producen en promedio igual cantidad de vibración
#H1: Al menos una de las marcas produce una vibración promedio diferente

Para probar las hipótesis dadas se usa la técnica ANOVA, la cual descompone la variabilidad total de los datos en sus dos componentes: la variabilidad debida a tratamientos y la que corresponde al error aleatorio. La Tabla de análisis de varianza se obtiene con el siguiente Script

fit<-aov(Vibración~Marca, data=DatosDCA)
summary(fit)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Marca        4  30.86   7.714   8.444 0.000187 ***
## Residuals   25  22.84   0.914                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

La validez de los resultados obtenidos queda supeditado a que los supuestos del modelo se cumplan, estos supuestos son:

Normalidad de los residuos

Homocedasticidad de varianzas

Independencia

Este último no lo verificaremos pues no tenemos el orden en que fueron realizadas las corridas experimentales.

#Para verificar la normalidad de los residuos utilizaremos la prueba de Shapiro-Wilks cuyo script es el siguiente:
shapiro.test(residuals(fit))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(fit)
## W = 0.95996, p-value = 0.3091

Con el resultado anterior con una confianza del 95 % no podemos rechazar la idea de que los residuos provengan de una distribución normal \((W=0.9599, p-value>0.05)\).

#Para verificar el supuesto de homocedasticidad de las varianzas utilizaremos la prueba de Bartlett script es el siguiente:
bartlett.test(Vibración~Marca, data=DatosDCA)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  Vibración by Marca
## Bartlett's K-squared = 4.0967, df = 4, p-value = 0.3931

Con una confianza del 95 % no podemos rechazar la idea de que las varianzas sean homogeneas \((chi^2= 4.0967, df = 4, p-value>0.05)\)

Volviendo a la tabla ANOVA

##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Marca        4  30.86   7.714   8.444 0.000187 ***
## Residuals   25  22.84   0.914                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Una vez verificados los supuestos podemos concluir con una confianza del 95 % que se rechaza la hipótesis nula,es decir,que hay evidencia estadística para concluir que existen diferencias significativas en al menos un par de medias de tratamientos (Marcas) \((F=8.444,df(4,25),p-value<0.05\))

Ahora es necesario investigar cuáles tratamientos (Marcas) resultaron diferentes, o cuáles provocan la diferencia, es decir, el problema es probar la igualdad de todos los posibles pares de medias con las hipótesis:

#Utilizaremos la técnica LSD (Least Signifficant Difference), para lo cual debemos cargar la libreria agricolae.
library(agricolae)
## Warning: package 'agricolae' was built under R version 3.3.0
Grupos<- LSD.test(y = fit, trt = "Marca", group = T, console = T)
## 
## Study: fit ~ "Marca"
## 
## LSD t Test for Vibración 
## 
## Mean Square Error:  0.9135333 
## 
## Marca,  means and individual ( 95 %) CI
## 
##        Vibración       std r      LCL      UCL  Min  Max
## Marca1  13.68333 1.1940128 6 12.87970 14.48696 11.6 15.0
## Marca2  15.95000 1.1674759 6 15.14637 16.75363 14.4 17.2
## Marca3  13.66667 0.8164966 6 12.86304 14.47030 12.4 14.9
## Marca4  14.73333 0.9395034 6 13.92970 15.53696 13.7 16.0
## Marca5  13.08333 0.4792355 6 12.27970 13.88696 12.3 13.5
## 
## alpha: 0.05 ; Df Error: 25
## Critical Value of t: 2.059539 
## 
## Least Significant Difference 1.136505
## Means with the same letter are not significantly different.
## 
## Groups, Treatments and means
## a     Marca2      15.95 
## b     Marca4      14.73 
## bc    Marca1      13.68 
## bc    Marca3      13.67 
## c     Marca5      13.08
#Otra opcion cuando cambiamos el argumento "group" a F(false), se interpreta a mi parecer de forma más sencilla la diferencia entre las medias
Grupos<- LSD.test(y = fit, trt = "Marca", group = F, console = T)
## 
## Study: fit ~ "Marca"
## 
## LSD t Test for Vibración 
## 
## Mean Square Error:  0.9135333 
## 
## Marca,  means and individual ( 95 %) CI
## 
##        Vibración       std r      LCL      UCL  Min  Max
## Marca1  13.68333 1.1940128 6 12.87970 14.48696 11.6 15.0
## Marca2  15.95000 1.1674759 6 15.14637 16.75363 14.4 17.2
## Marca3  13.66667 0.8164966 6 12.86304 14.47030 12.4 14.9
## Marca4  14.73333 0.9395034 6 13.92970 15.53696 13.7 16.0
## Marca5  13.08333 0.4792355 6 12.27970 13.88696 12.3 13.5
## 
## alpha: 0.05 ; Df Error: 25
## Critical Value of t: 2.059539 
## 
## Comparison between treatments means
## 
##                  Difference pvalue sig.         LCL         UCL
## Marca1 - Marca2 -2.26666667 0.0004  *** -3.40317205 -1.13016128
## Marca1 - Marca3  0.01666667 0.9761      -1.11983872  1.15317205
## Marca1 - Marca4 -1.05000000 0.0686    . -2.18650539  0.08650539
## Marca1 - Marca5  0.60000000 0.2873      -0.53650539  1.73650539
## Marca2 - Marca3  2.28333333 0.0003  ***  1.14682795  3.41983872
## Marca2 - Marca4  1.21666667 0.0369    *  0.08016128  2.35317205
## Marca2 - Marca5  2.86666667 0.0000  ***  1.73016128  4.00317205
## Marca3 - Marca4 -1.06666667 0.0646    . -2.20317205  0.06983872
## Marca3 - Marca5  0.58333333 0.3006      -0.55317205  1.71983872
## Marca4 - Marca5  1.65000000 0.0062   **  0.51349461  2.78650539

Los resultados indican que existen diferencias estadísticas significativas entre las medias de la marca 2 con el resto, además, la marca 2 es la que en promedio produce mayor vibración, mientras que la que produce menor vibración promedio es la marca 5, sin embargo, esta marca es estadisticamente igual a la marca 3 y a la marca 1.