MSc.Javier De La Hoz Maestre
#Asignatura: Estadístca III (Diseño Experimental)
#Programa : Ingeniería Industrial
#Facultad : Ingeniería
#Universidad del Magdalena
Ejemplo tomado de:
#Devore, J.L.(2008). Probabilidad y estadística para Ingenierías y ciencias. Cengage Learning Editores.
Numerosos factores contribuyen al funcionamiento suave de un motor eléctrico (“Increasing Market Share Through Improved Product and Process Design: An Experimental Approach”, Quality Engineering, 1991: 361-369). En particular, es deseable mantener el ruido del motor y vibraciones a un mínimo. Para estudiar el efecto que la marca de los cojinetes tiene en la vibración del motor, se examinaron cinco marcas diferentes de cojinetes instalando cada tipo de cojinete en muestras aleatorias distintas de seis motores. Se registró la cantidad de vibración del motor (medida en micrones) cuando cada uno de los 30 motores estaba funcionando. Los datos de este estudio se dan a continuación. Formule y pruebe las hipótesis pertinentes a un nivel de significación de 0.05 y luego realice un análisis de comparaciones múltiples si es apropiado.
DatosDCA <- read.csv2("~/Cursos 2016-I/Curso R y Rstudio/Datos/DatosDCA.csv")
## Marca Vibración
## 1 Marca1 13.1
## 2 Marca1 15.0
## 3 Marca1 14.0
## 4 Marca1 14.4
## 5 Marca1 14.0
## 6 Marca1 11.6
## 7 Marca2 16.3
## 8 Marca2 15.7
## 9 Marca2 17.2
## 10 Marca2 14.9
## 11 Marca2 14.4
## 12 Marca2 17.2
## 13 Marca3 13.7
## 14 Marca3 13.9
## 15 Marca3 12.4
## 16 Marca3 13.8
## 17 Marca3 14.9
## 18 Marca3 13.3
## 19 Marca4 15.7
## 20 Marca4 13.7
## 21 Marca4 14.4
## 22 Marca4 16.0
## 23 Marca4 13.9
## 24 Marca4 14.7
## 25 Marca5 13.5
## 26 Marca5 13.4
## 27 Marca5 13.2
## 28 Marca5 12.7
## 29 Marca5 13.4
## 30 Marca5 12.3
#Las hipótesis a evaluar son las siguientes:
#H0: Las cinco marca producen en promedio igual cantidad de vibración
#H1: Al menos una de las marcas produce una vibración promedio diferente
Para probar las hipótesis dadas se usa la técnica ANOVA, la cual descompone la variabilidad total de los datos en sus dos componentes: la variabilidad debida a tratamientos y la que corresponde al error aleatorio. La Tabla de análisis de varianza se obtiene con el siguiente Script
fit<-aov(Vibración~Marca, data=DatosDCA)
summary(fit)
## Df Sum Sq Mean Sq F value Pr(>F)
## Marca 4 30.86 7.714 8.444 0.000187 ***
## Residuals 25 22.84 0.914
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
La validez de los resultados obtenidos queda supeditado a que los supuestos del modelo se cumplan, estos supuestos son:
Normalidad de los residuos
Homocedasticidad de varianzas
Independencia
Este último no lo verificaremos pues no tenemos el orden en que fueron realizadas las corridas experimentales.
#Para verificar la normalidad de los residuos utilizaremos la prueba de Shapiro-Wilks cuyo script es el siguiente:
shapiro.test(residuals(fit))
##
## Shapiro-Wilk normality test
##
## data: residuals(fit)
## W = 0.95996, p-value = 0.3091
Con el resultado anterior con una confianza del 95 % no podemos rechazar la idea de que los residuos provengan de una distribución normal \((W=0.9599, p-value>0.05)\).
#Para verificar el supuesto de homocedasticidad de las varianzas utilizaremos la prueba de Bartlett script es el siguiente:
bartlett.test(Vibración~Marca, data=DatosDCA)
##
## Bartlett test of homogeneity of variances
##
## data: Vibración by Marca
## Bartlett's K-squared = 4.0967, df = 4, p-value = 0.3931
Con una confianza del 95 % no podemos rechazar la idea de que las varianzas sean homogeneas \((chi^2= 4.0967, df = 4, p-value>0.05)\)
Volviendo a la tabla ANOVA
## Df Sum Sq Mean Sq F value Pr(>F)
## Marca 4 30.86 7.714 8.444 0.000187 ***
## Residuals 25 22.84 0.914
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Una vez verificados los supuestos podemos concluir con una confianza del 95 % que se rechaza la hipótesis nula,es decir,que hay evidencia estadística para concluir que existen diferencias significativas en al menos un par de medias de tratamientos (Marcas) \((F=8.444,df(4,25),p-value<0.05\))
Ahora es necesario investigar cuáles tratamientos (Marcas) resultaron diferentes, o cuáles provocan la diferencia, es decir, el problema es probar la igualdad de todos los posibles pares de medias con las hipótesis:
#Utilizaremos la técnica LSD (Least Signifficant Difference), para lo cual debemos cargar la libreria agricolae.
library(agricolae)
## Warning: package 'agricolae' was built under R version 3.3.0
Grupos<- LSD.test(y = fit, trt = "Marca", group = T, console = T)
##
## Study: fit ~ "Marca"
##
## LSD t Test for Vibración
##
## Mean Square Error: 0.9135333
##
## Marca, means and individual ( 95 %) CI
##
## Vibración std r LCL UCL Min Max
## Marca1 13.68333 1.1940128 6 12.87970 14.48696 11.6 15.0
## Marca2 15.95000 1.1674759 6 15.14637 16.75363 14.4 17.2
## Marca3 13.66667 0.8164966 6 12.86304 14.47030 12.4 14.9
## Marca4 14.73333 0.9395034 6 13.92970 15.53696 13.7 16.0
## Marca5 13.08333 0.4792355 6 12.27970 13.88696 12.3 13.5
##
## alpha: 0.05 ; Df Error: 25
## Critical Value of t: 2.059539
##
## Least Significant Difference 1.136505
## Means with the same letter are not significantly different.
##
## Groups, Treatments and means
## a Marca2 15.95
## b Marca4 14.73
## bc Marca1 13.68
## bc Marca3 13.67
## c Marca5 13.08
#Otra opcion cuando cambiamos el argumento "group" a F(false), se interpreta a mi parecer de forma más sencilla la diferencia entre las medias
Grupos<- LSD.test(y = fit, trt = "Marca", group = F, console = T)
##
## Study: fit ~ "Marca"
##
## LSD t Test for Vibración
##
## Mean Square Error: 0.9135333
##
## Marca, means and individual ( 95 %) CI
##
## Vibración std r LCL UCL Min Max
## Marca1 13.68333 1.1940128 6 12.87970 14.48696 11.6 15.0
## Marca2 15.95000 1.1674759 6 15.14637 16.75363 14.4 17.2
## Marca3 13.66667 0.8164966 6 12.86304 14.47030 12.4 14.9
## Marca4 14.73333 0.9395034 6 13.92970 15.53696 13.7 16.0
## Marca5 13.08333 0.4792355 6 12.27970 13.88696 12.3 13.5
##
## alpha: 0.05 ; Df Error: 25
## Critical Value of t: 2.059539
##
## Comparison between treatments means
##
## Difference pvalue sig. LCL UCL
## Marca1 - Marca2 -2.26666667 0.0004 *** -3.40317205 -1.13016128
## Marca1 - Marca3 0.01666667 0.9761 -1.11983872 1.15317205
## Marca1 - Marca4 -1.05000000 0.0686 . -2.18650539 0.08650539
## Marca1 - Marca5 0.60000000 0.2873 -0.53650539 1.73650539
## Marca2 - Marca3 2.28333333 0.0003 *** 1.14682795 3.41983872
## Marca2 - Marca4 1.21666667 0.0369 * 0.08016128 2.35317205
## Marca2 - Marca5 2.86666667 0.0000 *** 1.73016128 4.00317205
## Marca3 - Marca4 -1.06666667 0.0646 . -2.20317205 0.06983872
## Marca3 - Marca5 0.58333333 0.3006 -0.55317205 1.71983872
## Marca4 - Marca5 1.65000000 0.0062 ** 0.51349461 2.78650539
Los resultados indican que existen diferencias estadísticas significativas entre las medias de la marca 2 con el resto, además, la marca 2 es la que en promedio produce mayor vibración, mientras que la que produce menor vibración promedio es la marca 5, sin embargo, esta marca es estadisticamente igual a la marca 3 y a la marca 1.