#Asignatura: Estadístca III (Diseño Experimental)
#Programa : Ingeniería Industrial
#Facultad : Ingeniería
#Universidad del Magdalena
Ejemplo tomado de:
#Gutiérrez Pulido, H. De la Vara Salazar Román.(2004). Análisis y diseño de experimentos. Editorial McGrawHill.
Una compañía de transporte de carga desea escoger la mejor ruta para llevar la mercancía de un depósito a otro. La mayor preocupación es el tiempo de viaje. En el estudio se seleccionaron al azar cinco choferes de un grupo de 10 y se asignaron a la ruta A; los cinco restantes se asignaron a la ruta B. Los datos obtenidos fueron:
¿Existen diferencias significativas entre las rutas? Plantee y pruebe las hipótesis estadísticas correspondientes.
En caso de rechazar la hipótesis del inciso a), dibuje los diagramas de cajas simultáneos para determinar cuál ruta es mejor.
Inciso (a)
1. Planteamos las hipótesis
2. Seleccionamos un nivel de significancia
\(a=0.05\)
3. Seleccionamos el estadístico de prueba. La selección del estadístico depende de la forma de la población, de si las varianzas poblacionales son conocidas o no, si dichas varianzas son iguales o no y del tamaño de las muestras. Nos apoyaremos en la siguente tabla para la selecciòn del estadístico
Tabla 1. Estadísticos de prueba para la diferencia de medias.
Tabla tomada de Solano, H. L. (2006). Estadística inferencial. Uninorte.
3.1 Realizaremos la prueba de Shapiro Wilk para comprobar la normalidad de los datos
Cargar los datos
Datos <- read.csv("~/Cursos 2016-I/Datos.csv", sep=";")
Datos
## Ruta Tiempo.de.viaje
## 1 A 18
## 2 A 24
## 3 A 30
## 4 A 21
## 5 A 32
## 6 B 22
## 7 B 29
## 8 B 34
## 9 B 25
## 10 B 35
Prueba de normalidad
En este caso la hipótesis nula de la prueba de Shapiro dice que la distribuciòn de los datos es normal
shapiro.test(Datos$Tiempo.de.viaje)
##
## Shapiro-Wilk normality test
##
## data: Datos$Tiempo.de.viaje
## W = 0.95228, p-value = 0.6955
Se observa que el p-valor de la prueba es 0.6955 , mucho mayor que el nivel de significancia (0.05) por lo que podemos decir que no se rechaza la hipótesis nula, es decir, los datos provienen de una distribución normal.
3.2 Realizaremos la prueba F, en la cual la hipótesis nula estabece que las varianzas son homogéneas
Prueba de homogeneidad de varianzas
var.test(Tiempo.de.viaje ~ Ruta, alternative='two.sided', conf.level=.95,data=Datos)
##
## F test to compare two variances
##
## data: Tiempo.de.viaje by Ruta
## F = 1.1111, num df = 4, denom df = 4, p-value = 0.9211
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.1156862 10.6716999
## sample estimates:
## ratio of variances
## 1.111111
El p-valor de la prueba 0.9211 es mayor que el nivel de significancia, por lo que podemos concluir que no hay evidencia para rechazar que las varianzas sean homogéneas
Con los anteriores resultados y observando la tabla 1, el estadìstico de prueba será una t-student con v=n1+n2-2 grados de libertad
4.Cálculos
t.test(Tiempo.de.viaje~Ruta, alternative='two.sided', conf.level=.95,
var.equal=TRUE, data=Datos)
##
## Two Sample t-test
##
## data: Tiempo.de.viaje by Ruta
## t = -1.0968, df = 8, p-value = 0.3046
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -12.409805 4.409805
## sample estimates:
## mean in group A mean in group B
## 25 29
5. Conclusión
Como el p-valor de la prueba (0.3046) es mayor que el nivel de significancia (0.05) no se rechaza la hipótesis nula, es decir que no hay evidencias estadísticas significativas para concluir que los promedios de tiempos en las rutas sean diferentes.
Inciso (b)
Aunque se concluyó que las rutas no difieren, es decir no existe una ruta mejor se presenta el script para la construcción del diagrama de cajas simultáneo
boxplot(Tiempo.de.viaje~Ruta, data=Datos, id.method="y",xlab="Ruta", ylab="Tiempo de viaje")
`