Ejercicio
El conjunto de datos SleepStudy (esta en R) contiene 253
observaciones sobre patrones de sueño en estudiantes universitarios.
Para ello se realizó un seguimiento de estos alumnos durante dos
semanas. La variable X=AverageSleep contiene el número medio de horas de
sueño de cada estudiante durante este periodo. En el siguiente paso
leemos los datos y presentamos un histograma de esta variable.
Recuerde que primero debe instalar el paquete: Lock5Data
# esto es para que Cargamos el paquete-libreria en R que contiene los datos
install.packages("Lock5Data")
library(Lock5Data)
# Cargamos los datos del estudio de sueño
data(SleepStudy)
#Para ver los primeros 6 datos
head(SleepStudy)
#Para ver el histograma de frecuencia
hist(SleepStudy$AverageSleep, col="lightSalmon", xlab="Promedio de horas de sueño diarias", main="Estudio del sueño en \n estudiantes universitarios")
EjemploSupongamos que queremos determinar si es
admisible la hipótesis de que estos alumnos duermen en promedio 8 horas
diarias, con un nivel de significancia del 5%.
H0: Los alumnos duermen en promedio 8 horas diarias
H1: Los alumnos No duermen en promedio 8 horas diarias.
Utilizaríamos entonces la sintaxis:
t.test(x=SleepStudy$AverageSleep,
alternative = "two.sided",
mu = 8, conf.level = 0.95)
Obsérvese que para llevar a cabo el contraste basta con especificar
la media que se desea poner a prueba mediante mu=8, el nivel de
confianza: 1-significancia.
Como resultado del procedimiento se muestra que elp-valor del contraste
es 0.57483> 0.05, que indica que la hipótesis H0 no se rechaza osea
que la hipotesis planteada es admisible.
Además, obtenemos también la estimación del número medio de horas de
sueño en la muestra de estudiantes universitarios =7.96593 horas y un
intervalo de confianza al 95%: 7.846466- 8.085392, que nos indica que
con un 95% de confianza podemos inferir que el numero de horas medio de
los universitarios esta entre 7.8466 y 8.085392 horas. Finalmente
observe que el valor promedio de la muestra esta dentreo del intervalo
de confianza, por esto es que NO se rechaza Ho.
Para los siguientes ejercicios: a. Escriba la Hipotesis nula y la
hipotesis alterna
c. Describa con que grado de significacncia a utilizar.
d. Que tipo de prueba a utilizar si es de dos colas o de una cola.
e. Correr la prueba, y describa el resultado de la prueba y la
conclusión. f. Cual es el intervalo de confianza y su interpretación
Podemos utilizar t.test() para contrastar la igualdad de medias en poblaciones normales. Por defecto, la función t.test() asume que la variable sobre la que se realiza el contraste tiene diferente varianza en los grupos que se comparan.
La hipotesis a contrastar es: Existen diferencias en el promedio de
horas de sueño diarias entre hombres y mujeres, asumiendo varianzas
distintas, con un nivel de significancia del 5%.
H0: Las mujeres duermen en promedio las mismas horas que los
hombres
H1: Las mujeres NO duermen en promedio las mismas horas que los
hombres.
Entonces, empleamos la siguiente sintaxis:
t.test(AverageSleep~Gender,alternative ="two.sided",
mu = 0, var.equal = FALSE,
data=SleepStudy)
Como vemos, no existen diferencias significativas en las horas promedio de sueño entre hombres y mujeres dado que el p-valor 0.564, y con una confianza del 95% podemos afirmar que la diferencia en el numero de horas promedio entre hombres y mujeres es cero horas porque el intervalo es 7.994768 7.923235.
Para los siguientes ejercicios: a. Escriba la Hipotesis nula y la
hipotesis alterna
c. Describa con que grado de significacncia a utilizar.
d. Que tipo de prueba a utilizar si es de dos colas o de una cola.
e. Correr la prueba, y describa el resultado de la prueba y la
conclusión. f. Cual es el intervalo de confianza y su interpretación