Estadística Inferencial - Lectura 3 Ejercicio 2

Lucas Mesias

2. Para confirmar que el tiempo que requieren los estudiantes de ingeniería para desarrollar una guía de ejercicios de Cálculo I es de dos horas, se eligió aleatoriamente a 16 estudiantes de esta asignatura y seles pidió anotar el tiempo [min.] invertido en la tarea. Los resultados fueron los siguientes: 140,6; 133,3;142,4; 86,4; 129,9; 110,8; 133,2; 129,1; 142,5; 150,2; 141,6; 111,0; 127,2; 137,9; 131,9; 121,9.

estudiantes <- c(140.6, 133.3, 142.4, 86.4, 129.9, 110.8, 133.2, 129.1, 142.5,
                    150.2, 141.6, 111.0, 127.2, 137.9, 131.9, 121.9)
n <- length(estudiantes)
g_libertad <- n - 1
alfa <- 0.05

Se usa un nivel de significancia del 5%, puesto que no es necesaria una rigurosidad extrema.

a) Enuncia las hipótesis nula y alternativa a contrastar.

H0: la media de los alumnos es igual a 2 horas // mu = mu0

Ha: la media de los alumnos distinta a 2 horas // mu =/= mu0

valor_nulo <- 120 # minutos

b) Analiza si es razonable en este caso considerar que los datos cumplen las condiciones para usaruna prueba t de Student.

No se especificó si los estudiantes realizaron la guia individualmente o en grupos, por lo que no descartaría la posibilidad de que los datos no sean independientes, pero ya que no tenemos más información al respecto y se nos dice que fueron elegidos aleatoriamente, vamos a asumir que son independientes. Se realiza el gráfico Q-Q y la prueba Shapiro-Wilk para comprobar la cercanía a una dist. normal.

g <- ggqqplot(data = data.frame(estudiantes),
                x = "estudiantes",
                color = "steelBlue",
                xlab = "Teórico",
                ylab = "Muestra",
                title = "Q-Q muestra vs d.Normal")
print(g)

normalidad <- shapiro.test(estudiantes)
print(normalidad)
## 
##  Shapiro-Wilk normality test
## 
## data:  estudiantes
## W = 0.88058, p-value = 0.03961

Se puede observar del gráfico que algunos puntos se escapan de la región aceptable, por lo que se aplicó la prueba Shapiro-Wilk, la cual indica que los datos no son lo suficientemente aproximados a la dist. normal con un valor p inferior al nivel de significación. p = 0.03961 < 0.05

c) Independientemente del resultado anterior, aplica la prueba propuesta y obtenga un intervalo deconfianza y un valor p.

t.test(estudiantes,
        alternative = "two.sided",
        mu = valor_nulo,
        conf.level = 1 - alfa)
## 
##  One Sample t-test
## 
## data:  estudiantes
## t = 2.3699, df = 15, p-value = 0.03163
## alternative hypothesis: true mean is not equal to 120
## 95 percent confidence interval:
##  120.9428 137.7947
## sample estimates:
## mean of x 
##  129.3688

d) Usando un nivel de significación adecuado, entrega una conclusión para la cuestión planteada.

Como se mencionó anteriormente, se usó un nivel de significancia de 5%. La prueba T nos indica que la media del tiempo que tardan los estudiantes es distinta a 120 minutos, con un 95% de confianza, ya que el p value que nos entrega es menor a nuestro nivel de significancia. p-value = 0.03163 < 0.05

Referencias

Köhler, J & Jara, L. (desconocido). Lectura 03: inferencia con una y dos muestras. INFERENCIA Y MODELOS ESTADÍSTICOS.