Buscar y resolver un ejemplo de uso de la prueba z con una cola

En una academia militar un adolescente llamado Francis asegura que el cuerpo humano aguanta 100 “Quacks” por lo que solicita a 30 integrantes del equipo militar que le ayuden a comprobarlo, en el experimento se encontró que solo podían comer en promedio 97 “Quacks”. Se supone que la desviación estándar de la población es de 5 “Quacks” bajo una distribución normal. Con un nivel de significancia de .05 ¿Se acepta la afirmación de Francis?

Referencia: Malcolm in the Middle “El embotellamiento”
muestra=rep(97,30)
x_bar=mean(muestra)
mu=100
sigma=12
n=30


z=z.test(muestra,mu=mu,sigma.x=
sigma,conf.level =
0.95,alternative="less")
z
## 
##  One-sample z-Test
## 
## data:  muestra
## z = -1.3693, p-value = 0.08545
## alternative hypothesis: true mean is less than 100
## 95 percent confidence interval:
##        NA 100.6037
## sample estimates:
## mean of x 
##        97
# ggplot() with dummy data
grafico_densidad = ggplot(data.frame(x = c(-3, 3)), aes(x = x)) + 
  stat_function(fun = dnorm_limit, geom = "area", fill = "blue", alpha = 0.2) +  stat_function(fun = dnorm) +
  xlab("Remuneraciones") + ylab("Densidad") + ggtitle("Función de densidad") + 
  theme_bw() + geom_vline(xintercept = (x_bar-mu)/(sigma/sqrt(n)),cex=1.2,colour ="darkred") + 
  geom_text(aes(x=(x_bar-mu)/(sigma/sqrt(n))+0.2, label="z", y=0.0), colour ="darkred",size=10)

plot(grafico_densidad)

gracias al valor de p-value y a z dentro del intervalo de confianza podemos asegurar por ambos caminos que se acepta la hipotesis de Francis.

Actividad 2: Buscar y resolver un ejemplo de uso de la prueba t con una cola.

En una academia militar un adolescente llamado Francis asegura que el cuerpo humano aguanta 100 “Quacks” por lo que solicita a 30 integrantes del equipo militar que le ayuden a comprobarlo, en el experimento se encontró que solo podían comer en promedio 96 “Quacks”. Se supone que la desviación estándar de la muestra es de 12 “Quacks” . Con un nivel de significancia de .05 ¿Podemos rechazar la afirmación de Francis?

Referencia: Malcolm in the Middle “El embotellamiento”
## 
##  One Sample t-test
## 
## data:  muestra
## t = -4.284, df = 29, p-value = 9.207e-05
## alternative hypothesis: true mean is less than 100
## 95 percent confidence interval:
##      -Inf 95.09085
## sample estimates:
## mean of x 
##  91.86388
# ggplot() with dummy data
grafico_densidad = ggplot(data.frame(x = c(-3, 3)), aes(x = x)) + 
  stat_function(fun = dnorm_limit, geom = "area", fill = "blue", alpha = 0.2) +  stat_function(fun = dnorm) +
  xlab("Remuneraciones") + ylab("Densidad") + ggtitle("Función de densidad") + 
  theme_bw() + geom_vline(xintercept = (x_bar-mu)/(sigma/sqrt(n)),cex=1.2,colour ="darkred") + 
  geom_text(aes(x=(x_bar-mu)/(sigma/sqrt(n))+0.2, label="t", y=0.0), colour ="darkred",size=10)

plot(grafico_densidad)

Tenemos que t esta en el intervalo de confianza por lo que no podemos rechazar la hipotesis de Francis

Actividad 3: Buscar y resolver un ejemplo de uso de la prueba chi para varianza con dos colas.

La St.Louis Metro Bus Company de Estados Unidos, desea dar una imagen de confiabilidad haciendo que sus conductores sean puntuales en los horarios de llegada a las paradas. la empresa desea que haya poca variabilidad en dichos tiempos. En terminos de la varianza de los tiempos de llegada de las paradas, la empresa desea que la varianza sea de 4 minutos o menos. Esta prueba hipotesis se realiza con un nivel de significancia de alpha = 0.05. Asuma que en una muestra aleatoria de 24 llegadas a cierta parada en una interseccion en el centro de la ciudad, la varianza muestral encontrada es 4.9 (FUENTE)

#Datos
sigma2=4
n = 24
s2=4.9


#Normalización
chi = (n-1)*s2/(sigma2)

#Confianza
alfa = 0.05
confianza = 1-alfa

chi_alfa = qchisq(alfa,df = n-1,lower.tail = F) #Lower.tail se relaciona con <= de la hipótesis nula.
chi
## [1] 28.175
chi_alfa
## [1] 35.17246

como 28.175 está dentro del intervalo [35.17246] no podemos rechazar la hipótesis nula

Actividad 5: Buscar/crear y resolver un ejemplo de prueba de hipótesis en una proporción binomial, de una o dos colas.

se obtiene 7 veces un numero par al lanzar el dado 20 veces, ¿se puede rechazar la hipótesis nula de que el lanzamiento del dado es justo?.

X=12
pbar=12/20
p0=0.5
n=20
print(prop.test(X, n, p=0.5, correct=FALSE)) 
## 
##  1-sample proportions test without continuity correction
## 
## data:  X out of n, null probability 0.5
## X-squared = 0.8, df = 1, p-value = 0.3711
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
##  0.3865815 0.7811935
## sample estimates:
##   p 
## 0.6

Gracias al p-value podemos rechazar la hipotesis que el lanzamiento del dado sea justo.

Actividad 6: Buscar/crear y resolver un ejemplo de prueba de hipótesis en el que aplique la prueba del signo.

La compañía steam decide comparar la popularidad de 2 videojuegos por lo que se le hace una encuesta a 200 personas, las respuestas arrojan que 87 personas prefieren el primer videojuego y el resto de personas prefieren el segundo videojuego, ¿ podemos rechazar la hipótesis que ambos videojuegos son igualmente populares?

binom.test(87, 200)
## 
##  Exact binomial test
## 
## data:  87 and 200
## number of successes = 87, number of trials = 200, p-value = 0.07684
## alternative hypothesis: true probability of success is not equal to 0.5
## 95 percent confidence interval:
##  0.3652171 0.5067388
## sample estimates:
## probability of success 
##                  0.435

Sabiendo los resultados NO podemos rechazar la hipótesis que los juegos son igualmente populares.

Actividad 7: Buscar/crear y resolver un ejemplo de prueba de hipótesis en el que aplique la prueba de Wilcoxon para una muestra.

Teniendo una lista de salarios de químicos queremos saber si,la mediana de los salarios difiere de 39000 dolares

data("Chemist")
res = wilcox.test(Chemist$salary, mu = 39000,
conf.int=0.95)
res
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  Chemist$salary
## V = 897.5, p-value = 0.01224
## alternative hypothesis: true location is not equal to 39000
## 95 percent confidence interval:
##  39165 40485
## sample estimates:
## (pseudo)median 
##          39855

con un 95% de confianza podemos rechazar la hipótesis nula y aceptar la hipótesis alternativa dando a entender que la media de salarios difiere de $39000 dolares.