Supongamos que tenemos una población de estudiantes y queremos determinar si la altura promedio de los estudiantes en una muestra particular es significativamente mayor que la altura promedio de la población general
Se trabaja con 30 estudiantes aleatorios con altura promedio 175cm en la muestra y un promedio de 170cm en la población con una desviación estándar de 5cm.
set.seed(30)
estudiantes = rnorm(30, mean=175, sd = 5)
media_p = 170
ds = 5
z.test(estudiantes, mu=media_p, sigma.x=ds, alternative="greater", conf.level = .95)
##
## One-sample z-Test
##
## data: estudiantes
## z = 3.6672, p-value = 0.0001226
## alternative hypothesis: true mean is greater than 170
## 95 percent confidence interval:
## 171.8461 NA
## sample estimates:
## mean of x
## 173.3477
con un intervalo de confianza del 95% se acepta la hipotesis alternativa, que nos indica que la media es mayor a 170cm.
Supongamos que tenemos una muestra de 25 estudiantes y queremos determinar si la media de sus calificaciones en un examen es significativamente mayor que 75 puntos (media poblacional). Para ello, utilizaremos la prueba t de una cola.
muestra_calificaciones <- rnorm(25, mean = 78, sd = 10)
t.test(muestra_calificaciones, alternative = "greater", mu = 75, conf.level = 0.95)
##
## One Sample t-test
##
## data: muestra_calificaciones
## t = 0.46308, df = 24, p-value = 0.3237
## alternative hypothesis: true mean is greater than 75
## 95 percent confidence interval:
## 71.99856 Inf
## sample estimates:
## mean of x
## 76.11387
con un intervalo de confianza del 95% se acepta la hipotesis alternativa que nos indica que la media es mayor a 75 puntos.
muestra_grupo1 <- rnorm(30, mean = 80, sd = 10)
muestra_grupo2 <- rnorm(25, mean = 85, sd = 15)
var.test(muestra_grupo1, muestra_grupo2, conf.level = 0.95)
##
## F test to compare two variances
##
## data: muestra_grupo1 and muestra_grupo2
## F = 0.64536, num df = 29, denom df = 24, p-value = 0.2597
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.2910385 1.3901121
## sample estimates:
## ratio of variances
## 0.6453613
con un intervalo de confianza del 95% se acepta la hipotesis alternativa que nos indica que las varianzas no son iguales.
El objetivo será probar si la distribución de las especies de flores en el conjunto de datos sigue una distribución teórica que esperamos en función de una proporción específica que estableceremos.
data("iris")
distribucion_teorica <- c(0.4, 0.3, 0.3)
conteo_especies = table(iris$Species)
chisq.test(conteo_especies, p = distribucion_teorica)
##
## Chi-squared test for given probabilities
##
## data: conteo_especies
## X-squared = 2.7778, df = 2, p-value = 0.2494
como el p-value es mayor a 0.05 lo que indica un 95% de intervalo de confianza, se acepta la hipotesis nula que nos indica que no hay suficiente evidencia para afirmar que las especies de flores no siguen la distribución teórica esperada.
Supongamos que queremos probar si la proporción de éxitos (éxito = 1, fracaso = 0) en una muestra de estudiantes que aprobaron un examen es significativamente diferente del 70%.
muestra_binomial = rbinom(100, size = 1, prob = 0.7)
prop.test(sum(muestra_binomial), length(muestra_binomial), p = 0.7, alternative = "two.sided", conf.level = 0.95)
##
## 1-sample proportions test with continuity correction
##
## data: sum(muestra_binomial) out of length(muestra_binomial), null probability 0.7
## X-squared = 0.011905, df = 1, p-value = 0.9131
## alternative hypothesis: true p is not equal to 0.7
## 95 percent confidence interval:
## 0.6093752 0.7942336
## sample estimates:
## p
## 0.71
como el p-value es mayor a 0.05 se acepta la hipotesis nula, la que indica que no tenemos suficiente evidencia para afirmar que la proporción es diferente de la proporción teórica del 70%
Supongamos que tenemos dos conjuntos de datos antes y después de aplicar un programa de entrenamiento a un grupo de personas para mejorar su rendimiento físico. Queremos determinar si el programa de entrenamiento tuvo un impacto significativo en el rendimiento de las personas.
antes_entrenamiento <- c(10, 12, 8, 14, 9, 11, 13, 7, 15, 12)
despues_entrenamiento <- c(12, 15, 11, 18, 13, 14, 16, 10, 17, 15)
diferencias = despues_entrenamiento - antes_entrenamiento
SIGN.test(diferencias, mu = 0, alternative = "two.sided", conf.level = 0.95)
##
## One-sample Sign-Test
##
## data: diferencias
## s = 10, p-value = 0.001953
## alternative hypothesis: true median is not equal to 0
## 95 percent confidence interval:
## 2.324444 3.675556
## sample estimates:
## median of x
## 3
##
## Achieved and Interpolated Confidence Intervals:
##
## Conf.Level L.E.pt U.E.pt
## Lower Achieved CI 0.8906 3.0000 3.0000
## Interpolated CI 0.9500 2.3244 3.6756
## Upper Achieved CI 0.9785 2.0000 4.0000
como el p-value es menor a al valor de significancia (0.05) se rechaza la hipotesis nula obteniendo que hay evidencia suficiente para afirmar que el programa de entrenamiento tuvo un impacto significativo en el rendimiento físico de las personas.
Supongamos que tenemos una muestra de 15 estudiantes y queremos probar si el tiempo promedio que tardan en completar un examen es igual a 30 minutos.
tiempo_examen <- c(25, 30, 28, 32, 29, 31, 27, 30, 31, 33, 29, 30, 28, 32, 30)
wilcox.test(tiempo_examen, mu = 30, alternative = "two.sided")
## Warning in wilcox.test.default(tiempo_examen, mu = 30, alternative =
## "two.sided"): cannot compute exact p-value with ties
## Warning in wilcox.test.default(tiempo_examen, mu = 30, alternative =
## "two.sided"): cannot compute exact p-value with zeroes
##
## Wilcoxon signed rank test with continuity correction
##
## data: tiempo_examen
## V = 27.5, p-value = 0.6533
## alternative hypothesis: true location is not equal to 30
con un valor de significancia de 0.05 se acepta la hipotesis nula que indica que no tenemos suficiente evidencia para afirmar que el tiempo promedio es diferente de 30 minutos.