# Datos
grupo_A <- c(70, 75, 80, 85, 90, 95)
grupo_B <- c(85, 87, 89, 91, 93, 95)
# Media y varianza
media_A <- mean(grupo_A)
media_B <- mean(grupo_B)
var_A <- var(grupo_A)
var_B <- var(grupo_B)
# Prueba de Fisher
f_value <- var_A / var_B
f_value
## [1] 6.25
# Graficar los boxplots para comparar varianzas
boxplot(grupo_A, grupo_B, names = c("Grupo A", "Grupo B"),
main = "Comparación de varianzas", col = c("lightblue", "lightgreen"))
Como𝐹=7 es mayor que el valor crítico, rechazamos la hipótesis nula de
que las varianzas son iguales. Esto significa que las varianzas no son
iguales, por lo que usaremos la prueba t, que no asume varianzas
iguales.
# Intervalo de confianza para la diferencia de medias con 95% y 99%
n_A <- length(grupo_A)
n_B <- length(grupo_B)
se_A <- sqrt(var_A / n_A)
se_B <- sqrt(var_B / n_B)
# Error estándar combinado
se_combined <- sqrt(se_A^2 + se_B^2)
# Diferencia de medias
diff_media <- media_A - media_B
# Valor t para 95% y 99% de confianza
t_95 <- qt(0.975, df = n_A + n_B - 2)
t_99 <- qt(0.995, df = n_A + n_B - 2)
# Intervalos de confianza
IC_95 <- diff_media + c(-1, 1) * t_95 * se_combined
IC_99 <- diff_media + c(-1, 1) * t_99 * se_combined
IC_95
## [1] -16.664307 1.664307
IC_99
## [1] -20.535179 5.535179
Cuando aumentamos el nivel de confianza de 95% a 99%, el intervalo de confianza se amplía, lo que significa que la estimación de la diferencia de medias será menos precisa (el intervalo será más ancho), pero más confiable. Es decir, la probabilidad de que el verdadero valor de la diferencia de medias se encuentre dentro del intervalo es mayor, pero la estimación es menos precisa.
# Datos del piloto
media_estudio <- 15
sd_estudio <- 4
n_estudio <- 25
# Valor t para 95% de confianza
t_val <- qt(0.975, df = n_estudio - 1)
# Error estándar
se_estudio <- sd_estudio / sqrt(n_estudio)
# Intervalo de confianza
IC_estudio <- media_estudio + c(-1, 1) * t_val * se_estudio
IC_estudio
## [1] 13.34888 16.65112
El intervalo de confianza del 95% para el tiempo promedio de estudio semanal es [13.35, 16.65] horas.
# Tamaño de muestra con margen de error de 1 hora
margen_error_1 <- 1
n_muestra_1 <- (t_val * sd_estudio / margen_error_1)^2
n_muestra_1
## [1] 68.15484
El tamaño de muestra necesario es aproximadamente 69 estudiantes.
# Tamaño de muestra con margen de error de 0.5 horas
margen_error_05 <- 0.5
n_muestra_05 <- (t_val * sd_estudio / margen_error_05)^2
n_muestra_05
## [1] 272.6193
El tamaño de muestra necesario es aproximadamente 273 estudiantes. Cuando el margen de error se reduce, el tamaño de la muestra aumenta considerablemente. Esto indica que a medida que buscamos mayor precisión (menor margen de error), necesitamos un tamaño de muestra más grande