Descripción del Problema 5

“Análisis de Potencia, Tamaño del Efecto y Errores Tipo I y II en una Prueba de Hipótesis para una Sola Población”

Esta actividad propone explorar la relación entre el tamaño muestral, el tamaño del efecto y la potencia estadística mediante simulaciones. Se analizarán diferentes escenarios usando pruebas t para una muestra y se interpretarán los resultados obtenidos.

Caso 1: Variación del Tamaño del Efecto

Simulación y Cálculo de Potencia

n_vals <- c(20,30,40,50,60,70,80,90,100,200,300,400,500,600,700,800)
d_vals <- c(0.2, 0.5, 0.8)
alpha <- 0.001

# Calcular la potencia para cada combinación de tamaño muestral y tamaño del efecto
potencias <- expand.grid(n = n_vals, d = d_vals) %>%
  rowwise() %>%
  mutate(power = power.t.test(n = n, delta = d * 15, sd = 15, sig.level = alpha, type = "one.sample")$power)

Gráfico de Potencia vs Tamaño Muestral

ggplot(potencias, aes(x = n, y = power, color = as.factor(d))) +
  geom_line(size = 1.2) +
  geom_point() +
  scale_color_manual(values = c("blue", "orange", "red")) +
  labs(title = "Potencia en función del Tamaño Muestral",
       x = "Tamaño Muestral",
       y = "Potencia",
       color = "Tamaño del Efecto") +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

# Cargar librerías necesarias
library(ggplot2)

# Parámetros del problema
set.seed(123)
alpha_1 <- 0.001  # Nivel de significancia
sample_sizes <- c(20,30,40,50,60,70,80,90,100,200,300,400,500,600,700,800)
effect_sizes <- c(0.2, 0.5, 0.8)  # Pequeño, mediano y grande

# Calcular potencia para cada combinación de tamaño muestral y efecto
power_results_1 <- expand.grid(n = sample_sizes, d = effect_sizes)
power_results_1$power <- mapply(function(n, d) {
  power.t.test(n = n, delta = d * 15, sd = 15, sig.level = alpha_1, type = "one.sample")$power
}, power_results_1$n, power_results_1$d)

# Graficar los resultados
ggplot(power_results_1, aes(x = n, y = power, color = as.factor(d))) +
  geom_line(size = 1) +
  geom_point() +
  labs(title = "Potencia de la prueba t según tamaño del efecto y muestra",
       x = "Tamaño muestral", y = "Potencia", color = "Tamaño del efecto") +
  theme_minimal()

**Respuestas a las preguntas del Caso 1:

A. Se alcanza el 80% de potencia para un efecto grande (d = 0.8) con un tamaño muestral n ≈ 40-50. B. Para un efecto mediano (d = 0.5), se requiere n ≈ 100-150 para lograr una potencia adecuada. C. Más allá de n = 300, el aumento del tamaño muestral tiene beneficios marginales para un efecto grande.

D. Interpretación del efecto del tamaño en la potencia para cada tamaño del efecto

  • Para un efecto pequeño (d = 0.2): La potencia es baja para tamaños muestrales pequeños.
  • Para un efecto mediano (d = 0.5):Se logra una potencia aceptable (~80%) con aproximadamente n = 100-150.
  • Para un efecto grande (d = 0.8): Se logra una potencia del 80% con n ≈ 40-50.

Por tanto cuanto mayor sea el tamaño del efecto, menor tamaño muestral se necesita para alcanzar una potencia adecuada.

Caso 2: Variación del Tamaño de Muestra

Cálculo de Potencia para Diferentes Valores de Alpha

alphas <- c(0.01, 0.05, 0.10)
potencias_alpha <- expand.grid(n = n_vals, d = d_vals, alpha = alphas) %>%
  rowwise() %>%
  mutate(power = power.t.test(n = n, delta = d * 15, sd = 15, sig.level = alpha, type = "one.sample")$power)

Gráfico de Potencia vs Tamaño del Efecto

ggplot(potencias_alpha, aes(x = d, y = power, color = as.factor(n))) +
  geom_line(size = 1.2) +
  geom_point() +
  facet_wrap(~alpha, scales = "free_y") +
  labs(title = "Potencia en función del Tamaño del Efecto",
       x = "Tamaño del Efecto",
       y = "Potencia",
       color = "Tamaño Muestral") +
  theme_minimal()

# Parámetros para el Caso 2
alpha_2 <- 0.05  # Nivel de significancia
effect_sizes_2 <- seq(0.1, 1.0, by = 0.1)  # Diferentes tamaños del efecto

# Calcular potencia para cada combinación de tamaño de muestra y efecto
power_results_2 <- expand.grid(d = effect_sizes_2, n = sample_sizes)
power_results_2$power <- mapply(function(n, d) {
  power.t.test(n = n, delta = d * 15, sd = 15, sig.level = alpha_2, type = "one.sample")$power
}, power_results_2$n, power_results_2$d)

# Graficar los resultados
ggplot(power_results_2, aes(x = d, y = power, color = as.factor(n))) +
  geom_line(size = 1) +
  geom_point() +
  labs(title = "Potencia de la prueba t según tamaño del efecto y muestra",
       x = "Tamaño del efecto", y = "Potencia", color = "Tamaño muestral") +
  theme_minimal()

** Respuestas a las preguntas del Caso 2**

  1. La potencia aumenta a medida que el tamaño del efecto crece.
  2. Aumentar el tamaño muestral incrementa la potencia, pero con rendimientos decrecientes más allá de n = 300-400.
  3. Comparando los niveles α = 0.01 y α = 0.10, un α más bajo (0.01) requiere muestras mayores para la misma potencia, mientras que un α más alto (0.10) facilita rechazar la hipótesis nula con menos datos, aunque con mayor riesgo de error Tipo I.
  4. En un contexto médico, un α = 0.01 es más adecuado para minimizar falsos positivos.