Informe 5 Caso 1: Variando los tamaños de los efectos (d)

problema 5 caso 1: Variando los tamaños de los efectos (d)

En los códigos del archivo llamado caso1.R, para cada tamaño fijo de los efectos d, se modela la relación entre el tamaño muestral y la potencia (manteniendo constante el nivel de significancia α=0.05). En las figuras se visualizan los resultados para tamaño de efecto muy pequeño (d=0.1), pequeño (d=0.2), mediano (d=0.5) y grande (d=0.8). Repite el análisis usando 5 valores distintos del nivel de significancia. ¿Cambian los resultados? ¿Qué ocurre cuando el tamaño de muestra de los grupos que se comparan es de 20, 60 , 100 y 140? Analiza y compara los resultados.

paso 1: Definición de parámetros

effect_sizes <- c(0.1, 0.2, 0.5, 0.8) # Tamaños del efecto: muy pequeño, pequeño, mediano y grande
sample_sizes <- c(20, 60, 100, 140)   # Tamaños de muestra
alpha_levels <- c(0.01, 0.025, 0.05, 0.10, 0.15) # Niveles de significancia

Se han definido cuatro tamaños del efecto:

Muy pequeño (d = 0.1) Pequeño (d = 0.2) Mediano (d = 0.5) Grande (d = 0.8)

El tamaño del efecto (d) es una medida de la magnitud de la diferencia entre dos grupos. Cuanto mayor es el tamaño del efecto, más fácil es detectarlo. Por lo tanto, se espera que a medida que aumente 𝑑, la potencia también aumente, dado un tamaño de muestra constante. En estudios reales, los efectos grandes son raros, y los efectos pequeños son más comunes, lo que significa que se necesita un tamaño de muestra mayor para detectarlos con la misma potencia.

Los tamaños de muestra considerados son n=20, n=60, n=100, y n=140, este es uno de los factores más críticos que afectan la potencia de una prueba estadística. Muestras más grandes proporcionan una mayor precisión y una mayor capacidad para detectar efectos pequeños. En general, se espera que la potencia aumente con el tamaño de la muestra, permitiendo una mayor probabilidad de rechazar la hipótesis nula si existe un verdadero efecto.

Ademas se prueban cinco niveles de significancia: α=0.01, α=0.025, α=0.05, α=0.10, y α=0.15.El α es la probabilidad de cometer un error de tipo I (rechazar la hipótesis nula cuando es verdadera). Un α más bajo (más estricto) reduce esta probabilidad, pero también disminuye la potencia. Al contrario, un α más alto (menos estricto) aumenta la potencia pero también la posibilidad de cometer un error de tipo I. El análisis muestra cómo la potencia varía con diferentes niveles de α, lo que es fundamental para equilibrar el riesgo de errores estadísticos y la capacidad de detectar un efecto.

paso 2: Cálculo de la potencia

results <- expand.grid(d = effect_sizes, n = sample_sizes, alpha = alpha_levels)
results$power <- NA

for (i in 1:nrow(results)) {
  res <- pwr.t.test(d = results$d[i], n = results$n[i], sig.level = results$alpha[i], type = "two.sample")
  results$power[i] <- res$power
}

print(results)

##      d   n alpha      power
## 1  0.1  20 0.010 0.01350839
## 2  0.2  20 0.010 0.02513156
## 3  0.5  20 0.010 0.14395508
## 4  0.8  20 0.010 0.43797260
## 5  0.1  60 0.010 0.02180466
## 6  0.2  60 0.010 0.06749459
## 7  0.5  60 0.010 0.54945334
## 8  0.8  60 0.010 0.95941915
## 9  0.1 100 0.010 0.03094690
## 10 0.2 100 0.010 0.12034615
## 11 0.5 100 0.010 0.82382249
## 12 0.8 100 0.010 0.99879065
## 13 0.1 140 0.010 0.04089447
## 14 0.2 140 0.010 0.18076972
## 15 0.5 140 0.010 0.94322683
## 16 0.8 140 0.010 0.99997722
## 17 0.1  20 0.025 0.03189431
## 18 0.2  20 0.025 0.05376191
## 19 0.5  20 0.025 0.23825190
## 20 0.8  20 0.025 0.58104981
## 21 0.1  60 0.025 0.04730442
## 22 0.2  60 0.025 0.12395969
## 23 0.5  60 0.025 0.68011116
## 24 0.8  60 0.025 0.98184398
## 25 0.1 100 0.025 0.06355008
## 26 0.2 100 0.025 0.20166877
## 27 0.5 100 0.025 0.89825058
## 28 0.8 100 0.025 0.99963669
## 29 0.1 140 0.025 0.08054416
## 30 0.2 140 0.025 0.28247671
## 31 0.5 140 0.025 0.97275660
## 32 0.8 140 0.025 0.99999510
## 33 0.1  20 0.050 0.06095912
## 34 0.2  20 0.050 0.09456733
## 35 0.5  20 0.050 0.33793903
## 36 0.8  20 0.050 0.69340420
## 37 0.1  60 0.050 0.08444035
## 38 0.2  60 0.050 0.19237465
## 39 0.5  60 0.050 0.77526589
## 40 0.8  60 0.050 0.99148114
## 41 0.1 100 0.050 0.10837184
## 42 0.2 100 0.050 0.29064587
## 43 0.5 100 0.050 0.94042720
## 44 0.8 100 0.050 0.99987838
## 45 0.1 140 0.050 0.13264737
## 46 0.2 140 0.050 0.38512417
## 47 0.5 140 0.050 0.98640721
## 48 0.8 140 0.050 0.99999876
## 49 0.1  20 0.100 0.11632725
## 50 0.2  20 0.100 0.16472928
## 51 0.5  20 0.100 0.46406530
## 52 0.8  20 0.100 0.79942625
## 53 0.1  60 0.100 0.14989019
## 54 0.2  60 0.100 0.29234051
## 55 0.5  60 0.100 0.85949024
## 56 0.8  60 0.100 0.99665226
## 57 0.1 100 0.100 0.18296555
## 58 0.2 100 0.100 0.40804897
## 59 0.5 100 0.100 0.96984801
## 60 0.8 100 0.100 0.99996732
## 61 0.1 140 0.100 0.21548307
## 62 0.2 140 0.100 0.51019013
## 63 0.5 140 0.100 0.99426817
## 64 0.8 140 0.100 0.99999976
## 65 0.1  20 0.150 0.16967584
## 66 0.2  20 0.150 0.22687425
## 67 0.5  20 0.150 0.54908911
## 68 0.8  20 0.150 0.85442599
## 69 0.1  60 0.150 0.20918436
## 70 0.2  60 0.150 0.36928271
## 71 0.5  60 0.150 0.90097004
## 72 0.8  60 0.150 0.99826590
## 73 0.1 100 0.150 0.24737543
## 74 0.2 100 0.150 0.49060948
## 75 0.5 100 0.150 0.98154365
## 76 0.8 100 0.150 0.99998680
## 77 0.1 140 0.150 0.28424260
## 78 0.2 140 0.150 0.59214983
## 79 0.5 140 0.150 0.99688999
## 80 0.8 140 0.150 0.99999992

Utilizando el paquete pwr en R, se calculan las potencias para cada combinación de tamaño del efecto, tamaño de muestra y nivel de significancia.

Los resultados muestran claramente que:Para efectos muy pequeños (d=0.1), la potencia es baja incluso con tamaños de muestra más grandes y niveles de α más altos. Esto refleja la dificultad de detectar diferencias mínimas, lo cual es común en estudios de gran precisión.A medida que el tamaño del efecto aumenta (d=0.2,0.5,0.8), la potencia incrementa considerablemente. Para efectos medianos y grandes, incluso tamaños de muestra moderados (n=60) pueden alcanzar potencias cercanas al 80% o más, especialmente con α más altos.La relación entre α y la potencia es evidente: al incrementar α, la potencia aumenta para todos los tamaños de efecto y muestras. Sin embargo, esto también incrementa la posibilidad de errores de tipo I, lo que podría no ser aceptable en ciertos contextos, como estudios clínicos.

ggplot(results, aes(x = n, y = power, color = factor(alpha), group = factor(alpha))) +
  geom_line() +
  geom_point() +
  facet_wrap(~ d, labeller = labeller(d = c(`0.1` = "Muy pequeño (d = 0.1)", 
                                            `0.2` = "Pequeño (d = 0.2)", 
                                            `0.5` = "Mediano (d = 0.5)", 
                                            `0.8` = "Grande (d = 0.8)"))) +
  labs(title = "Relación entre el tamaño muestral, la potencia y los niveles de significancia",
       x = "Tamaño de muestra (n)", y = "Potencia", color = "Nivel de significancia (α)") +
  theme_minimal()

Las gráficas muestran tendencias claras:

Para tamaños de muestra pequeños (n=20), la potencia es insuficiente para todos los tamaños de efecto, excepto para d=0.8 con α más alto, lo que implica un riesgo significativo de no detectar efectos reales en estudios con muestras pequeñas.

Al incrementar el tamaño de la muestra a n=60, n=100, y n=140, la potencia aumenta, particularmente para efectos medianos y grandes, lo que es consistente con las expectativas teóricas.

Comparación de los niveles de α: niveles más altos de α resultan en mayores potencias para cualquier tamaño de muestra, pero conllevan un mayor riesgo de rechazar la hipótesis nula incorrectamente.

Conclusiones:

*Relación entre el tamaño del efecto y la potencia: Como se esperaba, efectos más grandes son más fáciles de detectar, incluso con tamaños de muestra pequeños.

*Importancia del tamaño de la muestra: Muestras más grandes proporcionan una mayor potencia, lo que es crucial para detectar efectos pequeños. Sin embargo, en estudios con recursos limitados, esto puede no ser viable.

*Equilibrio entre α y la potencia: Un α más alto incrementa la potencia pero también el riesgo de errores de tipo I, lo cual debe ser cuidadosamente balanceado según el contexto del estudio.

*Este análisis demuestra la importancia de planificar adecuadamente un estudio para garantizar que la potencia sea suficiente para detectar efectos significativos, considerando las limitaciones y los riesgos asociados con diferentes niveles de α y tamaños de muestra.

Informe 5 Caso 1: Variando los tamaños de los efectos (d)

juliana zarate jimenez y Luisa Torres Betran

2024-09-14