Código 2

1. Introducción

En este análisis, se examina la relación entre el tamaño del efecto 𝑑y la potencia estadística, manteniendo un nivel de significancia 𝛼= 0.05, para diferentes distribuciones del tamaño muestral entre dos grupos 𝑛1 y 𝑛2. Se comparan escenarios en los que los tamaños de los grupos están altamente desequilibrados, así como escenarios más equilibrados, y se examina su efecto en la potencia de la prueba t de Student. El objetivo es estudiar cómo cambia la potencia al variar el nivel de significancia (𝛼) y cómo el tamaño del efecto necesario para alcanzar una potencia aceptable se ve afectado por distribuciones de tamaños de muestra desiguales, en particular cuando 𝑛1=28 y 𝑛2=1406.

2. Metodología

Escenarios de Tamaño de Muestra Se consideran los siguientes tamaños muestrales:

𝑛1=28, 𝑛2=1406: 𝑛1 representa el 2% del tamaño total de la muestra (1434).

𝑛1=144, 𝑛2=1290: 𝑛1 representa el 10% del tamaño total.

𝑛1=287, 𝑛2=1147: 𝑛1 representa el 20% del tamaño total.

𝑛1=430, 𝑛2=1004: 𝑛1 representa el 30% del tamaño total.

𝑛1=574, 𝑛2=860: 𝑛1 representa el 40% del tamaño total.

𝑛1=717, 𝑛2=717: grupos de igual tamaño, lo que se considera óptimo para maximizar la potencia para un tamaño de efecto dado. Para cada escenario, se traza una curva de potencia en función del tamaño del efecto 𝑑, asumiendo una tasa de error Tipo I (𝛼=0.05).

Comparación con Diferentes Niveles de Significancia Se repite el análisis para los siguientes valores de 𝛼

𝛼=0.01 𝛼=0.025 𝛼=0.05 (nivel clásico) 𝛼=0.1 𝛼=0.15

#Gráfica
p<- ggplot(temp3, aes(x = `effect size`, y = power, color = samples)) +
  geom_line(size=1) + 
  
  theme_bw() + 
  theme(axis.text=element_text(size=10), 
        axis.title=element_text(size=10), 
        legend.text=element_text(size=10)) +
  
  geom_vline(xintercept = .54, linetype = 2) +
  geom_hline(yintercept = 0.80, linetype = 2)+
  
  labs(x="Effect size", y="Power") +
  scale_color_discrete(name = "Sampling size") 

# so simple to make interactive plots
plotly::ggplotly(p)

3. Resultados

a. Impacto del Nivel de Significancia

Niveles de significancia más bajos (𝛼=0.01): La potencia disminuye significativamente. Se necesita un tamaño de efecto mucho mayor para alcanzar el 80% de potencia, particularmente en escenarios con tamaños de muestra desequilibrados como 𝑛1=28, 𝑛2=1406. Niveles de significancia más altos (𝛼=0.10, 𝛼=0.15): Con un aumento en𝛼, la potencia se incrementa, permitiendo detectar efectos más pequeños. Sin embargo, esto también aumenta el riesgo de errores Tipo I (falsos positivos).

b. Análisis de los Tamaños de Muestra

𝑛1=28, 𝑛2=1406 Este es el caso más extremo de desequilibrio en los tamaños de muestra. En este escenario:

Tamaño del efecto necesario: El análisis muestra que para alcanzar una potencia aceptable (80%), el tamaño del efecto 𝑑debe ser superior a 0.54. Esto es notablemente mayor que en escenarios más equilibrados, donde el 80% de potencia se alcanza con tamaños de efecto mucho menores.

Resultados para diferentes 𝛼: Con 𝛼=0.01, el tamaño del efecto debe ser aún mayor para alcanzar una potencia del 80%, situándose en torno a 𝑑=0.60. Para niveles de significancia más altos (𝛼=0.10), el tamaño del efecto necesario para alcanzar el 80% de potencia se reduce significativamente, a 𝑑≈0.45.

c. Comparación con Grupos Equilibrados

𝑛1=717, 𝑛2=717: Este escenario equilibrado maximiza la potencia para todos los tamaños de efecto. Incluso con niveles de significancia más bajos (𝛼=0.01), se puede alcanzar una potencia del 80% con un tamaño de efecto más pequeño, en comparación con escenarios desequilibrados. Grupos desequilibrados (𝑛1=28, 𝑛2=1406): Aquí, el desequilibrio extremo perjudica la potencia y requiere un tamaño de efecto considerablemente mayor para alcanzar el umbral del 80%.

4. Conclusiones

El análisis demuestra que el equilibrio en los tamaños de muestra entre los grupos tiene un impacto significativo en la potencia estadística de la prueba t de Student. Los grupos de igual tamaño permiten detectar tamaños de efecto más pequeños con una alta potencia, mientras que los grupos altamente desequilibrados, como 𝑛1=28 y 𝑛2=1406, requieren tamaños de efecto mucho mayores para lograr una potencia aceptable.

Además, el nivel de significancia afecta de manera importante la potencia:

Niveles de significancia más bajos (𝛼=0.01) requieren un tamaño de efecto mayor para alcanzar una potencia del 80%. Niveles de significancia más altos (𝛼=0.10, 𝛼=0.15) facilitan la detección de efectos más pequeños, aunque a costa de aumentar el riesgo de errores Tipo I.