Introducción

En este estudio de caso sobre cálculo de tamaño de muestra se plantea la necesidad de determinar el coeficiente de correlación existente entre dos variables numéricas: Recuento de eosinófilos/µL y la puntuación al COPD Assessment Test en pacientes con Enfermedad Pulmonar Obstructiva Crónica (EPOC).

Por tanto, la pregunta de investigación que guía el cálculo de muestra es:

¿Existe una asociación entre el Recuento de eosinófilos/µL y la puntuación al COPD Assessment Test en pacientes con Enfermedad Pulmonar Obstructiva Crónica (EPOC)?

Información / elementos requeridos para el cálculo

Fórmula del tamaño de muestra

La fórmula para calcular el tamaño de muestra necesario para estimar un coeficiente de correlación (r) con un poder estadístico específico y un nivel de significancia determinado, para una prueba de hipótesis de dos colas, es según Machin et al. (2018):

\[ n = \left( \frac{Z_{\alpha/2} + Z_{\beta}}{0.5 \cdot \ln\left(\frac{1+r}{1-r}\right)} \right)^2 + 3 \]

Donde:

Esta fórmula se basa en la transformación de Fisher para el coeficiente de correlación, que estabiliza la varianza del coeficiente de correlación para facilitar los cálculos del tamaño de muestra.

Sustitución de valores

Se sustituyen los valores específicos proporcionados en la fórmula:

La fórmula se convierte en:

\[ n = \left( \frac{1.96 + 0.84}{0.5 \cdot \ln\left(\frac{1 + 0.3}{1 - 0.3}\right)} \right)^2 + 3 \]

Cálculo paso a paso en R

# Valores dados
r <- 0.3
z_alpha_2 <- 1.96  # Valor crítico para un nivel de confianza del 95%
z_beta <- 0.84     # Valor crítico para un poder del 80%

# Cálculo del tamaño de muestra usando la fórmula
numerador <- (z_alpha_2 + z_beta) ^ 2
denominador <- (0.5 * log((1 + r) / (1 - r))) ^ 2
n <- numerador / denominador + 3

n
## [1] 84.83512
  1. Cálculo del logaritmo natural transformado:
log_transformado <- log((1 + r) / (1 - r))
log_transformado
## [1] 0.6190392
  1. Multiplicación por 0.5:
multiplicacion <- 0.5 * log_transformado
multiplicacion
## [1] 0.3095196
  1. Suma de Z_{/2} y Z_{}:
suma_z <- z_alpha_2 + z_beta
suma_z
## [1] 2.8
  1. División de los valores:
division <- suma_z / multiplicacion
division
## [1] 9.046277
  1. Cuadrado del resultado:
cuadrado <- division^2
cuadrado
## [1] 81.83512
  1. Adición final de 3:
n_final <- cuadrado + 3
n_final
## [1] 84.83512

Por lo tanto, el tamaño de muestra n es aproximadamente 85 cuando se redondea al número entero más cercano.

Se requieren 85 pacientes con EPOC, seleccionados al azar, a quienes se les realizará una evaluación simultánea de recuento de eosinófilos/µL y puntuación al COPD Assessment Test.

¿Qué sucede si se desea trabajar con una prueba de hipótesis de una cola?

Se utiliza una prueba de hipótesis de una cola cuando la hipótesis alternativa está interesada en una sola dirección (por ejemplo, si se considera que ambas variables se relacionan de forma directa, se espera que el coeficiente de correlación sea mayor que cero, y por tanto, no se espera que este sea menor o igual que cero).

A continuación se calculará el tamaño de muestra requerido para estimar un coeficiente de correlación hipotético (r=0.30) con una prueba de una cola, manteniendo el nivel de confianza del 95% y el poder del 80%.

Fórmula para prueba de una cola

Para una prueba de una cola, la fórmula del tamaño de muestra es similar, pero se usa el valor crítico \(Z_{\alpha}\) en lugar de \(Z_{\alpha/2}\):

\[ n = \left( \frac{Z_{\alpha} + Z_{\beta}}{0.5 \cdot \ln\left(\frac{1+r}{1-r}\right)} \right)^2 + 3 \]

Cálculo del tamaño de muestra

Usando los valores:

  • r = 0.3
  • Z_{} = 1.645 (para un nivel de confianza del 95% en una prueba de una cola)
  • Z_{} = 0.84 (para un poder del 80%)

La fórmula se convierte en:

\[ n = \left( \frac{1.645 + 0.84}{0.5 \cdot \ln\left(\frac{1 + 0.3}{1 - 0.3}\right)} \right)^2 + 3 \]

Código para el cálculo de prueba de una cola en R

# Valores para prueba de una cola
z_alpha_one_tail <- 1.645

# Cálculo del tamaño de muestra para una cola
numerador_one_tail <- (z_alpha_one_tail + z_beta) ^ 2
n_one_tail <- numerador_one_tail / denominador + 3

n_one_tail
## [1] 67.45795

Por lo tanto, el tamaño de muestra n para una prueba de una cola es aproximadamente 67 pacientes cuando se redondea al número entero más cercano; un tamaño menor, que el requerido para una prueba de dos colas.

Cálculo con el paquete pwr

Estos cálculos pueden ser realizados en el paquete pwr (Champely 2006), con algunas pequeñas variaciones en el resultado con las siguientes sintaxis:

library(pwr)

# Para prueba de hipótesis de dos colas

two_tail <- pwr.r.test(r = 0.3, sig.level = 0.05, power = 0.80, alternative = "two.sided")
print(two_tail)
## 
##      approximate correlation power calculation (arctangh transformation) 
## 
##               n = 84.07364
##               r = 0.3
##       sig.level = 0.05
##           power = 0.8
##     alternative = two.sided
# Para prueba de hipótesis de una cola

one_tail <- pwr.r.test(r = 0.3, sig.level = 0.05, power = 0.80, alternative = "greater")
print(one_tail)
## 
##      approximate correlation power calculation (arctangh transformation) 
## 
##               n = 66.55463
##               r = 0.3
##       sig.level = 0.05
##           power = 0.8
##     alternative = greater

Notas

Machin et al. (2018) afirma que pueden usarse los valores sugeridos para𝜌de 0.1, 0.3 y 0.5 son considerados como efectos “pequeños,” “medianos,” y “grandes” en epidemiología, aunque para trabajos de laboratorio, se pueden anticipar valores mucho mayores.

Para ejemplificar el cálculo con prueba de hipótesis de una cola se consideró un valor de𝜌> 1 como hipótesis alternativa, puesto que se esperaba que la relación entre las variables del ejemplo tenían una relación directa.

Referencias

Champely, Stephane. 2006. pwr: Basic Functions for Power Analysis.” Comprehensive R Archive Network. https://doi.org/10.32614/CRAN.package.pwr.
Machin, David, Michael Cambpell, Say Tan, and Sze Tan. 2018. Sample Sizes for Clinical, Laboratory and Epidemiology Studies. 4th ed. Oxford: John Wiley & Sons Ltd.