En este estudio de caso sobre cálculo de tamaño de muestra se plantea la necesidad de determinar el coeficiente de correlación existente entre dos variables numéricas: Recuento de eosinófilos/µL y la puntuación al COPD Assessment Test en pacientes con Enfermedad Pulmonar Obstructiva Crónica (EPOC).
Por tanto, la pregunta de investigación que guía el cálculo de muestra es:
¿Existe una asociación entre el Recuento de eosinófilos/µL y la puntuación al COPD Assessment Test en pacientes con Enfermedad Pulmonar Obstructiva Crónica (EPOC)?
La fórmula para calcular el tamaño de muestra necesario para estimar un coeficiente de correlación (r) con un poder estadístico específico y un nivel de significancia determinado, para una prueba de hipótesis de dos colas, es según Machin et al. (2018):
\[ n = \left( \frac{Z_{\alpha/2} + Z_{\beta}}{0.5 \cdot \ln\left(\frac{1+r}{1-r}\right)} \right)^2 + 3 \]
Donde:
Esta fórmula se basa en la transformación de Fisher para el coeficiente de correlación, que estabiliza la varianza del coeficiente de correlación para facilitar los cálculos del tamaño de muestra.
Se sustituyen los valores específicos proporcionados en la fórmula:
La fórmula se convierte en:
\[ n = \left( \frac{1.96 + 0.84}{0.5 \cdot \ln\left(\frac{1 + 0.3}{1 - 0.3}\right)} \right)^2 + 3 \]
# Valores dados
r <- 0.3
z_alpha_2 <- 1.96 # Valor crítico para un nivel de confianza del 95%
z_beta <- 0.84 # Valor crítico para un poder del 80%
# Cálculo del tamaño de muestra usando la fórmula
numerador <- (z_alpha_2 + z_beta) ^ 2
denominador <- (0.5 * log((1 + r) / (1 - r))) ^ 2
n <- numerador / denominador + 3
n
## [1] 84.83512
log_transformado <- log((1 + r) / (1 - r))
log_transformado
## [1] 0.6190392
multiplicacion <- 0.5 * log_transformado
multiplicacion
## [1] 0.3095196
suma_z <- z_alpha_2 + z_beta
suma_z
## [1] 2.8
division <- suma_z / multiplicacion
division
## [1] 9.046277
cuadrado <- division^2
cuadrado
## [1] 81.83512
n_final <- cuadrado + 3
n_final
## [1] 84.83512
Por lo tanto, el tamaño de muestra n es aproximadamente 85 cuando se redondea al número entero más cercano.
Se requieren 85 pacientes con EPOC, seleccionados al azar, a quienes se les realizará una evaluación simultánea de recuento de eosinófilos/µL y puntuación al COPD Assessment Test.
Se utiliza una prueba de hipótesis de una cola cuando la hipótesis alternativa está interesada en una sola dirección (por ejemplo, si se considera que ambas variables se relacionan de forma directa, se espera que el coeficiente de correlación sea mayor que cero, y por tanto, no se espera que este sea menor o igual que cero).
A continuación se calculará el tamaño de muestra requerido para estimar un coeficiente de correlación hipotético (r=0.30) con una prueba de una cola, manteniendo el nivel de confianza del 95% y el poder del 80%.
Para una prueba de una cola, la fórmula del tamaño de muestra es similar, pero se usa el valor crítico \(Z_{\alpha}\) en lugar de \(Z_{\alpha/2}\):
\[ n = \left( \frac{Z_{\alpha} + Z_{\beta}}{0.5 \cdot \ln\left(\frac{1+r}{1-r}\right)} \right)^2 + 3 \]
Usando los valores:
La fórmula se convierte en:
\[ n = \left( \frac{1.645 + 0.84}{0.5 \cdot \ln\left(\frac{1 + 0.3}{1 - 0.3}\right)} \right)^2 + 3 \]
# Valores para prueba de una cola
z_alpha_one_tail <- 1.645
# Cálculo del tamaño de muestra para una cola
numerador_one_tail <- (z_alpha_one_tail + z_beta) ^ 2
n_one_tail <- numerador_one_tail / denominador + 3
n_one_tail
## [1] 67.45795
Por lo tanto, el tamaño de muestra n para una prueba de una cola es aproximadamente 67 pacientes cuando se redondea al número entero más cercano; un tamaño menor, que el requerido para una prueba de dos colas.
Estos cálculos pueden ser realizados en el paquete pwr (Champely 2006), con algunas pequeñas variaciones en el resultado con las siguientes sintaxis:
library(pwr)
# Para prueba de hipótesis de dos colas
two_tail <- pwr.r.test(r = 0.3, sig.level = 0.05, power = 0.80, alternative = "two.sided")
print(two_tail)
##
## approximate correlation power calculation (arctangh transformation)
##
## n = 84.07364
## r = 0.3
## sig.level = 0.05
## power = 0.8
## alternative = two.sided
# Para prueba de hipótesis de una cola
one_tail <- pwr.r.test(r = 0.3, sig.level = 0.05, power = 0.80, alternative = "greater")
print(one_tail)
##
## approximate correlation power calculation (arctangh transformation)
##
## n = 66.55463
## r = 0.3
## sig.level = 0.05
## power = 0.8
## alternative = greater
Machin et al. (2018) afirma que pueden usarse los valores sugeridos para𝜌de 0.1, 0.3 y 0.5 son considerados como efectos “pequeños,” “medianos,” y “grandes” en epidemiología, aunque para trabajos de laboratorio, se pueden anticipar valores mucho mayores.
Para ejemplificar el cálculo con prueba de hipótesis de una cola se consideró un valor de𝜌> 1 como hipótesis alternativa, puesto que se esperaba que la relación entre las variables del ejemplo tenían una relación directa.