Glantz, Primer of Biostatistics

Pasos de la prueba de hipótesis

Se busca evaluar si un tratamiento o un factor de riesgo modifica la frecuencia con la que ocurre un desenlace.

Interpretación de valores de \(p > \alpha\)

No se alcanza a demostrar que haya diferencia entre grupos, diferente a se demuestra que no hay diferencia entre grupos

\(\beta\): probabilidad no rechazar la hipótesis nula cuando es falsa

poder = \(1-\beta\): probabilidad rechazar la hipótesis nula cuando es falsa

Factores que determinan el poder estadístico

Distribución de valores de t de 200 experimentos con 10 sujetos en cada muestra

Probabilidad de error tipo I o \(\alpha\)

Distribución de valores de t de 200 experimentos con 10 sujetos en cada muestra bajo la hipótesis nula y bajo un efecto diurético de 200 ml/día con \(\alpha = 0.05\)

Distribución de valores de t de 200 experimentos con 10 sujetos en cada muestra bajo la hipótesis nula y bajo un efecto diurético de 200 ml/día con \(\alpha = 0.01\)

Poder: Área de la hipótesis alterna desde límite de \(\alpha\) en la hipótesis nula hasta cola de la distribución

Calculemos el valor de t crítico para un \(\alpha = 0.05\) bajo la hipótesis nula y el valor de t esperado en caso de un efecto diurético de 200 ml/día.

Grados de libertad \(GL_t=n_1+n_2-2\)

##Valor de t crítico para una prueba de 2 colas con alfa=0.05 con 18 grados de libertad
qt(0.05/2, 18, lower.tail = FALSE)
## [1] 2.100922
##Valor de t crítico para una prueba de 2 colas con alfa=0.01 con 18 grados de libertad
qt(0.01/2, 18, lower.tail = FALSE)
## [1] 2.87844

Bajo un efecto diurético de 200 ml/día y 10 sujetos en cada grupo esperamos —

\(t = \frac{\bar x_{dr} - \bar x_{pla}}{\sqrt{(s^2/n_{dr}) + (s^2/n_{pla})}}\)

\(\sigma=200\)

\(t = \frac{200}{\sqrt{(200^2/10) + (200^2/10)}} = 2.236\)

##valor crítico en hipótesis nula bajo alfa=0.05
qt(0.05/2, 18, lower.tail = FALSE)
## [1] 2.100922
##diferencia entre hipótesis nula y efecto de 200 ml/día bajo alfa=0.05
qt(0.05/2, 18, lower.tail = FALSE) - 2.236
## [1] -0.135078
##poder estadístico con efecto de 200 ml/día y alfa=0.05
pt(-0.135, 18, lower.tail = FALSE)
## [1] 0.552945
##valor crítico en hipótesis nula bajo alfa=0.01
qt(0.01/2, 18, lower.tail = FALSE)
## [1] 2.87844
##diferencia entre hipótesis nula y efecto de 200 ml/día bajo alfa=0.01
qt(0.01/2, 18, lower.tail = FALSE) - 2.236
## [1] 0.6424405
##poder estadístico con efecto de 200 ml/día y alfa=0.05
pt(0.642, 18, lower.tail = FALSE)
## [1] 0.2644827

Distribución de valores de t de 200 experimentos con 10 sujetos en cada muestra bajo la hipótesis nula y bajo un efecto diurético de 200 ml/día con \(\alpha = 0.05\)

Distribución de valores de t de 200 experimentos con 10 sujetos en cada muestra bajo la hipótesis nula y bajo un efecto diurético de 200 ml/día con \(\alpha = 0.01\)

¿Interpretación?


Tamaño de la diferencia entre los grupos

Fijamos \(\alpha = 0.05\)

Distribución de valores de t de 200 experimentos con 10 sujetos en cada muestra bajo la hipótesis nula y bajo un efecto diurético de 200 ml/día

Distribución de valores de t de 200 experimentos con 10 sujetos en cada muestra bajo un efecto diurético de 100 y 400 ml/día t crítica bajo hipótesis nula con 18 Gl = 2.101 t esperada bajo supuesto de efecto de 100 ml/día = 1.118 t esperada bajo supuesto de efecto de 400 ml/día = 4.472

##valor crítico en hipótesis nula bajo alfa=0.05
qt(0.05/2, 18, lower.tail = FALSE)
## [1] 2.100922
##diferencia entre hipótesis nula y efecto de 100 ml/día bajo alfa=0.05
qt(0.05/2, 18, lower.tail = FALSE) - 1.118
## [1] 0.982922
##poder estadístico con efecto de 200 ml/día y alfa=0.05
pt(0.983, 18, lower.tail = FALSE)
## [1] 0.1693183
##valor crítico en hipótesis nula bajo alfa=0.05
qt(0.05/2, 18, lower.tail = FALSE)
## [1] 2.100922
##diferencia entre hipótesis nula y efecto de 100 ml/día bajo alfa=0.05
qt(0.05/2, 18, lower.tail = FALSE) - 4.472
## [1] -2.371078
##poder estadístico con efecto de 200 ml/día y alfa=0.05
pt(-2.371, 18, lower.tail = FALSE)
## [1] 0.9854472

Tamaño de muestra

Fijamos \(\alpha = 0.05\) y efecto en 200 ml/día

Distribución de valores de t de 200 experimentos con 20 sujetos en cada muestra bajo la hipótesis nula y bajo un efecto diurético de 200 ml/día

Bajo un efecto diurético de 200 ml/día y 20 sujetos en cada grupo esperamos —

\(t = \frac{\bar x_{dr} - \bar x_{pla}}{\sqrt{(s^2/n_{dr}) + (s^2/n_{pla})}}\)

\(\sigma=200\)

\(t = \frac{200}{\sqrt{(200^2/20) + (200^2/20)}} = 3.162\)

##valor crítico en hipótesis nula bajo alfa=0.05
qt(0.05/2, 18, lower.tail = FALSE)
## [1] 2.100922
##diferencia entre hipótesis nula, efecto de 200 ml/día y n=10
qt(0.05/2, 18, lower.tail = FALSE) - 2.236
## [1] -0.135078
##poder estadístico con efecto de 200 ml/día y n=10
pt(-0.135, 18, lower.tail = FALSE)
## [1] 0.552945
##valor crítico en hipótesis nula bajo alfa=0.05 y 38 grados de libertad
qt(0.05/2, 38, lower.tail = FALSE)
## [1] 2.024394
##diferencia entre hipótesis nula, efecto de 200 ml/día y n=20
qt(0.05/2, 38, lower.tail = FALSE) - 3.162
## [1] -1.137606
##poder estadístico con efecto de 200 ml/día y n=10
pt(-1.138, 38, lower.tail = FALSE)
## [1] 0.8688776

Relación entre tamaño de muestra y poder estadístico bajo el supuesto de un efecto diurético de 200 ml/día y aceptando una probabilidad de error tipo I de 0.05 ***

Poder estadístico para diferencia de proporciones

Pasemos a la comparación de variables cualitativas

El poder estadístico para la diferencia de proporciones también se basa en la comparación del valor crítico del estadístico, en este caso z, entre la hipótesis nula y lo que se observaría bajo cierta diferencia de proporciones

z - valor crítico para \(\alpha\) de dos colas = 1.96

Valores de z con los que se abarca el 95% de la distribución normal

qnorm(1-(0.05/2))
## [1] 1.959964
round(qnorm(1-(0.05/2)), 2)
## [1] 1.96

\(z' = \frac{|p_2-p_1|}{s_{p_2-p_1}}\)

\(s_{p_2-p_1} = \sqrt{\frac{p_2(1-p_2)}{n_2} + \frac{p_1(1-p_1)}{n_1}}\)

\(z_{1-\beta(superior)} = z_{\alpha/2}-z´=z_{\alpha/2} - \frac{|p_2-p_1|}{s_{p_2-p_1}}\)

Evolución de recién nacidos con peso extremadamente bajo al nacimiento de acuerdo al método de conservación de temperatura

El estudio no encontró diferencia entre los grupos, ¿qué tanto podemos confiar que la bolsa de polietileno no modifique la mortalidad con una diferencia del 10% aceptando un \(\alpha=0.05\)?

¿Proporción de recién nacidos calentados por método tradicional que fallecieron?

¿Proporción que esperaríamos si la bolsa de polietileno disminuyera la mortalidad 10%?

¿Desviación estándar de la diferencia (\(s_{p_2-p_1}\))?

¿Valor de z esperado?

¿Diferencia entre $z_{/2} y z esperado?

¿Poder estadístico?


Uso de prueba de t vs. prueba de Wilcoxon (Mann-Whitney)

t-tests, non-parametric tests, and large studies—a paradox of statistical practice?

Con tamaños de muestra > 200 la prueba de t es robusta a distribuciones sesgadas mientras la de Wilcoxon tiene un aumento en el valor real de \(\alpha\)

Uso de prueba de Wilcoxon especialmente útil en muestas pequeñas (<40) con distribuciones sesgadas

Gráfica de poder estadístico para prueba de t

Graficamos poder para detectar diferencia de 200 ml/día de efecto diurético desviación estándar de 200, \(\alpha=0.05\) y distintos tamaños de muestra

tamaños <- c(seq(2,18,2), seq(20,50,5))
tamaños
##  [1]  2  4  6  8 10 12 14 16 18 20 25 30 35 40 45 50
poderes <- power.t.test(n=tamaños, delta=200, sd=200)$power
power.t.test(n=tamaños, delta=200, sd=200)$power
##  [1] 0.09131778 0.22246334 0.34715648 0.46117590 0.56198462 0.64863435
##  [7] 0.72141656 0.78139651 0.83004003 0.86895280 0.93370763 0.96770825
## [13] 0.98475123 0.99298477 0.99684394 0.99860742
plot(tamaños, poderes, type="l")

plot(tamaños, poderes, type="l", xlab="Tamaños de muestra (sujetos por grupo)", ylab="Poder estadístico", lwd=2, col="blue")
abline(v=seq(10, 50, 10), h=seq(0.2, 1, 0.2), col="lightgray")
title(main="Poder estadístico para detectar un efecto diurético\nde 200ml/día con desviación estándar de 200 ml/día\ny un error tipo I del 5% de acuerdo al número de sujetos estudiados")