Glantz, Primer of Biostatistics
Se busca evaluar si un tratamiento o un factor de riesgo modifica la frecuencia con la que ocurre un desenlace.
Se determina el nivel de confianza de la prueba o su inverso, el grado de error tipo I (\(\alpha\)) que se está dispuesto a aceptar
Se calcula un estadístico ( z, t, \(\chi^2\), T, entre muchos otros) que cuantifica la diferencia entre lo observado y lo que se espera si la hipótesis nula fuera cierta
Concluimos que hay una diferencia entre los grupos si el valor del estadístico obtenido es mayor o menor a los valores que obtendríamos en \(1-\alpha\) ocasiones bajo la hipótesis nula
No se alcanza a demostrar que haya diferencia entre grupos, diferente a se demuestra que no hay diferencia entre grupos
\(\beta\): probabilidad no rechazar la hipótesis nula cuando es falsa
poder = \(1-\beta\): probabilidad rechazar la hipótesis nula cuando es falsa
Riesgo que estamos dispuestos a tomar al rechazar la hipótesis de diferencia entre los grupos (\(\alpha\))
Tamaño de la diferencia entre grupos que se desea detectar, en particular el cociente del tamaño de la diferencia y la desviación estándar
Tamaño de muestra
Distribución de valores de t de 200 experimentos con 10 sujetos en cada muestra
Distribución de valores de t de 200 experimentos con 10 sujetos en cada muestra bajo la hipótesis nula y bajo un efecto diurético de 200 ml/día con \(\alpha = 0.05\)
Distribución de valores de t de 200 experimentos con 10 sujetos en cada muestra bajo la hipótesis nula y bajo un efecto diurético de 200 ml/día con \(\alpha = 0.01\)
Poder: Área de la hipótesis alterna desde límite de \(\alpha\) en la hipótesis nula hasta cola de la distribución
Calculemos el valor de t crítico para un \(\alpha = 0.05\) bajo la hipótesis nula y el valor de t esperado en caso de un efecto diurético de 200 ml/día.
Grados de libertad \(GL_t=n_1+n_2-2\)
##Valor de t crítico para una prueba de 2 colas con alfa=0.05 con 18 grados de libertad
qt(0.05/2, 18, lower.tail = FALSE)
## [1] 2.100922
##Valor de t crítico para una prueba de 2 colas con alfa=0.01 con 18 grados de libertad
qt(0.01/2, 18, lower.tail = FALSE)
## [1] 2.87844
Bajo un efecto diurético de 200 ml/día y 10 sujetos en cada grupo esperamos —
\(t = \frac{\bar x_{dr} - \bar x_{pla}}{\sqrt{(s^2/n_{dr}) + (s^2/n_{pla})}}\)
\(\sigma=200\)
\(t = \frac{200}{\sqrt{(200^2/10) + (200^2/10)}} = 2.236\)
##valor crítico en hipótesis nula bajo alfa=0.05
qt(0.05/2, 18, lower.tail = FALSE)
## [1] 2.100922
##diferencia entre hipótesis nula y efecto de 200 ml/día bajo alfa=0.05
qt(0.05/2, 18, lower.tail = FALSE) - 2.236
## [1] -0.135078
##poder estadístico con efecto de 200 ml/día y alfa=0.05
pt(-0.135, 18, lower.tail = FALSE)
## [1] 0.552945
##valor crítico en hipótesis nula bajo alfa=0.01
qt(0.01/2, 18, lower.tail = FALSE)
## [1] 2.87844
##diferencia entre hipótesis nula y efecto de 200 ml/día bajo alfa=0.01
qt(0.01/2, 18, lower.tail = FALSE) - 2.236
## [1] 0.6424405
##poder estadístico con efecto de 200 ml/día y alfa=0.05
pt(0.642, 18, lower.tail = FALSE)
## [1] 0.2644827
Distribución de valores de t de 200 experimentos con 10 sujetos en cada muestra bajo la hipótesis nula y bajo un efecto diurético de 200 ml/día con \(\alpha = 0.05\)
Distribución de valores de t de 200 experimentos con 10 sujetos en cada muestra bajo la hipótesis nula y bajo un efecto diurético de 200 ml/día con \(\alpha = 0.01\)
¿Interpretación?
Fijamos \(\alpha = 0.05\)
Distribución de valores de t de 200 experimentos con 10 sujetos en cada muestra bajo la hipótesis nula y bajo un efecto diurético de 200 ml/día
t crítica bajo hipótesis nula con 18 Gl = 2.101 t esperada bajo supuesto de efecto de 100 ml/día = 1.118 t esperada bajo supuesto de efecto de 400 ml/día = 4.472
##valor crítico en hipótesis nula bajo alfa=0.05
qt(0.05/2, 18, lower.tail = FALSE)
## [1] 2.100922
##diferencia entre hipótesis nula y efecto de 100 ml/día bajo alfa=0.05
qt(0.05/2, 18, lower.tail = FALSE) - 1.118
## [1] 0.982922
##poder estadístico con efecto de 200 ml/día y alfa=0.05
pt(0.983, 18, lower.tail = FALSE)
## [1] 0.1693183
##valor crítico en hipótesis nula bajo alfa=0.05
qt(0.05/2, 18, lower.tail = FALSE)
## [1] 2.100922
##diferencia entre hipótesis nula y efecto de 100 ml/día bajo alfa=0.05
qt(0.05/2, 18, lower.tail = FALSE) - 4.472
## [1] -2.371078
##poder estadístico con efecto de 200 ml/día y alfa=0.05
pt(-2.371, 18, lower.tail = FALSE)
## [1] 0.9854472
Fijamos \(\alpha = 0.05\) y efecto en 200 ml/día
Distribución de valores de t de 200 experimentos con 20 sujetos en cada muestra bajo la hipótesis nula y bajo un efecto diurético de 200 ml/día
Bajo un efecto diurético de 200 ml/día y 20 sujetos en cada grupo esperamos —
\(t = \frac{\bar x_{dr} - \bar x_{pla}}{\sqrt{(s^2/n_{dr}) + (s^2/n_{pla})}}\)
\(\sigma=200\)
\(t = \frac{200}{\sqrt{(200^2/20) + (200^2/20)}} = 3.162\)
##valor crítico en hipótesis nula bajo alfa=0.05
qt(0.05/2, 18, lower.tail = FALSE)
## [1] 2.100922
##diferencia entre hipótesis nula, efecto de 200 ml/día y n=10
qt(0.05/2, 18, lower.tail = FALSE) - 2.236
## [1] -0.135078
##poder estadístico con efecto de 200 ml/día y n=10
pt(-0.135, 18, lower.tail = FALSE)
## [1] 0.552945
##valor crítico en hipótesis nula bajo alfa=0.05 y 38 grados de libertad
qt(0.05/2, 38, lower.tail = FALSE)
## [1] 2.024394
##diferencia entre hipótesis nula, efecto de 200 ml/día y n=20
qt(0.05/2, 38, lower.tail = FALSE) - 3.162
## [1] -1.137606
##poder estadístico con efecto de 200 ml/día y n=10
pt(-1.138, 38, lower.tail = FALSE)
## [1] 0.8688776
***
Pasemos a la comparación de variables cualitativas
El poder estadístico para la diferencia de proporciones también se basa en la comparación del valor crítico del estadístico, en este caso z, entre la hipótesis nula y lo que se observaría bajo cierta diferencia de proporciones
z - valor crítico para \(\alpha\) de dos colas = 1.96
Valores de z con los que se abarca el 95% de la distribución normal
qnorm(1-(0.05/2))
## [1] 1.959964
round(qnorm(1-(0.05/2)), 2)
## [1] 1.96
\(z' = \frac{|p_2-p_1|}{s_{p_2-p_1}}\)
\(s_{p_2-p_1} = \sqrt{\frac{p_2(1-p_2)}{n_2} + \frac{p_1(1-p_1)}{n_1}}\)
\(z_{1-\beta(superior)} = z_{\alpha/2}-z´=z_{\alpha/2} - \frac{|p_2-p_1|}{s_{p_2-p_1}}\)
Evolución de recién nacidos con peso extremadamente bajo al nacimiento de acuerdo al método de conservación de temperatura
El estudio no encontró diferencia entre los grupos, ¿qué tanto podemos confiar que la bolsa de polietileno no modifique la mortalidad con una diferencia del 10% aceptando un \(\alpha=0.05\)?
¿Proporción de recién nacidos calentados por método tradicional que fallecieron?
¿Proporción que esperaríamos si la bolsa de polietileno disminuyera la mortalidad 10%?
¿Desviación estándar de la diferencia (\(s_{p_2-p_1}\))?
¿Valor de z esperado?
¿Diferencia entre $z_{/2} y z esperado?
¿Poder estadístico?
t-tests, non-parametric tests, and large studies—a paradox of statistical practice?
Con tamaños de muestra > 200 la prueba de t es robusta a distribuciones sesgadas mientras la de Wilcoxon tiene un aumento en el valor real de \(\alpha\)
Uso de prueba de Wilcoxon especialmente útil en muestas pequeñas (<40) con distribuciones sesgadas
Graficamos poder para detectar diferencia de 200 ml/día de efecto diurético desviación estándar de 200, \(\alpha=0.05\) y distintos tamaños de muestra
tamaños <- c(seq(2,18,2), seq(20,50,5))
tamaños
## [1] 2 4 6 8 10 12 14 16 18 20 25 30 35 40 45 50
poderes <- power.t.test(n=tamaños, delta=200, sd=200)$power
power.t.test(n=tamaños, delta=200, sd=200)$power
## [1] 0.09131778 0.22246334 0.34715648 0.46117590 0.56198462 0.64863435
## [7] 0.72141656 0.78139651 0.83004003 0.86895280 0.93370763 0.96770825
## [13] 0.98475123 0.99298477 0.99684394 0.99860742
plot(tamaños, poderes, type="l")
plot(tamaños, poderes, type="l", xlab="Tamaños de muestra (sujetos por grupo)", ylab="Poder estadístico", lwd=2, col="blue")
abline(v=seq(10, 50, 10), h=seq(0.2, 1, 0.2), col="lightgray")
title(main="Poder estadístico para detectar un efecto diurético\nde 200ml/día con desviación estándar de 200 ml/día\ny un error tipo I del 5% de acuerdo al número de sujetos estudiados")