Utilidad de los intervalos de confianza

El intervalo de confianza, ya sea para un valor numérico y una proporción (obtenida de una variable nominal) brinda una noción del posible valor poblacional para esa medición.

La forma general para la obtención de un intervalo de confianza es:

\(X \pm z_{\alpha/2} S\)

X = estimación puntual
S = error estándar

El error estándar depende de la desviación estándar y del tamaño de muestra

Desviación estándar de una proporción

Capítulo 5 de Primer of Biostatistics - Glantz

***

\(\sigma = \sqrt{p(1-p)}\)

p es la proporción de sujetos con un rasgo de interés

\(S_p = \sqrt{\frac{p(1-p)}{n}}\)

La distribución de p es aproximadamente normal con promedio p y desviación \(\sigma_p\)

Área de la distribución normal incluída a distintos valores de \(\sigma\)

qnorm(1-(0.05/2))
## [1] 1.959964
round(qnorm(1-(0.05/2)), 2)
## [1] 1.96

Cálculo del intevalo de confianza para una proporción

\(p \pm 1.96S\)

En una muestra de 708 pacientes con COVID-19 hubo 244 diabéticos.

\(p = 244/708 = 0.3446\)

\(S_p = \sqrt{\frac{(0.3446)*(1-0.3446)}{708}}\)

\(S_p = 0.0178\)

\(IC95\%-p = 0.3446 \pm 1.96*0.0178 = 0.3096-0.3796\)

Intervalo de confianza para la diferencia de proporciones

Capítulo 6 de Statistics from Square One

En caso de querer saber si dos proporciones difieren entre sí una posibilidad es obtener un intervalo de confianza para la diferencia de dos proporciones

Esto es una alternativa a la prueba de \(\chi^2\) para comparar frecuencias de variables cuantitativas entre grupos

Los intervalos de confianza proporcionan magnitudes de efectos o diferencias además de proporcional evidencia para aceptar o rechazar la hipótesis nula

  • ¿Difiere la proporción de pacientes de sexo femenino con apendicitis con respecto a la proporción de pacientes con sexo femenino atendidas por el servicio de cirugía general?

Diferencia \(p_1 - p_2\)

\(SE_{(p_1-p_2)} = \sqrt{\frac{p_1(1-p_1)}{n_1} + \frac{p_2(1-p_2)}{n_2}}\)

Entre 640 pacientes atendidos en el servicio de cirugía general por cualquier causa excepto apendicitis 363 (56.7%) fueron mujeres

De los 120 pacientes con apendicitis 60.8% fueron mujeres

\(0.608 - 0.567 = 0.041\)

\(SE_{(p_1-p_2)} = \sqrt{\frac{0.608(1-0.608)}{120} + \frac{0.567(1-0.567)}{640}}\)

\(SE_{(p_1-p_2)} = \sqrt{\frac{0.2383}{120} + \frac{0.2355}{640}}\)

\(SE_{(p_1-p_2)} = \sqrt{0.001986 + 0.00038} = 0.0487\)

\(IC95\%_{(p_1-p_2)} = 0.041 \pm 1.96(0.0487) = -0.0544 - 0.1365\)

¿Interpretación?


  • En una muestra de 458 pacientes no hipertensos hospitalizados por COVID-19 224 (48.9%) fallecieron. Entre los pacientes hipertensos con COVID-19 (n=246), 138 (56.1%) fallecieron. ¿Difiere la proporción de pacientes fallecidos por COVID-19 entre hipertensos y no hipertensos?

\(0.561 - 0.489 = 0.072\)

\(SE_{(p_1-p_2)} = \sqrt{\frac{0.561(1-0.561)}{246} + \frac{0.489(1-0.489)}{458}}\)

\(SE_{(p_1-p_2)} = \sqrt{\frac{0.246}{246} + \frac{0.25}{458}}\)

\(SE_{(p_1-p_2)} = \sqrt{0.001 + 0.0005} = 0.0393\)

\(IC95\%_{(p_1-p_2)} = 0.071 \pm 1.96(0.0393) = -0.006 - 0.148\)

¿Interpretación?

library(openxlsx)
combi <- loadWorkbook("~/Documentos/HRAEI/bases/covid19_unionMI_eip.xlsx")
combi <- read.xlsx(combi)
names(combi)[grep("^PCR", names(combi))] <- "PCR.COVID"
adultos <- subset(combi, PCR.COVID=="POSITIVO" & (pcr_bin=="POSITIVO" | is.na(pcr_bin)) & EDAD>17 & (egreso_bin=="MEJORÍA" | egreso_bin=="DEFUNCIÓN"))
adultos$egreso_bin <- factor(adultos$egreso_bin, levels = c("MEJORÍA", "DEFUNCIÓN"))
adultos$FECHA.ING.A.MED..INT <- as.Date(adultos$FECHA.ING.A.MED..INT, origin = "1899-12-29")
adultos$SEXO <- factor(adultos$SEXO)
adultos$intub <- factor(adultos$Manejo.via.aerea=="Ventilación mecánica", labels=c("Sin ventilación mecánica", "Ventilación mecánica invasiva"))
adultos$DM <- factor(adultos$DM, levels=c("Sin DT2", "Con DT2"))
adultos$HAS <- factor(adultos$HAS, levels=c("Sin HTA", "Con HTA"))
adultos$sobobes <- cut(adultos$IMC, breaks=c(0, 20, 25, 30, 50), right=TRUE, labels=c("Desnutrido", "Normopeso", "Sobrepeso", "Obesidad"))
adultos$SEXO[is.na(adultos$SEXO)] <- "HOMBRE"
chisq.test(table(adultos$HAS, adultos$egreso_bin), correct = FALSE)
## 
##  Pearson's Chi-squared test
## 
## data:  table(adultos$HAS, adultos$egreso_bin)
## X-squared = 3.3114, df = 1, p-value = 0.0688
prop.test(table(adultos$HAS, adultos$egreso_bin), correct = FALSE)
## 
##  2-sample test for equality of proportions without continuity
##  correction
## 
## data:  table(adultos$HAS, adultos$egreso_bin)
## X-squared = 3.3114, df = 1, p-value = 0.0688
## alternative hypothesis: two.sided
## 95 percent confidence interval:
##  -0.005189969  0.148975249
## sample estimates:
##    prop 1    prop 2 
## 0.5109170 0.4390244