La investigación sobre los factores asociados al riesgo de muerte por COVID-19 en México ha despertado un gran interés debido a la gravedad de esta enfermedad y su impacto en la población. La Secretaría de Salud, a través del Sistema de Vigilancia Epidemiológica, desarrolló un exhaustivo registro de datos para llevar a cabo un análisis detallado de los casos reportados en las unidades médicas pertenecientes al Sector Salud. Este esfuerzo permitió estudiar la progresión de la enfermedad desde el momento del ingreso hasta el desenlace, ya fuera el alta médica o el fallecimiento del paciente.
La estructura temporal de los datos es especialmente valiosa, ya que permite analizar el impacto de los factores de riesgo de forma retrospectiva, asegurando que estos ocurren antes del desenlace. Esto proporciona una base sólida para hablar de causalidad, dado que los factores de riesgo influyen de manera previa y directa en la evolución de los pacientes, estableciendo grupos de comparación basados en la causa y el efecto.
El análisis se centra en una base de datos que abarca casos positivos de COVID-19 que requirieron hospitalización desde el inicio de la pandemia en México, comenzando con el primer paciente registrado el 27 de febrero de 2020 y extendiéndose hasta el corte del 7 de febrero de 2022. Este período incluye múltiples oleadas de la pandemia, lo que proporciona una perspectiva amplia y enriquecedora para el estudio de tendencias y patrones.
Entre los principales factores que se evalúan por su contribución al riesgo de mortalidad se encuentran características demográficas como la edad y el sexo, así como diversas comorbilidades y condiciones clínicas que pueden agravar el estado de los pacientes. Entre estas se incluyen:
El propósito de este análisis es identificar qué factores tienen un impacto más significativo en la probabilidad de muerte, proporcionando información valiosa para el diseño de estrategias de prevención, tratamiento y manejo clínico. Además, este enfoque puede ayudar a optimizar la asignación de recursos médicos y dirigir esfuerzos hacia los grupos más vulnerables. El conocimiento derivado de este estudio podría ser crucial para mitigar los efectos de futuras pandemias en México y otros países.
####### PAQUETERIAS ########
library(readxl)
library(ggplot2)
library(DescTools)
library(polycor)
####### DATOS ########
setwd("C:/Users/bryan/OneDrive/Documentos/MMOP_II/Diplomado/Mod_4/contingencia")
datos <- read_excel("covid19_hospitalizados.xlsx")
data <- na.omit(datos)
El enfoque del análisis se centrará en las variables de hipertensión, obesidad y tabaquismo, ya que estas condiciones representan factores modificables que, mediante intervenciones específicas y cambios en los hábitos de vida, pueden influir positivamente en la prevención de casos graves y mortalidad por COVID-19. Estas tres condiciones están vinculadas directamente con estilos de vida y decisiones personales, lo que las convierte en objetivos prioritarios para campañas de sensibilización y prevención.
La hipertensión, por ejemplo, aunque es común en la población, puede controlarse con ajustes en la dieta, el ejercicio regular y el manejo adecuado del estrés. Estas acciones no solo ayudan a reducir el riesgo cardiovascular, sino que también fortalecen el organismo para enfrentar infecciones como el COVID-19.
La obesidad, otro factor relevante, afecta a un amplio sector de la población y se asocia con una inflamación crónica que empeora las respuestas inmunitarias. Combatir la obesidad implica adoptar una alimentación equilibrada y saludable, incrementar la actividad física y educar sobre el impacto de los alimentos ultraprocesados en la salud. Es un cambio gradual que puede mejorar significativamente la calidad de vida y reducir la vulnerabilidad frente a enfermedades graves.
El tabaquismo, por su parte, constituye un desafío tanto individual como social. El consumo de tabaco daña los pulmones y compromete la capacidad respiratoria, aumentando el riesgo de complicaciones severas en infecciones respiratorias como el COVID-19. Los esfuerzos para reducir el tabaquismo incluyen programas para dejar de fumar, apoyo psicológico, y políticas públicas que limitan la promoción y accesibilidad del tabaco.
Por estas razones, el análisis de estas variables no solo ayuda a entender su relación con la mortalidad por COVID-19, sino que también destaca la importancia de trabajar en la prevención desde un enfoque comunitario y de salud pública. Al abordar estas condiciones y promover hábitos saludables, se puede reducir significativamente el impacto de futuras pandemias y mejorar la resistencia frente a otras enfermedades. Este estudio tiene el potencial de servir como base para desarrollar estrategias efectivas que prioricen la prevención y la concientización en México.
# Calcular porcentajes para cada condición
ht <- prop.table(table(data$ht)) * 100
ob <- prop.table(table(data$ob)) * 100
tab <- prop.table(table(data$tab)) * 100
# Crear un dataframe con los valores "sí" y "no"
cond <- data.frame(
Factor = rep(c("Hipertensión", "Obesidad", "Tabaquismo"), each = 2),
Respuesta = rep(c("No", "Sí"), 3),
Porcentaje = c(ht["no"], ht["si"], ob["no"], ob["si"], tab["no"], tab["si"])
)
# Graficar los porcentajes de "sí" y "no" por factor
ggplot(cond, aes(x = Factor, y = Porcentaje, fill = Respuesta)) +
geom_bar(stat = "identity") +
geom_text(aes(label = sprintf("%.1f%%", Porcentaje)),
position = position_stack(vjust = 0.5), size = 4, color = "white") +
labs(x = "Factores", y = "Porcentaje", fill = "Respuesta") +
ggtitle("Porcentajes de incidencia por condición") +
scale_fill_manual(values = c("steelblue", "tomato")) +
theme_minimal()
El análisis de los factores de riesgo para los casos evaluados muestra lo siguiente:
Estos resultados destacan cómo la prevalencia de cada factor varía dentro de los casos analizados.
Se pretende llevar a cabo un estudio para determinar si condiciones como la hipertensión, la obesidad y el tabaquismo tienen un impacto significativo en la mortalidad de pacientes afectados por COVID-19. Estas variables, consideradas como factores de riesgo potencialmente modificables, revisten especial interés debido a su relación con hábitos de vida que pueden ser sujetos de intervención preventiva.
A través de este estudio, se busca no solo identificar la relación entre estas condiciones y la mortalidad por COVID-19, sino también destacar la importancia de adoptar hábitos saludables. Esto permitiría reducir significativamente los riesgos asociados y mejorar la resistencia de la población frente a futuras pandemias u otras enfermedades graves. Los resultados obtenidos podrían tener un impacto considerable en las estrategias de salud pública, promoviendo políticas basadas en la prevención y la promoción de estilos de vida saludables.
data$muerte <- factor(data$muerte, level = c('no', 'si'),
labels = c('No muerte', 'Muerte'))
data$ht <- factor(data$ht, level = c('no', 'si'),
labels = c('Sin hipertension', 'Con hipertension'))
data$ob <- factor(data$ob, level = c('no', 'si'),
labels = c('Sin obesidad', 'Con obesidad'))
data$tab <- factor(data$tab, level = c('no', 'si'),
labels = c('No fumador', 'Fumador'))
mh <- table(data$muerte,data$ht)
mh
Sin hipertension Con hipertension
No muerte 249716 111048
Muerte 157194 126613
mhp <- prop.table(mh, margin=2) * 100
mhp
Sin hipertension Con hipertension
No muerte 61.36885 46.72538
Muerte 38.63115 53.27462
# Gráfico de barras
barplot_heights <- barplot(
mhp,
beside = TRUE,
legend.text = rownames(mhp),
ylim = c(0, 100),
ylab = "Porcentaje"
)
# Etiquetas de porcentaje dentro de las barras
text(
x = barplot_heights,
y = mhp + 5,
labels = sprintf("%.1f%%", mhp),
cex = 0.8,
col = "black"
)
Se observa una notable diferencia en la mortalidad al comparar a las personas con hipertensión y aquellas que no presentan esta condición. En el grupo de individuos sin hipertensión, el porcentaje de muertes es considerablemente menor, representando un 38.6%. En contraste, entre las personas que padecen hipertensión, el porcentaje de mortalidad se eleva significativamente hasta un 53.3%.
Con el propósito de evaluar si existe una relación significativa entre la hipertensión y la mortalidad en pacientes diagnosticados con COVID-19, se emplean análisis estadísticos basados en pruebas de independencia.
mh <- t(mh)
mh
No muerte Muerte
Sin hipertension 249716 157194
Con hipertension 111048 126613
jicuad <- chisq.test(mh, correct = FALSE)
jicuad
Pearson's Chi-squared test
data: mh
X-squared = 13055, df = 1, p-value < 2.2e-16
GTest(mh)
Log likelihood ratio (G-test) test of independence without correction
data: mh
G = 13033, X-squared df = 1, p-value < 2.2e-16
Tanto la prueba de Ji-Cuadrada de Pearson como la prueba de Máxima Verosimilitud arrojan un p-valor inferior a 2.2e-16, lo que lleva a rechazar contundentemente la hipótesis nula de que la mortalidad por COVID-19 es independiente de la hipertensión en los pacientes. Esto indica una asociación estadísticamente significativa entre la hipertensión y la mortalidad, lo que resalta su papel como un factor de riesgo importante en los desenlaces clínicos de la enfermedad.
Dado que las pruebas paramétricas como estas tienen el supuesto de frecuencias esperadas mayores a 5 en cada celda de la tabla de contingencia, es fundamental reportar tanto las frecuencias esperadas para validar el cumplimiento de este requisito. Este detalle garantiza la validez y la fiabilidad de los resultados estadísticos obtenidos.
De igual manera, se muestran los residuales estandarizados, indicando la magnitud y dirección de la desviación entre los valores observados y los esperados bajo la hipótesis de independencia.
jicuad$observed
No muerte Muerte
Sin hipertension 249716 157194
Con hipertension 111048 126613
round(jicuad$expected, 1)
No muerte Muerte
Sin hipertension 227746 179164
Con hipertension 133018 104643
round(jicuad$stdres, 1)
No muerte Muerte
Sin hipertension 114.3 -114.3
Con hipertension -114.3 114.3
mosaicplot(mh, shade = T, main = "Muerte segun padecimiento de hipertensión")
Es evidente que los valores esperados en cada celda de la tabla de contingencia cumplen con el criterio estadístico de ser superiores a 5, lo cual asegura la validez de los resultados obtenidos mediante las pruebas aplicadas.
En el grupo de pacientes sin hipertensión, en la categoría “No muerte”, el residual estandarizado es 114.3, lo que indica una sobrerrepresentación significativa de pacientes sin hipertensión que sobreviven. En la categoría “Muerte”, el residual estandarizado es -114.3, señalando una subrepresentación marcada de pacientes sin hipertensión que fallecen.
En el grupo con hipertensión, en la categoría “No muerte”, el residual estandarizado es -114.3, reflejando una subrepresentación significativa de pacientes con hipertensión que sobreviven. En la categoría “Muerte”, el residual estandarizado es 114.3, mostrando una sobrerrepresentación de pacientes hipertensos que fallecen.
mo <- table(data$muerte,data$ob)
mo
Sin obesidad Con obesidad
No muerte 293214 67550
Muerte 224213 59594
mop <- prop.table(mo, margin=2) * 100
mop
Sin obesidad Con obesidad
No muerte 56.66770 53.12874
Muerte 43.33230 46.87126
# Gráfico de barras
barplot_heights <- barplot(
mop,
beside = TRUE,
legend.text = rownames(mop),
ylim = c(0, 100),
ylab = "Porcentaje"
)
# Etiquetas de porcentaje dentro de las barras
text(
x = barplot_heights,
y = mop + 5,
labels = sprintf("%.1f%%", mop),
cex = 0.8,
col = "black"
)
Se observa una pequeña diferencia en la mortalidad al comparar a las personas sin obesidad y aquellas que presentan esta condición. En el grupo de individuos “Sin obesidad”, el porcentaje de muertes es considerablemente menor, representando un 43.33%, mientras que el porcentaje de supervivencia alcanza el 56.67%. En contraste, entre las personas “Con obesidad”, el porcentaje de mortalidad aumenta un poco, alcanzando un 46.87%, mientras que la supervivencia disminuye al 53.13%.
Con el propósito de evaluar si existe una relación significativa entre la obesidad y la mortalidad en pacientes diagnosticados con COVID-19, se emplean análisis estadísticos basados en pruebas de independencia.
mo <- t(mo)
mo
No muerte Muerte
Sin obesidad 293214 224213
Con obesidad 67550 59594
jicuadob <- chisq.test(mo, correct = FALSE)
jicuadob
Pearson's Chi-squared test
data: mo
X-squared = 518.71, df = 1, p-value < 2.2e-16
fisherob <- fisher.test(mo)
fisherob
Fisher's Exact Test for Count Data
data: mo
p-value < 2.2e-16
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
1.139619 1.168028
sample estimates:
odds ratio
1.153718
La prueba de Ji-Cuadrada de Pearson indica que existe una asociación significativa entre la obesidad y la mortalidad por COVID-19. El p-valor extremadamente pequeño muestra que es muy poco probable que esta relación ocurra por azar.
La prueba exacta de Fisher apoya lo anterior, pues el p-value < 2.2e-16, confirmando la asociación significativa entre obesidad y mortalidad. El Odds Ratio indica que los pacientes con obesidad tienen un riesgo de muerte mayor en comparación con los pacientes sin obesidad.
De igual manera que en el caso anterior, se reportan las observaciones esperadas para garantizar la validez y confiabilidad de los resultados obtenidos. Además, los residuales estandarizados complementan el análisis al reflejar la magnitud y dirección de las desviaciones entre los valores observados y los esperados, proporcionando mayor profundidad en la interpretación estadística.
jicuadob$observed
No muerte Muerte
Sin obesidad 293214 224213
Con obesidad 67550 59594
round(jicuadob$expected, 1)
No muerte Muerte
Sin obesidad 289602 227825
Con obesidad 71162 55982
round(jicuadob$stdres, 1)
No muerte Muerte
Sin obesidad 22.8 -22.8
Con obesidad -22.8 22.8
mosaicplot(mo, shade = T, main = "Muerte segun padecimiento de obesidad")
Queda claro que los valores esperados en cada celda de la tabla de contingencia satisfacen el requisito estadístico de ser mayores a 5, lo que garantiza la solidez y la confiabilidad de los resultados obtenidos a través de las pruebas realizadas.
Los residuales estandarizados muestran desviaciones significativas en los resultados observados frente a los esperados, lo que sugiere una relación importante entre la obesidad y la mortalidad. En particular, las personas sin obesidad presentan una tendencia a sobrevivir más de lo esperado y a fallecer menos de lo esperado, mientas que las personas con obesidad tienen un mayor número de fallecimientos y una menor cantidad de sobrevivientes de lo esperado.
mtb <- table(data$muerte,data$tab)
mtb
No fumador Fumador
No muerte 335616 25148
Muerte 262461 21346
mtbp <- prop.table(mtb, margin=2) * 100
mtbp
No fumador Fumador
No muerte 56.11585 54.08870
Muerte 43.88415 45.91130
# Gráfico de barras
barplot_heights <- barplot(
mtbp,
beside = TRUE,
legend.text = rownames(mtbp),
ylim = c(0, 100),
ylab = "Porcentaje"
)
# Etiquetas de porcentaje dentro de las barras
text(
x = barplot_heights,
y = mtbp + 5,
labels = sprintf("%.1f%%", mtbp),
cex = 0.8,
col = "black"
)
Se observa una pequeña diferencia en la mortalidad al comparar a las personas no fumadoras y aquellas que sí tienen el hábito de fumar. En el grupo de individuos “No fumador”, el porcentaje de muertes es ligeramente menor, representando un 43.88%, mientras que el porcentaje de supervivencia alcanza el 56.12%. En contraste, entre las personas “Fumadoras”, el porcentaje de mortalidad muestra un leve aumento, alcanzando un 45.91%, mientras que la supervivencia disminuye al 54.09%.
Con el propósito de evaluar si existe una relación significativa entre el tabaquismo y la mortalidad en pacientes diagnosticados con COVID-19, se emplean análisis estadísticos basados en pruebas de independencia.
mtb <- t(mtb)
mtb
No muerte Muerte
No fumador 335616 262461
Fumador 25148 21346
jicuadtb <- chisq.test(mtb, correct = FALSE)
jicuadtb
Pearson's Chi-squared test
data: mtb
X-squared = 71.937, df = 1, p-value < 2.2e-16
# Tasas de riesgo
p1 <- mtb[2, 2] / sum(mtb[2, ])
p2 <- mtb[1, 2] / sum(mtb[1, ])
cat("P(Muerte|Fumador) =", p1, "\n",
"P(Muerte|No fumador) =", p2, "\n")
P(Muerte|Fumador) = 0.459113
P(Muerte|No fumador) = 0.4388415
# Riesgo relativo
RR <- p1 / p2
# Prueba de hipotesis
EE_RR <- sqrt(((1-p1)/mtb[2, 2])+((1-p2)/mtb[1, 2]))
# Definir el valor de Z_c
Zc_RR <- log(RR) / EE_RR
# Calcular el p-valor para un test bilateral (dos colas)
p_value_RR <- 2 * (1 - pnorm(abs(Zc_RR)))
# Intervalo de confianza
CI_lower <- RR * exp(-1.96 * EE_RR)
CI_upper <- RR * exp(1.96 * EE_RR)
cat( "\nRiesgo Relativo (RR):", RR, "\n",
"Estadístico Zc para el RR:", Zc_RR, "\t",
"p-valor:", ifelse(p_value_RR < 2.2e-16, "p-value < 2.2e-16", p_value_RR), "\n",
"Intervalo de confianza del RR (95%):", CI_lower, "-", CI_upper, "\n")
Riesgo Relativo (RR): 1.046193
Estadístico Zc para el RR: 8.614901 p-valor: p-value < 2.2e-16
Intervalo de confianza del RR (95%): 1.0355 - 1.056997
# Calcular el Riesgo Atribuible (RA)
RA <- p1 - p2
# Calcular el Error Estándar (EE) del RA
n1 <- sum(mtb[2, ]) # Total de fumadores
n2 <- sum(mtb[1, ]) # Total de no fumadores
EE_RA <- sqrt((p1 * (1 - p1) / n1) + (p2 * (1 - p2) / n2))
# Estadístico Z para el RA
Zc_RA <- RA / EE_RA
# P-valor bilateral
p_value_RA <- 2 * (1 - pnorm(abs(Zc_RA)))
# Intervalo de Confianza (95%) para el RA
CI_lower_RA <- RA - 1.96 * EE_RA
CI_upper_RA <- RA + 1.96 * EE_RA
cat("\nRiesgo Atribuible (RA):", RA, "\n",
"Estadístico Zc para el RA:", Zc_RA, "\t",
"p-valor:", ifelse(p_value_RA < 2.2e-16, "p-value < 2.2e-16", p_value_RA), "\n",
"Intervalo de Confianza del RA (95%):", CI_lower_RA, "-", CI_upper_RA, "\n")
Riesgo Atribuible (RA): 0.02027152
Estadístico Zc para el RA: 8.451724 p-valor: p-value < 2.2e-16
Intervalo de Confianza del RA (95%): 0.01557044 - 0.02497259
# Datos de la tabla de contingencia
a <- as.numeric(mtb[2,2]) # Muertes fumadores
b <- as.numeric(mtb[2,1]) # No muertes fumadores
c <- as.numeric(mtb[1,2]) # Muertes no fumadores
d <- as.numeric(mtb[1,1]) # No muertes no fumadores
# Calcular la Razón de Momios (OR)
OR <- (a * d) / (b * c)
# Calcular el Error Estándar (EE) del log(OR)
EE_OR <- sqrt((1 / a) + (1 / b) + (1 / c) + (1 / d))
# Prueba de hipótesis (estadístico Zc)
Zc <- log(OR) / EE_OR
p_value_OR <- 2 * (1 - pnorm(abs(Zc))) # P-valor bilateral
# Intervalo de confianza para OR
CI_lower_OR <- OR * exp(-1.96 * EE_OR)
CI_upper_OR <- OR * exp(1.96 * EE_OR)
cat("\nRazón de Momios (OR):", OR, "\n",
"Estadístico Zc:", Zc, "\t",
"p-valor:", ifelse(p_value_OR < 2.2e-16, "p-value < 2.2e-16", p_value_OR), "\n",
"Intervalo de Confianza del OR (95%):", CI_lower_OR, "-", CI_upper_OR, "\n")
Razón de Momios (OR): 1.085403
Estadístico Zc: 8.479655 p-valor: p-value < 2.2e-16
Intervalo de Confianza del OR (95%): 1.065036 - 1.106159
La prueba de Chi-cuadrada arrojó un p-valor menor a 2.2e-16, lo que confirma la existencia de una asociación estadísticamente significativa entre el tabaquismo y la mortalidad.
La probabilidad de muerte entre los fumadores es mayor que en los no fumadores.
El riesgo relativo (RR) calculado es de 1.046, indicando que los fumadores tienen un riesgo de mortalidad 4.6% mayor en comparación con los no fumadores, y esto es respaldado por un intervalo de confianza del 95% que oscila entre 1.0355 y 1.056997, demostrando que el riesgo relativo es consistentemente mayor a 1. Además, el estadístico Zc para el RR fue de 8.615, con un p-valor menor a 2.2e-16, lo que reafirma la significancia estadística de este hallazgo.
El riesgo atribuible (RA) es de 0.0203, lo que implica que aproximadamente el 2.03% de las muertes en fumadores pueden atribuirse al tabaquismo. Este resultado es estadísticamente significativo, con un Zc de 8.452 y un p-valor menor a 2.2e-16, y su intervalo de confianza del 95% está comprendido entre 0.01557 y 0.02497.
Por otro lado, la razón de momios (OR) se calculó en 1.085, indicando que los momios de morir son un 8.5% mayores en fumadores que en no fumadores. Este resultado está respaldado por un intervalo de confianza del 95%, que varía entre 1.065 y 1.106, y por un estadístico Zc de 8.48 con un p-valor menor a 2.2e-16.
Estos análisis confirman que, aunque la relación entre el tabaquismo y la mortalidad por COVID-19 es estadísticamente significativa, el impacto en términos absolutos es modesto pero consistente. Estos hallazgos subrayan la importancia de considerar el tabaquismo como un factor de riesgo, aunque su efecto no es abrumador.
En base a los resultados obtenidos, las conclusiones generales destacan lo siguiente:
Hipertensión: Las pruebas de Ji-cuadrada de Pearson y Máxima Verosimilitud rechazan contundentemente la hipótesis nula de independencia entre hipertensión y mortalidad por COVID-19, con p-valores inferiores a 2.2e-16. Esto confirma que la hipertensión es un factor de riesgo significativo, asociándose con un mayor número de desenlaces fatales en los pacientes. La validación de las frecuencias esperadas respalda la solidez de los resultados estadísticos.
Obesidad: Tanto la prueba de Ji-cuadrada como la prueba exacta de Fisher rechazan la hipótesis de independencia, mostrando p-valores extremadamente pequeños (<2.2e-16). Los pacientes con obesidad presentan un mayor riesgo de muerte en comparación con los pacientes sin obesidad, confirmado por el Odds Ratio, que resalta una asociación estadísticamente significativa.
Tabaquismo: La hipótesis de independencia entre tabaquismo y mortalidad es rechazada por la prueba de Chi-cuadrada, con p-valor inferior a 2.2e-16. Los resultados revelan que los fumadores tienen un riesgo de mortalidad ligeramente mayor (RR = 1.046) respecto a los no fumadores. Aunque el impacto absoluto es modesto (RA = 0.0203), el tabaquismo es un factor de riesgo consistente, según el Odds Ratio (OR = 1.085).
En conjunto, los análisis confirman que la hipertensión, la obesidad y el tabaquismo tienen una relación significativa con la mortalidad por COVID-19, aunque la magnitud del impacto varía entre los factores. Estas evidencias destacan la importancia de diseñar intervenciones específicas para abordar estos factores de riesgo, como parte de las estrategias de salud pública dirigidas a reducir las muertes asociadas a la enfermedad.