Introducción

La tuberculosis continúa siendo una de las principales enfermedades infecciosas de impacto mundial, generando importantes desafíos para los sistemas de salud y la gestión de los recursos sanitarios. El análisis estadístico de indicadores epidemiológicos permite comprender el comportamiento de la enfermedad y apoyar la toma de decisiones basadas en evidencia.

En este estudio se analiza la relación entre la incidencia de tuberculosis y la mortalidad por tuberculosis mediante la aplicación del coeficiente de correlación de Pearson. Este método permite determinar la fuerza y dirección de la asociación existente entre ambas variables, aportando información relevante para la planificación, vigilancia epidemiológica y formulación de estrategias de control de la enfermedad.

Problema de Investigación

¿Existe una relación estadísticamente significativa entre la incidencia de tuberculosis y la mortalidad por tuberculosis?

Hipótesis

H0

No existe relación significativa entre las variables.

H1

Existe relación significativa entre las variables.

Librerías

library(readxl)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(tidyr)
library(ggplot2)

Importación de datos

tb <- read_excel("C:/Users/nayar/OneDrive/Documentos/tuberculosis.xlsx")

Preparación de datos

datos_cor <- tb |>
 filter(`GHO (DISPLAY)` %in% c(
   "Incidence of tuberculosis (per 100 000 population per year)",
   "Deaths due to tuberculosis among HIV-negative people (per 100 000 population)"
 )) |>
 select(
   indicador = `GHO (DISPLAY)`,
   pais = `COUNTRY (DISPLAY)`,
   anio = `YEAR (DISPLAY)`,
   valor = Numeric
 )

datos_cor <- pivot_wider(
 datos_cor,
 names_from = indicador,
 values_from = valor,
 values_fn = mean
)

colnames(datos_cor)[3] <- "incidencia"
colnames(datos_cor)[4] <- "mortalidad"

datos_cor <- na.omit(datos_cor)

Estadística descriptiva

summary(datos_cor)
##         pais         anio        incidencia      mortalidad   
##  Length   :19   Min.   :2000   Min.   :22.00   Min.   :140.0  
##  N.unique : 1   1st Qu.:2004   1st Qu.:26.50   1st Qu.:180.0  
##  N.blank  : 0   Median :2009   Median :30.00   Median :210.0  
##  Min.nchar: 5   Mean   :2009   Mean   :30.05   Mean   :221.6  
##  Max.nchar: 5   3rd Qu.:2014   3rd Qu.:34.00   3rd Qu.:255.0  
##                 Max.   :2018   Max.   :40.00   Max.   :360.0

Gráfico

ggplot(datos_cor,
       aes(x = incidencia,
           y = mortalidad)) +
 geom_point(size = 3) +
 geom_smooth(method = "lm")
## `geom_smooth()` using formula = 'y ~ x'

Correlación de Pearson

correlacion <- cor.test(
 datos_cor$incidencia,
 datos_cor$mortalidad,
 method = "pearson"
)

correlacion
## 
##  Pearson's product-moment correlation
## 
## data:  datos_cor$incidencia and datos_cor$mortalidad
## t = 14.427, df = 17, p-value = 5.734e-11
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.9006176 0.9853763
## sample estimates:
##       cor 
## 0.9615051

Resultados

El análisis de correlación de Pearson aplicado a los indicadores de tuberculosis reportados para Japón mostró un coeficiente de correlación de r = 0.9615, evidenciando una relación positiva muy fuerte entre la incidencia y la mortalidad por tuberculosis.

El valor p obtenido fue de 5.734e-11, inferior al nivel de significancia de 0.05, indicando que la asociación observada es estadísticamente significativa.

El intervalo de confianza al 95 % para el coeficiente de correlación se ubicó entre 0.9006 y 0.9854, lo que confirma la estabilidad de la relación encontrada entre las variables analizadas.

Interpretación

El análisis mostró una correlación positiva muy fuerte (r = 0.9615) entre la incidencia y la mortalidad por tuberculosis.

El valor p fue menor a 0.05, por lo que se rechaza la hipótesis nula y se concluye que existe una relación estadísticamente significativa entre ambas variables.

Conclusiones

  1. Se identificó una correlación positiva muy fuerte entre la incidencia y la mortalidad por tuberculosis (r = 0.9615).

  2. El valor p obtenido (5.734e-11) permitió rechazar la hipótesis nula y confirmar una asociación estadísticamente significativa entre las variables.

  3. Los resultados sugieren que los incrementos en la incidencia de tuberculosis están asociados con aumentos en la mortalidad por esta enfermedad.

  4. La información obtenida puede contribuir a la planificación y asignación eficiente de recursos sanitarios destinados a programas de prevención y control de la tuberculosis.

  5. El análisis estadístico respalda la importancia de fortalecer las estrategias de vigilancia epidemiológica y atención oportuna para reducir el impacto de la enfermedad.

Referencias

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2021). An introduction to statistical learning: With applications in R (2nd ed.). Springer.

Montgomery, D. C., Peck, E. A., & Vining, G. G. (2021). Introduction to linear regression analysis (6th ed.). Wiley.

Wickham, H., Çetinkaya-Rundel, M., & Grolemund, G. (2023). R for data science (2nd ed.). O’Reilly Media.

World Health Organization. (2024). Global tuberculosis report 2024. World Health Organization.

World Health Organization. (s. f.). Global Health Observatory. https://www.who.int/data/gho