title: “Análisis de Tuberculosis y Gestión de Recursos Sanitarios” author: “Darleny Sabogal y David Gómez” date: “2026-06-20” output: html_document —

Introducción

Este trabajo analiza indicadores de tuberculosis para apoyar la gestión de recursos sanitarios.

Cargar librerías

library(readxl)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)

Cargar base de datos

tb <- read_excel("C:/Users/nayar/OneDrive/Documentos/tuberculosis.xlsx")
head(tb)
## # A tibble: 6 × 5
##   `GHO (DISPLAY)`   `YEAR (DISPLAY)` `COUNTRY (DISPLAY)` `Display Value` Numeric
##   <chr>                        <dbl> <chr>               <chr>             <dbl>
## 1 Smear-positive t…             2000 Japan               87 [77-100]         870
## 2 Smear-positive t…             2008 Japan               87 [77-100]         870
## 3 Tuberculosis - n…             1990 Japan               51821            518210
## 4 Tuberculosis - n…             1991 Japan               50612            506120
## 5 Tuberculosis - n…             1993 Japan               48461            484610
## 6 Tuberculosis - n…             1994 Japan               44425            444250

Estructura de la base

str(tb)
## tibble [546 × 5] (S3: tbl_df/tbl/data.frame)
##  $ GHO (DISPLAY)    : chr [1:546] "Smear-positive tuberculosis case-detection rate (%)" "Smear-positive tuberculosis case-detection rate (%)" "Tuberculosis - new and relapse cases" "Tuberculosis - new and relapse cases" ...
##  $ YEAR (DISPLAY)   : num [1:546] 2000 2008 1990 1991 1993 ...
##  $ COUNTRY (DISPLAY): chr [1:546] "Japan" "Japan" "Japan" "Japan" ...
##  $ Display Value    : chr [1:546] "87 [77-100]" "87 [77-100]" "51821" "50612" ...
##  $ Numeric          : num [1:546] 870 870 518210 506120 484610 ...

Variables

names(tb)
## [1] "GHO (DISPLAY)"     "YEAR (DISPLAY)"    "COUNTRY (DISPLAY)"
## [4] "Display Value"     "Numeric"

Resumen estadístico

summary(tb)
##    GHO (DISPLAY) YEAR (DISPLAY) COUNTRY (DISPLAY)   Display Value
##  Length   :546   Min.   :1990   Length   :546     Length   :546  
##  N.unique : 48   1st Qu.:2004   N.unique :  1     N.unique :403  
##  N.blank  :  0   Median :2008   N.blank  :  0     N.blank  :  0  
##  Min.nchar: 16   Mean   :2008   Min.nchar:  5     Min.nchar:  1  
##  Max.nchar: 93   3rd Qu.:2013   Max.nchar:  5     Max.nchar: 25  
##                  Max.   :2018                                    
##     Numeric        
##  Min.   :     0.0  
##  1st Qu.:   452.5  
##  Median :  1275.0  
##  Mean   : 76769.7  
##  3rd Qu.: 85137.5  
##  Max.   :760000.0

Problema de investigación

Pregunta de investigación

¿Cómo ha evolucionado el comportamiento de los indicadores de tuberculosis en Japón entre 1990 y 2018 y qué tendencias pueden identificarse para apoyar la gestión de recursos sanitarios?

Objetivo general

Analizar los indicadores de tuberculosis registrados en Japón mediante técnicas estadísticas y un modelo de regresión lineal para identificar tendencias relevantes para la gestión de recursos sanitarios.

Estadística descriptiva

mean(tb$Numeric, na.rm = TRUE)
## [1] 76769.74
median(tb$Numeric, na.rm = TRUE)
## [1] 1275
sd(tb$Numeric, na.rm = TRUE)
## [1] 144057.5
range(tb$Numeric, na.rm = TRUE)
## [1]      0 760000

Distribución de los indicadores

ggplot(tb, aes(x = Numeric)) +
  geom_histogram(bins = 30) +
  labs(
    title = "Distribución de indicadores de tuberculosis",
    x = "Valor numérico",
    y = "Frecuencia"
  )

Evolución temporal

tb_anual <- tb %>%
  group_by(`YEAR (DISPLAY)`) %>%
  summarise(promedio = mean(Numeric, na.rm = TRUE))

ggplot(tb_anual,
       aes(x = `YEAR (DISPLAY)`,
           y = promedio)) +
  geom_line() +
  geom_point() +
  labs(
    title = "Evolución temporal de los indicadores",
    x = "Año",
    y = "Promedio"
  )

Modelo de regresión lineal

modelo <- lm(
  Numeric ~ `YEAR (DISPLAY)`,
  data = tb
)

summary(modelo)
## 
## Call:
## lm(formula = Numeric ~ `YEAR (DISPLAY)`, data = tb)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -243214  -84811  -29845   17533  516166 
## 
## Coefficients:
##                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      18753306.4  1814919.6   10.33   <2e-16 ***
## `YEAR (DISPLAY)`    -9301.2      903.9  -10.29   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 131900 on 544 degrees of freedom
## Multiple R-squared:  0.1629, Adjusted R-squared:  0.1614 
## F-statistic: 105.9 on 1 and 544 DF,  p-value: < 2.2e-16

Interpretación de resultados

El análisis descriptivo mostró que los indicadores de tuberculosis en Japón presentan una amplia variabilidad durante el período estudiado (1990-2018). El valor promedio de los registros fue de 76.769,74, mientras que la mediana fue de 1.275, evidenciando una distribución asimétrica influenciada por algunos valores muy altos.

La desviación estándar de 144.057,5 indica una dispersión considerable de los datos, lo que refleja diferencias importantes entre los distintos indicadores incluidos en la base de datos.

El modelo de regresión lineal presentó un coeficiente negativo para la variable año (-9301,2), indicando una tendencia general decreciente de los indicadores de tuberculosis a medida que transcurre el tiempo.

El valor p (< 2e-16) demuestra que la relación entre el año y los indicadores de tuberculosis es estadísticamente significativa.

El coeficiente de determinación (R² = 0,1629) indica que aproximadamente el 16,29 % de la variabilidad observada en los indicadores puede explicarse por la variable año.

Conclusiones

  1. Los indicadores de tuberculosis en Japón muestran una tendencia general de disminución durante el período comprendido entre 1990 y 2018.

  2. El análisis descriptivo evidenció una alta variabilidad en los registros, reflejando diferencias importantes entre los distintos indicadores epidemiológicos estudiados.

  3. El modelo de regresión lineal identificó una relación estadísticamente significativa entre el año de observación y los valores de los indicadores de tuberculosis.

  4. Los resultados obtenidos sugieren avances en las estrategias de control y vigilancia de la tuberculosis en Japón durante las últimas décadas.

  5. El uso de herramientas estadísticas en RStudio facilita la generación de evidencia para apoyar la toma de decisiones y la gestión eficiente de los recursos sanitarios.

Referencias

Organización Mundial de la Salud. (2024). Global tuberculosis report 2024. Organización Mundial de la Salud.

R Core Team. (2025). R: A language and environment for statistical computing. R Foundation for Statistical Computing. Viena, Austria.

Wickham, H., François, R., Henry, L., Müller, K., & Vaughan, D. (2024). dplyr: A grammar of data manipulation. R package version 1.1.4.

Wickham, H. (2024). ggplot2: Elegant graphics for data analysis. Springer.

World Health Organization. (2024). Global Health Observatory data repository: Tuberculosis indicators. Organización Mundial de la Salud. .