1. Introducción

El presente análisis evalúa la desigualdad territorial en la tasa ajustada de mortalidad por tuberculosis en Colombia para el año 2017. Se emplean medidas absolutas, relativas y de concentración para cuantificar la variabilidad entre departamentos y regiones.

#Paquetes utilizados

library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.5.2
## Warning: package 'ggplot2' was built under R version 4.5.2
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   4.0.2     ✔ tibble    3.3.0
## ✔ lubridate 1.9.4     ✔ tidyr     1.3.1
## ✔ purrr     1.1.0     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(forcats)
library(dplyr)
library(stringr)
library(ggplot2)
library(DescTools)
## Warning: package 'DescTools' was built under R version 4.5.2
library(rlang)
## 
## Adjuntando el paquete: 'rlang'
## 
## The following objects are masked from 'package:purrr':
## 
##     %@%, flatten, flatten_chr, flatten_dbl, flatten_int, flatten_lgl,
##     flatten_raw, invoke, splice
library(forcats)

#2.Base de datos seleccionada por año 2017 y ordenar por ingreso

library(readxl)
## Warning: package 'readxl' was built under R version 4.5.2
basetbc <- read_excel("basetbc.xlsx")
View(basetbc)

datos_2017 <- basetbc %>%
  filter(Year == 2017) %>%
  arrange(P_Ingpcug)

View(datos_2017)
datos_2017

#3 Identificación de extremos

dept_pobre <- datos_2017 %>%
  slice_min(order_by = P_Ingpcug, n = 1)

dept_rico <- datos_2017 %>%
  slice_max(order_by = P_Ingpcug, n = 1)

dept_pobre
dept_rico

#Interpretacion: Se observa una marcada diferencia en la tasa ajustada de mortalidad por tuberculosis entre el departamento con menor ingreso (Chocó) y el de mayor ingreso (Bogotá).

Chocó presenta una tasa de 35.7 por 100.000 habitantes, mientras que Bogotá presenta 6.1 por 100.000.

Esto refleja claramente el gradiente socioeconómico en salud dentro del cual se evidencia un comportamiento inversamente proporcional entre nivel socieconomico y mortalidad por TBc.

#Resumen e indicadores

# Calcular medidas pareadas
# 1-TRANsFORMAR LA VARIABLE tasa_ajustada A NUMERICO ##
dept_pobre$tasa_ajustada <- as.numeric(dept_pobre$tasa_ajustada)
dept_rico$tasa_ajustada  <- as.numeric(dept_rico$tasa_ajustada)

#2- CALCULO DE MEDIDAS PAREADAS##

diferencia <- dept_pobre$tasa_ajustada - dept_rico$tasa_ajustada
razon <- dept_pobre$tasa_ajustada / dept_rico$tasa_ajustada

str(datos_2017$tasa_ajustada)
##  chr [1:33] "35.7" "9.8" "12.4" "24.6" "9" "5.7" "11.7" "33.2" "16" "24.6" ...
datos_2017$tasa_ajustada <- as.numeric(datos_2017$tasa_ajustada)

diferencia <- 
  slice_min(datos_2017, P_Ingpcug, n = 1)$tasa_ajustada -
  slice_max(datos_2017, P_Ingpcug, n = 1)$tasa_ajustada

razon <- 
  slice_min(datos_2017, P_Ingpcug, n = 1)$tasa_ajustada /
  slice_max(datos_2017, P_Ingpcug, n = 1)$tasa_ajustada

# Mostrar resultados
cat("Diferencia absoluta:", diferencia)
## Diferencia absoluta: 29.6
cat("Razón:", round(razon, 2))
## Razón: 5.85
# Crear quintiles de ingreso
datos_2017 <- datos_2017 %>%
  mutate(quintil = ntile(P_Ingpcug, 5))



library(dplyr)
# Calcular promedio por quintil
resumen_q <- datos_2017 %>%
  group_by(quintil) %>%
  summarise(tasa_promedio = mean(tasa_ajustada))

resumen_q

#Interpretacion En 2017 se evidenció una marcada desigualdad en la distribución de la tuberculosis según nivel de ingreso. El departamento con menor ingreso presentó una tasa ajustada 29.6 puntos mayor que el de mayor ingreso, con una razón de 5.85, indicando que la carga de enfermedad fue casi seis veces superior en el territorio más vulnerable socioeconómicamente.

El análisis estratificado por quintiles de ingreso no muestra un patrón progresivo o lineal en la distribución de la mortalidad por tuberculosis. Aunque el quintil intermedio presenta la mayor tasa promedio, la diferencia entre los quintiles extremos es reducida. Este patrón sugiere que la distribución territorial de la mortalidad por TBc no responde exclusivamente a la posición socioeconómica promedio, sino a factores estructurales adicionales y a la heterogeneidad interna de los grupos.

datos_2017 <- datos_2017 %>%
  mutate(
    Departamento = stringr::str_trim(Departamento),
    Region = case_when(
      Departamento %in% c("Atlántico", "Bolívar", "Cesar", "Córdoba",
                          "La Guajira", "Magdalena",
                          "San Andrés y Providencia", "Sucre") ~ "Atlántica",
      
      Departamento %in% c("Boyacá", "Cundinamarca", "Meta",
                          "Norte de Santander", "Santander") ~ "Oriental",
      
      Departamento %in% c("Antioquia", "Caldas", "Caquetá", "Huila",
                          "Quindío", "Risaralda", "Tolima") ~ "Central",
      
      Departamento %in% c("Cauca", "Chocó", "Nariño",
                          "Valle del Cauca") ~ "Pacífica",
      
      stringr::str_detect(Departamento, "Bogot") ~ "Bogotá D.C.",
      
      TRUE ~ "Amazonia-Orinoquia"
    )
  )


resumen_regiones <- datos_2017 %>%
        group_by(Region) %>%
        summarise(
          n_deptos = n(),
          poblacion_total = sum(Poblacion_Total),
          tasa_ponderada = weighted.mean(tasa_ajustada, Poblacion_Total)
        )
      
resumen_regiones

#Interpretacion El análisis regional evidencia heterogeneidad territorial en la mortalidad por tuberculosis en Colombia para 2017.Las tasas ponderadas muestran variación impotante, lo que sugire desigualdad territorial. La región Central presenta la mayor tasa ponderada, mientras que Bogotá D.C. registra la menor. La diferencia absoluta entre estas regiones alcanza 11.72 por 100.000 habitantes, lo que refleja una brecha territorial significativa. Este patrón sugiere que la distribución de la mortalidad por TB no responde exclusivamente a la posición socioeconómica promedio regional, sino a una interacción compleja de determinantes estructurales, acceso a servicios de salud y condiciones demográficas.

media_nacional <- weighted.mean(datos_2017$tasa_ajustada, datos_2017$Poblacion_Total)

BGV <- resumen_regiones %>%
  mutate(peso = poblacion_total / sum(poblacion_total)) %>%
  summarise(BGV = sum(peso * (tasa_ponderada - media_nacional)^2)) %>%
  pull(BGV)



BGSD <- sqrt(BGV)

CV <- (BGSD / media_nacional) * 100

cat("Media nacional (ponderada):", round(media_nacional, 2))
## Media nacional (ponderada): 13.38
cat("BGV:", round(BGV, 2))
## BGV: 16.51
cat("BGSD:", round(BGSD, 2))
## BGSD: 4.06
cat("CV:", round(CV, 2), "%")
## CV: 30.37 %

#Interpretaciion: Los indicadores muestran una desigualdad territorial relevante en la distribución del evento analizado. La brecha absoluta de 4.06 indica que existe una diferencia importante entre los extremos de la distribución, mientras que la brecha relativa (BGV : 16,51) sugiere que esa diferencia es equivalente al promedio. El coeficiente de variación (CV ; 30,37%) confirma una dispersión considerable entre regiones, lo que implica ausencia de homogeneidad territorial. Aunque la media nacional resume el comportamiento global, esta oculta desigualdades internas marcadas. En términos estructurales, estos resultados reflejan que el evento no se distribuye de manera equitativa en el territorio, sino que responde a determinantes sociales y condiciones diferenciales de desarrollo socioeconómico.

#GRAFICO DE BARRAS POR REGION

resumen_regiones %>%
  mutate(Region = fct_reorder(Region, tasa_ponderada)) %>%
  ggplot(aes(x = Region, y = tasa_ponderada, fill = tasa_ponderada)) +
  geom_col(width = 0.7) +
  geom_hline(yintercept = media_nacional, linetype = "dashed", color = "red") +
  geom_text(aes(label = round(tasa_ponderada, 1)), vjust = -0.3) +
  scale_fill_gradient(low = "#27AE60", high = "#C0392B") +
  coord_flip() +
  labs(title = "Tasa de mortalidad por TB según región, Colombia 2017") +
  theme_minimal()

# Grafica 1. La gráfica presenta la tasa de mortalidad por tuberculosis ajustada y ponderada por población según región en Colombia para 2017. La línea roja punteada representa la media nacional. #varianza_total

varianza_total <- sum(datos_2017$Poblacion_Total * 
                        (datos_2017$tasa_ajustada - media_nacional)^2) / 
  sum(datos_2017$Poblacion_Total)

cat("Varianza TOTAL:", round(varianza_total, 2))
## Varianza TOTAL: 51
cat("Varianza ENTRE regiones (BGV):", round(BGV, 2))
## Varianza ENTRE regiones (BGV): 16.51
cat("% explicado por regiones:", round(BGV/varianza_total*100, 1), "%")
## % explicado por regiones: 32.4 %

#Interpretacion : La varianza total del indicador fue de 51, lo que refleja una dispersión considerable a nivel nacional. De esta variabilidad, 16,51 corresponde a la varianza entre regiones, indicando que las diferencias regionales aportan una fracción sustancial de la desigualdad observada. El 32,4% de la variación total es explicada por las diferencias entre regiones, lo que significa que cerca de un tercio de la desigualdad del indicador se debe a brechas territoriales, mientras que el porcentaje restante obedece a variabilidad dentro de las propias regiones, lo que sugiere que la desigualdad no solo se da entre regiones si no dentro de las mismas regiones internamente.

#Indice de GINI

datos_lorenz <- datos_2017 %>%
  arrange(tasa_ajustada) %>%
  mutate(
    prop_acum_deptos = cumsum(rep(1/n(), n())),
    prop_acum_tasa = cumsum(tasa_ajustada) / sum(tasa_ajustada)
  )

# Calcular Gini

install.packages("DescTools")
## Warning: package 'DescTools' is in use and will not be installed
library(DescTools)

gini_salud <- Gini(datos_2017$tasa_ajustada)
cat("Índice de Gini:", round(gini_salud, 4))
## Índice de Gini: 0.4757

#Interpretacion El índice de Gini de 0,4 evidencia un nivel moderado–alto de desigualdad en la distribución del indicador entre las unidades analizadas, lo que confirma que las tasas no están homogéneamente distribuidas y que existen brechas importantes que deben ser consideradas desde una perspectiva estructural y territorial.

#Curva LORENZ

library("ggplot2")
library(tidyverse)
ggplot(datos_lorenz, aes(x = prop_acum_deptos, y = prop_acum_tasa)) +
  geom_line(color = "#2C3E50", linewidth = 1.2) +
  geom_abline(slope = 1, linetype = "dashed", color = "red") +
  labs(title = "Curva de Lorenz - Mortalidad por TB",
       x = "Proporción acumulada de departamentos",
       y = "Proporción acumulada de mortalidad") +
  theme_minimal()

#Interpretacion Se evidencia que la curva negra se encuentra por debajo de la línea de igualdad perfecta.Esto nos indica que La mortalidad por tuberculosis no se distribuye de manera uniforme entre los departamentos. La separación respecto a la línea de igualdad refleja una concentración de la carga en un número limitado de territorios, lo que evidencia disparidades territoriales para 2017 en Colombia.

#Gráfico de barras ordenado

datos_2017 %>%
  mutate(Departamento = fct_reorder(Departamento, tasa_ajustada)) %>%
  ggplot(aes(x = Departamento, y = tasa_ajustada, fill = tasa_ajustada)) +
  geom_col() +
  geom_hline(yintercept = media_nacional, linetype = "dashed", color = "red") +
  scale_fill_gradient(low = "#27AE60", high = "#C0392B") +
  coord_flip() +
  labs(title = "Tasa de Mortalidad por TB por Departamento, 2017",
       subtitle = paste("Media nacional:", round(media_nacional, 1)),
       x = "", y = "Tasa por 100,000 hab") +
  theme_minimal() + theme(legend.position = "none")

#Interpretacion

La distribución departamental de la mortalidad por tuberculosis en 2017 evidencia una marcada heterogeneidad territorial. Se observa un valor extremo en Vaupés, cuya tasa supera ampliamente la media nacional, así como un grupo de departamentos con tasas consistentemente superiores al promedio. Esta variabilidad sugiere concentración geográfica de la carga de enfermedad y respalda la existencia de desigualdades subnacionales relevantes en la distribución de TBC en Colombia.

#Grafica de dispersión con la variable de posición socioeconómica Ingreso per cápita (P_Ingpcug) y mortalidad por TBC, Colombia 2017.

library(ggplot2)

ggplot(datos_2017, 
       aes(x = P_Ingpcug, 
           y = tasa_ajustada)) +
  geom_point(size = 3, alpha = 0.7, color = "#2C3E50") +
  geom_smooth(method = "lm", se = TRUE, color = "red") +
  labs(title = "Relación entre ingreso per cápita y mortalidad por TBC, Colombia 2017",
       x = "Ingreso per cápita",
       y = "Tasa ajustada de mortalidad por TBC (por 100.000 hab)") +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'

#Interpretacion: El gráfico de dispersión evidencia una asociación inversa entre el ingreso per cápita y la mortalidad por tuberculosis, indicando que los departamentos con mayor nivel socioeconómico tienden a registrar menores tasas. Sin embargo, la relación es débil y muestra considerable dispersión, lo que sugiere que el ingreso no es el único determinante de las diferencias territoriales observadas. La existencia de valores atípicos apunta a la influencia de factores estructurales y contextuales adicionales.