Introducción

Contexto y motivación

La salud de una población refleja no solo su bienestar individual, sino también el nivel de desarrollo social, económico y político de un país. Las desigualdades globales en salud han sido objeto de análisis por parte de organismos internacionales como la OMS y el Banco Mundial, que evidencian cómo factores estructurales —como la educación, la pobreza, la inversión pública o la infraestructura sanitaria— generan brechas significativas entre países.

Estas diferencias no solo se expresan en la esperanza de vida o la mortalidad infantil, sino también en la distribución de los recursos sanitarios, el acceso a servicios de salud, el crecimiento poblacional y la incidencia de enfermedades. Por ello, resulta pertinente analizar, desde un enfoque multivariado, cómo se agrupan los países según sus condiciones de salud y desarrollo, buscando patrones que revelen similitudes o contrastes entre distintas regiones del mundo.

A través del aprendizaje no supervisado, es posible explorar relaciones ocultas en los datos sin necesidad de establecer categorías previas. Este enfoque resulta especialmente valioso cuando se trabaja con indicadores complejos y heterogéneos, ya que permite identificar grupos naturales de países y comprender qué variables son más determinantes en la diferenciación de sus condiciones de vida.

Enfoque metodológico

En este estudio se aplica un modelo de aprendizaje no supervisado, específicamente un Análisis de Componentes Principales (ACP) combinado con una clusterización jerárquica mediante el método de Ward, con el propósito de agrupar países según indicadores relacionados con la salud pública y el desarrollo humano.

El ACP se utiliza como técnica de reducción de dimensionalidad, lo que permite resumir la información contenida en múltiples variables cuantitativas en unos pocos componentes que concentran la mayor parte de la variabilidad del conjunto de datos. Posteriormente, el método de Ward —un enfoque de clusterización jerárquica— se aplica sobre los componentes principales con el fin de conformar grupos de países con características similares. Este método se seleccionó por su capacidad para minimizar la varianza interna de los grupos y producir segmentaciones estadísticamente más homogéneas y estables.

Objetivos

En consecuencia, este estudio tiene como objetivos:

  1. Agrupar los países en función de sus condiciones de salud y desarrollo, utilizando técnicas de aprendizaje no supervisado.

  2. Identificar los patrones comunes y diferencias significativas entre los grupos formados, con el fin de reconocer los países con mayores niveles de vulnerabilidad sanitaria.

  3. Analizar la relación entre las distintas variables y cómo estas influyen en las condiciones generales de salud poblacional.

  4. Evidenciar los países con mayores niveles de vulnerabilidad sanitaria, con el propósito de orientar estrategias de intervención diferenciadas y detectar casos atípicos que representen tanto buenas prácticas como situaciones críticas que requieran atención prioritaria.

De esta forma, se busca ofrecer una visión estadística y objetiva de las desigualdades globales en salud, utilizando herramientas de análisis multivariado que facilitan la interpretación de grandes volúmenes de información.Con base en lo anterior, surge la necesidad de aplicar herramientas de análisis multivariado que permitan sintetizar y comparar objetivamente las condiciones sanitarias de los países.

Metodología

Fuente de los datos

Los datos utilizados provienen de la base de indicadores del Banco Mundial, específicamente del conjunto Health, Nutrition and Population Statistics, correspondiente al año 2020. Esta fuente reúne información de 191 países y más de 400 variables relacionadas con aspectos demográficos, económicos y sanitarios.

El año 2020 fue seleccionado por representar un punto crítico en la salud mundial, marcado por el impacto de la pandemia de COVID-19, que afectó simultáneamente a la mayoría de las naciones. Este periodo ofrece una perspectiva singular sobre la resiliencia estructural de los sistemas de salud, al evidenciar cómo la capacidad sanitaria, el gasto público y las condiciones demográficas influyeron en los resultados poblacionales.

Limpieza y selección de variables

En una primera etapa se realizó un proceso de depuración de la base de datos, eliminando observaciones incompletas o con valores faltantes (“NA”), así como registros correspondientes a regiones o bloques económicos, conservando únicamente los países individuales. Los datos originales se presentan en la Tabla 1, donde se observa la estructura inicial del conjunto de variables disponibles.

library(readxl)
library(DT)
Tabla_1= read_excel("P_Data_Extract_From_Health_Nutrition_and_Population_Statistics.xlsx")
datatable(Tabla_1,options = list(pageLength = 10,scrollX = TRUE,initComplete = JS("function(settings,json) {$(this.api().table().header()).css({'background-color': '#7B1E1E','color': 'white','font-weight': 'bold'});}")))

Posteriormente, se eliminaron variables redundantes o con alta correlación y aquellas que no aportaban información relevante al objetivo del análisis (variables relacionadas con el genero y la edad). Este proceso permitió reducir el conjunto inicial a 21 variables cuantitativas, seleccionadas por su relevancia para caracterizar las condiciones de salud, población y gasto sanitario de cada país, seguido de esto se decidio renombrar las variables con la intencion de que al momento de graficar no se presenten problemas de lectura.Dado el contexto particular del año 2020, se realizaron dos versiones del análisis:

  1. una incluyendo todos los países, y

  2. otra excluyendo los casos atípicos (China e India), con el fin de evaluar la robustez de los resultados y el posible efecto de estos valores extremos.

Finalmente, todas las variables numéricas fueron estandarizadas mediante la transformación scale, garantizando media cero y desviación estándar uno, condición necesaria para aplicar el Análisis de Componentes Principales (ACP). La Tabla 2 presenta la base de datos final utilizada en el estudio.

library(tidyverse)
Tabla_1[Tabla_1 == ".."] = NA
Tabla_1[Tabla_1 == ""] = NA 
Tabla_1=Tabla_1%>%select(-1,-2,-3)
Tabla_1=Tabla_1[-c(192, 193, 194, 195, 196), ]
Tabla_1=Tabla_1[, colSums(is.na(Tabla_1)) == 0]
Tabla_1=Tabla_1%>%select(-contains("male"),-contains("female"),-contains("ages"))
Tabla_1=Tabla_1%>%select(1,2,3,4,5,9,8,37,14,15,31,18,21,24,25,27,38,19,20,39,41,34)
Tabla_2=Tabla_1%>%rename(pais=`Country Code`,
                             Dep_pobl=`Age dependency ratio (% of working-age population) [SP.POP.DPND]`,
                             Dep_ancianos=`Age dependency ratio, old [SP.POP.DPND.OL]`,
                             Dep_jovenes=`Age dependency ratio, young [SP.POP.DPND.YG]`,
                             Tasa_natal=`Birth rate, crude (per 1,000 people) [SP.DYN.CBRT.IN]`,
                             Tasa_mortal=`Death rate, crude (per 1,000 people) [SP.DYN.CDRT.IN]`,
                             Gasto_PPP=`Current health expenditure per capita, PPP (current international $) [SH.XPD.CHEX.PP.CD]`,
                             Creci_Pobl=`Population growth (annual %) [SP.POP.GROW]`,
                             Gasto_Gob_capital=`Domestic general government health expenditure per capita, PPP (current international $) [SH.XPD.GHED.PP.CD]`,
                             Gasto_priv_salud=`Domestic private health expenditure (% of current health expenditure) [SH.XPD.PVTD.CH.ZS]`,
                             Muertes_neon=`Number of neonatal deaths [SH.DTH.NMRT]`,
                             Tasa_fertil=`Fertility rate, total (births per woman) [SP.DYN.TFRT.IN]`,
                             Esperanza_Vida=`Life expectancy at birth, total (years) [SP.DYN.LE00.IN]`,
                             Mortal_materna=`Maternal mortality ratio (modeled estimate, per 100,000 live births) [SH.STA.MMRT]`,
                             Mortal_Infantil=`Mortality rate, infant (per 1,000 live births) [SP.DYN.IMRT.IN]`,
                             Mortal_menores5=`Mortality rate, under-5 (per 1,000) [SH.DYN.MORT]`,
                             Poblacion=`Population, total [SP.POP.TOTL]`,
                             Vacunacion_polio=`Immunization, Pol3 (% of one-year-old children) [SH.IMM.POL3]`,
                             Tuberculosis=`Incidence of tuberculosis (per 100,000 people) [SH.TBS.INCD]`,
                             Pobl_Rural=`Rural population [SP.RUR.TOTL]`,
                             Tasa_muertosNac=`Stillbirth rate (per 1,000 total births) [SH.DYN.STLB]`,
                             Gasto_bolsillo=`Out-of-pocket expenditure (% of current health expenditure) [SH.XPD.OOPC.CH.ZS]`)
datatable(Tabla_2,options = list(pageLength = 10,scrollX = TRUE,initComplete = JS("function(settings,json) {$(this.api().table().header()).css({'background-color': '#7B1E1E','color': 'white','font-weight': 'bold'});}")))

Descripción de las variables

Las variables seleccionadas provienen del Banco Mundial y fueron escogidas por su capacidad para describir de manera integral las condiciones sanitarias y socioeconómicas de las naciones. Se agrupan en cuatro categorías principales las cuales se mencionan en la Tabla 3:

library(tibble)
library(knitr)
library(kableExtra)

tabla_detallada <- tribble(~Categoría, ~Variable, ~Descripción, ~Interpretación, ~Importancia,
  
  # Bloque 1: Demográficos
  "Indicadores demográficos", "Tasa de natalidad", 
  "Número de nacimientos por cada 1.000 habitantes en un año.", 
  "Mide el crecimiento poblacional natural.",
  "Permiten analizar la dinámica poblacional y su impacto social.",
  
  "", "Tasa de mortalidad", 
  "Número de muertes por cada 1.000 habitantes en un año.",
  "Evalúa las condiciones de salud y calidad de vida.",
  "",
  
  "", "Crecimiento poblacional", 
  "Porcentaje de aumento de la población total en un año.",
  "Determina el ritmo de expansión demográfica.",
  "",
  
  # Bloque 2: Salud
  "Indicadores de salud", "Esperanza de vida",
  "Promedio de años que se espera viva una persona al nacer.",
  "Refleja el nivel de bienestar y atención médica.",
  "Muestran la situación sanitaria general de un país.",
  
  "", "Mortalidad infantil",
  "Número de muertes de menores de un año por cada 1.000 nacidos vivos.",
  "Evalúa la efectividad de los servicios de salud materno-infantil.",
  "",
  
  "", "Mortalidad materna",
  "Porcentaje de niños que reciben vacunas básicas durante su primer año de vida.",
  "Indica la cobertura del sistema de salud preventiva.",
  "",
  
  "","Muertes Neonatales","","","",
  
  "","vacunacion contra el polio","","","",
  
  "","tasa de mortinatos","","","",

  # Bloque 3: Económicos
  "Indicadores económicos", "Gasto en salud (% PIB)",
  "Proporción del producto interno bruto destinada a la salud.",
  "Indica el compromiso económico del país con el bienestar social.",
  "Evalúan la sostenibilidad financiera del sistema de salud.",
  
  "", "Gasto privado",
  "Monto promedio de gasto en salud por persona.",
  "Mide la inversión directa en la atención médica individual.",
  "",
  
  "", "Gasto de bolsillo",
  "Porcentaje del gasto en salud que asumen los hogares.",
  "Refleja la accesibilidad económica a los servicios de salud.",
  "",
  "","gasto total","","","",
  
  "indicadores epidemiologicos y poblaciones complementarios","incidencia de tuberculosis","","","",
  "","poblacion total","","","",
  "","poblacion rural","","","")

kable(tabla_detallada, caption = "Categorías, variables y su interpretación") %>%kable_styling(bootstrap_options = c("striped", "hover", "condensed"),full_width = FALSE,font_size = 12) %>%row_spec(0, bold = TRUE, color = "white", background = "#7B1E1E") %>%column_spec(1, bold = TRUE, width = "4cm") %>%column_spec(2, width = "3cm") %>%column_spec(3:5, width = "5cm") %>%collapse_rows(columns = 1, valign = "middle")
Categorías, variables y su interpretación
Categoría Variable Descripción Interpretación Importancia
Indicadores demográficos Tasa de natalidad Número de nacimientos por cada 1.000 habitantes en un año. Mide el crecimiento poblacional natural. Permiten analizar la dinámica poblacional y su impacto social.
Tasa de mortalidad Número de muertes por cada 1.000 habitantes en un año. Evalúa las condiciones de salud y calidad de vida.
Crecimiento poblacional Porcentaje de aumento de la población total en un año. Determina el ritmo de expansión demográfica.
Indicadores de salud Esperanza de vida Promedio de años que se espera viva una persona al nacer. Refleja el nivel de bienestar y atención médica. Muestran la situación sanitaria general de un país.
Mortalidad infantil Número de muertes de menores de un año por cada 1.000 nacidos vivos. Evalúa la efectividad de los servicios de salud materno-infantil.
Mortalidad materna Porcentaje de niños que reciben vacunas básicas durante su primer año de vida. Indica la cobertura del sistema de salud preventiva.
Muertes Neonatales
vacunacion contra el polio
tasa de mortinatos
Indicadores económicos Gasto en salud (% PIB) Proporción del producto interno bruto destinada a la salud. Indica el compromiso económico del país con el bienestar social. Evalúan la sostenibilidad financiera del sistema de salud.
Gasto privado Monto promedio de gasto en salud por persona. Mide la inversión directa en la atención médica individual.
Gasto de bolsillo Porcentaje del gasto en salud que asumen los hogares. Refleja la accesibilidad económica a los servicios de salud.
gasto total
indicadores epidemiologicos y poblaciones complementarios incidencia de tuberculosis
poblacion total
poblacion rural

La selección de estas variables se basó en criterios de disponibilidad global, comparabilidad internacional y relevancia conceptual, con el propósito de construir una visión integral del bienestar poblacional y de las desigualdades estructurales entre países.

Análisis de Componentes Principales (ACP)

El Análisis de Componentes Principales (ACP) se aplicó como técnica de reducción de dimensionalidad, con el fin de condensar la información contenida en las 21 variables en un número menor de componentes no correlacionados.

El procedimiento se realizó con la función prcomp() del lenguaje R, utilizando las variables previamente estandarizadas. La varianza explicada por cada componente se evaluó mediante el gráfico de sedimentación (scree plot), determinándose que las cuatro primeras componentes explican más del 80 % de la variabilidad total.

Las visualizaciones principales del ACP incluyen:

  • Gráfico de varianza explicada: fviz_eig()

  • Proyección de los países en el plano factorial: fviz_pca_ind()

  • Contribución de las variables: fviz_pca_var()

Este análisis permitió identificar las combinaciones lineales de indicadores que mejor describen las diferencias estructurales entre países en términos de desarrollo y desempeño sanitario.

Clusterización jerárquica (método de Ward)

A partir de las coordenadas obtenidas en el espacio de los componentes principales, se aplicó una clusterización jerárquica utilizando el método de Ward, con el propósito de agrupar los países según sus similitudes multivariadas.

Este método fue seleccionado por su capacidad para minimizar la varianza interna de los grupos, garantizando la homogeneidad de los clusters. El procedimiento se implementó mediante las librerías FactoClass y dendextend en R.

El número óptimo de grupos se determinó a partir del análisis visual del dendrograma y la revisión del coeficiente de varianza, priorizando la coherencia interpretativa y la estabilidad estadística de los segmentos formados.

Finalmente, los países fueron asignados a sus respectivos clusters, representando los resultados mediante diagramas de dispersión y círculos de correlación, los cuales permiten observar la separación de los grupos y la relación entre las variables y los componentes principales.

Resultados descriptivos

Medidas de tendencia central

Para iniciar el análisis, una vez obtenida y depurada la base de datos —tras eliminar valores faltantes, variables redundantes y observaciones no válidas— se realizó un análisis estadístico descriptivo con el propósito de examinar el comportamiento general de las variables seleccionadas y observar la variabilidad existente entre los países.

Los resultados de este análisis se presentan en la Tabla 4, donde se resumen los principales estadísticos descriptivos (media, mediana, valores mínimos y máximos, y desviación estándar) de los indicadores utilizados. Estos permiten identificar diferencias marcadas entre las naciones, así como reconocer la presencia de valores atípicos que podrían influir en los análisis posteriores.

Dado el posible sesgo derivado del tamaño poblacional y del impacto desigual de la pandemia —especialmente en China e India—, se elaboraron dos versiones del análisis descriptivo: una que incluye todos los países y otra que excluye estos casos. Esta comparación busca evaluar la robustez y estabilidad de los resultados, así como estimar la influencia de observaciones con peso desproporcionado en los promedios globales.

Matriz de correlaciones

Con el fin de comprender las relaciones entre las variables y detectar posibles problemas de colinealidad —es decir, variables que aportan información redundante—, se elaboró una matriz de correlaciones, presentada en la Figura 1. Este análisis constituye la base conceptual para definir el número de dimensiones a conservar en el Análisis de Componentes Principales (ACP).

El gráfico de correlaciones se muestra a continuación:

library(corrplot)
numeros = Tabla_2[, sapply(Tabla_2, is.numeric)]
colnames(numeros) = abbreviate(colnames(numeros), minlength = 10)
cor_matriz = cor(numeros, use = "complete.obs")
corrplot(cor_matriz, method = "color", type = "upper", order = "hclust", tl.cex = 0.6)

numeros = Tabla_2[, sapply(Tabla_2, is.numeric)] colnames(numeros) = abbreviate(colnames(numeros), minlength = 10) cor_matriz = cor(numeros, use = “complete.obs”) corrplot(cor_matriz, method = “color”, type = “upper”, order = “hclust”, tl.cex = 0.6)

Del análisis de correlaciones se destacan varios patrones relevantes:

  • Se observa una fuerte relación entre la dependencia juvenil, la tasa de natalidad y la tasa de fertilidad, con coeficientes superiores a 0.97. Esto indica que una estructura poblacional joven tiende a generar mayores tasas de natalidad, manteniendo un ciclo demográfico de alta reproducción. Este fenómeno explica por qué algunas regiones permanecen en etapas de crecimiento acelerado, mientras otras transitan hacia fases de madurez poblacional.

  • El envejecimiento poblacional presenta una correlación positiva significativa con el gasto en salud (≈ 0.72). A medida que la población envejece, aumenta la presión sobre los sistemas sanitarios y de protección social. Los países con mayores proporciones de adultos mayores deben destinar más recursos a atención médica crónica, pensiones y servicios especializados, lo que representa un desafío fiscal creciente.

  • En contraste, los indicadores de desarrollo sanitario muestran correlaciones negativas con los distintos tipos de mortalidad. Destaca la fuerte relación inversa entre la esperanza de vida y la mortalidad infantil, lo que confirma que las mejoras en infraestructura, prevención y acceso a servicios reducen simultáneamente múltiples indicadores de mortalidad.

  • Estos resultados sugieren que las políticas en salud deben tener un enfoque integral y multisectorial. Abordar un único indicador puede generar efectos limitados: por ejemplo, reducir la mortalidad infantil implica fortalecer la atención neonatal, pero también mejorar la educación, la nutrición y la planificación familiar. Del mismo modo, enfrentar el envejecimiento poblacional exige no solo sistemas de salud robustos, sino también reformas sociales y económicas que promuevan un envejecimiento activo y sostenible.

En conjunto, la matriz de correlación evidencia la interdependencia entre factores demográficos, económicos y sanitarios, lo que subraya la necesidad de políticas coordinadas entre sectores para lograr un desarrollo más equitativo y resiliente.

Análisis gráfico de distribución

Finalmente, se elaboraron una serie de gráficos complementarios —como diagramas de caja, barras y densidad— que permiten visualizar la dispersión y la asimetría de las variables seleccionadas. Estos gráficos facilitan una interpretación visual del comportamiento de los datos y permiten contrastar los resultados estadísticos previamente obtenidos.

Las representaciones gráficas posibilitan identificar países con comportamientos extremos, detectar patrones comunes entre regiones y confirmar las relaciones previamente observadas en el análisis de correlaciones.

En conjunto, los resultados descriptivos ofrecen una visión panorámica del estado global de la salud y el desarrollo de los países analizados, constituyendo un punto de partida esencial para la aplicación de los modelos de reducción de dimensionalidad y agrupamiento desarrollados en la siguiente sección.

Resultados del modelo

Análisis de Componentes Principales (ACP)

Después de aplicar el Análisis de Componentes Principales (ACP) sobre las variables seleccionadas, se obtiene una tabla que muestra la importancia relativa de cada componente principal (PC). Cada componente constituye una combinación lineal de las variables originales que resume una porción de la información total del conjunto de datos.

En la Figura 2 se presenta la gráfica de sedimentación (scree plot), donde se observa que las cuatro primeras componentes explican cerca del 79 % de la varianza total. Este resultado indica que dichas dimensiones concentran la mayor parte de la información relevante, por lo que se consideran suficientes para representar el espacio de datos.

library(factoextra)
library(plotly)
library(shiny)

# ---- 1. Base inicial ----
# Escalamos solo las columnas numéricas, pero mantenemos 'pais'
TCI_scaled <- as.data.frame(scale(Tabla_2 %>% select(-pais)))
TCI <- cbind(TCI_scaled, pais = Tabla_2$pais)

# ---- 2. Definir conjuntos de entrenamiento y prueba ----
predecir <- c(35,134,75,64,57)
TCI_test <- TCI[predecir, ]
TCI_train <- TCI[-predecir, ]

# ---- 3. PCA con países ----
res.pca <- prcomp(TCI_train %>% select(-pais), scale = TRUE)

# ---- 4. Segunda base ----
TCCI <- Tabla_2[-c(34,75), ]
TCCI_scaled <- as.data.frame(scale(TCCI %>% select(-pais)))
TCCI <- cbind(TCCI_scaled, pais = TCCI$pais)

predecir2 <- c(34,56,132,74,63)
TCCI_test2 <- TCCI[predecir2, ]
TCCI_train2 <- TCCI[-predecir2, ]

# ---- 5. Segundo PCA ----
res.pca2 <- prcomp(TCCI_train2 %>% select(-pais), scale = TRUE)

# ---- 6. Gráficos ----
m <- fviz_eig(res.pca, addlabels = TRUE, barfill = "#0073C2FF") +
  ggtitle("Varianza explicada por cada componente (Con China e India)")

o <- fviz_eig(res.pca2, addlabels = TRUE, barfill = "#0073C2FF") +
  ggtitle("Varianza explicada por cada componente (Sin China e India)")

# ---- 7. Menú interactivo ----
selectInput("graf", "Selecciona una gráfica:",
             choices = c("Con China e India" = "m",
                         "Sin China e India" = "o"),
             selected = "m")
renderPlotly({
  switch(input$graf,
         "m" = ggplotly(m),
         "o" = ggplotly(o))
})

El primer componente principal (PC1) concentra más del 50 % de la varianza total, lo que evidencia que resume gran parte de la información de las variables originales. Este componente se asocia a factores de desarrollo y bienestar sanitario, en los que influyen variables como la esperanza de vida, el gasto en salud (público y privado), la mortalidad infantil y materna, y las tasas de natalidad y mortalidad. En la práctica, los países con valores altos en el PC1 tienden a presentar mejores condiciones de salud pública, mayor inversión en sistemas sanitarios y poblaciones más longevas; mientras que los valores bajos reflejan contextos con menor gasto en salud, mayor mortalidad y condiciones sanitarias más precarias.

El segundo componente principal (PC2), que explica alrededor del 11 % de la varianza, representa diferencias estructurales en la composición poblacional. Está influido principalmente por variables como la tasa de dependencia (joven y anciana), el crecimiento poblacional y la tasa de fertilidad. Los países con valores altos en el PC2 suelen caracterizarse por poblaciones jóvenes y en crecimiento, mientras que los de valores bajos presentan estructuras más envejecidas y tasas de natalidad reducidas.

La incorporación del tercer (PC3) y cuarto (PC4) componentes eleva el porcentaje acumulado de varianza explicada hasta aproximadamente el 79 %, confirmando que estos cuatro ejes capturan la esencia de las relaciones entre las variables analizadas. A partir del quinto componente (PC5), el aporte marginal de información es inferior al 6 %, lo que indica que dichos componentes contienen principalmente variabilidad residual o ruido estadístico.

En conjunto, los resultados del ACP permiten reducir la complejidad del conjunto de datos y evidencian las principales dimensiones latentes del desarrollo sanitario mundial. Estas dimensiones servirán como base para la formación de grupos de países en la siguiente etapa del análisis, mediante la aplicación del método de clusterización jerárquica.

Visualización de países y variables en el plano factorial

Análisis de contribución de las variables por componentes

El análisis de las contribuciones de las variables en el modelo de Análisis de Componentes Principales (ACP) permitió identificar que cada dimensión está compuesta por un conjunto de indicadores que representan distintos aspectos demográficos, económicos y sanitarios.

En la Dimensión 1, las variables con mayor influencia son la tasa de natalidad (8,24%), la tasa de fertilidad (7,75%), la mortalidad infantil (8,11%), la mortalidad en menores de cinco años (7,93%) y la dependencia juvenil (8,10%). Estas variables se relacionan estrechamente con el crecimiento poblacional y las condiciones de salud infantil, por lo que esta dimensión se denominó ‘Dinámica demográfica y bienestar infantil’. En conjunto, los principales indicadores aportan aproximadamente un 40,13% a la construcción de este eje, reflejando la influencia de los factores de natalidad y mortalidad sobre la estructura poblacional.

La Dimensión 2 está dominada por la población rural (34,23%), la población total (32,66%), el gasto privado en salud (8,89%) y el gasto de bolsillo (7,60%). Estas variables evidencian la relación entre la concentración poblacional y la financiación privada de los servicios sanitarios, razón por la cual esta dimensión se denominó ‘Estructura poblacional y gasto sanitario’. En conjunto, estas variables representan cerca del 83,38% del peso total de la dimensión, lo que demuestra que está fuertemente influenciada por los factores demográficos.

La Dimensión 3 está determinada principalmente por la mortalidad total (25,24%), el gasto público per cápita (PPP) (11,20%), el gasto gubernamental en capital sanitario (13,17%) y la dependencia de ancianos (17,51%). Estos indicadores reflejan el grado de desarrollo de los sistemas de salud y el impacto del gasto público en la longevidad y el bienestar de la población, motivo por el cual se denominó ‘Inversión pública y envejecimiento poblacional’. En conjunto, estas variables explican alrededor del 67,12% del peso de esta dimensión.

Por último, la Dimensión 4 está configurada principalmente por la mortalidad total (15,41%), el gasto privado en salud (22,43%), la población total (8,92%) y la población rural (8,62%). Estas variables están asociadas a las condiciones sanitarias y a los patrones de mortalidad, mostrando diferencias entre países en cuanto al acceso y la eficacia de los servicios de salud. Por ello, esta dimensión se denominó ‘Condiciones sanitarias y mortalidad general’, con las variables principales aportando un 55,38% del total de la dimensión.

En síntesis, las cuatro dimensiones identificadas reflejan la interacción entre factores demográficos, económicos y sanitarios. Este resultado confirma que las desigualdades globales en salud no dependen de un solo factor, sino de combinaciones complejas entre estructura poblacional, inversión en salud y resultados epidemiológicos. Estas dimensiones servirán como base para la interpretación de los grupos de países obtenidos en el análisis de clusterización.

formacion de cluster

prediccion de grupos

Conclusiones

Bibliografía