1 INTRODUCCIÓN

En la actualidad, la salud pública global enfrenta múltiples desafíos interconectados que reflejan profundas desigualdades entre países. Enfermedades transmisibles como el VIH/SIDA y la tuberculosis continúan siendo amenazas persistentes en regiones vulnerables, mientras que los indicadores de esperanza de vida, mortalidad infantil o acceso a servicios básicos de salud muestran diferencias estructurales que trascienden el ámbito sanitario. En este sentido, el análisis comparativo de variables relacionadas con la salud permite no solo identificar patrones epidemiológicos, sino también comprender cómo los determinantes sociales, económicos y ambientales influyen en el bienestar de las poblaciones.

Desde esta perspectiva, el análisis de variables de salud adquiere relevancia al permitir identificar patrones y asociaciones que no son evidentes a simple vista. La base de datos utilizada en este estudio proveniente del Banco Mundial y correspondiente al año 2019, integra indicadores relacionados con enfermedades infecciosas (como el VIH y la tuberculosis), salud general (esperanza de vida, mortalidad, vacunación, gasto per cápita en salud), condiciones ambientales y de saneamiento, así como variables demográficas y de cobertura sanitaria. El año 2019 fue seleccionado por su importancia contextual, al representar la situación sanitaria global inmediatamente antes del impacto del COVID-19, lo que permite establecer una línea base para comprender las condiciones estructurales previas a la pandemia. Este conjunto de variables ofrece una visión integral del estado de salud mundial y de las desigualdades entre países desarrollados y en vías de desarrollo, evidenciando las interrelaciones entre inversión pública, cobertura de salud y resultados sanitarios.

El problema central que orienta este trabajo radica en identificar las desigualdades globales en salud a partir de variables cuantitativas que reflejan condiciones epidemiológicas y sociales diversas. Para ello, se aplican técnicas de aprendizaje no supervisado, como el Análisis de Componentes Principales (ACP) y la clusterización jerárquica (método de Ward), constituye una herramienta idónea para abordar este tipo de problemas multivariantes. Estas metodologías permiten reducir la complejidad de los datos y descubrir patrones ocultos sin necesidad de variables dependientes o hipótesis previas, lo que posibilita una segmentación empírica de los países según sus condiciones sanitarias y socioeconómicas.

Comprender estas disparidades no sólo es útil para la investigación estadística, sino que tiene profundas implicaciones en la formulación de políticas públicas y estrategias internacionales orientadas a garantizar la equidad sanitaria. En consecuencia, el presente análisis busca explorar la distribución, variabilidad y relación entre indicadores clave de salud, con el propósito de aportar evidencia empírica que contribuya a una lectura crítica de las condiciones de vida y bienestar en el ámbito mundial.

2 METODOLOGÍA

2.1 MÉTODOS UTILIZADOS

El presente estudio se desarrolló a partir de un enfoque cuantitativo y exploratorio, orientado a identificar patrones, relaciones y agrupamientos entre diferentes indicadores de salud pública a nivel internacional. Este enfoque resulta pertinente dado que el objetivo no es comprobar una hipótesis específica, sino descubrir estructuras latentes que explican las desigualdades sanitarias entre países. Para ello, se empleó una base de datos compuesta por variables asociadas al estado sanitario global, que incluyen aspectos como mortalidad, incidencia de enfermedades, cobertura de servicios básicos, gasto en salud y esperanza de vida, entre otros.

El proceso metodológico comprendió varias etapas consecutivas:

1. Depuración y preparación de los datos: En una primera etapa, se realizó un proceso de limpieza y adecuación de la base de datos, en el cual se renombraron las variables para facilitar su interpretación y se convirtieron los valores no numéricos (“NA”, “N/A”, cadenas vacías) en datos faltantes, con el fin de evitar sesgos en los cálculos estadísticos. Posteriormente, se eliminaron los registros incompletos, obteniendo una base de datos final libre de valores ausentes y con variables cuantitativas correctamente tipificadas. Esta depuración fue esencial para garantizar la consistencia y comparabilidad entre países, evitando distorsiones derivadas de valores faltantes o errores de codificación

2. Análisis descriptivo inicial: Se calcularon medidas estadísticas básicas (media, mediana, moda, desviación estándar, valores mínimos y máximos) con el propósito de caracterizar la tendencia central y la dispersión de cada indicador. Este análisis permitió identificar países con comportamientos extremos y variables con alta variabilidad, lo que sugiere diferencias estructurales en los niveles de desarrollo sanitario. Los resultados se sintetizaron en una tabla de estadísticas descriptivas, que permitió identificar variables con alta variabilidad o presencia de valores atípicos y orientar la interpretación posterior del ACP.

3. Exploración gráfica: Con el fin de visualizar la distribución de los datos, se elaboraron diagramas de caja (boxplots) para cada variable, divididos en dos bloques. Estos gráficos facilitaron la detección de asimetrías, valores extremos y rangos de variación, elementos esenciales para entender la heterogeneidad de los países en cada indicador. De forma complementaria, se construyó un mapa de calor (heatmap) a partir de la matriz de correlaciones, lo que permitió identificar relaciones directas e inversas entre indicadores de salud, gasto público y condiciones de vida. Esta etapa aportó una comprensión preliminar de las interdependencias entre los determinantes de la salud global.

4. Análisis multivariado: Para sintetizar la información y reducir la dimensionalidad de la base de datos, se aplicó un Análisis de Componentes Principales (ACP). Esta técnica permitió agrupar las variables correlacionadas en un conjunto menor de componentes que explican la mayor parte de la varianza total. Los resultados del ACP se analizaron mediante biplots y círculos de correlaciones, que facilitaron la interpretación de las dimensiones más relevantes y de las variables con mayor contribución a la diferenciación entre países.

5. Segmentación y clasificación de países: A partir de las coordenadas obtenidas del ACP, se realizó una clusterización jerárquica utilizando el método de Ward,donde se maximiza la varianza entre grupos, con el objetivo de clasificar los países en grupos homogéneos según sus características sanitarias. Este procedimiento permitió construir un dendrograma que evidenció la estructura de similitud entre los países, y con base en la interpretación de los saltos del gráfico se definieron tres clusters representativos. Para validar la consistencia de la segmentación, también se aplicó un análisis no jerárquico (k-means) sobre las coordenadas principales, comparando la estabilidad de los grupos obtenidos. Finalmente, se calcularon los promedios de los indicadores por grupo, lo que permitió caracterizar el perfil sanitario de cada cluster e interpretar los patrones comunes entre los países que los componen.

2.2 VARIABLES

Las variables incluidas en el análisis fueron seleccionadas con el propósito de representar de manera integral los principales determinantes y resultados en salud pública a nivel mundial. Se agrupan en cinco dimensiones conceptuales: enfermedades transmisibles, salud general, condiciones ambientales, indicadores poblacionales y cobertura sanitaria. Esta organización permite comprender las interrelaciones entre factores epidemiológicos, estructurales y sociales que definen el bienestar sanitario de los países.

2.3 TABLA DE VARIABLES

#TABLA DE VARIABLES

variables_salud <- data.frame(
  Variable = c(
    "AdultosYNiñosHIV", "MuertesAIDS", 
    "IncidenciaTuberculosis", "DeteccionTuberculosis", "MuerteTuberculosis", 
    "TratamientoTuberculosis", "ExpectativaVidaNacer", "PerCapitaSalud", 
    "MortalidadInfantil", "MortalidadGeneral", "VacunaDPT", 
    "MortalidadAguaContaminada", "SobrepesoAdultos", "SaneamientoBasico", 
    "UHC", "MortalidadECV", "AccesoServiciosAgua"
  ),
  
  Descripción = c(
    "Número de adultos y niños viviendo con VIH",
    "Número estimado de muertes relacionadas con el SIDA",
    "Casos nuevos de tuberculosis por cada 100.000 habitantes",
    "Porcentaje de casos de tuberculosis detectados y notificados",
    "Tasa de mortalidad por tuberculosis (por 100.000 habitantes)",
    "Porcentaje de éxito en tratamientos de tuberculosis",
    "Esperanza de vida al nacer (años)",
    "Gasto en salud per cápita (US$ corrientes)",
    "Tasa de mortalidad infantil (por 1.000 nacidos vivos)",
    "Tasa de mortalidad general (por 1.000 habitantes)",
    "Cobertura de vacunación DPT (% de niños 12–23 meses)",
    "Muertes atribuibles a consumo de agua contaminada (por 100.000 hab.)",
    "Porcentaje de adultos con sobrepeso (IMC ≥ 25)",
    "Porcentaje de población con acceso a saneamiento básico",
    "Índice de Cobertura Universal en Salud (UHC Service Coverage Index)",
    "Tasa de mortalidad por enfermedades cardiovasculares (por 100.000 hab.)",
    "Porcentaje de población con acceso a servicios de agua potable"
  )
)

tabla_salud <- kable(
  variables_salud, 
  format = "html",
  col.names = c("Variable", "Descripción"),
  align = c('l', 'l'),
) %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = FALSE,
    font_size = 13,
    position = "center"
  ) %>%
  row_spec(0, background = "#2b6cb0", color = "white", bold = TRUE) %>%
  column_spec(1, bold = TRUE, width = "3cm") %>%
  column_spec(2, width = "10cm") %>%
  footnote(
    general = "",
    general_title = "",
    footnote_as_chunk = TRUE
  )

tabla_salud
Variable Descripción
AdultosYNiñosHIV Número de adultos y niños viviendo con VIH
MuertesAIDS Número estimado de muertes relacionadas con el SIDA
IncidenciaTuberculosis Casos nuevos de tuberculosis por cada 100.000 habitantes
DeteccionTuberculosis Porcentaje de casos de tuberculosis detectados y notificados
MuerteTuberculosis Tasa de mortalidad por tuberculosis (por 100.000 habitantes)
TratamientoTuberculosis Porcentaje de éxito en tratamientos de tuberculosis
ExpectativaVidaNacer Esperanza de vida al nacer (años)
PerCapitaSalud Gasto en salud per cápita (US$ corrientes)
MortalidadInfantil Tasa de mortalidad infantil (por 1.000 nacidos vivos)
MortalidadGeneral Tasa de mortalidad general (por 1.000 habitantes)
VacunaDPT Cobertura de vacunación DPT (% de niños 12–23 meses)
MortalidadAguaContaminada Muertes atribuibles a consumo de agua contaminada (por 100.000 hab.)
SobrepesoAdultos Porcentaje de adultos con sobrepeso (IMC ≥ 25)
SaneamientoBasico Porcentaje de población con acceso a saneamiento básico
UHC Índice de Cobertura Universal en Salud (UHC Service Coverage Index)
MortalidadECV Tasa de mortalidad por enfermedades cardiovasculares (por 100.000 hab.)
AccesoServiciosAgua Porcentaje de población con acceso a servicios de agua potable

Descripción individual de las variables seleccionadas.

1. Enfermedades transmisibles: VIH/SIDA y tuberculosis.

- AdultosYNiñosHIV: Mide el número total de adultos y niños que viven con VIH en un país. Su inclusión permite dimensionar la magnitud de una de las principales epidemias a nivel mundial y evaluar la capacidad de los sistemas de salud para ofrecer diagnóstico, tratamiento antirretroviral y prevención.

- MuertesAIDS: Esta variable refleja directamente la efectividad de las políticas de tratamiento y prevención, ya que una menor tasa de mortalidad suele estar asociada a una mejor cobertura antirretroviral y programas de educación sexual. Su análisis permite identificar los países que aún enfrentan altos niveles de mortalidad debido a deficiencias en la atención médica o en la detección temprana. Además, complementa el indicador anterior al mostrar las consecuencias fatales de la epidemia en ausencia de intervención eficaz.

- IncidenciaTuberculosis: Mide los nuevos casos de tuberculosis por cada 100.000 habitantes. Esta variable fue seleccionada porque la tuberculosis sigue siendo una de las principales causas de morbilidad en países de ingresos medios y bajos. La incidencia permite evaluar la intensidad de transmisión de la enfermedad y la efectividad de las estrategias de control.

- DetecciónTuberculosis: Corresponde al porcentaje de casos de tuberculosis detectados y notificados oficialmente. Es fundamental ya que revela la capacidad de vigilancia epidemiológica del sistema de salud. Un nivel alto indica un sistema eficiente en diagnóstico y seguimiento; en cambio, niveles bajos implican subregistro y riesgo de propagación no controlada. Su inclusión busca reflejar la eficacia institucional y la disponibilidad de recursos diagnósticos.

- MuerteTuberculosis: Expresa la tasa de mortalidad por tuberculosis (por cada 100.000 habitantes). Este indicador complementa la incidencia, mostrando la gravedad del problema y la efectividad de los tratamientos. Un valor alto suele relacionarse con acceso limitado a medicamentos o diagnóstico tardío. Es relevante porque resume los impactos letales de una enfermedad prevenible y curable, lo que refleja inequidades estructurales en salud.

- TratamientoTuberculosis: Su análisis permite medir el rendimiento operativo del sistema sanitario frente a enfermedades infecciosas. Indica el porcentaje de éxito en los tratamientos de tuberculosis. Se utiliza como un reflejo directo de la calidad y continuidad de la atención médica.

Estas variables reflejan la dimensión infecciosa de la salud mundial y sirven como indicadores sensibles de la desigualdad estructural entre países

2. Salud general y desempeño del sistema sanitario.

- ExpectativaVidaNacer: Es uno de los indicadores más integrales del desarrollo humano, ya que sintetiza los resultados de múltiples dimensiones: calidad de la atención médica, condiciones de vida, nutrición, educación y seguridad.

- PerCapitaSalud: Indica el gasto promedio en salud por persona, medido en dólares corrientes. Es una medida fundamental del esfuerzo económico destinado a garantizar el bienestar sanitario. Su análisis permite examinar la relación entre inversión pública/privada y los resultados en salud (como mortalidad o esperanza de vida). Países con alto gasto per cápita suelen mostrar mejores indicadores, aunque no siempre de forma proporcional, lo cual permite reflexionar sobre la eficiencia del gasto y las políticas de equidad.

- MortalidadInfantil: Expresa el número de muertes de niños menores de un año por cada 1.000 nacidos vivos. Este indicador se considera uno de los más sensibles para evaluar las condiciones de salud y desarrollo de un país. Su inclusión permite captar la dimensión humana y social de las desigualdades sanitarias, así como los progresos en salud materno-infantil.

- MortalidadGeneral: Corresponde al número total de muertes por cada 1.000 habitantes. Es un indicador amplio que resume el impacto de todas las causas de mortalidad en la población. Aunque no distingue entre tipos de enfermedades, permite establecer una medida general del estado de salud de la población y sirve como punto de referencia para comparar los efectos combinados de las políticas públicas y las condiciones socioeconómicas.

- VacunaDPT: Representa el porcentaje de niños entre 12 y 23 meses que han recibido la vacuna DPT (difteria, tos ferina y tétanos). Este indicador es esencial para medir el alcance de los programas de inmunización y la capacidad del sistema sanitario para prevenir enfermedades evitables.

Estas variables, en conjunto, miden la capacidad de los países para garantizar el acceso universal a servicios esenciales y mantener una población saludable, sirviendo como base para identificar brechas de desarrollo humano.

3. Condiciones ambientales y de saneamiento

- MortalidadAguaContaminada: Indica las muertes atribuibles al consumo de agua contaminada por cada 100.000 habitantes. El acceso a agua potable es un derecho básico, por lo que altos niveles de mortalidad reflejan fallas estructurales en saneamiento, infraestructura y equidad social.

- SaneamientoBasico: Refleja el porcentaje de población con acceso a instalaciones de saneamiento adecuadas (como baños o sistemas de alcantarillado). Esta variable permite evaluar el impacto de la infraestructura y las políticas públicas en la salud colectiva. La falta de saneamiento está estrechamente relacionada con enfermedades infecciosas, mortalidad infantil y contaminación ambiental.

- AccesoServiciosAgua: Mide el porcentaje de población con acceso a servicios de agua potable. Esta variable completa la visión ambiental y estructural de la salud, mostrando las diferencias en infraestructura básica entre países. La disponibilidad de agua segura influye directamente en la incidencia de enfermedades gastrointestinales y en la calidad de vida.

El análisis de estas variables permite reconocer cómo los determinantes ambientales influyen directamente en la incidencia de enfermedades infecciosas y en la mortalidad infantil.

4. Indicadores poblacionales y transiciones epidemiológicas.

- SobrepesoAdultos: Se eligió porque el sobrepeso se ha convertido en problemas de salud pública global, vinculado con enfermedades crónicas no transmisibles (ECV, diabetes, hipertensión). Analizar esta variable permite observar la transición epidemiológica que experimentan muchos países hacia estilos de vida menos saludables y sus implicaciones económicas y sociales.

- MortalidadECV: Refleja la tasa de mortalidad por enfermedades cardiovasculares (por cada 100.000 habitantes). Permite evaluar cómo los factores de riesgo (dieta, actividad física, estrés) y la atención médica inciden en la salud adulta.

Ambas variables ilustran la transición epidemiológica global: mientras algunos países aún luchan contra enfermedades infecciosas, otros enfrentan los efectos del sedentarismo y la dieta no saludable

5. Cobertura sanitaria.

- UHC (Cobertura Universal en Salud): El índice UHC mide el nivel de cobertura efectiva de servicios de salud esenciales en un país. Representa la capacidad del sistema sanitario para ofrecer atención accesible y de calidad sin que las personas enfrenten dificultades financieras.

La base de datos final incluye información de 130 países, seleccionados por contar con registros completos para el año 2019, considerado un punto de referencia previo a los efectos de la pandemia de COVID-19. Cada fila representa un país y cada columna, una variable cuantitativa asociada a los indicadores antes descritos.

Se excluyeron territorios no soberanos y observaciones con valores faltantes para garantizar consistencia estadística y comparabilidad internacional. A continuación, se presenta la tabla de la base de datos utilizada, junto con las variables seleccionadas para el análisis:

2.4 TABLA DE DATOS

Ano Pais AdultosyNinosHIV MuertesAIDS IncidenciaTuberculosis DeteccionTuberculosis MuerteTuberculosis TratamientoTuberculosis ExpectativaVidaNacer PerCapitaSalud MortalidadInfantil MortalidadGeneral VacunaDPT MortalidadAguaContaminada SobrepesoAdultos SaneamientoBasico UHC MortalidadECV AccesoServiciosAgua
1 2019 Afghanistan 11000 690 189.00 73 26.00 91 62.94100 320.82699 56.9 7.064000 65 16.6 43.77 51.003481 42 34.4 73.78464
2 2019 Albania 1400 100 16.00 87 0.29 88 79.46700 992.41248 8.0 7.473000 99 3.2 60.93 99.183069 64 11.3 94.75822
3 2019 Algeria 23000 500 61.00 80 6.60 86 75.68200 729.48763 20.7 4.681000 88 4.1 55.58 86.138504 74 14.0 94.23914
4 2019 Angola 310000 17000 351.00 65 53.00 69 63.05100 173.05660 43.8 7.701000 57 48.9 30.22 51.393623 39 24.6 56.88304
5 2019 Armenia 4800 100 26.00 81 1.20 82 76.22195 1649.65063 10.7 8.800000 92 5.8 54.07 93.857872 70 20.2 99.92817
6 2019 Australia 29000 100 6.80 87 0.18 86 82.90000 5450.58697 3.2 6.700000 95 1.9 63.00 100.000000 87 9.0 99.96985
7 2019 Azerbaijan 9600 200 60.00 80 5.90 84 73.29000 624.19559 16.6 5.600000 94 3.6 60.28 96.129030 67 19.3 95.66775
8 2019 Bahamas, The 4100 100 15.00 87 0.58 75 71.40800 2152.24023 15.7 9.321000 89 2.6 74.23 94.930582 79 20.3 98.88696
9 2019 Bangladesh 14000 600 221.00 80 24.00 95 72.62500 129.13426 25.4 5.372000 98 18.2 23.44 54.910240 50 19.2 97.82514
10 2019 Belarus 26000 500 29.00 80 2.40 89 74.22683 1176.52857 2.4 12.800000 98 1.6 54.91 99.340761 81 24.4 98.39199
11 2019 Belgium 18000 100 9.00 87 0.29 81 81.99512 6110.09912 3.3 9.500000 97 5.3 51.01 99.486199 87 10.0 100.00000
12 2019 Belize 3600 200 27.00 88 1.80 66 72.57700 454.55008 11.4 5.040000 98 4.3 71.16 88.198504 69 16.1 98.40055
13 2019 Benin 75000 2400 55.00 61 7.80 89 59.88800 79.72821 51.8 9.335000 72 60.2 28.53 18.629855 35 21.3 66.67227
14 2019 Bhutan 1000 100 164.00 80 18.00 94 72.00500 424.02038 21.1 6.350000 97 15.7 42.84 75.403670 60 16.7 98.87231
15 2019 Bolivia 26000 740 106.00 61 10.00 83 67.82000 617.92742 23.0 7.555000 75 14.3 62.26 63.816310 65 16.6 92.56595
16 2019 Botswana 350000 4400 253.00 52 28.00 72 67.16700 1032.23814 42.3 6.408000 95 26.8 40.48 79.751689 55 19.5 92.22140
17 2019 Brazil 900000 14000 46.00 91 2.50 69 75.80900 1502.48133 13.0 6.452000 70 6.6 59.91 89.298796 81 15.1 98.93554
18 2019 Bulgaria 3200 100 23.00 80 1.40 82 75.11220 1804.21032 5.5 16.300000 93 2.9 51.39 86.024724 76 24.0 99.14488
19 2019 Burkina Faso 100000 3600 47.00 50 9.70 81 60.18400 117.76923 50.2 8.564000 91 60.9 19.37 22.824069 38 24.1 49.00285
20 2019 Burundi 83000 1800 107.00 52 21.00 94 62.18000 66.69831 35.6 7.394000 93 53.3 15.00 45.745276 42 23.9 62.09432
21 2019 Cabo Verde 3300 100 49.00 80 4.30 89 75.44900 404.85758 13.2 5.004000 96 12.1 44.09 78.824956 69 17.3 88.59087
22 2019 Cambodia 77000 1400 287.00 63 17.00 96 70.12700 313.47016 23.5 6.189000 88 17.1 22.05 66.957416 58 23.3 75.33672
23 2019 Cameroon 490000 15000 179.00 53 29.00 86 61.69500 144.53820 46.8 8.163000 67 47.3 38.07 42.400858 43 24.9 67.99048
24 2019 Canada 62000 500 5.80 87 0.21 79 82.16366 5560.36096 4.5 7.600000 91 2.3 59.01 98.757327 91 9.6 99.22165
25 2019 Central African Republic 120000 5400 540.00 45 98.00 81 31.53000 75.33767 124.3 30.250000 42 97.0 21.83 14.481982 31 32.5 38.21227
26 2019 Chad 120000 3500 142.00 58 22.00 80 52.99300 70.17754 65.5 12.519000 50 99.2 19.77 12.294019 27 24.0 50.49806
27 2019 China 1250000 34000 58.00 88 2.20 94 77.94000 884.98067 6.0 7.090000 99 2.2 34.58 91.288136 81 16.0 95.31737
28 2019 Colombia 170000 2000 35.00 81 2.40 75 76.79300 1258.85478 12.4 5.380000 94 3.4 58.02 92.151092 80 10.3 96.89252
29 2019 Congo, Dem. Rep.  490000 20000 320.00 60 49.00 92 60.24200 36.85119 49.8 9.460000 73 52.3 19.96 16.416663 40 24.7 35.67806
30 2019 Congo, Rep.  130000 7100 373.00 56 52.00 72 63.15200 99.37222 33.0 7.344000 79 26.4 23.78 20.364263 39 23.0 73.59587
31 2019 Cote d’Ivoire 430000 13000 137.00 55 21.00 84 60.27400 159.52195 52.3 8.492000 79 47.0 32.63 34.777968 41 23.3 72.54106
32 2019 Cuba 38000 500 6.50 88 0.31 82 77.41300 2578.01886 5.4 10.047000 99 9.7 53.07 90.656190 83 16.8 94.14848
33 2019 Cyprus 1300 100 5.90 87 0.19 28 81.45400 3179.28448 2.6 6.600000 95 1.6 53.91 99.395816 81 9.0 99.76519
34 2019 Czechia 3500 100 5.00 87 0.21 74 79.22927 3422.44659 2.4 10.500000 97 4.1 58.40 99.137135 83 14.3 99.88047
35 2019 Denmark 6800 100 5.10 87 0.17 45 81.45122 6180.27343 3.3 9.300000 97 4.1 44.85 99.597232 82 11.1 100.00000
36 2019 Dominican Republic 74000 2300 42.00 79 1.80 80 73.11200 802.13521 30.9 6.132000 89 5.8 60.93 87.203108 75 18.6 96.14011
37 2019 Ecuador 43000 500 46.00 80 3.30 80 77.28600 922.83608 11.7 4.753000 85 4.7 64.66 90.003241 79 11.5 95.01122
38 2019 Egypt, Arab Rep.  23000 500 12.00 65 0.43 87 71.21300 554.68299 18.4 5.477000 95 4.8 72.56 97.200558 70 27.4 98.76142
39 2019 El Salvador 22000 500 60.00 80 0.97 90 71.72500 835.52037 10.6 7.439000 96 6.1 64.98 86.821606 78 13.0 97.82035
40 2019 Estonia 7200 100 13.00 87 1.20 76 78.64634 2702.26655 1.9 11.600000 91 2.6 56.15 99.077158 79 15.1 99.98729
41 2019 Eswatini 230000 3100 363.00 67 22.00 86 59.85000 742.75272 48.2 9.372000 90 46.5 54.53 64.521431 58 35.1 70.42753
42 2019 Ethiopia 630000 15000 140.00 69 19.00 90 65.74100 72.71867 41.0 6.481000 68 40.7 9.76 8.652039 36 17.2 47.25398
43 2019 Fiji 1400 100 66.00 78 4.40 30 67.00900 593.39126 20.6 9.092000 97 10.8 64.10 93.709941 59 38.8 95.38331
44 2019 France 190000 700 9.00 83 0.55 12 82.82683 5705.14150 3.3 9.100000 96 3.4 35.76 98.648415 84 10.1 100.00000
45 2019 Gabon 49000 2000 521.00 46 84.00 67 67.33700 413.21197 29.7 6.693000 70 17.5 44.91 49.784825 49 21.5 85.98402
46 2019 Gambia, The 26000 1400 158.00 68 19.00 84 64.42700 69.75344 38.4 6.807000 88 29.5 37.51 47.201409 46 23.0 83.89902
47 2019 Georgia 7400 100 74.00 77 3.80 85 74.16500 1019.25424 8.3 12.081000 94 3.3 63.72 86.532078 69 22.4 94.43603
48 2019 Germany 87000 500 6.10 91 0.32 69 81.29268 6830.81144 3.1 11.300000 91 3.2 54.13 99.225384 88 11.8 100.00000
49 2019 Ghana 340000 16000 144.00 33 34.00 84 64.45500 182.89056 32.6 7.340000 97 25.2 34.98 24.996073 46 22.8 85.24234
50 2019 Guatemala 30000 580 26.00 82 2.10 85 71.63900 541.90891 20.4 5.117000 88 15.3 60.90 68.243669 61 15.5 93.50771
51 2019 Guinea 120000 4900 176.00 72 19.00 89 59.37900 107.17321 67.4 9.945000 47 57.8 26.31 27.606398 39 24.5 67.67525
52 2019 Guinea-Bissau 35000 1500 361.00 34 72.00 73 62.16100 146.10569 48.3 7.863000 78 49.4 30.05 24.981106 36 26.1 61.37447
53 2019 Guyana 8900 200 77.00 80 11.00 71 69.06700 648.05991 27.0 7.503000 99 8.6 54.51 89.149890 77 27.8 94.94836
54 2019 Haiti 130000 2700 170.00 69 8.90 84 64.32800 125.56307 45.0 7.876000 51 25.9 28.88 36.938528 53 32.7 66.32099
55 2019 Honduras 20000 720 31.00 78 4.60 89 72.12400 426.79705 15.1 4.486000 88 7.1 61.74 81.952553 66 20.3 94.60685
56 2019 Iceland 500 100 4.10 87 0.34 100 83.16341 5227.25494 2.0 6.300000 92 2.4 56.81 98.781102 89 8.6 100.00000
57 2019 India 2500000 59000 202.00 77 23.00 84 70.74600 202.82311 29.7 6.670000 91 36.4 26.47 69.663146 64 23.7 91.56222
58 2019 Indonesia 550000 27000 312.00 66 34.00 83 70.34900 352.02312 19.3 7.558000 85 15.8 34.12 82.072701 56 24.2 91.81374
59 2019 Iran, Islamic Rep.  46000 2300 13.00 76 1.00 85 76.85500 915.96956 12.1 4.659000 99 2.9 58.63 90.021087 75 14.9 97.32361
60 2019 Iraq 2600 100 28.00 57 2.10 94 71.24500 461.70657 23.6 4.360000 84 4.4 71.67 97.864853 58 22.4 97.77879
61 2019 Ireland 7400 100 5.80 87 0.14 4 82.70244 6144.64388 3.0 6.200000 94 2.7 64.19 89.307391 82 9.9 96.00410
62 2019 Jamaica 29000 840 3.20 84 0.24 66 71.53200 648.96349 17.8 7.531000 96 2.3 59.08 86.631604 77 19.3 90.99735
63 2019 Jordan 570 100 5.50 76 0.09 82 76.86500 704.69775 13.6 3.033000 89 1.9 70.08 97.221489 67 12.7 98.95137
64 2019 Kenya 1400000 20000 267.00 62 37.00 86 62.93900 208.51188 37.2 7.294000 93 29.0 31.29 35.295795 51 19.1 60.86078
65 2019 Kuwait 770 100 20.00 87 0.39 74 81.96976 2642.75521 7.6 1.644638 92 0.8 77.65 100.000000 77 10.1 100.00000
66 2019 Kyrgyz Republic 9200 200 110.00 86 4.40 81 71.60000 231.85300 16.1 5.200000 95 2.3 56.08 97.777714 71 22.7 89.85881
67 2019 Lao PDR 16000 500 155.00 61 27.00 90 67.91100 212.54206 40.4 6.599000 80 20.5 28.22 78.948092 51 27.1 85.09983
68 2019 Lebanon 2700 100 15.00 87 1.00 80 78.20800 1553.97224 12.8 5.458000 76 2.4 64.29 99.067379 74 12.1 92.60000
69 2019 Lesotho 290000 5000 654.00 49 57.00 78 55.24900 565.59255 63.3 11.830000 87 108.1 40.57 48.427925 53 36.9 72.87738
70 2019 Liberia 34000 1400 308.00 53 56.00 75 61.23200 122.76556 58.2 8.513000 70 34.6 34.95 20.761974 43 22.0 74.16096
71 2019 Libya 7200 100 59.00 54 12.00 70 72.94100 1231.62605 9.2 5.165000 73 2.2 66.71 92.106002 64 20.9 99.89152
72 2019 Lithuania 3400 100 41.00 87 4.20 87 76.28293 2834.09038 3.3 13.600000 92 2.6 57.83 93.768325 75 19.8 98.00147
73 2019 Luxembourg 1200 100 8.90 87 0.23 36 82.63902 6700.66965 2.1 6.900000 99 1.9 51.59 97.594263 86 8.6 99.87670
74 2019 Madagascar 54000 2700 233.00 57 44.00 82 63.50400 50.00874 44.5 7.518000 70 40.1 15.19 13.169337 33 26.5 51.17221
75 2019 Malawi 1000000 14000 146.00 61 14.00 88 64.99500 99.94220 33.6 6.301000 95 30.8 22.47 42.803838 48 26.1 69.46488
76 2019 Malaysia 85000 2500 92.00 83 5.10 80 75.90000 1086.65445 6.7 4.980000 98 14.4 52.41 95.880234 78 19.7 97.09037
77 2019 Maldives 100 100 36.00 87 2.10 61 79.70700 1697.84741 6.4 2.579000 98 2.3 48.62 98.268428 68 12.6 99.52721
78 2019 Mali 120000 5500 52.00 63 7.60 82 59.21700 86.47464 63.7 9.475000 77 66.1 30.79 44.797697 40 24.2 79.27972
79 2019 Mauritania 8200 500 89.00 63 16.00 81 67.64000 170.54567 34.8 6.115000 80 37.8 44.85 49.589394 36 18.4 72.54431
80 2019 Mexico 330000 5300 23.00 81 1.80 72 74.53000 1111.38885 12.2 6.083000 82 3.5 72.05 90.776558 74 15.3 99.11535
81 2019 Moldova 15000 500 80.00 110 5.30 84 70.18100 859.53687 13.7 13.919000 91 3.6 59.92 82.989826 72 24.0 90.69569
82 2019 Mongolia 590 100 428.00 31 10.00 88 71.05317 583.79219 12.8 5.600000 98 3.2 55.74 67.792340 67 28.7 81.43561
83 2019 Montenegro 500 100 15.00 89 0.20 95 76.68293 2045.05829 2.6 10.500000 85 1.8 49.09 97.502299 72 20.9 98.68140
84 2019 Morocco 21000 500 97.00 88 7.90 89 74.24500 435.44825 18.0 5.629000 99 4.6 53.36 86.328234 68 22.6 84.98185
85 2019 Mozambique 2300000 49000 361.00 89 19.00 94 61.30600 107.70056 49.7 8.078000 85 45.6 24.59 33.350311 43 28.7 57.57537
86 2019 Myanmar 270000 7100 322.00 79 36.00 88 66.45700 208.77198 38.9 8.847000 90 12.9 25.27 73.165319 60 25.6 78.90934
87 2019 Namibia 210000 3600 486.00 61 57.00 87 63.54600 808.96376 44.6 7.722000 87 28.8 35.16 34.960775 62 22.8 84.83948
88 2019 Nepal 30000 730 238.00 47 58.00 89 69.29900 184.41678 27.3 7.024000 93 17.8 27.44 72.880128 50 20.4 90.28637
89 2019 Netherlands 24000 100 4.90 87 0.11 86 82.11220 6217.20444 3.5 8.800000 94 3.4 46.35 97.694408 85 10.0 100.00000
90 2019 New Zealand 3400 100 7.20 87 0.26 83 82.05610 4288.51326 4.3 6.870000 92 2.1 66.50 100.000000 85 10.4 100.00000
91 2019 Nicaragua 11000 500 43.00 81 1.50 88 73.76400 491.61882 12.1 4.950000 98 3.5 65.77 72.969399 73 12.8 81.61224
92 2019 Niger 34000 1300 84.00 59 16.00 83 60.03100 73.61729 69.5 9.573000 81 70.3 16.91 14.790038 34 20.6 47.36668
93 2019 North Macedonia 500 100 12.00 88 0.44 89 76.60244 1412.93395 6.1 9.800000 92 1.0 60.60 97.879171 74 19.3 97.72562
94 2019 Oman 2500 100 9.20 87 0.36 48 79.94600 1345.07210 8.7 2.001000 99 1.6 63.94 99.320038 70 20.3 91.88826
95 2019 Pakistan 200000 8600 263.00 54 19.00 93 66.72900 148.10311 56.8 6.772000 84 38.8 49.86 65.389936 44 26.3 90.19065
96 2019 Panama 27000 500 37.00 80 4.80 83 78.51400 2779.18297 12.7 4.719000 88 4.2 68.97 83.378552 79 11.1 94.18250
97 2019 Papua New Guinea 58000 990 432.00 74 47.00 71 65.33100 95.03245 36.1 6.624000 35 24.9 49.68 19.149287 30 30.7 47.07673
98 2019 Paraguay 19000 500 46.00 94 3.90 67 73.66800 1018.23418 17.2 5.584000 86 4.6 66.76 91.715674 74 16.5 99.59111
99 2019 Peru 93000 1100 119.00 83 7.30 83 76.27500 702.30297 14.2 6.160000 88 7.6 64.73 76.709439 75 10.7 93.00324
100 2019 Philippines 100000 800 554.00 67 27.00 86 69.68000 377.78833 22.7 5.896000 84 16.9 32.62 81.251027 60 25.3 93.63736
101 2019 Portugal 45000 500 19.00 87 1.80 71 81.67561 3603.89656 2.8 10.800000 99 6.8 54.60 99.645117 87 11.2 99.21959
102 2019 Qatar 560 100 35.00 87 0.28 73 82.94500 3023.11597 5.4 0.841000 98 0.4 75.73 99.936546 75 12.9 99.97053
103 2019 Romania 19000 200 65.00 87 4.70 84 75.60732 1912.92549 5.6 13.400000 88 7.2 62.11 86.541583 79 21.1 100.00000
104 2019 Russia 1430000 19000 50.00 100 5.50 68 73.08390 1695.36590 4.7 12.300000 97 3.2 57.48 88.707420 79 24.0 96.79553
105 2019 Rwanda 240000 3100 57.00 79 4.90 87 66.69100 143.76721 31.8 6.132000 98 25.0 17.70 71.206525 47 20.4 62.41174
106 2019 Sao Tome and Principe 1200 100 114.00 58 19.00 70 68.04300 199.62419 11.3 6.117000 95 16.7 40.08 45.120100 60 20.6 77.33578
107 2019 Saudi Arabia 8100 200 11.00 91 0.64 90 78.31300 3151.00621 5.8 2.295000 96 1.9 71.08 95.323576 72 14.3 98.66034
108 2019 Senegal 41000 1300 117.00 70 16.00 91 67.66800 157.29120 34.9 5.979000 96 31.7 28.66 57.049034 51 22.4 82.69753
109 2019 Serbia 3400 100 14.00 110 0.73 85 75.93659 1701.61011 4.8 14.600000 97 3.9 53.34 97.897022 77 21.4 94.91236
110 2019 Sierra Leone 74000 2800 295.00 78 31.00 88 59.59300 164.00572 64.1 9.390000 95 69.5 21.75 20.099739 38 24.3 61.92981
111 2019 Slovak Republic 1100 100 4.50 87 0.27 94 77.66585 2350.36599 4.9 9.800000 97 3.6 59.09 97.531845 82 16.7 99.78782
112 2019 South Africa 7400000 51000 615.00 57 38.00 79 66.07100 1160.67156 25.6 8.750000 85 27.6 54.69 75.379645 71 21.6 93.38824
113 2019 South Sudan 160000 8900 227.00 69 34.00 85 58.12900 51.38451 72.6 9.302000 61 68.1 22.36 15.747278 31 22.0 40.84166
114 2019 Spain 150000 650 9.90 87 0.47 47 83.83171 4012.39781 2.6 8.800000 95 3.2 51.29 99.919357 85 9.6 99.92584
115 2019 Sri Lanka 4100 200 64.00 58 3.30 85 76.69800 539.31778 6.2 6.700000 99 4.8 35.15 92.487941 66 15.6 88.39141
116 2019 Sudan 35000 1700 67.00 65 9.90 83 65.80300 194.06461 44.0 6.549000 93 15.8 36.87 36.778261 45 22.4 61.60565
117 2019 Suriname 6700 200 29.00 77 2.30 79 71.77300 1625.46811 17.1 7.034000 77 7.1 56.40 89.249143 72 21.6 97.54177
118 2019 Syrian Arab Republic 510 100 19.00 67 0.13 89 70.97000 348.78369 21.5 5.284000 67 9.1 70.29 93.955932 62 22.0 93.87294
119 2019 Tajikistan 12000 100 83.00 73 7.90 91 70.96200 253.69133 23.3 4.843000 97 9.0 56.24 96.772560 70 19.4 81.81511
120 2019 Tanzania 1700000 30000 237.00 58 35.00 93 66.00700 102.27097 34.7 6.183000 91 30.2 29.61 29.099389 42 18.4 56.56585
121 2019 Thailand 580000 15000 150.00 82 14.00 85 77.19700 709.02260 9.1 7.422000 97 11.8 42.58 98.420524 82 14.3 99.96483
122 2019 Timor-Leste 1300 100 498.00 62 88.00 91 66.49600 192.14461 39.9 7.477000 83 20.4 12.47 55.189893 50 20.9 82.38412
123 2019 Togo 110000 3100 37.00 82 2.70 87 61.05500 123.89256 40.2 8.394000 84 42.4 28.59 18.349511 41 26.1 67.81213
124 2019 Trinidad and Tobago 12000 500 17.00 87 1.50 61 72.83600 1878.99069 19.0 7.948000 93 1.6 57.11 93.915211 76 20.4 98.87517
125 2019 Tunisia 6500 500 35.00 79 1.20 90 75.59900 708.20061 14.4 6.099000 98 3.1 56.00 96.376573 68 15.2 96.19409
126 2019 Uganda 1400000 19000 200.00 77 16.00 82 66.35400 94.25074 31.7 5.420000 93 28.1 21.26 20.408091 48 21.8 54.32669
127 2019 United Arab Emirates 1400 100 0.98 87 0.67 81 82.59600 3236.16093 5.0 0.958000 99 0.8 71.32 99.098480 75 8.7 100.00000
128 2019 United Kingdom 100000 1000 8.10 89 0.34 78 81.36912 4982.20198 3.8 9.019000 93 6.1 61.16 99.108060 87 10.7 100.00000
129 2019 United States 1190000 5000 2.90 87 0.17 75 78.78780 10546.01320 5.5 8.697000 94 2.3 71.30 99.684435 85 13.2 99.74463
130 2019 Uruguay 14000 200 36.00 87 2.50 73 77.50300 2296.00227 6.2 9.754000 94 4.4 65.05 97.767800 83 16.6 99.48724
131 2019 Venezuela, RB 86000 4400 45.00 79 2.40 81 72.76600 79.02017 21.5 6.802000 64 5.2 54.79 96.759710 74 17.9 93.86290
132 2019 Viet Nam 250000 5000 176.00 60 9.80 91 74.21100 523.92726 14.9 6.300000 89 6.9 15.41 86.637803 69 20.8 95.98905
133 2019 Yemen, Rep.  8200 500 48.00 61 6.50 85 66.56700 107.65340 38.8 5.859000 60 15.6 35.22 53.626939 42 26.3 59.71658
134 2019 Zambia 1400000 25000 333.00 59 33.00 89 62.91400 235.69543 35.7 6.482000 88 35.8 27.29 35.459467 54 23.2 66.85340
135 2019 Zimbabwe 1300000 24000 199.00 69 11.00 84 61.06000 74.50810 46.0 8.281000 90 36.2 32.78 35.774336 55 32.7 63.09495

El conjunto de variables seleccionadas ofrece una mirada integral a los distintos determinantes de la salud global: desde la incidencia de enfermedades infecciosas hasta las condiciones estructurales de saneamiento y la cobertura sanitaria. Este enfoque multivariado permite no solo comparar países, sino también identificar patrones sistémicos que reflejan desigualdades históricas entre regiones, consolidando una base sólida para los análisis posteriores de componentes principales y clusterización.

3 RESULTADOS DESCRIPTIVOS

Antes de realizar análisis más complejos, es fundamental comprender el comportamiento general de cada variable incluida en el estudio. La siguiente tabla presenta los principales estadísticos descriptivos media, mediana, moda, desviación estándar, mínimo y máximo que permiten identificar la distribución, variabilidad y rango de los datos. Estos indicadores ofrecen una visión inicial sobre las tendencias centrales y la dispersión de los valores entre los distintos países, ayudando a detectar posibles desigualdades, comportamientos atípicos o concentraciones en determinados niveles de salud pública.

En la siguiente tabla se resumen las principales medidas descriptivas de las variables incluidas en el estudio, considerando 135 países y excluyendo islas o territorios no soberanos. En ella se observan contrastes significativos entre los indicadores de salud, lo que refleja las desigualdades existentes en los sistemas sanitarios a nivel mundial.

3.1 TABLA DE ESTADISTICAS DESCRIPTIVAS

Variable Media Mediana Moda Desv. Estandar Minimo Maximo
1 AdultosyNinosHIV 260495.56 30000.00 120000.00 759696.72 100.00 7400000.00
2 MuertesAIDS 4824.74 600.00 100.00 9947.64 100.00 59000.00
3 IncidenciaTuberculosis 125.14 59.00 15.00 147.59 0.98 654.00
4 DeteccionTuberculosis 74.37 79.00 87.00 14.82 31.00 110.00
5 MuerteTuberculosis 14.14 4.90 19.00 19.55 0.09 98.00
6 TratamientoTuberculosis 79.73 84.00 89.00 14.92 4.00 100.00
7 ExpectativaVidaNacer 71.17 71.77 31.53 8.05 31.53 83.83
8 PerCapitaSalud 1370.71 617.93 36.85 1856.88 36.85 10546.01
9 MortalidadInfantil 23.91 17.80 3.30 20.49 1.90 124.30
10 MortalidadGeneral 7.60 7.06 8.80 3.27 0.84 30.25
11 VacunaDPT 87.23 92.00 97.00 12.83 35.00 99.00
12 MortalidadAguaContaminada 18.38 7.10 2.30 21.93 0.40 108.10
13 SobrepesoAdultos 47.07 52.41 44.85 17.26 9.76 77.65
14 SaneamientoBasico 72.23 86.53 100.00 28.90 8.65 100.00
15 UHC 63.59 68.00 74.00 16.84 27.00 91.00
16 MortalidadECV 19.67 20.40 22.40 6.47 8.60 38.80
17 AccesoServiciosAgua 85.63 93.86 100.00 16.87 35.68 100.00

En primer lugar, los valores asociados al VIH/SIDA evidencian una gran dispersión: mientras algunos países registran cifras mínimas cercanas a los 100 casos, otros superan los 7 millones de personas viviendo con VIH. Esta variabilidad sugiere una marcada diferencia en el acceso a programas de prevención, diagnóstico y tratamiento. Algo similar ocurre con las muertes relacionadas con el SIDA, donde el rango (de 100 a 51.000 muertes) revela brechas en la eficacia de las políticas de salud pública y en la disponibilidad de tratamientos antirretrovirales.

Respecto a la tuberculosis, los promedios de incidencia (127 casos por cada 100.000 habitantes) y mortalidad (14 muertes por 100.000) muestran que, aunque la enfermedad persiste, su detección y tratamiento presentan avances moderados. La tasa media de detección (73,84 %) y el éxito terapéutico (79,73 %) sugieren la existencia de sistemas de vigilancia relativamente eficaces, aunque la desviación estándar alta refleja que no todos los países logran mantener estos niveles.

En cuanto a los indicadores de salud general y desarrollo, se observa que la esperanza de vida al nacer alcanza una media de 70,9 años, lo que, junto con la elevada desviación estándar del gasto per cápita en salud, sugiere que las diferencias económicas tienen un impacto directo en los resultados sanitarios. Países con mayores niveles de inversión en salud tienden a presentar menor mortalidad infantil y mayor cobertura vacunal, lo que podría anticipar relaciones positivas entre gasto, cobertura y supervivencia.

Por otro lado, la mortalidad infantil (24,45 por cada 1.000 nacidos vivos) y la mortalidad por agua contaminada (18,7 por cada 100.000 habitantes) exhiben valores máximos muy superiores a las medias, lo que denota la persistencia de problemas estructurales en el acceso al agua potable y el saneamiento básico. En contraste, los promedios altos en saneamiento (71,56 %) y acceso al agua (85,21 %) muestran avances globales, aunque con claras desigualdades entre regiones.

Finalmente, los indicadores de enfermedades no transmisibles como la mortalidad por enfermedades cardiovasculares (19,75) y el sobrepeso en adultos (46,95 %) evidencian una transición epidemiológica: mientras algunos países enfrentan aún enfermedades infecciosas, otros ya lidian con patologías crónicas asociadas a estilos de vida.

Los gráficos presentan la distribución de diversas variables de salud que permiten identificar diferencias importantes entre países, evidenciando desigualdades globales en el acceso y la calidad de los servicios sanitarios. A través de los diagramas de caja se observan las tendencias centrales, la dispersión de los datos y la presencia de valores atípicos que reflejan realidades muy distintas entre regiones del mundo.

3.2 BOXPLOT DE LAS VARIABLES

#PRIMER BLOQUE DE BOXPLOTS

# Seleccionar las primeras 10 variables numéricas
vars_1 <- c("AdultosyNinosHIV", "MuertesAIDS",
            "IncidenciaTuberculosis", "DeteccionTuberculosis", "MuerteTuberculosis",
            "TratamientoTuberculosis", "ExpectativaVidaNacer", "PerCapitaSalud",
            "MortalidadInfantil")

# Reorganizar los datos en formato largo
data_box1 <- Salud2 %>%
  select(all_of(vars_1)) %>%
  pivot_longer(cols = everything(), names_to = "Variable", values_to = "Valor") %>%
  filter(!is.na(Valor))

# Crear gráfico con ggplot2
g_facetas1 <- ggplot(data_box1, aes(x = Variable, y = Valor, fill = Variable)) +
  geom_boxplot(alpha = 0.8, outlier.color = "red") +
  facet_wrap(~Variable, scales = "free", ncol = 5) +
  theme_minimal() +
  labs(
    x = "",
    y = "",
    title = "DISTRIBUCIÓN DE LAS VARIABLES NUMÉRICAS"
  ) +
  theme(
    plot.title = element_text(size = 18, face = "bold", hjust = 0.5),
    strip.text = element_text(size = 10, face = "bold"),
    panel.spacing = unit(3, "lines"), 
    axis.text.x = element_blank(),
    axis.ticks.x = element_blank(),
    legend.position = "none"
  )

# Convertir a gráfico interactivo
plot_facetas1 <- ggplotly(g_facetas1) %>%
  layout(
    title = list(
      text = "<b>DISTRIBUCIÓN DE LAS VARIABLES NUMÉRICAS</b>",
      x = 0.5, xanchor = "center",
      font = list(size = 18, family = "Palatino Linotype")
    ),
    margin = list(t = 80)
  )

plot_facetas1

En la variable “Adultos y Niños con VIH”, la distribución es fuertemente asimétrica hacia la derecha. La mayoría de los países presentan valores bajos, mientras que unos pocos concentran cifras extremadamente elevadas. Esto sugiere que la enfermedad no afecta de manera uniforme a nivel mundial, sino que se concentra en ciertas zonas geográficas. Aunque el gráfico no especifica regiones, podría suponerse que muchos de los valores más altos pertenecen al continente africano, donde históricamente se han registrado tasas más elevadas de VIH. Esta suposición se apoya en el conocimiento general de las tendencias epidemiológicas, más no en la evidencia directa del gráfico.

La variable “Detección de Tuberculosis” muestra una distribución más equilibrada, con una mediana cercana al 75%. Esto refleja que, en general, la mayoría de los países mantienen niveles moderados o altos de cobertura en la detección. No obstante, los valores más bajos podrían corresponder —de manera hipotética— a regiones con menos recursos en salud pública, como algunos países africanos o del sudeste asiático, donde las limitaciones de infraestructura y acceso podrían dificultar un diagnóstico oportuno.

En cuanto a la “Expectativa de Vida al Nacer”, los valores se concentran entre los 60 y 80 años, con una mediana próxima a los 70. La distribución es bastante uniforme, lo que refleja avances globales en salud. Sin embargo, los valores más bajos —posiblemente pertenecientes a países con menores niveles de desarrollo— podrían relacionarse con contextos donde prevalecen condiciones de pobreza, conflictos o enfermedades infecciosas. Por conocimiento general, estos escenarios suelen encontrarse en regiones africanas, aunque el gráfico por sí solo no permite confirmarlo con certeza.

La “Incidencia de Tuberculosis” vuelve a presentar una clara asimetría positiva. La mayoría de los países registran tasas bajas o moderadas, pero existen valores extremos que representan una alta concentración de casos. De forma analítica, puede inferirse que estos valores elevados podrían corresponder a zonas donde la tuberculosis continúa siendo endémica, como en algunas partes de África o Asia. Esto sugiere que la enfermedad se mantiene como un desafío sanitario localizado, más que un problema de carácter universal.

Finalmente, la “Mortalidad Infantil” también muestra una distribución asimétrica, con una mediana baja pero con outliers muy elevados. Esto evidencia que, aunque la mayoría de los países han mejorado este indicador, aún existen algunos con cifras preocupantes. De manera suposicional y analítica, podría pensarse que los valores más altos corresponden a países del continente africano, donde las deficiencias en atención médica, la malnutrición y las enfermedades prevenibles siguen impactando de manera significativa en la mortalidad infantil.

En cuanto a las Muertes por SIDA y Muertes por Tuberculosis presentan distribuciones fuertemente asimétricas, con medianas muy bajas y varios valores atípicos hacia el extremo superior. Esto significa que la mayoría de los países registran niveles reducidos de mortalidad por estas enfermedades, mientras un pequeño grupo concentra cifras extremadamente altas. Esta concentración indica desigualdad en el acceso a tratamientos antirretrovirales, a programas de prevención y al diagnóstico oportuno, lo que demuestra que, a pesar de los avances médicos, persisten focos de vulnerabilidad donde estas patologías siguen siendo una de las principales causas de muerte.

En contraste, la variable Per Cápita Salud refleja una dispersión muy amplia, evidenciando las diferencias en la inversión sanitaria por habitante. Mientras algunos países destinan montos significativos que superan con amplitud la mediana, la mayoría mantiene un gasto reducido. Este patrón sugiere que el gasto en salud continúa siendo una de las principales brechas entre países: los que más invierten logran reducir de forma notable la mortalidad por enfermedades infecciosas y crónicas, mientras que los de menor gasto tienden a concentrar las tasas más altas de muertes por SIDA y tuberculosis. En otras palabras, el financiamiento sanitario actúa como un indicador estructural del bienestar general y de la capacidad de respuesta ante enfermedades transmisibles.

Por otro lado, la variable Tratamiento de Tuberculosis muestra una mediana elevada y una menor dispersión, lo que indica que en la mayoría de países la cobertura de tratamiento ha mejorado considerablemente. Esto podría estar relacionado con la cooperación internacional y los programas de salud pública implementados en las últimas décadas, que han permitido ampliar el acceso a medicamentos y reforzar los sistemas de vigilancia. Sin embargo, los valores más bajos reflejan que algunos territorios aún enfrentan dificultades logísticas o presupuestales para sostener un tratamiento completo y continuo, lo que impacta directamente en la reducción de contagios y muertes.

#SEGUNNDO BLOQUE DE BOXPLOTS

# Seleccionar las otras 10 variables
vars_2 <- c("MortalidadGeneral", "VacunaDPT",
            "MortalidadAguaContaminada", "SobrepesoAdultos",
            "SaneamientoBasico", "UHC", "MortalidadECV",
            "AccesoServiciosAgua")

# Reorganizar los datos
data_box2 <- Salud2 %>%
  select(all_of(vars_2)) %>%
  pivot_longer(cols = everything(), names_to = "Variable", values_to = "Valor") %>%
  filter(!is.na(Valor))

# Crear gráfico
g_facetas2 <- ggplot(data_box2, aes(x = Variable, y = Valor, fill = Variable)) +
  geom_boxplot(alpha = 0.8, outlier.color = "red") +
  facet_wrap(~Variable, scales = "free", ncol = 5) +
  theme_minimal() +
  labs(
    x = "",
    y = "",
    title = "DISTRIBUCIÓN DE LAS VARIABLES NUMÉRICAS"
  ) +
  theme(
    plot.title = element_text(size = 18, face = "bold", hjust = 0.5),
    strip.text = element_text(size = 10, face = "bold"),
    panel.spacing = unit(3, "lines"), 
    axis.text.x = element_blank(),
    axis.ticks.x = element_blank(),
    legend.position = "none"
  )

# Convertir a plotly
plot_facetas2 <- ggplotly(g_facetas2) %>%
  layout(
    title = list(
      text = "<b>DISTRIBUCIÓN DE LAS VARIABLES NUMÉRICAS</b>", 
      x = 0.5, xanchor = "center",
      font = list(size = 18, family = "Palatino Linotype")
    ),
    margin = list(t = 80)
  )

plot_facetas2

La variable Acceso a Servicios de Agua presenta una mediana elevada, lo que indica que la mayoría de los países han alcanzado una cobertura relativamente alta de agua potable. Sin embargo, la amplitud del rango intercuartílico y la presencia de valores atípicos hacia la parte inferior revelan que aún existen naciones o regiones donde una proporción significativa de la población carece de acceso adecuado a agua limpia. Esta desigualdad en la infraestructura hídrica es un factor determinante en la aparición de enfermedades transmitidas por el agua y afecta directamente los indicadores de salud pública.

La variable Mortalidad por Agua Contaminada refuerza esta relación: aunque la mayoría de los países presentan niveles bajos de mortalidad, los valores atípicos muy elevados indican que en ciertos territorios las enfermedades hídricas continúan siendo una causa importante de muerte, especialmente en contextos rurales o en zonas sin sistemas de tratamiento de agua. El contraste entre una alta cobertura promedio y la persistencia de casos extremos demuestra que los avances globales no han sido homogéneos y que los logros en infraestructura no siempre garantizan un acceso equitativo.

Por otro lado, las variables Mortalidad por Enfermedades Cardiovasculares (ECV) y Mortalidad General muestran distribuciones más compactas, con medianas moderadas y menor dispersión. Esto sugiere que, a nivel global, las causas de muerte se han desplazado progresivamente hacia enfermedades crónicas no transmisibles, asociadas al envejecimiento y al estilo de vida. No obstante, la existencia de valores atípicos hacia arriba indica que algunos países todavía enfrentan tasas elevadas de mortalidad general, posiblemente debido a deficiencias en los sistemas de salud, bajo acceso a atención médica preventiva o coexistencia de enfermedades infecciosas y crónicas.

La variable Acceso a Saneamiento Básico mantiene una mediana elevada y una concentración importante de valores en los rangos superiores, lo que indica que la mayoría de los países han avanzado en la ampliación de redes de saneamiento y tratamiento de residuos. No obstante, la presencia de valores atípicos hacia el extremo inferior refleja que todavía existen zonas con deficiencias estructurales, donde la ausencia de servicios adecuados incrementa los riesgos de enfermedades transmitidas por el agua y afecta de forma directa la salud infantil y comunitaria.

La Cobertura Universal de Salud (UHC) muestra también una mediana alta, señal de que la mayoría de los países cuentan con un sistema sanitario que busca garantizar el acceso a servicios esenciales. Sin embargo, la dispersión visible y algunos valores bajos indican que aún persisten brechas en la atención, especialmente en regiones donde los sistemas de salud son fragmentados o carecen de recursos suficientes. Esta desigualdad en la cobertura implica que, mientras algunos países ofrecen atención preventiva y tratamiento accesible para toda la población, otros sólo alcanzan una cobertura parcial, dejando a grupos vulnerables fuera del sistema formal de salud.

En cuanto a la Vacunación DPT (difteria, tos ferina y tétanos), los diagramas reflejan una mediana alta y una distribución relativamente homogénea, lo que evidencia un avance generalizado en la inmunización infantil. Este indicador muestra uno de los mayores niveles de equidad global dentro del conjunto, producto de las campañas internacionales y de los programas de vacunación sostenidos por la Organización Mundial de la Salud y otras agencias. Sin embargo, los valores atípicos hacia abajo sugieren que aún existen países con coberturas insuficientes, ya sea por limitaciones logísticas, falta de infraestructura o conflictos que interrumpen los programas de salud. Estas diferencias, aunque minoritarias, representan focos de vulnerabilidad ante la reaparición de enfermedades prevenibles.

Por último, la variable Sobrepeso en Adultos presenta una distribución amplia y una dispersión notable, con valores que oscilan desde porcentajes bajos hasta niveles cercanos al 80 %. Este comportamiento evidencia una transición epidemiológica: en países con bajos ingresos predominan los problemas asociados a la desnutrición y las enfermedades infecciosas, mientras que en los de mayores recursos se observa un aumento sostenido del sobrepeso y la obesidad, consecuencia de dietas hipocalóricas y estilos de vida sedentarios. La amplitud de esta variable contrasta con la homogeneidad de los indicadores anteriores, mostrando que los retos en salud global han evolucionado desde las carencias estructurales hacia los riesgos derivados del exceso y la falta de hábitos saludables.

3.3 MAPA DE CALOR

#Filtrar en otra asignación
Salud3 <- select(Salud2, AdultosyNinosHIV,MuertesAIDS, IncidenciaTuberculosis, DeteccionTuberculosis, MuerteTuberculosis, TratamientoTuberculosis, ExpectativaVidaNacer, PerCapitaSalud, MortalidadInfantil, MortalidadGeneral, VacunaDPT, MortalidadAguaContaminada, SobrepesoAdultos, SaneamientoBasico, UHC, MortalidadECV, AccesoServiciosAgua)

cor_matrix <- cor(Salud3, use = "pairwise.complete.obs")

ggcorrplot(cor_matrix, 
           hc.order = TRUE,
           type = "lower",
           lab = TRUE,
           lab_size = 4,
           lab_col = "black",
           colors = c("#4575B4", "white", "#D73027"),
           title = "Matriz de correlación de indicadores de salud",
           ggtheme = ggplot2::theme_minimal(),
           outline.col = "gray70",
           sig.level = 0.6,  # Solo muestra valores con |cor| > 0.6
           insig = "blank") +  # Oculta los demás
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1, size = 12, face = "bold"),
    axis.text.y = element_text(size = 12, face = "bold"),
    plot.title = element_text(hjust = 0.5, size = 16, face = "bold"),
    legend.title = element_text(size = 12),
    legend.text = element_text(size = 10)
  )

La matriz de correlación muestra una representación integral de cómo los distintos indicadores de salud se interrelacionan, revelando patrones claros de desarrollo, desigualdad y transición epidemiológica a nivel global.

En primer lugar, se distingue un bloque de correlaciones positivas muy fuertes entre variables como expectativa de vida al nacer, acceso a servicios de agua, saneamiento básico, vacunación DPT y gasto per cápita en salud. Estas asociaciones, con valores de coeficientes que superan el 0.5, evidencian que los países con una infraestructura sanitaria sólida, altos niveles de inversión pública y amplia cobertura médica tienden a alcanzar mejores resultados en esperanza de vida y prevención de enfermedades transmisibles. Dicho de otro modo, la mejora en las condiciones básicas como el acceso a agua potable y servicios de saneamiento no solo repercute directamente en la salud física de la población, sino que también refleja un entorno socioeconómico más estable y equitativo.

Por otro lado, se observan correlaciones negativas intensas entre estos indicadores de desarrollo y las variables de mortalidad infantil, mortalidad por agua contaminada e incidencia o muertes por tuberculosis. En países donde el acceso al agua y al saneamiento es limitado, las tasas de mortalidad infantil se incrementa y las enfermedades infecciosas siguen siendo una amenaza persistente. Estas correlaciones, cercanas a -0.8, refuerzan la idea de que los determinantes estructurales como la infraestructura sanitaria, educación y recursos económicos, tienen un peso decisivo en los resultados de salud poblacional.

De manera interesante, el indicador de sobrepeso en adultos muestra correlaciones positivas moderadas con la expectativa de vida y el gasto en salud per cápita, lo cual sugiere un proceso de transición epidemiológica: mientras los países menos desarrollados aún enfrentan problemas de desnutrición y enfermedades infecciosas, las naciones con mayores recursos lidian con el aumento de enfermedades crónicas no transmisibles (como las cardiovasculares o la diabetes), derivadas de estilos de vida poco saludables. Esto evidencia que el progreso económico y sanitario mejora la supervivencia, pero al mismo tiempo introduce nuevos retos de salud pública.

Asimismo, la mortalidad por enfermedades cardiovasculares (ECV) mantiene correlaciones moderadas con la expectativa de vida y el sobrepeso, lo que puede atribuirse al envejecimiento de la población en países desarrollados. Mientras tanto, la mortalidad general y el UHC (Cobertura Universal de Salud) se sitúan en posiciones intermedias, mostrando que la cobertura sanitaria contribuye positivamente a la reducción de muertes, pero aún depende de factores estructurales más amplios.

En conjunto, esta matriz revela una división global en dos realidades sanitarias: por un lado, países con altos ingresos, amplia cobertura médica, servicios básicos garantizados y esperanza de vida elevada; por el otro, naciones con sistemas de salud débiles, deficiencias estructurales y mortalidad elevada por causas prevenibles. Es razonable suponer que las correlaciones más negativas (por ejemplo, entre saneamiento y mortalidad infantil o entre expectativa de vida y mortalidad por agua contaminada) corresponden a regiones como África subsahariana o partes del sur de Asia, donde la infraestructura básica sigue siendo insuficiente. En contraste, las correlaciones positivas entre vacunación, gasto en salud y longevidad caracterizan a Europa, América del Norte y Oceanía, donde la inversión en salud pública y las políticas preventivas se traducen en mejores resultados poblacionales.

En síntesis, el mapa de calor permite identificar patrones de asociación que reflejan tanto los determinantes estructurales de la salud como las disparidades globales entre países. Estas correlaciones sirven como base para el análisis multivariado posterior, ya que permiten agrupar variables con comportamientos similares y distinguir aquellas que explican de manera conjunta las diferencias en los resultados sanitarios. A partir de estos vínculos, el estudio puede avanzar hacia técnicas como el Análisis de Componentes Principales (ACP) con el fin de reducir la dimensionalidad de los datos

3.4 MODELOS UTILIZADOS

# ACP 

reemplazos <- c(
  "Bahamas, The" = "Bahamas",
  "Congo, Dem. Rep." = "Democratic Republic of the Congo",
  "Congo, Rep." = "Republic of Congo",
  "Cote d'Ivoire" = "Côte d'Ivoire",
  "Egypt, Arab Rep." = "Egypt",
  "Gambia, The" = "Gambia",
  "Iran, Islamic Rep." = "Iran",
  "Kyrgyz Republic" = "Kyrgyzstan",
  "Lao PDR" = "Laos",
  "Sao Tome and Principe" = "São Tomé and Príncipe",
  "Slovak Republic" = "Slovakia",
  "Syrian Arab Republic" = "Syria",
  "Venezuela, RB" = "Venezuela",
  "Viet Nam" = "Vietnam",
  "Yemen, Rep." = "Yemen"
)

Salud2$Pais <- recode(Salud2$Pais, !!!reemplazos)

# Seleccionar solo las variables cuantitativas
datos_pca_originales <- Salud2 %>%
  select(all_of(vars))

# Identificar y eliminar variables de Varianza Cero
nzv <- nearZeroVar(datos_pca_originales, saveMetrics = TRUE)

# Filtramos para quedarnos solo con las variables que SÍ tienen varianza
variables_con_varianza <- rownames(nzv[nzv$zeroVar == FALSE, ])

# Filtramos los datos para usarlos en el PCA
datos_pca <- datos_pca_originales[, variables_con_varianza]

# 3. Calcular el PCA
pca_res <- prcomp(datos_pca, center = TRUE, scale. = TRUE)


# Scree plot (varianza explicada)
fviz_eig(pca_res, addlabels = TRUE) +
  ggtitle("Gráfico de Varianza Explicada del PCA") +
  theme(plot.title = element_text(size = 16, face = "bold", hjust = 0.5))

# Tabla de varianza explicada
eig_vals <- (pca_res$sdev)^2
prop_var <- eig_vals / sum(eig_vals)
cum_var <- cumsum(prop_var)

pca_summary <- data.frame(
  Componente = paste0("PC", 1:length(eig_vals)),
  Varianza_Explicada = round(prop_var*100, 2),
  Varianza_Acumulada = round(cum_var*100, 2)
)
print(pca_summary)
   Componente Varianza_Explicada Varianza_Acumulada
1         PC1              52.83              52.83
2         PC2              10.63              63.46
3         PC3               7.77              71.23
4         PC4               5.78              77.01
5         PC5               5.38              82.39
6         PC6               4.17              86.56
7         PC7               3.67              90.23
8         PC8               2.31              92.54
9         PC9               1.76              94.30
10       PC10               1.58              95.88
11       PC11               1.17              97.04
12       PC12               0.87              97.92
13       PC13               0.68              98.59
14       PC14               0.54              99.13
15       PC15               0.44              99.57
16       PC16               0.28              99.85
17       PC17               0.15             100.00
# Cargas
round(pca_res$rotation[, 1:3], 3)
                             PC1    PC2    PC3
AdultosyNinosHIV           0.075  0.681 -0.068
MuertesAIDS                0.124  0.636  0.000
IncidenciaTuberculosis     0.248  0.212 -0.070
DeteccionTuberculosis     -0.245  0.037 -0.153
MuerteTuberculosis         0.260  0.052 -0.142
TratamientoTuberculosis    0.106  0.034  0.487
ExpectativaVidaNacer      -0.317  0.065  0.049
PerCapitaSalud            -0.220  0.039 -0.471
MortalidadInfantil         0.309 -0.107 -0.075
MortalidadGeneral          0.096 -0.069 -0.633
VacunaDPT                 -0.207  0.181  0.172
MortalidadAguaContaminada  0.292 -0.051 -0.163
SobrepesoAdultos          -0.257 -0.043  0.013
SaneamientoBasico         -0.304  0.047 -0.010
UHC                       -0.307  0.123 -0.144
MortalidadECV              0.244 -0.033  0.039
AccesoServiciosAgua       -0.292  0.068  0.015
# SEGMENTACIÓN, ANÁLISIS DE CLUSTER (Método de Ward)

# Seleccionamos las coordenadas del PCA (factores)
# Aquí usamos los 5 primeros componentes
pca_coord <- pca_res$x[, 1:5]

# Calculamos la distancia euclidiana entre países
distancia <- dist(pca_coord, method = "euclidean")

# Aplicamos el método de Ward
ward_model <- hclust(distancia, method = "ward.D2")



# Asignar países a los clusters

k_optimo <- 3

clusters <- cutree(ward_model, k = k_optimo)

# Crear tabla con los resultados
cluster_resultados <- data.frame(
  Pais = Salud2$Pais,
  Cluster = as.factor(clusters)
)

# Caracterización de los clusters

# Unimos la asignación con las variables originales
Salud_cluster <- cbind(cluster_resultados, Salud2[, vars])

# Calculamos el promedio de cada variable por cluster
resumen_clusters <- Salud_cluster %>%
  group_by(Cluster) %>%
  summarise(across(everything(), mean, na.rm = TRUE))

El análisis de componentes principales se aplicó con el objetivo de reducir la complejidad del conjunto de indicadores de salud, preservando la mayor parte de la información contenida en las variables originales. A través del gráfico del codo y la tabla de varianza se observó que la primera componente explica un 52.8% de la varianza total, la segunda un 10.6% y la tercera un 7.8%, alcanzando en conjunto un 71.23% de la variabilidad acumulada. Estas tres dimensiones sintetizan los principales ejes que diferencian a los países según sus condiciones sanitarias, su carga epidemiológica y su capacidad de respuesta del sistema de salud.

Primera Componente Principal (PC1): Desarrollo Sanitario y Bienestar Estructural.

La PC1, corresponde al 52.8% de la variabilidad total, constituye el eje más importante y dominante del modelo. Presenta cargas negativas altas en variables como Expectativa de vida al nacer (-0.317), Saneamiento básico (-0.304), Cobertura universal en salud (UHC) (-0.307) y Acceso a servicios de agua (-0.292).

Estas variables reflejan condiciones estructurales de bienestar y desarrollo sanitario. Los países con mejor infraestructura sanitaria, acceso a servicios básicos y mayor esperanza de vida se ubican en el extremo negativo del eje, mientras que aquellos con mayores niveles de mortalidad y deficiencias en salud pública se concentran en el extremo positivo. En este sentido, la PC1 puede interpretarse como un gradiente de desarrollo en salud pública, en el que se oponen países con sistemas de salud consolidados frente a aquellos con carencias estructurales que afectan la calidad de vida y la equidad sanitaria.

Segunda Componente Principal (PC2): Carga Epidemiológica de Enfermedades Transmisibles.

La PC2, con una varianza explicada del 10.63%, agrupa variables con altas cargas positivas en Adultos y niños con VIH (0.681), Muertes por SIDA (0.636) e Incidencia de tuberculosis (0.212).

Este patrón define un eje centrado en la carga epidemiológica asociada a enfermedades transmisibles, donde los países más afectados por el VIH/SIDA y la tuberculosis se distinguen claramente del resto. Esta dimensión muestra cómo la persistencia de enfermedades infecciosas continúa siendo un obstáculo estructural para el desarrollo sanitario sostenible, especialmente en regiones donde los sistemas de salud presentan debilidades en cobertura, prevención y tratamiento.

Tercera Componente Principal (PC3) – Eficiencia y Respuesta del Sistema de Salud.

La PC3, que explica el 7.77% de la varianza total, presenta cargas positivas en Tratamiento de tuberculosis (0.487) y Vacuna DPT (0.172), y cargas negativas en Mortalidad general (-0.633) y Gasto per cápita en salud (-0.471).

Esta configuración refleja un eje asociado con la eficiencia del sistema de salud y su capacidad de respuesta institucional. Los países con mayores niveles de cobertura de tratamiento y vacunación muestran menores tasas de mortalidad general, evidenciando un uso más efectivo de los recursos sanitarios. De esta forma, la PC3 puede interpretarse como un indicador de desempeño del sistema de salud, donde la relación entre inversión, atención y resultados revela la capacidad de cada país para convertir los recursos en mejoras tangibles en salud poblacional.

En conjunto, las tres primeras componentes del análisis permiten identificar patrones estructurales de desigualdad y desarrollo sanitario a nivel mundial. La PC1 diferencia los contextos de bienestar y desarrollo; la PC2 captura las brechas epidemiológicas derivadas de enfermedades infecciosas; y la PC3 refleja la capacidad institucional de respuesta frente a los retos de salud pública.

3.5 DENDOGRAMA

# ACP sobre Salud3
rownames(Salud3) <- Salud2$Pais
pca_resultado <- dudi.pca(Salud3, scannf = FALSE, nf = 5)

# Extraer factores estimados
factores <- pca_resultado$li

# Clustering jerárquico con método de Ward
distancia_factores <- dist(factores)
modelo_ward <- hclust(distancia_factores, method = "ward.D2")

# Convertir a dendrograma y abreviar etiquetas
dend_ward <- as.dendrogram(modelo_ward)
labels(dend_ward) <- abbreviate(labels(dend_ward), minlength = 5)

# Colorear ramas y etiquetas por número de clusters
clusters_deseados <- 3
dend_coloreado <- dend_ward %>%
  color_branches(k = clusters_deseados) %>%
  color_labels(k = clusters_deseados)


# Visualización alternativa con factoextra

fviz_dend(modelo_ward,
          k = clusters_deseados,
          show_labels = FALSE,               # Oculta los números/etiquetas
          k_colors = c("#E41A1C", "#377EB8", "#4DAF4A"),  # Paleta refinada
          rect = TRUE,
          rect_border = "gray30",
          rect_fill = TRUE,
          lwd = 1.2,                         # Grosor de las ramas
          main = "Dendrograma jerárquico") +
  theme_minimal(base_size = 14) +           # Fuente más clara
  theme(
    plot.title = element_text(size = 18, face = "bold", hjust = 0.5),
    axis.text.x = element_blank(),          # Oculta texto del eje X
    axis.ticks.x = element_blank(),         # Oculta marcas del eje X
    panel.grid = element_blank()            # Elimina cuadrícula
  )

El análisis de conglomerados jerárquicos, representado en el dendrograma, permitió clasificar a los países en tres grandes clusters (1, 2 y 3), siguiendo el método de Ward y utilizando las coordenadas del Análisis de Componentes Principales (PCA) como base. Fundamentada en la similitud de sus indicadores de salud, infraestructura sanitaria, y carga epidemiológica. Esta segmentación revela una clara estratificación del desarrollo sanitario global, coherente con los patrones observados en el análisis de componentes principales, en los cuales las tres primeras componentes reflejaban diferencias estructurales, epidemiológicas e institucionales entre países.

4 ANÁLISIS DE COMPONENETES PRINCIPALES (ACP)

# Asignar nombres de fila (países)
rownames(Salud3) <- Salud2$Pais

# Análisis de Componentes Principales (ACP)
pca_resultado <- dudi.pca(Salud3, scannf = FALSE, nf = 5)

# Asegurar que las coordenadas del PCA tengan los nombres de los países
rownames(pca_resultado$li) <- rownames(Salud3)

4.1 GRÁFICO DE INDIVIDUOS POR PAÍSES 1

# Gráfico de individuos (países) Dim 1 y 2
fviz_pca_ind(pca_resultado,
             axes = c(1, 2),
             col.ind = "cos2",                     # Color según calidad de representación
             gradient.cols = c("dodgerblue", "gold", "red"),  # Colores del gradiente
             repel = TRUE,                         # Evita solapamiento de etiquetas              
             pointsize = 2,                        # Tamaño de los puntos
             labelsize = 3,                        # Tamaño del texto de las etiquetas    
             arrowsize = 10,
             title = "Representación de países (Dim 1 y 2)") +
  theme_minimal() +
  theme(
    plot.title = element_text(size = 16, face = "bold"),
    legend.title = element_text(size = 12),
    legend.text = element_text(size = 10)
)

El gráfico del Análisis de Componentes Principales (ACP) muestra cómo se agrupan los países según sus indicadores de salud, proyectados sobre las dos primeras dimensiones (Dim 1 y Dim 2), que resumen la mayor parte de la variabilidad de los datos. Cada punto representa un país, y su posición depende de cómo se comportan sus variables sanitarias en comparación con los demás.

La Dimensión 1 (eje horizontal) representa un gradiente de desarrollo sanitario estructural. Los países situados hacia la izquierda del gráfico (como Mozambique y Sudáfrica) presentan peores condiciones de salud, con mayor mortalidad infantil, menor esperanza de vida, menor acceso a agua potable y saneamiento, y una alta carga de enfermedades infecciosas.

Por el contrario, los países ubicados hacia la derecha del eje (como Tailandia o varias naciones Europeas y de Medio Oriente) exhiben mejores condiciones sanitarias, caracterizadas por mayor gasto en salud, mejor cobertura de servicios básicos y menor mortalidad.

En términos analíticos, este eje resume un contraste entre precariedad estructural y bienestar sanitario, Donde los países con mayores niveles de desarrollo y políticas de salud consolidadas se oponen a aquellos con limitaciones en infraestructura y cobertura básica.

La Dimensión 2 (eje vertical) está más relacionada con la carga epidemiológica de enfermedades transmisibles, especialmente VIH/SIDA y tuberculosis. Los países que se encuentran en la parte superior del gráfico tienden a registrar altas tasas de VIH en adultos y niños, junto con mayores muertes por SIDA, mientras que los que se ubican en la parte inferior presentan niveles mucho más bajos de estas enfermedades, reflejando un mejor control epidemiológico.

Durante el año 2019, antes de la pandemia de COVID-19, varios países africanos como Sudáfrica, Mozambique, India, Zambia y Zimbabue, concentraban gran parte de la carga global del VIH/SIDA, mientras que otros países con mejores recursos sanitarios (como Tailandia o los Emiratos Árabes Unidos) mostraban avances notables en cobertura y tratamiento. Este patrón se refleja claramente en la separación de los puntos dentro del plano factorial.

4.2 GRÁFICO DE INDIVIDUOS POR PAÍSES 2

# Gráfico de individuos (países) Dim 1 y 3
fviz_pca_ind(pca_resultado,
             axes = c(1, 3),
             col.ind = "cos2",                     # Color según calidad de representación
             gradient.cols = c("dodgerblue", "gold", "red"),  # Colores del gradiente
             repel = TRUE,                         # Evita solapamiento de etiquetas              
             pointsize = 2,                        # Tamaño de los puntos
             labelsize = 3,                        # Tamaño del texto de las etiquetas    
             arrowsize = 10,
             title = "Representación de países (Dim 1 y 3)") +
  theme_minimal() +
  theme(
    plot.title = element_text(size = 16, face = "bold"),
    legend.title = element_text(size = 12),
    legend.text = element_text(size = 10)
)

El gráfico del ACP sobre las Dimensiones 1 y 3 permite explorar una perspectiva complementaria del desarrollo sanitario mundial. Mientras la Dimensión 1 continúa reflejando el nivel de desarrollo estructural y bienestar sanitario, la Dimensión 3 introduce un nuevo enfoque asociado con la eficiencia y capacidad de respuesta de los sistemas de salud frente a los principales retos epidemiológicos.

En el eje horizontal encontramos la dimensión 1 de desarrollo sanitario y bienestar estructural, este eje sintetiza el grado general de desarrollo en salud y condiciones socioestructurales.

Los países situados hacia la derecha del gráfico como Luxemburgo, Irlanda, España, Portugal o Uruguay destacan por sus altos niveles de bienestar sanitario, caracterizados por una infraestructura sólida, alta esperanza de vida, bajos niveles de mortalidad y amplio acceso a servicios esenciales como el agua potable, el saneamiento y la atención médica oportuna.

Por el contrario, los países ubicados hacia la izquierda del eje como la República Centroafricana, Sudán del Sur, Lesotho o Sudáfrica, presentan condiciones estructurales más precarias, con mayores tasas de mortalidad, menor inversión sanitaria per cápita y una alta carga de enfermedades transmisibles.

Para el eje vertical encontramos la dimensión 3 de eficiencia y respuesta del sistema de salud. El tercer componente mide cómo responde el sistema sanitario frente a los problemas de salud pública, considerando indicadores como el tratamiento efectivo de la tuberculosis, la cobertura de vacunación o la gestión de la mortalidad general.

Los países más arriba en el gráfico tienden a mostrar sistemas sanitarios más eficientes y mejor organizados, capaces de controlar enfermedades y mantener buenos resultados de salud incluso con recursos limitados. Por el contrario, los países que se ubican en la parte inferior presentan menor eficiencia institucional, baja cobertura de atención médica y deficiencias en la administración de recursos sanitarios.

4.3 CÍRCULO DE CORRELACIONES 1

# Círculo de correlaciones tipo mapa de calor Dim 1 y 2
fviz_pca_var(pca_resultado,
             axes = c(1, 2),
             col.var = "cos2",
             pointsize = 2,
             gradient.cols = c("dodgerblue", "gold", "red"),
             repel = TRUE,
             title = "Círculo de correlaciones (Dim 1 y 2)") +
  theme_minimal() +
  theme(
    plot.title = element_text(size = 16, face = "bold"),
    legend.title = element_text(size = 12),
    legend.text = element_text(size = 10)
)

El gráfico del círculo de correlaciones muestra la relación entre los diferentes indicadores de salud y las dos primeras dimensiones principales del Análisis de Componentes Principales (ACP). Cada punto representa una variable, y su posición dentro del plano indica cómo se asocia con los ejes que concentran la mayor parte de la variabilidad de los datos.

La Dimensión 1 (eje X) refleja un gradiente general de desarrollo sanitario y bienestar estructural. Hacia la derecha se ubican variables vinculadas a mejores condiciones de salud e infraestructura, como la Esperanza de Vida al Nacer, la Cobertura Sanitaria Universal (UHC), la Vacunación DPT, el Saneamiento Básico y el Acceso a Agua Potable. Estas variables tienden a caracterizar a países con sistemas de salud más robustos. En contraste, hacia la izquierda se agrupan indicadores asociados a condiciones menos favorables, como la Mortalidad General, la Mortalidad Infantil y la Mortalidad por Agua Contaminada, lo que evidencia la oposición entre contextos con alta calidad de vida y aquellos con mayores debilidades estructurales.

La Dimensión 2 (eje Y) diferencia principalmente los indicadores relacionados con la carga de enfermedades transmisibles. En la parte superior se concentran variables como Adultos y Niños con VIH, Muertes por SIDA e Incidencia de Tuberculosis, que muestran una fuerte asociación positiva con esta dimensión. Esto indica que la Dim 2 capta la variabilidad vinculada al impacto del VIH/SIDA y la tuberculosis. En la parte inferior aparecen variables con asociación opuesta, como la Mortalidad Infantil, la Mortalidad General o la Mortalidad por Agua Contaminada. Estas variables no representan simplemente “baja carga epidemiológica”, sino que corresponden a un conjunto distinto de problemáticas sanitarias no relacionadas directamente con VIH/TB, lo que sugiere que este eje separa dos tipos de desafíos epidemiológicos diferentes.

4.4 CÍRCULO DE CORRELACIONES 2

# Círculo de correlaciones tipo mapa de calor Dim 1 y 3
fviz_pca_var(pca_resultado,
             axes = c(1, 3),
             col.var = "cos2",
             pointsize = 2,
             gradient.cols = c("dodgerblue", "gold", "red"),
             repel = TRUE,
             title = "Círculo de correlaciones (Dim 1 y 3)") +
  theme_minimal() +
  theme(
    plot.title = element_text(size = 16, face = "bold"),
    legend.title = element_text(size = 12),
    legend.text = element_text(size = 10)
)

En este gráfico, las variables ubicadas hacia la derecha del eje horizontal (Dimensión 1) como PerCapitaSalud, AccesoServiciosAgua, SaneamientoBasico, VacunaDPT y DetecciónTuberculosis están fuertemente relacionadas con mejores condiciones de salud pública. Su agrupación indica que estas variables tienden a comportarse de forma similar: cuando aumenta la inversión en salud y la cobertura de servicios básicos, también mejoran los niveles de vacunación y de detección de enfermedades.

Por otro lado, hacia la izquierda del eje horizontal se encuentran variables como MortalidadInfantil, MuertesAIDS, AdultosYNiñosHIV, MortalidadAguaContaminada y MortalidadECV. Estas representan condiciones sanitarias desfavorables, es decir, mayor carga de enfermedad y menor eficiencia del sistema de salud. Su cercanía entre sí sugiere que estos problemas tienden a coexistir: los lugares con altas tasas de mortalidad o prevalencia de VIH/SIDA suelen tener también deficiencias en agua potable o infraestructura sanitaria.

En cuanto al eje vertical (Dimensión 3), este introduce un matiz adicional relacionado con los resultados clínicos o la eficacia del sistema de salud. En la parte superior se ubica MortalidadGeneral, mientras que en la parte inferior aparece TratamientoTuberculosis. Esta oposición indica que a medida que los tratamientos contra la tuberculosis son más exitosos, las tasas de mortalidad general tienden a ser menores. Es decir, existe una relación inversa entre la efectividad médica y la mortalidad global.

Los gráficos biplot integran en un mismo plano la representación de los países y las variables de salud, permitiendo observar simultáneamente la posición de cada país respecto a los principales ejes factoriales y las variables que más influyen en dicha ubicación.

4.5 BIPLOT ENTRE PAÍSES Y VARIABLES 1

NoNumericas <- c("Pais", "Ano")

# Convertir a numérico
datosSalud <- Salud
datosSalud[ , !(names(datosSalud) %in% NoNumericas)] <-
  lapply(datosSalud[ , !(names(datosSalud) %in% NoNumericas)], function(x) as.numeric(as.character(x)))

# Reemplazar valores vacíos por NA
datosSalud[datosSalud == "" | datosSalud == "NA" | datosSalud == "N/A"] <- NA

# Crear Salud3 con nombres de fila desde la columna Pais
Salud4 <- datosSalud[complete.cases(datosSalud), ]

# Asignar nombres de fila
rownames(Salud4) <- Salud4$Pais

# Eliminar columnas no numéricas
Salud4 <- Salud4 %>% select(-Pais, -Ano)



# BIPLOT Dim 1 y 2 

fviz_pca_biplot(pca_resultado,
                axes = c(1, 2),
                geom.ind = "text",             # mostrar nombres de países
                label = "all",                 # etiquetas de países y variables
                repel = TRUE,                  # evitar solapamiento
                col.ind = "cos2",              # color según calidad de representación
                pointsize = 2,
                gradient.cols = c("dodgerblue", "gold", "red"),
                col.var = "darkred",           # color de variables
                arrowsize = 0.8,
                labelsize = 3,
                title = "Biplot de países y variables (Dim 1 y 2)") +
  theme_minimal() +
  theme(
    plot.title = element_text(size = 16, face = "bold"),
    legend.title = element_text(size = 12),
    legend.text = element_text(size = 10)
  )

En el biplot de las Dimensiones 1 y 2, se aprecia una clara separación entre los países con mayor desarrollo sanitario (ubicados hacia la derecha), asociados a variables como expectativa de vida, acceso a servicios de agua, saneamiento y cobertura sanitaria universal, y aquellos con mayor carga de enfermedades transmisibles (a la izquierda), vinculados con VIH/SIDA, mortalidad infantil y tuberculosis.

Los vectores de las variables indican la dirección de su influencia, mostrando cómo los países tienden a agruparse según sus condiciones estructurales y epidemiológicas.

4.6 BIPLOT ENTRE PAÍSES Y VARIABLES 2

# BIPLOT Dim 1 y 3 
fviz_pca_biplot(pca_resultado,
                axes = c(1, 3),
                geom.ind = "text",             # mostrar nombres de países
                label = "all",                 # etiquetas de países y variables
                repel = TRUE,                  # evitar solapamiento
                col.ind = "cos2",              # color según calidad de representación
                pointsize = 2,
                gradient.cols = c("dodgerblue", "gold", "red"),
                col.var = "darkred",           # color de variables
                arrowsize = 0.8,
                labelsize = 3,
                title = "Biplot de países y variables (Dim 1 y 3)") +
  theme_minimal() +
  theme(
    plot.title = element_text(size = 16, face = "bold"),
    legend.title = element_text(size = 12),
    legend.text = element_text(size = 10)
  )

Por otro lado, el biplot de las Dimensiones 1 y 3 resalta diferencias en la eficiencia del sistema de salud y los resultados clínicos. Los países con mejor desempeño sanitario se concentran hacia el lado derecho, cerca de variables como PerCapitaSalud, DetecciónTuberculosis y VacunaDPT, mientras que los de mayor vulnerabilidad se agrupan hacia la izquierda, relacionados con mortalidad general, enfermedades cardiovasculares y VIH/SIDA.

En conjunto, estos biplots permiten visualizar cómo las características sanitarias y socioestructurales explicadas por las dimensiones del PCA se reflejan tanto en la distribución de los países como en el comportamiento conjunto de los indicadores de salud.

4.7 CLASIFICACIÓN POR GRUPOS 1

# PCA
k_final <- 3  # Número de clusters

# Crear los clusters con el método Ward
grupos_ward_final <- cutree(ward_model, k = k_final)
# Usar los mismos grupos del método Ward
Grupo <- as.factor(grupos_ward_final)

# Clasificación por grupos Dim 1 y 2
s.class(
  pca_resultado$li, 
  fac = Grupo,
  sub = "Componentes 1 y 2 por grupo (95% confianza)", 
  possub = "bottomright",
  xax = 1, yax = 2,
  col = c("red", "dodgerblue", "#4DAF4A"),  
  cellipse = 2,       # Nivel de confianza 95%
  cpoint = 2,         # Tamaño de puntos
  cstar = 1.2,        # Tamaño de líneas al centro del grupo
  clabel = 1.2,       # Tamaño de etiquetas
  axesell = TRUE,     
  addaxes = TRUE      
)

# Cuadrícula y título
grid(col = "gray80", lty = "dotted")
title(main = "Clasificación de países por grupos (Dim 1 y 2)", cex.main = 1.5, font.main = 2)
box()

El gráfico muestra la distribución de países según su similitud en indicadores sanitarios, representados mediante un Análisis de Componentes Principales (ACP). En el plano se observan tres grupos claramente diferenciados, que agrupan a los países según su nivel de desarrollo y características del sistema de salud.

Grupo 1 (rojo): Corresponde a países con baja infraestructura sanitaria y alta vulnerabilidad epidemiológica. Este grupo se ubica principalmente en el cuadrante izquierdo del gráfico. Agrupa sobre todo a países africanos y asiáticos con deficiencias en cobertura de salud, baja expectativa de vida y escasa inversión pública en el sector. Su dispersión interna refleja que, aunque comparten limitaciones estructurales, existen diferencias en el nivel de vulnerabilidad y desempeño sanitario dentro del grupo. Países como República Centro Africana que cuenta con una expectativa de vida de 31 años y una mortalidad infantil de 124 por cada 1000 nacidos vivos o Chad con una expectativa de vida de 53 años y una mortalidad infantil de 65 por cada 1000 nacidos vivos. Estos países comparten un contexto de pobreza, baja cobertura médica y persistencia de enfermedades infecciosas, lo que justifica su agrupación dentro del cluster de menor desarrollo sanitario.

Grupo 2 (azul): Representa a países con desarrollo sanitario intermedio o en transición. Se localiza cerca del origen de los ejes, lo que indica un comportamiento medio respecto a las demás agrupaciones. Aquí se incluyen principalmente países de América Latina, Europa del Este y Medio Oriente. Encontramos países como Ruanda con una esperanza de vida de aproximadamente 67 años y una tasa de mortalidad infantil de 31 por cada 1000 nacidos vivos o Santo Tomé y Príncipe que para el 2019 su cobertura de saneamiento fue del 45% con una esperanza de vida de 68 años. Estos presentan avances en vacunación, acceso a agua potable y servicios básicos, pero aún mantienen brechas internas y desafíos en eficiencia del gasto y control epidemiológico. Su posición intermedia evidencia que están en un proceso de mejora y consolidación de sus sistemas de salud.

Grupos 3 (verde): Agrupa a los países con sistemas de salud altamente desarrollados y consolidados, ubicados en el extremo derecho del eje Dim1. Son en su mayoría países europeos y de Oceanía, caracterizados por una infraestructura sanitaria avanzada, baja carga de enfermedades transmisibles y altos niveles de bienestar. La baja dispersión de los puntos dentro del clúster indica gran homogeneidad entre ellos. Entre este grupo se encuentra España con la expectativa más alta de vida de 84 años, una mortalidad infantil de 2 por cada 1000 nacidos vivos o Estonia que cuenta con una expectativa de vida de 79 años y una mortalidad infantil de 2 por cada 1000 nacidos vivos. La combinación de las dimensiones 1 y 2 permite observar cómo los países se agrupan principalmente según su nivel de desarrollo sanitario, donde el eje horizontal diferencia los sistemas con mayores problemas de mortalidad e infecciones, y el eje vertical aporta matices relacionados con la cobertura de servicios de salud.

4.8 CLASIFICACIÓN POR GRUPOS 2

# Clasificación por grupos dim 1 y 3
# PCA

# Usar los mismos grupos del método Ward
Grupo <- as.factor(grupos_ward_final)

# Clasificación por grupos Dim 1 y 2 
s.class(
  pca_resultado$li, 
  fac = Grupo,
  sub = "Componentes 1 y 3 por grupo (95% confianza)", 
  possub = "bottomright",
  xax = 1, yax = 3,
  col = c("red", "dodgerblue", "#4DAF4A"),  
  cellipse = 2,       # Nivel de confianza 95%
  cpoint = 2,         # Tamaño de puntos
  cstar = 1.2,        # Tamaño de líneas al centro del grupo
  clabel = 1.2,       # Tamaño de etiquetas
  axesell = TRUE,     
  addaxes = TRUE      
)

# Cuadrícula y título
grid(col = "gray80", lty = "dotted")
title(main = "Clasificación de países por grupos (Dim 1 y 3)", cex.main = 1.5, font.main = 2)
box()

En el plano de las dimensiones 1 y 3, se mantiene una separación clara entre los grupos. La Dimensión 3 aporta diferencias vinculadas a la esperanza de vida, la mortalidad por enfermedades crónicas y el gasto per cápita en salud.En el plano se observan tres grupos bien diferenciados.

Grupo 1 (rojo): Indica que los países pertenecientes a este grupo comparten características similares y probablemente se encuentran en condiciones menos favorables en las variables que más influyen en esa dimensión, como podrían ser indicadores de desarrollo económico, infraestructura, o acceso a servicios. La forma alargada de su elipse indica cierta dispersión interna, lo que significa que, aunque los países de este grupo son parecidos, hay algunas diferencias notables entre ellos. Entre los paises encontramos a Republica Democratica del Congo con el menor gasto per capita de aproximadamente 36,8 dolarescorrientes y una mortalidad general de 9 por cada 1000 habitantes y Sudafrica con un gasto per capita de 1160.67 dolares y mortalidad general de 9 por cada 1000 habitantes.

Grupo 2 (azul): ocupa una posición intermedia entre los grupos 1 y 3. Su ubicación sugiere que estos países tienen características de nivel medio, es decir, no se encuentran en las posiciones más bajas ni más altas de las variables consideradas. Este grupo podría estar compuesto por países en vías de desarrollo o con economías en transición, que comparten algunos rasgos con las naciones más avanzadas y otros con las menos desarrolladas. Además, su elipse es más compacta, lo que evidencia una mayor homogeneidad entre sus integrantes y una menor dispersión de los datos. Podemos encontrar que para 2019 el gasto mas bajo en salud per capita fue Venezuela con 79,02 dolares y una mortalidad general de 6 por cada 1000 habitantes, sin embargo, Surinam invirtiio 1625,46 dolares en salud y su mortalidad general fue de 7 por cada 1000 habitantes.

Grupo 3 (verde): Refleja los países que poseen niveles más altos en las variables más influyentes, lo cual puede interpretarse como un mayor grado de desarrollo, productividad o bienestar social. La forma más alargada de su elipse demuestra que dentro del grupo también existe cierta diversidad: algunos países se destacan más que otros en determinados aspectos.Por ejemplo, tenemos a Belice cuyo gasto en salud per capita fue de solo 454.55 dolares y su mortalidad general de 5 por cada 1000 habitantes, en contraste, encontramos a Alemania cuyo gasto per capita en salud fue de 6830.81 dolares siendo uno de los paises que mas invierte en salud.

La representación de las dimensiones 1 y 3 complementa el análisis anterior, mostrando cómo los países más desarrollados han pasado de enfrentar enfermedades transmisibles a manejar retos de envejecimiento y salud crónica, mientras que los países del grupo 1 aún lidian con las consecuencias de la pobreza y la falta de acceso básico a servicios médicos.

4.9 TABLA DE PERTENENCIA DE PAÍSES A CLUSTERS (Método Ward)

# Crear tabla de pertenencia
tabla_pertenencia <- data.frame(
  Pais = rownames(Salud3),
  Cluster_Asignado = as.factor(grupos_ward_final)
)

# Mostrar tabla con formato
tabla_pertenencia %>%
  arrange(Cluster_Asignado) %>%
  kable(format = "html") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    font_size = 14
  ) %>%
  column_spec(1, bold = TRUE) %>%
  scroll_box(height = "400px")
Pais Cluster_Asignado
Afghanistan 1
Angola 1
Benin 1
Botswana 1
Burkina Faso 1
Burundi 1
Cambodia 1
Cameroon 1
Central African Republic 1
Chad 1
Democratic Republic of the Congo 1
Republic of Congo 1
Côte d’Ivoire 1
Eswatini 1
Ethiopia 1
Gabon 1
Gambia 1
Ghana 1
Guinea 1
Guinea-Bissau 1
Haiti 1
India 1
Indonesia 1
Kenya 1
Laos 1
Lesotho 1
Liberia 1
Madagascar 1
Malawi 1
Mali 1
Mauritania 1
Mongolia 1
Mozambique 1
Myanmar 1
Namibia 1
Nepal 1
Niger 1
Pakistan 1
Papua New Guinea 1
Philippines 1
Rwanda 1
Senegal 1
Sierra Leone 1
South Africa 1
South Sudan 1
Sudan 1
Tanzania 1
Timor-Leste 1
Togo 1
Uganda 1
Yemen 1
Zambia 1
Zimbabwe 1
Albania 2
Algeria 2
Armenia 2
Azerbaijan 2
Bahamas 2
Bangladesh 2
Belarus 2
Belize 2
Bhutan 2
Bolivia 2
Brazil 2
Bulgaria 2
Cabo Verde 2
China 2
Colombia 2
Cuba 2
Dominican Republic 2
Ecuador 2
Egypt 2
El Salvador 2
Estonia 2
Fiji 2
Georgia 2
Guatemala 2
Guyana 2
Honduras 2
Iran 2
Iraq 2
Jamaica 2
Jordan 2
Kyrgyzstan 2
Lebanon 2
Libya 2
Lithuania 2
Malaysia 2
Mexico 2
Moldova 2
Montenegro 2
Morocco 2
Nicaragua 2
North Macedonia 2
Panama 2
Paraguay 2
Peru 2
Romania 2
Russia 2
São Tomé and Príncipe 2
Saudi Arabia 2
Serbia 2
Slovakia 2
Sri Lanka 2
Suriname 2
Syria 2
Tajikistan 2
Thailand 2
Trinidad and Tobago 2
Tunisia 2
Uruguay 2
Venezuela 2
Vietnam 2
Australia 3
Belgium 3
Canada 3
Cyprus 3
Czechia 3
Denmark 3
France 3
Germany 3
Iceland 3
Ireland 3
Kuwait 3
Luxembourg 3
Maldives 3
Netherlands 3
New Zealand 3
Oman 3
Portugal 3
Qatar 3
Spain 3
United Arab Emirates 3
United Kingdom 3
United States 3
library(countrycode)

# Crear columna con código ISO3
cluster_resultados$iso3 <- countrycode(cluster_resultados$Pais,
                                       origin = "country.name",
                                       destination = "iso3c")



# Descargar geometría mundial
world <- rnaturalearth::ne_countries(scale = "medium", returnclass = "sf")

# Unir con tus clusters
world_clusters <- world %>%
  mutate(Pais = countrycode(name, "country.name", "country.name")) %>%
  left_join(cluster_resultados, by = "Pais")


pal <- colorFactor(
  palette = c("#E41A1C", "#377EB8", "#4DAF4A"), # rojo, azul, verde
  domain = world_clusters$Cluster
)

leaflet(world_clusters) %>%
  addTiles() %>%
  addPolygons(
    fillColor = ~pal(Cluster),
    weight = 1,
    opacity = 1,
    color = "white",
    dashArray = "3",
    fillOpacity = 0.7,
    highlightOptions = highlightOptions(
      weight = 2,
      color = "#666",
      dashArray = "",
      fillOpacity = 0.7,
      bringToFront = TRUE),
    label = ~paste0(Pais, " - Cluster ", Cluster),
    labelOptions = labelOptions(
      style = list("font-weight" = "normal", padding = "3px 8px"),
      textsize = "13px",
      direction = "auto")
  ) %>%
  addLegend(pal = pal, values = ~Cluster, opacity = 0.7,
            title = "Clusters de países",
            position = "bottomright")
world_clusters <- world %>%
  left_join(cluster_resultados, by = c("iso_a3" = "iso3"))

Grupo 1: Países con mayores desafíos sanitarios y estructurales.

El Grupo 1 está conformado principalmente por países de África Subsahariana, Asia meridional y algunos del Sudeste Asiático, como Afganistán, Angola, Etiopía, Malawi, Mozambique, Nepal, Uganda o Yemen, además de la India. Este grupo representa a las naciones con mayores limitaciones en infraestructura sanitaria, cobertura de servicios básicos y control epidemiológico.

De acuerdo con los resultados del PCA, estos países presentan valores altos en la segunda componente (PC2), asociada a la carga epidemiológica por enfermedades transmisibles (VIH, SIDA y tuberculosis), y valores bajos en la primera componente (PC1), que representa el nivel de bienestar y desarrollo sanitario. En este sentido, el Grupo 1 refleja contextos donde los sistemas de salud enfrentan carencias estructurales, bajos niveles de inversión y alta vulnerabilidad ante enfermedades infecciosas.

En términos generales, estos países concentran altas tasas de mortalidad infantil y general, una menor expectativa de vida, y baja cobertura de saneamiento y agua potable, lo que los ubica en el nivel más bajo del desarrollo sanitario global.

Grupo 2: Países en transición sanitaria y de desarrollo intermedio.

El Grupo 2 incluye una gran diversidad de países de América Latina, Europa del Este, Medio Oriente y Asia Central, como Colombia, México, Brasil, Egipto, Irán, Rumania, Serbia, Rusia y Tailandia. Este conglomerado agrupa a países con niveles intermedios de desarrollo sanitario, con mejoras sostenidas en cobertura, vacunación y atención médica, aunque aún persisten desigualdades internas y desafíos epidemiológicos.

En el PCA, este grupo se caracteriza por valores moderados en la PC1 (estructura sanitaria) y valores relativamente bajos en la PC2, lo que refleja menor incidencia de enfermedades transmisibles en comparación con el Grupo 1, pero sin alcanzar los niveles de eficiencia y bienestar de los países más desarrollados.

El Grupo 2 refleja sistemas de salud en consolidación, con una creciente inversión pública y mejoras en la cobertura universal, aunque todavía limitados por brechas socioeconómicas y desafíos en la sostenibilidad de sus políticas sanitarias. Puede considerarse el segmento de transición hacia un modelo sanitario más eficiente y equitativo.

Grupo 3: Países con alto desarrollo sanitario y sistemas consolidados.

El Grupo 3 reúne a las naciones con los sistemas de salud más avanzados, como Australia, Canadá, Estados Unidos, Francia, Alemania, España, Dinamarca o los Países Bajos. Estos países se ubican en el extremo más favorable del PCA, con altos valores negativos en la PC1, que representan una infraestructura sanitaria sólida, elevada expectativa de vida, cobertura universal amplia y bajos niveles de mortalidad prevenible.

Además, exhiben bajos valores en la PC2, indicando mínima presencia de enfermedades transmisibles, y valores altos en la PC3, relacionados con eficiencia en los tratamientos, respuesta institucional y capacidad de inversión.

En conjunto, el Grupo 3 representa el nivel más alto de desarrollo y bienestar sanitario global, caracterizado por políticas públicas robustas, acceso equitativo a los servicios de salud y una estructura institucional capaz de garantizar la sostenibilidad del sistema.

4.10 TABLA RESUMEN PROMEDIO POR GRUPOS

# Tabla resumen de promedios por grupo
aggregate(Salud3, by = list(Cluster = Grupo), FUN = mean)

El Cluster 1, se caracteriza,por tener los peores resultados en casi todos los indicadores. Tiene una expectativa de vida muy baja (63 años), un gasto en salud per cápita reducido (226), una mortalidad infantil elevada (44) y una alta incidencia de enfermedades infecciosas: VIH en adultos y niños (516797), muertes por sida (9815) y tuberculosis (30). Además, presenta una detección de tuberculosis del (61 %), y niveles bajos en saneamiento (42 %), acceso a agua (68 %) y cobertura sanitaria (42 %). La mortalidad por agua contaminada (39) y enfermedades cardiovasculares (24) también es alta. Este grupo representa territorios con baja inversión en salud pública, infraestructura sanitaria deficiente y altos niveles de vulnerabilidad epidemiológica, es decir, contextos donde prevalecen enfermedades transmisibles y condiciones de vida precarias.

El Cluster 2 en cambio, muestra valores moderados o equilibrados en la mayoría de los indicadores. Por ejemplo, presenta una expectativa de vida media (74 años), gasto per cápita en salud intermedio (1115), mortalidad infantil moderada (13) y cobertura de vacunación DPT relativamente alta (90 %). Además, cuenta con buenos niveles de acceso al agua (95 %) y saneamiento (89 %), así como un valor de cobertura de servicios de salud (UHC del 72) %. En conjunto, este grupo representa territorios con condiciones sanitarias aceptables, un sistema de salud funcional y niveles de mortalidad que, aunque no son los mejores, tampoco reflejan una situación crítica. Podría decirse que agrupa países o regiones con desarrollo medio y sistemas de salud estables.

Por el contrario, el Cluster 3 agrupa las mejores condiciones de salud y desarrollo. Se destaca por una alta expectativa de vida (81 años), elevado gasto en salud per cápita (4823), baja mortalidad infantil (4), y una incidencia de VIH y tuberculosis muy reducida. Además, tiene la mayor cobertura en vacunación DPT (95 %), amplio acceso a agua potable (99 %) y saneamiento básico (98 %), y una cobertura universal en salud (UHC) cercana al 82 %. También presenta los menores niveles de mortalidad por agua contaminada (2.8) y por enfermedades cardiovasculares (10). En conjunto, este grupo representa regiones o países con alto desarrollo humano, sistemas de salud robustos, y altas condiciones de bienestar general.

5 CONCLUSIONES

El análisis confirma que la desigualdad sanitaria global no es un fenómeno aislado ni producto del azar, sino el resultado de procesos históricos y estructurales que han moldeado las capacidades de los países para responder a los desafíos de salud. En este sentido, el Análisis de Componentes Principales aporta una lectura sintética pero profunda: los dos primeros componentes explican la mayor parte de la variabilidad y ayudan a comprender cómo se organizan las diferencias sanitarias en el mundo. El Componente 1 representa un eje de desarrollo estructural que recoge avances acumulados en esperanza de vida, acceso a agua y saneamiento, infraestructura sanitaria y cobertura de vacunación. El Componente 2, por su parte, captura diferencias en carga epidemiológica, eficiencia del gasto y resiliencia institucional. Así, el PCA no solo reduce la dimensionalidad, sino que revela que las desigualdades sanitarias responden tanto a capacidades estructurales como a presiones epidemiológicas persistentes, confirmando que la salud es un fenómeno profundamente histórico y sistémico.

Los clústeres obtenidos mediante el método de Ward reflejan no solo diferencias estadísticas, sino trayectorias de desarrollo sanitario marcadas por la acumulación de ventajas o desventajas a lo largo del tiempo. El Grupo de Alto Desempeño, concentrado en Norteamérica, Europa Occidental, Asia Oriental y Oceanía, muestra indicadores positivos que no pueden entenderse únicamente como fruto de políticas recientes, sino como resultado de décadas de inversión acumulada, estabilidad institucional y consolidación de sistemas universales.

El Grupo Intermedio, donde se ubica gran parte de América Latina —incluida Colombia—, representa países en transición: han logrado avances significativos en esperanza de vida, vacunación y acceso a servicios básicos, pero aún enfrentan fragilidades en eficiencia del gasto y desigualdades internas que revelan un desarrollo fragmentado y heterogéneo.

Finalmente, el Grupo de Vulnerabilidad Crítica, concentrado en África Subsahariana y partes de Asia, evidencia limitaciones persistentes en infraestructura, sistemas de salud poco robustos y una alta carga de enfermedades infecciosas, agravadas por dinámicas globales de dependencia económica e inestabilidad política.

La lectura crítica de estos patrones invita a reconocer que el desarrollo sanitario no avanza como un bloque homogéneo, sino como un mosaico de avances y retrocesos. Países como Colombia requieren estrategias que trasciendan la ampliación del acceso básico y se centren en mejorar la eficiencia del gasto y fortalecer la capacidad institucional de respuesta. Los casos atípicos, como Sudáfrica —con un desarrollo moderado pero una carga epidemiológica excesiva— o la República Centroafricana —con déficits acumulados en todos los ejes—, son especialmente reveladores: muestran tanto fallos estructurales como la necesidad de políticas focalizadas que reconozcan realidades específicas y eviten soluciones uniformes.

En conjunto, el mapa y el análisis multivariado confirman que los patrones de desarrollo sanitario son sistémicos y regionales, no individuales. Los países se parecen a sus vecinos porque comparten contextos históricos, instituciones y capacidades similares. Esto obliga a repensar las políticas públicas: no basta con diseñar estrategias país por país, sino que se requieren alianzas regionales, cooperación técnica e inversión conjunta a largo plazo.

Más allá de describir diferencias, este estudio ofrece una base empírica para la acción: focalizar recursos en los países con mayores déficits, priorizar inversiones en infraestructura básica y programas de control epidemiológico, evaluar la eficiencia del gasto y diseñar estrategias diferenciadas que respondan a realidades complejas y desiguales. En síntesis, la desigualdad sanitaria global no solo se mide en indicadores, sino que refleja procesos históricos y estructurales que deben ser enfrentados con políticas adaptadas, sostenibles y regionalmente coordinadas. El verdadero valor del análisis está en que nos obliga a reflexionar sobre las causas profundas de las diferencias y sobre la necesidad de construir respuestas colectivas que trasciendan fronteras y reconozcan la naturaleza compartida de los desafíos en salud global.

6 REFERENCIAS

  • UNAIDS – Fact Sheet 2024: muestra que la región del África Subsahariana concentra una parte muy significativa de las personas que viven con VIH, y que las mujeres y niñas representan el 62 % de todas las nuevas infecciones en esa regiónUNAIDS Fact Sheet 2024

  • UNICEF – Datos sobre mortalidad infantil: UNICEF – Child Mortality Data

  • World Health Organization (Región Africana) – Informe sobre VIH: “En la Región Africana se estimaban 25.6 millones de personas que viven con VIH en 2021… WHO Regional Factsheet HIV Africa

  • Informe sobre Tuberculosis en la región africana:: Tuberculosis in the WHO African Region – 2023 Progress Update

  • https://www.afro.who.int/sites/default/files/2023-08/CAR.pdf?utm_source

  • https://www.msf.mx/actualidad/el-vih-es-una-crisis-silenciosa-en-republica-centroafricana/#:~:text=Aunque%20la%20Rep%C3%BAblica%20Centroafricana%20(RCA,confirman%20unos%205%2C500%20nuevos%20casos.