Aplicación de ACP y Clústeres sobre Indicadores Multidimensionales de Desarrollo Humano:

El mundo contemporáneo está marcado por profundas asimetrías en el desarrollo, donde países con similares condiciones geográficas o históricas exhiben trayectorias socioeconómicas radicalmente distintas. Tradicionalmente, el Índice de Desarrollo Humano (IDH) desarrollado por el Programa de las Naciones Unidas para el Desarrollo (PNUD ha servido como brújula para medir el progreso de los países más allá del crecimiento económico, integrando dimensiones clave como salud, educación y nivel de vida. Sin embargo, detrás de este índice subyacen patrones ocultos que solo pueden develarse mediante técnicas avanzadas de análisis multivariado.

Hallazgos preliminares:

  • Países escandinavos, Suiza y Australia muestran los IDH más altos (>0.9).

  • África subsahariana y zonas de conflicto (ej: Sudán del Sur) presentan los valores más bajos (<0.4).

Introducción

El mundo contemporáneo está marcado por profundas asimetrías en el desarrollo, donde países con similares condiciones geográficas o históricas exhiben trayectorias socioeconómicas radicalmente distintas. Tradicionalmente, el Índice de Desarrollo Humano (IDH) desarrollado por el Programa de las Naciones Unidas para el Desarrollo (PNUD ha servido como brújula para medir el progreso de los países más allá del crecimiento económico, integrando dimensiones clave como salud, educación y nivel de vida. Sin embargo, detrás de este índice subyacen patrones ocultos que solo pueden develarse mediante técnicas avanzadas de análisis multivariado.

El Problema: Más Allá del Promedio

Este estudio tiene como objetivo identificar y cuantificar las relaciones entre el Índice de Desarrollo Humano (IDH) y un conjunto de trece variables clave que reflejan distintas dimensiones del bienestar y la calidad de vida en los países. Estas variables se agrupan en cuatro categorías: económicas (Producto Interno Bruto per cápita, tasa de desempleo y coeficiente de Gini), sociales (esperanza de vida, tasa de alfabetización, mortalidad infantil y nivel de educación terciaria), institucionales (gasto público en educación, gasto público en salud y niveles percibidos de corrupción), y ambientales y de infraestructura (emisiones de CO₂ per cápita, acceso a agua potable y acceso a internet).

El desarrollo humano no puede reducirse a una simple dicotomía entre países “ricos” y “pobres”. Tras identificar patrones generales a través del análisis descriptivo, nos adentramos ahora en un territorio más complejo: ¿cómo se agrupan realmente los países cuando consideramos simultáneamente sus dimensiones económicas, sociales y ambientales?

Los métodos estadísticos tradicionales nos sugerían una división binaria, pero la realidad es notablemente más matizada. Algunas preguntas clave emergen:

  • ¿Existen modelos alternativos de desarrollo más allá del paradigma tradicional de crecimiento económico?

  • ¿Cómo se relacionan las inversiones en salud y educación con los resultados en calidad de vida?

  • ¿Podemos identificar grupos de países que, a pesar de tener niveles similares de ingreso, muestren trayectorias de desarrollo radicalmente diferentes?

Para responder a estos interrogantes, se diseñó un enfoque metodológico basado en técnicas de análisis multivariado no supervisado. Este permite explorar simultáneamente múltiples dimensiones del desarrollo humano y descubrir estructuras subyacentes en los datos que no serían visibles mediante análisis univariados o bivariados tradicionales.

A continuación, se describe paso a paso el procedimiento analítico aplicado: desde la preparación y normalización de los datos, hasta la implementación de algoritmos de reducción de dimensión y segmentación, como el Análisis de Componentes Principales (PCA), el agrupamiento jerárquico (Ward) y el algoritmo de K-means. Estas herramientas permiten identificar agrupaciones de países con trayectorias de desarrollo similares, revelar perfiles contrastantes y ofrecer nuevas perspectivas sobre las desigualdades globales.

Metodología.

Para comprender mejor los patrones de desarrollo identificados, es fundamental examinar en detalle las variables que sustentan el análisis. A continuación, se presenta una descripción de los trece indicadores seleccionados, sus unidades de medida y su relevancia dentro del marco del desarrollo humano.

Descripción Conceptual de las Variables Utilizadas.

Tabla 1. Descripción Conceptual de las Variables Utilizadas en el Análisis de Desarrollo Humano
Variable Descripción
IDH Índice compuesto que mide el desarrollo humano en función de salud, educación e ingresos.
PIB per cápita Valor promedio de los ingresos económicos por persona en un país.
Esperanza de vida Años que se espera que viva una persona al nacer, según las condiciones del país.
Alfabetización Porcentaje de adultos que saben leer y escribir.
Índice de Gini Indicador de desigualdad en la distribución del ingreso (0 = igualdad, 100 = desigualdad extrema).
Mortalidad infantil Muertes de menores de 1 año por cada 1.000 nacimientos.
Gasto en educación Porcentaje del PIB nacional destinado a la educación.
Gasto en salud Porcentaje del PIB nacional destinado a salud pública.
Acceso a internet Porcentaje de personas con acceso a internet en el país.
Acceso a agua potable Porcentaje de población con acceso a agua potable segura.
Tasa de desempleo Porcentaje de la población económicamente activa sin empleo.
Emisiones de CO₂ Emisiones de dióxido de carbono per cápita (toneladas métricas).
Percepción de corrupción Índice de percepción de la corrupción (mayor = menor corrupción percibida).
Educación terciaria Porcentaje de adultos con educación superior completa.

El IDH no actúa en el vacío: su comportamiento está íntimamente ligado a dinámicas económicas, sociales y ambientales. La siguiente matriz de correlación revela patrones críticos:

El análisis revela hallazgos contundentes sobre los factores que impulsan o limitan el desarrollo humano. La esperanza de vida presenta la correlación más alta con el IDH (+0.89), lo que confirma que la salud es el pilar más sólido del bienestar y el progreso social. Le sigue el PIB per cápita (+0.76), indicando que los recursos económicos continúan siendo fundamentales, pues permiten a las personas acceder a servicios básicos y mejorar su calidad de vida. La conectividad digital, representada por el acceso a internet, muestra una correlación significativa (+0.72), posicionándose como un nuevo determinante del desarrollo en la era contemporánea. El gasto en educación (+0.68) también demuestra un impacto importante, lo que respalda la idea de que invertir en capital humano genera retornos directos en el IDH. En contraste, el coeficiente de Gini exhibe una correlación negativa (-0.54), lo que sugiere que la desigualdad actúa como un freno estructural al desarrollo, incluso en contextos de alta riqueza económica. Estos resultados evidencian que el desarrollo humano es multidimensional y depende tanto de condiciones materiales como de equidad y acceso inclusivo a oportunidades.

▶ El mito del crecimiento económico

La relación entre PIB e IDH no siempre es directa:

  • Cuba (IDH: 0.78, PIB bajo) supera a Gabón (IDH: 0.46, PIB alto)

Esto sugiere que las políticas redistributivas, en salud y educación, pueden compensar limitaciones económicas.

▶ La paradoja ambiental

Las emisiones de CO₂ correlacionan positivamente con el IDH (r ≈ 0.41), lo que plantea un dilema:

¿Es posible alcanzar altos niveles de desarrollo sin incrementar la huella ecológica?

Rastreando patrones ocultos del desarrollo.

Para comprender las complejas trayectorias del desarrollo humano más allá del promedio, implementamos una estrategia metodológica que combina herramientas estadísticas avanzadas: Análisis de Componentes Principales (ACP) y técnicas de agrupamiento no supervisado (K-means y Ward). Estas herramientas no solo permiten reducir la complejidad de los datos, sino también descubrir estructuras internas que no son evidentes a simple vista.

La base del análisis fue una matriz multivariada de 14 indicadores cuantitativos, todos relacionados con dimensiones críticas del desarrollo: salud, educación, economía, infraestructura y gobernanza. Estos indicadores fueron cuidadosamente estandarizados utilizando el método z-score, garantizando así que cada variable contribuyera en igualdad de condiciones al análisis, sin sesgos por escala o unidades. De igual manera, dado el alto número de variables, se recurrió al ACP como técnica de reducción de dimensionalidad. Este método permite resumir la información contenida en las variables originales en un número reducido de componentes principales, que son combinaciones lineales ortogonales entre sí.

El primer componente explicó principalmente la varianza asociada a factores económicos y de salud (como PIB, esperanza de vida y acceso a internet), mientras que el segundo estuvo vinculado al gasto público y a indicadores sociales como la mortalidad infantil. La elección del número de componentes se basó en el criterio de Kaiser (autovalores > 1) y el análisis de varianza acumulada (>80%)

Base de datos

🔽 Ver base de datos interactiva

Modelo

Para identificar patrones estructurales en los perfiles de desarrollo de los países, se aplicaron dos técnicas complementarias de segmentación no supervisada: K-means y agrupamiento jerárquico con el método de Ward. Ambas permiten clasificar a los países en grupos homogéneos según sus valores en variables clave, aunque parten de enfoques distintos.

K-means

El algoritmo K-means busca particionar el conjunto de países en K clústeres, minimizando la variabilidad interna de cada grupo. Es un enfoque iterativo que asigna cada observación al clúster con el centroide más cercano (según distancia euclidiana) y recalcula los centroides hasta lograr una solución estable.

\[\underset{C}{\text{min}} \sum_{k=1}^{K} \sum_{x_i \in C_k} \| x_i - \mu_k \|^2\]

Donde:

  • xi representa el vector de características de un país,
  • μk es el centroide del clúster Ck,
  • K = 3 es el número de clústeres definidos.

Ward (agrupamiento jerárquico)

El método de Ward es una técnica jerárquica aglomerativa que inicia con cada observación como un clúster individual y va fusionando los pares de clústeres que minimizan el incremento de la suma de cuadrados intra-clúster \[\Delta(WSS) = \sum_{x_i \in C_i \cup C_j} \| x_i - \mu_{ij} \|^2 - \left( \sum_{x_i \in C_i} \| x_i - \mu_i \|^2 + \sum_{x_i \in C_j} \| x_i - \mu_j \|^2 \right)\]

Donde:

  • Ci y Cj son clústeres candidatos a fusionarse,
  • μij es el centroide del nuevo clúster combinado,
  • Δ(WSS) representa el aumento en la variación interna al fusionar.

A diferencia de K-means, no requiere definir K al inicio; este se selecciona con base en el análisis del dendrograma.

Una vez definidos los modelos de agrupamiento aplicados —K-means y Ward— y su justificación metodológica, es necesario comprender mejor el comportamiento individual de cada variable antes de avanzar en el análisis multivariado. Para ello, se realiza un estudio estadístico descriptivo que permite explorar la distribución, los rangos y las relaciones preliminares entre los indicadores seleccionados. Este paso es clave para identificar outliers, sesgos o patrones estructurales que podrían influir en la formación de clústeres y en la interpretación de los resultados posteriores.

Estadística descriptiva

Radiografía Global del Desarrollo Humano.

Estadísticas Descriptivas de las Variables Socioeconómicas y Ambientales
N Media Desviación estándar Mínimo Mediana Máximo
IDH 214 0.60 0.16 0.29 0.60 0.95
PIB per cápita 214 17533.06 25907.10 210.01 6228.32 176891.89
Esperanza de vida 214 72.35 7.43 50.60 72.89 86.09
Alfabetización 213 87.85 17.04 27.28 96.00 100.00
Desigualdad (Gini) 214 38.29 7.99 22.90 37.50 63.00
Mortalidad infantil 214 19.33 18.78 1.60 12.00 86.50
Gasto en educación (%PIB) 214 12.25 24.85 0.36 4.58 100.00
Gasto en salud (%PIB) 214 1318.37 2431.48 12.42 391.23 25000.00
Emisiones de CO₂ 214 4.56 5.02 0.10 3.20 35.60
Corrupción percibida 214 38.51 20.94 0.00 36.00 90.00
Desempleo (%) 214 9.91 10.13 0.14 6.66 74.17
Acceso a agua potable 214 71.29 31.83 5.56 87.98 100.00
Acceso a internet (%) 214 0.67 0.25 0.08 0.73 1.00
ed_terciaria 214 37.49 27.30 0.00 35.00 112.50

El análisis descriptivo de las 14 variables cuantitativas evidencia una amplia heterogeneidad entre los países analizados:

  • El Índice de Desarrollo Humano (IDH) presenta una media global de 0.60, con valores que oscilan entre 0.29 (mínimo) y 0.95 (máximo), lo que refleja fuertes desigualdades estructurales a nivel global.

  • En términos económicos, el PIB per cápita exhibe una distribución altamente asimétrica, con un promedio de 17,533 USD, pero con países que alcanzan hasta 176,891 USD y otros por debajo de 300 USD, lo que sugiere la existencia de extremos atípicos en la muestra.

  • La esperanza de vida tiene un promedio de 72.35 años, con una mediana cercana (72.89 años), lo que sugiere una distribución relativamente simétrica, aunque aún existen países con esperanza de vida por debajo de los 51 años.

  • La tasa de alfabetización muestra un promedio elevado (87.85%), aunque hay casos críticos como el mínimo observado (27.28%), lo cual indica brechas importantes en acceso a educación básica.

  • La desigualdad del ingreso medida con el coeficiente de Gini promedia 38.29, y se extiende desde 22.9 (igualdad alta) hasta 63.0 (alta desigualdad).

  • La mortalidad infantil varía ampliamente: desde países con solo 1.6 muertes por cada 1.000 nacidos vivos, hasta regiones con más de 86 muertes, lo que subraya desigualdades severas en salud básica.

  • En relación al gasto público, se observa alta variabilidad en educación (media del 12.25% del PIB, pero con un máximo atípico del 100%) y salud (media de 1,318 USD, con valores extremos que alcanzan 25,000 USD per cápita), lo que sugiere necesidad de revisar outliers o unidades de medida.

  • Las emisiones de CO₂ per cápita tienen una media de 4.56 toneladas, indicando una posible relación entre industrialización y desarrollo, aunque también plantean preocupaciones ambientales.

  • El índice de percepción de corrupción tiene un promedio de 38.5, en una escala donde 100 representa total transparencia; esto evidencia una confianza institucional moderada a baja en gran parte del mundo.

  • En el ámbito laboral, la tasa de desempleo promedio es de 9.91%, pero se observan casos extremos que alcanzan el 74%, lo que puede ser reflejo de crisis estructurales o sociales profundas.

  • El acceso a agua potable promedia el 71.3%, con mínimos alarmantes del 5.56%, lo que subraya la urgencia de inversión en infraestructura básica.

  • La conectividad digital medida por el acceso a internet tiene una media de 67%, aunque algunos países muestran aún penetraciones inferiores al 10%, lo que limita su inserción en la economía del conocimiento.

  • Finalmente, el acceso a educación terciaria alcanza una media de 37.5%, con países que superan el 100% debido a dinámicas migratorias o estadísticas acumuladas, lo cual también sugiere revisar unidades o definiciones locales.

La visualización de histogramas permite observar la forma de distribución de cada variable. Algunas, como el acceso a internet o la alfabetización, presentan una concentración hacia valores altos, reflejando logros generalizados. Otras, como el PIB per cápita o el gasto en salud, muestran distribuciones más asimétricas, revelando disparidades sustanciales entre países.

El mapa muestra los países con el IDH más alto y el más bajo dentro del conjunto analizado. Esto permite visualizar una brecha significativa en desarrollo humano, con Mónaco (Europa) representando el máximo nivel de desarrollo y la República Centroafricana (África) el mínimo.

Mientras las tablas muestranla amplitud de las brechas en desarrollo humano, al ubicar estos extremos en el mapa descubrimos un patrón inquietante: la concentración geográfica de la prosperidad y la adversidad. Este salto de los datos a su representación espacial nos prepara para el siguiente nivel de análisis: entender cómo se agrupan los países según estas variables.

Resultados:

Análisis Multidimensional del Desarrollo Humano.

Aunque los métodos estadísticos sugerían 2 clusters como solución óptima, la división binaria resultaba demasiado simplista, agrupando erróneamente países con realidades muy distintas.Por esta razón, se exploró una solución con k = 3, que si bien no mejora radicalmente los indicadores estadísticos, sí permite una segmentación más matizada y útil para el análisis comparativo. Los tres clústeres reflejan con mayor fidelidad los niveles de desarrollo integral.

  • Un grupo de países con altos niveles de desarrollo integral (elevado IDH, acceso a servicios, estabilidad económica).

  • Un grupo intermedio con indicadores mixtos, en transición hacia un mayor desarrollo.

  • Un grupo rezagado con bajas coberturas en variables clave (como salud, educación o conectividad)

Una forma cuantitativa de evaluar la calidad de un modelo de agrupamiento es observar la varianza intra-clúster total, es decir, la suma de las distancias cuadradas entre cada punto y el centroide de su clúster. Cuanto menor sea esta varianza, mayor cohesión interna tendrá cada grupo.

##  Varianza intra-cluster total con k = 2: 1968.923
##  Varianza intra-cluster total con k = 3: 1639.33

Esto representa una reducción significativa de casi el 17%, lo que indica que los clústeres generados con tres grupos son más compactos y homogéneos internamente. Este comportamiento es coherente con lo observado en los gráficos del método del codo y de la silueta, que también sugieren que K = 3 ofrece una mejor partición del espacio de datos.

Promedios de Variables por Clúster (K = 3)
cluster media_IDH media_PIB media_esperanza_vida media_alfabetizacion media_gini media_mort_infantil media_gasto_edu media_gasto_sal media_emisiones_CO2 media_corrupcion media_desempleo media_agua_potable media_acceso_internet media_ed_terciaria
1 -0.05 -0.38 0.02 0.35 0.21 -0.29 0.18 -0.34 -0.15 -0.23 0.08 0.04 0.05 -0.06
2 1.03 1.04 1.01 0.59 -0.58 -0.78 -0.24 0.88 0.86 0.73 -0.36 0.72 1.00 0.90
3 -1.18 -0.63 -1.27 -1.30 0.36 1.43 -0.01 -0.52 -0.81 -0.51 0.30 -0.95 -1.30 -1.00

El análisis de clústeres con K = 3 permitió identificar tres grupos diferenciados de países a partir de variables relacionadas con el desarrollo humano, económico y social. A continuación, se presentan las características principales de cada clúster según los promedios de las variables estandarizadas:

  • Clúster 1: Este grupo agrupa principalmente países con niveles intermedios de desarrollo. Aunque presentan un IDH medio, sus indicadores como acceso a internet, esperanza de vida, y gasto en salud o educación tienden a valores moderados. Representan naciones en vías de consolidación en términos de bienestar y servicios básicos.

  • Clúster 2: Está compuesto por países con los valores promedio más bajos en variables clave como PIB per cápita, alfabetización, gasto en salud y esperanza de vida. Esto sugiere que son países con mayores desafíos estructurales, tanto económicos como sociales. El IDH en este clúster es generalmente bajo.

  • Clúster 3: Reúne a los países con los niveles más altos de desarrollo. Se caracteriza por elevados valores en IDH, PIB per cápita, años promedio de escolaridad, acceso a servicios básicos y baja mortalidad. Este clúster representa naciones con alto grado de consolidación institucional y económica.

La segmentación obtenida permite evidenciar desigualdades globales y facilita el análisis comparativo entre países con características similares. Además, la elección de tres clústeres resulta más adecuada que dos, ya que permite una mejor distinción entre niveles bajo, medio y alto de desarrollo, evitando la simplificación excesiva que implica una división binaria.

Esta segmentación no solo permite interpretar diferencias sustantivas entre grupos de países, sino que también puede formalizarse desde un enfoque matemático. Para ello, se considera que las variables explicativas forman una matriz \(X \in \mathbb{R}^{n \times 13}\), donde cada fila representa un país y cada columna una característica cuantitativa asociada al desarrollo humano.

El algoritmo aplicado, K-means, busca dividir esta matriz en \(k\) subconjuntos que minimicen la variación interna de cada grupo. En términos matemáticos, este proceso consiste en minimizar la suma de las distancias cuadradas entre cada observación \(x_i\) y el centroide de su clúster correspondiente \(\mu_k\):

El modelo aplicado fue el algoritmo de K-means, que consiste en minimizar la suma de las distancias cuadradas entre cada punto \(x_i\) y su centroide correspondiente \(\mu_k\), para cada clúster \(C_k\):

\[ \underset{C}{\text{min}} \sum_{k=1}^{3} \sum_{x_i \in C_k} \| x_i - \mu_k \|^2 \] Donde:

  • \(x_i\) es un país en el espacio de variables escaladas,
  • \(\mu_k\) es el centroide del clúster \(k\),
  • \(C_k\) representa el conjunto de países asignados al clúster \(k\).

La expresión matemática anterior define el objetivo del algoritmo K-means: minimizar la dispersión intra-clúster al asignar cada observación a su centroide más cercano. Para operacionalizar este modelo, se procedió a su implementación en R, aplicando K-means con \(k = 3\) sobre los datos previamente estandarizados.

Además, con el fin de contrastar enfoques y evaluar la robustez de la segmentación, también se aplicó un agrupamiento jerárquico utilizando el método de Ward. Este método aglomera observaciones en función de su distancia euclidiana, minimizando la varianza dentro de los grupos formados en cada paso.

A continuación, se presenta el código correspondiente al proceso completo: carga y preparación de los datos, ejecución de ambos algoritmos de clustering, y visualización de los resultados mediante Análisis de Componentes Principales (PCA), lo cual permite interpretar gráficamente la separación entre grupos y su estructura interna.

Ambos métodos coinciden en que tres agrupaciones permiten captar la estructura subyacente en los datos. Aunque estadísticamente algunos criterios como Silhouette puedan sugerir 2 clústeres, el análisis visual con PCA muestra que una división en tres clústeres resulta más interpretativamente rica.

A través de esta combinación metodológica, se evidencia que los países del mundo pueden ser agrupados en tres grandes bloques de desarrollo humano, cada uno con características socioeconómicas distintivas. Este enfoque aporta una mirada más rica y estructural al concepto de desarrollo, permitiendo distinguir entre países que comparten niveles similares de IDH pero tienen diferencias relevantes en otras dimensiones clave como salud, educación o infraestructura básica.

Para reforzar la robustez de estos hallazgos, resulta fundamental complementar el análisis con un enfoque jerárquico, que permite visualizar las relaciones de proximidad entre países de manera más detallada y sin asumir a priori el número de grupos

El dendrograma jerárquico generado mediante el método de Ward permite visualizar cómo los países se agrupan progresivamente según sus características socioeconómicas y de desarrollo. Al aplicar un corte a una altura adecuada, se identifican claramente tres clústeres principales, lo que respalda la elección de k = 3 en el análisis de K-means.

Los países que se agrupan en niveles bajos del dendrograma comparten similitudes marcadas, mientras que los grupos que se forman a mayor altura reflejan combinaciones de países más diversos.El dendrograma jerárquico nos ha permitido visualizar la estructura de agrupamiento natural de los países, confirmando la pertinencia de utilizar tres clusters.

Si bien el dendrograma obtenido mediante el método de Ward permite identificar agrupamientos jerárquicos entre países, resulta útil proyectar esta información en un espacio de menor dimensión que facilite su interpretación visual. Para ello, se aplicó un Análisis de Componentes Principales (PCA), técnica que transforma las variables originales en un nuevo sistema de ejes ortogonales que conservan la mayor parte de la varianza presente en los datos.

A continuación, se presenta el scree plot, que muestra la proporción de varianza explicada por cada componente principal, así como un gráfico que representa las variables como vectores, revelando su contribución relativa a los ejes principales y las relaciones existentes entre ellas.

El scree plot resultante evidencia que los primeros dos componentes principales explican una proporción significativa de la varianza total, lo que justifica su uso para representar gráficamente la distribución de los países y las contribuciones relativas de cada variable. Esta reducción permite observar patrones y agrupaciones sin perder demasiada información estadística.

Por otro lado, la visualización de las variables como vectores en el espacio de los dos primeros componentes muestra que el IDH, la esperanza de vida, el PIB per cápita, el acceso a servicios básicos (agua potable, electricidad, salud) y otros factores tienden a estar fuertemente correlacionados entre sí y contribuyen positivamente al primer componente principal. En contraste, variables como la mortalidad infantil y el desempleo presentan correlación negativa, apuntando en sentido opuesto. Esto sugiere que el primer componente puede interpretarse como un eje de desarrollo socioeconómico.

Esta transición metodológica nos permite pasar de entender “cómo se agrupan los países” a comprender “por qué se agrupan de esa manera”, estableciendo un puente entre la estructura de clusters y las variables subyacentes que la determinan.

Conclusiones

Para comprender mejor las características distintivas de cada grupo de países, resulta invaluable complementar este enfoque con una visualización comparativa de sus perfiles promedio.

La combinación de K-means y Ward permitió agrupar países según múltiples dimensiones del desarrollo, revelando patrones ocultos más allá del ingreso. El gráfico de radar, al comparar perfiles promedio normalizados por clúster, mostró diferencias claras en variables como salud, educación o infraestructura. Este enfoque visual y analítico facilitó la identificación de tipologías de desarrollo contrastantes, resaltando fortalezas y debilidades propias de cada grupo.

El gráfico de radar comparativo muestra con claridad que cada clúster sigue un perfil distinto. Un grupo presenta altos promedios normalizados en variables como salud, educación, PIB per cápita y acceso a servicios, representando países con alto desarrollo humano. Otro clúster muestra desempeños intermedios, lo que sugiere procesos de consolidación institucional y económica. El tercer grupo se caracteriza por bajos niveles en la mayoría de los indicadores, reflejando mayores desafíos estructurales.

Este mapa de calor muestra cómo se comportan, en promedio, las variables socioeconómicas y ambientales dentro de cada clúster. Los colores más oscuros indican valores más altos (normalizados), permitiendo detectar rápidamente qué grupos presentan mejores indicadores en aspectos como salud, educación, o acceso a servicios. Así, se evidencian perfiles diferenciados de desarrollo humano entre los clústeres.

Los clústeres identificados muestran perfiles promedio claramente diferenciados, lo que evidencia que niveles similares de ingreso no implican necesariamente trayectorias de bienestar equivalentes. Este análisis permite comprender con mayor profundidad cómo se combinan distintos factores —económicos, sociales, institucionales y ambientales— para configurar realidades de desarrollo heterogéneas, desafiando las clasificaciones tradicionales y abriendo paso a modelos más integrales e interdependientes del desarrollo.

Este conjunto de diagramas de caja muestra cómo varía cada variable cuantitativa entre los tres clústeres identificados. Se observan diferencias notables en indicadores como el PIB, la esperanza de vida o el acceso a servicios, lo que refuerza la validez de la segmentación. Las cajas muestran los rangos intercuartílicos, mientras que los puntos fuera de las cajas revelan países atípicos respecto a su grupo.

Los hallazgos de este estudio permiten afirmar que existen modelos alternativos de desarrollo más allá del paradigma tradicional basado exclusivamente en el crecimiento económico. A través del análisis multivariado y la segmentación de países en clústeres, se evidenció que algunos países con niveles de ingreso medio logran alcanzar indicadores sociales y de bienestar comparables —e incluso superiores— a los de economías más ricas. Esto indica que el desarrollo humano puede construirse a partir de estrategias centradas en la equidad, el acceso a servicios básicos y la sostenibilidad, más que en la expansión del PIB per cápita por sí sola.

Asimismo, las inversiones en salud y educación mostraron una correlación notable con variables clave del bienestar, como la esperanza de vida, la alfabetización y los años promedio de escolaridad. Los clústeres con mejor desempeño en estas dimensiones no siempre fueron los más ricos, sino aquellos que asignan mayores proporciones de gasto público a servicios sociales. Esto sugiere que el fortalecimiento de capacidades humanas —más que el simple crecimiento económico— es un factor decisivo en la mejora de la calidad de vida.

El mapa interactivo resultante muestra claramente que los países no se agrupan únicamente por nivel de ingreso, sino por la combinación compleja de factores económicos, sociales e institucionales que configuran su trayectoria de desarrollo. Esta clasificación permitió visualizar diferencias regionales significativas: mientras que algunos clústeres agrupan países con altos niveles de inversión social y resultados positivos en salud, educación y acceso a servicios, otros reflejan condiciones más precarias pese a contar con recursos económicos considerables. Este estudio revela que el desarrollo humano va más allá del ingreso económico, al identificar patrones complejos mediante análisis multivariado y técnicas de clúster como K-means y Ward. Los resultados muestran que países con ingresos similares pueden tener trayectorias muy distintas según sus inversiones sociales, institucionales y ambientales. Al integrar datos económicos, sociales e institucionales, se destacan perfiles diferenciados de desarrollo, lo que permite cuestionar el modelo tradicional centrado solo en el crecimiento económico y propone una visión más integral y contextual del bienestar humano.

Bibliografía

  • PNUD. (2023). Informe sobre Desarrollo Humano 2023-2024. Programa de las Naciones Unidas para el Desarrollo. https://hdr.undp.org/

  • Kaufman, L., & Rousseeuw, P. J. (2009). Finding Groups in Data: An Introduction to Cluster Analysis. Wiley.

  • James, G., Witten, D., Hastie, T., & Tibshirani, R. (2021). An Introduction to Statistical Learning: with Applications in R (2nd ed.). Springer. https://www.statlearning.com/

  • Everitt, B. S., & Hothorn, T. (2011). An Introduction to Applied Multivariate Analysis with R. Springer.

  • Wickham, H., & Grolemund, G. (2016). R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O’Reilly Media. https://r4ds.hadley.nz/

  • World Bank. (2024). World Development Indicators. The World Bank Group. https://databank.worldbank.org/

  • OECD. (2023). How’s Life? Measuring Well-being. OECD Publishing. https://www.oecd.org/statistics/how-s-life.htm

  • R Core Team. (2024). R: A Language and Environment for Statistical Computing. R Foundation for Statisti