2026-06-04

Introducción

Los países pertenecientes a la OCDE comparten altos niveles de desarrollo económico e institucional; sin embargo, presentan diferencias importantes en variables como inflación, comercio exterior, inversión, desempleo y crecimiento económico. Estas diferencias pueden generar distintos niveles de vulnerabilidad macroeconómica frente a choques externos o cambios en las condiciones económicas globales. Por esta razón, resulta relevante identificar si existen perfiles económicos similares entre los países y comprender qué factores explican dichas diferencias. Para ello, se emplearon técnicas de aprendizaje no supervisado, las cuales permiten descubrir patrones y agrupamientos en los datos sin contar con clasificaciones previas.

Pregunta de investigación

¿Es posible identificar perfiles diferenciados de vulnerabilidad macroeconómica entre los países de la OCDE y determinar qué dimensiones latentes explican esas diferencias estructurales mediante técnicas de aprendizaje no supervisado?

Metodología

Para identificar perfiles de vulnerabilidad sin clasificaciones previas, se adoptó un enfoque de aprendizaje no supervisado enfocado en dos etapas estratégicas complementarias:

Etapa 1: Reducción (ACP)

  • Reduce las 15 variables económicas originales.
  • Identifica factores latentes.
  • Conserva la información más relevante.
  • Facilita la interpretación económica.

Etapa 2: Clusterización
Ward: Identifica grupos iniciales minimizando la variabilidad interna.
K-means: Refina la asignación final de los países a cada grupo.
• Permite identificar perfiles de vulnerabilidad similares.

Etapa 3: Interpretación
• Análisis de los clusters obtenidos.
• Caracterización de los perfiles económicos.
• Identificación de niveles de vulnerabilidad macroeconómica.

Estadisticas descriptivas

Estadísticas descriptivas de las variables seleccionadas
Variable Media Mediana DE Min Max
x1 1.012 0.356 5.079 -7.282 14.913
x2 0.951 0.262 1.337 -0.319 4.555
x5 26.008 26.102 1.219 22.813 28.445
x11 27.153 27.004 1.362 23.660 30.653
x14 27.507 27.034 2.319 23.804 34.375
x15 10.670 10.405 6.887 -3.586 27.823
x16 12.824 13.125 8.240 -8.283 35.465
x18 2.342 2.369 0.671 -0.276 4.251
x19 6.085 3.068 9.122 -0.868 54.152
x20 7.344 6.599 10.812 -39.070 35.318
x21 1.701 1.746 0.694 -0.920 3.021
x22 1.275 1.392 0.739 -0.901 2.536
x25 0.309 0.129 0.684 0.000 4.207
x26 1.852 1.805 0.500 1.037 3.534
x29 0.996 0.020 3.171 -0.739 18.714

Hallazgos principales

El análisis evidencia una fuerte heterogeneidad que justifica segmentar por clustering para identificar perfiles de vulnerabilidad. Las mayores variaciones se observan en inversión fija (x20) e inflación (x19), con rangos amplios que reflejan alta volatilidad. Asimismo, la cuenta corriente (x1) presenta desequilibrios clave para definir los grupos. En contraste, el PIB en PPP (x11), las exportaciones (x5) y el deflactor de importaciones (x14) son más estables, destacando también el mercado laboral (x26) por su baja dispersión. Por estas diferencias de escala, es indispensable estandarizar los datos antes del análisis.

Correlación

Análisis de Correlación y ACP

Correlaciones Positivas: Destaca la relación casi idéntica entre inflación (x19) y deflactor de importaciones (x25) con un coeficiente de 0.92, y la relación entre exportaciones (x5) y PIB (x11) con 0.81. El PIB nominal (x18) se vincula con la inflación (0.72) y el consumo (0.67), mientras que inversión (x20) e importaciones (x16) avanzan juntas (0.68).

Correlaciones Negativas: La cuenta corriente (x1) presenta los impactos negativos más notables, mostrando que la aceleración del gasto interno coincide con una reducción del saldo exterior al asociarse con importaciones (-0.57), inversión (-0.49) y consumo (-0.41).

Implicaciones para el ACP: La alta redundancia de información en precios y la presencia de bloques bien definidos confirman que el ACP podrá reducir las 15 dimensiones originales a componentes sintéticos esenciales, limpiando el análisis de ruido estadístico.

Resultados del Modelo

Número óptimo de clusters

El método Silhouette indica que la mejor separación matemática se obtiene con k = 2. Sin embargo, se seleccionaron 3 clusters porque permiten identificar un grupo intermedio y capturar mejor las diferencias entre los países. Aunque la calidad de agrupación disminuye ligeramente, la interpretación económica resulta más completa y realista.

ACP — Varianza explicada

Los primeros 4 componentes principales explican aproximadamente el 67,9% de la variabilidad total de los datos, por lo que permiten resumir gran parte de la información original. Además, las dos primeras dimensiones concentran cerca del 47,4% de la variabilidad y sirven como base para la representación gráfica de los países.

Esta tabla visualiza qué tan eficiente es el análisis para resumir las 15 variables originales en unas pocas dimensiones. Al mirar los eigenvalores, la regla estadística estándar dice que solo debemos conservar los componentes que tengan un valor mayor a 1. Siguiendo este corte, las primeras 5 dimensiones son las únicas que califican, Como observamos en el gráfico y en la tabla de soporte, el primer componente es el más robusto al capturar el 30.1% de la variabilidad, mientras que el segundo añade un 17.3%, acumulando casi la mitad de la información total (\(47.4\%\)). Por lo cual, tomamos la decisión estratégica de trabajar con las primeras 4 dimensiones.

Tabla 2. Eigenvalores y varianza acumulada
Eigenvalor % Varianza % Acumulado
Dim.1 4.513 30.087 30.087
Dim.2 2.588 17.254 47.341
Dim.3 1.580 10.536 57.877
Dim.4 1.504 10.025 67.902
Dim.5 1.192 7.948 75.850
Dim.6 0.930 6.203 82.053
Dim.7 0.717 4.781 86.834
Dim.8 0.612 4.079 90.913
Dim.9 0.432 2.879 93.793
Dim.10 0.316 2.107 95.899
Dim.11 0.230 1.533 97.432
Dim.12 0.155 1.033 98.465
Dim.13 0.113 0.754 99.219
Dim.14 0.076 0.505 99.724
Dim.15 0.041 0.276 100.000

Interpretación económica de los componentes principales

A partir de las variables con mayor contribución en cada componente, se propone la siguiente interpretación económica:

  • Componente 1: Estabilidad monetaria y financiera.
  • Componente 2: Tamaño e integración económica.
  • Componente 3: Equilibrio externo y comercio.
  • Componente 4: Demanda interna y crecimiento.

Círculo de correlaciones

La primera dimensión está asociada principalmente a variables relacionadas con la estabilidad y el desempeño macroeconómico. Por su parte, la segunda dimensión aporta información complementaria relacionada con aspectos fiscales y comerciales. El gráfico evidencia qué variables tienen mayor influencia en la diferenciación de los países.

La tercera dimensión está asociada al equilibrio externo y comercio, destacando variables como x14 y x16. Por su parte, la cuarta dimensión aporta información complementaria sobre demanda interna y crecimiento, estructurada por x22 y x15. El gráfico evidencia que x22 y x15 tienen la mayor influencia en la diferenciación de los países, mientras que x5 y x21 resultan irrelevantes.

Dendrograma

El dendrograma confirma la existencia de tres grupos principales de países. Uno de ellos está conformado por economías con características más extremas, mientras que los otros dos reúnen países con perfiles económicos más similares entre sí. La estructura jerárquica muestra una clara diferenciación entre los grupos identificados.

Agrupación de países por cluster

La representación de los clusters en el plano factorial muestra una separación clara entre los grupos. Esto confirma que los países dentro de cada cluster comparten características macroeconómicas similares y que existen diferencias importantes entre los distintos perfiles identificados.

Resultados de clusters

Tabla 3. Asignación de países por cluster
Cluster 1 Cluster 2 Cluster 3
Australia Austria Türkiye
Canada Belgium Argentina
Denmark Chile
France Colombia
Germany Czech Republic
Ireland Estonia
Italy Finland
Japan Greece
Korea Hungary
Netherlands Iceland
Norway Israel
Spain Luxembourg
Sweden Mexico
Switzerland New Zealand
United Kingdom Poland
United States Portugal
Slovak Republic
Slovenia
Brazil
Croatia
India
Peru
Romania
SouthAfrica

Conclusiones

Este análisis demostró que es posible simplificar la complejidad macroeconómica global de forma eficiente al condensar 15 variables correlacionadas en dimensiones sintéticas que retienen el 67.90%% de la variabilidad total, eliminando información redundante sin perder capacidad explicativa. Además, aunque los criterios matemáticos sugerían dos grupos, la elección estratégica de 3 clústeres evitó una polarización forzada de los datos, permitiendo aislar un segmento intermedio y trazar un mapa de riesgo mucho más realista. En conclusión, los altos estándares institucionales de la OCDE no ocultan sus profundas diferencias estructurales; por lo tanto, esta segmentación se consolida como una herramienta clave para anticipar tensiones financieras y evaluar la resiliencia de cada país ante choques externos.

¡Muchas Gracias!