Gestión de Datos — Universidad del Valle
Manejando un contexto global que está marcado por la incertidumbre económica, la volatilidad financiera y las diferentes externalidades, es importante comprender las diferencias estructurales entre las economías desarrolladas para la toma de decisiones de las políticas públicas y la gestión estratégica de riesgos. Los países que son miembros de la organización para la Cooperación y el Desarrollo Económicos u OCDE, que es un foro internacional intergubernamental que tiene como propósito diseñar y promover políticas públicas que mejoren el bienestar económico y social de los ciudadanos a través de estándares globales (DNP, 2026), si bien comparten estándares globales elevados de desarrollo institucional y económico, presentan trayectorias macroeconómicas heterogéneas que son expuestas a vulnerabilidades.
En este estudio entonces, se plantea una pregunta central de investigación, ¿Es posible identificar perfiles diferenciados de vulnerabilidad entre los países incluidos en la base de datos de la OCDE y que dimensiones latentes explican esas diferencias estructurales?
Para responder el interrogante, se hace uso de un enfoque de aprendizaje no supervisado, específicamente mediante la combinación de análisis de componentes principales o ACP y las técnicas de clusterización, Ward y K-means. Con esto se permite explorar la estructura de los datos sin imponer categorías previas, descubriendo ciertos patrones naturales de agrupamiento que reflejan afinidades reales en el comportamiento macroeconómico de los países.
El análisis tiene una selección estratégica de 15 variables económicas organizadas en 5 dimensiones teóricas de vulnerabilidad, entre ellas, la estabilidad monetaria, la posición externa, el dinamismo económico, el mercado laboral y la demanda pública, que serán explicadas más a fondo en la continuidad del trabajo. Es importante destacar que el análisis tiene un carácter exploratorio, los datos tomados vienen de fuentes reales y heterogéneas, lo que implica la presencia de correlaciones reales entre variables teniendo en cuenta los valores VIF (medida estadística que detecta y cuantifica la multicolinealidad) elevados y el índice de KMO (medida que evalúa si un conjunto de variables es apto para hacer un análisis factorial), buscando más que un modelo perfecto, una interpretación robusta y contextualizada de la realidad económica observada.
A través de la información de este informe, se pretende no solo segmentar a los países de la OCDE en grupos con perfiles de vulnerabilidad similares, sino también tener una interpretación económica significativa de los factores latentes de dicha segmentación pudiendo aportar como se dijo insumos valiosos para el diseño de políticas diferenciadas, la anticipación de riesgos y la comprensión a profundidad de las dinámicas que configuran la macroeconomía en el mundo.
Para responder a la pregunta de investigación sobre si es posible identificar perfiles de vulnerabilidad se adoptó un enfoque de aprendizaje no supervisado que es una metodología muy útil cuando no se cuenta con una clasificación previa de los datos y se requiere que sean los propios patrones de información los que revelen cómo se agrupan naturalmente los países según su comportamiento económico.
El proceso se desarrollara en 2 etapas complementarias, en primer lugar se aplica el Analista de Componentes Principales o ACP, una técnica estadística que reduce la cantidad de variantes de un conjunto de datos, transformandolas en nuevas variables no correlacionadas llamadas “componentes principales” (Esri, 2026), esto permite reducir entonces la complejidad de trabajar con las 15 variables económicas al identificar las combinaciones entre ellas que capturan su información más relevante, ayudando a descubrir cuales son los factores latentes que explican realmente las diferencias entre países, sin que se pierda el significado económico de los datos principales.
En la etapa siguiente, se utilizan las técnicas de clusterización, acentuando en los métodos de Ward y K-means, el primero, un algoritmo de agrupamiento jerárquico que tiene como objetivo principal unir puntos o grupos de datos de manera que la variabilidad o dispersión interna de cada grupo sea lo más pequeña posible (IBM, 2026) y el segundo, también un algoritmo de aprendizaje no supervisado usado para dividir un conjunto de datos sin etiquetas en K grupos o clusters de modo que los elementos de un mismo grupo sean muy similares entre sí y diferentes de los otros grupos (IEBSchool, 2026).
La combinación de ACP y la clusterización se usó estratégicamente, ya que mientras el primero logra explicar por qué los países se diferencian, el segundo muestra quienes son los que se parecen, para poder tener una visión global que permite tanto la segmentación como la interpretación económica de cada grupo.
Se debe resaltar que, como se trabajó con datos globales y heterogéneos, existe presencia de correlaciones naturales entre las variables económicas, es por eso que se usarán indicadores como el KMO y el VIF que evalúan el grado de adecuación de los datos para el análisis factorial y la detección de la multicolinealidad respectivamente, esto se menciona transparentemente en el informe y lejos de considerar el resultado de estos valores como limitantes, son asumidos como parte de la realidad económica priorizando una interpretación robusta y contextualizada en lugar de la obtención de un perfecto modelo estadístico.
| Dimensión | Variables incluidas | Justificación conceptual |
|---|---|---|
| Estabilidad monetaria | Tipo de cambio, Inflación, Deflactor de importaciones, Tasa de interés | Captura presiones inflacionarias, volatilidad cambiaria y condiciones financieras internas |
| Posición externa | Cuenta corriente, Volumen exportaciones, Deflactor importaciones, Crecimiento export./import | Evalúa la exposición a shocks externos y la sostenibilidad de la balanza de pagos |
| Dinamismo económico | Crecimiento PIB nominal, Crecimiento inversión, Crecimiento consumo privado | Mide la capacidad de expansión endógena y la solidez de la demanda interna |
| Mercado Laboral | Tasa de desempleo | Refleja tensiones sociales y rigideces estructurales en el ajuste económico |
| Demanda pública | PIB en PPP, Crecimiento gasto gobierno | Considera el rol del Estado como estabilizador o fuente de presión fiscal |
Esta técnica estadística permite simplificar un conjunto grande de variables relacionadas en un número de factores o componentes que capturan la información más importante de los datos, en otras palabras, el ACP busca encontrar combinaciones de las 15 variables que explique la mayor parte de las diferencias que observamos entre los países de la OCDE. La lógica que sigue el ACP es identificar los patrones de correlación entre las variables, por ejemplo, si la inflación y el índice de importaciones tienden a moverse juntos en varios de los países, el análisis, podría tender a combinarlos en un solo componente representante que se llamara después de X manera, de esta forma se reduce la complejidad sin perder el significado original de la información.
Cada uno de los componentes que se genera por el ACP tiene 2 elementos clave que se deben interpretar, la varianza explicada y los loadings. La varianza explicada, indica qué porcentaje de la variabilidad total de los datos es capturado por ese componente lo que es importante para decidir la cantidad de componentes que te tomarán para el análisis posterior, por otra parte, los loadings muestran que tanto contribuye cada variable original a la información de cada componente para poder darle un nombre un significado acertado a cada factor previamente identificado.
En este contexto el ACP es especialmente útil para entender las dimensiones latentes de vulnerabilidad macroeconómica que están realmente válida la comprensión de cómo se relaciona las variables y prepara la información para presentes en los datos, más allá de la agrupación teórica inicial que se pudo definir, lo que la siguiente etapa de agrupación según las puntuaciones de las variables en los componentes principales.
Una vez que el Análisis de Componentes Principales permita identificar los factores latentes, se procede a agrupar los países según sus similitudes en esos componentes utilizando las técnicas de clusterización ya mencionadas, Ward y K-means.
Este algoritmo de agrupación jerárquica a diferencia de otros métodos que miden distancias punto por punto punto por punto como distancias máximas o mínimas, este se basa en la suma de cuadrados del error o SSE, empezando por considerar a cada individuo como un cluster independiente, luego en cada ciclo, el algoritmo evalúa la posibilidad de fusionar cada par de clústers y luego este fusiona unicamente el par de clusters que al unirse, provoque el menor aumento en la suma total de los cuadrados dentro de los grupos, es decir, la menor pérdida de información, este proceso se repite hasta que los puntos quedan unificadas en un solo gran cluster (Noble, 2026).
En este caso, el método Ward, une en cada paso a los clústers o países que generen el menor aumento posible de varianza dentro de los grupos y posee una gran ventaja al tender a producir clústers de tamaños equilibrados y bien diferenciados, haciendo que se facilite mucho más la interpretación económica de los resultados.
El algoritmo K-means encuentra patrones ocultos dividiendo un conjunto de datos en K grupos o Clústers distintos basándose en la similitud de sus características, este toma la cantidad K de grupos que el usuario desea crear y pone K puntos aleatorios en el espacio de los datos llamados centroides que serán los centros de los grupos futuros, a cada dato, se le asigna el centroide más cercano utilizando una medida de distancia y una vez agrupados los datos, se calcula el promedio de la posición de todos los puntos de cada grupo haciendo que el centroide se mueva a esa nueva posición promedio, esto se repite una y otra vez hasta que los centroides dejan de moverse lo que significa que los grupos se han estabilizado (Ikotun et al., 2023).
El K-means se utiliza para refinar la asignación de países a cada grupo, esta aproximación híbrida permite aprovechar las fortalezas de cada método, utilizando la capacidad exploratoria del método jerárquico y la precisión del particionamiento iterativo del K-means.
La interpretación de los clústers resultantes se realiza analizando las características promedio de los países en cada grupo, tanto de los componentes principales como de las variables originales, permitiendo describir el perfil económico de cada segmento por ejemplo, identificándose los países de alta vulnerabilidad monetaria, las economías independientes del comercio externo o naciones con dinamismo interno pero presionadas laboralmente, de esta forma la clusterización no solo segmenta, sino que aporta un valioso significado económico a cada grupo para poder identificar perfiles diferenciados de vulnerabilidad macroeconómica en los países de la OCDE.
Para que el proceso de agrupamiento refleje realmente los perfiles de vulnerabilidad macroeconómica, cada variable seleccionada cumple un rol específico al diferenciar a los países según su estructura económica. A continuación, se describe cada indicador dentro de las cinco dimensiones teóricas definidas, explicando por qué resulta importante para la segmentación.
Esta variable indica cuántas unidades de la moneda del país se necesitan para obtener un dólar estadounidense, un valor que fluctúa diariamente según la oferta, la demanda y las políticas económicas. Esta relación permite calcular el poder adquisitivo internacional y el costo de comerciar o viajar, fluctuando por tasas de interés, inflación o la balanza comercial (Larson, 2025).
Como indicador clave de la estabilidad financiera externa, permite diferenciar en la segmentación a los países con divisas estables de aquellos que experimentan volatilidad frecuente, la cual suele traducirse en mayor exposición a shocks internacionales y presiones sobre los precios internos. Su inclusión es fundamental para agrupar economías según su capacidad de absorber fluctuaciones del mercado cambiario sin comprometer a los inversionistas o resistiendo a las crisis cambiarias sin desplomarse.
Mide el nivel de inflación o la variación de los precios de todos los bienes y servicios producidos dentro de un país en un periodo determinado. A diferencia de otros índices, evalúa la economía en su conjunto (consumo familiar, inversión empresarial, gasto del gobierno y exportaciones) excluyendo los aumentos de precio en los productos que vienen del exterior (Banco Mundial, 2026).
Esta variable es indispensable para la clusterización porque se encarga de separar a los países con entornos de precios controlados de aquellos que enfrentan dinámicas de inflación aceleradas que explotan el consumo, distorsionan las señales del mercado y limitan el margen de la política monetaria, otorgando un rol central en la configuración de perfiles.
Mide la variación de los precios de los bienes y servicios que un país compra al exterior para evaluar el impacto de la inflación importada. Esta se provoca por factores externos, como la subida de precios internacionales de materias primas (petróleo, alimentos o manufacturas) o la depreciación de la moneda local, lo que eleva el costo de importar y se traslada al consumidor final, aumentando el costo de vida general (BCRP, s.f.).
En el análisis de agrupamiento ayuda a identificar economías altamente sensibles a la volatilidad de los mercados globales, permitiendo distinguir entre naciones que logran neutralizar los eventos externos y aquellas con una estructura productiva dependiente de insumos extranjeros. Su inclusión evidencia cómo los precios internacionales se transmiten a la economía doméstica.
Es el porcentaje de interés aplicado a préstamos, inversiones o bonos con un vencimiento menor a un año. Son sumamente sensibles a la política del banco central para controlar la liquidez y la inflación, ya que al modificarse, los bancos comerciales ajustan sus propias tasas, encareciendo o abaratando los créditos y el ahorro (Simple; Ackermann & Yang Alcocer, 2026).
Esta tasa ayuda a clasificar a los países según su momento económico, distinguiendo entre donde es barato pedir dinero prestado (porque se busca el crecimiento) y donde es caro (porque se busca frenar la inflación o evitar la fuga de capitales). Funciona como un termómetro que muestra cómo reacciona cada país cuando su economía tiene problemas.
Mide el valor neto de los ingresos y egresos de un país con el resto del mundo por comercio de bienes y servicios, rentas y transferencias, expresado como proporción de su producto interno bruto para facilitar las comparaciones (Focus Economics, 2026).
Al momento de agrupar países, sirve para distinguir las economías que siempre necesitan pedir dinero prestado al extranjero (gastan más de lo que ganan) de aquellas que generan ahorro o excedentes (ganan más de lo que gastan). Muestra qué tan resistentes son los países ante cambios en los flujos de dinero mundial y si pueden mantenerse estables sin caer en problemas de deuda.
Se refiere al valor total en dólares estadounidenses de todos los bienes y servicios vendidos por un país al extranjero. Sirve para evaluar la salud financiera, la competitividad internacional y la balanza comercial, estandarizando las transacciones para medir el tamaño del mercado global de un país (Banco Santander, 2026).
Refleja la escala y la inserción comercial de un país en los mercados globales. Su relevancia para la segmentación radica en que permite diferenciar a las economías altamente integradas y competitivas de aquellas con menor exposición externa, lo cual incide directamente en su capacidad para generar dinero y amortiguar crisis mediante ingresos externos.
Es un índice de precios utilizado para separar el efecto de la inflación del valor nominal de los bienes y servicios que un país compra del exterior. Permite conocer el volumen real de las importaciones para saber si el aumento en el gasto exterior se debe a una mayor cantidad de mercancía o simplemente a la subida de precios en el extranjero (Qureshi & Keddie, 2023).
Evidencia el costo real de adquirir bienes extranjeros y su impacto en la balanza comercial. Para la clusterización, ayuda a identificar países cuyos márgenes de competitividad se ven comprimidos por el encarecimiento de insumos externos, facilitando la agrupación de naciones con presiones sobre su sector exportador y su capacidad de pago internacional.
Mide la variación porcentual o absoluta del valor o volumen de bienes y servicios que un país vende a mercados internacionales en un período determinado. Refleja la competitividad, la demanda global y la salud del sector externo, actuando como motor de desarrollo que genera entrada de divisas, economías de escala y empleo (Petchko, 2018).
Con ella se mide la dinámica reciente del sector externo y la capacidad de expandir la presencia internacional. Para la segmentación, permite distinguir economías con trayectoria comercial expansiva de aquellas con estancamiento o contracción exportadora, funcionando como un indicador temprano de cambios en la competitividad o demanda global.
Mide la variación porcentual del valor o volumen total de bienes y servicios que un país compra del exterior de un periodo a otro. Si crece de forma sostenida, refleja un aumento en el consumo de los hogares o la necesidad de materias primas locales, mostrando la exposición de la industria nacional a productos extranjeros y determinando el déficit o superávit (Cárdenas et al., 2019).
Muestra la evolución de la demanda interna de bienes extranjeros. En el análisis de grupos, resulta útil para diferenciar países cuyo consumo interno se sostiene en productos externos de aquellos que priorizan la producción doméstica, aportando información clave sobre la estructura de dependencia y la sostenibilidad de la balanza comercial.
Mide el aumento en el valor de mercado de todos los bienes y servicios finales producidos en un país durante un período determinado, reflejando tanto el incremento en la cantidad de producción como la subida de precios o inflación (Testbook, 2026).
Captura la expansión general de la actividad económica y constituye el indicador base para medir el ciclo macroeconómico. Para la segmentación, permite agrupar a los países según su ritmo de expansión, definiendo su capacidad para generar empleo, recaudo fiscal y confianza empresarial al diferenciar fases de recuperación frente al estancamiento.
Es el aumento en el gasto destinado a adquirir bienes de capital físico (maquinaria, edificios y tecnología) utilizados para producir bienes y servicios, con una vida útil superior a un año. Es considerado el motor fundamental del crecimiento económico sostenible (Focus Economics, 2026).
Muestra la formación de capital y la confianza del sector privado en el futuro productivo del país. Su inclusión es determinante para la clusterización, ya que permite separar economías que fortalecen su capacidad productiva de aquellas donde la incertidumbre frena la acumulación de capital, condicionando su potencial a mediano y largo plazo.
Es el aumento en el gasto que realizan las familias, las empresas y las organizaciones sin fines de lucro en bienes y servicios, excluyendo el gasto del gobierno y la inversión en vivienda nueva. Representa entre la mitad y dos tercios del PIB global, siendo el motor principal que impulsa el crecimiento y refleja mayor confianza, mejor empleo e ingresos para los hogares (Arenas, 2018).
Representa el porcentaje de la fuerza laboral o población económicamente activa que no tiene trabajo, pero está disponible y busca empleo activamente, siendo un indicador clave para medir la salud del mercado de trabajo (Focus Economics, 2026).
Constituye un indicador directo de las tensiones sociales y las rigideces estructurales del mercado de trabajo. En el proceso de agrupamiento, resulta fundamental para diferenciar países con mercados laborales flexibles y alta capacidad de absorción de mano de obra de aquellos con desempleo estructural elevado, que impacta en la sostenibilidad del consumo, finanzas públicas y bienestar social.
Mide el tamaño de la economía convirtiendo su producción a dólares estadounidenses, pero ajustando la cifra según el costo de vida real y la inflación local. A diferencia del PIB nominal, permite realizar una comparación equitativa del poder de compra real entre diferentes países (Equipo de Investopedia, 2026).
Para la segmentación, esta variable es esencial porque contextualiza la vulnerabilidad macroeconómica según la escala de desarrollo, evitando que países pequeños pero estables se agrupen erróneamente con economías grandes pero frágiles, garantizando una comparación estructuralmente equilibrada.
Es el aumento sostenido de los recursos financieros que el Estado destina a la administración pública, la inversión en infraestructura, el pago de deudas y la provisión de servicios como salud, educación y protección social (DANE, 2026).
En la clusterización, permite agrupar a los países según su orientación fiscal, diferenciando aquellos que utilizan el gasto público para amortiguar crisis o estimular la actividad de los que priorizan la consolidación fiscal o enfrentan restricciones presupuestales, definiendo su margen de maniobra institucional.
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats 1.0.1 ✔ readr 2.2.0
## ✔ ggplot2 4.0.3 ✔ stringr 1.6.0
## ✔ lubridate 1.9.5 ✔ tibble 3.3.1
## ✔ purrr 1.2.1 ✔ tidyr 1.3.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::group_rows() masks kableExtra::group_rows()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
## corrplot 0.95 loaded
## Welcome to factoextra!
## Want to learn more? See two factoextra-related books at https://www.datanovia.com/en/product/practical-guide-to-principal-component-methods-in-r/
## Cargando paquete requerido: ade4
## Cargando paquete requerido: ggrepel
## Cargando paquete requerido: xtable
## Cargando paquete requerido: scatterplot3d
##
## ---------------------
## Welcome to dendextend version 1.19.1
## Type citation('dendextend') for how to cite the package.
##
## Type browseVignettes(package = 'dendextend') for the package vignette.
## The github page is: https://github.com/talgalili/dendextend/
##
## Suggestions and bug-reports can be submitted at: https://github.com/talgalili/dendextend/issues
## You may ask questions at stackoverflow, use the r and dendextend tags:
## https://stackoverflow.com/questions/tagged/dendextend
##
## To suppress this message use: suppressPackageStartupMessages(library(dendextend))
## ---------------------
##
##
## Adjuntando el paquete: 'dendextend'
##
## The following object is masked from 'package:stats':
##
## cutree
##
## Adjuntando el paquete: 'reshape2'
##
## The following object is masked from 'package:tidyr':
##
## smiths
datos <- read_excel("DatosEcon.xlsx", sheet = "Data")
paises <- datos$Pais
datos <- as.data.frame(datos)
rownames(datos) <- paises
datos <- datos %>% select(-Pais)
variables <- c("x1", "x2", "x5", "x11", "x14",
"x15", "x16", "x18", "x19", "x20",
"x21", "x22", "x25", "x26", "x29")
datos_sel <- datos[, variables]
vars_log <- c("x2", "x5", "x11", "x14", "x18", "x21", "x22", "x25", "x26")
datos_trans <- datos_sel
datos_trans[, vars_log] <- log(datos_trans[, vars_log])
rownames(datos_trans) <- paises
datos_std <- as.data.frame(scale(datos_trans))
rownames(datos_std) <- paiseslibrary(knitr)
library(kableExtra)
datos_trans <- as.data.frame(datos_trans)
desc <- datos_trans %>%
summarise(across(everything(),
list(
Media = ~round(mean(.), 3),
Mediana = ~round(median(.), 3),
DE = ~round(sd(.), 3),
Min = ~round(min(.), 3),
Max = ~round(max(.), 3)
)
)) %>%
pivot_longer(everything(),
names_to = c("Variable", "Estadístico"),
names_sep = "_") %>%
pivot_wider(names_from = "Estadístico",
values_from = "value")
kable(desc, caption = "Tabla 1. Estadísticas descriptivas de las variables seleccionadas") %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
full_width = FALSE,
position = "center") %>%
row_spec(0, bold = TRUE, background = "#2C3E50", color = "white")| Variable | Media | Mediana | DE | Min | Max |
|---|---|---|---|---|---|
| x1 | 1.012 | 0.356 | 5.079 | -7.282 | 14.913 |
| x2 | 0.951 | 0.262 | 1.337 | -0.319 | 4.555 |
| x5 | 26.008 | 26.102 | 1.219 | 22.813 | 28.445 |
| x11 | 27.153 | 27.004 | 1.362 | 23.660 | 30.653 |
| x14 | 27.507 | 27.034 | 2.319 | 23.804 | 34.375 |
| x15 | 10.670 | 10.405 | 6.887 | -3.586 | 27.823 |
| x16 | 12.824 | 13.125 | 8.240 | -8.283 | 35.465 |
| x18 | 2.342 | 2.369 | 0.671 | -0.276 | 4.251 |
| x19 | 6.085 | 3.068 | 9.122 | -0.868 | 54.152 |
| x20 | 7.344 | 6.599 | 10.812 | -39.070 | 35.318 |
| x21 | 1.701 | 1.746 | 0.694 | -0.920 | 3.021 |
| x22 | 1.275 | 1.392 | 0.739 | -0.901 | 2.536 |
| x25 | 0.309 | 0.129 | 0.684 | 0.000 | 4.207 |
| x26 | 1.852 | 1.805 | 0.500 | 1.037 | 3.534 |
| x29 | 0.996 | 0.020 | 3.171 | -0.739 | 18.714 |
El análisis de las estadísticas descriptivas revela una alta heterogeneidad y asimetría en la muestra, lo que valida la necesidad de realizar una segmentación para identificar perfiles de vulnerabilidad. Las variables ligadas a la inversión fija (x20) y a la inflación (x19) registran la mayor volatilidad del modelo; la inversión fluctúa drásticamente entre un crítico \(-39.070\%\) y un máximo de \(35.318\%\), mientras que la inflación presenta un sesgo a la derecha empujado por un máximo extremo de \(54.152\%\), contrastando con una mediana estable de \(3.068\%\). Asimismo, la cuenta corriente (x1) exhibe fuertes desequilibrios externos con un rango que va desde un déficit severo de \(-7.282\%\) hasta un superávit de \(14.913\%\) del PIB, convirtiéndose, junto a las anteriores, en las variables que definirán las fronteras y el comportamiento de los clústeres.
Por otro lado, indicadores como el tamaño de la economía en PPP (x11), el volumen de exportaciones (x5) y el deflactor de importaciones (x14) muestran distribuciones altamente simétricas, con medias y medianas casi idénticas que servirán para delimitar la escala estructural de los grupos. El mercado laboral (x26) destaca por ser el bloque más homogéneo, con una dispersión mínima (DE: 0.500) y un desempleo compacto entre \(1.037\%\) y \(3.534\%\). Dada la evidente disparidad de escalas y rangos entre variables, resulta metodológicamente obligatorio estandarizar los datos antes de aplicar el algoritmo de agrupamiento, evitando así que las variables de fluctuación extrema distorsionen el peso de la segmentación.
La matriz de correlación presentada permite visualizar las afinidades lineales entre las 15 variables seleccionadas antes de aplicar el ACP, en esta representación gráfica, los colores rojos indican correlaciones positivas (a mayor intensidad, mayor correlación), mientras que los tonos azules representan correlaciones negativas, además los valores numéricos internos confirman la magnitud de estas relaciones.
corrplot(cor(datos_trans),
method = "ellipse",
type = "upper",
tl.cex = 0.75,
tl.col = "black",
addCoef.col = "black",
number.cex = 0.55,
col = colorRampPalette(c("#2166AC", "white", "#B2182B"))(200),
title = "Matriz de correlación — Variables macroeconómicas",
mar = c(0, 0, 2, 0))Existe una relación extremadamente fuerte entre la inflación (x19) y el deflactor de importaciones (x25), con un coeficiente de 0.92, lo que indica que ambas métricas se comportan de manera casi idéntica en la muestra de países.
Se observa también una correlación positiva alta (0.81) entre el volumen de exportaciones (x5) y el PIB a paridad de poder adquisitivo (x11), lo que evidencia que las economías de mayor tamaño manejan, naturalmente, volúmenes de exportación mucho más altos.
El crecimiento del PIB nominal (x18) muestra afinidades significativas con la inflación (x19), valor de 0.72 y con el crecimiento del consumo privado (x21) con un valor de 0.67. Asimismo, el crecimiento de las importaciones (x16) y el de la inversión fija (x20) están vinculados con un coeficiente de 0.68, sugiriendo que la actividad productiva y la demanda externa crecen juntas en estos datos.
La cuenta corriente (x1) presenta las correlaciones negativas más notables del análisis, mostrando un valor de -0.57 con el crecimiento de importaciones (x16), de -0.49 con el crecimiento de la inversión (x20) y de -0.41 con el consumo privado (x21). Estos números indican que, en este conjunto de datos, el aumento en los ritmos de gasto e inversión interna coincide con una reducción en el saldo de la cuenta corriente.
Por otro lado, el volumen de exportaciones (x5) mantiene relaciones negativas moderadas con el crecimiento de importaciones (x16) con un valor de -0.46 y el consumo privado (x21), con un valor de -0.47.
La correlación de 0.92 entre la inflación (x19) y el deflactor de importaciones (x25) confirma que existe una superposición significativa en la información que aportan estas dos variables. El ACP permitirá fusionar esta información repetida en un solo factor sintético, limpiando el análisis de ruido estadístico.
La existencia de bloques de variables que se mueven juntas, como el grupo de precios o el grupo de inversión-importaciones, frente a variables que se mueven opuestas, como la cuenta corriente, indica que el ACP podrá reducir las 15 variables originales a un número menor de componentes que capturen la esencia del comportamiento económico sin perder información relevante.
fviz_nbclust(datos_std, FUN = kmeans, method = "silhouette") +
labs(title = "Número óptimo de clusters — Método Silhouette",
x = "Número de clusters k",
y = "Ancho de silueta promedio") +
theme_minimal()
Para poder determinar el número optimo de clusters, se uso el gráfico
del método Silhouette, la cual muestra que el mejor resultado matemático
se obtiene con \(k = 2\) grupos, ya que
alcanza el punto más alto de separación con un valor cercano a \(0.3\). No obstante, para este análisis se
decidió trabajar con una estructura de 3 clústeres. Esta elección se
justifica porque, aunque el indicador baja ligeramente a un nivel de
\(0.17\), mantener 3 grupos evita caer
en un modelo de “blanco o negro” que obligaría a juntar a países con
perfiles económicos intermedios o en transición dentro de una misma
categoría.
Al elegir 3 clústeres en lugar de dos, el modelo gana un valor analítico mucho más realista para el estudio macroeconómico. En vez de dividir la muestra únicamente en dos extremos opuestos (como economías estables frente a vulnerables), un tercer grupo permite identificar un punto medio con características mixtas. De esta manera, el algoritmo logra capturar mejor las diferencias de fondo, la resiliencia y el dinamismo de los países analizados, manteniendo una buena cohesión dentro de cada grupo.
acp <- dudi.pca(datos_std, scannf = FALSE, nf = 4)
dist_datos <- dist(datos_std)
modelo_ward <- hclust(dist_datos, method = "ward.D2")
clusters <- cutree(modelo_ward, k = 3)
NuevaBase <- data.frame(Cluster = clusters, datos_trans)fviz_eig(acp,
addlabels = TRUE,
ylim = c(0, 40),
barfill = "#2C3E50",
barcolor = "#2C3E50") +
labs(title = "Varianza explicada por componente principal",
x = "Componente",
y = "% de varianza explicada") +
theme_minimal()
Para poder determinar el número óptimo de componentes que retengan
información relevante, se evaluó mediante el gráfico de sedimentación
(scree plot) bajo el criterio de Elbow o el codo y el porcentaje de
varianza acumulada. Para la elaboración de este análisis se decidió
trabajar con los 4 primeros componentes, dado que entre estos 4
componentes se logra resumir el 67,9% de toda la información de los
datos, ya que a partir de k = 4 se comienza a aplanar la varianza
explicada y los componentes siguientes aportan información
secundaria.
eig <- get_eigenvalue(acp)
kable(round(eig, 3),
caption = "Tabla 2. Eigenvalores y varianza acumulada",
col.names = c("Eigenvalor", "% Varianza", "% Acumulado")) %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
full_width = FALSE,
position = "center") %>%
row_spec(0, bold = TRUE, background = "#2C3E50", color = "white")| Eigenvalor | % Varianza | % Acumulado | |
|---|---|---|---|
| Dim.1 | 4.513 | 30.087 | 30.087 |
| Dim.2 | 2.588 | 17.254 | 47.341 |
| Dim.3 | 1.580 | 10.536 | 57.877 |
| Dim.4 | 1.504 | 10.025 | 67.902 |
| Dim.5 | 1.192 | 7.948 | 75.850 |
| Dim.6 | 0.930 | 6.203 | 82.053 |
| Dim.7 | 0.717 | 4.781 | 86.834 |
| Dim.8 | 0.612 | 4.079 | 90.913 |
| Dim.9 | 0.432 | 2.879 | 93.793 |
| Dim.10 | 0.316 | 2.107 | 95.899 |
| Dim.11 | 0.230 | 1.533 | 97.432 |
| Dim.12 | 0.155 | 1.033 | 98.465 |
| Dim.13 | 0.113 | 0.754 | 99.219 |
| Dim.14 | 0.076 | 0.505 | 99.724 |
| Dim.15 | 0.041 | 0.276 | 100.000 |
Esta tabla visualiza qué tan eficiente es el análisis para resumir las 15 variables originales en unas pocas dimensiones. Al mirar los eigenvalores, la regla estadística estándar dice que solo debemos conservar los componentes que tengan un valor mayor a 1. Siguiendo este corte, las primeras 5 dimensiones son las únicas que califican, comenzando con la Dim.1 en un fuerte \(4.513\) y cerrando con la Dim.5 en \(1.192\). A partir de la Dim.6, los valores caen a \(0.930\), lo que significa que ya no aportan suficiente información y es mejor descartarlas.
En cuanto a la variabilidad, la Dim.1 y la Dim.2 logran capturar juntas el \(47.341\%\) de la información de los países. Sin embargo, para que el informe tenga un respaldo mucho más sólido, se opto por quedarse con las primeras 4 dimensiones que capturan un \(67.902\%\)
A partir de las variables con mayor contribución en cada componente, se propone la siguiente interpretación económica:
fviz_pca_var(acp,
col.var = "contrib",
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
repel = TRUE,
axes = c(1, 2)) +
labs(title = "Círculo de correlaciones — Estabilidad monetaria y financiera vs Tamaño e integración económica",
color = "Contribución (%)") +
theme_minimal()
Al analizar el plano principal (Dim1 y Dim2), el cual explica un 47.4%
de la variabilidad, con este gráfico se puede decir que en el extremo
positivo de la dimensión 1, lidera un grupo de variables altamente
correlacionadas asociadas a la robustez y al flujo económico, destacando
con la mayor contribución e intensidad x19 y x25, seguidas de cerca por
x18 y x29. Simultáneamente, las variables x5 y x1 se posicionan en el
extremo negativo actuando como indicadores de solidez e inserción
internacional que sirven de contrapeso frente a las fricciones o
desequilibrios macroeconómicos del extremo opuesto.
En la dimensión 2, la variable x22 destaca por su orientación perpendicular, lo que demuestra que aporta información independiente y representa una dinámica fiscal particular (la demanda pública) que no está explicada por la primera dimensión. No obstante, al exhibir un vector corto y una tonalidad azul en el gráfico, se evidencia su baja contribución en este plano, compartiendo el cuadrante superior derecho de manera secundaria con x15 y x16 (crecimiento de exportaciones e importaciones); esto sugiere que la variabilidad profunda de este bloque comercial y fiscal se terminará de desarrollar en las dimensiones latentes posteriores.
fviz_pca_var(acp,
col.var = "contrib",
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
repel = TRUE,
axes = c(1, 3)) +
labs(title = "Círculo de correlaciones — Estabilidad monetaria y financiera vs Equilibrio externo y comercio",
color = "Contribución (%)") +
theme_minimal()
En el gráfico de los Componentes 1 y 3 (donde la Dim3 explica el 10.5%),
la Inflación (x19), el Deflactor de importaciones (x25) y el Crecimiento
del PIB nominal (x18) se mantienen como las variables con mayor
contribución y siguen dominando con fuerza el eje horizontal. Sin
embargo, lo verdaderamente clave de este mapa aparece en el eje vertical
(Dimensión 3), donde se observa una clara oposición diagonal entre la
Cuenta corriente (x1), ubicada en el extremo superior izquierdo, y el
bloque compuesto por el Crecimiento de importaciones (x16) junto al
Deflactor de importaciones (x14) en el extremo inferior derecho. Esta
contraposición directa nos revela que, para este grupo de países de la
OCDE, a medida que aumentan tanto el volumen como el costo de los
productos que se compran al exterior (x16 y x14), el saldo de la cuenta
corriente (x1) se reduce de forma automática. Por último, otras
variables como el volumen de exportaciones (x5) o el gasto del gobierno
(x22) muestran vectores muy cortos, lo que significa que su nivel de
aporte en esta tercera dimensión es prácticamente nulo.
fviz_pca_var(acp,
col.var = "contrib",
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
repel = TRUE,
axes = c(2, 3)) +
labs(title = "Círculo de correlaciones — Tamaño e integración económica vs Equilibrio externo y comercio",
color = "Contribución (%)") +
theme_minimal()
Al analizar el gráfico de los Componentes 2 y 3 (que explican un 27.8%
de la variabilidad), el eje horizontal (Dimensión 2) muestra una
agrupación liderada por x11 junto a x2, x29 y x5 proyectándose con
fuerza hacia la izquierda, teniendo como contrapartida directa al
crecimiento de importaciones (x16) abajo a la derecha. Sin embargo, lo
más importante ocurre en el eje vertical (Dimensión 3), donde el gasto
del gobierno (x22) por fin gana protagonismo con un vector largo hacia
arriba, alineándose en los cuadrantes superiores con la cuenta corriente
(x1), la inflación (x19) y el deflactor de importaciones (x25). Este
grupo forma una clara oposición diagonal frente al costo de las
importaciones (x14), que se desplaza con fuerza hacia el extremo
inferior izquierdo, lo que demuestra que en este plano las presiones
inflacionarias y el gasto público avanzan de la mano sirviendo de
contrapeso al encarecimiento de los productos del exterior.
fviz_pca_var(acp,
col.var = "contrib",
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
repel = TRUE,
axes = c(2, 4)) +
labs(title = "Círculo de correlaciones — Tamaño e integración económica vs Demanda interna y crecimiento",
color = "Contribución (%)") +
theme_minimal()
En el gráfico de los componentes 2 y 4 (27.3% de la variabilidad total),
se puede observar una diferenciación entre economías orientadas al
sector externo y economías impulsadas por la demanda interna. Mientras
la dimensión contrapone variables asociadas al tamaño económico y al
comercio exterior como el PIB en PPP (x11), el volumen de exportaciones
(x5) frente a variables vinculadas con el consumo y la inversión y el
gasto gubernamental, la dimensión 4 ahonda esta distinción al estar
dominada por el crecimiento del gasto público (x22); La oposición entre
el crecimiento de las exportaciones (x15) y el el crecimiento del gasto
público (x22) propone la existencia de dos patrones de crecimiento
diferenciados, uno apoyado en la expansión de la demanda interna y otro
dependiendo del desempeño del sector exportador. Por ende esta dimensión
puede interpretarse como un eje de demanda pública que haya diferencias
estructurales en la forma en que las economías sostienen su
crecimiento.
fviz_pca_var(acp,
col.var = "contrib",
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
repel = TRUE,
axes = c(3, 4)) +
labs(title = "Círculo de correlaciones — Equilibrio externo y comercio vs Demanda interna y crecimiento",
color = "Contribución (%)") +
theme_minimal()
En el gráfico de los Componentes 3 y 4 (que suman un 20.5% de la
variabilidad total), el eje horizontal (Dimensión 3) mantiene la clásica
oposición entre el costo y volumen de las importaciones (x14 y x16)
hacia la izquierda, frente al saldo de la cuenta corriente (x1) hacia la
derecha. Sin embargo, la gran diferencia y el valor de la Dimensión 4
(eje vertical, 10%) es que vuelve a aislar una dinámica puramente fiscal
e interna al poner en un choque directo al Gasto del gobierno (x22) en
el extremo superior derecho, frente al Volumen de exportaciones (x15)
que se desploma con mucha fuerza en el extremo inferior izquierdo. Está
clara contraposición nos confirma que, incluso al cruzarlo con el tercer
componente, el impulso fiscal del sector público (x22) opera de forma
inversa al motor exportador (x15) de estas economías.
contrib1 <- as.data.frame(acp$co[, 1]^2 / sum(acp$co[, 1]^2) * 100)
colnames(contrib1) <- "Contribucion"
contrib1$Variable <- rownames(contrib1)
ggplot(contrib1, aes(x = reorder(Variable, Contribucion), y = Contribucion)) +
geom_bar(stat = "identity", fill = "#2C3E50") +
coord_flip() +
labs(title = "Contribución de variables — Estabilidad monetaria y financiera",
x = "Variable", y = "Contribución (%)") +
theme_minimal()
Las variables ubicadas en la cima del gráfico, específicamente la
variable 8 (con casi un 15% de aporte), seguida de cerca por las
variables 9, 11 y 13 (todas superando un tope del 10%), se consolidan
como los pilares determinantes del componente; esto significa que el
comportamiento de esta dimensión responde principalmente a las dinámicas
de esta agrupación de indicadores de alto impacto macroeconómico. En un
rango de relevancia intermedia se posicionan las variables 10, 7, 3 y
15, las cuales aportan entre el 6% y el 10% de la variabilidad
explicada, complementando la estructura del índice.
contrib2 <- as.data.frame(acp$co[, 2]^2 / sum(acp$co[, 2]^2) * 100)
colnames(contrib2) <- "Contribucion"
contrib2$Variable <- rownames(contrib2)
ggplot(contrib2, aes(x = reorder(Variable, Contribucion), y = Contribucion)) +
geom_bar(stat = "identity", fill = "#E74C3C") +
coord_flip() +
labs(title = "Contribución de variables — Tamaño e integración económica",
x = "Variable", y = "Contribución (%)") +
theme_minimal()
Las variables ubicadas en la cima del gráfico, específicamente la
variable 4 (que lidera de forma contundente con más del 20% de aporte),
seguida de cerca por las variables 3 y 2 (ambas superando un tope del
13%), se consolidan como los pilares determinantes del componente; esto
significa que el comportamiento de esta dimensión vertical responde de
manera principal a las dinámicas de esta agrupación de indicadores
específicos. En un rango de relevancia intermedia se posicionan las
variables 15, 5, 9 y 13, las cuales aportan entre el 7% y el 10% de la
variabilidad explicada, complementando la estructura del índice. Por el
contrario, variables situadas en la base como la 10, la 8, la 6 y, de
manera absoluta, la variable 14 cuyo aporte es nulo.
contrib3 <- as.data.frame(acp$co[, 3]^2 / sum(acp$co[, 3]^2) * 100)
colnames(contrib3) <- "Contribucion"
contrib3$Variable <- rownames(contrib3)
ggplot(contrib3, aes(x = reorder(Variable, Contribucion), y = Contribucion)) +
geom_bar(stat = "identity", fill = "#2ECC71") +
coord_flip() +
labs(title = "Contribución de variables — Equilibrio externo y comercio",
x = "Variable", y = "Contribución (%)") +
theme_minimal()
Las variables ubicadas en la cima de este gráfico, específicamente la
variable 5 (que lidera de manera contundente con más del 22% de aporte),
seguida de cerca por las variables 1, 7 y 12 (todas superando un tope
del 13%), se consolidan como los pilares determinantes del componente;
esto significa que el comportamiento de esta dimensión responde
principalmente a las dinámicas de esta agrupación de indicadores
específicos. En un rango de relevancia intermedia se posicionan las
variables 9, 13 y 8, las cuales aportan entre el 5% y el 10% de la
variabilidad explicada, complementando la estructura del índice. Por el
contrario, variables situadas en la base como la 4, la 10, la 11, la 15,
la 3 y, de manera absoluta, la variable 14 cuyo aporte es nulo.
contrib4 <- as.data.frame(acp$co[, 4]^2 / sum(acp$co[, 4]^2) * 100)
colnames(contrib4) <- "Contribucion"
contrib4$Variable <- rownames(contrib4)
ggplot(contrib4, aes(x = reorder(Variable, Contribucion), y = Contribucion)) +
geom_bar(stat = "identity", fill = "#9B59B6") +
coord_flip() +
labs(title = "Contribución de variables — Demanda interna y crecimiento",
x = "Variable", y = "Contribución (%)") +
theme_minimal()
Las variables ubicadas en la cima del gráfico, específicamente la
variable 6 (que lidera de forma contundente con más del 25% de aporte),
seguida de cerca por las variables 12 y 10 (superando el 20% y el 13%
respectivamente), se consolidan como los pilares determinantes del
componente; esto significa que el comportamiento de esta dimensión
vertical responde de manera principal a las dinámicas de esta agrupación
de indicadores específicos. En un rango de relevancia intermedia se
posicionan las variables 14, 4, 7 y 15, las cuales aportan entre el 6% y
el 9% de la variabilidad explicada, complementando la estructura del
índice. Por el contrario, variables situadas en la base como la 3, la
13, la 9, la 2, la 8 y, de manera absoluta, la variable 11 cuyo aporte
es nulo.
fviz_pca_ind(acp,
col.ind = "cos2",
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
repel = TRUE,
axes = c(1, 2)) +
labs(title = "Proyección de países — Estabilidad monetaria y financiera vs Tamaño e integración económica",
color = "Calidad de representación") +
theme_minimal()
En el gráfico se muestra la proyección de los países sobre los dos
primeros componentes principales, que en conjunto explican el 47,4% de
la variabilidad total, permite identificar similitudes y diferencias
estructurales entre las economías analizadas. Si bien la mayor parte de
los países se concentra alrededor del origen del plano factorial, lo que
indica perfiles relativamente cercanos al comportamiento promedio de la
muestra y una combinación equilibrada de las dimensiones representadas
por ambos componentes.
Sin embargo, se observan varios países alejados del centro lo que evidencia características macroeconómicas diferenciadas, de los cuales destacan Argentina y Türkiye, los cuales se ubican en extremo positivo del componente 1 y en valores negativos del componente 2, convirtiendolos en las observaciones más alejadas del conjunto principal. Esta posición requiere niveles particularmente elevados en las variables asociadas al primer componente, relacionadas principalmente con presiones inflacionarias y desequilibrios macroeconómicos, configurando perfiles de vulnerabilidad más marcados que los observados en la mayoría de países de la muestra.
Por otro lado, países como Japón, Alemania, Irlanda y Suiza se ubican en el extremo opuesto, reflejando perfiles asociados a menores niveles de vulnerabilidad en las dimensiones capturadas por este componente, asimismo la cercanía observada entre países como Polonia, Hungría, Rumania e italia sugiere la existencia de características estructurales compartidas, mientras que Estonia, islandia y grecia destacan por sus altas puntuaciones en el componente 2, evidenciando dinámicas diferenciadas respecto al resto de economías; el gráfico evidencia una marcada heterogeneidad entre los países y confirma la presencia de distintos perfiles de vulnerabilidad económica.
fviz_pca_biplot(acp,
repel = TRUE,
col.var = "#E74C3C",
col.ind = "#2C3E50",
axes = c(1, 2)) +
labs(title = "Biplot — Países y variables según las dimensiones de estabilidad monetaria y tamaño económico") +
theme_minimal()
El Biplot permite identificar qué variables están asociadas con cada
grupo de países y como las dimensiones principales explican las
diferencias estructurales observadas en la muestra.
El componente 1 (30,1%) muestra una oposición entre dos conjuntos de variables, hacia el extremo positivo se ubican la inflación (x19), el crecimiento del PIB nominal (x18), el deflactor de importaciones (x25), la tasa de interés (x29) y el tipo de cambio (x2); estas variables representan presiones inflacionarias y desequilibrios macroeconómicos. En sentido contrario se encuentran la cuenta corriente (x1), el volumen de exportaciones (x5) y el PIB en paridad de poder adquisitivo (x11) que son vinculados con la solidez económica y el desempeño externo.
Esta estructura explica las posiciones de Argentina, Türkiye, Brasil e India en la dirección de las variables inflacionarias, mientras que Japón, Alemania y Suiza se proyectan hacia el extremo contrario.
Asimismo, el Componente 2 (17,3%) diferencia economías caracterizadas por un mayor dinamismo de demanda y comercio exterior, en la cuadrante superior, se pueden ver variables como el crecimiento de las importaciones (x16), el consumo privado (x21), el crecimiento de las exportaciones (x15) y el gasto público (x22), lo que explica la posición destacada de países como Estonia, Islandia, Grecia y Croacia. El gráfico permite visualizar cómo las diferencias entre países están determinadas por la combinación de factores monetarios, comerciales y de crecimiento económico identificados por el ACP.
dist_datos <- dist(datos_std)
modelo_ward <- hclust(dist_datos, method = "ward.D2")
clusters <- cutree(modelo_ward, k = 3)
dend_modelo <- as.dendrogram(modelo_ward)
altura_corte <- mean(c(modelo_ward$height[length(modelo_ward$height) - 1],
modelo_ward$height[length(modelo_ward$height) - 2]))
dend_modelo %>%
color_branches(k = 3) %>%
color_labels(k = 3) %>%
plot(main = "Dendrograma — Método de Ward",
sub = "3 clusters",
cex = 0.6)## Loading required namespace: colorspace
La selección del número óptimo de clusters k se realizó mediante la
evaluación conjunta del análisis del dendrograma y la coherencia
interpretativa de los datos. En el gráfico, la línea horizontal
discontinua marca de forma perfecta el corte que define 3 clusters bien
diferenciados, justo antes de que las fusiones produzcan incrementos
dramáticos en la disimilaridad.
El primer cluster (en rosa) aísla de inmediato a Türkiye y Argentina, confirmando matemáticamente que sus perfiles macroeconómicos son casos atípicos y extremos que no encajan con el resto. El segundo cluster (en verde) agrupa a las potencias industriales más estables y desarrolladas, sub dividiéndose en una rama muy cohesionada por Germany, Japan y Korea, y otra que conecta a economías de gran escala como United States, France, United Kingdom, Australia y los países europeos más sólidos. Por último, el tercer cluster (en azul) es el más grande y diverso, concentrando economías intermedias y emergentes; en su estructura interna se revela una fuerte coherencia al asociar directamente bloques regionales como el latinoamericano de Chile y Colombia junto a India, o el grupo de Perú, Islandia y Grecia.
s.class(acp$li,
fac = as.factor(clusters),
xax = 1, yax = 2,
sub = "Estabilidad monetaria y financiera vs Tamaño e integración económica",
possub = "bottomright",
col = c("#2196F3", "#4CAF50", "#FF9800"),
clabel = 0.8,
cpoint = 1.5)
En el plano de los componentes 1 y 2 se puede observar una clara
diferenciación entre los tres conjuntos identificados, el Cluster 3 se
encuentra totalmente separado de los demás grupos, ubicándose en valores
positivos de ambos componentes, lo que deja evidenciado un perfil
macroeconómico significativamente diferente al resto de países
analizados. A su vez, los Clusters 1 y 2 concentran la mayor parte de
las observaciones, y aunque presentan cierta proximidad espacial
mantienen centros de agrupación claramente diferenciados, esto indica
que comparten ciertas características estructurales, pero difieren en la
intensidad de los factores asociados a la estabilidad monetaria, la
posición externa y el dinamismo económico. Este plano muestra que la
principal fuente de diferenciación entre países está asociada al primer
componente principal
s.class(acp$li,
fac = as.factor(clusters),
xax = 1, yax = 3,
sub = "Estabilidad monetaria y financiera vs Equilibrio externo y comercio",
possub = "bottomright",
col = c("#2196F3", "#4CAF50", "#FF9800"),
clabel = 0.8,
cpoint = 1.5)
Al analizar los Componentes 1 y 3 se mantiene la separación observada
entre los tres conjuntos, especialmente en el caso del Cluster 3 que
continúa apartado del resto de las observaciones, lo que sugiere que las
diferencias estructurales identificadas no dependen únicamente del
segundo componente, sino que, permanecen incluso al incorporar la
tercera dimensión, asimismo, los Clusters 1 y 2 continúan
diferenciándose principalmente a lo largo del componente 1, mientras que
la tercera dimensión incluye variaciones adicionales relacionadas con la
posición externa y las dinámicas comerciales de los países. Estos
resultados evidencian que la estructura de agrupamiento es consistente y
estable.
s.class(acp$li,
fac = as.factor(clusters),
xax = 1, yax = 4,
sub = "Estabilidad monetaria y financiera vs Demanda interna y crecimiento",
possub = "bottomright",
col = c("#2196F3", "#4CAF50", "#FF9800"),
clabel = 0.8,
cpoint = 1.5)
En el plano de los componentes 1 y 4 se observa nuevamente una clara
separación del Cluster 3 respecto a los demás conjuntos, sin embargo, la
cuarta dimensión presenta una menor capacidad discriminante en
comparación con las dimensiones anteriores, dado que los Clusters 1 y 2
conservan una distribución parecida a la observada en los gráficos
anteriores. Esto indica que las diferencias entre los perfiles de
vulnerabilidad están explicadas principalmente por el primer componente
mientras que la cuarta dimensión proporciona información complementaria
relacionada con la demanda pública y el comportamiento del gasto
gubernamental, su contribución resulta relevante para caracterizar los
grupos, aunque no representa el principal factor de separación entre
ellos.
s.class(acp$li,
fac = as.factor(clusters),
xax = 2, yax = 3,
sub = "Tamaño e integración económica vs Equilibrio externo y comercio",
possub = "bottomright",
col = c("#2196F3", "#4CAF50", "#FF9800"),
clabel = 0.8,
cpoint = 1.5)
Al analizar los componentes 2 y 3 se evalúa la estructura de
agrupamiento sin la afluencia directa del primer componente principal;
en este plano los Clusters 1 y 2 continúan mostrando diferencias
significativas, aunque con una mayor superposición entre sus áreas de
dispersión, lo que sugiere que las distinciones entre ambos grupos son
más moderadas cuando se excluye a dimensión dominante del análisis, no
obstante, el Cluster 3 permanece claramente aislado del resto,
confirmando la existencia de un perfil de vulnerabilidad diferenciado.
Estos resultados enseñan que la clasificación obtenida no depende
únicamente de una única dimensión, sino que responde a la combinación de
varios factores estructurales relacionados con la posición externa, el
dinamismo económico y las condiciones macroeconómicas de los países
analizados.
paises <- rownames(datos_std)
c1 <- paises[clusters == 1]
c2 <- paises[clusters == 2]
c3 <- paises[clusters == 3]
max_len <- max(length(c1), length(c2), length(c3))
c1 <- c(c1, rep("", max_len - length(c1)))
c2 <- c(c2, rep("", max_len - length(c2)))
c3 <- c(c3, rep("", max_len - length(c3)))
tabla_clusters <- data.frame(
`Cluster 1` = c1,
`Cluster 2` = c2,
`Cluster 3` = c3,
check.names = FALSE)
kable(tabla_clusters,
caption = "Tabla 3. Asignación de países por cluster",
align = c("l", "l", "l")) %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
full_width = TRUE,
font_size = 13) %>%
row_spec(0, bold = TRUE, background = "#2C3E50", color = "white") %>%
column_spec(1, background = "#D6EAF8", bold = TRUE) %>%
column_spec(2, background = "#D5F5E3", bold = TRUE) %>%
column_spec(3, background = "#FDEBD0", bold = TRUE)| Cluster 1 | Cluster 2 | Cluster 3 |
|---|---|---|
| Australia | Austria | Türkiye |
| Canada | Belgium | Argentina |
| Denmark | Chile | |
| France | Colombia | |
| Germany | Czech Republic | |
| Ireland | Estonia | |
| Italy | Finland | |
| Japan | Greece | |
| Korea | Hungary | |
| Netherlands | Iceland | |
| Norway | Israel | |
| Spain | Luxembourg | |
| Sweden | Mexico | |
| Switzerland | New Zealand | |
| United Kingdom | Poland | |
| United States | Portugal | |
| Slovak Republic | ||
| Slovenia | ||
| Brazil | ||
| Croatia | ||
| India | ||
| Peru | ||
| Romania | ||
| SouthAfrica |
perfil_largo <- NuevaBase %>%
group_by(Cluster) %>%
summarise(across(all_of(variables), ~round(mean(.), 3))) %>%
mutate(Cluster = paste("Cluster", Cluster)) %>%
pivot_longer(-Cluster, names_to = "Variable", values_to = "Media")
ggplot(perfil_largo, aes(x = Variable, y = Media, fill = Cluster)) +
geom_bar(stat = "identity", position = "dodge", alpha = 0.85) +
scale_fill_manual(values = c("#2196F3", "#4CAF50", "#FF9800")) +
labs(title = "Medias por cluster según variable",
x = "Variable", y = "Media") +
theme_minimal() +
theme(legend.position = "bottom",
axis.text.x = element_text(angle = 45, hjust = 1))perfil <- NuevaBase %>%
group_by(Cluster) %>%
summarise(across(everything(), ~round(mean(.), 3))) %>%
mutate(Cluster = paste("Cluster", Cluster))
kable(t(perfil),
caption = "Tabla 4. Medias por cluster",
col.names = c("Cluster 1", "Cluster 2", "Cluster 3")) %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
full_width = TRUE,
font_size = 13) %>%
row_spec(0, bold = TRUE, background = "#2C3E50", color = "white") %>%
column_spec(1, bold = TRUE) %>%
column_spec(2, background = "#D6EAF8") %>%
column_spec(3, background = "#D5F5E3") %>%
column_spec(4, background = "#FDEBD0")| Cluster 1 | Cluster 2 | Cluster 3 | |
|---|---|---|---|
| Cluster | Cluster 1 | Cluster 2 | Cluster 3 |
| x1 | 4.769 | -1.395 | -0.162 |
| x2 | 0.629 | 0.965 | 3.368 |
| x5 | 27.056 | 25.335 | 25.701 |
| x11 | 28.067 | 26.472 | 28.023 |
| x14 | 28.173 | 27.163 | 26.299 |
| x15 | 7.838 | 12.026 | 17.056 |
| x16 | 6.990 | 16.766 | 12.201 |
| x18 | 2.026 | 2.413 | 4.013 |
| x19 | 3.370 | 4.939 | 41.551 |
| x20 | 2.434 | 9.527 | 20.412 |
| x21 | 1.310 | 1.892 | 2.530 |
| x22 | 1.359 | 1.203 | 1.468 |
| x25 | 0.080 | 0.258 | 2.745 |
| x26 | 1.727 | 1.893 | 2.357 |
| x29 | -0.162 | 0.968 | 10.588 |
Con el objetivo de identificar perfiles diferenciados de vulnerabilidad entre los países incluidos en la muestra, se analizaron las medias de las variables originales dentro de cada conglomerado, esto permite entender qué características macroeconómicas prevalecen en cada grupo y cuáles son los factores que explican las diferencias estructurales encontradas mediante el análisis de conglomerados.
El Cluster 1 agrupa principalmente economías desarrolladas y relativamente consolidadas, tales como Estados Unidos, Alemania, Japón, Suiza, Suecia, Canadá y Reino Unido. A nivel macroeconómico, este grupo se caracteriza por presentar un comportamiento más estable en comparación con los demás conglomerados, esto se puede evidenciar en su mayor promedio de cuenta corriente (x1 = 4.769) lo que sugiere una posición externa relativamente más favorable y una menor dependencia del financiamiento externo. Asimismo, recoge bajos niveles de inflación (x19 = 3.370), tasas de interés reducidas (x29 = -0.162) y un tipo de cambio estable (x2 = 0.629), evidenciando menores presiones monetarias y financieras.
Por otro lado, aunque el Cluster 1 presenta niveles elevados de PIB en paridad de poder adquisitivo (x11 = 28.067), volumen de exportaciones (x5 = 27.056) y costos de importación (x14 = 28.173), el crecimiento de las exportaciones (x15 = 7.838) e importaciones (x16 = 6.990) es relativamente moderado frente a otros grupos lo que puede interpretarse como economías maduras, con mercados más consolidados y menores fluctuaciones en sus ritmos de expansión; estas características permiten asociar este conglomerado con un perfil de menor vulnerabilidad macroeconómica basado en estabilidad monetaria, fortaleza productiva y mayor equilibrio externo.
El Cluster 2 reúne una combinación de economías emergentes y países de desarrollo intermedio, entre ellos Colombia, Chile, México, Brasil, Perú, India y Sudáfrica, junto con algunos miembros europeos de la OCDE. Este grupo muestra un comportamiento más dinámico en términos de crecimiento económico y comercial, se pueden observar valores superiores al Cluster 1 en variables como el crecimiento de exportaciones (x15 = 12.026), crecimiento de importaciones (x16 = 16.766) e inversión (x20 = 9.527) lo que sugiere economías en expansión y con mayor integración comercial. Sin embargo, este dinamismo está acompañado de ciertos elementos de vulnerabilidad, la cuenta corriente promedio es negativa (x1 = -1.395) lo que puede interpretarse como una mayor dependencia de recursos externos o una mayor exposición a desequilibrios comerciales, además, la inflación (x19 = 4.939), las tasas de interés (x29 = 0.968) y el tipo de cambio (x2 = 0.965) son más elevados que en el Cluster 1, aunque permanecen lejos de los niveles extremos observados en el Cluster 3, por lo tanto este conglomerado puede entenderse como un grupo de vulnerabilidad intermedia, donde coinciden oportunidades de crecimiento económico con mayores riesgos asociados a fluctuaciones externas y condiciones monetarias menos estables.
El Cluster 3, formado únicamente por Argentina y Türkiye, constituye el grupo más diferenciado de toda la muestra y representa un perfil claramente particular de vulnerabilidad macroeconómica, la principal característica de este conglomerado es la magnitud alta de las variables asociadas a presiones inflacionarias y monetarias. La inflación (x19 = 41.551) supera ampliamente la observada en los demás grupos, mientras las tasas de interés (x29 = 10.588) y el tipo de cambio (x2 = 3.368) también presentan valores considerablemente más elevados, este patrón sugiere economías sometidas a mayores tensiones monetarias, depreciación cambiaria y políticas de ajuste más intensas.
Adicionalmente, el Cluster 3 presenta altos niveles de crecimiento de exportaciones (x15 = 17.056), inversión (x20 = 20.412) y consumo privado (x21 = 2.530), lo cual podría indicar intentos de expansión económica o mecanismos de ajuste frente a contextos macroeconómicos adversos, no obstante, el peso dominante de las variables inflacionarias y financieras sugiere que dichos procesos ocurren en un entorno de alta volatilidad e incertidumbre, por ende, este conglomerado puede interpretarse como el grupo de mayor vulnerabilidad macroeconómica, diferenciándose claramente del resto de países analizados.
Los resultados del análisis de conglomerados evidencian la existencia de perfiles heterogéneos de vulnerabilidad dentro de los países de la OCDE y asociados, mientras el Cluster 1 representa economías más estables y consolidadas, el Cluster 2 refleja países con dinámicas de crecimiento más intensas pero con riesgos moderados, y por último el Cluster 3 concentra casos extremos de desequilibrio macroeconómico. Estos datos respaldan la hipótesis de que existen dimensiones latentes capaces de diferenciar estructuralmente a los países según sus condiciones macroeconómicas y niveles de exposición a vulnerabilidades.
vars_viz <- c("x19", "x29", "x26", "x20", "x1")
data_viz <- NuevaBase %>%
rownames_to_column("Pais") %>%
select(Pais, Cluster, all_of(vars_viz)) %>%
mutate(Cluster = paste("Cluster", Cluster))
data_long <- melt(data_viz, id.vars = c("Pais", "Cluster"))
ggplot(data_long, aes(x = variable, y = value,
fill = as.factor(Cluster))) +
geom_boxplot(alpha = 0.7) +
scale_fill_manual(values = c("#2196F3", "#4CAF50", "#FF9800"),
name = "Cluster") +
labs(title = "Distribución de variables clave por cluster",
x = "Variable", y = "Valor") +
theme_minimal() +
theme(legend.position = "bottom")
La distribución de variables por clusters muestra no solo las
diferencias entre grupos sino también el grado de variabilidad interna,
permitiendo complementar el análisis de medias. En términos de inflación
(x19) y tasas de interés (x29), el Cluster 3 presenta valores claramente
superiores a los demás conglomerados, con una concentración
relativamente homogénea entre sus países, evidenciando fuertes presiones
monetarias y financieras. Por otro lado los Clusters 1 y 2 muestran
niveles bastante bajos, aunque el Cluster 2 presenta una dispersión algo
mayor, revelando condiciones macroeconómicas más heterogéneas.
Relacionado con la inversión (x20), el Cluster 3 vuelve a destacar por
registrar los niveles más altos aunque con una variabilidad importante,
Esto sugiere economías con mayores niveles de inversión, pero con
comportamientos menos estables y más cambiantes en el tiempo. El Cluster
2 muestra un comportamiento intermedio, mientras que el Cluster 1
mantiene valores más moderados y estables, consistentes con economías
más maduras. Finalmente, la cuenta corriente (x1) evidencia diferencias
estructurales entre conglomerados, el Cluster 1 presenta valores
predominantemente positivos, indicando una posición externa más sólida,
mientras que el Cluster 2 concentra valores más dispersos y en algunos
casos negativos, asociados a una mayor dependencia externa.
A partir del análisis no supervisado realizado mediante la combinación del Análisis de Componentes Principales (ACP) y las técnicas de clusterización de Ward y K-means, se demostró que es posible identificar perfiles diferenciados de vulnerabilidad macroeconómica entre los países de la OCDE y asociados. La reducción de 15 variables originales a cinco componentes principales permitió conservar el 75,85 % de la variabilidad total de los datos, evidenciando que las principales diferencias estructurales entre las economías están asociadas a las presiones inflacionarias y monetarias, la posición externa, el dinamismo económico y la demanda pública.
La segmentación obtenida permitió identificar tres perfiles claramente diferenciados. El primer conglomerado reúne economías desarrolladas y relativamente estables, caracterizadas por una posición externa favorable y menores presiones monetarias; el segundo agrupa países con un mayor dinamismo económico y comercial, aunque con vulnerabilidades intermedias asociadas a desequilibrios externos y una mayor heterogeneidad macroeconómica; finalmente, el tercer conglomerado, integrado por Argentina y Türkiye, representa un perfil extremo de vulnerabilidad, dominado por altas tasas de inflación, depreciación cambiaria y fuertes tensiones monetarias.
Estos resultados evidencian que, aun entre economías que comparten elevados estándares institucionales y de desarrollo, persisten diferencias estructurales significativas en términos de resiliencia y exposición al riesgo macroeconómico. Por tanto, la metodología empleada constituye una herramienta útil para simplificar la complejidad económica, identificar patrones ocultos y proporcionar insumos para el diseño de políticas económicas diferenciadas y estrategias de prevención frente a posibles crisis.
Finalmente, dado el carácter exploratorio del estudio, futuras investigaciones podrían incorporar nuevas variables relacionadas con aspectos fiscales, financieros e institucionales, así como realizar análisis dinámicos en diferentes periodos de tiempo, con el propósito de profundizar la comprensión de los factores que determinan la vulnerabilidad macroeconómica de los países.
Departamento Nacional de Planeación. (2026). Sobre la OCDE: Relación Colombia-OCDE. https://www.dnp.gov.co/LaEntidad_/subdireccion-general-prospectiva-desarrollo-nacional/ocde-colombia/Paginas/sobre-la-ocde.aspx
Esri. (2026). Cómo funciona la herramienta Componentes principales multidimensionales. ArcGIS Pro 3.4. https://pro.arcgis.com/es/pro-app/3.4/tool-reference/image-analyst/how-the-multidimensional-principle-components-tool-works.htm
IBM. (2026). Método de agrupamiento jerárquico. IBM SPSS Statistics 32.0.0. https://www.ibm.com/docs/es/spss-statistics/32.0.0?topic=analysis-hierarchical-cluster-method
IEBSchool. (2026). Algoritmo K-means: qué es y cómo funciona. https://www.iebschool.com/hub/algoritmo-k-means-que-es-y-como-funciona-big-data/
Noble, J. (2026). ¿Qué es el clustering jerárquico? IBM. https://www.ibm.com/es-es/think/topics/hierarchical-clustering
Ikotun, A. M., Ezugwu, A. E., Abualigah, L., Abuhaija, B., & Heming, J. (2023). K-means clustering algorithms: A comprehensive review, variants analysis, and advances in the era of big data. Information Sciences, 622, 178-210. https://doi.org/10.1016/j.ins.2022.11.139
Larson, E. (2025, 20 de mayo). ¿Cómo funciona el tipo de cambio de divisas? Western Union Blog. https://www.westernunion.com/blog/es/como-funciona-tipo-cambio-divisa/
Banco Mundial. (2026). Deflactor del PIB (inflación anual %) [Indicador]. World Development Indicators. https://databank.worldbank.org/metadataglossary/world-development-indicators/series/NY.GDP.DEFL.KD.ZG
Banco Central de Reserva del Perú. (s.f.). Guía metodológica de la Nota Semanal: VI. Inflación. https://www.bcrp.gob.pe/docs/Publicaciones/Guia-Metodologica/Guia-Metodologica-06.pdf
Ackermann, N., & Yang Alcocer, Y. (2026). Tipos de interés a largo plazo frente a tipos de interés a corto plazo | Definición y diferencia. Study.com. https://study.com/academy/lesson/short-vs-long-term-interest-rates-differences-significance.html
Focus Economics. (2026). Balanza en cuenta corriente: definición, cálculo e interpretación. https://www.focus-economics.com/es/economic-indicator/current-account-balance/
Banco Santander. (2026). Balanza comercial. Glosario económico. https://www.bancosantander.es/glosario/balanza-comercial
Qureshi, F., & Keddie, N. (2023, 31 de mayo). Deflators and how we use them in economic estimates. Office for National Statistics. https://www.ons.gov.uk/economy/inflationandpriceindices/methodologies/deflatorsandhowweusethemineconomicestimates
Petchko, K. (2018). Teoría y marcos teóricos. En Cómo escribir sobre economía y políticas públicas. ScienceDirect. https://www.sciencedirect.com/topics/economics-econometrics-and-finance/export-led-growth
Cárdenas, G., Suárez, E., Romero, H., & Fajardo, E. (2019). Composición de importaciones y actividad económica: El caso de Colombia. Revista ESPACIOS, 40(1), 24. https://revistaespacios.com/a19v40n01/a19v40n01p24.pdf
Testbook. (2026). Nominal GDP formula: Definition, calculation, and examples. https://testbook.com/ugc-net-commerce/nominal-gdp-formula
Focus Economics. (2026). Inversión: definición, cálculo e interpretación. https://www.focus-economics.com/es/economic-indicator/investment/
Arenas, C. (2018, 12 de noviembre). Consumo privado. Estrategias de Inversión. https://www.estrategiasdeinversion.com/herramientas/diccionario/economia/consumo-privado-t-1633
Focus Economics. (2026). Tasa de desempleo: definición, cálculo e interpretación. https://www.focus-economics.com/es/economic-indicator/unemployment-rate/
Equipo de Investopedia. (2026, 11 de mayo). ¿Qué es la paridad del poder adquisitivo (PPA) y cómo se calcula? Investopedia. https://www.investopedia.com/updates/purchasing-power-parity-ppp/
Departamento Administrativo Nacional de Estadística. (2026). Gastos del gobierno general por finalidad. https://www.dane.gov.co/index.php/estadisticas-por-tema/cuentas-nacionales/cuentas-nacionales-anuales/gastos-del-gobierno-general-por-finalidad
Rahmatika, R. (s. f.). Take a decision based on biplot analysis on Indonesian poverty data. Towards Data Science. Recuperado el 10 de junio de 2026, de https://towardsdatascience.com/take-a-decision-based-on-biplot-analysis-on-indonesian-poverty-data-679c28d4ad46/
R Core Team. (2019). biplot: Biplot of a matrix or principal component analysis (R package stats, versión 3.6.2). RDocumentation. https://www.rdocumentation.org/packages/stats/versions/3.6.2/topics/biplot
Young, F. W. (s. f.). Biplots. University of Valencia. Recuperado el 10 de junio de 2026, de https://www.uv.es/visualstats/vista-frames/help/lecturenotes/lecture13/biplot.html
Método Elbow, para elegir el número ideal de clusters. (s/f). https://platzi.com. Recuperado el 10 de junio de 2026, de https://platzi.com/blog/metodo-elbow-para-elegir-el-numero-ideal-de-clusters/
(S/f). Sciencedirect.com. Recuperado el 10 de junio de 2026, de https://www.sciencedirect.com/topics/mathematics/scree-plot