1. Introducción

1.1 Problema de investigación

La economía mundial está lejos de ser un conjunto homogéneo de naciones que comparten las mismas dinámicas de producción, comercio e inflación. Por el contrario, incluso dentro de organismos de cooperación como la Organización para la Cooperación y el Desarrollo Económicos (OCDE), coexisten realidades macroeconómicas profundamente diversas: desde economías con mercados de capital consolidados, instituciones fiscales robustas y patrones de crecimiento estables, hasta economías emergentes que experimentan una alta volatilidad en sus ciclos económicos, presiones inflacionarias persistentes y una marcada dependencia del comercio exterior como motor de su crecimiento.

Este contraste plantea una pregunta de investigación central que motiva el presente análisis: ¿Los países estudiados se agrupan naturalmente en tipos o perfiles económicos distintos, o son todos tan diferentes entre sí que no es posible encontrar patrones comunes?

Esta pregunta enmarca el problema de investigación central del trabajo: la identificación de perfiles macroeconómicos estructuralmente diferenciados a partir de indicadores cuantitativos. Dicha perspectiva exige aclarar el significado de algunos términos fundamentales en este contexto:

En primer lugar, cuando se habla de perfiles estructurales, se hace referencia a configuraciones estables de variables macroeconómicas que reflejan la arquitectura económica subyacente de cada país, y no simplemente fluctuaciones de corto plazo asociadas a coyunturas específicas. En segundo lugar, el concepto de agrupación natural implica que los grupos no son definidos de forma arbitraria o institucional, sino que emergen directamente de los datos empíricos, a través de técnicas de aprendizaje no supervisado que identifican similitudes y diferencias entre países sin imponer categorías preconcebidas.

La relevancia de este problema reside en que las clasificaciones tradicionales de países, como la distinción entre economías avanzadas y emergentes propuesta por el Fondo Monetario Internacional (FMI, 2023), suelen basarse en criterios unidimensionales como el ingreso per cápita, y resultan insuficientes para capturar la complejidad real de los regímenes macroeconómicos observados en la práctica. Frente a ello, el uso combinado del Análisis de Componentes Principales (ACP) y la clusterización jerárquica permite construir una taxonomía empírica multidimensional, que sintetiza simultáneamente la escala de la actividad económica, la velocidad del crecimiento y el grado de apertura comercial de cada economía.

1.2 Marco general y contexto

La base de datos utilizada en este estudio proviene de la Organización para la Cooperación y el Desarrollo Económicos (OCDE), organismo internacional fundado en 1961 con sede en París, Francia, cuya misión central es promover políticas que mejoren el bienestar económico y social de las personas en todo el mundo. La OCDE no es únicamente un foro de diálogo político entre sus miembros, sino también una de las instituciones productoras de estadísticas macroeconómicas más rigurosas y estandarizadas del mundo: trabaja con más de 100 países, acumula más de 2.000 bases de datos y establece metodologías comunes de medición que garantizan la comparabilidad de los indicadores entre economías con sistemas estadísticos muy distintos. Esta estandarización metodológica es precisamente lo que hace de la base de datos de la OCDE una fuente especialmente adecuada para el análisis multivariado comparado: al estar construida bajo criterios homogéneos de recolección y procesamiento, las diferencias observadas entre países reflejan genuinamente sus características estructurales y no artefactos de medición o inconsistencias metodológicas entre sistemas estadísticos nacionales.

Desde una perspectiva analítica, la elección de los países de la OCDE como objeto de estudio responde a criterios metodológicos precisos. Por un lado, los miembros plenos de la organización comparten ciertos umbrales mínimos de capacidad institucional, infraestructura tecnológica y desarrollo de sus sistemas financieros, lo que permite realizar comparaciones más rigurosas que las que serían posibles en una muestra global que incluyera economías en estadios de desarrollo radicalmente distintos. Por otro lado, la incorporación de economías emergentes asociadas como Argentina, Brasil, India, Sudáfrica, Perú, Rumanía, Colombia y Croacia introduce la heterogeneidad necesaria para que las técnicas de clusterización puedan identificar diferencias estructurales genuinas y no simplemente variaciones menores dentro de un grupo de países muy homogéneo. En conjunto, los 42 países de la muestra representan aproximadamente el 80% del PIB mundial, lo que otorga al análisis una representatividad global significativa y asegura que los perfiles económicos identificados tengan relevancia más allá del contexto estrictamente académico.

El conjunto de datos analizado cubre 42 países, incluyendo los 38 miembros plenos de la OCDE junto a economías emergentes asociadas: Argentina, Brasil, India, Sudáfrica, Perú, Rumanía, Colombia y Croacia. Este conjunto heterogéneo abarca un espectro muy amplio de realidades económicas globales, que puede clasificarse preliminarmente en tres grandes grupos con características estructurales bien diferenciadas.

En primer lugar, las economías avanzadas altamente integradas, caracterizadas por un fuerte posicionamiento en el comercio internacional, estabilidad nominal y mercados financieros consolidados, como Alemania, Francia, Japón, Estados Unidos y Corea del Sur. Estas economías se distinguen por contar con instituciones fiscales y monetarias robustas, mercados laborales estables y una elevada capacidad de acumulación de capital que sustenta su crecimiento a largo plazo.

En segundo lugar, las economías emergentes con tensiones nominales o cambiarias, como Argentina y Türkiye, que presentan una mayor exposición a choques de precios externos, depreciaciones cambiarias recurrentes y una menor capacidad de los bancos centrales para contener las presiones inflacionarias de manera sostenida.

En tercer lugar, las economías latinoamericanas en proceso de industrialización y desarrollo institucional, como Colombia y Perú, que combinan tasas de crecimiento del PIB relativamente elevadas con una alta volatilidad macroeconómica, mercados financieros en consolidación y una mayor dependencia de la exportación de materias primas como motor de su actividad económica.

La coexistencia de estos tres tipos de economías dentro de una misma base de datos constituye precisamente el elemento que hace valiosa la aplicación de técnicas de aprendizaje no supervisado: la diversidad estructural del conjunto analizado permite que los algoritmos de reducción de dimensionalidad y clusterización revelen patrones genuinos de similitud y diferenciación, sin que estos sean impuestos por categorías institucionales previas. En este sentido, la heterogeneidad de la muestra no es un obstáculo metodológico, sino una condición que enriquece el análisis y le otorga mayor poder explicativo para responder la pregunta de investigación planteada.

1.3 Justificación y objetivos

La justificación de este estudio radica tanto en su contribución metodológica como en su relevancia práctica para la comprensión del comportamiento económico comparado. Desde el punto de vista metodológico, el uso combinado del ACP y la clusterización jerárquica con el método de Ward permite superar las limitaciones de los análisis univariados, al construir una taxonomía empírica que captura simultáneamente múltiples dimensiones del comportamiento macroeconómico. Desde el punto de vista práctico, identificar perfiles económicos diferenciados resulta fundamental para diseñar políticas públicas y estrategias de cooperación internacional adaptadas a las realidades específicas de cada grupo de países, en lugar de aplicar recetas uniformes que ignoran las diferencias estructurales entre economías.

El objetivo principal del presente trabajo es aplicar técnicas de aprendizaje no supervisado, específicamente el Análisis de Componentes Principales y la clusterización jerárquica, sobre un conjunto de 15 indicadores macroeconómicos de la OCDE, con el propósito de identificar patrones estructurales entre los 42 países analizados, construir perfiles económicos diferenciados y determinar qué dimensiones latentes del comportamiento económico articulan dichas diferencias.

Para lograr este objetivo, el trabajo se estructura de la siguiente manera: en la sección 2 se describe la metodología, incluyendo la fuente de datos, las variables seleccionadas, el proceso de estandarización y los algoritmos utilizados; en la sección 3 se presenta el análisis descriptivo de las variables; en la sección 4 se desarrollan los resultados del ACP y la clusterización; y finalmente se presentan las conclusiones que responden a la pregunta de investigación planteada.

2. Metodología

La metodología adoptada en este estudio se basa en un enfoque de aprendizaje no supervisado, diseñado para identificar patrones estructurales en un conjunto de economías sin necesidad de una clasificación previa. A diferencia de los métodos supervisados, en los que el algoritmo aprende a partir de etiquetas o categorías predefinidas, el aprendizaje no supervisado permite que los propios datos revelen su estructura interna, generando agrupaciones que emergen directamente de las similitudes y diferencias observadas entre las observaciones. Este enfoque resulta especialmente apropiado para el análisis macroeconómico comparado, dado que evita imponer clasificaciones institucionales o geográficas que podrían introducir sesgos en los resultados.

El proceso metodológico se articuló en las siguientes etapas secuenciales: carga y exploración de la base de datos, selección y descripción de las variables de estudio, estandarización de los datos, análisis descriptivo, reducción de dimensionalidad mediante el Análisis de Componentes Principales (ACP), determinación del número óptimo de clústeres, conformación de grupos mediante el algoritmo de clusterización jerárquica con el método de Ward, y análisis e interpretación de los resultados obtenidos.

2.1 Base de datos

Los datos utilizados en este estudio provienen de la base de datos oficial de la Organización para la Cooperación y el Desarrollo Económicos (OCDE). Esta base de datos fue suministrada en el marco del curso de Gestión de Datos de la Universidad del Valle y contiene información macroeconómica detallada para 42 países, que incluyen los 38 miembros plenos de la OCDE y 8 economías emergentes asociadas.

El proceso de carga de la base de datos se realizó mediante el software RStudio, una de las herramientas más ampliamente utilizadas en el análisis estadístico y la ciencia de datos. En primer lugar, se importó el archivo en formato compatible con R, verificando la correcta lectura de los nombres de las variables, los tipos de datos y la ausencia de valores perdidos o errores de codificación. Posteriormente, se realizó una exploración inicial de la estructura del conjunto de datos, confirmando que la unidad de análisis corresponde a los países, donde cada fila representa una economía y cada columna un indicador macroeconómico específico.

Del conjunto inicial de 29 variables disponibles en la base de datos, se seleccionaron 15 indicadores que permiten capturar de forma integral las principales dimensiones de la actividad económica: el tamaño y escala productiva, la dinámica del crecimiento, la apertura comercial, los niveles de demanda interna y el comportamiento de los precios. Esta selección garantiza una representación multidimensional del desempeño macroeconómico de los países analizados, proporcionando una base sólida para la aplicación de las técnicas de análisis multivariado.

library(readxl)
library(tidyverse)
library(factoextra)
library(plotly)
library(dplyr)
library(ggplot2)
library(plotly)
library(tibble)
library(rnaturalearth)
library(sf)

DatosEcon <- read_excel("DatosEcon.xlsx")

#Filtrar la base de datos 

data<-DatosEcon%>%
  select(Pais,x25, x10, x22, x17, x20, x24, x4, x16, x12, x14, x7, x6, x8, x13, x21)%>%
  column_to_rownames("Pais")%>%
  rename(
    Deflactor_PIB            = x25,
    PIB                      = x10,
    Crecimiento_publico      = x22,
    Crecimiento_economico    = x17,
    Crecimiento_inversion    = x20,
    Precio_importaciones     = x24,
    Comercio_total           = x4,
    Crecimiento_importaciones = x16,
    Inversion_capital        = x12,
    Exportaciones            = x14,
    Consumo_hogares          = x7,
    Gasto_publico            = x6,
    Exportaciones_netas      = x8,
    Importaciones            = x13,
    Crecimiento_privado      = x21
  )

2.2 Descripción de variables

Las 15 variables seleccionadas se organizan en cuatro grandes grupos temáticos que cubren las dimensiones fundamentales del análisis macroeconómico: variables de volumen económico, variables de comercio exterior, variables de crecimiento y variables de precios. A continuación, se presenta una descripción detallada de cada variable, incluyendo su definición conceptual, su unidad de medida y los países que presentan los valores más representativos o extremos, con el fin de contextualizar económicamente cada indicador dentro de la muestra analizada.

Tablas descriptivas de las variables

Variables de Volumen económico

library(dplyr)
library (kableExtra)
tabla_variables <- data.frame(
  Variable = c("PIB", "Exportaciones", "Importaciones", "Comercio total",
               "Consumo hogares", "Gasto público", "Inversión capital",
               "Exportaciones netas"),
  
  Definicion = c(
    "Producto Interno Bruto a precios de mercado corrientes en dólares estadounidenses.",
    "Valor total de exportaciones de bienes y servicios en dólares corrientes.",
    "Valor total de importaciones de bienes y servicios en dólares corrientes.",
    "Suma del valor de exportaciones e importaciones en dólares corrientes.",
    "Gasto final de los hogares en bienes y servicios de consumo en dólares corrientes.",
    "Gasto de consumo final del gobierno en dólares corrientes.",
    "Formación bruta de capital fijo en dólares corrientes.",
    "Contribución de las exportaciones netas al cambio del PIB real."
  ),
  
  Paises_representativos = c(
    "Mayor: EE.UU., Japón, Alemania. Menor: Colombia, Croacia, Estonia.",
    "Mayor: Alemania, EE.UU., Corea del Sur. Menor: Eslovenia, Estonia.",
    "Mayor: EE.UU. Menor: Perú, Colombia.",
    "Mayor: Corea del Sur, Alemania, EE.UU. Destaca: Irlanda por su rol fiscal.",
    "Mayor: EE.UU., Japón, Alemania. Moderado: Colombia, Perú.",
    "Mayor: EE.UU., Japón, Francia. Alto relativo: países nórdicos.",
    "Mayor: Corea del Sur, Alemania, EE.UU. Alta variabilidad: Argentina, Perú.",
    "Mayor superávit: Irlanda. Mayor déficit: Chile, Colombia, Nueva Zelanda."
  )
)

tabla_variables %>%
  kbl(caption = "Variables de volumen económico",
      col.names = c("Variable", "Definición y unidad de medida", 
                    "Países más representativos"),
      align = c("l", "l", "l"),
      booktabs = TRUE) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
                full_width = TRUE,
                font_size = 12) %>%
  row_spec(0, background =  "#b39ddb", color = "white", bold = TRUE) %>%
  row_spec(seq(1, nrow(tabla_variables), by = 2), 
           background = "#f3e5f5") %>%
  row_spec(seq(2, nrow(tabla_variables), by = 2), 
           background = "white") %>%
  column_spec(1, bold = TRUE, width = "3cm") %>%
  column_spec(2, width = "7cm") %>%
  column_spec(3, width = "6cm") %>%
  footnote(general = "Fuente: Elaboración propia con base en datos OCDE.",
           general_title = "Nota:",
           footnote_as_chunk = TRUE)
Variables de volumen económico
Variable Definición y unidad de medida Países más representativos
PIB Producto Interno Bruto a precios de mercado corrientes en dólares estadounidenses. Mayor: EE.UU., Japón, Alemania. Menor: Colombia, Croacia, Estonia.
Exportaciones Valor total de exportaciones de bienes y servicios en dólares corrientes. Mayor: Alemania, EE.UU., Corea del Sur. Menor: Eslovenia, Estonia.
Importaciones Valor total de importaciones de bienes y servicios en dólares corrientes. Mayor: EE.UU. Menor: Perú, Colombia.
Comercio total Suma del valor de exportaciones e importaciones en dólares corrientes. Mayor: Corea del Sur, Alemania, EE.UU. Destaca: Irlanda por su rol fiscal.
Consumo hogares Gasto final de los hogares en bienes y servicios de consumo en dólares corrientes. Mayor: EE.UU., Japón, Alemania. Moderado: Colombia, Perú.
Gasto público Gasto de consumo final del gobierno en dólares corrientes. Mayor: EE.UU., Japón, Francia. Alto relativo: países nórdicos.
Inversión capital Formación bruta de capital fijo en dólares corrientes. Mayor: Corea del Sur, Alemania, EE.UU. Alta variabilidad: Argentina, Perú.
Exportaciones netas Contribución de las exportaciones netas al cambio del PIB real. Mayor superávit: Irlanda. Mayor déficit: Chile, Colombia, Nueva Zelanda.
Nota: Fuente: Elaboración propia con base en datos OCDE.

Variables de crecimiento económico

tabla_crecimiento <- data.frame(
  Variable = c("Crecimiento económico", "Crecimiento inversión",
               "Crecimiento importaciones", "Crecimiento privado",
               "Crecimiento público"),
  
  Definicion = c(
    "Tasa de variación anual del volumen del PIB real (%). Es el indicador más utilizado para medir el ritmo de expansión de una economía.",
    "Tasa de variación anual de la formación bruta de capital fijo (%). Indica si las economías están expandiendo o contrayendo su capacidad productiva futura.",
    "Tasa de crecimiento anual del volumen de importaciones (%). Una tasa alta puede reflejar expansión de la demanda interna o mayor integración a cadenas globales de valor.",
    "Tasa de crecimiento anual del consumo privado de los hogares (%). Refleja la dinámica de la demanda interna y el comportamiento del ingreso disponible de las familias.",
    "Tasa de variación anual del gasto de consumo final del gobierno (%). Indica si el gobierno está expandiendo o contrayendo su participación en la economía."
  ),
  
  Paises_representativos = c(
    "Mayor: Irlanda (13.4%), Perú, Chile, Colombia, Türkiye. Menor: Japón (1.64%), Alemania, Finlandia.",
    "Mayor dispersión: Argentina, Chile. Valores negativos en economías con ajuste fiscal o desaceleración post-pandémica.",
    "Mayor: Perú, Colombia, Chile, asociados a la recuperación de la demanda interna. Negativos en países con ajuste fiscal.",
    "Mayor: Colombia, Perú, Argentina, impulsados por la recuperación post-pandémica. Menor: economías europeas maduras.",
    "Mayor: países con paquetes de estímulo fiscal. Negativo: países europeos con consolidación fiscal."
  )
)

tabla_crecimiento %>%
  kbl(caption = "Variables de crecimiento económico",
      col.names = c("Variable", "Definición y unidad de medida", 
                    "Países más representativos"),
      align = c("l", "l", "l"),
      booktabs = TRUE) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
                full_width = TRUE,
                font_size = 12) %>%
  row_spec(0, background = "#b39ddb", color = "white", bold = TRUE) %>%
  row_spec(seq(1, nrow(tabla_crecimiento), by = 2), 
           background ="#f3e5f5") %>%
  row_spec(seq(2, nrow(tabla_crecimiento), by = 2), 
           background = "white") %>%
  column_spec(1, bold = TRUE, width = "3cm") %>%
  column_spec(2, width = "7cm") %>%
  column_spec(3, width = "6cm")%>% footnote(general = "Fuente: Elaboración propia con base en datos OCDE.",
           general_title = "Nota:",
           footnote_as_chunk = TRUE)
Variables de crecimiento económico
Variable Definición y unidad de medida Países más representativos
Crecimiento económico Tasa de variación anual del volumen del PIB real (%). Es el indicador más utilizado para medir el ritmo de expansión de una economía. Mayor: Irlanda (13.4%), Perú, Chile, Colombia, Türkiye. Menor: Japón (1.64%), Alemania, Finlandia.
Crecimiento inversión Tasa de variación anual de la formación bruta de capital fijo (%). Indica si las economías están expandiendo o contrayendo su capacidad productiva futura. Mayor dispersión: Argentina, Chile. Valores negativos en economías con ajuste fiscal o desaceleración post-pandémica.
Crecimiento importaciones Tasa de crecimiento anual del volumen de importaciones (%). Una tasa alta puede reflejar expansión de la demanda interna o mayor integración a cadenas globales de valor. Mayor: Perú, Colombia, Chile, asociados a la recuperación de la demanda interna. Negativos en países con ajuste fiscal.
Crecimiento privado Tasa de crecimiento anual del consumo privado de los hogares (%). Refleja la dinámica de la demanda interna y el comportamiento del ingreso disponible de las familias. Mayor: Colombia, Perú, Argentina, impulsados por la recuperación post-pandémica. Menor: economías europeas maduras.
Crecimiento público Tasa de variación anual del gasto de consumo final del gobierno (%). Indica si el gobierno está expandiendo o contrayendo su participación en la economía. Mayor: países con paquetes de estímulo fiscal. Negativo: países europeos con consolidación fiscal.
Nota: Fuente: Elaboración propia con base en datos OCDE.

Variables de precios

tabla_precios <- data.frame(
  Variable = c("Deflactor PIB", "Precio importaciones"),
  
  Definicion = c(
    "Tasa de crecimiento del deflactor implícito del PIB (%). Es una medida amplia de la inflación interna que no se limita a la canasta del consumidor, sino que abarca toda la producción nacional.",
    "Tasa de variación del deflactor de las importaciones (%). Mide los cambios en los costos de los bienes importados, reflejando la exposición de una economía a la inflación internacional y a los choques de precios externos."
  ),
  
  Paises_representativos = c(
    "Mayor: Argentina (>50%), reflejando su persistente problema inflacionario. Türkiye también presenta valores elevados. Menor: economías avanzadas (<5%).",
    "Mayor: Türkiye, Hungría, Croacia, con alta apertura comercial y dependencia de materias primas importadas. Mayor variabilidad en países productores de commodities."
  )
)

tabla_precios %>%
  kbl(caption = "Variables de precios",
      col.names = c("Variable", "Definición y unidad de medida", 
                    "Países más representativos"),
      align = c("l", "l", "l"),
      booktabs = TRUE) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
                full_width = TRUE,
                font_size = 12) %>%
  row_spec(0, background = "#b39ddb", color = "white", bold = TRUE) %>%
  row_spec(1, background = "#f3e5f5") %>%
  row_spec(2, background = "white") %>%
  column_spec(1, bold = TRUE, width = "3cm") %>%
  column_spec(2, width = "7cm") %>%
  column_spec(3, width = "6cm") %>%
  footnote(general = "Fuente: Elaboración propia con base en datos OCDE.",
           general_title = "Nota:",
           footnote_as_chunk = TRUE)
Variables de precios
Variable Definición y unidad de medida Países más representativos
Deflactor PIB Tasa de crecimiento del deflactor implícito del PIB (%). Es una medida amplia de la inflación interna que no se limita a la canasta del consumidor, sino que abarca toda la producción nacional. Mayor: Argentina (>50%), reflejando su persistente problema inflacionario. Türkiye también presenta valores elevados. Menor: economías avanzadas (<5%).
Precio importaciones Tasa de variación del deflactor de las importaciones (%). Mide los cambios en los costos de los bienes importados, reflejando la exposición de una economía a la inflación internacional y a los choques de precios externos. Mayor: Türkiye, Hungría, Croacia, con alta apertura comercial y dependencia de materias primas importadas. Mayor variabilidad en países productores de commodities.
Nota: Fuente: Elaboración propia con base en datos OCDE.

###{-}

2.3 Análisis de correlaciones

Como etapa previa a la aplicación del ACP, se construyó una matriz de correlaciones entre las 15 variables seleccionadas. Este análisis cumple una función exploratoria fundamental: permite identificar la existencia de relaciones lineales entre los indicadores, lo cual es una condición necesaria para que la reducción de dimensionalidad mediante ACP sea pertinente y genere componentes con significado económico interpretable. Los resultados de la matriz se organizan en tres bloques temáticos claramente diferenciados, cada uno con una lógica económica propia que anticipa las dimensiones latentes que emergerán del análisis multivariado.

library(readxl)
library(dplyr)
library(tibble)
library(ggcorrplot)
DatosEcon <- read_excel("DatosEcon.xlsx")
data <- DatosEcon %>%
  select(Pais,x25,x10,x22,x17,x20,x24,x4,x16,x12,x14,x7,x6,x8,x13,x21) %>%
  column_to_rownames("Pais") %>%
  rename(
    Deflactor_PIB            = x25,
    PIB                      = x10,
    Crecimiento_publico      = x22,
    Crecimiento_economico    = x17,
    Crecimiento_inversion    = x20,
    Precio_importaciones     = x24,
    Comercio_total           = x4,
    Crecimiento_importaciones = x16,
    Inversion_capital        = x12,
    Exportaciones            = x14,
    Consumo_hogares          = x7,
    Gasto_publico            = x6,
    Exportaciones_netas      = x8,
    Importaciones            = x13,
    Crecimiento_privado      = x21
  )
r <- cor(data, use = "complete.obs")
ggcorrplot(r,
           hc.order      = TRUE,
           type          = "lower",
           lab           = TRUE,
           lab_size      = 2,
           colors        = c("#c0392b", "white", "#2b6cb0"),
           outline.color = "white",
           tl.cex        = 8,
           tl.col        = "#2d3748") +
  labs(title = "Matriz de Correlación") +
  theme(
    plot.title   = element_text(size = 10, face = "bold", hjust = 0.5),
    legend.title = element_text(size = 8)
  )

El primer bloque corresponde al grupo de variables de volumen económico, donde se observan las correlaciones más elevadas y consistentes de toda la matriz. Las exportaciones presentan una correlación de 0.99 con la inversión en capital y de 0.98 con las importaciones, mientras que el consumo de los hogares correlaciona 0.98 con las importaciones y 0.97 con el PIB. A su vez, la inversión en capital registra una correlación de 0.93 con las importaciones y de 0.99 con las exportaciones. Estas correlaciones, que se aproximan a la unidad, no son estadísticamente casuales: reflejan la coherencia estructural de la identidad macroeconómica del método del gasto, según la cual el PIB equivale a la suma del consumo de los hogares, la inversión, el gasto gubernamental y las exportaciones netas. En otras palabras, los países con mayor escala productiva, como Estados Unidos, Alemania, Japón y Corea del Sur, tienden simultáneamente a registrar mayores niveles de consumo interno, inversión en capital y flujos de comercio exterior, dado que todas estas variables son expresión del mismo fenómeno subyacente: el tamaño absoluto de la economía. Esta estructura de correlaciones altamente positivas confirma que estas seis variables comparten una dimensión latente común, que en el ACP se identificará como la dimensión de Actividad Macroeconómica.

El segundo bloque corresponde al grupo de variables de crecimiento económico, donde se observa una pauta de correlaciones positivas moderadas. El crecimiento económico correlaciona 0.74 con el crecimiento público y 0.37 con este mismo indicador en una lectura cruzada, mientras que el crecimiento privado presenta correlaciones de 0.43 con el crecimiento de la inversión y de 0.56 con el crecimiento de las importaciones. Adicionalmente, el crecimiento de la inversión registra una correlación de 0.68 con el crecimiento de las importaciones. Desde una perspectiva macroeconómica, esta estructura es consistente con el mecanismo keynesiano del multiplicador: cuando una economía experimenta un incremento en su inversión o en su consumo privado, este impulso se propaga hacia los demás agregados de demanda, expandiendo simultáneamente las importaciones, el gasto público y el producto total. Esta dinámica es especialmente pronunciada en economías con alta propensión marginal al consumo y ciclos económicos más volátiles, como Colombia, Perú y Argentina, donde los períodos de expansión tienden a generar incrementos correlacionados y simultáneos en todos los componentes de la demanda agregada. La magnitud moderada de estas correlaciones, inferior a la observada en el bloque de volumen, es también económicamente razonable: las tasas de crecimiento son más sensibles a las coyunturas específicas de cada país que los niveles absolutos, lo que introduce una mayor heterogeneidad entre las economías de la muestra.

El tercer bloque de correlaciones relevantes involucra las variables de precios. El deflactor del PIB y el precio de las importaciones presentan una correlación excepcionalmente elevada de 0.99, la más alta de toda la matriz junto con las correlaciones del bloque de volumen. Este resultado tiene una interpretación económica precisa: en economías con alta apertura comercial, los incrementos en los precios de los bienes importados se transmiten rápidamente al nivel general de precios interno a través de múltiples canales: el encarecimiento de los insumos productivos importados eleva los costos de producción y, por ende, los precios de los bienes finales; la depreciación cambiaria que suele acompañar el alza de precios externos incrementa el costo en moneda local de todas las importaciones; y la reducción del poder adquisitivo real de los hogares contrae la demanda interna, afectando el ciclo económico en su conjunto. Esta pauta es especialmente visible en economías como Argentina y Türkiye, que han enfrentado simultáneamente inflación interna persistente y presiones cambiarias que encarecen estructuralmente sus importaciones. Adicionalmente, se observa que el crecimiento de la inversión correlaciona 0.40 con el precio de las importaciones y 0.39 con el deflactor del PIB, lo que sugiere que los entornos de mayor presión inflacionaria tienden a coincidir con períodos de mayor volatilidad en la formación de capital.

Un hallazgo particularmente revelador de la matriz es el comportamiento anómalo de la variable Comercio_total respecto al resto de indicadores de volumen. A diferencia del PIB, las exportaciones, las importaciones y el consumo de los hogares, que presentan correlaciones entre sí superiores a 0.92, el Comercio_total registra correlaciones sorprendentemente bajas con estas mismas variables: apenas 0.09 con el PIB, 0.10 con las exportaciones, 0.11 con la inversión en capital y 0.09 con el consumo de los hogares. Este comportamiento, aparentemente paradójico dado que el comercio total es precisamente la suma de exportaciones e importaciones, tiene una explicación económica precisa: el indicador de Comercio_total utilizado en este estudio no mide el volumen absoluto del intercambio comercial, sino la contribución relativa del comercio exterior al cambio del PIB real. En consecuencia, esta variable captura la dinámica y el peso relativo del sector externo en la economía, y no su magnitud absoluta. Esto explica por qué economías como Irlanda, cuyo comercio exterior representa más del 200% de su PIB, y economías latinoamericanas como Colombia y Perú, con un sector externo de menor escala absoluta pero relevante en términos relativos, pueden presentar valores similares en esta variable, mientras que economías grandes como Estados Unidos o Japón, cuyo comercio exterior representa una fracción relativamente menor de su PIB, registran valores más bajos. Esta distinción entre magnitud absoluta y peso relativo es fundamental para interpretar correctamente los resultados del ACP y la clusterización que se presentan más adelante.

Un hallazgo particularmente revelador de la matriz es el comportamiento anómalo de la variable Comercio_total respecto al resto de indicadores de volumen. A diferencia del PIB, las exportaciones, las importaciones y el consumo de los hogares, que presentan correlaciones entre sí superiores a 0.92, el Comercio_total registra correlaciones sorprendentemente bajas con estas mismas variables: apenas 0.09 con el PIB, 0.10 con las exportaciones, 0.11 con la inversión en capital y 0.09 con el consumo de los hogares. Este comportamiento, aparentemente paradójico dado que el comercio total es precisamente la suma de exportaciones e importaciones, tiene una explicación económica precisa: el indicador de Comercio_total utilizado en este estudio no mide el volumen absoluto del intercambio comercial, sino la contribución relativa del comercio exterior al cambio del PIB real. En consecuencia, esta variable captura la dinámica y el peso relativo del sector externo en la economía, y no su magnitud absoluta. Esto explica por qué economías como Irlanda, cuyo comercio exterior representa más del 200% de su PIB, y economías latinoamericanas como Colombia y Perú, con un sector externo de menor escala absoluta pero relevante en términos relativos, pueden presentar valores similares en esta variable, mientras que economías grandes como Estados Unidos o Japón, cuyo comercio exterior representa una fracción relativamente menor de su PIB, registran valores más bajos. Esta distinción entre magnitud absoluta y peso relativo es fundamental para interpretar correctamente los resultados del ACP y la clusterización que se presentan más adelante.

2.4 Análisis de Componentes Principales (ACP)

El Análisis de Componentes Principales (ACP), conocido también como Principal Component Analysis (PCA) en inglés, es una técnica estadística multivariada de reducción de dimensionalidad que transforma un conjunto de variables originales, posiblemente correlacionadas entre sí, en un conjunto menor de variables no correlacionadas denominadas componentes principales. Cada componente principal es una combinación lineal de todas las variables originales, construida de tal manera que el primer componente capture la mayor proporción posible de la varianza total del conjunto de datos, el segundo capture la mayor proporción posible de la varianza restante y así sucesivamente. De este modo, el ACP permite resumir la información contenida en múltiples variables en unas pocas dimensiones sin perder información relevante.

En el contexto del análisis macroeconómico comparado, el ACP cumple una función doble: por un lado, permite reducir la complejidad de un espacio de 15 variables a un espacio de 2 o 3 dimensiones que son más manejables para la visualización e interpretación; por otro lado, permite identificar las dimensiones latentes del comportamiento económico que subyacen a los datos, es decir, los factores estructurales que organizan las diferencias y similitudes entre los países analizados. Esta segunda función es especialmente valiosa en economía, dado que los indicadores macroeconómicos rara vez actúan de forma independiente, sino que responden a estructuras subyacentes como el tamaño de la economía, el ciclo económico o el grado de apertura comercial.

La pertinencia del ACP en este estudio se fundamenta en la existencia de correlaciones significativas entre las variables seleccionadas, condición necesaria para que la reducción dimensional genere componentes con contenido informativo relevante. El número de componentes a retener se determinó mediante el criterio del codo en el gráfico de sedimentación (Scree plot), el cual indica visualmente el punto a partir del cual los componentes adicionales aportan una contribución marginal mínima a la explicación de la varianza total. En este estudio, los primeros tres componentes concentran el 73.4% de la varianza total, lo que se considera un nivel de representación adecuado para los propósitos del análisis.

Para interpretar el significado económico de cada componente, se analizaron los círculos de correlaciones y los gráficos de contribución de variables, que permiten identificar qué indicadores aportan más información a cada dimensión. Las variables con flechas más largas y tonalidades más intensas en el biplot son las que mayor carga factorial presentan, es decir, las que más contribuyen a definir el carácter de cada componente. Este análisis permitió denominar los tres componentes retenidos como: Actividad Macroeconómica (Dimensión 1), Crecimiento de la Economía (Dimensión 2) y Sector Externo (Dimensión 3), denominaciones que reflejan la naturaleza económica de las variables que los configuran.

2.5 Clusterización jerárquica con el método de Ward

Una vez obtenidas las coordenadas de los países en el espacio factorial definido por los componentes principales, se procedió a aplicar un algoritmo de clusterización para identificar grupos de economías con perfiles macroeconómicos similares. La clusterización es una técnica de aprendizaje no supervisado que clasifica las observaciones en grupos homogéneos llamados clústeres, de manera que los países al interior de cada grupo sean los más similares posible entre sí y, al mismo tiempo, los más diferentes posible respecto a los países de otros grupos.

Para este estudio se empleó el método de clusterización jerárquica aglomerativa con el criterio de Ward, también conocido como método de Ward o método de la varianza mínima. Este algoritmo comienza considerando cada país como un clúster individual y, en cada etapa, fusiona los dos grupos cuya unión minimice el incremento en la varianza intra-clúster, es decir, la suma de las distancias cuadradas de cada observación respecto al centroide de su grupo. Este criterio tiene la ventaja de generar clústeres compactos y balanceados en tamaño, lo que lo hace especialmente adecuado para identificar perfiles económicos bien diferenciados.

El resultado del algoritmo jerárquico se representa visualmente mediante un dendrograma, que es una estructura en forma de árbol donde cada nodo representa una fusión de grupos y la altura de las ramas indica la distancia a la que se unieron. El análisis del dendrograma permite identificar visualmente la estructura de los datos y determinar el número óptimo de clústeres mediante la observación de los saltos más pronunciados en la altura de las fusiones. En este estudio, la inspección visual del dendrograma se complementó con el análisis del método de la silueta, que proporciona una medida cuantitativa de la calidad de la clasificación para distintos números de grupos.

El método de la silueta calcula, para cada observación, un coeficiente que compara la distancia media de esa observación respecto a los demás puntos de su propio clúster con la distancia media respecto a los puntos del clúster más cercano. Los valores del coeficiente de silueta oscilan entre -1 y 1: valores cercanos a 1 indican que la observación está bien clasificada dentro de su grupo; valores cercanos a 0 indican que la observación se encuentra en la frontera entre dos grupos; y valores negativos indican que la observación estaría mejor clasificada en otro clúster. Para este estudio, si bien el método de la silueta sugirió k=2 como el número óptimo de clústeres desde una perspectiva puramente estadística, la inspección visual del dendrograma permitió identificar que una solución de k=3 clústeres captura mejor la heterogeneidad estructural de la muestra, preservando la diferenciación entre las economías avanzadas y las emergentes latinoamericanas, y reconociendo el carácter atípico de Corea del Sur.

El software utilizado para todas las etapas del análisis fue RStudio, empleando los paquetes FactoMineR y factoextra para el ACP y la visualización de resultados, y el paquete stats para la implementación del algoritmo de clusterización jerárquica con el método de Ward. Se incorporaron visualizaciones interactivas y gráficos dinámicos para facilitar la exploración de los datos y la interpretación de los resultados obtenidos.

En conjunto, la combinación del ACP y la clusterización jerárquica con el método de Ward constituye una estrategia metodológica robusta y coherente para abordar la pregunta de investigación planteada: permite primero sintetizar la información de 15 variables macroeconómicas en tres dimensiones interpretables, y luego identificar grupos de países con perfiles estructuralmente similares en ese espacio reducido, sin imponer categorías preconcebidas que podrían sesgar los resultados.

3. Analisís descriptivo

Antes de aplicar técnicas de análisis multivariado, como lo es, y el análisis de componentes principales (ACP) y métodos de clusterización, es fundamental poder examinar cuál es el comportamiento general de las variables seleccionadas permitiendo así un análisis pertinente mediante el cual se logra identificar tendencias, niveles de dispersión y posibles diferencias,estructurales entre los países de la base de datos a trabajar

Teniendo las variables analizadas, las cuales representan dimensiones de la actividad económica, incluyendo indicadores de producción, comercio exterior, demanda, comercio, económico y comportamiento de los precios, estas variables proporcionan una visión integral de la característica económica de los países pertenecientes a la OECD y las economías emergentes utilizadas en la base de datos

El análisis descriptivo va a concluir en una etapa fundamental, ya que permite detectar patrones preliminares de similitud y diferencias entre los países estudiados. Asimismo, se facilita la identificación de posibles relaciones entre variables que podrían resumirse mediante comportamientos principales, y así poder llegar a utilizarse para construir grupos homogéneos de economías

3.1 Panorama general de los países

library(readxl)
library(dplyr)
library(ggplot2)
library(plotly)
library(tibble)
library(rnaturalearth)
library(sf)
DatosEcon <- read_excel("DatosEcon.xlsx")
data <- DatosEcon %>%
  select(Pais, x25, x10, x22, x17, x20, x24, x4, x16, x12, x14, x7, x6, x8, x13, x21) %>%
  column_to_rownames("Pais") %>%
  rename(
    Deflactor_PIB             = x25,
    PIB                       = x10,
    Crecimiento_publico       = x22,
    Crecimiento_economico     = x17,
    Crecimiento_inversion     = x20,
    Precio_importaciones      = x24,
    Comercio_total            = x4,
    Crecimiento_importaciones = x16,
    Inversion_capital         = x12,
    Exportaciones             = x14,
    Consumo_hogares           = x7,
    Gasto_publico             = x6,
    Exportaciones_netas       = x8,
    Importaciones             = x13,
    Crecimiento_privado       = x21
  )
mundo <- ne_countries(scale="medium", returnclass="sf")
data1 <- data %>% rownames_to_column("Pais")
mundo_data <- mundo %>% left_join(data1, by=c("name"="Pais"))

g_mapa <- ggplot(mundo_data) +
  geom_sf(aes(fill=PIB,
              text=paste("País:", name,
                         "<br>PIB:", scales::dollar(PIB, scale=1e-12,
                                                     suffix="T", accuracy=0.1))),
          color="white", size=0.1) +
  scale_fill_gradient2(low="#f8bbd0", mid="#b39ddb", high="#4a148c",
                       midpoint=median(data1$PIB, na.rm=TRUE),
                       na.value="lightgray",
                       name="PIB",
                       labels=scales::dollar_format(scale=1e-12, suffix="T")) +
  theme_void() +
  theme(plot.title=element_text(size=14, face="bold", hjust=0.5),
        plot.subtitle=element_text(size=11, hjust=0.5),
        legend.position="right") +
  labs(title="PIB Mundial por País",
       subtitle="Producto Interno Bruto - Volumen a precios de mercado",
       caption="Fuente: Elaboración propia con base en DatosEcon.xlsx")

ggplotly(g_mapa, tooltip="text") %>%
  layout(margin=list(t=60, b=20, l=20, r=20)) %>%
  config(displayModeBar=TRUE, displaylogo=FALSE)

En la siguiente representación geográfica de producto bruto interno PIB, se puede visualizar las diferencias en los tamaños económicos incluidos en el estudio, evidenciando una clara heterogeneidad entre los países analizados a través de su intensidad de color, la producción económica mundial se encuentra distribuida de manera desigual, así esta se concentra en un grupo reducido de economías que presentan niveles de PIB considerablemente superiores al resto.

Dentro de esta representación geográfica se puede observar que especialmente Colombia es una de las muestras que destaca, la cual aparece con una tonalidad más intensa en el mapa indicando que este país tiene un PIB más elevado que el resto, de igual manera como los países Japón, India, Brasil, Canadá y Australia cuentan con niveles importantes de producción económica donde estas economías combinan mercados internos con una elevada capacidad productiva y una participación significativa.

Al observar en América Latina se observa una situación heterogénea, mientras que Colombia, Brasil y Argentina, registran mayores niveles de actividad económica, evidenciando diferencias importantes en capacidad productiva, tamaño poblacional y así un nivel de desarrollo económico.

Teniendo relación con la pregunta central de la investigación, en este mapa muestra que existen diferencias en la capacidad productiva de los países analizados en la base de datos, sugiriendo la presencia de perfiles económicos diferenciados, los cuales podrán ser identificados mediante técnicas multivariadas como el análisis de componentes principales, y de esta manera se llega consolidar como una de las variables explica las diferencias estructurales observadas en los datos de la OECD

3.2 Estadísticas descriptivas

library(readxl)
library(dplyr)
library(kableExtra)
library(tibble)
DatosEcon <- read_excel("DatosEcon.xlsx")
data <- DatosEcon %>%
  select(Pais, x25, x10, x22, x17, x20, x24, x4, x16, x12, x14, x7, x6, x8, x13, x21) %>%
  column_to_rownames("Pais") %>%
  rename(
    Deflactor_PIB             = x25,
    PIB                       = x10,
    Crecimiento_publico       = x22,
    Crecimiento_economico     = x17,
    Crecimiento_inversion     = x20,
    Precio_importaciones      = x24,
    Comercio_total            = x4,
    Crecimiento_importaciones = x16,
    Inversion_capital         = x12,
    Exportaciones             = x14,
    Consumo_hogares           = x7,
    Gasto_publico             = x6,
    Exportaciones_netas       = x8,
    Importaciones             = x13,
    Crecimiento_privado       = x21
  )
moda <- function(x) { ux <- unique(x); ux[which.max(tabulate(match(x, ux)))] }
calcular_stats <- function(nombre, valores) {
  data.frame(Variable=nombre,
             Media=round(mean(valores, na.rm=TRUE), 2),
             Mediana=round(median(valores, na.rm=TRUE), 2),
             Moda=round(moda(valores), 2),
             Desv_Estandar=round(sd(valores, na.rm=TRUE), 2),
             Minimo=round(min(valores, na.rm=TRUE), 2),
             Maximo=round(max(valores, na.rm=TRUE), 2))
}
tabla_desc <- bind_rows(
  calcular_stats("Deflactor PIB", data$Deflactor_PIB),
  calcular_stats("PIB", data$PIB),
  calcular_stats("Crecimiento Público", data$Crecimiento_publico),
  calcular_stats("Crecimiento Económico", data$Crecimiento_economico),
  calcular_stats("Crecimiento Inversión", data$Crecimiento_inversion),
  calcular_stats("Precio Importaciones", data$Precio_importaciones),
  calcular_stats("Comercio Total", data$Comercio_total),
  calcular_stats("Crecimiento Importaciones", data$Crecimiento_importaciones),
  calcular_stats("Inversión Capital", data$Inversion_capital),
  calcular_stats("Exportaciones", data$Exportaciones),
  calcular_stats("Consumo Hogares", data$Consumo_hogares),
  calcular_stats("Gasto Público", data$Gasto_publico),
  calcular_stats("Exportaciones Netas", data$Exportaciones_netas),
  calcular_stats("Importaciones", data$Importaciones),
  calcular_stats("Crecimiento Privado", data$Crecimiento_privado))
tabla_desc %>%
  kbl(caption="Estadísticas Descriptivas", align=c("l","r","r","r","r","r","r"),
      format.args=list(big.mark=".", decimal.mark=",")) %>%
  kable_styling(bootstrap_options=c("striped","hover","condensed"),
                full_width=FALSE, font_size=13, position="center") %>%
  row_spec(0, background="#b39ddb", color="white", bold=TRUE) %>%
  row_spec(seq(1, nrow(tabla_desc), by=2), background="#f3e5f5") %>%
  row_spec(seq(2, nrow(tabla_desc), by=2), background="#e8f5e9") %>%
  column_spec(2:7, width="2.5cm", color="black") %>%
  footnote(general="Fuente: Elaboración propia con base en DatosEcon.xlsx",
           general_title="Nota:", footnote_as_chunk=TRUE)
Estadísticas Descriptivas
Variable Media Mediana Moda Desv_Estandar Minimo Maximo
Deflactor PIB 2,890000e+00 1,140000e+00 1,060000e+00 1,018000e+01 1,000000e+00 6,715000e+01
PIB 9,137015e+13 1,930567e+12 2,055445e+12 3,310409e+14 2,601447e+10 1,915777e+15
Crecimiento Público 4,460000e+00 4,030000e+00 5,350000e+00 2,780000e+00 4,100000e-01 1,263000e+01
Crecimiento Económico 6,410000e+00 5,290000e+00 4,920000e+00 2,870000e+00 1,640000e+00 1,343000e+01
Crecimiento Inversión 7,340000e+00 6,600000e+00 9,770000e+00 1,081000e+01 -3,907000e+01 3,532000e+01
Precio Importaciones 2,310000e+00 1,100000e+00 1,010000e+00 6,280000e+00 8,700000e-01 4,151000e+01
Comercio Total 3,762049e+11 2,106370e+11 2,691674e+11 4,947373e+11 8,363996e+09 2,751302e+12
Crecimiento Importaciones 1,282000e+01 1,312000e+01 6,480000e+00 8,240000e+00 -8,280000e+00 3,547000e+01
Inversión Capital 2,366899e+13 3,753493e+11 4,851550e+11 9,288766e+13 8,332420e+09 5,731436e+14
Exportaciones 2,914816e+13 5,506796e+11 4,347850e+11 1,320778e+14 2,177336e+10 8,491465e+14
Consumo Hogares 5,073561e+13 1,046384e+12 1,075068e+12 1,730062e+14 1,310195e+10 8,824598e+14
Gasto Público 1,615331e+13 3,209043e+11 4,507190e+11 5,883308e+13 4,701223e+09 3,376846e+14
Exportaciones Netas 0,000000e+00 -1,000000e-02 -2,000000e-02 5,000000e-02 -9,000000e-02 2,800000e-01
Importaciones 2,881452e+13 4,897133e+11 3,959720e+11 1,166532e+14 2,245229e+10 7,298250e+14
Crecimiento Privado 6,610000e+00 5,730000e+00 5,030000e+00 3,930000e+00 4,000000e-01 2,051000e+01
Nota: Fuente: Elaboración propia con base en DatosEcon.xlsx

En la subsiguiente tabla de estadísticas descriptivas se exponen las métricas fundamentales de tendencia central y dispersión correspondientes a las 15 variables objeto de estudio. Cada uno de estos indicadores representa dimensiones esenciales de la dinámica económica, abarcando componentes de producción, comercio exterior, inversión, crecimiento económico y la evolución de los precios.

Siendo así, en primer lugar, el producto bruto PIB representa una media aproximadamente del 9.14 x10^13 y una desviación estándar del 3.31 x10^14 logrando evidenciar una elevada dispersión entre los países analizados. Además, se llega a observar la diferencia entre el valor mínimo, siendo el 2.60 x10^10 y el máximo el 1.92 x10^15 reflejando una coexistencia de gran escala, junto con los países de menor tamaño económico.

También así, se observa un patrón similar en las variables relacionadas con el comercio exterior siendo el comercio total representando una media del 3.76 x10^11 y alcanza valores máximos a 2.75 x10^12 mientras que las exportaciones e importaciones tiene un amplio rango de variación y elevada desviación estándar contando con estos distintos grados de integración de los mercados internacionales.

Analizando un poco la variable de inversión de capital, muestra una alta variabilidad con una desviación estándar, cerca al 9.29 x10^13 así mismo considerándose unos valores máximos superiores a la media siendo este, un comportamiento que indica que algunos países poseen una capacidad significativa para acumular capital productivo, lo que puede insinuar mayores, niveles de crecimiento y desarrollo económico a largo plazo

Tratando un poco sobre la demanda agregada, las variables como consumo hogares y gastos públicos presentan amplios rangos de variación, contando el consumo de hogares con una media del 5.07 x10^13 y gastos públicos registrando una media del 1.62 x10^13 reflejando algunas diferencias distintas y distintos grados de participación del sector público en la actividad de la economía nacional.

Al analizar un poco las variables de crecimiento se observa el crecimiento económico presentando una media del 6.41, mientras que el crecimiento inversión alcanza una media del 7.34, siendo esta una variable que cuenta con una mayor dispersión relativa dentro del grupo de indicadores de crecimiento.

De igual manera se puede llegar a analizar el crecimiento importaciones con una media de 1.28 y una desviación estándar del 8.24, indicando que esta variable tiene una elevada heterogeneidad, diciendo un poco que los países con mayor tasas de crecimiento de importaciones pueden estar experimentando procesos de expansión y teniendo un incremento de demanda interna o una mayor integración a la cadenas globales de producción

Por otro lado, las variables del crecimiento privado y el crecimiento público presenta unas medias de 6.61 y 4.46, siendo estos unos resultados que en promedio, el crecimiento de la demanda privada supera el crecimiento del gasto gubernamental, indicando que éste sería un papel predominante en el sector privado

Analizando un poco los indicadores de precios, como lo es la variable deflactor PIB, presentando una media del 2.89 y registrando una desviación estándar relativamente alta y con valores máximo superiores al 6,71 siendo un comportamiento significativo en los niveles de inflación y estabilidad macroeconómica. Asimismo se logra analizar el precio de importaciones que presenta una media del 2.31, pero con unos valores máximos cercanos al 4.15 evidenciando que algunos países enfrentan incrementos en los costos asociados al comercio exterior

Por último, las exportaciones netas muestran una media cercana a cero y una dispersión relativamente baja en comparación a las demás variables, indicando que en promedio, los países presentan balances comerciales relativamente equilibrados

3.3 Boxplot de variables

library(readxl)
library(dplyr)
library(tidyr)
library(ggplot2)
library(plotly)
library(tibble)
DatosEcon <- read_excel("DatosEcon.xlsx")
data <- DatosEcon %>%
  select(Pais, x25, x10, x22, x17, x20, x24, x4, x16, x12, x14, x7, x6, x8, x13, x21) %>%
  column_to_rownames("Pais") %>%
  rename(
    Deflactor_PIB             = x25,
    PIB                       = x10,
    Crecimiento_publico       = x22,
    Crecimiento_economico     = x17,
    Crecimiento_inversion     = x20,
    Precio_importaciones      = x24,
    Comercio_total            = x4,
    Crecimiento_importaciones = x16,
    Inversion_capital         = x12,
    Exportaciones             = x14,
    Consumo_hogares           = x7,
    Gasto_publico             = x6,
    Exportaciones_netas       = x8,
    Importaciones             = x13,
    Crecimiento_privado       = x21
  )
data1<- as.data.frame(scale(data)) %>%
  rownames_to_column("Pais") %>%
  pivot_longer(cols=-Pais, names_to="Variable", values_to="Valor")

grafico <- ggplot(data1, aes(x=Variable, y=Valor, fill=Variable,
                                 text=paste("País:", Pais, "<br>Valor estandarizado:", round(Valor, 2)))) +
  geom_boxplot(alpha=0.7, outlier.shape=21, outlier.size=1.5) +
  scale_fill_manual(values=c(
    "Deflactor_PIB"="#b39ddb", "PIB"="#ce93d8", "Crecimiento_publico"="#c5e1a5",
    "Crecimiento_economico"="#80cbc4", "Crecimiento_inversion"="#f8bbd0",
    "Precio_importaciones"="#ede7f6", "Comercio_total"="#e1bee7",
    "Crecimiento_importaciones"="#dcedc8", "Inversion_capital"="#b2dfdb",
    "Exportaciones"="#f3e5f5", "Consumo_hogares"="#e8f5e9",
    "Gasto_publico"="#d1c4e9", "Exportaciones_netas"="#b2ebf2",
    "Importaciones"="#fce4ec", "Crecimiento_privado"="#c8e6c9")) +
  theme_minimal(base_family="sans") +
  theme(legend.position="none",
        plot.title=element_text(size=14, face="bold", hjust=0.5),
        axis.text.x=element_text(angle=45, hjust=1, size=8)) +
  labs(title="Distribución de Variables Estandarizadas",
       x="", y="Valor estandarizado (Z-score)",
       caption="Fuente: Elaboración propia con base en DatosEcon.xlsx")

ggplotly(grafico, tooltip="text")

En la siguiente imagen muestra los diagramas de caja de las 15 variables económicas previamente seleccionadas, luego de ser estandarizadas mediante sus puntuaciones Z permitiendo comparar la dispersión relativa de las variables, facilitando asi la identificación de patrones, valores atípicos y algunas diferencias estructurales de los países analizados en la base de datos.

Se logra observar que la mayoría de variables presenta medianas cercanas a cero el cual es un resultado esperado después del proceso de estandarización, sin embargo se logra evidenciar que las economías estudiadas de las variables mantienen un comportamiento heterogéneo en distintos ámbitos de la actividad económica.

Al realizar el análisis de variables asociadas como en el comercio internacional , en particular el comercio total, exportaciones, importaciones y precio importaciones estas muestran una cantidad de valores atípicos indicando que algunos países registran niveles de actividad superiores al promedio del conjunto analizado y así la presencia de los valores extremos es consistente con la existencia de economías altamente integrada a comercios internacionales

Así mismo la variables relacionadas con la producción como lo son las variables PIB, consumo hogares, gasto público e inversión capital, presentan también valores extremos hacia la parte superior dando como resultado diferencias sustanciales en el tamaño económico de los países y la capacidad de la movilización de los recursos productivos sugiriendo así, que algunas economías poseen niveles de producción e inversión significativamente superiores al promedio.

En cuanto a indicadores de crecimiento se observa que las variables crecimiento inversión , crecimiento económico y crecimiento privado, siendo una de las variables que mayor destaca la de crecimiento inversión por poseer valores extremos tanto positivos como negativos, sugiriendo así la existencia de importantes diferencias en los ciclos económicos de los países

De igual manera las variables relacionadas con el precio como lo son el deflactor PIB y precio importaciones muestran observaciones atípicas muy superiores al promedio, evidenciando que los países enfrentan presiones de inflaciones o variación de los precios externos

De igual importancia la variable exportaciones netas representa una distribución más concentrada alrededor de la mediana con una dispersión menor al resto de los indicadores, existiendo algunas diferencias en los balances comerciales de los países, en resumen en el diagrama de cajas muestra una heterogeneidad entre las economías incluidas en el estudio, mostrando la presencia recurrente de valores atípicos así mismo, existen diferencias significativas entre aspectos relacionados con el crecimiento económico, la inversión el consumo la producción y la integración comercial

3.4 Distribución de las variables de crecimiento

library(readxl)
library(dplyr)
library(tidyr)
library(ggplot2)
library(tibble)
DatosEcon <- read_excel("DatosEcon.xlsx")
data <- DatosEcon %>%
  select(Pais, x25, x10, x22, x17, x20, x24, x4, x16, x12, x14, x7, x6, x8, x13, x21) %>%
  column_to_rownames("Pais") %>%
  rename(
    Deflactor_PIB             = x25,
    PIB                       = x10,
    Crecimiento_publico       = x22,
    Crecimiento_economico     = x17,
    Crecimiento_inversion     = x20,
    Precio_importaciones      = x24,
    Comercio_total            = x4,
    Crecimiento_importaciones = x16,
    Inversion_capital         = x12,
    Exportaciones             = x14,
    Consumo_hogares           = x7,
    Gasto_publico             = x6,
    Exportaciones_netas       = x8,
    Importaciones             = x13,
    Crecimiento_privado       = x21
  )
data %>%
  rownames_to_column("Pais") %>%
  select(Pais, Crecimiento_economico, Crecimiento_inversion, Crecimiento_privado,
         Crecimiento_publico, Crecimiento_importaciones) %>%
  pivot_longer(cols=-Pais, names_to="Variable", values_to="Valor") %>%
  ggplot(aes(x=Valor, fill=Variable)) +
  geom_histogram(bins=10, alpha=0.8, color="white") +
  facet_wrap(~Variable, scales="free", ncol=3) +
  scale_fill_manual(values=c(
    "Crecimiento_economico"="#80cbc4", "Crecimiento_inversion"="#f8bbd0",
    "Crecimiento_privado"="#c8e6c9", "Crecimiento_publico"="#c5e1a5",
    "Crecimiento_importaciones"="#dcedc8")) +
  theme_minimal(base_family="sans") +
  theme(legend.position="none",
        plot.title=element_text(size=14, face="bold", hjust=0.5),
        strip.background=element_rect(fill="#ede7f6", color=NA),
        strip.text=element_text(face="bold", size=9)) +
  labs(title="Distribución de Variables de Crecimiento (%)",
       x="Valor (%)", y="Frecuencia",
       caption="Fuente: Elaboración propia con base en DatosEcon.xlsx")

Aquí se logran observar las variables asociadas al crecimiento económico presentando distribuciones relativamente heterogéneas entre los países analizados como se muestra el crecimiento económico, observando una concentración importante entre los valores cercanos del 4% y el 10%, indicando que la mayoría de las economías registraron ritmos de expansión, moderados. De otro modo, se observa países con tasas superiores al 12% evidenciando, existencia de economías de procesos de crecimiento significativos un poco más acelerados.

Cómo se puede observar el crecimiento importaciones, presenta una mayor dispersión respecto al resto de las variables, con unos valores que oscilan desde -10 hasta 40 reflejando un comportamiento de diferencias importantes en la demanda interna, la apertura comercial y niveles de integración de los países.

Por otra parte, observando el gráfico de crecimiento de inversión, muestra una distribución más amplia dentro de este grupo de indicadores, observando valores negativos y positivos de gran magnitud, sugiriendo que hubo un proceso de desaceleración económica en algunos países o hubo un ajuste en la formación del capital.

Por parte del crecimiento privado y el crecimiento de gastos públicos, presenta una distribución relativamente más concentrada, indicando que existen diferencias entre países asi observando que la evolución de la demanda agregada tiende a ser más estable en la inversión o en el comercio exterior.

Por último, se observa que estas distribuciones sugieren que las principales diferencia no sólo se encuentran en el tamaño de las economías de sus países, sino también como su velocidad crece principalmente en los motores económicos.

3.5 Distribución de las variables precio

library(readxl)
library(dplyr)
library(tidyr)
library(ggplot2)
library(tibble)
DatosEcon <- read_excel("DatosEcon.xlsx")
data <- DatosEcon %>%
  select(Pais, x25, x10, x22, x17, x20, x24, x4, x16, x12, x14, x7, x6, x8, x13, x21) %>%
  column_to_rownames("Pais") %>%
  rename(
    Deflactor_PIB             = x25,
    PIB                       = x10,
    Crecimiento_publico       = x22,
    Crecimiento_economico     = x17,
    Crecimiento_inversion     = x20,
    Precio_importaciones      = x24,
    Comercio_total            = x4,
    Crecimiento_importaciones = x16,
    Inversion_capital         = x12,
    Exportaciones             = x14,
    Consumo_hogares           = x7,
    Gasto_publico             = x6,
    Exportaciones_netas       = x8,
    Importaciones             = x13,
    Crecimiento_privado       = x21
  )
data %>%
  rownames_to_column("Pais") %>%
  select(Pais, Deflactor_PIB, Precio_importaciones) %>%
  pivot_longer(cols=-Pais, names_to="Variable", values_to="Valor") %>%
  ggplot(aes(x=Valor, fill=Variable)) +
  geom_histogram(bins=10, alpha=0.8, color="white") +
  facet_wrap(~Variable, scales="free", ncol=2) +
  scale_fill_manual(values=c("Deflactor_PIB"="#b39ddb",
                              "Precio_importaciones"="#ede7f6")) +
  theme_minimal(base_family="sans") +
  theme(legend.position="none",
        plot.title=element_text(size=14, face="bold", hjust=0.5),
        strip.background=element_rect(fill="#ede7f6", color=NA),
        strip.text=element_text(face="bold", size=9)) +
  labs(title="Distribución de Variables de Precios",
       x="Valor", y="Frecuencia",
       caption="Fuente: Elaboración propia con base en DatosEcon.xlsx")

En esta parte se logra observar las variables relacionadas con los precios, los cuales presentan una marcada asimetría positiva, tanto en la variable de deflactor PIB cómo con la variable precio importaciones, mostrando una fuerte concentración en valores bajos y moderados, siendo estas acompañadas por presencias de algunos países que cuentan con incrementos excepcionalmente altos

En la gráfico deflactor PIB registra que sus valores superan ampliamente al resto de las observaciones, indicando una economía con inflaciones mayores que las otras observadas en el conjunto de países Asimismo se observa un comportamiento similar en el gráfico precio importaciones donde algunos países cuentan con incrementos considerables en costos de los bienes, siendo así estos unos resultados los cuales sugieren que la mayoría de las economías mantienen niveles relativamente estables existiendo diferencias importantes en materia de la estabilidad macroeconómica.

3.6 Distribución de Variables de Volumen Económico

library(readxl)
library(dplyr)
library(tidyr)
library(ggplot2)
library(tibble)
DatosEcon <- read_excel("DatosEcon.xlsx")
data <- DatosEcon %>%
  select(Pais, x25, x10, x22, x17, x20, x24, x4, x16, x12, x14, x7, x6, x8, x13, x21) %>%
  column_to_rownames("Pais") %>%
  rename(
    Deflactor_PIB             = x25,
    PIB                       = x10,
    Crecimiento_publico       = x22,
    Crecimiento_economico     = x17,
    Crecimiento_inversion     = x20,
    Precio_importaciones      = x24,
    Comercio_total            = x4,
    Crecimiento_importaciones = x16,
    Inversion_capital         = x12,
    Exportaciones             = x14,
    Consumo_hogares           = x7,
    Gasto_publico             = x6,
    Exportaciones_netas       = x8,
    Importaciones             = x13,
    Crecimiento_privado       = x21
  )
data %>%
  rownames_to_column("Pais") %>%
  select(Pais, PIB, Comercio_total, Inversion_capital, Exportaciones,
         Consumo_hogares, Gasto_publico, Importaciones, Exportaciones_netas) %>%
  pivot_longer(cols=-Pais, names_to="Variable", values_to="Valor") %>%
  ggplot(aes(x=Valor, fill=Variable)) +
  geom_histogram(bins=10, alpha=0.8, color="white") +
  facet_wrap(~Variable, scales="free", ncol=3) +
  scale_fill_manual(values=c(
    "PIB"="#ce93d8", "Comercio_total"="#e1bee7", "Inversion_capital"="#b2dfdb",
    "Exportaciones"="#f3e5f5", "Consumo_hogares"="#e8f5e9", "Gasto_publico"="#d1c4e9",
    "Importaciones"="#fce4ec", "Exportaciones_netas"="#b2ebf2")) +
  theme_minimal(base_family="sans") +
  theme(legend.position="none",
        plot.title=element_text(size=14, face="bold", hjust=0.5),
        strip.background=element_rect(fill="#ede7f6", color=NA),
        strip.text=element_text(face="bold", size=9)) +
  labs(title="Distribución de Variables de Volumen Económico",
       x="Valor", y="Frecuencia",
       caption="Fuente: Elaboración propia con base en DatosEcon.xlsx")

En los siguientes gráficos de distribución de variables de volumen económico, presentan distribuciones altamente asimétricas hacia la derecha, particularmente todos los indicadores que se observan está concentrada en valores relativamente bajos, mientras que un grupo muy reducido registra magnitudes considerablemente superiores.

En la gráfica de PIB muestra la mayor dispersión dentro del conjunto de variables analizadas reflejando diferencias entre la economía de gran tamaño y países con menor capacidad productiva, siendo esta una situación que se observa en variables como exportaciones, importaciones, comercio total e inversión capital.

Por otro lado, el consumo hogares y gasto público presentan patrones similares, indicando que las diferencias en el tamaño de los mercados son clave para explicar la heterogeneidad observada entre los países estudiados en la base de datos.

No obstante, las exportaciones neta muestran una distribución más concentrada alrededor del cero sugiriendo que la mayoría de la economía se mantiene en balances comerciales relativamente equilibrados, pero la presencia de observaciones extremas que se observan que algunos países presentan un déficit comercial significativamente mayores que el promedio observado.

Siendo así, la elevada asimetría que se observa en estas variables, se llega a confirmar la coexistencia de economías con escala productiva, de la cual está constituyente una fuente de variabilidad dentro del conjunto de datos.

3.7 Crecimiento economico por país

library(readxl)
library(dplyr)
library(ggplot2)
library(plotly)
DatosEcon <- read_excel("DatosEcon.xlsx")
data <- DatosEcon %>%
  select(Pais, x25, x10, x22, x17, x20, x24, x4, x16, x12, x14, x7, x6, x8, x13, x21) %>%
  column_to_rownames("Pais") %>%
  rename(
    Deflactor_PIB             = x25,
    PIB                       = x10,
    Crecimiento_publico       = x22,
    Crecimiento_economico     = x17,
    Crecimiento_inversion     = x20,
    Precio_importaciones      = x24,
    Comercio_total            = x4,
    Crecimiento_importaciones = x16,
    Inversion_capital         = x12,
    Exportaciones             = x14,
    Consumo_hogares           = x7,
    Gasto_publico             = x6,
    Exportaciones_netas       = x8,
    Importaciones             = x13,
    Crecimiento_privado       = x21
  )
data1 <- data %>%
  rownames_to_column("Pais") %>%
  arrange(Crecimiento_economico)
grafico <- ggplot(data1, aes(x=Crecimiento_economico,
                              y=reorder(Pais, Crecimiento_economico),
                              fill=Crecimiento_economico,
                              text=paste("País:", Pais,
                                         "<br>Crecimiento:", round(Crecimiento_economico, 2), "%"))) +
  geom_bar(stat="identity", alpha=0.85) +
  scale_fill_gradient2(low="#f8bbd0", mid="#ede7f6", high="#b39ddb", midpoint=0) +
  theme_minimal(base_family="sans") +
  theme(legend.position="none",
        plot.title=element_text(size=14, face="bold", hjust=0.5),
        axis.text.y=element_text(size=9),
        axis.text.x=element_text(size=9),
        panel.grid.major.y=element_blank()) +
  labs(title="Crecimiento Económico por País",
       x="Crecimiento (%)", y="",
       caption="Fuente: Elaboración propia con base en DatosEcon.xlsx")
ggplotly(grafico, tooltip="text")

Siendo el crecimiento económico, uno de los indicadores más importantes para evaluar el desempeño de una economía, en el siguiente gráfico se muestran diferencias significativas entre los países analizados con ayuda de la base de datos.

Siendo Irlanda, un país que registra la tasa de crecimiento más elevada de un 13.43% siendo esta una economía de mayor dinamismo, dentro del conjunto con un resultado el cual puede asociarse a una fuerte integración internacional

Siguiendo las posiciones corresponden, Perú, Chile, Türkiye y Colombia, siendo estos unos países que cuentan con una tasa superior al 10% sugiriendo que estos tienen procesos de expansión económica más acelerados de los observados en muchas economías

Por otro lado países como Japón, Alemania, Finlandia y República eslovaca presentan niveles más bajos de crecimiento económico, donde Japón ocupa la última posición con una tasa de crecimiento del 1.64%, resultados los cuales reflejan un comportamiento de economías maduras donde la expansión suele ser más moderada debido a factores como la estabilidad demográfica o saturación de mercados, los cuales cuentan con menores oportunidades de crecimiento.

Este gráfico muestra una clara heterogeneidad en ritmos de crecimiento entre los países estudiados, constituyendo una evidencia preliminar donde se observa diferencias estructurales entre las economías, lo cual respalda la aplicación posterior del análisis de componentes.

3.8 PIB y balanza Comercial por País

library(readxl)
library(dplyr)
library(ggplot2)
library(plotly)
library(tibble)
DatosEcon <- read_excel("DatosEcon.xlsx")
data <- DatosEcon %>%
  select(Pais, x25, x10, x22, x17, x20, x24, x4, x16, x12, x14, x7, x6, x8, x13, x21) %>%
  column_to_rownames("Pais") %>%
  rename(
    Deflactor_PIB             = x25,
    PIB                       = x10,
    Crecimiento_publico       = x22,
    Crecimiento_economico     = x17,
    Crecimiento_inversion     = x20,
    Precio_importaciones      = x24,
    Comercio_total            = x4,
    Crecimiento_importaciones = x16,
    Inversion_capital         = x12,
    Exportaciones             = x14,
    Consumo_hogares           = x7,
    Gasto_publico             = x6,
    Exportaciones_netas       = x8,
    Importaciones             = x13,
    Crecimiento_privado       = x21
  )
data1 <- data %>%
  rownames_to_column("Pais") %>%
  mutate(Tipo=ifelse(Exportaciones_netas >= 0, "Superávit", "Déficit"))

grafico <- ggplot(data1, aes(x=reorder(Pais, Exportaciones_netas), y=Exportaciones_netas,
                              color=Tipo,
                              text=paste("País:", Pais,
                                         "<br>Exp. Netas:", round(Exportaciones_netas, 4),
                                         "<br>Balance:", Tipo))) +
  geom_segment(aes(xend=reorder(Pais, Exportaciones_netas), y=0, yend=Exportaciones_netas),
               linewidth=0.8, alpha=0.6) +
  geom_point(size=3, alpha=0.9) +
  geom_hline(yintercept=0, linetype="dashed", color="gray50", linewidth=0.8) +
  scale_color_manual(values=c("Superávit"="#b39ddb", "Déficit"="#f8bbd0")) +
  coord_flip() +
  theme_minimal(base_family="sans") +
  theme(legend.position="top",
        legend.title=element_blank(),
        plot.title=element_text(size=14, face="bold", hjust=0.5),
        axis.text.y=element_text(size=8),
        panel.grid.major.y=element_blank()) +
  labs(title="Balanza Comercial por País",
       subtitle="Exportaciones Netas: Superávit vs Déficit",
       x="", y="Exportaciones Netas",
       caption="Fuente: Elaboración propia con base en DatosEcon.xlsx")

ggplotly(grafico, tooltip="text")

En el siguiente gráfico de balanza comercial por por país, representada mediante las exportaciones netas, las cuales permiten identificar qué países registran, superávit o déficit, donde se puede observar que la mayoría de las economías se concentran cerca del equilibrio comercial, mientras que algunos países presentan posiciones significativamente más extremas.

Un país de ellos es Irlanda, destacado ampliamente como el de economía con mayor superávit alcanzando un valor cercano a 0.28,contando con una mayor diferencia con respecto al resto de los países sugiriendo que este tiene una fuerte orientación de exportadora y una elevada competitividad en los mercados internacionales, siguiéndole a este sigue Türkiye, Suiza y Croacia, los cuales también presentan un saldo comercial positivos un poco altos, aunque inferiores al caso de Irlanda.

Por otro lado, en el extremo opuesto se observan países con déficit relativamente elevados como lo es Chile, registrando una muestra de -0.09 seguido a esta por Nueva Zelanda, Colombia y República Checa sugiriendo estos resultados tienen una mayor dependencia de bienes importados y con una menor capacidad de exportar.

Por último, la distribución observada en el gráfico evidencia que los países analizados presentan algunas estrategias de inserción internacional, mientras que algunas economías se caracterizan por tener una fuerte orientación exportadora.

4. Desarrollo

4.1 Analisís de componentes principales (ACP)

En el gráfico de sedimentación (Scree-plot) muestra cuanta variación captura cada factor de las variables estudiadas.Los factores se ordenan de mayor a menor de acuerdo a la cantidad de variación que abarcan:la dim1 captura la mayor variación, la dim2 la segunda mayor, y así sucesivamente. En el eje horizontal se representan los factores o dimensiones, y en el eje vertical, el porcentaje de varianza explicada por cada uno.

factores <- prcomp(data, scale = TRUE)
factores_grafico<-fviz_eig(factores,
                           addlabels=TRUE,
                           barfill="#b39ddb",
                           barcolor= "#b39ddb",
                           linecolor= "gray50"
                           )
ggplotly(factores_grafico)#Gráfica del codo

Como se evidencia en el gráfico, la dim1 explica el 39.2% de la varianza total, mientras que la dim2 abarca alrededor 22.4% y por otro lado, la dim3 explica aproximadamente el 11.8%. En conjunto, estas 3 dimensiones concrentran el 73.4% de la varianza acumulada, lo cual indica que gran parte de la información contenida en las 15 variables originales puede resumirse adecuadamente en solo tres dimensiones.

Adicionalmente, se muestra que a partir de la dim4, el comportamiento del porcentaje de varianza empieza a disminuir , formando el caracteristico “punto de codo”. Este comportamiente indica que añadir más dimensiones al estudio, no aportaria información relevante adicional y se consideraria como ruido.

A partir de la gráfica del codo es posible concluir que las tres dimensiones escogidas son suficientes para representar la estructura subyacente de los datos, permitiendo una reducción dimensional óptima sin una pérdida significativa de información.

fviz_pca_var(factores,
             col.var = "contrib", # Color by contributions to the PC
             gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
             repel = TRUE,
             axes = c(1,2),
             title = "Variables - dim1 vs dim2"
)  #Grafica de los factores 1,2

El gráfico del circulo de correlaciones se construye a partir del analisís de componente principales, y se presenta como un recurso visual para identificar que variables contribuyen más información a la dimensión, de acuerdo al color, longitud y proximidad al eje correspondiente.En el caso del gráfico entre la dimensión 1 y la dimensión 2, observamos que las variables de PIB, Inversión_capital, Gasto_público,Importaciones, Exportaciones y Consumo_hogares son las que más contribuyen a la formación de la dimensón 1, ya que las flechas que corresponden a las variables presentan tonalidades rojas y se encuentran más cerca del eje horizontal.Adicionalmente, estas variables presentan una correlación positiva, evidenciada por el hecho de que las flechas se dirigen a la misma dirreción, lo que sugiere que los países con mayor PIB tienden simultáneamente a registrar mayores niveles de inversión, gasto público, importaciones y exportaciones

Por otro lado, la dimensión 2, es construida principalmente por las variables de Crecimiento_inversión, Crecimiento_importaciones y Crecimiento_privado, ya que estas presentan tonalidades amarillas y se encuentran más cercanas al eje vertical. Al igual que las variables de la dimensión 1, estas presentan una correlación positiva, debido a que si dirigen en la misma dirreción, lo que indica que los países con mayor Crecimiento_inversión tienden a tener un mayor creimiento privado y de importaciones.

fviz_pca_var(factores,
             col.var = "contrib", # Color by contributions to the PC
             gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
             repel = TRUE,
             axes = c(1,3),
             title = "Variables - dim1 vs dim2"
)  #Grafica de los factores 1,3

A partir del gráfico de las dimensiones 1 y 3, se evidencia que las variables principales en la dimensión 3 corresponden a: Exportaciones_netas, Precio_importaciones y Deflactor_PIB, debido a sus tonalidades amarillas y proximidad al eje vertical. Al igual que las variables de las dimensiones anteriores, presentan una correlacion positiva indica por la dirreción de las flechas, lo que permite concluir que los paises con mayor volumen de Exportaciones_netas presenta valores altos de Deflactor_PIB y Precio_importaciones.

4.1.1 Dimensión 1: Actividad macroeconomica

Las variables principales que contribuyen a la creación de la dimensión 1 son:PIB, Inversión_Capital,Gasto_publico, Importaciones, Exportaciones y Consumo_hogares, debido a que son las variables que logran superar la linea punteada roja que marca el umbral de contribución esperada si todas las variables aportaran igual.

# Contribución de variables a la Dimensión 1
Variables_dim1<-fviz_contrib(factores, choice = "var", axes = 1, top = 10, fill = "#b39ddb", color= "#b39ddb")

ggplotly(Variables_dim1)

Estas seis variables son los componentes fundamentales de la formula para calcular el PIB mediante el metodo del gasto, el cual consiste en sumar todos los gastos finales de los distintos agentes de la economía. Es decir, que se trata de sumar el valor a precio de mercado de todas las compras realizadas de bienes y servicios finales (BBVA,2026). Al identificar la relación obtenida de las seis variables, se decide denominar a la dimensión 1, como: Actividad macroeconomica, ya que de acuerdo con la teoria, la relación de las seis variables mide el PIB, el cual es un indicador macroeconomico fundamental, ya que que cuantifica el volumen de actividad económica de un país.

En este estudio el factor de Actividad macroeconomica actua como un indicador para mostrar el tamaño y la escala de la actividad económica de cada país. Por lo tanto, los países que más contribuyen a explicar este factor son los que presentan PIB elevados, alta inversión en capital, gran volumen de exportaciones e importaciones y un consumo interno significativo.

# Contribución de países a la Dimensión 1
paises_dim1<-fviz_contrib(factores, choice = "ind", axes = 1, top = 10,fill = "#b39ddb", color= "#b39ddb")

ggplotly(paises_dim1)

De acuerdo con el gráfico de la contribución de países, Corea del Sur es el país más sobresaliente, ya que contribuye en aproxidamente un 80% al factor 1, esto es teoricamente acertado, debido a que Corea del Sur es la duodecima economía más grande del mundo por PIB nominal y se encuentra entre las 15 mayores economias de acuerdo con el PIB en paridad de poder adquisitivo. Esto se debe a su liderazgo en innovación tecnologíca y en la industria de semiconductores, a través de empresas como Samsung y SK Hynix, asi como de mantener un mercado laboral estable con cifras de desempleo no mayores a 5%. Adicionalmente,el volumen total de importaciones y exportaciones constantemente lo clasifica como el séptimo mayor exportador y el noveno mayor importador del mundo (COVE, s.f.). En menor medida, Colombia y Japón también contribuyen al factor 1 con aproximadamente 10% y 5% respectivamente.

4.1.2 Dimensión 2: Crecimiento de la economía

La segunda dimensión, se caracteriza por obtener más información de las variables: Crecimiento_inversión, Crecimiento_importaciones, Crecimiento_privado, precio_importaciones, deflactor_PIB, crecimiento_economico y por último, Exportaciones_netas, siendo estas las que superan el umbral de contribución esperado.

# Contribución de variables a la Dimensión 2
Variables_dim2<-fviz_contrib(factores, choice = "var", axes = 2, top = 10,fill = "#b39ddb", color= "#b39ddb")

ggplotly(Variables_dim2)

Para elegir la denominación de la dimesión, se hizó enfasís principalmente en las 3 variables con mayor contribución, las cuales corresponden a tasas de variación de los principales agregados macroeconómicos. Por esta razón, la dimensión se denomina Crecimiento de la Economía, ya que actuá como un indicador para medir que tan rapido cambió la economía de un país, a diferencia de la dimensión 1 que mide el tamaño y escala de la actividad macroeconomica. Por lo tanto, los países que más contribuyen a esta dimensión seran los que presenten mayores tasas de variación en su inversión, consumo privado e importaciones, independientemente de su escala productiva absoluta

# Contribución de países a la Dimensión 2
paises_dim2<-fviz_contrib(factores, choice = "ind", axes = 2, top = 10,fill = "#b39ddb", color= "#b39ddb")

ggplotly(paises_dim2)

De acuerdo con el gráfico de contribución de países, la Dimensión 2 es construida principalmente por siete países que superan el umbral de contribución esperada. De los cuales, Argentina lidera con aproximadamente el 32% de contribución, seguida de Chile con el 13% e Irlanda con el 11%. En menor medida, Perú, Colombia, Japón y Alemania contribuyen con el 7%, 6%, 3% y 3% respectivamente.

A diferencia de la dimensión 1, la dimensión 2 tiene una mayor cantidad de países contribuyentes, los cuales no se caracterizan por ser los más grandes ni por ser economías poderosas, sino por ser los más volatiles, es decir, que sus agregados macroeconómicos cambian de forma más brusca y pronunciada que los del resto.Debido a esto, se evidencia una predominancia de las economías latinoamericanas, ya que de acuerdo con PNUD (2024), las economías de America Latina se caracterizan por tener una alta volatilidad , la cual se asocia con reducciones del crecimiento a largo plazo, disminución del consumo, ahorro e inversión, también afecta la ya baja productividad de la región. Estos factores, pueden conllevar una recesión economica, la cual tiene impactos negativos en la mortalidad infantil, la educación y la pobreza. En otras palabras, esta dimensión está capturando la inestabilidad estructural de las economías emergentes latinoamericanas, no su tamaño ni su nivel de desarrollo.

4.1.3 Dimensión 3: Sector externo

Las cinco variables que más contribuyen a la dimensión 3 y superaron el umbral de contribución esperado son: Exportaciones_netas, Precio_importaciones, Deflactor_PIB, crecimiento_importaciones y crecimiento_economico.

# Contribución de variables a la Dimensión 3
Variables_dim3<- fviz_contrib(factores, choice = "var", axes = 3, top = 10,fill = "#b39ddb", color= "#b39ddb")

ggplotly(Variables_dim3)

Las variables de esta dimensión se caracterizan por reflejar la posición comercial de cada economía frente al exterior y su exposición a los mercados internacionales.Por lo tanto, se denomino, Sector externo y actua como un indicador de la apertura comercial y la sensibilidad de la economía de un país frente a otros. Los países que contribuyen de mayor forma a esta dimensión serán aquellos con mayor dependencia del comercio exterior.

# Contribución de países a la Dimensión 3
paises_dim3<- fviz_contrib(factores, choice = "ind", axes = 3, top = 10,fill = "#b39ddb", color= "#b39ddb")

ggplotly(paises_dim3)

De acuerdo con el gráfico de contribución de países, la Dimensión 3 está dominada por dos países que concentran la mayor parte de su varianza explicada: Irlanda con aproximadamente el 39% e Argentina con el 38%. En menor medida, Türkiye, Chile e India también superan el umbral de contribución esperada con aproximadamente el 5%, 3% y 2.5% respectivamente.

Se conoce que países como, China y Estados Unidos son considerados el primer y segundo pais mayor exportador e importador respectivamente, sin embargo, el comercio internacional solo representa aproximadamente el 37% y 25% de su PIB. Debido a esto, no se evidencia su presencia en el gráfico, en contraste con Irlanda y Argentina, que entre ambos contribuyen alrededor del 80% de la dimensión, esto se debe a que las economías que más dependen del comercio exterior suelen ser países pequeños que deben abrirse al comercio internacional para abastecerse de las materias primas y bienes necesarios.También suelen ser nodos financieros y comerciales o refugios fiscales con un fuerte mercado de intermediación.Un claro ejemplo es Irlanda, cuyo comercio exterior representa el 237% de su PIB, porque este país actúa como sede fiscal y plataforma de reexportación para grandes multinacionales tecnológicas y farmacéuticas, lo que infla sus flujos comerciales más allá de su capacidad productiva real (El Orden Mundial, 2024). En conjunto, esta dimensión no captura el tamaño de la economía ni su velocidad de crecimiento, sino el grado en que su dinámica económica está condicionada por su vínculo con el comercio internacional.

4.2 Clausterización

4.2.1 Número óptimo de clústeres

A continuación se presentan los resultados de la clausterización de los 42 países estudiados, utilizando el metodo jerarquico. Como primer paso, se determino el número óptimo de clústeres mediante el método de la silueta.

data_std<-scale(data)
library(factoextra)
fviz_nbclust(data_std, FUN = hcut, method = "silhouette")

El metodo de la silueta permite estudiar la distancia de separación entre los clústeres resultantes. El gráfico de siluetas muestra la proximidad de cada punto de un clúster a los puntos de los clústeres vecinos, lo que proporciona una forma de evaluar visualmente parámetros como el número de clústeres (Scikit-learn, s.f). El eje horizontal representa el número de clústeres evaluados y el eje vertical el ancho promedio de la silueta, donde valores cercanos a 1 indican una clasificación óptima y valores cercanos a 0 indican que los grupos se solapan.

Como se observa en el gráfico, el valor máximo de la silueta se alcanza en k=2, lo cual indica que una solución de dos grupos produciría la clasificación más compacta y diferenciada estadísticamente.

4.2.1 Dendograma

Un dendrograma es una estructura en forma de árbol que visualiza el proceso de agrupación jerárquica. Cada nivel del árbol representa una operación de fusión o división, y la altura de las ramas representa la distancia (o disimilitud) a la que se unieron los países (DataCamp, 2025).

library(dendextend)
cluster3<- as.data.frame(factores$x[, 1:3])   
dist_paises <- dist(cluster3, method = "euclidean")
modelo_jerarquico <- hclust(dist_paises, method = "ward.D2")
dend_modelo <- as.dendrogram(modelo_jerarquico)
clusters_selec <- 3
dend_modelo %>%
  color_branches(k = clusters_selec) %>%
  set("labels_col", k = clusters_selec) %>%
  set("labels_cex", 0.65) %>%
  plot(main = "Dendrograma (k=3)",
       ylab = "Distancia",
       xlab = "")

clusters <- cutree(modelo_jerarquico, k=clusters_selec)

# Unir base de datos con la nueva variable cluster

datanv <- data.frame(Cluster=clusters, data)

Se evidencia en el dendograma que se determino dividir la muestra de los 42 países en 3 clusteres y no en 2 como lo dice el gráfico de la silueta. Esta decisión se basa principalmente en la inspección visual del dendograma, que indica que un corte en k=3 logra clasificar los países de mejor forma, ya que si se eligieran 2 clusteres, el grupo verde y azul serian uno solo, se perdería información importante para determinar los patrones que tienen las economías emergentes y de la OECD.

Como se observa en el gráfico, se identifica tres grupos claramente diferenciados, representados por tres colores distintos. El primer grupo, en color rojo, está conformado exclusivamente por Corea del Sur, este además se separa del resto de países a una distancia aproximada de 20, lo que nos lleva a concluir que se debe a un caso atípico. El segundo grupo, en color verde, agrupa a la mayoría de los países con economías avanzadas, como Alemania, Francia, Reino Unido, Estados Unidos y Japón, entre otros. Por último, el tercer grupo identificado por su color azul, es construido por Chile, India, Colombia, Argentina, Perú y Sudáfrica, estos corresponden a economías emergentes de America Latina y en caso de India, Asia.

Una vez identificados los tres clusteres mediante el dendrograma, se procede a caracterizar cada uno de ellos a partir de los países que los conforman y su comportamiento en las variables macroeconómicas analizadas, es importante aclarar que los gráficos de cajas en cada cluster presentan los valores estandarizados dentro del propio grupo, lo que significa que el cero representa la media de ese clúster específico y no la media de toda la muestra. Este enfoque permite observar la distribución interna y la dispersión de las variables al interior de cada uno, identificando qué países se alejan del comportamiento típico de su grupo. Por esta razón, los valores y conclusiones obtenidos de los boxplots individuales no deben compararse directamente con los de la tabla de medianas de la sección 4.3, donde la estandarización se realiza sobre los 42 países de la muestra completa, permitiendo contrastar los tres perfiles en una escala común. Ambos análisis son complementario, solo que el primero describe el comportamiento interno de cada grupo y el segundo evidencia las diferencias estructurales entre los tres clústeres.

4.2.3 Cluster 1: Economias Avanzandas

paises_cluster <- data.frame(
  Pais = rownames(data),
  Cluster = as.factor(clusters)
) %>%
  arrange(Cluster, Pais)

# Agregar row.names = FALSE para quitar el índice
paises_cluster %>%
  filter(Cluster == 1) %>%
  kbl(caption = "Países pertenecientes al Clúster 1",
      col.names = c("País", "Clúster"),
      row.names = FALSE) %>%        # ← esto elimina el doble
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
                full_width = FALSE,
                position = "center") %>%
  row_spec(0, background = "#b39ddb", color = "white", bold = TRUE)
Países pertenecientes al Clúster 1
País Clúster
Australia 1
Austria 1
Belgium 1
Brazil 1
Canada 1
Croatia 1
Czech Republic 1
Denmark 1
Estonia 1
Finland 1
France 1
Germany 1
Greece 1
Hungary 1
Iceland 1
Ireland 1
Israel 1
Italy 1
Japan 1
Luxembourg 1
Mexico 1
Netherlands 1
New Zealand 1
Norway 1
Poland 1
Portugal 1
Romania 1
Slovak Republic 1
Slovenia 1
SouthAfrica 1
Spain 1
Sweden 1
Switzerland 1
Türkiye 1
United Kingdom 1
United States 1

El cluster 1 esta conformado por 36 de los 42 países, siendo el más numeroso entre los 3. Como se observa en la tabla, en este grupo predonomina las economías avanzadas pertenicentes a la OECD, entre las cuales se encuentra: Estados Unidos, Alemania, Francia, Reino Unido, Japón, Australia, Canada, entre otros. Así mismo, se encuentra economías emergentes de Europa, como Croacia, Estonia, Hungría, Romania y República Checa, y casos particulares como Sudáfrica, Brasil, México y Türkiye.

library(plotly)

etiquetas <- c(
  x25 = "Deflactor_PIB",
  x10 = "PIB",
  x22 = "Crecimiento_publico",
  x17 = "Crecimiento_economico",
  x20 = "Crecimiento_inversion",
  x24 = "Precio_importaciones",
  x4  = "Comercio_total",
  x16 = "Crecimiento_importaciones",
  x12 = "Inversion_capital",
  x14 = "Exportaciones",
  x7  = "Consumo_hogares",
  x6  = "Gasto_publico",
  x8  = "Exportaciones_netas",
  x13 = "Importaciones",
  x21 = "Crecimiento_privado"
)
datos1 <- datanv %>%
  filter(Cluster == 1) %>%
  pivot_longer(cols = -Cluster, names_to = "Variable", values_to = "Valor") %>%
  mutate(Variable = recode(Variable, !!!etiquetas)) %>%
  group_by(Variable) %>%
  mutate(Valor = as.numeric(scale(Valor))) %>%
  ungroup()

p1 <- ggplot(datos1, aes(x = Variable, y = Valor)) +
  geom_boxplot(fill = "#b39ddb", outlier.colour = "gray40", outlier.size = 1.5,
               width = 0.6) +
  labs(
    title    = "Cluster 1 - Distribucion de variables economicas",
    subtitle = "Valores estandarizados por variable",
    x        = NULL,
    y        = "Valor estandarizado"
  ) +
  theme_minimal(base_size = 11) +
  theme(
    axis.text.x        = element_text(angle = 45, hjust = 1, size = 9),
    axis.text.y        = element_text(size = 9),
    plot.title         = element_text(face = "bold", size = 13),
    plot.subtitle      = element_text(size = 9, color = "gray50"),
    panel.grid.major.x = element_blank(),
    panel.grid.minor   = element_blank(),
    plot.background    = element_rect(fill = "white", color = NA),
    panel.background   = element_rect(fill = "white", color = NA)
  )

ggplotly(p1)

El gráfico de cajas del cluster 1 revela patrones interesantes de este grupo, donde el cero representa la media del propio clúster y no la de toda la muestra. En primer lugar, todas las variables presentan una mediana cercana a cero, lo que indica que la mayoría de países del clúster se comporta de forma similar entre sí.

En segundo lugar, las variables de volumen (Comercio_total, Consumo_hogares, Exportaciones, Importaciones, Gasto_público, Inversión_capital, PIB ) tienen cajas muy compactas cerca de cero pero con valores atípicos altos hacia arriba, estos valores atípicos refleja la presencia de economías grandes, como Estados Unidos, Japón o Alemania, esto se debe a que estas economías presentan volúmenes absolutos de producción, consumo y comercio que superan entre 3 y 6 desviaciones estandar a la media del grupo.

En tercer lugar se observa que las variables de crecimiento (Crecimiento_económico, Crecimiento_inversión, Crecimiento_consumo privado, Crecimiento_gastopúblico y Crecimiento_importaciones) presentan medianas cercanas a cero con dispersión moderada, lo que indica que no todos los países del cluster crecieron igual. En el caso, de crecimiento_importaciones y crecimiento_inversión presentan casos atípicos con valores negativo, evidenciando que algunos países en el cluster experimentaron una contracción o recesión economica, a diferencia de crecimiento_economico, crecimiento_privado y crecimient_publico con casos atipicos con valores positivos, lo que refleja que se presentan países en el cluster que registraron crecimientos superiores a la media del clúster.

Por otro lado, las variables de precio ( Deflactor del PIB y Precio de importaciones) presentan cajas compactas con medianas cercanas a cero y valores atipicos positivos, lo que indica que la mayoría de países del clúster registró presiones inflacionarias similares entre si, con algunos casos puntuales, donde hay países mayor exposición a precios internacionales elevados.

Finalmente, la variable de exportaciones_netas presenta una mediana ligeramente negativa, lo que refleja que dentro del cluster, existen países con una tendencia hacía el déficit comercial, es decir, que son economías con un consumo interno tan elevado que demandan más bienes y servicios de otros países de los que exportan.

library(readxl)
library(dplyr)
library(ggplot2)
library(plotly)
library(tibble)
library(rnaturalearth)
library(sf)
paises_cluster <- data.frame(
  Pais    = rownames(datanv),
  Cluster = factor(clusters)
) %>%
  mutate(Pais = recode(Pais, "Korea" = "South Korea"))

# Mapa base
mundo <- ne_countries(scale = "medium", returnclass = "sf")
mundo_cluster <- mundo %>%
  left_join(paises_cluster, by = c("name" = "Pais"))

# Mapa Cluster 1 
m1 <- ggplot(mundo_cluster) +
  geom_sf(aes(fill = ifelse(Cluster == "1", "En cluster", "Fuera del cluster"),
              text = paste("Pais:", name)),
          color = "white", size = 0.1) +
  scale_fill_manual(values = c("En cluster" = "#90caf9",
                               "Fuera del cluster" = "lightgray"),
                    name = "") +
  theme_void() +
  theme(plot.title      = element_text(size = 14, face = "bold", hjust = 0.5),
        plot.subtitle   = element_text(size = 10, hjust = 0.5),
        legend.position = "bottom") +
  labs(title    = "Cluster 1 - Paises miembros",
       subtitle = "Economias desarrolladas")

ggplotly(m1, tooltip = "text") %>%
  layout(margin = list(t = 60, b = 20, l = 20, r = 20)) %>%
  config(displayModeBar = TRUE, displaylogo = FALSE)

Basados en el gráfico de boxplot, el cluster 1 se denomina Economias Avanzadas, dado que los países que lo conforman sobresalen por su estabilidad y solidez economíca en vez de la velocidad de crecimiento que caracteriza a las economías emergentes. De acuerdo con el Fondo Monetario Internacional (FMI, 2023), la clasificación de economías avanzadas agrupa a países como Australia, Canadá, Francia, Alemania, Japón, Reino Unido y Estados Unidos, la mayoría de los cuales conforman este clúster. Las economías avanzadas generalmente se caracterizan por tener un grado muy significativo de industrialización , un ingreso per cápita más alto y estructuras e instituciones financieras más estables; adicionalmente quienes viven en estos países, también suelen tener acceso a infraestructuras y tecnologías más avanzadas (Liberto,2026).

La coexistencia de economías exportadoras e importadoras netas dentro del grupo refleja la heterogeneidad comercial del clúster. Muchos de los países que presentan déficit comercial cuentan con una demanda interna respaldada por mercados laborales estables y sistemas de bienestar desarrollados, además de economías diversificadas que requieren la importación de materias primas de otros países para la producción de sus bienes de consumo interno y exportación, lo que explica de forma natural su condición de importadores netos.

Asi mismo,la estabilidad que se evidencia en las variables de precio, presentan que estos países cuentan con bancos centrales independientes y respaldos economicos grandes que permiten que no haya una inflación persistente. Cabe señalar que el clúster incluye casos particulares como Brasil, México, Türkiye y Sudáfrica, que según la clasificación del FMI (2023) pertenecen al grupo de economías emergentes, pero que comparten con las economías avanzadas del grupo una estructura macroeconómica suficientemente estable como para ser agrupados junto a ellas.

4.2.3 Cluster 2:Economías emergentes

paises_cluster <- data.frame(
  Pais = rownames(data),
  Cluster = as.factor(clusters)
) %>%
  arrange(Cluster, Pais)

# Agregar row.names = FALSE para quitar el índice
paises_cluster %>%
  filter(Cluster == 2) %>%
  kbl(caption = "Países pertenecientes al Clúster 2",
      col.names = c("País", "Clúster"),
      row.names = FALSE) %>%        # ← esto elimina el doble
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
                full_width = FALSE,
                position = "center") %>%
  row_spec(0, background = "#b39ddb", color = "white", bold = TRUE)
Países pertenecientes al Clúster 2
País Clúster
Argentina 2
Chile 2
Colombia 2
India 2
Peru 2

El Clúster 2 está conformado por cinco países: Argentina, Chile, Colombia, India y Perú. A diferencia del Clúster 1 que agrupa 36 economías predominantemente avanzadas, este grupo recopila en su mayoria a economías emergentes de América Latina y a la India, una de las economías emergentes más grande de Asia. EL hecho, de que estos países esten juntos en un mismo cluster sugiere que tienen patrones macroeconomicos comunes que los diferencia del resto de países.

library(plotly)

datos2 <- datanv %>%
  filter(Cluster == 2) %>%
  pivot_longer(cols = -Cluster, names_to = "Variable", values_to = "Valor") %>%
  mutate(Variable = recode(Variable, !!!etiquetas)) %>%
  group_by(Variable) %>%
  mutate(Valor = as.numeric(scale(Valor))) %>%
  ungroup()

p2 <- ggplot(datos2, aes(x = Variable, y = Valor)) +
  geom_boxplot(fill = "#b39ddb", outlier.colour = "gray40", outlier.size = 1.5,
               width = 0.6) +
  labs(
    title    = "Cluster 2 - Distribucion de variables economicas",
    subtitle = "Valores estandarizados por variable",
    x        = NULL,
    y        = "Valor estandarizado"
  ) +
  theme_minimal(base_size = 11) +
  theme(
    axis.text.x        = element_text(angle = 45, hjust = 1, size = 9),
    axis.text.y        = element_text(size = 9),
    plot.title         = element_text(face = "bold", size = 13),
    plot.subtitle      = element_text(size = 9, color = "gray50"),
    panel.grid.major.x = element_blank(),
    panel.grid.minor   = element_blank(),
    plot.background    = element_rect(fill = "white", color = NA),
    panel.background   = element_rect(fill = "white", color = NA)
  )

ggplotly(p2)

El gráfico de cajas del Clúster 2 revela un perfil macroeconómico distinto al del Clúster 1, caracterizado por una mayor dispersión en prácticamente todas las variables.Recordando que los valores están estandarizados dentro del propio grupo, el cero representa la media del clúster y no la de toda la muestra.

Las variables de volumen: Comercio_total, Consumo_hogares, Exportaciones, Importaciones, Gasto_público, Inversión_capital, PIB presentan medianas de -0.42, -0.33, -0.18, -0.27, -0.37, -0.06, -0.28 respectivamente, siendo predominantemente negativas y cercanas a cero con cajas amplias, lo que indica que hay países que tienen volúmenes de actividad económica por debajo del promedio del grupo. Adicionalmente, la variable Exportaciones_netas presenta una caja muy amplia con una mediana positiva de 0.33, lo que evidencia que dentro del grupo coexisten países exportadores netos e importadores netos. Es importante recordar que estas medianas están calculadas dentro del propio grupo, por lo que no implican necesariamente que estos países estén por debajo del promedio de toda la muestra, como se evidenciará en la tabla comparativa de la sección 4.3.

Por otro lado, las variables de crecimiento: Crecimiento_económico (-0.17), Crecimiento_inversión (-0.43), Crecimiento_privado (-0.30), Crecimiento_público (-0.08) presentan cajas más amplias que el Clúster 1, con medianas cercanas a cero y ligeramente negativas, excepto Crecimiento_importaciones (0.05) que es positiva y cercana a cero. Como lo señala el PNUD (2024), esta mayor dispersión refleja la alta volatilidad que caracteriza a estas economías, ya que algunos países registran crecimientos superiores al promedio del grupo pero otros experimentan contracciones.

Finalmente, las variables de precios (Deflactor_PIB y Precio_importaciones) presentan medianas iguales de -0.44 pero con cajas amplias y valores atípicos positivos, lo que indica que si bien la mayoría de los países muestran una inflación más variable e inestable en comparación con el Clúster 1, l registra niveles de precios por debajo de la media interna del clúster, existe una alta variabilidad entre ellos, con algunos casos que superan considerablemente ese promedio, reflejando una menor capacidad para controlar los movimientos de precios tanto internos como externos en comparación con el Clúster 1.

# Mapa Cluster 2
m2 <- ggplot(mundo_cluster) +
  geom_sf(aes(fill = ifelse(Cluster == "2", "En cluster", "Fuera del cluster"),
              text = paste("Pais:", name)),
          color = "white", size = 0.1) +
  scale_fill_manual(values = c("En cluster" = "#ef9a9a",
                               "Fuera del cluster" = "lightgray"),
                    name = "") +
  theme_void() +
  theme(plot.title      = element_text(size = 14, face = "bold", hjust = 0.5),
        plot.subtitle   = element_text(size = 10, hjust = 0.5),
        legend.position = "bottom") +
  labs(title    = "Cluster 2 - Paises miembros",
       subtitle = "Economias emergentes")

ggplotly(m2, tooltip = "text") %>%
  layout(margin = list(t = 60, b = 20, l = 20, r = 20)) %>%
  config(displayModeBar = TRUE, displaylogo = FALSE)

De acuerdo con el gráfico de boxplot, se designó el nombre de Economías Emergentes al Clúster 2, dado que los países que lo conforman poseen una alta volatilidad yy una mayor dispersión en sus variables macroeconómicas en comparación con el Clúster 1.Las economías emergentes se caracterizan por estar en procesos de industrialización y desarrollo institucional, con mercados financieros en consolidación y mayor exposición a choques externos, debido a que los países con este tipo de economía son naciones que están invirtiendo en mayor capacidad productiva, pasando de economías tradicionales basadas en agricultura y exportación de materias primas hacia economías más industrializadas y con sectores de manufactura y servicios en expansión (Investopedia, 2025).

La amplia dispersión que se observa en las variables de crecimiento muestra que hay países que registran crecimientos superiores a la media del grupo pero otros experimentan contracciones, evidenciando la inestabilidad estructural que el Programa de las Naciones Unidas para el Desarrollo asocia con las economías de América Latina y en general de las emergentes (PNUD, 2024). Por otro lado, las variables de precio reflejan una menor capacidad para controlar la inflación, siendo un rasgo típico de economías aún en desarrollo.

4.2.3 Cluster 3:Economía de alto rendimiento

paises_cluster <- data.frame(
  Pais = rownames(data),
  Cluster = as.factor(clusters)
) %>%
  arrange(Cluster, Pais)

# Agregar row.names = FALSE para quitar el índice
paises_cluster %>%
  filter(Cluster == 3) %>%
  kbl(caption = "Países pertenecientes al Clúster 3",
      col.names = c("País", "Clúster"),
      row.names = FALSE) %>%        # ← esto elimina el doble
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
                full_width = FALSE,
                position = "center") %>%
  row_spec(0, background = "#b39ddb", color = "white", bold = TRUE)
Países pertenecientes al Clúster 3
País Clúster
Korea 3

El Clúster 3 está conformado unicamente por Corea del sur, ya que como se evidenció en el dendograma,Corea se separa del resto de países a una distancia de aproximadamente de 20, lo que confirma su condición como un caso atípico estructural dentro del estudio.

# Cluster 3 1pais
data_std <- as.data.frame(scale(data))

datos3 <- data_std %>%
  filter(rownames(data_std) == "Korea") %>%
  pivot_longer(cols = everything(), 
               names_to = "Variable", 
               values_to = "Valor") %>%
  mutate(Variable = recode(Variable, !!!etiquetas))

p3 <- ggplot(datos3, aes(x = Variable, y = Valor)) +
  geom_col(fill = "#f8bbd0", width = 0.7) +
  labs(
    title    = "Cluster 3 - Korea",
    subtitle = "Valores estandarizados",
    x        = NULL,
    y        = "Valor estandarizado"
  ) +
  theme_minimal(base_size = 11) +
  theme(
    axis.text.x        = element_text(angle = 45, hjust = 1, size = 9),
    axis.text.y        = element_text(size = 9),
    plot.title         = element_text(face = "bold", size = 13),
    plot.subtitle      = element_text(size = 9, color = "gray50"),
    panel.grid.major.x = element_blank(),
    panel.grid.minor   = element_blank(),
    plot.background    = element_rect(fill = "white", color = NA),
    panel.background   = element_rect(fill = "white", color = NA)
  )
ggplotly(p3)

El gráfico de barras de Corea del Sur revela un perfil macroeconómico singular dentro de la muestra. Las variables se pueden analizar en dos grupos claramente diferenciados.

En primer lugar, las variables de volumen: Exportaciones (6.3), Importaciones (6.0), Inversión_capital (6.0), PIB (5.5), Gasto_público (5.5) y Consumo_hogares (4.9), presentan valores entre 5 y 6 desviaciones estándar por encima del promedio de la muestra, lo que indica que Corea del Sur tiene una escala de actividad económica muy superior al resto de países analizados, por lo tanto, no tiene un patrón similar con ninguno de los otros clausteres. Este comportamiento puede ser explicado por posición como una de las economías más grandes e industrializadas del mundo, sustentada en su liderazgo en sectores de alto valor agregado como los semiconductores, la electrónica y la industria automotriz (COVE, s.f.).

En segundo lugar, las variables de crecimiento, Crecimiento_económico, Crecimiento_inversión, Crecimiento_privado, Crecimiento_importaciones y Crecimiento_ público, presentan valores cercanos a cero o ligeramente negativos, lo que indica que Corea no se diferencia del resto de países en su velocidad de crecimiento sino en su tamaño economico. Es decir, que corea tiene una economía más grande y consolidad que el resto de países, independimiente de su ritmo de crecimiento.

Estos dos comportamientos confirman que Corea del Sur es un caso atípico en la muestra, ya que es una economía que no encaja en ningún perfil presentando por los cluster, sino más bien es una categoría propia dentro del sistema economico internacional.

El cluster 3 se denomina Economía de alto rendimiento ,dado que Corea del Sur representa un caso singular dentro de la muestra, distinguiéndose no por su velocidad de crecimiento sino por la extraordinaria escala de su actividad económica. Las variables de volumen como exportaciones, importaciones, inversión en capital, PIB, gasto público y consumo de hogares, presentan valores entre 5 y 6 desviaciones estándar por encima del promedio de la muestra, lo que confirma que Corea del Sur opera a una escala productiva significativamente superior al resto de los países analizados. Este comportamiento es consistente con su posición como una de las economías más industrializadas del mundo, sustentada en sectores de alto valor agregado como los semiconductores, la electrónica y la industria automotriz, a través de empresas como Samsung y SK Hynix (COVE, s.f.) Por otro lado, las variables de crecimiento presentan valores cercanos a cero, indicando que Corea no se diferencia del resto de países en su ritmo de expansión sino en el tamaño consolidado de su economía, lo que confirma su condición de caso atípico estructural dentro del estudio y justifica su clasificación como un clúster independiente.

4.3 Comparación de clusteres

Una vez caracterizados los tres clusteres de forma individual, se procede a realizar una comparación global que permita identificar las diferencias estructurales entre los perfiles económicos encontrados. El metodo jerárquico permitió clasificar los 42 países de la muestra en tres clusteres diferenciados: el primero, denominado Economía Avanzada, agrupa a 36 países con estructuras macroeconómicas maduras y estables; el segundo, denominado Economía Emergente, reúne a cinco países, que son: Argentina, Chile, Colombia, India y Perú, caracterizados por una mayor volatilidad e inestabilidad macroeconómica; y el tercero, denominado Economía de Alto Rendimiento, conformado exclusivamente por Corea del Sur, cuya escala de actividad económica supera entre 5 y 6 desviaciones estándar al promedio de la muestra.

library(kableExtra)
data_std <- as.data.frame(scale(data))
data_std$Cluster <- as.factor(clusters)

data_std %>%
  group_by(Cluster) %>%
  summarise(across(everything(), ~ round(mean(.x, na.rm = TRUE), 2))) %>%
  kbl(caption = "Comparación de medias por clúster",
      align = c("c", rep("r", ncol(datanv)-1))) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
                full_width = FALSE,
                font_size = 13,
                position = "center") %>%
  row_spec(0, background = "#b39ddb", color = "white", bold = TRUE)
Comparación de medias por clúster
Cluster Deflactor_PIB PIB Crecimiento_publico Crecimiento_economico Crecimiento_inversion Precio_importaciones Comercio_total Crecimiento_importaciones Inversion_capital Exportaciones Consumo_hogares Gasto_publico Exportaciones_netas Importaciones Crecimiento_privado
1 -0.15 -0.22 -0.16 -0.20 -0.19 -0.15 0.04 -0.25 -0.21 -0.18 -0.23 -0.21 0.11 -0.21 -0.20
2 1.15 0.48 1.04 1.59 1.42 1.13 -0.40 1.90 0.31 0.09 0.73 0.41 -0.79 0.28 1.61
3 -0.18 5.51 0.42 -0.79 -0.42 -0.19 0.65 -0.34 5.92 6.21 4.81 5.47 0.10 6.01 -0.74

La tabla de medianas estandarizadas permite comparar el comportamiento de los tres perfiles económicos identificados en una escala común, donde el cero representa el promedio de toda la muestra, los valores positivos indican que el clúster está por encima y los negativos por debajo.

En las variables de volumen (PIB, Exportaciones, Importaciones, Inversión en capital, Gasto público y Consumo de hogares), el cluster 3 lidera con medianas de 5.51 en PIB, 6.21 en Exportaciones, 6.01 en Importaciones, 5.92 en Inversión_capital, 5.47 en Gasto_público y 4.81 en Consumo_hogares, situándose entre 5 y 6 desviaciones estándar por encima del promedio. El Clúster 2 ocupa el segundo lugar con medianas de 0.48 en PIB, 0.31 en Exportaciones, 0.28 en Importaciones, 1.90 en Inversión en capital y 0.73 en Gasto público, todas por encima del promedia pero a nivel moderado. En último lugar, se encuentra el Clúster 1, a pesar de agrupar la mayoría de economías avanzadas, presenta las medianas más bajas en volumen con valores entre -0.15 y -0.25, lo que refleja que al ser un grupo de 36 países, la mediana se ve influenciada por las economías avanzadas pero de tamaño medio , y no por paises como Estados Unidos o Alemania que actuan como datos atípicos.

Sin embargo, cuando observamos las variables de crecimiento, el cluster 2 lidera con medianas de 1.59 en Crecimiento_económico, 1.42 en Crecimiento_inversión, 1.61 en Crecimiento_privado, 1.04 en Crecimiento_ público y valores positivos en Crecimiento de importaciones, todas por encima del promedio.En segundo lugar, se encuentra el Clúster 1, que presenta medianas negativas en todas las variables de crecimiento, con valores de -0.20 en Crecimiento_económico, -0.19 en Crecimiento_inversión, -0.20 en Crecimiento_ privado y -0.16 en Crecimiento_público, lo que indica que la mayoría de sus países creció por debajo del promedio de la muestra. Por último, el Clúster 3 registra los valores más bajos con -0.79 en Crecimiento_ económico y -0.42 en Crecimiento_inversión, confirmando que Corea del Sur, pese a su enorme escala productiva, no destaca por su velocidad de crecimiento. Este patrón revela una relación inversa entre tamaño y dinamismo: las economías más grandes tienden a crecer más lentamente, mientras que las economías emergentes del Clúster 2 compensan su tamaño economico con tasas de crecimiento más elevadas, aunque asociadas a mayor volatilidad estructural, como lo indica eL Programa de las Naciones Unidas para el desarrollo.

En las variables de precios (Deflactor_PIB y Precio_importaciones), el cluster 2 presenta medianas más elevadas con 1.15 y 1.13 respectivamente superando el promedio de la muestra. Por otro lado, el cluster 1, registra mediana de -0.15 en ambas variables y el cluster 3 de -0.18 en deflactor_PIB y -0.19 en Precio_importaciones, ambos por debajo del promedio. Esta diferencia entre los clusteres, indica que el cluster 2 esta más expuesto a inflaciones más intensa que afecta su producción interna y su capacidad de crecimiento.

Finalmente, la variable Exportaciones netas presenta un comportamiento revelador: el Clúster 2 registra la única mediana negativa de los tres grupos con -0.79, confirmando que las economías emergentes son predominantemente importadoras netas, es decir que demandan más bienes del exterior de los que exportan. En contraste, los Clústeres 1 y 3 presentan medianas positivas aunque muy similares entre sí, con 0.11 y 0.10 respectivamente, indicando un balance comercial ligeramente favorable en promedio, aunque con alta dispersión interna especialmente en el Clúster 1 dado el tamaño heterogéneo de las economías que lo conforman.

fviz_cluster(list(data=cluster3, cluster=clusters),
             geom="point",
             ellipse.type="convex",
             palette=c("#b39ddb", "#80cbc4", "#f8bbd0"),
             ggtheme=theme_minimal(),
             main="Clusters en el Plano PCA")

El gráfico de clústeres en el plano PCA representa la distribución de los 42 países en el espacio definido por la Dimensión 1 (Actividad Macroeconómica) y la Dimensión 2 (Crecimiento de la Economía), cada una explicando el 33.3% de la varianza total. Cada punto representa un país y las áreas sombreadas delimitan el espacio que ocupa cada clúster.

Como se observa, los tres clústeres se encuentran claramente separados en el plano, confirmando visualmente la existencia de perfiles económicos diferenciados. El Clúster 1 de Economías Avanzadas ocupa la parte central y derecha del gráfico, con una dispersión considerable a lo largo de la Dimensión 1, reflejando la heterogeneidad en tamaño que existe dentro del grupo, desde economías grandes y medianas pero estables, como Estados Unidos y Estonia respectivamente.

El cluster 2 de economías emergentes, se ubica en la parte izquierda con valores negativos en la dimensión 1 pero positivos en la dimensión 2, evidenciando que estas economías tienen una menor escala de actividad macroeconómica pero un mayor tasa de crecimiento. Por último, el clúster 3 que esta conformado exclusivamente por Corea del Sur aparece como un punto aislado en la parte superior del gráfico, muy alejado del resto de clúster, lo que apoya su condición de caso atípico con valores extremadamente altos en ambas dimensiones.

La separación visual entre los tres clúster confirma que el algoritmo jerárquico logró identificar agrupaciones coherentes y bien diferenciadas, donde cada clúster ocupa una región distinta del espacio factorial.

Los resultados obtenidos permiten responder de forma afirmativa a la pregunta de investigación, ya que sí existen patrones estructurales entre los países de la OCDE y las economías emergentes que hacen posible la identificación de perfiles económicos diferenciados. El análisis de componentes principales logró resumir el 73.4% de la varianza total en tres dimensiones: actividad macroeconómica, crecimiento de la economía y sector externo. A partir de estas dimensiones, la clusterización jerárquica mediante el método Ward identificó tres perfiles claramente separados en el espacio factorial: las Economías Avanzadas, caracterizadas por su solidez y estabilidad estructural; las Economías Emergentes, distinguidas por su dinamismo y volatilidad macroeconómica; y la Economía de Alto Rendimiento, representada por Corea del Sur como caso atípico representando una economía de alto rendimiento.

Esta clasificación es consistente y acertada, teniendo en cuenta la distinción que establece el Fondo Monetario Internacional entre economías avanzadas y economías emergentes (FMI, 2023), lo que respalda institucionalmente los perfiles identificados. En conjunto, los hallazgos evidencian que las diferencias entre los países no son aleatorias, sino que responden a patrones sistemáticos asociados al nivel de desarrollo, la capacidad institucional y el grado de integración comercial de cada economía.

5.Conclusion

Los resultados del análisis responden de manera positiva a la pregunta de investigación, los 42 países analizados no formaron un conjunto uniforme ni tampoco demasiado distinto entre si, por lo contrario, se organizaron en perfiles macroeconómicos bien diferenciados y estadísticamente sustentados por tres dimensiones latentes, derivadas de la reducción de las quince variables originales mediante el Análisis de Componentes Principales, las cuales en conjunto explican el 73.4% de la varianza total. La Dimensión 1, Actividad Macroeconómica, concentró el mayor peso explicativo y agrupó los componentes del PIB por el método del gasto. La Dimensión 2, Crecimiento de la Economía,estuvo dominada por la volatilidad propia de las economías latinoamericanas. La Dimensión 3, Sector Externo, estuvo determinada principalmente por Irlanda y Argentina, cuyo comercio exterior representa una proporción del PIB muy superior al de economías con mayor volumen comercial absoluto como China o Estados Unidos, lo cual confirma que esta dimensión refleja dependencia comercial relativa y no tamaño económico. A partir de estas tres dimensiones, se dividió a los países en tres grupos: el primero, conformado por 36 economías avanzadas y emergentes de Europa, caracterizadas en su mayoría por su estabilidad. El segundo, por 5 economías de América Latina y Asia, que comparten como característica común el dinamismo. El tercero, conformado únicamente por Corea del Sur, cuyo comportamiento resultó muy diferente al resto de los países, resultado de una contribución cercana al 80% a la dimensión 1, a pesar de tener, el crecimiento más bajo de los tres grupos durante el periodo analizado.

Un hallazgo importante del análisis es que existe una relación inversa entre el tamaño de la actividad productiva y la velocidad de crecimiento, es decir, las economías más avanzadas crecieron por debajo del promedio, mientras que las economías emergentes crecieron más rápido. Esto demuestra que tener una economía estable y sólida no es igual a tener una economía que crece rápido. En el caso de Corea del Sur, se le considera un país con alto rendimiento porque tiene una economía fuerte, a pesar de ser, el país con más bajo crecimiento durante el periodo estudiado. A esto se suma que la elección de tres clústeres se apartó del óptimo estadístico (k=2) sugerido por el método de la silueta, decisión que introduce un grado de subjetividad en el resultado final. El clúster mayoritario diluyó diferencias internas entre economías de escala muy distinta, como Estados Unidos y Estonia. El tercer clúster, al estar conformado por un único país, no permite validar su consistencia mediante medidas internas de dispersión. Estas limitaciones son atribuibles principalmente a la composición desigual de la muestra, construida sobre 38 economías de la OCDE frente a solo 8 economías emergentes asociadas, lo que tiende a sesgar la clasificación hacia un grupo numeroso de economías avanzadas como categoría predeterminada.

El modelo logró responder de forma sólida, aunque parcial, al objetivo de la investigación. Por un lado, identificó con respaldo estadístico que existen patrones estructurales sistemáticos, y no aleatorios, entre los países analizados, y que dichos patrones son consistentes con la distinción institucional entre economías avanzadas y emergentes establecida por el Fondo Monetario Internacional. Estos hallazgos constituyen una respuesta concreta y fundamentada a la pregunta de investigación. Por otro lado, la subjetividad en la elección del número de clústeres, la heterogeneidad remanente dentro del grupo mayoritario y la imposibilidad de generalizar un perfil construido a partir de un solo país indican que el modelo no logra alcanzar de forma completa y definitiva la estructura económica mundial. En consecuencia, los resultados deben interpretarse como una estructural útil pero provisional del período estudiado, más que como una estructura generalizable sobre la relación entre tamaño, crecimiento y apertura comercial de las economías.

Recomendaciones

A partir de los hallazgos del modelo surgen dos recomendaciones concretas y una advertencia metodológica. La primera apunta a las economías emergentes de América Latina y Asia: el dinamismo de crecimiento no vale mucho si viene acompañado de inflación alta y déficit comercial, crecer rápido con esas dos condiciones no produce fortaleza estructural produce vulnerabilidad. Las políticas deberían ir primero por ahí. La segunda tiene que ver con cómo se diseña la cooperación internacional. El clúster mayoritario agrupa países que comparten un perfil estadístico, pero no una trayectoria. Brasil, México, Sudáfrica y Türkiye no son equivalentes a las economías consolidadas de la OCDE por el hecho de caer en el mismo grupo, tratar ese clúster como un bloque homogéneo produce recomendaciones que le sirven bien a unos y mal a otros. Queda también una advertencia metodológica: investigaciones futuras deberían trabajar con una muestra más balanceada entre economías avanzadas y emergentes, y usar criterios estadísticos adicionales para resolver la tensión entre k=2 y k=3. Los casos como el de Corea del Sur merecen análisis propio; un país que no encaja bien en ningún clúster no debería quedarse dentro de uno solo para no distorsionar la lectura del resto.

Bibliografia

Centre for Defence and Strategic Studies (COVE). (s.f.). Know Your Region: South Korea Economy. Australian Defence College. https://cove.army.gov.au/article/kyr-south-korea-economy

Programa de las Naciones Unidas para el Desarrollo (PNUD). (2024). Un subibaja: El crecimiento económico en América Latina y el Caribe. https://www.undp.org/es/latin-america/blog/un-subibaja-el-crecimiento-economico-en-america-latina-y-el-caribe Seijas, N. (2025, 20 de abril). Los países con más dependencia del comercio internacional. El Orden Mundial. https://elordenmundial.com/mapas-y-graficos/paises-dependencia-comercio-interncional/ Scikit-learn. (s.f.). Selecting the number of clusters with silhouette analysis on KMeans clustering. https://scikit-learn.org/stable/auto_examples/cluster/plot_kmeans_silhouette_analysis.html Liberto, D. (2026, 1 de mayo). Advanced economies. Investopedia. https://www.investopedia.com/terms/a/advanced-economies.asp

Investopedia. (2025, 18 de septiembre). Emerging market economy. https://www.investopedia.com/terms/e/emergingmarketeconomy.asp

Fondo Monetario Internacional. (2023). Country composition of WEO groups. https://www.imf.org/en/publications/weo/weo-database/2023/april/groups-and-aggregates