1. Introducción

La Organización para la Cooperación y el Desarrollo Económicos (OECD, por sus siglas en inglés) es un organismo internacional que promueve políticas orientadas al crecimiento económico sostenible, la estabilidad financiera y la mejora de las condiciones de vida de la población. A través de sus sistemas de información estadística, la OECD recopila y publica indicadores económicos comparables entre países, constituyendo una de las principales fuentes de información para el análisis económico internacional.

En un contexto caracterizado por la creciente integración de los mercados y la interdependencia económica entre países, resulta relevante identificar patrones comunes y diferencias estructurales entre las economías. Variables relacionadas con el producto interno bruto, el comercio internacional, la inversión y la balanza de pagos permiten describir aspectos fundamentales del desempeño económico de cada nación y facilitan la comparación entre ellas.

Sin embargo, el análisis simultáneo de múltiples indicadores económicos puede resultar complejo debido a la existencia de relaciones de dependencia y correlación entre las variables. En consecuencia, se hace necesario el uso de técnicas estadísticas multivariadas que permitan sintetizar la información y revelar estructuras subyacentes en los datos.

El presente estudio tiene como objetivo segmentar los países incluidos en la base de datos de la OECD a partir de un conjunto de indicadores macroeconómicos seleccionados. Para ello se emplean técnicas de reducción de dimensionalidad y análisis de conglomerados, con el fin de identificar grupos de países que presenten características económicas similares. Los resultados obtenidos permiten reconocer perfiles económicos diferenciados y aportar una visión más estructurada de las relaciones existentes entre las economías analizadas.

2. Metodologia

En este estudio se empleó un conjunto de datos conformado por 15 variables macroeconómicas provenientes de la OCDE, las cuales describen el comportamiento del sector externo, la demanda agregada, la inversión y el crecimiento económico. Estas variables fueron observadas para un total de 42 países, lo que permite realizar un análisis comparativo internacional y la identificación de patrones económicos mediante técnicas multivariadas

2.2 Descripción de las variables

A continuación se describen las variables económicas utilizadas en el análisis, todas provenientes de las cuentas nacionales de la OECD, la Organización para la Cooperación y el Desarrollo Económicos (OCDE) es una organización internacional que trabaja para diseñar mejores políticas que contribuyan a mejorar la calidad de vida (OECD, n.d.). Estas variables permiten caracterizar el desempeño macroeconómico de los países.

Current account balance as a percentage of GDP: Esta variable mide el saldo de la cuenta corriente de un país en relación con su Producto Interno Bruto (PIB). Incluye transacciones de bienes, servicios, ingresos primarios y transferencias corrientes con el resto del mundo, permitiendo evaluar la posición externa de la economía y su sostenibilidad frente al comercio internacional.

Goods and services trade, volume in USD: Representa el valor total del comercio internacional de bienes y servicios ajustado por precios constantes. Permite analizar el flujo real de intercambio comercial de una economía con el exterior, eliminando el efecto de la inflación.

Exports of goods and services, volume in USD (national accounts basis): Mide el valor de los bienes y servicios exportados por una economía en términos reales. Esta variable refleja la competitividad internacional y la capacidad de generar ingresos externos.

Government final consumption expenditure, volume: Corresponde al gasto final del gobierno en bienes y servicios, como educación, salud y administración pública, expresado en términos reales. Permite analizar el tamaño e influencia del sector público dentro de la demanda agregada.

Private final consumption expenditure, volume: Representa el gasto de los hogares en bienes y servicios para consumo final. Es uno de los principales componentes del PIB por el lado de la demanda y refleja el comportamiento del consumo privado.

Net exports, contributions to changes in real GDP: Mide la contribución del saldo entre exportaciones e importaciones al crecimiento del PIB real. Permite identificar si el sector externo impulsa o reduce el crecimiento económico.

Gross domestic product, nominal value, market prices: Es el valor total de la producción económica a precios corrientes de mercado. Incluye el efecto de cambios en precios y cantidades, y se utiliza para medir el tamaño de la economía en términos monetarios.

Gross domestic product, volume, market prices: Representa el PIB ajustado por inflación, eliminando el efecto de los cambios en los precios. Es el principal indicador del crecimiento económico real.

Gross domestic product, volume in USD, at constant purchasing power parities: Expresa el PIB en términos de paridad de poder adquisitivo (PPA), permitiendo comparaciones internacionales más precisas al corregir diferencias en niveles de precios entre países.

Gross fixed capital formation, total, volume: Mide la inversión en activos fijos como maquinaria, infraestructura y equipos productivos en términos reales. Es un indicador clave de acumulación de capital y crecimiento futuro.

Exports of goods and services, volume, growth (national accounts basis): Indica la tasa de crecimiento de las exportaciones en términos reales, reflejando la dinámica del sector externo y la competitividad internacional.

Imports of goods and services, volume, growth (national accounts basis): Mide la variación de las importaciones en términos reales, reflejando la demanda interna de bienes y servicios extranjeros.

Gross domestic product, volume, growth: Representa el crecimiento del PIB real y es el principal indicador del desempeño económico de un país.

Gross domestic product, market prices, deflator, growth: Mide la variación general de los precios en la economía, funcionando como un indicador amplio de inflación.

Gross fixed capital formation, total, volume, growth: Refleja el crecimiento de la inversión en activos fijos, permitiendo analizar la dinámica de acumulación de capital en la economía.

2.3 Dimensiones económicas basadas en la literatura

Según Tecnobits (Vidal, 2023), una dimensión económica se entiende como el análisis de los aspectos monetarios y financieros de una sociedad, así como la forma en que se generan, distribuyen y utilizan los recursos económicos.

De acuerdo con la literatura macroeconómica internacional y la estructura de las cuentas nacionales de la OCDE, las variables del estudio pueden organizarse en cinco dimensiones teóricas que permiten interpretar de manera estructurada el desempeño económico de los países. Estas dimensiones no corresponden a los componentes obtenidos en el PCA, sino a una clasificación teórica utilizada para facilitar la interpretación económica de las variables y los resultados posteriores del análisis multivariado.

1. Tamaño de la economía y nivel de producción

Esta dimensión recoge el nivel agregado de actividad económica y la capacidad productiva de un país.

Incluye las siguientes variables: - Gross domestic product, nominal value, market prices (PIB nominal) - Gross domestic product, volume, market prices (PIB real) - Gross domestic product, volume in USD, at constant purchasing power parities (PIB PPA)

Esta dimensión permite comparar el tamaño relativo de las economías y su nivel de desarrollo económico.


2. Demanda interna

Representa el comportamiento del gasto agregado dentro de la economía, tanto público como privado.

Incluye: - Private final consumption expenditure, volume (Consumo privado) - Government final consumption expenditure, volume (Consumo del gobierno)

Según Estudyando (Ricardo, 2025), la demanda interna se define como el gasto total realizado dentro de una economía por los agentes económicos, incluyendo el consumo de los hogares, la inversión y el gasto público.


3. Sector externo y apertura comercial

Agrupa las variables relacionadas con el comercio internacional y la interacción con el resto del mundo.

Incluye: - Goods and services trade, volume in USD (Comercio total) - Exports of goods and services, volume in USD (Exportaciones) - Exports of goods and services, volume, growth (Crecimiento exportaciones) - Imports of goods and services, volume, growth (Crecimiento importaciones) - Net exports, contributions to changes in real GDP (Exportaciones netas) - Current account balance as a percentage of GDP (Cuenta corriente)

Esta dimensión mide el grado de apertura económica, competitividad internacional y posición externa de la economía.


4. Inversión y acumulación de capital

Refleja la capacidad de una economía para expandir su producción futura mediante inversión.

Incluye: - Gross fixed capital formation, total, volume (Inversión total) - Gross fixed capital formation, total, volume, growth (Crecimiento de la inversión)

Esta dimensión es clave para analizar el potencial de crecimiento económico a largo plazo.


5. Dinámica macroeconómica (crecimiento e inflación)

Recoge los cambios en el nivel de actividad económica y estabilidad de precios.

Incluye: - Gross domestic product, volume, growth (Crecimiento del PIB) - Gross domestic product, market prices, deflator, growth (Inflación / deflactor del PIB)

Esta dimensión permite evaluar el ciclo económico y la estabilidad macroeconómica de los países.

2.4 Análisis de Componentes Principales (ACP)

El Análisis de Componentes Principales (ACP) es una técnica estadística multivariada que permite reducir la dimensionalidad del conjunto de datos, transformando las variables originales en nuevas variables denominadas componentes principales. Estas componentes son construidas como combinaciones lineales de las variables originales, de forma que capturan la mayor proporción posible de la varianza total del sistema (KeepCoding, 2025).

Matemáticamente, cada componente principal se define como:

\[ Z_1 = a_{11}X_1 + a_{12}X_2 + \cdots + a_{1p}X_p \]

\[ Z_k = a_{k1}X_1 + a_{k2}X_2 + \cdots + a_{kp}X_p \]

donde: - \(X_1, X_2, \dots, X_p\) representan las variables originales, - \(a_{kj}\) son los coeficientes o cargas factoriales, - \(Z_k\) es la k-ésima componente principal.

El objetivo del ACP es maximizar la varianza explicada bajo la restricción de ortogonalidad entre componentes:

\[ \max Var(Z_1) \quad \text{sujeto a } \|a_1\| = 1 \]

El objetivo es identificar cuántos componentes son necesarios para capturar la mayor parte de la varianza total de los datos—típicamente entre 70-90% según el contexto (OpenWebinars, 2025). Esto permite reducir significativamente la dimensionalidad: en lugar de trabajar con 15 variables potencialmente redundantes, se trabaja con un número reducido de componentes sintéticos que capturan la esencia de la heterogeneidad internacional (Jolliffe, 2002).

2.5 Análisis de Clúster

Posteriormente, se aplicaron técnicas de clustering con el objetivo de agrupar los países según su similitud en las variables macroeconómicas transformadas por el PCA. El análisis de clúster permite identificar estructuras ocultas dentro de los datos, agrupando observaciones homogéneas entre sí y heterogéneas respecto a otros grupos.

Determinación del número óptimo de clústeres

Antes de aplicar los algoritmos de agrupamiento, se evaluó el número adecuado de conglomerados mediante criterios de validación interna. Para ello se emplearon el método del codo, el cual permite identificar una partición que represente adecuadamente la estructura de los datos.

Método del codo

El método del codo consiste en calcular la suma de cuadrados intra-clúster (Within Cluster Sum of Squares, WSS) para diferentes valores de \(K\). A medida que aumenta el número de clústeres, la variabilidad interna disminuye; sin embargo, existe un punto a partir del cual la reducción deja de ser significativa. Dicho punto, conocido como “codo”, se considera una referencia para seleccionar el número óptimo de grupos.

La función objetivo que minimiza el algoritmo K-means es:

\[ WSS = \sum_{k=1}^{K}\sum_{x_i \in C_k} ||x_i-\mu_k||^2 \] donde:

  • \(C_k\) representa el conjunto de observaciones pertenecientes al clúster \(k\).
  • \(\mu_k\) corresponde al centroide del clúster.
  • \(x_i\) representa cada observación.

Una disminución importante del WSS indica una mejor homogeneidad dentro de los grupos.

2.6 Herramienta FactoClass

La clasificación de los países y la exploración de las estructuras de agrupamiento se apoyó en la herramienta FactoClass dentro del entorno estadístico R. Esta herramienta facilita la implementación e interpretación de técnicas de clasificación sobre las coordenadas factoriales obtenidas mediante el Análisis de Componentes Principales (ACP), permitiendo visualizar la formación de grupos y comparar diferentes particiones de los datos.

FactoClass no constituye un método estadístico independiente, sino una herramienta computacional que complementa el análisis multivariado mediante funciones de clasificación, representación gráfica y validación de conglomerados. Su utilización permitió apoyar la selección del número de grupos y facilitar la interpretación económica de los clústeres obtenidos.

3. Filtracion de datos

Antes de la aplicación de las técnicas multivariadas, se realizó un proceso de depuración y filtración de la base de datos.

Datos<- read_excel("~/R/Taller 3/DatosEcon (1).xlsx")
Datos

En primer lugar, se excluyó la variable cualitativa correspondiente al nombre de los países, debido a que los métodos utilizados requieren exclusivamente variables numéricas para su correcta aplicación.

Posteriormente, se verificó la consistencia de las variables cuantitativas, asegurando la ausencia de valores incompatibles para el análisis.

variables <- Datos %>%
  select(
    Pais,
    Cuenta_corriente = x1,
    Comercio_total = x4,
    Exportaciones = x5,
    Consumo_gobierno = x6,
    Consumo_privado = x7,
    Exportaciones_netas = x8,
    PIB_nominal=x9,
    PIB_Real = x10,
    PIB_PPP=x11,
    Inversion = x12,
    Crecimiento_exportaciones = x15,
    Crecimiento_importaciones = x16,
    Crecimiento_PIB = x17,
    Inflacion = x19,
    Crecimiento_inversion = x20,
  )
variables

4. Estadisticas Descriptivas

4.1 Estadísticas descriptivas generales

vars_num <- names(variables)[-1]

variables %>%
  select(all_of(vars_num)) %>%
  psych::describe() %>%
  select(n, mean, sd, min, median, max) %>%
  round(2) %>%
  kable(
    caption = "Estadísticas descriptivas de las 15 variables seleccionadas (OECD)",
    align   = "rrrrrr",
    col.names = c("n", "Media", "Desv. Est.", "Mínimo", "Mediana", "Máximo")
  ) %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE)
Estadísticas descriptivas de las 15 variables seleccionadas (OECD)
n Media Desv. Est. Mínimo Mediana Máximo
Cuenta_corriente 42 1.010000e+00 5.080000e+00 -7.280000e+00 3.600000e-01 1.491000e+01
Comercio_total 42 3.762049e+11 4.947373e+11 8.363996e+09 2.106370e+11 2.751302e+12
Exportaciones 42 3.704357e+11 4.488404e+11 8.082994e+09 2.173976e+11 2.257271e+12
Consumo_gobierno 42 1.615331e+13 5.883308e+13 4.701223e+09 3.209043e+11 3.376846e+14
Consumo_privado 42 5.073561e+13 1.730062e+14 1.310195e+10 1.046384e+12 8.824598e+14
Exportaciones_netas 42 0.000000e+00 5.000000e-02 -9.000000e-02 -1.000000e-02 2.800000e-01
PIB_nominal 42 1.068741e+14 3.699529e+14 3.135620e+10 2.384922e+12 2.071658e+15
PIB_Real 42 9.137015e+13 3.310409e+14 2.601447e+10 1.930567e+12 1.915777e+15
PIB_PPP 42 1.545227e+12 3.230601e+12 1.884749e+10 5.341115e+11 2.052937e+13
Inversion 42 2.366899e+13 9.288766e+13 8.332420e+09 3.753493e+11 5.731436e+14
Crecimiento_exportaciones 42 1.067000e+01 6.890000e+00 -3.590000e+00 1.041000e+01 2.782000e+01
Crecimiento_importaciones 42 1.282000e+01 8.240000e+00 -8.280000e+00 1.312000e+01 3.547000e+01
Crecimiento_PIB 42 6.410000e+00 2.870000e+00 1.640000e+00 5.290000e+00 1.343000e+01
Inflacion 42 6.080000e+00 9.120000e+00 -8.700000e-01 3.070000e+00 5.415000e+01
Crecimiento_inversion 42 7.340000e+00 1.081000e+01 -3.907000e+01 6.600000e+00 3.532000e+01

Las variables de tamaño (PIB nominal y real, comercio, exportaciones, consumo privado, inversión) muestran valores muy altos frente a indicadores de estabilidad (inflación, cuenta corriente, tasas de crecimiento). Esto refleja la presencia de economías muy grandes junto a otras mucho más pequeñas.

Además, en la mayoría de las variables de tamaño, la media supera ampliamente a la mediana, se presenta una distribución sesgada a la derecha. Unos pocos países con economías enormes elevan el promedio, mientras la mayoría se concentra en niveles bajos.Por otro lado, las desviaciones estándar son muy altas en variables de tamaño, lo que confirma la heterogeneidad de la muestra. En cambio, indicadores de crecimiento e inflación muestran distribuciones más equilibradas y menos afectadas por valores extremos.

Los resultados evidencian diferencias estructurales marcadas entre países, lo que justifica aplicar técnicas como Análisis de Componentes Principales (ACP) y clusterización para agrupar economías con perfiles similares y sintetizar la información.

4.2 Distribución de las variables: diagramas de caja

vars_nivel <- c("Comercio_total", "Exportaciones", "Consumo_gobierno",
                 "Consumo_privado", "PIB_nominal", "PIB_Real", "PIB_PPP",
                 "Inversion")

variables %>%
  select(Pais, all_of(vars_nivel)) %>%
  pivot_longer(cols = -Pais, names_to = "variable", values_to = "valor") %>%
  mutate(variable = recode(variable,
    "Comercio_total"   = "Comercio total",
    "Exportaciones"    = "Exportaciones",
    "Consumo_gobierno" = "Consumo gobierno",
    "Consumo_privado"  = "Consumo privado",
    "PIB_nominal"      = "PIB nominal",
    "PIB_Real"         = "PIB real",
    "PIB_PPP"          = "PIB (PPP)",
    "Inversion"        = "Inversión"
  )) %>%
  ggplot(aes(x = variable, y = valor, fill = variable)) +
  geom_boxplot(alpha = 0.7) +
  facet_wrap(~variable, scales = "free", ncol = 2) +
  labs(
    title    = "Distribución de las variables de tamaño económico",
    subtitle = "Comercio, consumo, PIB e inversión (en USD, escala propia por variable)",
    x        = NULL,
    y        = "Valor (USD)"
  ) +
  theme_minimal(base_size = 11) +
  theme(legend.position = "none",
        axis.text.x = element_text(angle = 45, hjust = 1),
        strip.text = element_text(face = "bold"))

vars_tasa <- c("Cuenta_corriente", "Exportaciones_netas",
               "Crecimiento_exportaciones", "Crecimiento_importaciones",
               "Crecimiento_PIB", "Inflacion", "Crecimiento_inversion")

variables %>%
  select(Pais, all_of(vars_tasa)) %>%
  pivot_longer(cols = -Pais, names_to = "variable", values_to = "valor") %>%
  mutate(variable = recode(variable,
    "Cuenta_corriente"          = "Cuenta corriente",
    "Exportaciones_netas"       = "Exportaciones netas",
    "Crecimiento_exportaciones" = "Crec. exportaciones",
    "Crecimiento_importaciones" = "Crec. importaciones",
    "Crecimiento_PIB"           = "Crec. PIB",
    "Inflacion"                 = "Inflación",
    "Crecimiento_inversion"     = "Crec. inversión"
  )) %>%
  ggplot(aes(x = variable, y = valor, fill = variable)) +
  geom_boxplot(alpha = 0.7) +
  geom_hline(yintercept = 0, linetype = "dashed", color = "gray40") +
  coord_flip() +
  labs(
    title    = "Distribución de las variables de crecimiento y equilibrio externo",
    subtitle = "Valores expresados en porcentaje (%)",
    x        = NULL,
    y        = "Porcentaje (%)"
  ) +
  theme_minimal(base_size = 11) +
  theme(legend.position = "none")

Con estos diagramas de caja podemos visualizar con mayor claridad la dispersión y la forma de distribución de las variables seleccionadas, y para facilitar más la interpretación, las variables se dividieron en dos grupos: por un lado, aquellas que representan el tamaño de la economía (expresadas en dólares) y, por otro, las variables asociadas al crecimiento económico y al equilibrio externo (expresadas en porcentajes).

En el primer gráfico se observa una elevada heterogeneidad entre los países cuando se analizan variables de tamaño económico. Aunque se utilizó una escala logarítmica para reducir las diferencias de magnitud porque se hacia ilegible, continúan apareciendo numerosos valores atípicos en indicadores como PIB nominal, PIB real, consumo privado e inversión. Esto nos indica que existen algunos países con economías considerablemente más grandes que el resto de la muestra, mientras que la mayoría se concentra en niveles intermedios o bajos. Este patrón coincide con lo observado en las estadísticas descriptivas y refleja las importantes diferencias estructurales que existen entre las economías analizadas.

También podemos ver que las variables relacionadas con producción, consumo y comercio presentan rangos de los cuartiles relativamente amplios, lo que nos muestra una dispersión importante incluso entre los países que no son considerados extremos. En otras palabras, las diferencias no se limitan únicamente a unas pocas economías muy grandes, sino que están presentes en gran parte de la muestra.

En contraste, el segundo gráfico muestra un comportamiento más homogéneo para las variables expresadas en porcentaje. La mayoría de los países se concentra alrededor de valores moderados de crecimiento e inflación, con cajas más compactas y una menor dispersión general. Sin embargo, siguen apareciendo algunos valores atípicos, especialmente en inflación, crecimiento de las exportaciones, crecimiento de las importaciones y crecimiento de la inversión. Estos casos podrían estar asociados a episodios económicos particulares o a economías que experimentaron cambios significativamente más intensos que el promedio durante el período analizado.

Algo a denotar es que resulta especialmente interesante observar que la cuenta corriente y las exportaciones netas presentan una dispersión relativamente reducida en comparación con las variables de tamaño económico. Esto nos sugiere que aunque los países difieren considerablemente en el tamaño de sus economías, las diferencias en sus balances externos son menos pronunciadas. Desde la perspectiva del análisis multivariado, este resultado indica que las variables de crecimiento y equilibrio externo podrían aportar información complementaria a las variables de tamaño, contribuyendo a identificar perfiles económicos distintos entre los países.

En resumen, ambos gráficos muestran que la muestra combina economías muy diferentes tanto en escala como en desempeño macroeconómico. Estas diferencias constituyen precisamente el tipo de patrones que técnicas como el ACP y la clusterización buscan resumir e identificar, permitiendo posteriormente agrupar países con características económicas similares.

4.3 Forma de la distribución: histogramas

vars_hist <- c("Crecimiento_PIB", "Inflacion", "Cuenta_corriente",
                "Crecimiento_inversion")

variables %>%
  select(all_of(vars_hist)) %>%
  pivot_longer(cols = everything(), names_to = "variable", values_to = "valor") %>%
  mutate(variable = recode(variable,
    "Crecimiento_PIB"       = "Crecimiento del PIB",
    "Inflacion"             = "Inflación",
    "Cuenta_corriente"      = "Cuenta corriente",
    "Crecimiento_inversion" = "Crecimiento de la inversión"
  )) %>%
  ggplot(aes(x = valor)) +
  geom_histogram(bins = 10, fill = "steelblue", color = "white", alpha = 0.85) +
  geom_vline(xintercept = 0, linetype = "dashed", color = "gray30") +
  facet_wrap(~variable, scales = "free", ncol = 2) +
  labs(
    title    = "Distribución de variables clave de crecimiento y equilibrio externo",
    subtitle = "Frecuencia de países según rango de valores (%)",
    x        = "Valor (%)",
    y        = "Número de países"
  ) +
  theme_minimal(base_size = 11)

Con los histogramas podemos observar con mayor detalle la forma de la distribución de cada variable, complementando la información que ya proporcionan los diagramas de caja. Mientras que el boxplot resume la dispersión a través de los cuartiles, el histograma muestra cómo se distribuyen realmente los países a lo largo del rango de valores, lo que permite identificar si la distribución es simétrica, si presenta sesgo hacia algún lado, o si existen agrupaciones particulares de países en ciertos tramos.

En el caso del crecimiento del PIB, se observa una distribución relativamente simétrica y unimodal, con la mayoría de los países concentrados en tasas de crecimiento positivas y moderadas, situadas entre 0% y 10%. Esto nos sugiere que durante el período analizado, buena parte de las economías de la muestra experimentaron un desempeño económico relativamente similar, sin grandes diferencias en su ritmo de expansión.

Por parte del crecimiento de la inversión, nos presenta un comportamiento parecido, aunque con una dispersión algo mayor, pues la mayoría de los países se ubica en valores positivos cercanos a cero, pero aparecen algunos casos con crecimientos negativos marcados y otros con crecimientos considerablemente más altos que el resto. Esto indica que, si bien existe un comportamiento “típico” compartido por la mayoría de los países, también hay economías que experimentaron ajustes mucho más fuertes en su formación de capital, posiblemente asociados a coyunturas económicas particulares.

En cuanto la cuenta corriente, nos muestra una distribución más dispersa y con menor concentración alrededor de un único valor. Los países se reparten de forma relativamente equilibrada entre superávits y déficits moderados, lo que refleja la heterogeneidad en los balances externos de las economías analizadas. A diferencia de las variables de tamaño económico, en este caso no se observa un grupo reducido de países que se aleje drásticamente del resto, sino una variación más gradual a lo largo de toda la muestra.

Finalmente, la inflación es la variable que presenta el comportamiento más asimétrico de las cuatro. La gran mayoría de los países se concentra en tasas de inflación bajas, cercanas a un solo dígito, pero aparece una cola larga hacia la derecha con algunos países que registraron tasas considerablemente más altas, llegando incluso a superar el 50%. Esta asimetría nos puede decir que mientras que la inflación “típica” se mantiene contenida en la mayoría de las economías, unos pocos episodios de inflación elevada generalmente asociados a crisis económicas o desequilibrios estructurales pueden alejarse notablemente del resto de la muestra.

4.4 Ranking de países según el tamaño de la economía (PIB nominal)

variables %>%
  arrange(PIB_PPP) %>%
  mutate(Pais = factor(Pais, levels = Pais)) %>%
  ggplot(aes(x = PIB_PPP, y = Pais)) +
  geom_col(fill = "steelblue", width = 0.7) +
  labs(
    title    = "PIB PPP por país",
    subtitle = "Ordenado de menor a mayor",
    x        = "PIB PPP (USD)",
    y        = NULL
  ) +
  theme_minimal(base_size = 10)

El gráfico de PIB en paridad de poder de compra (PPP) permite comparar de manera más precisa el tamaño real de las economías, ya que elimina las distorsiones presentes en el PIB nominal y refleja mejor la capacidad productiva de cada país. En este contexto, destaca la posición dominante de Estados Unidos, cuyo PIB PPP supera ampliamente al del resto de países, con un valor superior a 2.0×10¹³dólares, lo que genera una brecha tan grande que comprime visualmente las barras de las demás economías. En un segundo nivel se ubican Japón, Alemania, Brasil, Francia y el Reino Unido, que aunque más pequeños que Estados Unidos, sobresalen claramente frente al resto. Posteriormente, Turquía, México, Italia y Corea conforman un grupo de economías medianas, seguidas de un conjunto amplio de países con valores relativamente bajos y similares, entre los que se encuentran los países nórdicos, del este de Europa y algunos latinoamericanos como Colombia, Chile y Perú. En conjunto, el gráfico evidencia una estructura jerárquica marcada en la distribución del tamaño económico de la muestra.

4.5 Ranking de países según el crecimiento del PIB

variables %>%
  arrange(Crecimiento_PIB) %>%
  mutate(Pais = factor(Pais, levels = Pais),
         signo = ifelse(Crecimiento_PIB >= 0, "Positivo", "Negativo")) %>%
  ggplot(aes(x = Crecimiento_PIB, y = Pais, fill = signo)) +
  geom_col(width = 0.7) +
  geom_vline(xintercept = 0, linetype = "dashed", color = "gray30") +
  scale_fill_manual(values = c("Positivo" = "steelblue", "Negativo" = "tomato")) +
  labs(
    title    = "Crecimiento del PIB real por país",
    subtitle = "Ordenado de menor a mayor",
    x        = "Crecimiento del PIB (%)",
    y        = NULL,
    fill     = "Crecimiento"
  ) +
  theme_minimal(base_size = 10) +
  theme(legend.position = "bottom")

El gráfico de crecimiento del PIB real muestra el dinamismo económico de los países analizados y contrasta con el ranking de tamaño económico observado en el PIB PPP, ya que en este caso no son las grandes economías las que lideran, sino principalmente las emergentes o de menor tamaño relativo.

Irlanda encabeza la muestra con la tasa de crecimiento más alta, seguida de Perú, Chile, Turquía, Colombia y Argentina, todas con ritmos de expansión significativamente superiores al resto, lo que refleja el patrón típico de economías en desarrollo que parten de una base productiva menor y tienen mayor margen para crecer. En el extremo opuesto, Japón, Alemania, Finlandia y los países escandinavos registran los crecimientos más bajos, aunque positivos, mostrando la estabilidad característica de las economías desarrolladas y de alto ingreso, con un crecimiento moderado pero menos cambiante.

Un aspecto relevante es que ningún país presenta crecimiento negativo, lo que evidencia que el período corresponde a una fase de expansión generalizada. Finalmente, se observa un grupo intermedio de países de ingreso medio-alto, como Estados Unidos, Francia, Italia, Bélgica, España y Portugal, con tasas de crecimiento entre el 4% y el 6%, lo que sugiere que para este conjunto la variable de crecimiento del PIB tendrá menor capacidad discriminante frente a los países ubicados en los extremos del ranking

4.6 Relación entre tamaño económico y crecimiento

variables %>%
  ggplot(aes(x = PIB_PPP, y = Crecimiento_PIB)) +
  geom_point(color = "steelblue", size = 3, alpha = 0.8) +
  geom_text_repel(aes(label = Pais), size = 3, max.overlaps = 20) +
  geom_hline(yintercept = 0, linetype = "dashed", color = "gray40") +
  scale_x_log10(labels = scales::label_number(scale_cut = scales::cut_short_scale())) +
  labs(
    title    = "Tamaño de la economía vs. crecimiento del PIB",
    subtitle = "PIB PPP en escala logarítmica para facilitar la comparación",
    x        = "PIB PPP (USD, escala log)",
    y        = "Crecimiento del PIB (%)"
  ) +
  theme_minimal(base_size = 11)

El diagrama de dispersión entre el PIB PPP en escala logarítmica y el crecimiento del PIB permite analizar simultáneamente el tamaño de la economía y su dinamismo reciente, mostrando que no existe una relación lineal clara entre ambas variables, ya que los países aparecen distribuidos de manera dispersa. Esto evidencia que tener una economía más grande no implica necesariamente crecer más rápido, ni lo contrario.

En la parte superior del gráfico destacan Irlanda, Perú, Chile, Colombia, Argentina y Türkiye, que, aunque no son las economías más grandes, presentan tasas de crecimiento relativamente altas, en algunos casos superiores al 10%, asociadas a procesos de expansión acelerada o recuperación económica. Irlanda resulta particularmente llamativa porque combina un crecimiento excepcional con un tamaño económico mayor que varias economías latinoamericanas. En contraste, las economías de gran tamaño como Estados Unidos, Japón y Alemania se ubican hacia la derecha del gráfico, pero con tasas de crecimiento moderadas o bajas, lo que refleja las limitaciones estructurales de los países desarrollados para mantener ritmos de expansión elevados.

Asimismo, se observa una concentración de países en una zona intermedia, especialmente economías europeas como Francia, Italia, España, Bélgica, Países Bajos y Polonia, que comparten características de tamaño medio o alto y crecimiento moderado, sugiriendo cierta homogeneidad en sus patrones económicos. En conjunto, el gráfico muestra que el desempeño económico no puede resumirse únicamente por el tamaño ni por el crecimiento, y que la diversidad de perfiles justifica el uso de herramientas como el Análisis de Componentes Principales (ACP), capaces de representar múltiples dimensiones y capturar la heterogeneidad observada.

4.7 Matriz de correlaciones

datos_cor <- variables %>%
  select(all_of(vars_num)) %>%
  cor(use = "complete.obs")

ggcorrplot(datos_cor,
           hc.order = TRUE,
           type     = "lower",
           lab      = TRUE,
           lab_size = 2.8,
           title    = "Matriz de correlaciones entre las 15 variables seleccionadas",
           colors   = c("tomato", "white", "steelblue")) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
## Warning: `aes_string()` was deprecated in ggplot2 3.0.0.
## ℹ Please use tidy evaluation idioms with `aes()`.
## ℹ See also `vignette("ggplot2-in-packages")` for more information.
## ℹ The deprecated feature was likely used in the ggcorrplot package.
##   Please report the issue at <https://github.com/kassambara/ggcorrplot/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Con la matriz de correlaciones podemos confirmar y ser más precisos de forma cuantitativa, las cosas que ya habíamos anticipado visualmente en los gráficos anteriores: las 15 variables seleccionadas no se comportan de manera independiente, sino que se articulan en bloques claramente diferenciados según el tipo de información que capturan.

El bloque más evidente es el de las variables de tamaño económico, conformado por Inversion, Consumo_privado, PIB_nominal, Consumo_gobierno, PIB_Real, PIB_PPP, Comercio_total y Exportaciones. Estas variables presentan correlaciones extremadamente altas entre sí, en varios casos superiores a 0.97 e incluso de 0.99, lo que equivale prácticamente a una relación lineal perfecta. Esto significa que, en términos de información estadística, estas ocho variables están diciendo casi lo mismo: todas reflejan, desde distintos ángulos, el tamaño absoluto de la economía.

Un segundo bloque, más moderado pero que igualmente es visible, agrupa las variables de crecimiento y dinamismo, que son: Crecimiento_PIB, Crecimiento_importaciones, Crecimiento_inversion y, en menor medida, Crecimiento_exportaciones e Inflacion. Las correlaciones dentro de este grupo son positivas y de magnitud media, oscilando aproximadamente entre 0.17 y 0.68, lo que nos indica que los países con mayor crecimiento del PIB tienden también a mostrar mayor crecimiento en importaciones e inversión, algo lógico, que una economía que crece más rápido importa más y atrae más inversión. Sin embargo, estas correlaciones no son tan fuertes como las del bloque anterior, lo que sugiere que cada variable de crecimiento aporta algo de información propia que no está completamente capturada por las demás.

Un resultado contrario lo podemos encontrar con las que tienen correlacion negativa, entre Crecimiento_inversion y Cuenta_corriente (-0.49) y entre Crecimiento_importaciones y Cuenta_corriente (-0.57). Esto tiene una interpretación de que los países que crecen más en inversión e importaciones tienden a deteriorar su balanza de cuenta corriente, ya que una mayor absorción interna de bienes (muchos de ellos importados) presiona negativamente el saldo externo.

Por otra lado, tenemos Cuenta_corriente y Exportaciones_netas, que nos muestran una correlación positiva moderada (0.55), coherente con el hecho de que ambas variables miden dimensiones relacionadas del equilibrio externo de una economía, aunque desde perspectivas distintas.

Para terminar, nos llama la atención que las correlaciones entre los dos bloques (tamaño vs. crecimiento) son en general muy bajas, e incluso levemente negativas en varios casos. Esto confirma estadísticamente lo que ya se observaba en el diagrama de dispersión: el tamaño de una economía y su ritmo de crecimiento son dimensiones prácticamente independientes en esta muestra. Un país puede ser grande y crecer poco (como Japón o Alemania), o ser relativamente pequeño y crecer mucho (como Irlanda o Perú). Esta independencia entre bloques es una condición favorable para el ACP, ya que garantiza que los componentes principales resultantes serán interpretables y no redundantes entre sí.

4.8 Inflación vs Crecimiento del PIB por pais

variables %>%
  select(Pais, Crecimiento_PIB, Inflacion) %>%
  pivot_longer(cols = -Pais, names_to = "variable", values_to = "valor") %>%
  mutate(variable = recode(variable,
    "Crecimiento_PIB" = "Crecimiento del PIB",
    "Inflacion"       = "Inflación"
  )) %>%
  group_by(Pais) %>%
  mutate(orden = valor[variable == "Crecimiento del PIB"]) %>%
  ungroup() %>%
  mutate(Pais = fct_reorder(Pais, orden)) %>%
  ggplot(aes(x = valor, y = Pais, color = variable, shape = variable)) +
  geom_point(size = 3, alpha = 0.85) +
  geom_vline(xintercept = 0, linetype = "dashed", color = "gray40") +
  scale_color_manual(values = c("Crecimiento del PIB" = "steelblue",
                                 "Inflación"           = "tomato")) +
  labs(
    title    = "Crecimiento del PIB e inflación por país",
    subtitle = "Ordenado por crecimiento del PIB de menor a mayor",
    x        = "Valor (%)",
    y        = NULL,
    color    = NULL,
    shape    = NULL
  ) +
  theme_minimal(base_size = 10) +
  theme(legend.position = "top")

El gráfico de crecimiento del PIB e inflación por país permite comparar simultáneamente dos variables que, aunque relacionadas, reflejan fenómenos distintos: el crecimiento económico y el aumento de precios. En la mayoría de los casos, ambos indicadores se concentran en rangos moderados entre 0% y 10%, mostrando un comportamiento relativamente homogéneo. Sin embargo, destacan excepciones importantes como Argentina, que combina un crecimiento moderado con una inflación superior al 40%, lo que evidencia un patrón de expansión poco sostenible. Turquía presenta un comportamiento similar, aunque menos extremo, con crecimiento alto acompañado de inflación elevada. En contraste, Japón, Alemania, Finlandia y los países nórdicos muestran tanto crecimiento como inflación en niveles bajos, reflejando economías maduras con estabilidad de precios y expansión controlada. Por otro lado, países como Irlanda y Perú lideran en crecimiento del PIB mientras mantienen una inflación contenida, lo que sugiere un crecimiento de mejor calidad sustentado en factores estructurales más que en presiones inflacionarias. En conjunto, el gráfico confirma que la relación entre crecimiento e inflación es débil y no sistemática: algunos países crecen mucho con poca inflación, otros poco con inflación alta, y muchos se agrupan en valores intermedios. Esta heterogeneidad refuerza la utilidad del Análisis de Componentes Principales (ACP), ya que ambas variables aportan dimensiones complementarias para entender los perfiles económicos de los países.

4.9 Cuenta corriente por pais

variables %>%
  arrange(Cuenta_corriente) %>%
  mutate(Pais  = factor(Pais, levels = Pais),
         signo = ifelse(Cuenta_corriente >= 0, "Superávit", "Déficit")) %>%
  ggplot(aes(x = Cuenta_corriente, y = Pais)) +
  geom_point(aes(color = signo), size = 3) +
  geom_segment(aes(x = 0, xend = Cuenta_corriente, y = Pais, yend = Pais,
                   color = signo), linewidth = 0.5) +
  geom_vline(xintercept = 0, linetype = "dashed", color = "gray40") +
  scale_color_manual(values = c("Superávit" = "steelblue",
                                 "Déficit"   = "tomato")) +
  labs(
    title    = "Cuenta corriente por país",
    subtitle = "Ordenado de menor a mayor (% del PIB)",
    x        = "Cuenta corriente (% del PIB)",
    y        = NULL,
    color    = NULL
  ) +
  theme_minimal(base_size = 10) +
  theme(legend.position = "top")

El gráfico de cuenta corriente por país resulta especialmente informativo porque permite distinguir de inmediato qué economías registran superávit es decir, generan más de lo que gastan en su intercambio con el resto del mundo y cuáles operan con déficit, dependiendo de financiamiento externo.

La muestra se encuentra casi dividida por la mitad entre países con superávit y déficit, reflejando la heterogeneidad en el equilibrio externo. En el extremo positivo destacan Noruega e Irlanda, con superávits superiores al 10% del PIB, explicados por la exportación de hidrocarburos en el caso noruego y por el efecto de las multinacionales en Irlanda. Les siguen Dinamarca, Alemania, Suiza y Países Bajos, todas economías exportadoras netas con balances externos consistentemente positivos, lo que evidencia una competitividad estructural en sus sectores productivos. En el extremo opuesto, Rumania, Grecia, Chile y Nueva Zelanda presentan déficits superiores al -5% del PIB, asociados a una alta dependencia de importaciones, mientras que Colombia también muestra un déficit relevante vinculado a su perfil de importador de manufacturas y exportador de materias primas. Un grupo intermedio numeroso se concentra alrededor del equilibrio, con valores entre -2% y +2%, como Francia, Austria, Bélgica, Croacia y Canadá, lo que indica balances externos relativamente neutros.

Desde la perspectiva multivariada, este gráfico confirma que la cuenta corriente no depende directamente del tamaño ni del ritmo de crecimiento económico, sino de factores estructurales como la competitividad exportadora, la dependencia energética o la estructura productiva, aportando así una dimensión adicional y complementaria al Análisis de Componentes Principales (ACP).

5. Análisis de componentes principales

Para realizar el Análisis de Componentes Principales (PCA) se utilizó una base de datos conformada por 42 países y 15 variables económicas, las cuales representan diferentes dimensiones del desempeño económico internacional, incluyendo indicadores relacionados con producción, comercio exterior, consumo, inversión y crecimiento económico.

Antes de aplicar el PCA, se filtro la información, excluyendo la variable cualitativa correspondiente al nombre del país, debido a que el método requiere únicamente variables cuantitativas.Posteriormente, se estandarizaron las variables para eliminar diferencias de escala, permitiendo que cada indicador tuviera la misma importancia dentro del análisis.

5.1 Resumen de componentes principales

datos_pca <- variables %>%
  select(-Pais)
res.pca <- prcomp(datos_pca, center=TRUE, scale = TRUE)
summary_pca <- summary(res.pca)$importance
summary_pca <- as.data.frame(summary_pca)
summary_pca <- round(summary_pca,3)

kable(
  summary_pca,
  format = "html",
  caption = "**<b>**Resumen del Análisis de Componentes Principales**</b>**<br><i>**Importancia de las componentes principales**</i>",
  col.names = c(
    "PC1",
    "PC2",
    "PC3",
    "PC4",
    "PC5",
    "PC6",
    "PC7",
    "PC8",
    "PC9",
    "PC10",
    "PC11",
    "PC12",
    "PC13",
    "PC14",
    "PC15"
  )
)%>%
  
kable_styling(
  bootstrap_options = c(
    "striped",
    "hover",
    "condensed"
  ),
  full_width = FALSE,
  position = "center"
)%>%
  
row_spec(0,
         bold = TRUE,
         background = "#7D3324",
         color="white")
Resumen del Análisis de Componentes Principales
Importancia de las componentes principales
PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10 PC11 PC12 PC13 PC14 PC15
Standard deviation 2.236 1.863 1.550 1.273 1.001 0.765 0.657 0.488 0.364 0.252 0.218 0.066 0.03 0.008 0.002
Proportion of Variance 0.333 0.231 0.160 0.108 0.067 0.039 0.029 0.016 0.009 0.004 0.003 0.000 0.00 0.000 0.000
Cumulative Proportion 0.333 0.565 0.725 0.833 0.900 0.939 0.968 0.983 0.992 0.996 1.000 1.000 1.00 1.000 1.000

El análisis permitió transformar las 15 variables originales en nuevas dimensiones denominadas componentes principales, las cuales concentran la mayor parte de la información contenida en los datos.

La primera componente principal (Dimensión 1) explica aproximadamente 33.3% de la variabilidad total, siendo la dimensión con mayor capacidad para representar las diferencias económicas entre los países analizados.

La segunda componente (Dimensión 2) representa aproximadamente 23.1% de la variabilidad, mientras que la tercera componente aporta aproximadamente 16%.

En conjunto, las tres primeras componentes explican alrededor de 72.5 % de la variabilidad total, por lo cual permiten realizar una representación adecuada de la estructura económica de los países reduciendo la información original de 15 variables a tres dimensiones principales.

5.2 Histograma: Porcentaje de varianza explicada

fviz_eig(
  res.pca,
  addlabels = TRUE,
  barfill = "#800020",
  barcolor = "#800020",
  linecolor = "#5A0018"
)

El gráfico de sedimentación muestra una disminución progresiva de la varianza explicada por cada componente. Se observa que las primeras dimensiones concentran la mayor cantidad de información, mientras que después de la tercera componente la contribución individual disminuye considerablemente.

Por esta razón, se seleccionan las tres primeras componentes principales para la interpretación del comportamiento económico de los países, ya que representan la mayor proporción de información conservando una pérdida mínima de variabilidad.

fviz_pca_ind(
  res.pca,
  col.ind = "cos2",
  gradient.cols = c(
    "#4A001F",
    "#800020",
    "#C06C84"
  ),
  repel = TRUE
)

El eje Dim1 (33.3%) y el eje Dim2 (23.1%) representan los dos primeros componentes principales.En conjunto explican alrededor del 56.4% de la variabilidad total de los datos, lo cual es un porcentaje aceptable para visualizar patrones.

El gráfico factorial permite observar la posición relativa de cada país según sus características económicas.Los países ubicados cerca entre sí presentan comportamientos económicos similares, mientras que aquellos alejados presentan diferencias importantes.

El color indica el valor de cos2, que mide qué tan bien está representado cada individuo en el plano de los dos componentes.Los puntos más claros, tienen una mejor representación, es decir, su posición en el gráfico refleja fielmente su relación con las dimensiones, mientras que, los puntos más oscuros están menos representados, lo que significa que necesitaríamos más dimensiones para entenderlos mejor.

fviz_pca_var(
  res.pca,
  col.var = "contrib",
  gradient.cols = c(
    "#4A001F",
    "#800020",
    "#C06C84"
  ),
  repel = TRUE
)

La escala de color “contrib” indica qué variables aportan más a la construcción de los componentes principales.Variables con colores más claros (valores altos de contribución, entre 7–9) son las que más influyen en la separación de los ejes.

Por ejemplo, PIB_Real, PIB_nominal, Consumo_privado,consumo gobierno, Inversión parecen tener una fuerte contribución en Dim1.En cambio, comercio total, exportaciones y Crecimiento_importaciones se asocian más con Dim2.

Este PCA muestra que las variables relacionadas con el PIB y el consumo son las que más explican la variabilidad en el primer eje, mientras que las de crecimiento e inflación lo hacen en el segundo. Esto ayuda a identificar patrones y posibles agrupamientos de economías según tamaño y dinámica.

eig.val <- get_eigenvalue(res.pca)
eig.val%>%
  kable(
    caption = "**Valores propios y porcentaje de varianza explicada**",
    digits = 6,
    align = "c"
  ) %>%
  kable_styling(
    bootstrap_options = c("striped","hover"),
    full_width = FALSE
  )
Valores propios y porcentaje de varianza explicada
eigenvalue variance.percent cumulative.variance.percent
Dim.1 5.001503 33.343355 33.34336
Dim.2 3.469984 23.133224 56.47658
Dim.3 2.402706 16.018037 72.49462
Dim.4 1.621448 10.809656 83.30427
Dim.5 1.001436 6.676243 89.98052
Dim.6 0.585115 3.900770 93.88129
Dim.7 0.431057 2.873715 96.75500
Dim.8 0.237992 1.586612 98.34161
Dim.9 0.132334 0.882223 99.22384
Dim.10 0.063747 0.424983 99.64882
Dim.11 0.047398 0.315988 99.96481
Dim.12 0.004323 0.028820 99.99363
Dim.13 0.000886 0.005909 99.99954
Dim.14 0.000063 0.000422 99.99996
Dim.15 0.000006 0.000042 100.00000

Los resultados que se evidencian en la tabla tienen tendencia a disminuir, a mayor numero de componentes o dimension, menor es el eigen valor y la varianza explicada, constatando así el uso de las 3 primeras componentes pues de ahi en adelante las componentes se vuelven un ruido para el analisis.

** 5.6 Análisis de componentes

** 5.6.1 Por variables**

res.var <- get_pca_var(res.pca)
tabla<-res.var$coord
tabla<-as.data.frame(tabla)
tabla <- tabla[,c(
  "Dim.1",
  "Dim.2",
  "Dim.3"
)]

tabla[,1:3] <- round(tabla[,1:3],3)
kable(
  tabla,
  caption= "**Coordenadas de las variables**",
  align="c"
)%>%
  kable_styling(
  bootstrap_options=c("striped","hover"),
  full_width=FALSE
)
Coordenadas de las variables
Dim.1 Dim.2 Dim.3
Cuenta_corriente -0.008 0.547 -0.527
Comercio_total -0.197 0.733 0.591
Exportaciones -0.217 0.770 0.511
Consumo_gobierno -0.992 -0.052 -0.087
Consumo_privado -0.974 -0.128 -0.061
Exportaciones_netas 0.076 0.532 -0.657
PIB_nominal -0.989 -0.110 -0.071
PIB_Real -0.993 -0.074 -0.082
PIB_PPP -0.155 0.565 0.697
Inversion -0.977 -0.038 -0.092
Crecimiento_exportaciones -0.023 -0.263 -0.257
Crecimiento_importaciones -0.100 -0.750 0.438
Crecimiento_PIB 0.078 -0.387 -0.136
Inflacion 0.112 -0.352 0.085
Crecimiento_inversion 0.063 -0.704 0.531

Dim.1 (33.3% de la varianza):

Aquí destacan con valores muy altos y negativos: PIB_Real (-0.993), PIB_nominal (-0.989), Consumo_gobierno (-0.992), Consumo_privado (-0.974), Inversión (-0.977).

Esto nos muestra que el primer componente representa el tamaño y nivel de actividad interna de la economía.Las economías con mayor PIB e inversión se ubicarían en un extremo de este eje.

Dim.2 (23.1% de la varianza):

Variables con fuerte asociación positiva: Exportaciones (0.770), Comercio_total (0.733), PIB_PPP (0.565), Cuenta_corriente (0.547).Este eje refleja la apertura comercial y el desempeño externo, por tanto, las economías más orientadas al comercio y exportaciones se diferencian aquí.

Dim.3 (16% de la varianza):

Variables con valores altos: PIB_PPP (0.697), Comercio_total (0.591), Exportaciones_netas (-0.657), Crecimiento_inversión (0.531).

Este componente parece capturar la dinámica de crecimiento y balanza externa, mostrando cómo se relacionan las exportaciones netas y la inversión con el desempeño económico.

tabla_contrib <- res.var$contrib[,1:3]

tabla_contrib <- as.data.frame(tabla_contrib)

tabla_contrib <- round(tabla_contrib,3)


kable(
  tabla_contrib,
  caption = "**Contribución de las variables a las tres primeras componentes**",
  align="c"
)%>%
kable_styling(
  bootstrap_options=c("striped","hover"),
  full_width=FALSE
)
Contribución de las variables a las tres primeras componentes
Dim.1 Dim.2 Dim.3
Cuenta_corriente 0.001 8.611 11.557
Comercio_total 0.774 15.479 14.531
Exportaciones 0.938 17.108 10.878
Consumo_gobierno 19.668 0.079 0.317
Consumo_privado 18.975 0.471 0.154
Exportaciones_netas 0.116 8.161 17.967
PIB_nominal 19.570 0.347 0.210
PIB_Real 19.719 0.157 0.277
PIB_PPP 0.482 9.199 20.211
Inversion 19.094 0.041 0.350
Crecimiento_exportaciones 0.010 1.986 2.738
Crecimiento_importaciones 0.201 16.211 7.999
Crecimiento_PIB 0.120 4.306 0.767
Inflacion 0.253 3.573 0.299
Crecimiento_inversion 0.079 14.269 11.744

Los resultados demuestran que las variables que contribuyen en los tres componentes estan asi:

  1. Componente 1: El consumo del gobierno, consumo privado, PIB nominal,PIB real e Inversión son las variables que en conjunto suman una varianza de explicacion en el componente alrededor del 95%.Esto significa que el primer componente está fuertemente determinado por el tamaño de la economía y el gasto interno, reflejando la importancia del producto interno bruto y los niveles de consumo e inversión en la caracterización de los países.

  2. Componente 2: Comercio Total, exportaciones, crecimiento importaciones y crecimiento inversion son las variables que aportan de explicacion alrededor del 62%. Esto indica que la segunda dimensión está asociada principalmente con la dinámica del comercio exterior y la inversión, diferenciando economías según su grado de apertura y el comportamiento de sus flujos comerciales.

  3. componente 3: PIB PPP, exportaciones netascomercio total y crecimiento inversión representan valores significativos en relacion a los otros, acumulando una varianza de aproximadamente 61%. Aquí se observa un eje vinculado a la balanza externa y la capacidad de crecimiento económico, donde las exportaciones netas y el PIB ajustado por paridad de poder adquisitivo juegan un papel central.

tabla_co2 <- res.var$cos2[,1:3]

tabla_co2 <- as.data.frame(tabla_co2)

tabla_co2 <- round(tabla_co2,3)


kable(
  tabla_co2,
  caption = "**Valor de representación (Cos2) para cada variable en cada componente**",
  align="c"
)%>%
kable_styling(
  bootstrap_options=c("striped","hover"),
  full_width=FALSE
)
Valor de representación (Cos2) para cada variable en cada componente
Dim.1 Dim.2 Dim.3
Cuenta_corriente 0.000 0.299 0.278
Comercio_total 0.039 0.537 0.349
Exportaciones 0.047 0.594 0.261
Consumo_gobierno 0.984 0.003 0.008
Consumo_privado 0.949 0.016 0.004
Exportaciones_netas 0.006 0.283 0.432
PIB_nominal 0.979 0.012 0.005
PIB_Real 0.986 0.005 0.007
PIB_PPP 0.024 0.319 0.486
Inversion 0.955 0.001 0.008
Crecimiento_exportaciones 0.001 0.069 0.066
Crecimiento_importaciones 0.010 0.563 0.192
Crecimiento_PIB 0.006 0.149 0.018
Inflacion 0.013 0.124 0.007
Crecimiento_inversion 0.004 0.495 0.282

En esta tabla se observa que las variables que contribuyen en cada componente, tienen un valor de representacion considerable, es decir, para el primer componente las variables importantes en la contribución son aquellas que tienen valores cercanos a 1 demostrando buena representación, lo mismo ocurre para las otras 2 componentes.

5.6.2 Por Paises

res.ind <- get_pca_ind(res.pca)

tabla1 <- as.data.frame(res.ind$coord)

tabla1$Pais <- variables$Pais

tabla1 <- tabla1[,c(
  "Pais",
  "Dim.1",
  "Dim.2",
  "Dim.3"
)]

tabla1[,2:4] <- round(tabla1[,2:4],3)


kable(
 tabla1,
 caption="**Coordenadas de los países en las tres primeras componentes**",
 align="c"
)%>%
  
kable_styling(
 bootstrap_options=c(
 "striped",
 "hover",
 "condensed"
 ),
 full_width=FALSE
)
Coordenadas de los países en las tres primeras componentes
Pais Dim.1 Dim.2 Dim.3
Australia 0.671 0.472 0.080
Austria 0.634 -0.277 -0.013
Belgium 0.591 0.343 -0.152
Canada 0.555 0.677 0.655
Chile -0.625 -3.077 1.678
Colombia -5.550 -3.163 -0.010
Czech Republic 0.591 -0.146 0.012
Denmark 0.680 0.636 -1.051
Estonia 0.733 -1.635 -0.353
Finland 0.712 0.402 -0.684
France 0.429 1.045 0.871
Germany -0.040 3.745 1.702
Greece 0.761 -1.855 0.069
Hungary 0.479 -0.520 -0.429
Iceland 0.695 -1.459 0.147
Ireland 0.764 4.878 -5.486
Israel 0.683 -1.023 -0.390
Italy 0.482 0.226 0.598
Japan -3.307 2.242 0.134
Korea -12.097 0.319 -1.254
Luxembourg 0.717 -0.085 -0.712
Mexico 0.418 0.136 0.832
Netherlands 0.496 1.885 -0.305
New Zealand 0.717 -0.955 0.722
Norway 0.769 1.283 -1.764
Poland 0.577 -0.266 0.116
Portugal 0.705 -0.643 -0.351
Slovak Republic 0.669 -0.189 -0.385
Slovenia 0.751 -1.121 -0.544
Spain 0.523 0.403 -0.105
Sweden 0.619 0.455 -0.561
Switzerland 0.590 1.537 -1.111
Türkiye 0.872 -0.419 -0.980
United Kingdom 0.433 1.548 1.019
United States -0.781 5.266 6.448
Argentina 1.008 -3.212 0.965
Brazil 0.636 -0.477 0.890
Croatia 0.798 -1.038 -1.490
India -0.570 -2.031 1.168
Peru 0.837 -3.182 0.814
Romania 0.683 -0.916 0.127
SouthAfrica 0.689 0.189 -0.919

Las coordenadas representan la ubicación de cada país dentro del espacio factorial generado por el PCA.

Valores positivos indican una relación directa con las variables asociadas a la dimensión correspondiente, mientras que valores negativos representan una relación inversa.Estas coordenadas permiten identificar qué países poseen características similares y cuáles presentan comportamientos económicos diferenciados.

En la dimensión 1 se destaca el país de Korea con un valor negativo (-12.097) lo que indica que korea está fuertemente asociado de manera inversa con las variables que definen la Dimensión 1. Sugiere que su perfil económico se diferencia de los países con altos niveles de PIB e inversión interna.

En la dimensión 2 destaca United States (5.266).Este valor positivo y significativo muestra que Estados unidos tiene una relación directa con las variables que contribuyen a Dimensión 2 Esto implica que el país se caracteriza por un perfil económico alineado con la apertura comercial y el dinamismo de las exportaciones.

En la dimension 3 nuevamente destaca Estados Unidos con un valor positivo (6.448) Esto sugiere que Estados Unidos se posiciona como una economía con fuerte peso en la balanza externa y capacidad de crecimiento.

tabla2 <- as.data.frame(res.ind$contrib)

tabla2$Pais <- variables$Pais

tabla2 <- tabla2[,c(
  "Pais",
  "Dim.1",
  "Dim.2",
  "Dim.3"
)]

tabla2[,2:4] <- round(tabla2[,2:4],3)


kable(
 tabla2,
 caption="**Contribución de los paises en las componetes principales**",
 align="c"
)%>%
  
kable_styling(
 bootstrap_options=c(
 "striped",
 "hover",
 "condensed"
 ),
 full_width=FALSE
)
Contribución de los paises en las componetes principales
Pais Dim.1 Dim.2 Dim.3
Australia 0.215 0.153 0.006
Austria 0.191 0.053 0.000
Belgium 0.166 0.081 0.023
Canada 0.146 0.315 0.425
Chile 0.186 6.497 2.792
Colombia 14.663 6.864 0.000
Czech Republic 0.166 0.015 0.000
Denmark 0.220 0.277 1.095
Estonia 0.256 1.835 0.124
Finland 0.241 0.111 0.463
France 0.087 0.749 0.751
Germany 0.001 9.622 2.870
Greece 0.276 2.360 0.005
Hungary 0.109 0.185 0.182
Iceland 0.230 1.460 0.021
Ireland 0.278 16.324 29.824
Israel 0.222 0.719 0.151
Italy 0.110 0.035 0.355
Japan 5.206 3.448 0.018
Korea 69.664 0.070 1.559
Luxembourg 0.245 0.005 0.502
Mexico 0.083 0.013 0.685
Netherlands 0.117 2.438 0.092
New Zealand 0.245 0.626 0.517
Norway 0.282 1.130 3.082
Poland 0.159 0.048 0.013
Portugal 0.236 0.284 0.122
Slovak Republic 0.213 0.024 0.147
Slovenia 0.269 0.862 0.293
Spain 0.130 0.112 0.011
Sweden 0.183 0.142 0.312
Switzerland 0.166 1.622 1.223
Türkiye 0.362 0.120 0.952
United Kingdom 0.089 1.645 1.028
United States 0.290 19.024 41.206
Argentina 0.483 7.080 0.924
Brazil 0.192 0.156 0.785
Croatia 0.303 0.740 2.199
India 0.155 2.830 1.351
Peru 0.334 6.946 0.657
Romania 0.222 0.576 0.016
SouthAfrica 0.226 0.025 0.838

La tabla muestra cuánto aporta su posición a explicar la variabilidad de los datos en ese componente. En la dimensión 1 se ve a Korea encabezar la lista con (69.664) es el país que más define la variabilidad capturada por el primer componente, lo que lo convierte en un referente clave para entender el eje de “actividad económica interna”.

En la dimensión 2 estan los paises de Estados Unidos(19.024) e Irlanda (16.324). Esto indica que tanto Estados Unidos como Irlanda son países clave para entender la variabilidad en este componente, pues sus perfiles económicos están fuertemente alineados con la apertura comercial y los flujos externos.

En la dimensión 3 destaca nuevamente a Estados Unidos con 41.206 La fuerte contribución de Estados Unidos evidencia que su economía es determinante para explicar las diferencias en este componente, consolidando su papel como referente en la dinámica externa y de crecimiento.

tabla_c2 <- as.data.frame(res.ind$cos2)

tabla_c2$Pais <- variables$Pais

tabla_c2 <- tabla_c2[,c(
  "Pais",
  "Dim.1",
  "Dim.2",
  "Dim.3"
)]

tabla_c2[,2:4] <- round(tabla_c2[,2:4],3)


kable(
 tabla_c2,
 caption="**Valor de representación COS 2 en las 3 componentes principales**",
 align="c"
)%>%
  
kable_styling(
 bootstrap_options=c(
 "striped",
 "hover",
 "condensed"
 ),
 full_width=FALSE
)
Valor de representación COS 2 en las 3 componentes principales
Pais Dim.1 Dim.2 Dim.3
Australia 0.088 0.044 0.001
Austria 0.295 0.056 0.000
Belgium 0.438 0.148 0.029
Canada 0.090 0.134 0.125
Chile 0.020 0.486 0.145
Colombia 0.686 0.223 0.000
Czech Republic 0.104 0.006 0.000
Denmark 0.109 0.096 0.261
Estonia 0.099 0.495 0.023
Finland 0.116 0.037 0.107
France 0.064 0.380 0.264
Germany 0.000 0.673 0.139
Greece 0.069 0.409 0.001
Hungary 0.107 0.126 0.086
Iceland 0.121 0.532 0.005
Ireland 0.008 0.342 0.433
Israel 0.129 0.290 0.042
Italy 0.100 0.022 0.154
Japan 0.613 0.282 0.001
Korea 0.980 0.001 0.011
Luxembourg 0.275 0.004 0.271
Mexico 0.130 0.014 0.513
Netherlands 0.046 0.664 0.017
New Zealand 0.058 0.102 0.059
Norway 0.043 0.121 0.228
Poland 0.282 0.060 0.011
Portugal 0.251 0.209 0.062
Slovak Republic 0.118 0.009 0.039
Slovenia 0.165 0.367 0.086
Spain 0.206 0.122 0.008
Sweden 0.181 0.098 0.149
Switzerland 0.069 0.468 0.244
Türkiye 0.043 0.010 0.055
United Kingdom 0.025 0.324 0.140
United States 0.008 0.360 0.540
Argentina 0.027 0.271 0.024
Brazil 0.145 0.081 0.283
Croatia 0.062 0.104 0.215
India 0.023 0.289 0.096
Peru 0.040 0.575 0.038
Romania 0.107 0.192 0.004
SouthAfrica 0.209 0.016 0.372

La tabla permite visualizar a los paises y la representación que tiene en las componentes principales. Sigue la misma dinamica de la contribución siendo asi que los paises destacados en la tabla anterior, destacan aqui por tener una varianza explicada cercana a 1 tal es el caso de Korea en el primer componente con un valor de cos2 de 0.98.

6. Cluster de Factores

Para determinar el número adecuado de grupos se aplicó el método del codo basado en la suma de cuadrados intra-grupo (WSS). Este método permite identificar el punto donde agregar nuevos grupos deja de representar una mejora significativa en la reducción de la variabilidad interna.

Metodo wss

pca_resultado <- dudi.pca(
  datos_pca,
  scannf = FALSE,
  nf = 3
)
coordenadas <- as.data.frame(pca_resultado$li[,1:3])
fviz_nbclust(
  coordenadas,
  kmeans,
  method = "wss"
)

De acuerdo con el gráfico obtenido, se seleccionaron cuatro grupos debido a que a partir de este número la disminución de la variabilidad interna presenta una reducción menos significativa.

6.1 Formación de grupos

resultado_ACP <- readRDS("resultado_ACP.rds")

A partir de las coordenadas factoriales obtenidas mediante el PCA se realizó una clasificación por conglomerados, con el objetivo de identificar grupos de países con características económicas similares.El análisis permitió identificar 4 grupos principales.

Cabe resaltar que para el desarrollo del análisis de conglomerados se utilizó la función readRDS(), la cual permite cargar en R objetos previamente almacenados en formato .rds. En este caso, se recuperó el objeto resultado_ACP obtenido previamente mediante el Análisis de Componentes Principales (ACP).

tabla_cluster <- resultado_ACP$cluster

kable(
  tabla_cluster,
  caption = "**Clasificación de países según el análisis de conglomerados**",
  align = "c"
)%>%
  
kable_styling(
  bootstrap_options = c(
    "striped",
    "hover",
    "condensed"
  ),
  full_width = FALSE
)%>%
  
row_spec(
  0,
  background = "#800020",
  color = "white",
  bold = TRUE
)
Clasificación de países según el análisis de conglomerados
x
Australia 1
Austria 1
Belgium 1
Canada 1
Chile 2
Colombia 4
Czech Republic 1
Denmark 1
Estonia 2
Finland 1
France 1
Germany 3
Greece 2
Hungary 1
Iceland 2
Ireland 1
Israel 2
Italy 1
Japan 1
Korea 4
Luxembourg 1
Mexico 1
Netherlands 1
New Zealand 2
Norway 1
Poland 1
Portugal 1
Slovak Republic 1
Slovenia 2
Spain 1
Sweden 1
Switzerland 1
Türkiye 1
United Kingdom 1
United States 3
Argentina 2
Brazil 2
Croatia 1
India 2
Peru 2
Romania 2
SouthAfrica 1

La tabla muestra como los 42 paises se clasifican en los 4 clusters. A simple vista se observa gran cantidad de paises contenidos en el cluster 1.

frecuencia_cluster <- as.data.frame(table(resultado_ACP$cluster))

colnames(frecuencia_cluster) <- c("Cluster", "Número de países")

frecuencia_cluster$Porcentaje <- round(
  frecuencia_cluster$`Número de países`/
    sum(frecuencia_cluster$`Número de países`)*100,
  2
)


kable(
  frecuencia_cluster,
  caption="Frecuencia y participación porcentual de los clusters",
  align="c"
)%>%
kable_styling(
  bootstrap_options=c("striped","hover","condensed"),
  full_width=FALSE
)%>%
row_spec(0, background="#800020", color="white")
Frecuencia y participación porcentual de los clusters
Cluster Número de países Porcentaje
1 26 61.90
2 12 28.57
3 2 4.76
4 2 4.76

La clasificación obtenida mediante el método de Cluster de Factores permitió agrupar los 42 países analizados en cuatro grupos homogéneos según su comportamiento económico. El primer grupo concentra la mayor cantidad de países (61.9%), indicando que representa el patrón económico predominante dentro de la muestra. El segundo grupo reúne el 28.57% de los países, mostrando características diferenciadas respecto al grupo principal. Finalmente, los grupos 3 y 4 presentan una baja participación (4.76% cada uno), lo cual evidencia la presencia de países con comportamientos particulares o alejados del promedio general.

6.2 Mapa Factorial

plot(resultado_ACP$dudi)

El gráfico del análisis de componentes principales muestra la distribución de los países en el plano definido por los dos primeros factores. El Factor 1 (33.3%) está asociado principalmente con variables de consumo, PIB e inversión, mientras que el Factor 2 (23.1%) refleja la dinámica de crecimiento, exportaciones e importaciones.

La posición de los países en este espacio permite identificar relaciones directas o inversas con las variables que contribuyen a cada dimensión. Aquellos ubicados hacia la derecha del eje horizontal se relacionan con altos niveles de actividad interna, mientras que los situados hacia la izquierda presentan un perfil económico diferenciado. En el eje vertical, los países en la parte superior se vinculan con un mayor dinamismo en comercio y crecimiento, mientras que los que se ubican en la parte inferior muestran una relación inversa con estas variables.

Se observan agrupamientos de economías con perfiles similares, como Estados Unidos, Alemania y Reino Unido, que se alinean con un modelo de apertura comercial y consumo elevado. En contraste, países como Corea o Colombia aparecen más alejados, lo que evidencia características particulares que los diferencian del resto.

6.3 Biplot

scatter(resultado_ACP$dudi,xax=1,yax=2) # Graf. Conjuntos

El biplot del análisis de componentes principales permite observar de manera conjunta la distribución de los países y las variables económicas en el plano definido por los dos primeros factores.

La posición de los países en este espacio muestra perfiles diferenciados: economías como Estados Unidos, Alemania y Reino Unido se ubican en la zona positiva de ambos factores, lo que indica una combinación de gran tamaño interno y fuerte apertura comercial. En contraste, Corea aparece en el extremo negativo del Factor 1, lo que refleja una relación inversa con las variables de PIB e inversión, aunque su contribución a la dimensión es muy elevada, convirtiéndolo en un caso clave para definir este eje. Países latinoamericanos como Chile y Perú se sitúan más próximos al origen, lo que sugiere perfiles intermedios sin una asociación marcada con los extremos de las variables.

6.4 Gráfico de clusters

NuevaBaseDatos <- data.frame(
  Cluster = resultado_ACP$cluster,
  datos_pca
)

Grupo<-NuevaBaseDatos$Cluster
s.class((resultado_ACP$dudi)$li,Grupo,sub="Componentes 1 y 2",possub="bottomright",xax=1,yax=2,col=c(1,2,3,4))

El análisis de clusters en el espacio de los dos primeros componentes principales evidencia la existencia de cuatro grupos de países con perfiles económicos diferenciados. Cada cluster refleja similitudes internas y diferencias estructurales entre economías:

Cluster 1: agrupa países con perfiles económicos similares en términos de actividad interna (PIB, consumo e inversión). Su posición indica que comparten características estructurales relacionadas con el tamaño de la economía.

Cluster 2:reúne economías con mayor relación con el comercio exterior y las exportaciones, reflejando un perfil más abierto y dinámico en el intercambio internacional.

Cluster 3: concentra países vinculados a la balanza externa y el crecimiento proyectado, mostrando un comportamiento diferenciado en variables como exportaciones netas y PIB ajustado por paridad de poder adquisitivo.

Cluster 4: agrupa economías con características intermedias o mixtas, que no se alinean de manera extrema con ninguno de los dos ejes principales, pero que comparten rasgos comunes en comercio y consumo.

La combinación del PCA con el análisis de clusters permite clasificar de manera clara y sintética a las economías, resaltando tanto los casos extremos como las agrupaciones homogéneas, y ofreciendo una visión integral de las principales tendencias macroeconómicas.

6.5 Tabla de variables que caracterizan cada Cluster

La tabla de características continuas permite identificar las variables económicas que presentan mayor capacidad para diferenciar los cuatro grupos obtenidos mediante el análisis factorial. Estas variables permiten interpretar la naturaleza económica de cada cluster y establecer los factores que explican las similitudes y diferencias entre los países.

El criterio principal de interpretación corresponde al estadístico Test.Value, donde valores elevados indican que la variable presenta un comportamiento significativamente diferente respecto al promedio global.

Cluster 1

caracteristicas <- resultado_ACP$carac.cont
tabla_clase1 <- as.data.frame(caracteristicas[[1]])

kable(
  tabla_clase1,
  caption="Variables que caracterizan la Clase 1",
  align="c"
)%>%
kable_styling(
 bootstrap_options=c("striped","hover"),
 full_width=FALSE
)
Variables que caracterizan la Clase 1
Test.Value Class.Mean Frequency Global.Mean
Cuenta_corriente 2.457 2.523 26 1.012
Exportaciones_netas 2.041 0.014 26 0.001
Crecimiento_inversion -2.911 3.534 26 7.344
Crecimiento_importaciones -4.198 8.637 26 12.824

El primer grupo se caracteriza principalmente por indicadores relacionados con el sector externo y la dinámica de crecimiento económico.

La importancia de variables como la cuenta corriente y las exportaciones netas indica que estos países presentan características diferenciadas en su relación comercial con el exterior. Además, la presencia del crecimiento de inversión e importaciones muestra una dinámica económica asociada con procesos de expansión productiva.

Este cluster representa países con estructuras económicas relativamente equilibradas, donde la principal diferencia no está determinada por el tamaño absoluto de la economía, sino por su comportamiento comercial y evolución reciente.

Cluster 2

tabla_clase1 <- as.data.frame(caracteristicas[[2]])

kable(
  tabla_clase1,
  caption="Variables que caracterizan la Clase 2",
  align="c"
)%>%
kable_styling(
 bootstrap_options=c("striped","hover"),
 full_width=FALSE
)
Variables que caracterizan la Clase 2
Test.Value Class.Mean Frequency Global.Mean
Crecimiento_importaciones 4.079 2.102400e+01 12 1.282400e+01
Crecimiento_inversion 3.403 1.632100e+01 12 7.344000e+00
Crecimiento_PIB 2.336 8.051000e+00 12 6.415000e+00
Comercio_total -2.054 1.282860e+11 12 3.762049e+11
Exportaciones -2.297 1.188684e+11 12 3.704357e+11
Cuenta_corriente -2.575 -2.179000e+00 12 1.012000e+00

Este grupo está determinado por variables relacionadas con el crecimiento económico y la expansión de la actividad productiva.

Los valores superiores en crecimiento de inversión reflejan mayores procesos de acumulación de capital, mientras que el crecimiento de importaciones puede indicar un aumento de la demanda interna y una mayor integración económica.Por lo tanto, este cluster agrupa países con una dinámica económica caracterizada por procesos de crecimiento y transformación productiva.

Cluster 3

tabla_clase1 <- as.data.frame(caracteristicas[[3]])

kable(
  tabla_clase1,
  caption="Variables que caracterizan la Clase 3",
  align="c"
)%>%
kable_styling(
 bootstrap_options=c("striped","hover"),
 full_width=FALSE
)
Variables que caracterizan la Clase 3
Test.Value Class.Mean Frequency Global.Mean
Comercio_total 5.326 2.194413e+12 2 3.762049e+11
Exportaciones 5.247 1.995563e+12 2 3.704357e+11
PIB_PPP 4.832 1.231814e+13 2 1.545227e+12

Este grupo presenta una fuerte relación con la participación en el comercio internacional.

Los valores elevados de exportaciones y comercio total indican economías con alta apertura comercial y mayor interacción con mercados internacionales.La influencia del PIB por paridad de poder adquisitivo evidencia además una importante capacidad económica considerando las diferencias en niveles de precios entre países.Por lo tanto,este cluster puede interpretarse como un grupo de economías con alta integración internacional y gran capacidad productiva.

Cluster 4

tabla_clase1 <- as.data.frame(caracteristicas[[4]])

kable(
  tabla_clase1,
  caption="Variables que caracterizan la Clase 4",
  align="c"
)%>%
kable_styling(
 bootstrap_options=c("striped","hover"),
 full_width=FALSE
)
Variables que caracterizan la Clase 4
Test.Value Class.Mean Frequency Global.Mean
Consumo_privado 6.074 7.759038e+14 2 5.073561e+13
PIB_nominal 5.944 1.624441e+15 2 1.068741e+14
PIB_Real 5.777 1.411174e+15 2 9.137015e+13
Consumo_gobierno 5.681 2.467779e+14 2 1.615331e+13
Inversion 5.380 3.685029e+14 2 2.366899e+13

Este grupo está explicado principalmente por variables relacionadas con el tamaño económico y capacidad productiva interna.

Los valores elevados de PIB real y PIB nominal indican economías con altos niveles de producción agregada, mientras que el consumo privado, consumo gubernamental e inversión reflejan mercados internos grandes y una mayor capacidad de generación de actividad económica.

Este cluster representa países con economías de gran escala, donde la característica principal es el volumen absoluto de producción, consumo e inversión.

7.Conclusiones

El análisis exploratorio inicial permitió evidenciar una marcada heterogeneidad entre los 42 países de la muestra, especialmente en variables asociadas al tamaño macroeconómico como el PIB, el consumo privado, la inversión y el comercio internacional. Esta diversidad estructural confirmó que las comparaciones directas mediante técnicas descriptivas tradicionales resultan insuficientes para caracterizar el desempeño económico de naciones con realidades tan dispares, justificando la aplicación de métodos multivariados más robustos.

La aplicación del ACP demostró ser una estrategia eficaz para sintetizar la información contenida en las 15 variables económicas originales, reduciendo la dimensionalidad del conjunto de datos sin incurrir en una pérdida significativa de varianza explicada. Desde la perspectiva de la Gestión de Datos, esta técnica evidencia cómo la redundancia informática —derivada de la alta correlación entre variables macroeconómicas— puede mitigarse de forma sistemática, optimizando el procesamiento de datos complejos y permitiendo trabajar con representaciones más eficientes del fenómeno estudiado.

Los resultados del ACP mostraron que las variables vinculadas a la actividad económica interna (PIB, consumo e inversión) y aquellas relacionadas con la apertura comercial fueron las de mayor influencia en la diferenciación entre países. No obstante, el análisis gráfico de PIB versus Inflación reveló que el crecimiento económico no está determinado exclusivamente por el tamaño de la economía, identificando comportamientos atípicos como el de Argentina (alta inflación con crecimiento desproporcionado) y economías maduras con patrones estables como Japón y Finlandia. Esto confirma que tanto la capacidad productiva interna como la inserción internacional son dimensiones fundamentales para caracterizar el desempeño económico de una nación.

El análisis de clusterización permitió clasificar los países en cuatro grupos con perfiles económicos diferenciados: economías orientadas al mercado interno, economías con fuerte dependencia del comercio exterior, países con comportamientos particulares en sus balances externos, y un grupo con características intermedias. La identificación de agrupamientos como el bloque conformado por Estados Unidos, Alemania y Reino Unido —caracterizado por altos niveles de consumo y apertura comercial— frente a economías con dinámicas emergentes o más aisladas como Colombia, valida la utilidad del clustering no supervisado para segmentar sistemas complejos y facilitar la comprensión de patrones comunes entre economías con comportamientos similares.

La integración del Análisis de Componentes Principales con las técnicas de clusterización demostró ser un enfoque metodológico completo y complementario para el análisis de datos multivariados en contextos económicos. El ACP facilitó la proyección de los países en un plano factorial reducido, mientras que el clustering operó sobre dicha representación para revelar agrupamientos que no son evidentes al analizar cada variable de forma independiente. Esta sinergia proporcionó una visión más estructurada y objetiva de las similitudes y diferencias entre los países de la muestra, enriqueciendo significativamente la capacidad interpretativa del análisis.

8. Bibliografía

Ward, J. H. (1963). Hierarchical grouping to optimize an objective function. Journal of the American Statistical Association, 58(301), 236-244.

Wikipedia. (2013). Ward’s method. https://en.wikipedia.org/wiki/Ward%27s_method

KeepCoding. (2025). ¿Qué es el análisis de componentes principales (PCA)? https://keepcoding.io/blog/que-es-pca/

Universidad de Granada. (2016). Medidas de similitud y distancia en análisis multivariante. Departamento de Estadística e Investigación Operativa.

OpenWebinars. (2025). Tutorial de análisis de componentes principales en R. https://openwebinars.net

Jolliffe, I. T. (2002). Principal component analysis (2nd ed.). Springer.

TIBCO Software. (2024). Ward’s hierarchical clustering method. Statistica Documentation. https://docs.tibco.com

Organisation for Economic Co-operation and Development. (n.d.). Indicators. OECD Data. https://www.oecd.org/en/data/indicators.html

Vidal, S. (2023, septiembre 16). ¿Qué se entiende por una dimensión económica? Tecnobits. https://tecnobits.com/que-se-entiende-por-una-dimension-economica/

Paredes Inilupu, D. (2024). Data science con R: Análisis de datos y algoritmos de predicción con R. Bookdown. https://bookdown.org/dparedesi/data-science-con-r/

Banco de la República de Colombia. (n.d.). Producto interno bruto (PIB). Banrep Educa. https://www.banrep.gov.co/es/banrep-educa/econo-cimientos/producto-interno-bruto-pib

Rodrigo Ricardo. (2025, 29 noviembre). Demanda interna: Qué es, características y ejemplos. Estudyando. https://estudyando.com/que-se-entiende-por-una-dimension-economica/