1 Introducción

Las economías de los países están influenciadas por múltiples factores como el crecimiento económico e internacional, la inversión, el consumo y las condiciones presentes en el mercado laboral. Aunque los países pertenecientes a la OECD comparten ciertos niveles de desarrollo y cooperación económica, cada uno presenta características particulares que reflejan diferentes modelos de crecimiento y desempeño económico.

Analizar estas diferencias resulta importante para comprender cómo se relacionan diversos indicadores económicos y qué características permiten distinguir a unos países de otros. Sin embargo, cuando se dispone de una gran cantidad de variables, identificar patrones de manera directa puede resultar complejo.

En este contexto, el presente trabajo busca explorar las similitudes y diferencias entre los países de la OECD a partir de un conjunto de indicadores económicos representativos. El objetivo es identificar grupos de países con comportamientos similares y determinar cuáles son los factores que explican en mayor medida las diferencias observadas entre ellos. Para ello, se emplean técnicas de análisis multivariado que permiten resumir la información contenida en múltiples variables y facilitar la identificación de patrones dentro de los datos. A partir de estos resultados se realiza una caracterización de los grupos encontrados y se discuten sus principales características económicas.

¿Es posible identificar grupos de países de la OECD con características económicas similares utilizando técnicas de reducción de dimensión y clusterización?

El presente trabajo tiene como propósito identificar patrones y similitudes económicas entre los países de la OECD a partir de diferentes indicadores relacionados con crecimiento económico, comercio internacional, inversión, consumo y estabilidad macroeconómica.

A través de técnicas de análisis multivariado se busca reducir la complejidad de la información disponible y facilitar la identificación de grupos de países con características similares. De esta manera, se pretende responder si existen perfiles económicos diferenciados dentro de la OECD y cuáles son los factores que explican en mayor medida dichas diferencias. El análisis permitirá obtener una visión general de las relaciones existentes entre los indicadores económicos y contribuir a una mejor comprensión de las características que distinguen a los distintos países estudiados.

1.1 Carga de datos y librerías

En esta primera sección se cargan las librerías necesarias y la base de datos utilizada para el análisis.

library(tidyverse)
library(cluster)
library(corrplot)
library(plotly)
library(knitr)
library(kableExtra)
library(factoextra)
library(reshape2)
library(DT)
library(readxl)

DatosEcon <- read_excel("DatosEcon.xlsx")

2 Metodología

Para el desarrollo del análisis se utilizaron datos económicos de países pertenecientes a la OECD. Inicialmente se realizó una selección de variables representativas con el fin de evitar información redundante y garantizar que cada indicador aportara una dimensión diferente del desempeño económico de los países.

Posteriormente se llevó a cabo un análisis exploratorio de los datos mediante estadísticas descriptivas y análisis de correlación, con el propósito de conocer el comportamiento de las variables y las relaciones existentes entre ellas.

Una vez comprendida la estructura de los datos, se aplicó el Análisis de Componentes Principales (ACP), técnica que permite resumir la información contenida en múltiples variables en un conjunto reducido de factores. Finalmente, utilizando la información obtenida a partir del ACP, se realizó un proceso de clusterización para identificar grupos de países con características económicas similares.

2.1 Selección de variables

En este estudio se seleccionaron 15 variables económicas con el objetivo de caracterizar y comparar el desempeño de distintos países, integrando información representativa de diferentes dimensiones del sistema económico. Esta selección busca evitar redundancia entre indicadores y facilitar una interpretación más clara de los resultados obtenidos mediante las técnicas estadísticas aplicadas.

Las variables se agrupan en cinco bloques principales:

2.1.1 Comercio internacional

x1: Cuenta corriente (% PIB)
x3: Importaciones
x5: Exportaciones
x15: Crecimiento de exportaciones

Este grupo permite evaluar el grado de apertura de cada economía y su nivel de integración con los mercados internacionales.

2.1.2 Consumo y gasto público

x6: Gasto público
x7: Consumo privado
x22: Crecimiento del gasto público
x21: Crecimiento del consumo privado

Este bloque analiza la estructura de la demanda interna y la participación del sector público en la actividad económica.

2.1.3 Crecimiento económico

x10: PIB real
x17: Crecimiento del PIB
x25: Deflactor del PIB

Estas variables describen el nivel de producción, su evolución en el tiempo y el comportamiento general de los precios.

2.1.4 Inversión

x12: Formación bruta de capital
x20: Crecimiento de la inversión

Este grupo refleja la capacidad de las economías para acumular capital y sostener el crecimiento futuro.

2.1.5 Estabilidad macroeconómica y mercado laboral

x26: Desempleo
x29: Tasa de interés

Este bloque permite evaluar las condiciones de estabilidad económica y del mercado laboral. En conjunto, estas variables permiten capturar diferencias estructurales entre las economías analizadas, facilitando su comparación desde múltiples dimensiones del desarrollo económico.

variables_15 <- c(
 "x1","x3","x5","x6","x7",
 "x22","x10","x17","x25","x12",
 "x20","x26","x29","x15","x21"
)

base_acp <- DatosEcon %>%
 select(all_of(variables_15))

Con el propósito de comprender el comportamiento general de la información utilizada en el análisis, se realizó una descripción estadística de las quince variables económicas seleccionadas. Estas variables representan dimensiones relacionadas con el comercio exterior, el consumo, el gasto público, la producción, la inversión, el mercado laboral y las condiciones financieras de los países pertenecientes a la OECD.

3 Estadísticas descriptivas

estadisticas <- base_acp %>%
 summarise(across(
   everything(),
   list(
     Media = mean,
     SD = sd,
     Min = min,
     Max = max
   ),
   na.rm = TRUE
 ))

estadisticas %>%
 t() %>%
 as.data.frame() %>%
 kable(
   caption = "Tabla 1. Estadísticas descriptivas de las variables seleccionadas"
 ) %>%
 kable_styling(
   bootstrap_options = c("striped","hover"),
   full_width = FALSE
 )

Tabla 1. Estadísticas descriptivas de las variables seleccionadas
	V1
x1_Media	1.012016e+00
x1_SD	5.078911e+00
x1_Min	-7.281639e+00
x1_Max	1.491254e+01
x3_Media	3.819741e+11
x3_SD	5.493589e+11
x3_Min	8.644998e+09
x3_Max	3.245332e+12
x5_Media	3.704357e+11
x5_SD	4.488404e+11
x5_Min	8.082994e+09
x5_Max	2.257271e+12
x6_Media	1.615331e+13
x6_SD	5.883308e+13
x6_Min	4.701223e+09
x6_Max	3.376846e+14
x7_Media	5.073561e+13
x7_SD	1.730062e+14
x7_Min	1.310195e+10
x7_Max	8.824598e+14
x22_Media	4.460344e+00
x22_SD	2.780562e+00
x22_Min	4.061435e-01
x22_Max	1.263068e+01
x10_Media	9.137015e+13
x10_SD	3.310409e+14
x10_Min	2.601447e+10
x10_Max	1.915777e+15
x17_Media	6.414701e+00
x17_SD	2.869844e+00
x17_Min	1.640697e+00
x17_Max	1.342655e+01
x25_Media	2.885763e+00
x25_SD	1.018038e+01
x25_Min	9.997199e-01
x25_Max	6.715228e+01
x12_Media	2.366899e+13
x12_SD	9.288766e+13
x12_Min	8.332420e+09
x12_Max	5.731436e+14
x20_Media	7.343549e+00
x20_SD	1.081189e+01
x20_Min	-3.906966e+01
x20_Max	3.531785e+01
x26_Media	7.371978e+00
x26_SD	5.268160e+00
x26_Min	2.819569e+00
x26_Max	3.426652e+01
x29_Media	9.956473e-01
x29_SD	3.171370e+00
x29_Min	-7.393333e-01
x29_Max	1.871363e+01
x15_Media	1.066987e+01
x15_SD	6.886647e+00
x15_Min	-3.585889e+00
x15_Max	2.782331e+01
x21_Media	6.610695e+00
x21_SD	3.929155e+00
x21_Min	3.985635e-01
x21_Max	2.050540e+01

Los resultados muestran una importante heterogeneidad entre los países analizados. Las variables asociadas al tamaño de la economía, tales como importaciones, exportaciones, gasto público, consumo privado, PIB real y formación bruta de capital, presentan los mayores niveles de dispersión. Esto refleja diferencias significativas en la escala económica de los países incluidos en la muestra.

Por otra parte, las variables relacionadas con tasas de crecimiento, como el crecimiento del PIB, el crecimiento de las exportaciones, el crecimiento de la inversión, el crecimiento del consumo privado y el crecimiento del gasto público, presentan una variabilidad relativamente menor, indicando comportamientos más homogéneos entre los países estudiados.

boxplot_base <- base_acp %>%
 pivot_longer(
   everything(),
   names_to = "Variable",
   values_to = "Valor"
 ) %>%
 ggplot(
   aes(
     x = Variable,
     y = Valor
   )
 ) +
 geom_boxplot(fill = "lightblue") +
 coord_flip() +
 theme_minimal() +
 labs(
   title = "Distribución y valores atípicos de las variables económicas"
 )

ggplotly(boxplot_base)

La figura permite identificar la dispersión y la presencia de valores atípicos en las variables económicas seleccionadas. Se observa que varias variables presentan observaciones extremas, especialmente aquellas relacionadas con producción, comercio e inversión. Este comportamiento es consistente con la existencia de economías de diferentes tamaños dentro de la OECD.

cv <- data.frame(
 Variable = names(base_acp),
 Media = sapply(base_acp, mean),
 SD = sapply(base_acp, sd)
)

cv$CV <- cv$SD / cv$Media

grafico_cv <- ggplot(
 cv,
 aes(
   reorder(Variable, CV),
   CV
 )
) +
 geom_col(fill = "steelblue") +
 coord_flip() +
 theme_minimal() +
 labs(
   title = "Coeficiente de variación por variable",
   x = NULL,
   y = "CV"
 )

ggplotly(grafico_cv)

El coeficiente de variación permite comparar la dispersión relativa de las variables independientemente de sus unidades de medida. Los resultados evidencian que algunas variables presentan una mayor variabilidad relativa entre países, mientras que otras muestran comportamientos más homogéneos. Esta medida complementa la interpretación obtenida a partir de los estadísticos descriptivos tradicionales.

Con el fin de identificar las relaciones lineales existentes entre las variables económicas seleccionadas, se calculó la matriz de correlación y se construyó un mapa de calor interactivo para facilitar la interpretación de los resultados.

correlaciones <- cor(base_acp)

cor_melt <- melt(correlaciones)

heatmap_cor <- ggplot(
 cor_melt,
 aes(
   Var1,
   Var2,
   fill = value,
   text = paste(
     "Variable 1:", Var1,
     "<br>Variable 2:", Var2,
     "<br>Correlación:", round(value, 3)
   )
 )
) +
 geom_tile() +
 scale_fill_gradient2(
   low = "blue",
   mid = "white",
   high = "red",
   midpoint = 0
 ) +
 theme_minimal() +
 theme(
   axis.text.x = element_text(
     angle = 45,
     hjust = 1
   )
 ) +
 labs(
   title = "Mapa de calor de correlaciones",
   fill = "Correlación"
 )

ggplotly(
 heatmap_cor,
 tooltip = "text"
)

La figura muestra las asociaciones existentes entre las variables analizadas. Se observan correlaciones positivas importantes entre el PIB real, el gasto público, el consumo privado y la formación bruta de capital, indicando que estas variables describen dimensiones similares relacionadas con el tamaño económico de los países.

Asimismo, las variables asociadas al crecimiento económico presentan relaciones positivas entre sí, sugiriendo que los países con mayor dinamismo económico tienden a registrar simultáneamente incrementos en la inversión, el consumo y la actividad productiva. De igual forma, las variables relacionadas con el comercio exterior muestran asociaciones relevantes entre importaciones y exportaciones, reflejando el grado de integración comercial de las economías analizadas.

cor_df <- as.data.frame(as.table(correlaciones))

cor_df <- cor_df %>%
 filter(Var1 != Var2) %>%
 mutate(cor_abs = abs(Freq)) %>%
 arrange(desc(cor_abs))

head(cor_df, 15) %>%
 kable(
   caption = "Tabla 2. Correlaciones más fuertes entre variables"
 ) %>%
 kable_styling(
   bootstrap_options = c("striped","hover"),
   full_width = FALSE
 )

Tabla 2. Correlaciones más fuertes entre variables
Var1	Var2	Freq	cor_abs
x10	x6	0.9979404	0.9979404
x6	x10	0.9979404	0.9979404
x12	x10	0.9861733	0.9861733
x10	x12	0.9861733	0.9861733
x12	x6	0.9838976	0.9838976
x6	x12	0.9838976	0.9838976
x10	x7	0.9784814	0.9784814
x7	x10	0.9784814	0.9784814
x7	x6	0.9746702	0.9746702
x6	x7	0.9746702	0.9746702
x5	x3	0.9648340	0.9648340
x3	x5	0.9648340	0.9648340
x12	x7	0.9312397	0.9312397
x7	x12	0.9312397	0.9312397
x21	x17	0.7391800	0.7391800

La existencia de correlaciones elevadas entre varias variables evidencia la presencia de información redundante dentro del conjunto de datos. Esta situación justifica la aplicación posterior del Análisis de Componentes Principales, técnica que permite reducir la dimensionalidad de la información conservando la mayor parte de la variabilidad original.

3.1 Análisis de Componentes Principales

Luego del análisis descriptivo y de correlación, se aplicó un Análisis de Componentes Principales sobre los datos previamente estandarizados. Esta técnica permite reducir la dimensionalidad del conjunto de datos conservando la mayor cantidad posible de información.

# Se realiza estandarización a las variables

base_escalada <- scale(base_acp)

La estandarización fue necesaria debido a que las variables se encuentran en diferentes unidades de medida y escalas. De esta forma, se evita que las variables con valores numéricos más grandes dominen el análisis.

modelo_acp <- prcomp(
 base_escalada,
 center = TRUE,
 scale. = TRUE
)

summary(modelo_acp)

## Importance of components:
##                           PC1    PC2    PC3    PC4     PC5     PC6    PC7
## Standard deviation     2.0058 1.7850 1.2873 1.2711 1.06214 1.00964 0.9304
## Proportion of Variance 0.2682 0.2124 0.1105 0.1077 0.07521 0.06796 0.0577
## Cumulative Proportion  0.2682 0.4806 0.5911 0.6988 0.77402 0.84198 0.8997
##                            PC8     PC9    PC10    PC11    PC12    PC13    PC14
## Standard deviation     0.81340 0.61797 0.52215 0.34826 0.21752 0.12967 0.05697
## Proportion of Variance 0.04411 0.02546 0.01818 0.00809 0.00315 0.00112 0.00022
## Cumulative Proportion  0.94379 0.96925 0.98742 0.99551 0.99866 0.99978 1.00000
##                            PC15
## Standard deviation     0.003305
## Proportion of Variance 0.000000
## Cumulative Proportion  1.000000

eig_val <- get_eigenvalue(modelo_acp)

datatable(
 eig_val,
 options = list(
   pageLength = 10,
   scrollX = TRUE
 ),
 caption = "Tabla 3. Varianza explicada por los componentes principales"
)

La tabla y la figura muestran que el primer componente principal explica el 26.82% de la variabilidad total, mientras que el segundo componente explica el 21.24%. En conjunto, los dos primeros componentes representan el 48.06% de la información contenida en los datos originales.

Asimismo, se observa que los cinco primeros componentes principales explican el 77.40% de la varianza total. Debido a que este porcentaje representa una proporción importante de la información original, se decidió conservar estos cinco componentes para realizar posteriormente el análisis de clústeres.

4 Interpretación de los factores

Componente Principal 1: Tamaño y capacidad económica

grafico_contrib_pc1 <- fviz_contrib(
 modelo_acp,
 choice = "var",
 axes = 1,
 top = 15
)

ggplotly(grafico_contrib_pc1)

contrib_pc1 <- round(get_pca_var(modelo_acp)$contrib[, 1], 2)

datatable(
 data.frame(
   Variable = names(contrib_pc1),
   Contribucion_PC1 = contrib_pc1
 ),
 options = list(
   pageLength = 15,
   scrollX = TRUE
 ),
 caption = "Tabla 4. Contribución de variables al Componente Principal 1"
)

Los resultados muestran que las variables con mayor contribución al primer componente principal fueron el gasto público, el PIB real, la formación bruta de capital y el consumo privado.

Estas variables representan los principales indicadores de producción, inversión y gasto de una economía. Por esta razón, el primer componente principal puede interpretarse como un factor asociado al tamaño y la capacidad económica de los países. En términos económicos, valores elevados en este componente corresponden a países con altos niveles de producción, inversión, consumo y gasto público.

Componente Principal 2: Dinamismo económico y apertura comercial

grafico_contrib_pc2 <- fviz_contrib(
 modelo_acp,
 choice = "var",
 axes = 2,
 top = 15
)

ggplotly(grafico_contrib_pc2)

contrib_pc2 <- round(get_pca_var(modelo_acp)$contrib[, 2], 2)

datatable(
 data.frame(
   Variable = names(contrib_pc2),
   Contribucion_PC2 = contrib_pc2
 ),
 options = list(
   pageLength = 15,
   scrollX = TRUE
 ),
 caption = "Tabla 5. Contribución de variables al Componente Principal 2"
)

En el segundo componente principal, las variables más influyentes fueron el crecimiento del consumo privado, el crecimiento del PIB, las exportaciones, el crecimiento de la inversión y las importaciones.

A diferencia del primer componente, este factor no está asociado al tamaño de la economía, sino al ritmo de crecimiento y al grado de integración con los mercados internacionales.

Por esta razón, el segundo componente principal se interpreta como un factor de dinamismo económico y apertura comercial.

5 Círculo de correlaciones ACP

grafico_var <- fviz_pca_var(
 modelo_acp,
 col.var = "contrib",
 gradient.cols = c("blue", "orange", "red"),
 repel = TRUE
)

ggplotly(grafico_var)

El círculo de correlaciones del ACP permite visualizar la relación entre las variables originales y los componentes principales retenidos. Se observa que variables como el PIB real, el gasto público, el consumo privado y la formación bruta de capital presentan vectores cercanos entre sí, indicando una fuerte asociación positiva y una contribución importante al primer componente principal.

Por otro lado, las variables relacionadas con crecimiento económico, comercio exterior e inversión presentan una mayor asociación con el segundo componente principal. Estos resultados respaldan la interpretación económica asignada a cada factor.

6 Representación conjunta de países

grafico_biplot <- fviz_pca_biplot(
 modelo_acp,
 repel = TRUE,
 col.var = "red",
 col.ind = "gray40"
)

ggplotly(grafico_biplot)

El biplot permite observar simultáneamente la posición de los países y la dirección de las variables económicas. Se aprecia que algunos países presentan comportamientos claramente diferenciados respecto al resto de la muestra, situación que posteriormente se refleja en los resultados de la clusterización.

7 Análisis de clústeres

Una vez identificadas las principales dimensiones económicas mediante el ACP, se utilizaron los cinco componentes principales retenidos para realizar la segmentación de países mediante el algoritmo K-means.

7.1 Coordenadas de los países en los componentes principales

coord_paises <- as.data.frame(modelo_acp$x)

datatable(
 round(coord_paises, 3),
 options = list(
   pageLength = 10,
   scrollX = TRUE
 ),
 caption = "Tabla 6. Coordenadas de los países en los componentes principales"
)

base_cluster <- coord_paises[, 1:5]

Se usaron los primeros cinco componentes principales porque explican el 77.40% de la varianza total. Esto significa que los clústeres se formaron usando información resumida de las quince variables originales.

7.2 Selección del número de clústeres

# Método del codo
grafico_codo <- fviz_nbclust(
 base_cluster,
 kmeans,
 method = "wss"
)

ggplotly(grafico_codo)

#Índice Silhouette

grafico_silhouette <- fviz_nbclust(
 base_cluster,
 kmeans,
 method = "silhouette"
)

ggplotly(grafico_silhouette)

# Gap Statistic

set.seed(123)

grafico_gap <- fviz_nbclust(
 base_cluster,
 kmeans,
 method = "gap_stat",
 nboot = 50
)

ggplotly(grafico_gap)

El método del codo mostró evidencia de una estructura de tres grupos, mientras que el índice silhouette sugirió una solución de dos clústeres. Considerando la interpretación económica de los resultados y la capacidad de diferenciar perfiles claramente distintos de países, se optó por trabajar con tres clústeres.

7.3 Modelo final K-means con tres clústeres

set.seed(123)

modelo_kmeans <- kmeans(
 base_cluster,
 centers = 3,
 nstart = 25
)

El modelo final se ajustó con tres clústeres y 25 inicializaciones aleatorias, con el fin de mejorar la estabilidad de la solución obtenida.

7.4 Visualización de los clústeres

grafico_cluster <- fviz_cluster(
 modelo_kmeans,
 data = base_cluster,
 geom = "point",
 ellipse.type = "convex",
 repel = TRUE
)

ggplotly(grafico_cluster)

La visualización muestra la existencia de tres grupos de países con características económicas diferenciadas.

7.5 Descripción de los grupos

DatosEcon_cluster <- DatosEcon %>%
 mutate(cluster = modelo_kmeans$cluster)

resumen_clusters <- DatosEcon_cluster %>%
 group_by(cluster) %>%
 summarise(
   total_paises = n(),
   across(all_of(variables_15), mean)
 )

datatable(
 resumen_clusters,
 options = list(
   pageLength = 5,
   scrollX = TRUE
 ),
 caption = "Tabla 7. Estadísticas promedio por clúster"
)

Clúster 1: Economías maduras y estables

Este grupo reúne 33 países y constituye el conjunto más representativo de la muestra. Presenta niveles elevados de producción, consumo e inversión, acompañados por tasas moderadas de crecimiento económico y niveles relativamente bajos de desempleo. Desde una perspectiva histórica, este grupo está conformado principalmente por economías desarrolladas de la OECD que completaron sus procesos de industrialización y consolidación productiva durante el siglo XX. Por esta razón, muestran una elevada capacidad económica, aunque con ritmos de crecimiento más moderados.

Clúster 2: Economía excepcional

Este grupo está integrado únicamente por Corea. Su separación respecto al resto de los países se explica por los niveles extraordinariamente altos observados en variables relacionadas con el tamaño económico, el consumo privado, la inversión y la producción. Históricamente, Corea constituye uno de los casos más exitosos de transformación económica moderna. En pocas décadas pasó de ser una economía en desarrollo a convertirse en una potencia industrial y tecnológica, situación que explica su comportamiento atípico dentro del conjunto analizado.

Clúster 3: Economías dinámicas y emergentes

Este grupo está conformado por Chile, Colombia, Grecia, Türkiye, Argentina, Croacia, India y Perú.

Los países pertenecientes a este clúster presentan las mayores tasas de crecimiento del PIB, crecimiento de la inversión, crecimiento de las exportaciones y crecimiento del consumo privado. Sin embargo, también registran niveles más elevados de desempleo y presiones inflacionarias.

Desde una perspectiva económica, este grupo representa economías emergentes o economías en procesos de expansión relativamente acelerados. Su principal característica es el dinamismo económico, aunque acompañado de una mayor volatilidad macroeconómica.

7.6 Clasificación final de los países

tabla_paises <- DatosEcon_cluster %>%
 group_by(cluster) %>%
 summarise(
   paises = paste(Pais, collapse = ", ")
 )

datatable(
 tabla_paises,
 options = list(
   pageLength = 5,
   scrollX = TRUE
 ),
 caption = "Tabla 8. Países pertenecientes a cada clúster"
)

La clasificación obtenida permite identificar tres perfiles económicos claramente diferenciados: economías maduras y estables, una economía excepcional con características particulares y economías emergentes caracterizadas por un mayor dinamismo económico.

8 Síntesis de los resultados

Los resultados del Análisis de Componentes Principales permitieron identificar dos dimensiones económicas fundamentales dentro del conjunto de países analizados. El primer componente principal estuvo asociado principalmente al tamaño y capacidad económica de los países, representado por variables como el PIB real, el gasto público, el consumo privado y la formación bruta de capital. Por su parte, el segundo componente principal reflejó el dinamismo económico y la apertura comercial, al estar influenciado principalmente por las tasas de crecimiento económico, el crecimiento de la inversión y las variables relacionadas con el comercio exterior.

A partir de estas dimensiones se realizó la segmentación mediante el algoritmo K-means, obteniéndose tres grupos claramente diferenciados. El primer grupo estuvo conformado principalmente por economías desarrolladas y relativamente estables, caracterizadas por altos niveles de producción y crecimiento moderado. El segundo grupo estuvo integrado únicamente por Corea, país que presentó un comportamiento económico significativamente diferente al resto de la muestra. Finalmente, el tercer grupo reunió economías con mayores tasas de crecimiento económico, inversión y comercio exterior, reflejando un perfil más dinámico, aunque acompañado de mayores niveles de desempleo e inflación.

En conjunto, los resultados evidencian que las diferencias entre los países no dependen únicamente del tamaño de sus economías, sino también de su ritmo de crecimiento y de su nivel de integración con los mercados internacionales. La aplicación combinada del ACP y la clusterización permitió identificar patrones económicos comunes y distinguir perfiles claramente diferenciados dentro de la muestra analizada.

9 Conclusiones

La aplicación conjunta del Análisis de Componentes Principales (ACP) y del algoritmo K-means permitió reducir la complejidad del conjunto de datos e identificar patrones económicos relevantes entre los países analizados. Los resultados evidenciaron que las diferencias observadas no dependen únicamente del tamaño de las economías, sino también de su nivel de dinamismo y de su integración con los mercados internacionales.

La reducción de dimensionalidad facilitó la identificación de factores económicos subyacentes y permitió realizar una clasificación más clara de los países, agrupándolos según características comunes. Esto demostró la utilidad de las técnicas de análisis multivariado para estudiar conjuntos de datos económicos con múltiples variables interrelacionadas.

En términos generales, el estudio permitió identificar perfiles económicos diferenciados dentro de la muestra y evidenció cómo herramientas estadísticas como el ACP y la clusterización pueden contribuir a una mejor comprensión de las relaciones existentes entre los indicadores macroeconómicos de distintos países.

En términos generales, el análisis realizado permite concluir que la combinación de técnicas de reducción de dimensionalidad y agrupamiento constituye una herramienta eficaz para comprender la complejidad de los sistemas económicos a nivel internacional. A partir de la información disponible, fue posible sintetizar múltiples indicadores en estructuras interpretables que revelan patrones coherentes de comportamiento entre los países de la OECD. Esto no solo facilita la identificación de similitudes y diferencias económicas, sino que también aporta una visión integrada del desarrollo económico, evidenciando que las economías pueden ser caracterizadas de manera consistente a partir de dimensiones fundamentales como el tamaño, el dinamismo y la apertura. En este sentido, los resultados obtenidos ofrecen una base analítica útil para futuras investigaciones comparativas y para la comprensión de las dinámicas estructurales que configuran el desempeño económico de los países.

10 Bibliografía

Barandica, O. J. (s. f.). Sitio web académico – Docente Universidad del Valle. https://www.joaquibarandica.com

Everitt, B. S., Landau, S., Leese, M., & Stahl, D. (2011). Cluster analysis (5th ed.). Wiley.

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2021). An introduction to statistical learning: With applications in R (2nd ed.). Springer.

Jolliffe, I. T. (2002). Principal component analysis (2nd ed.). Springer.

Kassambara, A. (2020). factoextra: Extract and visualize the results of multivariate data analyses (R package version 1.0.7). https://cran.r-project.org/package=factoextra

OECD. (s. f.). OECD data. https://data.oecd.org

R Core Team. (2024). R: A language and environment for statistical computing. https://www.r-project.org

Wickham, H. (2016). ggplot2: Elegant graphics for data analysis. Springer.

Segmentación de países de la OECD mediante Análisis de Componentes Principales y K-means

Samuel Ruiz Restrepo - 2341122, Lili Sofía Cruz García - 2417663, Zaira Aragón Rios - 2520989, Duvan Bermudez - 2227209

18 Junio 2026