La OCDE es una organización internacional creada después de la Segunda Guerra Mundial con el nombre de Organización para la Cooperación Económica Europea (OECE) con el propósito de coordinar el Plan Marshall. Para 1961, se cambió el nombre y se convirtió en la Organización para la Cooperación y el Desarrollo Económico (OCDE), con orientación hacia varios lados del Atlántico y después a nivel mundial. (Ministerio de Economía, Comercio y Empresa, s.f.)
Cuenta con 38 países miembros y algunos países asociados, de los cuales combinan investigación comparativa entre esos países con análisis específicos, con el objetivo de apoyar reformas que generen un crecimiento económico, social y ambientales, frente a los desafíos derivados de la interdependencia y la globalización. (Ministerio de Economía, Comercio y Empresa, s.f.)
Señala que entre los países miembros hay diferentes economías, como por ejemplo las dinámicas de crecimiento, inflación y empleo que no siguen un patrón. Esto muestra que analizar esas diferencias con un solo indicador, no permite capturar la complejidad real de cada economía, ya que los indicadores abarcan cuentas nacionales, precios, empleo, comercio internacional y balanza de pagos, dimensiones que interactúan de maneras distintas según la estructura de cada país. (OECD, 2022)
Por esto mismo, se planteó una pregunta que se responderá al final del informe, ¿Existen grupos de países dentro de la OCDE que compartan perfiles económicos similares cuando se analizan de forma simultánea los indicadores dentro de la base de datos?
Por esta razón, este trabajo toma un enfoque de aprendizaje no supervisado, que se usa porque no existe una clasificación previa y se busca que los propios datos revelen su estructura. Se combinan el Análisis de Componentes Principales (ACP) y las técnicas de clusterización Ward y K-means, permitiendo descubrir agrupamientos naturales entre países sin imponer categorías externas.
El estudio trabaja con 15 variables económicas agrupadas en cuatro dimensiones, como la posición externa, dinámica productiva, gasto interno y mercado laboral, que se detallan en la sección metodológica. Debido a la naturaleza exploratoria del estudio, se centra mayormente en la comprensión e interpretación económica de los resultados dentro de su contexto, más que obtener un modelo estadístico perfecto.
La base de datos utilizada en este análisis viene de la publicación
Main Economic Indicators (MEI) de la OCDE, considerada la fuente oficial
de referencia para el seguimiento de indicadores económicos a corto
plazo entre los países miembros de la organización. La MEI es una
publicación que favorece la identificación temprana en la tendencia en
la actividad económica y el ciclo de negocios entre sus países miembros.
Constituye una fuente indispensable de estadísticas clave de corto plazo
dirigida principalmente a economistas, académicos e investigadores.
(Morales, 2019) La base tiene información sobre 42 países,
correspondientes a los 38 miembros oficiales de la OCDE y 4 economías
asociadas , con indicadores con cuentas nacionales, tipo de cambio,
comercio exterior, empleo y condiciones monetarias . Para este trabajo
se seleccionaron 15 variables que tratan con cuatro dimensiones
económicas, como la posición externa, dinámica productiva, gasto interno
y mercado laboral. Dado que cada variable está medida en unidades
distintas, se aplicó una estandarización mediante la función
scale() de R previamente al análisis, asegurando que
ninguna variable domine por su escala de medición. (OCDE, 2022)
library(knitr)
library(kableExtra)
tabla <- data.frame(
Dimensión = c(
"Posición externa",
"Dinámica productiva",
"Gasto interno",
"Mercado laboral"
),
Variables = c(
"Cuenta corriente % PIB, Tipo de cambio, Comercio bienes y servicios, Exportaciones netas, Crecimiento exportaciones, crec. Importaciones",
"PIB en PPA constante, Crecimiento PIB real, Deflactor del PIB, Crecimiento inversión",
"Gasto consumo gobierno, Crecimiento consumo privado, Crecimiento consumo público",
"Tasa de desempleo, Tasa de interés corto plazo"
),
Justificación = c(
"Evalúa la relación de cada país con el comercio internacional y su exposición a choques externos",
"Mide la capacidad de crecimiento económico real y las presiones de inflación internas",
"Captura el comportamiento de la demanda interna pública y privada",
"Refleja las condiciones del empleo y el costo del dinero en cada economía"
)
)
tabla %>%
kable(format = "html", align = "lcc", caption = "<center><span style='color: #000000; opacity: 1;'>Tabla 1. Variables seleccionadas para el estudio.</span></center>") %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed", "responsive"),
full_width = FALSE,
position = "center",
font_size = 14
) %>%
row_spec(0, bold = TRUE, color = "white", background = "#2C3E50") %>%
column_spec(1, bold = TRUE, color = "#2C3E50", background = "#ECF0F1", width = "10em") %>%
column_spec(2, width = "30em") %>%
column_spec(3, width = "30em")
| Dimensión | Variables | Justificación |
|---|---|---|
| Posición externa | Cuenta corriente % PIB, Tipo de cambio, Comercio bienes y servicios, Exportaciones netas, Crecimiento exportaciones, crec. Importaciones | Evalúa la relación de cada país con el comercio internacional y su exposición a choques externos |
| Dinámica productiva | PIB en PPA constante, Crecimiento PIB real, Deflactor del PIB, Crecimiento inversión | Mide la capacidad de crecimiento económico real y las presiones de inflación internas |
| Gasto interno | Gasto consumo gobierno, Crecimiento consumo privado, Crecimiento consumo público | Captura el comportamiento de la demanda interna pública y privada |
| Mercado laboral | Tasa de desempleo, Tasa de interés corto plazo | Refleja las condiciones del empleo y el costo del dinero en cada economía |
Como no existe una clasificación previa de los países por perfil
económico, entonces por eso se usa el enfoque de aprendizaje no
supervisado, cuya característica principal es que no cuenta con un
output predeterminado y también permite que sean los propios patrones en
los datos los que determinen cómo se agrupan las observaciones. El
proceso se desarrolla en dos etapas que se complementan entre sí.
El ACP es un método estadístico que permite sintetizar un conjunto de datos que cuenta con muchas variables en un número más reducido de factores llamados componentes principales, que toma la mayor parte de la información de los datos originales (Sánchez, 2022). Este método transforma los datos originales en un espacio de menor dimensión agrupando las variables altamente correlacionadas, de la cual toma la información más importante. En este trabajo, el análisis del ACP busca encontrar combinaciones de las 15 variables que se seleccionaron anteriormente y se busca que expliquen la mayor parte de las diferencias observadas entre los países correspondientes de la OCDE. Se busca encontrar patrones entre las correlaciones de las variables. Un posible caso podría ser si la tasa de desempleo y la tasa de interés a corto plazo tienden a comportarse de manera similar entre los países, el análisis podría agruparlas en un solo componente que represente las dos condiciones, con el fin de que facilite la visualización y comprensión de los datos, sin alterar la información. (Keita, 2024).
Los resultados del ACP se interpretan a partir de dos elementos. El primero es la proporción de varianza que explica la relevancia de cada componente en ese factor, con el fin de resumir las diferencias entre países y sirve como guía para decidir con cuántos componentes trabajar en el siguiente análisis. El segundo es el peso que tiene cada variable dentro del componente permite entender qué indicadores están detrás de cada dimensión y construir una nueva interpretación a los resultados. (Keita, 2024).
Por estas razones, es muy útil aplicar el ACP a los 15 indicadores económicos de los países de la OCDE porque permite identificar qué dimensiones realmente diferencian a los países entre sí. Los resultados obtenidos sirven para la clusterización, donde cada país será asignado a un grupo según su comportamiento en los componentes identificados.
Los métodos de clustering se agrupan dentro de las técnicas de aprendizaje no supervisado y tienen como finalidad especificar los datos en distintos grupos para que cada observación sea bastante similar entre sí y distintas a las de otros grupos. En este trabajo se aplican dos métodos que son el K-means y Ward, cuyos resultados se comparan al final para verificar la robustez de los grupos identificados.
El K-means es un método de agrupamiento no jerárquico que divide el
conjunto de datos en clusters distintos, donde ningún país puede
pertenecer a más de un grupo simultáneamente. Su funcionamiento trata de
ubicarlo en una forma aleatoria en el espacio de datos, luego asigna
cada país el K más cercano según la distancia euclidiana, recalcula la
posición de cada punto central como la media de los países de un grupo
en específico y repite este proceso hasta que los puntos centrales se
estabilizan y dejan de cambiar (Gil Martínez, 2018). Dado que se
encuentra un óptimo local y no global, en este trabajo se aplicaron 25
puntos de inicio aleatorios mediante el parámetro nstart de
la función kmeans() de R, seleccionando la solución con
menor varianza intra-cluster, para medir qué tan dispersos están los
países dentro de su propio grupo.
Para decidir en cuántos grupos dividir los países se usaron dos herramientas gráficas. La primera es el método del codo, que muestra una curva donde se busca el punto donde agregar más grupos ya no mejora significativamente el resultado. La segunda es el método Silhouette, que muestra qué tan bien clasificado está cada país dentro de su grupo, siendo el número óptimo de grupos aquel que obtiene el valor más alto (Gil Martínez, 2018).
El método Ward es una técnica que agrupa los países de forma
progresiva, que empieza como cada país como un grupo individual, para
luego fusionarlo en cada paso los dos grupos más parecidos entre sí,en
otras palabras, aquellos cuya unión genere la menor pérdida de
homogeneidad dentro del grupo (Ward, 1963). Este proceso continúa hasta
que todos los países quedan unidos en un solo grupo, generando como
resultado un dendrograma, que es un diagrama que muestra visualmente
cómo se fueron fusionando los países. A diferencia del K-means, este
método no requiere definir cuántos grupos se quieren obtener, sino que
ese número se decide haciendo un corte sobre el dendrograma según (Gil
Martínez, 2018). En este trabajo se aplicó con las funciones
dist() y hclust() de R.
Usar los dos métodos de forma complementaria permite aprovechar las ventajas de cada uno y mejorar el análisis del trabajo. El K-means se agrupa mediante repeticiones y el método Ward ofrece una visión más estable y jerárquica de los grupos. Comparar sus resultados al final permite confirmar si los grupos identificados son consistentes para verificar si las conclusiones son confiables.
Cada una de las 15 variables seleccionadas fue incluida para capturar un aspecto del comportamiento económico de los países, para analizarlo en conjunto y permitir revelar las diferencias estructurales entre ellos. Es por esto que a continuación se explicará cada uno para identificar la información que aporta y de qué manera contribuye al proceso de segmentación.
La cuenta corriente registra todo lo que un país intercambia económicamente con el mundo, como por ejemplo, lo que se importa y lo que se exporta, lo que gana por inversiones fuera del país y las transferencias de dinero entre residentes del país y el exterior. Cuando el saldo es positivo, significa que el país genera más recursos de lo que gasta en el exterior, lo que significa que el país es prestamista del resto del mundo y no necesita ayuda económica del exterior. Sin embargo, cuando el saldo es negativo, el país gasta más de lo que recibe y depende del financiamiento externo para cubrir esa diferencia. (Focus Economics, 2026.) Como el PIB está expresado en porcentaje, hace que sea más fácil comparar la posición externa de cada país de distinto tamaño. Es por esto que en la segmentación, esta variable es importante para diferenciar países que no deben mucho al exterior y se pueden permitir no depender de otro, en comparación de aquellos que acumulan desequilibrios persistentes frente al exterior.
Cuando un país quiere comprar productos o servicios del exterior, lo que hace es cambiar su moneda local en una moneda universal, que en muchos casos sería el dólar estadounidense. El tipo de cambio es el precio de conversión, el cual indica cuántas unidades de la moneda local equivalen a un dólar (Datosmacro, s.f.). Este valor sube y baja constantemente dependiendo de la inflación del país, sus tasas de interés y el comportamiento de sus exportaciones e importaciones. (Western Union, 2026).
Incluir esta variable en el análisis tiene sentido porque el comportamiento del tipo de cambio de cada país refleja indirectamente qué tan estable y confiable es su economía. Esto es debido a que el valor de una divisa aumenta cuando la economía del país es fuerte y cae cuando la economía se debilita. Esto quiere decir que cuando un país con un tipo de cambio muy volátil generalmente enfrenta más dificultades económicas que uno con una moneda estable, lo que permite agrupar los países según ese nivel de estabilidad monetaria. (Western Union, 2026).
El comercio internacional es el conjunto de transacciones de compra y venta de bienes y servicios que realiza un país con el resto del mundo, con el objetivo de suplir con la demanda de productos que no se pueden producir en el propio país o que pueden llegar a ser más efectivos en el exterior. Existen dos tipos de intercambio, que serían las exportaciones, que corresponden a los bienes y servicios que un país produce y vende al exterior. Las importaciones, que son los bienes y servicios que un país compra a otros países.(IEP, 2021).
Esta variable registra el volumen total del comercio de bienes y servicios expresado en dólares estadounidenses. En otras palabras, el valor en términos monetarios es todo lo que un país vende y compra con el resto del mundo. Si el volumen es alto, eso significa que el país compra y vende más con el resto del mundo, lo que indica que su economía depende más del comercio exterior para crecer. Sin embargo, si el volumen es bajo indica que el país produce y consume principalmente dentro de su país. Esta diferencia es importante para la segmentación porque permite agrupar países según su nivel de dependencia del comercio internacional, separando los países donde su economía se ve de forma más independiente.
Las exportaciones netas representan la diferencia entre todo lo que un país vende al exterior y todo lo que compra de otros países. Si un país vende más de lo que compra, aporta positivamente al crecimiento de su economía. Pero si ocurre lo contrario y compra más de lo que vende, se le resta al crecimiento económico. Esta variable mide parte del crecimiento económico y se explica por lo que el país hizo con el resto del mundo.(Izquierdo, 2024).
Esta distinción es importante porque hay países que crecen principalmente porque exportan mucho, como Alemania con su industria manufacturera, y otros que crecen más por su consumo y gasto interno. En la segmentación, esta variable permite identificar esas diferencias y agrupar países según si su motor de crecimiento está más orientado hacia afuera o hacia adentro de su propia economía.
El crecimiento de las exportaciones mide el cambio porcentual en el valor de los bienes y servicios que un país vende al exterior de un período a otro (Familiarize Team, 2026). En pocas palabras, demuestra si un país tiene mayor o menor ventas en el mundo con el paso del tiempo. Si el porcentaje es positivo, el país está fortaleciendo su posición en los mercados internacionales ,pero cuando es negativo, significa que sus ventas al exterior cayeron, lo que puede indicar menor demanda global de sus productos.
Esta variable se incluyó porque cuando un país crece en términos de ventas, refleja lo desarrollada y competitiva que es su economía. Un país que vende cada vez más al mundo tiene una economía más fuerte porque tiene productos que otros países quieren comprar, pero si las exportaciones no crecen puede tener problemas de pocos productos. (Familiarize Team, 2026).
Un país que crece constantemente en exportaciones tiene una economía más conectada con el mundo. Por eso esta variable es útil para la segmentación, ya que hay países que año tras año venden más al mundo y otros cuyas exportaciones no crecen o incluso caen. Esa diferencia crea grupos de países con comportamientos económicos distintos, cuyo análisis de clustering puede identificar y separar.
3.1.6) Crecimiento de importaciones de bienes y servicios (x16)
El crecimiento de Importaciones suponen la posibilidad de acceder a productos más baratos o más eficientes, con el fin de aumentar el bienestar de los consumidores.
Las importaciones son todos los bienes y servicios que un país compra a otros países para satisfacer necesidades que no puede cubrir por sí solo, por lo que se benefician de la posibilidad de acceder a productos más baratos o más eficientes, con el fin de aumentar el bienestar de los países. Su crecimiento mide el cambio porcentual en el que un país está comprando más o menos bienes o servicios al mundo con el paso del tiempo. (Fanjul, s.f.) .
Esta variable se incluyó porque si las importaciones de un país crecen, significa que su economía tiene la capacidad para comprar más productos del exterior. Sin embargo, si un país compra mucho más de lo que vende al exterior, puede estar gastando más de lo que genera, lo que con el tiempo crea problemas económicos.
Por eso, comparar cómo crecen las importaciones entre países permite ver cuáles tienen una economía más activa y abierta al exterior. Esa diferencia ayuda a agrupar los países en perfiles económicos distintos dentro de la dimensión de posición externa.
El PIB mide el valor total de todos los bienes y servicios que produce un país en un período determinado y también se usa para conocer el tamaño de una economía. Al comparar el PIB de distintos países usando el tipo de cambio, resulta ser problemático porque los precios de los productos no son iguales en todos los países.
Para solucionar ese problema se usan las paridades de poder adquisitivo, que son tasas de conversión que permiten comparar el PIB de distintos países eliminando las diferencias de precios entre ellos (OCDE, 2020.). Es decir, el PIB en PPA muestra cuánto produce cada economía dependiendo de lo que se puede comprar en cada país. (Summa Edu, s.f.).
Por lo anterior, se escogió esta variable porque permite comparar la economía de los países de la OCDE de forma justa y real. Debido a que, los países con precios muy bajos serían considerados más pequeños de lo que realmente son y viceversa con los países con precios más grandes. En la segmentación, esta variable ayuda a diferenciar entre economías grandes y pequeñas según su producción real, lo que es fundamental para identificar grupos de países con niveles de desarrollo similares.
El crecimiento del PIB real mide el cambio porcentual en el valor de todos los bienes y servicios que produce un país de un año a otro (Banton, 2025). Pero no se cuenta la inflación porque un país podría parecer que mejoró económicamente, pero en realidad solo subieron los precios de sus productos. (OCDE, s.f.).
Cuando el crecimiento es positivo significa que la economía se está expandiendo, las empresas producen más, se crean empleos y hay más actividad económica. Cuando es negativo, significa que la economía se está debilitando, no venden tanto, los empleos disminuyen, hasta pueden llegar a un punto donde el país entra en recesión (Banton, 2025).
Se tomó en cuenta esta variable porque permite comparar qué tan rápido o lento está creciendo cada país, con el fin de identificar grupos donde ocurre ese similar comportamiento. La segmentación permite diferenciar entre países con economías en expansión fuerte, países con crecimiento moderado y países que no crecieron, lo que hace que el clustering los separe en grupos distintos.
El deflactor del PIB mide el impacto de la inflación en la producción total de la economía, lo hace para saber si un país ha crecido económicamente o solo aumentaron los precios (Raisin, 2026).
Por ejemplo, si un país produjo exactamente los mismos bienes que el año anterior pero sus precios subieron, entonces su PIB nominal aumentaría aún sin haber producido nada más. El deflactor del PIB permite interpretar esa situación y mostrar cuánto creció realmente la economía sin tener en cuenta el efecto que se hace con los precios (Raisin, 2026).
Esta variable se tomó en cuenta para el análisis porque las presiones inflacionarias internas de cada país son diferentes para el resto del mundo y esa diferencia dice mucho sobre cómo está organizada su economía (Equipo de Investopedia, 2026). Hay países con precios muy estables y otros con inflación muy alta, como fue el caso de Turquía en los datos analizados. Esa diferencia permite agrupar países según sus condiciones de precios internas, lo que genera perfiles económicos claramente distintos dentro de la dimensión de dinámica productiva.
La formación bruta de capital fijo mide cuánto está invirtiendo un país en activos que le permiten producir bienes y servicios en el futuro, como maquinaria, construcción, entre otros (OCDE, s.f.). Esta variable mide específicamente el cambio porcentual de esa inversión de un período a otro, es decir, si un país está invirtiendo más o menos que el año anterior.
Cuando esta inversión crece, significa que las empresas quieren expandir su capacidad productiva, lo que generalmente indica confianza en la economía. Cuando baja, puede ser porque las empresas no quieren arriesgarse a expandir por cierta incertidumbre económica o falta de financiamiento.(OCDE, s.f.).
Esta variable se incluyó porque la inversión que hace un país refleja su capacidad para crecer en el futuro. Países que invierten mucho tienen economías más dinámicas y con mayor potencial de crecimiento, mientras que países con inversión estancada o en caída pueden estar enfrentando dificultades estructurales. Esa diferencia es clave para agrupar países con perfiles de dinamismo económico similares dentro de la dimensión de dinámica productiva.
El gasto de consumo final del gobierno incluye todos los gastos que realiza el Estado para adquirir bienes y servicios destinados a satisfacer las necesidades de la población, como educación, salud, seguridad y administración pública (Eustat, s.f.).En otras palabras, es lo que gasta el Estado para prestar servicios a los ciudadanos.
Esta variable se incluyó porque el tamaño del gasto del gobierno refleja directamente el rol que tiene el Estado en la economía de cada país. Hay países donde el gobierno gasta mucho y tiene una presencia fuerte en la economía y otros donde el gasto es menor y el sector privado es más importante en la economía. Esa diferencia dentro de cada economía genera perfiles estructurales distintos que el análisis de clustering puede identificar y agrupar dentro de la dimensión de gasto interno.
El consumo privado mide todo lo que gastan las personas y familias en bienes y servicios, como alimentación, vivienda, transporte, salud y educación. Es uno de los componentes más importantes de la economía porque en la mayoría de los países representa entre la mitad y dos tercios del PIB, lo que lo convierte en el principal motor del crecimiento económico. Esta variable mide el cambio porcentual que tienen las familias sobre ese gasto de un año a otro.(Focus Economics, 2026).
Cuando el consumo aumenta, significa que las familias tienen más dinero disponible y confianza para gastar. Cuando disminuye, puede ser que las personas tengan menos ingresos disponibles.
Esta variable se incluyó porque el comportamiento del gasto de las familias refleja la economía dentro de un país. Países donde las familias gastan cada vez más tienen economías más dinámicas que aquellos donde no tienen mucho consumo, lo que genera perfiles económicos distintos dentro de la dimensión de gasto interno que el clustering puede identificar.
El gasto público es la cantidad total de dinero que desembolsa el Estado para desarrollar sus actividades y cumplir con sus objetivos hacia la sociedad, como reducir la desigualdad, redistribuir la riqueza o satisfacer diferentes necesidades a los ciudadanos de un país (Economipedia, 2026). Es por eso que esta variable mide el cambio porcentual de ese gasto de un período a otro.
Esta variable se incluyó porque no todos los gobiernos de la OCDE tienen la misma tendencia en su gasto. Hay países que aumentan su inversión pública constantemente y otros que disminuyen, lo que lleva a una diferencia económica en distintos países. Esa diferencia en cómo evoluciona el gasto público de cada país permite identificar perfiles económicos distintos dentro de la dimensión de gasto interno y agrupar países con comportamientos similares.
La tasa de desempleo es un indicador que muestra el porcentaje de personas que están buscando trabajo activamente pero no lo tienen (CEUPE, 2026). Quiere decir que mide la proporción de la población que puede y quiere trabajar, pero no tiene empleo. Esta variable incluye tanto a los empleados como a los que están buscando trabajo. (OCDE, s.f.).
Una tasa de desempleo baja generalmente indica que la economía está funcionando bien y generando suficientes empleos. Una tasa alta puede indicar que la economía no está creciendo lo suficiente como para que esas personas puedan trabajar, lo que genera problemas económicos. (CEUPE, 2026).
Esta variable se incluyó porque el nivel de desempleo de un país refleja las condiciones del mercado laboral y el bienestar de la población. Hay países de la OCDE con tasas de desempleo muy bajas como Japón o Corea y otros con tasas altas como Grecia o Colombia, lo que esta diferencia resulta ser clave para agrupar países con perfiles laborales similares dentro de la dimensión de mercado laboral.
La tasa de interés de corto plazo es el tipo de interés al que los bancos prestan dinero a corto plazo, y es influida por la política monetaria de los bancos centrales. Es decir, es el costo del dinero en un país para operaciones de corto plazo y también las decisiones que toma el banco para controlar la economía.
Cuando un banco central sube esta tasa,el dinero prestado es más caro, lo que frena el consumo y la inversión pero ayuda a controlar la inflación. Cuando la baja, el crédito se vuelve más asequible y estimula el crecimiento económico (Economía Mundial, 2025).
Esta variable se incluyó porque la tasa de interés de corto plazo refleja la postura económica de cada país en un momento determinado. Países con tasas muy altas generalmente están luchando contra la inflación, mientras que países con tasas bajas están intentando estimular su economía. Esa diferencia entre países permite identificar perfiles económicos distintos dentro de la dimensión de mercado laboral, ya que las condiciones monetarias afectan directamente el empleo y la inversión de cada nación.
library(readxl)
library(dplyr)
library(tidyverse)
library(ggplot2)
library(psych)
library(ggcorrplot)
library(factoextra)
library(FactoMineR)
library(FactoClass)
library(cluster)
library(dendextend)
library(ade4)
DatosEcon <- read_excel("DatosEcon.xlsx", sheet = "Data")
variables_seleccionadas <- c("Pais", "x1", "x2", "x4", "x6", "x8",
"x11", "x15", "x16", "x17", "x19",
"x20", "x21", "x22", "x26", "x29")
DatosSelec <- DatosEcon %>%
select(all_of(variables_seleccionadas))
DatosFinal <- as.data.frame(DatosSelec)
rownames(DatosFinal) <- DatosFinal$Pais
DatosFinal$Pais <- NULL
DatosL <- as.data.frame(scale(DatosFinal))
tabla_desc <- data.frame(
Variable = names(DatosFinal),
Media = round(sapply(DatosFinal, mean, na.rm = TRUE), 3),
Mediana = round(sapply(DatosFinal, median, na.rm = TRUE), 3),
SD = round(sapply(DatosFinal, sd, na.rm = TRUE), 3),
Minimo = round(sapply(DatosFinal, min, na.rm = TRUE), 3),
Maximo = round(sapply(DatosFinal, max, na.rm = TRUE), 3),
Asimetria = round(sapply(DatosFinal, function(x) psych::skew(x, na.rm = TRUE)), 3)
)
tabla_desc %>%
kable(
format = "html",
align = "c",
row.names = FALSE,
caption = "<center><span style='color: #000000; opacity: 1;'>Tabla 2: Estadísticas Descriptivas de las Variables</span></center>"
) %>%
kable_styling(
bootstrap_options = c("hover", "condensed", "responsive"),
full_width = FALSE,
position = "center",
font_size = 14
) %>%
row_spec(0, bold = TRUE, color = "white", background = "#1A365D") %>% #
row_spec(1:nrow(tabla_desc), background = "#FFFFFF", color = "#2D3748") %>%
column_spec(1, bold = TRUE, color = "#1A365D", background = "#EDF2F7", width = "10em") %>%
column_spec(2, width = "20em") %>%
column_spec(3, width = "20em") %>%
column_spec(4, width = "20em") %>%
column_spec(5, width = "20em") %>%
column_spec(6, width = "20em") %>%
column_spec(7, width = "20em")
| Variable | Media | Mediana | SD | Minimo | Maximo | Asimetria |
|---|---|---|---|---|---|---|
| x1 | 1.012000e+00 | 3.560000e-01 | 5.079000e+00 | -7.282000e+00 | 1.491300e+01 | 0.731 |
| x2 | 7.987000e+00 | 1.300000e+00 | 1.822000e+01 | 7.270000e-01 | 9.508200e+01 | 3.714 |
| x4 | 3.762049e+11 | 2.106370e+11 | 4.947373e+11 | 8.363996e+09 | 2.751302e+12 | 2.994 |
| x6 | 1.615331e+13 | 3.209043e+11 | 5.883308e+13 | 4.701223e+09 | 3.376846e+14 | 4.304 |
| x8 | 1.000000e-03 | -6.000000e-03 | 5.100000e-02 | -8.900000e-02 | 2.790000e-01 | 3.853 |
| x11 | 1.545227e+12 | 5.341115e+11 | 3.230601e+12 | 1.884749e+10 | 2.052937e+13 | 4.850 |
| x15 | 1.067000e+01 | 1.040500e+01 | 6.887000e+00 | -3.586000e+00 | 2.782300e+01 | 0.261 |
| x16 | 1.282400e+01 | 1.312500e+01 | 8.240000e+00 | -8.283000e+00 | 3.546500e+01 | 0.447 |
| x17 | 6.415000e+00 | 5.291000e+00 | 2.870000e+00 | 1.641000e+00 | 1.342700e+01 | 0.806 |
| x19 | 6.085000e+00 | 3.068000e+00 | 9.122000e+00 | -8.680000e-01 | 5.415200e+01 | 3.845 |
| x20 | 7.344000e+00 | 6.599000e+00 | 1.081200e+01 | -3.907000e+01 | 3.531800e+01 | -1.089 |
| x21 | 6.611000e+00 | 5.733000e+00 | 3.929000e+00 | 3.990000e-01 | 2.050500e+01 | 1.367 |
| x22 | 4.460000e+00 | 4.027000e+00 | 2.781000e+00 | 4.060000e-01 | 1.263100e+01 | 0.966 |
| x26 | 7.372000e+00 | 6.082000e+00 | 5.268000e+00 | 2.820000e+00 | 3.426700e+01 | 3.287 |
| x29 | 9.960000e-01 | 2.000000e-02 | 3.171000e+00 | -7.390000e-01 | 1.871400e+01 | 4.220 |
La Tabla 2 presenta las estadísticas descriptivas de las quince
variables económicas seleccionadas para el análisis. Los resultados
evidencian una importante heterogeneidad entre los indicadores
considerados, tanto en magnitud como en dispersión. Variables asociadas
al tamaño de la economía y a la actividad comercial, como el PIB y el
comercio de bienes y servicios, presentan valores considerablemente
superiores a los observados en indicadores de crecimiento o tasas
económicas.
Asimismo, se identifican diferencias importantes entre medias y medianas en varias variables, lo que sugiere distribuciones asimétricas. Este comportamiento se confirma mediante los coeficientes de asimetría, donde variables como x6, x11, x19, x26 y x29 presentan valores positivos elevados, indicando la presencia de países con desempeños significativamente superiores al promedio de la muestra.
Las diferencias observadas en escala y dispersión justifican la estandarización de las variables antes de aplicar técnicas multivariadas como el Análisis de Componentes Principales (ACP) y los métodos de clusterización, evitando que las variables de mayor magnitud dominen los resultados del análisis.
DatosFinal_long <- DatosFinal %>%
rownames_to_column(var = "Pais") %>%
pivot_longer(cols = -Pais, names_to = "Variable", values_to = "Valor")
ggplot(DatosFinal_long, aes(x = Valor)) +
geom_histogram(fill = "steelblue", color = "white", bins = 12) +
facet_wrap(~Variable, scales = "free", ncol = 4) +
labs(title = "",
x = "Valor", y = "Frecuencia") +
theme_minimal(base_size = 9) +
theme(plot.title = element_text(face = "bold", hjust = 0.5))
Figura 1. Distribución de las Variables Economicas.
Nota: Las
variables se presentan en sus unidades originales, por lo que algunas
distribuciones muestran escalas considerablemente mayores que
otras.
La Figura 1 presenta la distribución de las variables económicas
seleccionadas para el análisis. Se observan diferencias importantes en
la forma y dispersión de los indicadores, evidenciando la heterogeneidad
económica existente entre los países de la OECD. Varias variables
presentan distribuciones asimétricas y una concentración de
observaciones en rangos específicos, mientras que otras muestran la
presencia de valores extremos alejados de la tendencia central.
Asimismo, las variables relacionadas con el tamaño de la economía y el comercio internacional exhiben escalas considerablemente mayores que las variables de crecimiento y tasas económicas. Estos resultados son consistentes con las estadísticas descriptivas previamente obtenidas y respaldan la necesidad de estandarizar las variables antes de aplicar el Análisis de Componentes Principales (ACP) y los métodos de agrupamiento.
mat_cor <- cor(DatosFinal, use = "complete.obs", method = "pearson")
corrgr <- ggcorrplot(mat_cor,
type = "lower",
lab = TRUE,
lab_size = 2.5,
hc.order = TRUE,
colors = c("#E74C3C", "white", "#2980B9"),
title = "",
ggtheme = theme_minimal()) +
theme(plot.title = element_text(face = "bold", hjust = 1, size = 20),
axis.text.x = element_text(size = 7),
axis.text.y = element_text(size = 7))
corrgr
Figura 2. Matríz de correlaciones de Pearson
La Figura 2 presenta la matriz de correlación de las variables económicas seleccionadas para el estudio. Los resultados evidencian la existencia de relaciones tanto positivas como negativas entre los indicadores considerados, reflejando la interacción de distintos factores económicos presentes en los países de la OECD.
Entre las correlaciones positivas más relevantes se destaca la
relación entre las variables x4 y x11 (r =
0.89), así como entre x17 y x21 (r = 0.74) y
entre x2 y x16 (r = 0.72). Estas asociaciones
sugieren que los países con mayores niveles de actividad económica y
comercio internacional tienden a presentar comportamientos similares en
otras dimensiones relacionadas con el crecimiento y la dinámica
productiva.
Por otra parte, se identifican correlaciones negativas importantes
entre algunas variables. Destacan especialmente las relaciones entre
x8 y x20 (r = -0.70), x8 y
x16 (r = -0.63), así como entre x1 y
x21 (r = -0.57). Estas correlaciones indican que ciertos
indicadores presentan comportamientos opuestos dentro de la muestra
analizada, evidenciando diferencias estructurales entre las economías
consideradas.
En términos generales, la presencia de correlaciones moderadas y altas entre varias de las variables indica que existe información compartida y redundancia parcial dentro del conjunto de datos. Este resultado respalda la aplicación del Análisis de Componentes Principales (ACP), ya que dicha técnica permite sintetizar la información contenida en múltiples variables correlacionadas en un número reducido de componentes, facilitando la interpretación de los patrones económicos presentes en la muestra.
res.pca <- prcomp(DatosFinal, scale = TRUE)
res.var <- get_pca_var(res.pca)
eigenvalues <- get_eigenvalue(res.pca)
fviz_eig(res.pca,
addlabels = TRUE,
barfill = "steelblue",
barcolor = "steelblue3",
linecolor = "#E74C3C",
ylim = c(0, 60),
main = "",
xlab = "Componentes Principales",
ylab = "% de Varianza Explicada") +
geom_hline(yintercept = (1 / ncol(DatosFinal)) * 100,
linetype = "dashed",
color = "orange",
linewidth = 0.8) + # <- CORREGIDO: antes era size = 0.8
theme_minimal() +
theme(plot.title = element_text(face = "bold", hjust = 0.5))
Figura 3. Gráfico de Sedimentación
La Figura 3 presenta el gráfico de sedimentación (Scree Plot) obtenido a partir del Análisis de Componentes Principales (ACP). Los resultados muestran que el primer componente principal (CP1) explica el 26,3% de la variabilidad total de los datos, mientras que el segundo y tercer componente explican el 15,1% y 12,5%, respectivamente.
De manera conjunta, los tres primeros componentes concentran aproximadamente el 54% de la variabilidad total, lo que indica que una proporción importante de la información contenida en las quince variables originales puede resumirse mediante un número reducido de dimensiones. Adicionalmente, de acuerdo con el criterio de Kaiser, los seis primeros componentes presentan porcentajes de varianza superiores al umbral de referencia (6,67%), por lo que contienen información relevante para la representación de la estructura de los datos.
La marcada disminución de la varianza explicada después de los primeros componentes evidencia que gran parte de la información se concentra en las dimensiones iniciales. Por esta razón, el análisis posterior se centra principalmente en los primeros componentes principales, los cuales permiten interpretar los patrones económicos predominantes entre los países analizados.
varianza_pct <- round(summary(res.pca)$importance[2, 1:3] * 100, 2)
top_cp1 <- paste(names(sort(res.var$contrib[, 1], decreasing = TRUE)[1:5]), collapse = ", ")
top_cp2 <- paste(names(sort(res.var$contrib[, 2], decreasing = TRUE)[1:5]), collapse = ", ")
top_cp3 <- paste(names(sort(res.var$contrib[, 3], decreasing = TRUE)[1:5]), collapse = ", ")
tabla_contrib <- data.frame(
Componente = c("CP1", "CP2", "CP3"),
Varianza_pct = varianza_pct,
Top_Variables = c(top_cp1, top_cp2, top_cp3)
)
rownames(tabla_contrib) <- NULL
tabla_contrib %>%
kable(
format = "html",
align = "c",
caption = "<center><span style='color: #000000; opacity: 1;'>Tabla 4: Variables y Varianza por Componente Principal</span></center>"
) %>%
kable_styling(
bootstrap_options = c("hover", "condensed", "responsive"),
full_width = FALSE,
position = "center",
font_size = 14
) %>%
row_spec(0, bold = TRUE, color = "white", background = "#1A365D") %>%
row_spec(1:3, background = "#FFFFFF", color = "#2D3748",) %>%
column_spec(1, bold = TRUE, color = "#1A365D", background = "#EDF2F7", width = "10em") %>%
column_spec(2, width = "10em") %>%
column_spec(3, width = "15em")
| Componente | Varianza_pct | Top_Variables |
|---|---|---|
| CP1 | 26.33 | x16, x21, x20, x1, x17 |
| CP2 | 15.13 | x8, x15, x29, x17, x1 |
| CP3 | 12.55 | x11, x4, x22, x29, x19 |
La Tabla 4 presenta las variables con mayor contribución a cada uno de los tres primeros componentes principales. Estos componentes concentran aproximadamente el 54% de la variabilidad total de los datos y permiten sintetizar gran parte de la información contenida en las quince variables económicas originales.
El primer componente principal (CP1), que explica el 26,33% de la
varianza total, está determinado principalmente por las variables
x16, x21, x20, x1 y
x17. Debido a que es el componente con mayor capacidad
explicativa, puede interpretarse como la dimensión económica
predominante dentro de la muestra analizada, concentrando gran parte de
las diferencias existentes entre los países.
El segundo componente principal (CP2), responsable del 15,13% de la
variabilidad, está asociado principalmente con las variables
x8, x15, x29, x17 y
x1. Este componente captura información complementaria a la
representada por el CP1, permitiendo identificar patrones económicos
adicionales que no son explicados por la primera dimensión.
Por su parte, el tercer componente principal (CP3) explica el 12,55%
de la varianza total y está influenciado principalmente por las
variables x11, x4, x22,
x29 y x19. Este componente incorpora aspectos
específicos del comportamiento económico de los países que contribuyen a
diferenciar observaciones con características similares en los primeros
componentes.
En conjunto, los tres componentes principales permiten resumir la estructura de los datos y facilitan la identificación de patrones y agrupaciones entre los países analizados, reduciendo significativamente la complejidad del conjunto original de variables.
fviz_pca_ind(res.pca,
repel = TRUE,
col.ind = "cos2",
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
pointsize = 2,
labelsize = 3,
title = "") +
theme_minimal() +
theme(plot.title = element_text(face = "bold", hjust = 0.5))
Figura 4. Gráfico de Individuos (Países - PCA)
La Figura 4 muestra la representación de los países en el plano definido por los dos primeros componentes principales, los cuales explican conjuntamente aproximadamente el 41,4% de la variabilidad total de los datos. Esta representación permite visualizar las similitudes y diferencias existentes entre las economías analizadas a partir de las variables económicas seleccionadas.
Se observa una concentración importante de países alrededor del origen del plano factorial, especialmente varias economías europeas, lo que sugiere comportamientos relativamente similares respecto a los indicadores considerados. Por otro lado, países como Chile, Colombia, Perú, Argentina e India se ubican hacia valores positivos del primer componente principal, reflejando características económicas diferenciadas respecto al grupo central.
Asimismo, destacan algunos casos particulares que aparecen claramente alejados del resto de observaciones. Irlanda presenta una posición extrema en el cuadrante inferior izquierdo, mientras que Türkiye se ubica considerablemente distante en la parte inferior del gráfico. Estas posiciones sugieren perfiles económicos atípicos en comparación con el promedio de los países analizados.
La presencia de agrupamientos visuales y de países claramente diferenciados proporciona evidencia preliminar de que existen estructuras y patrones económicos comunes dentro de la muestra. Este resultado respalda la aplicación de técnicas de clusterización en la siguiente etapa del análisis, con el fin de identificar formalmente grupos de países con características económicas similares.
DatosL_num <- DatosL
fviz_nbclust(DatosL_num,
FUNcluster = kmeans,
method = "wss",
k.max = 10,
linecolor = "#2980B9") +
geom_vline(xintercept = 3, linetype = "dashed", color = "red") +
labs(title = "",
subtitle = "Buscar el punto de quiebre ('codo') en la curva",
x = "Número de Clusters (k)",
y = "Suma de Cuadrados Intra-cluster (WSS)") +
theme_minimal() +
theme(plot.title = element_text(face = "bold", hjust = 0.5))
Figura 5. Método del Codo (WSS) para K-Means
La Figura 5 presenta el método del codo aplicado al algoritmo K-Means. Este procedimiento evalúa la suma de cuadrados intra-cluster (WSS) para diferentes valores de k, permitiendo identificar el punto a partir del cual agregar nuevos grupos genera mejoras cada vez menores en la reducción de la variabilidad interna.
Los resultados muestran una disminución importante del WSS entre uno y tres grupos, observándose posteriormente una reducción más gradual. El punto de inflexión de la curva se ubica alrededor de k = 3, lo que sugiere que una partición en tres clusters representa una alternativa adecuada para segmentar los países analizados sin introducir una complejidad excesiva en la clasificación.
fviz_nbclust(DatosL_num,
FUNcluster = kmeans,
method = "silhouette",
k.max = 10,
linecolor = "#E74C3C") +
labs(title = "",
subtitle = "Seleccionar k con el mayor coeficiente silhouette promedio",
x = "Número de Clusters (k)",
y = "Silhouette Promedio") +
theme_minimal() +
theme(plot.title = element_text(face = "bold", hjust = 0.5))
Figura 6. Método Silhouette para K-Means
La Figura 6 presenta los resultados del método Silhouette, utilizado para evaluar la calidad de la agrupación obtenida para diferentes valores de k. Este indicador mide simultáneamente la cohesión interna de cada grupo y la separación respecto a los demás clusters.
Los resultados muestran que el mayor coeficiente Silhouette promedio se obtiene cuando k = 2, alcanzando un valor aproximado de 0,37. Esto indica que una solución de dos grupos proporciona la mejor separación relativa entre observaciones según este criterio. Sin embargo, para la selección final del número de clusters también se consideran los resultados del método del codo y la interpretación económica de los grupos obtenidos.
En conjunto, el análisis Silhouette proporciona una referencia adicional para evaluar la calidad de las particiones generadas mediante K-Means y complementar los criterios utilizados para la segmentación final de los países.
Aunque el criterio Silhouette sugirió una solución de dos grupos, el método del codo identificó un punto de inflexión claro en k = 3. Adicionalmente, la solución de tres clusters permitió una mejor diferenciación económica de los países analizados, por lo que se adoptó esta configuración para el análisis final.
Para tomar la preferencia por k=3 sobre k=2, se tomaron en cuenta dos aspectos. El primero es el punto de vista estadístico, en donde el método del codo demostró que pasar de dos a tres grupos genera una reducción importante en la variabilidad interna, mientras que agregar un cuarto grupo ya no produce mejoras significativas. Desde el punto de vista económico, una solución de dos grupos resultaba insuficiente para capturar la heterogeneidad estructural en la muestra, ya que concentraba la mayoría de los países en un único bloque sin diferenciar sus perfiles macroeconómicos. Con tres grupos, fue posible identificar economías con dinámicas distintas en términos de crecimiento, inserción comercial y tamaño económico, lo que da mayor análisis para el trabajo y justifica la elección de esta configuración.
k_optimo <- 3
set.seed(123)
modelo_kmeans <- kmeans(DatosL_num,
centers = k_optimo,
nstart = 25,
iter.max = 100)
DatosFinal$Cluster <- as.factor(modelo_kmeans$cluster)
tabla_paises_cluster <- data.frame(
Pais = rownames(DatosFinal),
Cluster = DatosFinal$Cluster
) %>% arrange(Cluster, Pais)
fviz_cluster(modelo_kmeans,
data = DatosL_num,
palette = c("#E74C3C", "#2ECC71", "#3498DB",
"#9B59B6", "#F39C12"),
ellipse.type = "convex",
repel = TRUE,
labelsize = 8,
pointsize = 2,
ggtheme = theme_minimal(),
main = paste0()) +
theme(plot.title = element_text(face = "bold", hjust = 0.5))
Figura 7. Clusters K-Means, k=3
Aplicando el algoritmo K-Means con tres clusters, los países fueron agrupados de acuerdo con sus características económicas sintetizadas mediante el Análisis de Componentes Principales. La Figura X presenta la distribución de los países en los grupos obtenidos.
El Cluster 1 reúne economías caracterizadas por una posición externa favorable y elevadas tasas de crecimiento económico. Este grupo presenta los mayores valores promedio en cuenta corriente como porcentaje del PIB y crecimiento del PIB real, además de un comportamiento moderado de las importaciones, lo que sugiere economías con una situación externa relativamente sólida.
El Cluster 2 agrupa países con una fuerte dinámica comercial y una elevada interacción con los mercados internacionales. Este grupo registra los mayores crecimientos tanto de exportaciones como de importaciones, reflejando economías altamente abiertas y con una intensa participación en el comercio exterior.
Por su parte, el Cluster 3 está conformado por economías de mayor tamaño relativo, evidenciado por sus elevados niveles promedio de PIB y volumen de comercio internacional. Sin embargo, presentan tasas de crecimiento más moderadas en comparación con los otros grupos, lo que sugiere estructuras económicas más consolidadas y maduras.
En conjunto, los resultados muestran que los países de la muestra no conforman un grupo homogéneo, sino que pueden clasificarse en perfiles económicos diferenciados según su crecimiento, inserción internacional y tamaño económico.
La solución final de K-Means identificó tres grupos diferenciados. El primer cluster estuvo conformado únicamente por Irlanda, país que presentó características suficientemente distintas para constituir un grupo independiente. El segundo cluster agrupó once países con perfiles económicos diferenciados respecto al promedio de la muestra, mientras que el tercer cluster reunió treinta países y concentró la mayor parte de las economías desarrolladas analizadas. Esta distribución confirma la existencia de heterogeneidad económica dentro de la OECD y evidencia la capacidad del modelo para identificar perfiles claramente diferenciados.
dist_matrix <- dist(DatosL_num, method = "euclidean")
hc_ward <- hclust(dist_matrix, method = "ward.D2")
dend_ward <- as.dendrogram(hc_ward)
dend_ward <- dend_ward %>%
color_branches(k = k_optimo) %>%
color_labels(k = k_optimo)
par(mar = c(4, 2, 3, 10))
plot(dend_ward,
horiz = TRUE,
main = paste0(""),
sub = "Clustering Jerárquico de Países OECD",
xlab = "Distancia de Ward",
cex = 0.7)
Figura 8. Dendrograma - Método Ward (k=3)
La Figura 8 presenta el dendrograma obtenido mediante el método jerárquico de Ward. Este procedimiento permite visualizar la estructura de similitud entre los países y la forma en que se agrupan progresivamente de acuerdo con sus características económicas.
Los resultados muestran una estructura de agrupación consistente con la obtenida mediante el algoritmo K-Means. En particular, se observa un grupo conformado por economías con perfiles diferenciados respecto al conjunto principal de países, mientras que la mayoría de las economías desarrolladas permanecen agrupadas dentro de un bloque relativamente homogéneo. Asimismo, Irlanda aparece como una observación claramente diferenciada del resto de países, lo que coincide con los resultados obtenidos en el análisis de K-Means.
La similitud entre ambas metodologías sugiere que los patrones identificados son estables y reflejan diferencias económicas reales dentro de la muestra analizada, fortaleciendo la validez de los grupos obtenidos.
Los resultados obtenidos mediante el Análisis de Componentes Principales (ACP), el algoritmo K-Means y el método jerárquico de Ward muestran una estructura de agrupación consistente entre los países analizados. En primer lugar, el ACP permitió identificar diferencias económicas relevantes entre las observaciones y evidenció la presencia de países con perfiles claramente diferenciados, como Irlanda y Türkiye, así como un conjunto amplio de economías concentradas alrededor del centro del espacio factorial.
Posteriormente, la aplicación de K-Means con k = 3 permitió segmentar los países en tres grupos. El primer cluster estuvo conformado únicamente por Irlanda, lo que evidencia la existencia de características económicas atípicas respecto al resto de la muestra. El segundo cluster agrupó once países con comportamientos diferenciados en términos de crecimiento económico, inserción internacional y dinámica productiva. Finalmente, el tercer cluster reunió treinta países y concentró la mayor parte de las economías desarrolladas analizadas.
Los resultados obtenidos mediante el método Ward fueron altamente consistentes con los observados en K-Means. El dendrograma mostró una estructura de agrupación similar, identificando un grupo principal compuesto por la mayoría de economías desarrolladas, un conjunto de países con características económicas diferenciadas y nuevamente el caso particular de Irlanda como observación claramente separada del resto.
La coincidencia entre ambas metodologías fortalece la robustez de los resultados obtenidos y sugiere que los grupos identificados reflejan diferencias económicas reales dentro de la muestra. En términos generales, las agrupaciones encontradas están asociadas a factores relacionados con el crecimiento económico, la apertura comercial, la posición externa y el tamaño de las economías, variables que fueron identificadas previamente como determinantes en los componentes principales.
En conjunto, los resultados confirman la existencia de heterogeneidad económica entre los países analizados y evidencian que, aun dentro de economías pertenecientes o asociadas a la OCDE, pueden identificarse perfiles diferenciados cuando se consideran simultáneamente múltiples indicadores macroeconómicos.
El presente trabajo permitió analizar las diferencias económicas existentes entre 42 países pertenecientes o asociados a la OCDE mediante técnicas de aprendizaje no supervisado. A partir de quince variables económicas agrupadas en las dimensiones de posición externa, dinámica productiva, gasto interno y mercado laboral, fue posible identificar patrones comunes y estructuras de agrupación entre las economías estudiadas.
El análisis descriptivo evidenció una importante heterogeneidad entre los países de la muestra, observándose diferencias significativas en términos de tamaño económico, comercio internacional, crecimiento, inflación y condiciones del mercado laboral. Asimismo, la presencia de correlaciones moderadas y altas entre varias variables justificó la aplicación del Análisis de Componentes Principales como herramienta de reducción de dimensionalidad.
Los resultados del ACP mostraron que los tres primeros componentes principales explican aproximadamente el 54% de la variabilidad total de los datos, permitiendo sintetizar gran parte de la información contenida en las quince variables originales. Las dimensiones identificadas estuvieron asociadas principalmente con factores relacionados con el crecimiento económico, la apertura comercial, la posición externa y el tamaño de las economías.
La aplicación de las técnicas de clusterización permitió identificar grupos de países con características económicas diferenciadas. Aunque el método Silhouette sugirió inicialmente una solución de dos grupos, la combinación de criterios estadísticos y económicos llevó a seleccionar una partición de tres clusters. Esta solución permitió una mejor representación de la heterogeneidad presente en la muestra y facilitó la interpretación de los perfiles económicos observados.
Tanto el algoritmo K-Means como el método jerárquico de Ward produjeron resultados consistentes, identificando estructuras de agrupación similares y destacando el caso particular de Irlanda como una observación claramente diferenciada respecto al resto de los países analizados. La coincidencia entre ambas metodologías fortalece la robustez de los resultados obtenidos y respalda la validez de los grupos identificados.
Finalmente, se concluye que sí existen grupos de países dentro de la OCDE que comparten perfiles económicos similares cuando se analizan simultáneamente indicadores relacionados con la posición externa, la dinámica productiva, el gasto interno y el mercado laboral. Los resultados obtenidos demuestran que, aun dentro de economías que comparten altos niveles de desarrollo institucional, persisten diferencias estructurales relevantes que permiten clasificarlas en grupos relativamente homogéneos según sus características macroeconómicas predominantes.
Ministerio de Economía, Comercio y Empresa. (s.f.). Organización para la Cooperación y el Desarrollo Económico. Gobierno de España. https://comercio.gob.es/PoliticaComercialUE/OMCOrganismosInternacionales/Paginas/ocde.aspx
OECD. (2023). OECD Economic Outlook, Volume 2023 Issue 1: A long unwinding road. OECD Publishing. https://www.oecd.org/en/publications/oecd-economic-outlook/volume-2023/issue-1_ce188438-en.html
OECD. (s.f.). OECD Data. OECD Publishing. https://www.oecd.org/en/data.html
OECD. (2022). Main Economic Indicators, Volume 2022 Issue 11. OECD Publishing. https://www.oecd.org/content/dam/oecd/en/publications/reports/2022/11/main-economic-indicators-volume-2022-issue-11_6284a3fe/a33047aa-en.pdf
Morales, Y. (2019, agosto 8). El indicador compuesto de la OCDE se mantiene arriba de 100 puntos. El Economista. https://www.eleconomista.com.mx/economia/Indicador-compuesto-de-la-OCDE-se-mantiene-arriba-de-100-puntos-20190808-0032.html
Sánchez, N. (2022). Análisis de Componentes Principales (ACP). RPubs. https://rpubs.com/nsanchezb1/930006
Keita, Z. (2024, marzo 1). Tutorial de análisis de componentes principales en R. DataCamp. https://www.datacamp.com/es/tutorial/pca-analysis-r
Gil Martínez, C. (2018, junio). Métodos de clustering. RPubs. https://rpubs.com/cristina_gil/clustering
Focus Economics. (s.f.). Saldo de la cuenta corriente. https://www.focus-economics.com/es/economic-indicator/current-account-balance/
Datosmacro. (s.f.). Tipo de cambio. Expansión. https://datosmacro.expansion.com/diccionario/tipo-de-cambio
Western Union. (s.f.). ¿Cómo funcionan los tipos de cambio de divisas? https://www.westernunion.com/blog/es/como-funcionan-los-tipos-de-cambio-de-divisas/
IEP. (2021, mayo 18). Negocios internacionales, exportación e importación. https://iep.edu.es/negocios-internacionales-exportacion-e-importacion/
Izquierdo Pina, S. (2024, octubre 26). Las exportaciones netas: un indicador clave de la competitividad económica internacional. Initzia. https://initzia.substack.com/p/las-exportaciones-netas-un-indicador
Familiarize Team. (2026, marzo 6). Tasa de crecimiento de exportaciones e importaciones: indicador económico y perspectivas del comercio global. Familiarize. https://docs.familiarize.com/es/glossary/exports-and-imports-growth-rate/
Fanjul, E. (s.f.). Importaciones, motor de crecimiento y bienestar. https://www.realinstitutoelcano.org/comentarios/importaciones-motor-crecimiento-bienestar/
Summa Edu. (s.f.). PIB PPA (USD actual). EduData. https://edudata.summaedu.org/glosario/pib-ppa-usd-actual/
OCDE. (2020). Paridades del poder adquisitivo (PPA). https://www.oecd.org/es/data/indicators/purchasing-power-parities-ppp.html
Equipo de Investopedia. (2026, abril 6). Comprender el deflactor de precios del PIB: una medida de inflación. Investopedia. https://www.investopedia.com/terms/g/gdppricedeflator.asp
Raisin. (2026). Qué es el deflactor del PIB y cómo se calcula. https://www.raisin.com/es-es/educacion-financiera/deflactor-del-pib/
OCDE. (s.f.). Formación bruta de capital fijo (FBCF). https://www.oecd.org/es/data/indicators/investment-gfcf.html
Eustat. (s.f.). Gasto en consumo final (P.3). Instituto Vasco de Estadística. https://es.eustat.eus/documentos/elem_3563/definicion.html
Focus Economics. (2026). Consumo privado (variación anual en %). https://www.focus-economics.com/es/economic-indicator/consumption/
Economipedia. (2026). Gasto público. https://economipedia.com/definiciones/gasto-publico.html
OCDE. (s.f.). Tasa de desempleo. https://www.oecd.org/es/data/indicators/unemployment-rate.html
CEUPE. (2026). ¿Qué es la tasa de desempleo? Cálculo, fórmula y ejemplo. https://www.ceupe.com/blog/tasa-de-desempleo.html
Economía Mundial. (2025). Tasa de interés: guía completa. https://www.economiamundial.es/glosario/politica-economica/tasa-de-interes/
StudySmarter. (2024, junio 26). Tasa de interés a corto plazo. https://www.studysmarter.es/resumenes/economia/sector-financiero/tasa-de-interes-a-corto-plazo/