Introducción:

El análisis de clasificación económica de países mediante técnicas de aprendizaje no supervisado ha cobrado relevancia significativa en la investigación económica contemporánea. La Organización para la Cooperación y el Desarrollo Económicos (OCDE) mantiene una extensa base de datos de indicadores macroeconómicos que permite realizar análisis comparativos entre países.

El presente estudio aprovecha estos datos para desarrollar una clasificación objetiva de 41 países, empleando técnicas estadísticas multivariadas avanzadas: el Análisis de Componentes Principales (ACP) y métodos de agrupamiento no supervisado, como el análisis de conglomerados. La complejidad de los sistemas económicos modernos, caracterizados por múltiples variables interrelacionadas, hace necesario el uso de técnicas que puedan manejar eficientemente esta multidimensionalidad. El ACP permite reducir esta complejidad identificando las principales dimensiones de variación en los datos, mientras que las técnicas de agrupamiento ayudan a identificar patrones naturales de similitud entre países.

Además, este enfoque combinado de ACP y análisis de los grupos resulta particularmente valioso, ya que las clasificaciones tradicionales de economías pueden estar sujetas a criterios subjetivos o políticos, mientras que un análisis basado en datos proporciona una perspectiva más objetiva y cuantificable. Adicionalmente, la inclusión de un conjunto de entrenamiento y un conjunto de prueba en el análisis permite evaluar la capacidad de generalización del modelo y su aplicabilidad a nuevos países.

En resumen, este estudio busca aprovechar la riqueza de los datos macroeconómicos de la OCDE para desarrollar una taxonomía robusta y representativa de las características económicas de los países, aportando una herramienta valiosa para el análisis comparativo y la toma de decisiones en el ámbito de la política económica.

Metodología

El estudio emplea una metodología basada en técnicas de aprendizaje no supervisado, específicamente el algoritmo k-means con el método de silueta y el método jerárquico de Ward. La base de datos inicial comprende 29 variables macroeconómicas para 42 países, incluyendo indicadores como balance de cuenta corriente como porcentaje del PIB, tipos de cambio, volúmenes de comercio internacional, gastos gubernamentales y privados, formación bruta de capital, tasas de crecimiento económico, deflactores de precios, indicadores laborales y tasas de interés.

El estudio emplea una metodología basada en técnicas de aprendizaje no supervisado, específicamente el algoritmo k-means con el método de silueta y el método jerárquico de Ward. La base de datos inicial comprende 29 variables macroeconómicas para 42 países, incluyendo indicadores como balance de cuenta corriente como porcentaje del PIB, tipos de cambio, volúmenes de comercio internacional, gastos gubernamentales y privados, formación bruta de capital, tasas de crecimiento económico, deflactores de precios, indicadores laborales y tasas de interés.

Basado en la base de datos de la OCDE, el estudio examina 29 variables macroeconómicas fundamentales que pueden categorizarse de la siguiente manera:

Comercio Internacional y Balanza de Pagos:

(x1) Saldo de cuenta corriente como porcentaje del PIB: Refleja la diferencia entre exportaciones e importaciones de bienes y servicios, así como transferencias unilaterales, mostrando el equilibrio entre ahorro e inversión de una economía.
(x2) Tipo de cambio por USD: Precio de la moneda nacional en función del dólar estadounidense, reflejando la fortaleza relativa de una divisa en los mercados internacionales.
(x3) Volumen de importaciones de bienes y servicios: Expresado en USD según criterios de cuentas nacionales, componente clave de la demanda agregada.
(x4) Volumen de comercio de bienes y servicios: Expresado en USD, factor determinante del crecimiento económico.
(x5) Volumen de exportaciones de bienes y servicios: En USD según cuentas nacionales, componente esencial de la demanda agregada.
(x8) Exportaciones netas, contribución al PIB real: Mide el impacto de las exportaciones netas en el crecimiento económico.

Producto Interno Bruto y Medidas Relacionadas:

(x9) PIB nominal a precios de mercado: Mide el tamaño de la economía en términos monetarios.
(x10) PIB en volumen a precios de mercado: Mide el crecimiento económico eliminando el efecto de la inflación.
(x11) PIB en volumen USD a paridad de poder adquisitivo constante: Permite comparaciones más precisas del PIB real entre países.
(x17/x18) Crecimiento del PIB en volumen: Principal medida del crecimiento económico.
(x19) Crecimiento del deflactor del PIB: Mide la variación de precios en todos los bienes y servicios.
(x25) Deflactor del PIB a precios de mercado: Medida general de la inflación en la economía.

Gasto y Consumo:

(x6) Gasto de consumo final del gobierno en volumen: Componente de la demanda agregada con impacto significativo en la actividad económica.
(x7) Gasto de consumo final privado en volumen: Principal componente de la demanda agregada, refleja el bienestar económico.
(x21) Crecimiento del gasto de consumo final privado: Indica el dinamismo del consumo privado.
(x22) Crecimiento del gasto de consumo final del gobierno: Refleja la evolución del componente público.

Comercio Internacional (Volúmenes y Crecimientos):

(x13) Volumen de importaciones: Refleja adquisiciones de bienes y servicios del exterior.
(x14) Volumen de exportaciones: Indica ventas de bienes y servicios al exterior.
(x15) Crecimiento del volumen de exportaciones: Mide el dinamismo del sector exportador.
(x16) Crecimiento del volumen de importaciones: Indica el dinamismo de la demanda interna.
(x23) Deflactor de exportaciones: Mide la variación de precios en bienes y servicios exportados.
(x24) Deflactor de importaciones: Mide la variación de precios en bienes y servicios importados.

Inversión:

(x12) Formación bruta de capital fijo total en volumen: Mide la adquisición neta de activos fijos por productores residentes.
(x20) Crecimiento de la formación bruta de capital fijo: Refleja la dinámica de inversión en activos fijos.

Mercado Laboral:

(x26) Tasa de desempleo: Proporción de población económicamente activa sin empleo.
(x27) Empleo total: Medido por encuesta de fuerza laboral, indica nivel de actividad económica.
(x28) Fuerza laboral: Población económicamente activa, incluye empleados y desempleados.

Variables Monetarias:

(x29) Tasa de interés a corto plazo: Indicador de política monetaria y condiciones financieras.

Esta clasificación detallada de variables proporciona una base sólida para el análisis multivariado posterior, permitiendo una comprensión integral de las diferentes dimensiones económicas que caracterizan a los países estudiados. La interrelación entre estas variables y su comportamiento conjunto será fundamental para identificar patrones y realizar la segmentación de países mediante las técnicas de ACP y análisis de clústeres.

Previo al análisis de agrupamiento, se realizó un estudio preliminar de las estadísticas descriptivas que permitió identificar valores atípicos significativos. Este análisis condujo a la exclusión de Corea del conjunto de datos debido a sus características híbridas que combinaban aspectos tanto de economías avanzadas como emergentes, lo cual podría distorsionar la formación de los clústeres.

Para el desarrollo del modelo k-means, se implementó un proceso de estandarización de las variables para eliminar el efecto de las diferentes escalas y unidades de medida, garantizando así que todas las variables contribuyan equitativamente al proceso de agrupamiento. Es importante señalar que, si bien los datos fueron estandarizados para el análisis de clústeres, las estadísticas descriptivas se mantuvieron en sus unidades originales para facilitar la interpretación contextual de los resultados

La implementación del algoritmo k-means resultó en la formación de dos clústeres distintivos: uno compuesto por 6 países identificados como economías avanzadas y otro que agrupa a 35 países.

Se realizó el respectivo estudio de la media, mediana y desviación estandar para los datos ya agrupados en el cluster con el fin de categorizar como “avanzados” ó “emergentes”, para posteriormente seleccionar una serie de variables que fueron consideradas como representativas del apartado socio/economico del que forman parte para evidenciar más ampliamente el comportamiento estadistico de los datos según cada categoría.

La selección de variables para cada categoría responde a su relevancia en reflejar aspectos estructurales de las economías en estudio, permitiendo una caracterización estadística precisa de los clústeres. El saldo de cuenta corriente (x1) es crucial para evidenciar el equilibrio externo de la economía, diferenciando economías con mayor o menor dependencia del comercio internacional. El PIB en volumen a precios de mercado (x10) permite una comparación del crecimiento económico real, excluyendo efectos inflacionarios, lo que es fundamental para observar el tamaño y estabilidad entre clústeres. El gasto de consumo final privado (x7) muestra el nivel de vida y el poder adquisitivo en cada economía, mientras que el volumen de exportaciones (x14) revela la orientación y competitividad de las economías en el comercio global. La formación bruta de capital fijo (x12) es indicativa de la inversión en infraestructura y capacidad productiva, y la tasa de desempleo (x26) proporciona una visión clara del estado del mercado laboral y la estabilidad económica. Finalmente, la tasa de interés a corto plazo (x29) refleja las condiciones financieras y el control inflacionario, generalmente más robustos en economías avanzadas. La selección de estas variables permite construir gráficos descriptivos que muestran el comportamiento estadístico de cada categoría en los clústeres, resaltando las diferencias entre economías desarrolladas y emergentes con un enfoque cuantitativo sólido.

Analisis de resultados

Gráficos de las variables más representativas por categoría establecida:

Gráfico lolipop del saldo de cuenta corriente como porcentaje del PIB

El análisis del gráfico muestra cómo diferentes países manejan sus finanzas internacionales, medido a través del saldo de cuenta corriente como porcentaje del PIB. Destaca especialmente el caso de Irlanda y Nueva Zelanda, que presentan los mayores superávits (alrededor del 15% del PIB), lo que significa que estas naciones están generando más ingresos del exterior de los que gastan, principalmente a través de sus exportaciones y otras entradas de dinero. En contraste, países como Chile, Hungría y Perú muestran déficits, indicando que gastan más en importaciones y otros pagos internacionales de lo que reciben. La mayoría de los países se mantienen en una zona más moderada, entre 0% y 5% del PIB, sugiriendo un balance más equilibrado en sus transacciones internacionales. Esta variedad de situaciones refleja las diferentes estrategias comerciales y económicas de cada país, su competitividad en los mercados internacionales y su capacidad para generar ingresos del exterior.

Gráfico lolipop del PIB en volumen a precios de mercado

Analizando el gráfico de lollipop que muestra el PIB en volumen a precios de mercado para diferentes países, se observan patrones interesantes en la distribución del crecimiento económico real. Los datos revelan que países como Colombia, India y Estados Unidos presentan los niveles más altos, con valores cercanos a 1e+15 (un cuatrillón en notación científica), lo que indica el gran tamaño de sus economías cuando se mide sin el efecto distorsionador de la inflación. En un nivel intermedio encontramos a naciones como España, México y Australia, que muestran valores alrededor de 1e+12 (un trillón). La mayoría de los países se concentran en este rango medio, sugiriendo cierta homogeneidad en el tamaño de sus economías reales. Los países con valores más bajos en la escala, como Estonia y Eslovenia, reflejan economías de menor tamaño, aunque esto no necesariamente indica menor prosperidad per cápita. Es importante notar que este indicador nos muestra el tamaño absoluto de las economías ajustado por inflación, lo que nos permite comparar la capacidad productiva real entre países, aunque no refleja necesariamente el nivel de vida o el desarrollo económico por habitante.

Gráfico de barras del PIB en Volumen a Precios de Mercado

El análisis del Producto Interno Bruto (PIB) en volumen a precios de mercado, representado mediante un gráfico de barras con escala logarítmica, revela una marcada heterogeneidad en la magnitud de las economías estudiadas. Se observa una clara estratificación donde potencias económicas como Estados Unidos, India y Colombia lideran con valores cercanos a 1e+15 unidades monetarias, seguidas por un grupo intermedio que incluye a países como España, México y Australia, con aproximadamente 1e+11 unidades monetarias. La utilización de la escala logarítmica resulta metodológicamente apropiada al permitir la visualización simultánea de economías con órdenes de magnitud sustancialmente diferentes, aunque es fundamental señalar que estos valores absolutos, si bien son indicativos del tamaño económico agregado, no necesariamente reflejan los niveles de desarrollo económico o bienestar social per cápita de cada nación, aspectos que requerirían la consideración de indicadores socioeconómicos complementarios para una evaluación más integral del desarrollo económico de cada país.

Gráfico de barras del gasto de consumo final privado en volumen:

El análisis del gasto de consumo final privado en volumen, visualizado mediante un gráfico de barras con escala logarítmica, muestra patrones significativos en el comportamiento del consumo privado entre las economías estudiadas. Se observa que países como Colombia, India y Estados Unidos mantienen los niveles más elevados de consumo privado, con valores próximos a 1e+15, lo que refleja el considerable tamaño de sus mercados internos y sugiere un mayor poder adquisitivo agregado de su población; mientras que la mayoría de las economías restantes se sitúan en torno a valores de 1e+11, evidenciando una distribución relativamente homogénea del consumo privado entre las economías de tamaño medio, aunque es importante señalar que estos valores absolutos deben interpretarse en conjunto con indicadores per cápita para obtener una imagen más precisa del bienestar económico real de la población en cada país.

Estadisticas descriptivas de la base de datos:

En el análisis de las estadísticas descriptivas, se observa una marcada heterogeneidad en las variables económicas estudiadas. Los indicadores de comercio internacional revelan que las importaciones y exportaciones de bienes y servicios presentan una distribución asimétrica positiva, con medias de 3.820e+11 USD y 3.704e+11 USD respectivamente, y medianas significativamente menores (2.039e+11 USD y 2.174e+11 USD), lo que sugiere la presencia de valores atípicos que sesgan la distribución. En cuanto a los indicadores económicos fundamentales, el PIB nominal exhibe una dispersión considerable (desviación estándar de 3.7e+14) con una media de 1.06e+14 y una mediana de 2.38e+12, evidenciando las pronunciadas disparidades económicas entre países. Los indicadores macroeconómicos del mercado laboral muestran que la tasa de desempleo mantiene una distribución asimétrica positiva (media de 7.37% y mediana de 6.08%), mientras que la fuerza laboral presenta una notable dispersión (desviación estándar de 35,182,554 personas) con una media de 22,851,310 personas, reflejando las significativas diferencias en el tamaño poblacional entre naciones. Las tasas de crecimiento, tanto del PIB (media de 6.4% y mediana de 5.3%) como del comercio internacional (media de crecimiento de exportaciones de 12.8% y de importaciones de 10.7%), muestran una dispersión más moderada, sugiriendo cierta homogeneidad en las dinámicas de crecimiento económico, aunque persisten variaciones significativas entre economías desarrolladas y emergentes.

Analizando los datos de Korea y comparándolos con las estadísticas descriptivas presentadas anteriormente, se justifica su exclusión del análisis de clústeres (tanto k-means como jerárquico Ward) debido a que sus valores presentan un comportamiento significativamente atípico, especialmente en variables críticas como el gasto en consumo del gobierno (x6) y el consumo privado (x7). Por ejemplo, mientras la media general del gasto en consumo del gobierno (x6) es de 1.615e+13 con una desviación estándar de 5.883e+13, Korea presenta un valor de 3.377e+14, que se desvía considerablemente de este rango. De manera similar, su consumo privado (x7) de 8.825e+14 se aleja notablemente de la media general de 5.074e+13. Esta marcada divergencia en variables macroeconómicas fundamentales podría distorsionar significativamente la formación de clústeres y la interpretación de los resultados del análisis. Además, sus patrones de comercio internacional y crecimiento económico muestran características distintivas que la sitúan como un caso especial dentro de la muestra. Por lo tanto, para garantizar la robustez y representatividad del análisis de clústeres, es metodológicamente más apropiado proceder con 41 observaciones, excluyendo a Korea como caso atípico.

Estadísticas descriptivas
variable Media Desviacion Mediana
x1 1.012016e+00 5.078911e+00 3.564667e-01
x2 7.986723e+00 1.822018e+01 1.300493e+00
x3 3.819741e+11 5.493589e+11 2.038763e+11
x4 3.762049e+11 4.947373e+11 2.106370e+11
x5 3.704357e+11 4.488404e+11 2.173976e+11
x6 1.615331e+13 5.883308e+13 3.209043e+11
x7 5.073561e+13 1.730062e+14 1.046384e+12
x8 1.255608e-03 5.056746e-02 -5.521490e-03
x9 1.068741e+14 3.699529e+14 2.384922e+12
x10 9.137015e+13 3.310409e+14 1.930567e+12
x11 1.545227e+12 3.230601e+12 5.341115e+11
x12 2.366899e+13 9.288766e+13 3.753493e+11
x13 2.881452e+13 1.166532e+14 4.897133e+11
x14 2.914816e+13 1.320778e+14 5.506796e+11
x15 1.066987e+01 6.886647e+00 1.040541e+01
x16 1.282432e+01 8.239738e+00 1.312490e+01
x17 6.414701e+00 2.869844e+00 5.291250e+00
x18 1.297359e+01 1.137298e+01 1.068455e+01
x19 6.084601e+00 9.121706e+00 3.068270e+00
x20 7.343550e+00 1.081189e+01 6.598671e+00
x21 6.610695e+00 3.929155e+00 5.733462e+00
x22 4.460344e+00 2.780562e+00 4.026876e+00
x23 2.744607e+00 8.723250e+00 1.109263e+00
x24 2.309236e+00 6.276407e+00 1.101486e+00
x25 2.885763e+00 1.018038e+01 1.137738e+00
x26 7.371978e+00 5.268160e+00 6.081741e+00
x27 2.105464e+07 3.263304e+07 8.025106e+06
x28 2.285131e+07 3.518255e+07 8.657374e+06
x29 9.956473e-01 3.171370e+00 1.972222e-02

Una vez excluido el dato de Korea para el desarrollo del modelo de k-means, el algoritmo arrojó una clasificación de 2 clusters que estableció a 6 paises dentro del el cluster 1, y el restante fueron clasificados en el cluster 2, de modo que tras realizar un estudio de las medias de las diferentes 29 variables, y posteriormente apoyandonos también en los datos de la mediana y la desviación estandar se determinó que el cluster 1 contenía los datos de paises con caracterisitcas de desarrollo avanzadas, mientras que el cluster 2 contenía los datos de países que podrían ser categorizados como emergentes.

Estadisticas descriptivas de los datos agrupados en el cluster 1

El primer cluster se caracteriza por mostrar indicadores económicos de mayor magnitud, particularmente en variables relacionadas con el volumen económico. Destaca el PIB nominal (x9) con una media de 2.85e+14 y el PIB en volumen (x10) de 2.10e+14, significativamente superiores al otro cluster. También muestra mayores niveles de consumo privado (x7) y gasto gubernamental (x6), así como una fuerza laboral más robusta (x28) con una media de 3.78e+07. Los indicadores de crecimiento (x15-x20) son más elevados, con medias que oscilan entre 13-32%, sugiriendo economías más dinámicas. Estas características son típicas de países desarrollados con economías maduras y de gran escala.

Estadísticas descriptivas Cluster 1
variable Media Desviacion Mediana
x1 -2.674579e+00 2.933072e+00 -2.043527e+00
x2 3.104109e+01 4.202692e+01 6.371338e+00
x3 2.086839e+11 2.521268e+11 8.503722e+10
x4 1.933582e+11 2.263743e+11 7.766069e+10
x5 1.780325e+11 2.024216e+11 7.230521e+10
x6 3.367178e+13 6.105528e+13 8.019389e+12
x7 1.477174e+14 2.612716e+14 4.251071e+13
x8 -2.172915e-02 4.939082e-02 -2.615070e-02
x9 2.847812e+14 4.506117e+14 1.414642e+14
x10 2.095886e+14 3.521838e+14 7.468232e+13
x11 8.829461e+11 8.879028e+11 5.815241e+11
x12 4.353693e+13 6.347029e+13 2.417349e+13
x13 5.159770e+13 8.042060e+13 1.959306e+13
x14 3.375055e+13 4.667658e+13 1.611458e+13
x15 1.481047e+01 9.924318e+00 1.593274e+01
x16 2.411511e+01 1.162980e+01 2.685635e+01
x17 1.103468e+01 1.530725e+00 1.101525e+01
x18 3.238266e+01 2.081970e+01 2.156855e+01
x19 1.926573e+01 1.904682e+01 9.189959e+00
x20 2.019049e+01 1.160254e+01 1.692217e+01
x21 1.339469e+01 4.541217e+00 1.310308e+01
x22 6.580158e+00 3.482162e+00 6.749213e+00
x23 1.156103e+01 2.258396e+01 1.697691e+00
x24 8.898870e+00 1.610028e+01 1.440652e+00
x25 1.273877e+01 2.667189e+01 1.587272e+00
x26 9.424446e+00 3.034519e+00 9.059028e+00
x27 3.426684e+07 4.360699e+07 1.865243e+07
x28 3.775133e+07 4.758506e+07 2.081129e+07
x29 4.905243e+00 6.853707e+00 2.267917e+00

Estadisticas descriptivas de los datos agrupados en el cluster 2

El segundo cluster exhibe valores más moderados en la mayoría de los indicadores económicos. El PIB nominal (x9) tiene una media de 2.02e+13 y el PIB en volumen (x10) de 1.90e+13, aproximadamente un orden de magnitud menor que el Cluster 1. Los indicadores de crecimiento (x15-x20) son más modestos, con medias entre 4-11%, sugiriendo economías en desarrollo con un ritmo de expansión más gradual. La fuerza laboral (x28) promedio es de 2.01e+07, significativamente menor que el primer cluster. Estos patrones son consistentes con economías emergentes o en desarrollo, que aunque muestran potencial de crecimiento, aún no alcanzan los niveles de las economías más avanzadas.

Estadísticas descriptivas Cluster 2
variable Media Desviacion Mediana
x1 1.534118e+00 5.169810e+00 4.199085e-01
x2 3.935751e+00 5.434942e+00 1.000000e+00
x3 4.041525e+11 5.888409e+11 2.284562e+11
x4 3.983463e+11 5.274136e+11 2.315455e+11
x5 3.925400e+11 4.749828e+11 2.346348e+11
x6 3.963542e+12 1.944178e+13 3.202725e+11
x7 1.034662e+13 4.867968e+13 9.850788e+11
x8 5.044433e-03 5.114633e-02 -2.456764e-03
x9 2.023906e+13 9.127152e+13 1.780436e+12
x10 1.897820e+13 9.029474e+13 1.676980e+12
x11 1.639076e+12 3.516982e+12 5.315382e+11
x12 4.563784e+12 2.205898e+13 3.398456e+11
x13 4.879957e+12 1.799463e+13 4.765986e+11
x14 4.930660e+12 1.821541e+13 5.350098e+11
x15 9.955049e+00 6.257278e+00 1.023538e+01
x16 1.096768e+01 5.975912e+00 1.196033e+01
x17 5.687543e+00 2.263772e+00 4.947930e+00
x18 9.824241e+00 3.794882e+00 1.058742e+01
x19 3.927462e+00 3.340208e+00 2.925734e+00
x20 5.272054e+00 9.327785e+00 5.988026e+00
x21 5.530828e+00 2.452164e+00 5.270348e+00
x22 4.063449e+00 2.558236e+00 3.791046e+00
x23 1.282336e+00 8.669388e-01 1.099104e+00
x24 1.214373e+00 6.653772e-01 1.089552e+00
x25 1.248231e+00 6.111722e-01 1.121627e+00
x26 7.127143e+00 5.558378e+00 5.734068e+00
x27 1.861210e+07 3.108757e+07 5.057750e+06
x28 2.014144e+07 3.334749e+07 5.357246e+06
x29 3.295922e-01 1.437285e+00 -8.377788e-02

La clara diferenciación entre los dos clusters sugiere una división natural entre países desarrollados y emergentes. El Cluster 1, con sus 6 países, representa claramente a las economías más desarrolladas, caracterizadas por grandes volúmenes de PIB, alto consumo interno, considerable gasto gubernamental y mercados laborales extensos. El Cluster 2, que agrupa a 35 países, representa a las economías emergentes, con indicadores económicos más moderados pero potencial de crecimiento. La exclusión de Corea del análisis, mencionada en la metodología, refuerza esta interpretación al eliminar casos híbridos que podrían difuminar esta clara distinción. Esta segmentación proporciona una base objetiva para la clasificación económica de países, respaldada por múltiples indicadores macroeconómicos que reflejan tanto el tamaño como el dinamismo de sus economías.

Análisis del modelo ACP

Matriz de correlación

El análisis de la matriz de correlación revela patrones significativos en las interrelaciones de las variables macroeconómicas estudiadas. Se observa una correlación positiva robusta (r > 0.5) entre las variables de gasto gubernamental y privado (x6, x7) con los indicadores de producción y comercio (x9, x10, x12, x13, x14), lo cual es congruente con la teoría económica que postula una fuerte interacción entre el gasto agregado y los niveles de producción nacional. En contraste, se identifica una tendencia hacia correlaciones negativas entre las variables de crecimiento económico y comercio internacional (x15-x21) y las métricas de volumen comercial (x1, x3-x5), sugiriendo una relación inversa entre las tasas de crecimiento y los niveles absolutos de comercio. Particularmente notable es la ausencia de correlaciones significativas entre los deflactores (x23-x25) y la mayoría de las variables de actividad económica real (x6-x15), con la excepción de correlaciones selectivas entre el deflactor del PIB (x25) y variables monetarias, lo cual sugiere una relativa independencia de los movimientos de precios respecto a las variables de actividad económica real, consistente con la dicotomía clásica en teoría macroeconómica. Este patrón de correlaciones proporciona evidencia empírica sobre la estructura de interrelaciones en las economías analizadas y sustenta la segmentación observada entre economías desarrolladas y emergentes.

Gráfico de varianza explicada

Con este gráfico, se visualizó que las dos primeras dimensiones poseen un mayor porcentaje de representación de la varianza, para la primera dimensión tenemos un porcentaje de 42.4 y en la segunda dimensión 29,1% . Estas dos dimensiones juntas representan el 71,5% de la varianza explicada, lo cual es suficiente para tomar estas dos dimensiones como representante de los datos ya que utilizar las otras dimensiones implica incrementar la cantidad de datos a analizar sin recibir a cambio un alto porcentaje de significancia para la varianza explicada.

Gráfico gráfico de Análisis de Componentes Principales (PCA)

Este grafico codifica los países de colores en función de cos2, los puntos en el plano representan los países, un color más anaranjado indica un alto cos2, mientras que uno con un color azul indica un bajo cos2. Esto representando su proporción de varianza de una variable original que se explica por una dimensión en particular. Para los valores altos en cos2 (cerca de 1) significa una buena representación de la variable en la dimensión países como Estados unidos y Korea que se encuentrar mas alejados y con un color anaranjado nos estan indicando que tienen una alta varianza en sus respectivas caracteristicas. los valores bajos de cos2 (cerca de 0) hace inferencia a que la variable original no es acorde a la caracterización de la dimensión particular a tratar.

Gráfico de Contribución de las variables

Este grafico organiza las variables en orden decente desde su porcentaje de significancia para la correlación en la dimensión correspondiente, la línea roja punteada representa el valor del caso hipotético en el que todas las variables presentaran el mismo valor de contribución. Conforme con este parámetro idealizado, las variables que superen este estándar son tomadas para conformar la dimensión.

Gráfico Biplot para el modelo PCA

El gráfico de Análisis de Componentes Principales (PCA) muestra la proyección de países en el espacio definido por las dos primeras dimensiones principales (Dim1 y Dim2), obtenidas a partir del modelo PCA. Este modelo fue generado utilizando un conjunto de entrenamiento con 25 países (datosz_train), y posteriormente se proyectaron los 16 países restantes (datosz_restante) en ese mismo espacio dimensional. Los puntos en el gráfico representan la ubicación de estos países del conjunto de prueba, evidenciando que el modelo PCA es capaz de capturar diferencias relevantes entre ellos, reflejadas en sus posiciones relativas en el espacio bidimensional. Aunque no es posible interpretar directamente el significado de las dimensiones, la distribución sugiere una agrupación y diferenciación de los países en función de sus características macroeconómicas. En estudios posteriores, se podría explorar la interpretación de estas dimensiones principales y analizar la relación entre la ubicación de los países en el espacio PCA y sus características económicas, obteniendo así una visión más profunda de las variables macroeconómicas que contribuyen a dichas diferencias.

En el análisis de componentes principales, se observa una clara diferenciación entre dos grupos de variables representadas en un espacio bidimensional. El grupo 1, ubicado más próximo al origen de coordenadas, exhibe una menor variabilidad en ambas dimensiones, lo cual se evidencia en la dispersión más concentrada de sus puntos y en la forma más compacta de su elipse de confianza. Esta característica sugiere una mayor homogeneidad en las variables que componen este grupo. En contraste, el grupo 2, posicionado en la región superior del gráfico, presenta una distribución más elongada y diagonal, indicando una mayor variabilidad en sus componentes y una posible correlación entre las dimensiones analizadas. La clara separación entre las elipses de ambos grupos y la ausencia de superposición significativa confirman que las dos dimensiones seleccionadas capturan adecuadamente la variabilidad inherente a los datos.

El análisis de agrupamiento jerárquico, visualizado mediante el dendrograma, revela una estructura de clasificación bien definida con dos grupos principales. El grupo mayoritario, que incluye aproximadamente 22 elementos, muestra una estructura interna compleja con múltiples subagrupaciones a diferentes niveles de similitud, sugiriendo una jerarquía de relaciones entre sus elementos. En contraste, se identifica un grupo minoritario y claramente diferenciado, compuesto por tres elementos (18, 9 y 25), que se une al resto de la estructura a una altura considerablemente mayor en el dendrograma, indicando una disimilitud sustancial con respecto al grupo principal. Esta marcada separación en la altura de fusión entre los dos grupos principales corrobora la existencia de una estructura de agrupamiento natural en los datos, que coincide con la separación observada en el análisis de componentes principales.

Conclusión

Los resultados obtenidos mediante la aplicación de técnicas de análisis multivariado a los indicadores económicos de los países trabajados en la base de datos, muestran algunos patrones significativos en la estructura económica regional. El análisis de componentes principales demuestra que la variabilidad de los indicadores económicos puede ser efectivamente capturada en dos dimensiones principales, las cuales explican una proporción sustancial de la varianza total. La primera componente, dominada por indicadores como el PIB y el volumen de comercio internacional, establece una clara diferenciación entre las economías de mayor escala y aquellas de menor tamaño relativo. La segunda componente, por su parte, captura la variabilidad asociada a indicadores de eficiencia y desarrollo económico, permitiendo discriminar entre países con diferentes niveles de sofisticación en sus estructuras productivas y comerciales.

El análisis de los grupos jerárquicos complementa estos hallazgos al identificar dos grupos claramente diferenciados de países. El primer grupo, que incluye a Brasil, México y Argentina, se caracteriza por economías de gran escala con una significativa participación en el comercio internacional y mercados internos robustos. El segundo grupo, más numeroso y heterogéneo, comprende economías de menor tamaño pero con diferentes niveles de desarrollo y especialización económica. Esta segmentación refleja no solo las diferencias en el tamaño de las economías sino también en sus estructuras productivas y patrones de integración internacional. Las distancias entre los conglomerados, evidenciadas en el dendrograma, sugieren que las brechas económicas entre estos grupos son sustanciales y persistentes, lo que tiene implicaciones importantes para las políticas de integración regional y desarrollo económico.

Estos resultados tienen implicaciones significativas para la formulación de políticas económicas y la comprensión de las dinámicas regionales. En primer lugar, sugieren que las estrategias de desarrollo económico y las políticas de integración regional deben considerar la heterogeneidad estructural existente entre los países de la región. En segundo lugar, la identificación de grupos de países con características similares puede facilitar la formulación de políticas de cooperación más efectivas y el diseño de estrategias de desarrollo adaptadas a las condiciones específicas de cada grupo. Finalmente, la persistencia de brechas significativas entre los grupos identificados plantea desafíos importantes para los objetivos de convergencia económica regional y sugiere la necesidad de mecanismos de integración que promuevan una mayor cohesión económica entre los países de América Latina y el Caribe.

Referencias