Este informe explora distintos métodos de aprendizaje no supervisado aplicados a una base de datos que contiene 29 variables económicas de 41 países, definidos según la Organización para la Cooperación y el Desarrollo Económicos (OCDE). A partir de esta información, utilizaremos técnicas de análisis no supervisado, en particular el Análisis de Componentes Principales (ACP) y la clusterización, para agrupar los países en función de sus características económicas. Estas herramientas permiten identificar grupos de países con patrones económicos similares, simplificando así la interpretación de grandes volúmenes de datos y facilitando la elaboración de recomendaciones en el ámbito de políticas y estrategias económicas.
El aprendizaje no supervisado es una técnica que permite a un modelo encontrar patrones o estructuras en los datos sin contar con etiquetas o resultados conocidos de antemano. A diferencia del aprendizaje supervisado, donde se le dan al modelo ejemplos con etiquetas para que aprenda, en el aprendizaje no supervisado el modelo explora los datos por su cuenta para identificar su estructura interna. Los algoritmos de este enfoque buscan relaciones o patrones ocultos en los datos, lo que ayuda a comprenderlos en mayor profundidad.
Como consecuencia de lo anterior, este trabajo destaca el análisis y la segmentación de países en función de sus indicadores económicos para identificar similitudes y diferencias estructurales entre diversas economías. Esta clasificación facilita un análisis detallado, que aporta información útil para la clasificación de los clusters y factores de los métodos de aprendizaje no supervisado.
Para realizar una segmentación eficiente de los países primeramente se estandarizaron los datos, ya que cuando se estandariza la información cada variable se transforma para tener una media de cero y una desviación estándar de uno. Esto se debe realizar para poner todas las variables en la misma escala, independientemente de sus unidades originales (por ejemplo, dólares, porcentajes o cantidades). La estandarización es útil en métodos de análisis como el ACP o el clustering, donde las variables con rangos de valores más amplios podrían influir desproporcionadamente en los resultados si no se ajustan, entonces podemos notar la diferencia en que cuando no se estandariza la información cada variable conserva su escala y unidad original. Esto es necesario sólo si se quiere analizar el impacto absoluto de cada variable, especialmente en casos donde las magnitudes son importantes o tienen un significado particular en su valor original. Teniendo en cuenta lo anterior se procede a desarrollar las siguientes técnicas para realizar nuestro análisis:
El Análisis de Componentes Principales es una técnica de reducción de dimensionalidad que tiene como objetivo simplificar el conjunto de datos manteniendo la mayor cantidad posible de su variabilidad. En lugar de analizar cada indicador económico individualmente, ACP permite transformar las variables originales en un conjunto de “componentes principales”, que son combinaciones lineales de las variables originales y que capturan patrones importantes en los datos.
El Análisis de Componentes Principales (ACP) es una técnica utilizada para sintetizar información o reducir la dimensionalidad de los datos, con el fin de minimizar el error cuadrático. Su objetivo es transformar un conjunto de variables, conocidas como variables originales, en un nuevo conjunto llamado componentes principales. Estos nuevos componentes son combinaciones lineales de las variables originales y están diseñados para ser independientes y no correlacionados entre sí. Un aspecto clave, y también uno de los mayores desafíos del ACP, es la interpretación de los componentes principales. Esta interpretación no se define de antemano, sino que se logra al analizar la relación entre los componentes y las variables originales, las cuales vienen dadas por la siguiente combinación lineal:
\[ Z = \lambda_1 X_1 + \lambda_2 X_2 + \dots + \lambda_p X_p \]
-Primero, se calcula la matriz de covarianza o correlación entre las variables. -A partir de esta matriz, se determinan los valores y vectores propios, los cuales representan la varianza de los datos en diferentes direcciones. -Los componentes principales son los vectores propios asociados con los valores propios más grandes, ya que estos representan la mayor variabilidad. -A continuación, se seleccionan los componentes que explican el mayor porcentaje de varianza acumulada, facilitando el análisis al reducir las dimensiones originales.
En el Análisis de Componentes Principales (ACP), cuando hablamos de ortogonalidad en factores, nos referimos a que los componentes principales son perpendiculares entre sí en el espacio de los datos, lo cual implica que no comparten información ni están correlacionados. Esta propiedad asegura que cada componente principal aporta una visión única sobre la variabilidad de los datos, sin duplicar lo que ya capturaron otros componentes. Gracias a esta independencia, la ortogonalidad permite que los resultados del análisis sean más claros y específicos, ya que cada componente representa una dimensión diferente de la información contenida en los datos.
Interpretación de los Componentes: Cada componente principal combina varias variables económicas en una “dimensión” que captura un patrón común. Por ejemplo, un componente podría agrupar variables de crecimiento económico, inversión y empleo, mientras otro podría estar más asociado con indicadores de inflación y deuda. Esta técnica nos permite observar relaciones complejas entre las variables sin perder de vista las tendencias más significativas.
1.Clusterización (Método de Ward y K-means): La clusterización es una técnica de agrupamiento que permite dividir los datos en subconjuntos homogéneos llamados “clusters”. Esto facilita la segmentación de los países según sus características económicas principales.
Método de Ward: El método de Ward es una técnica jerárquica que agrupa datos minimizando la varianza dentro de cada clúster. Funciona de la siguiente manera: -Cada país empieza siendo su propio cluster individual. -Los clusters se van fusionando progresivamente, seleccionando siempre la combinación que minimice el incremento de varianza en el grupo resultante. -Este proceso continúa hasta que todos los países estén en un único cluster o hasta alcanzar el número de clusters deseado.
El método de Ward es ideal para obtener clusters bien diferenciados, ya que minimiza la heterogeneidad interna, lo cual lo hace útil para identificar agrupaciones naturales de países con economías similares.
Los métodos jerárquicos se subdividen en aglomerativos y disociativos. Los métodos aglomerativos realizan un análisis con tantos grupos como individuos existan. A partir de estas unidades iniciales se van formando los grupos, de forma ascendente, con el fin de englobar estos en un mismo conglomerado. Los métodos disociativos o descendentes son el proceso inverso a los métodos aglomerativos. Estos métodos comienzan con un único conglomerado que agrupa todos los casos, formando así el grupo inicial. A través de divisiones sucesivas, se generan grupos cada vez más pequeños. Al final de este proceso, se obtienen tantas agrupaciones como casos individuales se hayan analizado.
K-means: El método K-means es una técnica no jerárquica que requiere establecer el número de clusters, k, de antemano. Funciona de la siguiente forma: -Inicialmente, se eligen k puntos como “centroides” iniciales, cada país se asigna al centroide más cercano, formando k grupos Luego, los centroides se recalculan en función de las nuevas asignaciones, y los países se vuelven a asignar al centroide más cercano. -Este proceso se repite hasta que los centroides ya no cambian significativamente, es decir, hasta que el agrupamiento se estabiliza. Los objetos se representan con vectores reales de dimensiones (x1, x2,…,xn) y el algoritmo k-means construye k grupos donde se minimiza la suma de distancias de los objetos, dentro de cada grupo S={S1,S2,…,Sk} a su centroide, el problema se formula de la siguiente manera:
\[ MinSE(\mu_i) = \text{MinS} \sum_{i=1}^{k} \sum_{x_j \in s_i} \| x_j - \mu_i \|^2 \]
Donde S es el conjunto de datos cuyos elementos son los objetos xj representados por vectores, donde cada uno de sus elementos representa una característica o atributo. Así se obtienen los k grupos o clusters con su correspondiente centroide i.
Este método es eficaz para analizar y clasificar países en clusters específicos, especialmente cuando se tiene una idea aproximada de la cantidad de segmentos económicos relevantes. Ambos métodos ofrecen perspectivas únicas sobre la segmentación. El método de Ward permite explorar jerarquías en los grupos de países, mientras que K-means es útil para obtener agrupaciones claras y con límites definidos. En este estudio, compararemos ambas técnicas para obtener los clusters más representativos según los indicadores económicos disponibles.
-Producto Interno Bruto (PIB) y Crecimiento Económico: Variables relacionadas con el PIB, crecimiento anual y PIB per cápita representan el tamaño y nivel de desarrollo de una economía. El PIB mide la producción económica total de un país y es uno de los indicadores más importantes para evaluar el bienestar general.
Las economías con PIB alto y crecimiento sostenido suelen tener mayores recursos para invertir en infraestructura y servicios, mientras que las economías con PIB más bajo o decreciente enfrentan mayores desafíos de desarrollo.
-Saldo de cuenta corriente como porcentaje del PIB: Muestra si un país es netamente exportador o importador en términos de bienes, servicios y transferencias. Un saldo positivo indica superávit, mientras que uno negativo refleja un déficit.
Importancia en la segmentación: Esta variable ayuda a clasificar países en función de su posición en el comercio internacional. Un superávit en cuenta corriente indica que el país podría estar acumulando reservas, mientras que un déficit podría reflejar dependencia de financiamiento externo.
-Exportaciones e Importaciones de bienes y servicios, volumen y crecimiento: Indican el valor total y el crecimiento de bienes y servicios que un país exporta e importa, ajustados por inflación.
Importancia en la Segmentación: La diferencia en los niveles de exportaciones e importaciones permite agrupar países en función de su apertura económica y especialización en sectores exportadores o dependientes de importaciones. El crecimiento en estos volúmenes ayuda a identificar economías en expansión comercial.
-Exportaciones netas, contribuciones a los cambios en el PIB real: Mide la contribución del comercio neto (exportaciones menos importaciones) al crecimiento del PIB real.
Importancia en la Segmentación: Ayuda a identificar la influencia del comercio exterior en el crecimiento económico, diferenciando economías orientadas al comercio de aquellas con un mercado interno predominante.
-Tipo de cambio, moneda nacional por USD: Refleja el valor de la moneda nacional frente al dólar estadounidense, siendo un indicador de competitividad internacional.
Importancia en la Segmentación: Un tipo de cambio favorable puede indicar competitividad exportadora, mientras que un tipo de cambio alto puede sugerir presiones inflacionarias o dependencia de la moneda extranjera.
-Deflactores de exportaciones, importaciones y PIB: Miden el cambio en los precios de exportaciones, importaciones y de toda la economía.
Importancia en la Segmentación: Los deflactores indican el comportamiento de precios de los productos específicos y del conjunto económico, permitiendo clasificar países según sus dinámicas inflacionarias y su exposición a cambios de precios internacionales.
-Gasto de consumo final del gobierno y privado (volumen y crecimiento): Reflejan el gasto en bienes y servicios por parte de los gobiernos y los hogares.
Importancia en la Segmentación: Estas variables permiten identificar economías con alto gasto público frente a aquellas donde el consumo privado es predominante, lo cual puede reflejar el rol del estado y el nivel de bienestar en la economía.
-Formación bruta de capital fijo, total y crecimiento: Representa la inversión en infraestructura, edificios y maquinaria, y su crecimiento.
Importancia en la Segmentación: Permite agrupar economías en función de su tasa de inversión en activos productivos, un indicador clave del potencial de crecimiento y desarrollo económico.
-Producto interno bruto, valor nominal y volumen, crecimiento: Mide el tamaño de la economía en términos actuales y reales, y su crecimiento.
Importancia en la Segmentación: Estas variables ayudan a identificar el tamaño y dinamismo de las economías, clasificando a los países según su nivel de desarrollo económico y su crecimiento.
-PIB en dólares constantes a paridades de poder adquisitivo (PPA): Ajusta el PIB en dólares según la paridad de poder adquisitivo, permitiendo una comparación estandarizada entre países.
Importancia en la Segmentación: Facilita la comparación entre economías ajustando las diferencias de precios, lo que permite clasificar países en función de su poder adquisitivo relativo.
-Tasa de desempleo: Porcentaje de la población activa sin empleo.
Importancia en la segmentación: Indica el nivel de empleo y la capacidad de absorción laboral de la economía.Países con baja tasa de desempleo suelen tener economías estables o en crecimiento, mientras que altas tasas pueden indicar problemas estructurales.
-Empleo total y fuerza laboral: Muestra el número de personas empleadas y la cantidad de personas activas en la economía. Importancia en la segmentación: Facilita la clasificación de países según su tamaño laboral y la capacidad de empleo, diferenciando economías con alta participación laboral de aquellas con limitaciones estructurales. Variables como la tasa de empleo y desempleo brindan información sobre el mercado laboral y la actividad económica general. Las tasas de desempleo elevadas pueden indicar dificultades en la economía, mientras que las bajas tasas de desempleo suelen asociarse con economías en crecimiento. Estas variables también permiten identificar economías con alta capacidad de generación de empleo frente a aquellas con desafíos estructurales en su mercado laboral.
-Tasa de interés a corto plazo: Refleja el costo del dinero a corto plazo, usualmente controlado por el banco central.
Importancia en la segmentación: Una tasa de interés baja puede indicar políticas de estímulo económico, mientras que una alta sugiere controles contra la inflación. Esto permite agrupar economías según su contexto monetario.
-Deuda Pública y Déficit Fiscal: Variables que reflejan la deuda pública y el déficit fiscal son cruciales para comprender la sostenibilidad de una economía. Los países con altos niveles de deuda pueden tener menos flexibilidad para invertir en crecimiento a futuro y más vulnerabilidad ante crisis. En cambio, una deuda controlada sugiere una economía más saludable y con mayor capacidad de respuesta ante cambios económicos.
-Inflación y Estabilidad de Precios: Indicadores de inflación muestran la variación en los precios de bienes y servicios. Una inflación alta generalmente sugiere una economía inestable, lo cual puede desincentivar la inversión y el ahorro. Los países con baja inflación tienden a atraer más inversiones y tienen una mayor estabilidad en el poder adquisitivo, siendo más atractivos para inversionistas y empresas.
-La segmentación de los países en estos clusters permite entender mejor la diversidad de estructuras económicas, niveles de desarrollo y desafíos que enfrenta cada grupo. Esta clasificación es útil para diseñar políticas específicas para cada tipo de economía, facilitar la cooperación internacional, y realizar comparaciones precisas. Los clusters también proporcionan una base para identificar patrones de convergencia o divergencia entre las economías a lo largo del tiempo, ayudando a anticipar tendencias en el desarrollo global.
-Al segmentar países con base en estos datos, el análisis no supervisado permite descubrir patrones que revelan similitudes económicas y estructurales, ofreciendo una base sólida para la toma de decisiones y la formulación de políticas.
1. Comercio Exterior
x3 - Importaciones de bienes y servicios (volumen en USD) x4 - Comercio de bienes y servicios (volumen en USD) x5 - Exportaciones de bienes y servicios (volumen en USD) x13 - Importaciones de bienes y servicios (volumen) x14 - Exportaciones de bienes y servicios (volumen) x15 - Crecimiento del volumen de exportaciones de bienes y servicios x16 - Crecimiento del volumen de importaciones de bienes y servicios x23 - Deflactor de exportaciones de bienes y servicios x24 - Deflactor de importaciones de bienes y servicios
2. Producto Interno Bruto (PIB)
x9 - Producto interno bruto (valor nominal) x10 - Producto interno bruto (volumen, precios de mercado) x11 - Producto interno bruto (volumen en USD a paridades de poder adquisitivo) x17 - Crecimiento del volumen del PIB x18 - Crecimiento del PIB en valor nominal x19 - Crecimiento del deflactor del PIB x25 - Deflactor del PIB (precios de mercado)
3. Consumo
x6 - Gasto de consumo final del gobierno (volumen) x7 - Gasto de consumo final privado (volumen) x21 - Crecimiento del gasto de consumo final privado (volumen) x22 - Crecimiento del gasto de consumo final del gobierno (volumen)
4. Inversión y Formación de Capital
x12 - Formación bruta de capital fijo total (volumen) x20 - Crecimiento de la formación bruta de capital fijo total
5. Empleo y Fuerza Laboral
x26 - Tasa de desempleo x27 - Empleo total (encuesta de fuerza laboral) x28 - Fuerza laboral 6. Tasas e Intereses x1 - Balanza por cuenta corriente como porcentaje del PIB x2 - Tipo de cambio (moneda nacional por USD) x8 - Exportaciones netas, contribución al cambio en el PIB real x29 - Tasa de interés a corto plazo
1.(COMERCIO EXTERIOR)
x15 - Crecimiento del volumen de exportaciones de bienes y servicios (porcentaje):
Esta variable es un buen indicador de la competitividad de un país en el mercado internacional. Un crecimiento en las exportaciones muestra que la demanda externa de los productos del país está aumentando, lo cual contribuye positivamente al PIB y a la generación de empleo. Se eligió x15 en lugar de las otras porque la tasa de crecimiento permite observar tendencias de mejora o deterioro en las exportaciones a lo largo del tiempo.
(cambio a x16)
2.(PIB)
x17 - Crecimiento del volumen del PIB (porcentaje):
El crecimiento del PIB es el indicador más común y directo para medir el rendimiento económico de un país en términos de crecimiento. Un aumento en el PIB generalmente implica una economía en expansión, con posibles beneficios como aumento del empleo y mayor inversión. x17 es preferible a las otras porque muestra la tasa de crecimiento y da una perspectiva de cómo cambia la economía a lo largo del tiempo.
(cambio a x18)
3. (INVERSION Y FORMACION DEL CAPITAL)
x20 - Crecimiento de la formación bruta de capital fijo total (porcentaje):
Esta variable mide el crecimiento de la inversión en infraestructura, edificios, maquinaria y otros activos fijos. Un crecimiento en la formación de capital sugiere que hay inversión para el futuro, lo que es fundamental para el desarrollo económico a largo plazo. En este caso, x20 da más información que las otras porque permite ver si la inversión está aumentando o disminuyendo, lo cual es importante para evaluar la sostenibilidad del crecimiento económico.
4.(CONSUMO)
x21 - Crecimiento del gasto de consumo final privado (porcentaje):
El gasto de consumo privado es un componente clave del PIB en muchos países. Su crecimiento refleja la confianza del consumidor y el poder adquisitivo de la población, factores esenciales para la demanda interna. Se eligió x21 y no las otras porque el crecimiento permite ver si el consumo se está expandiendo o contrayendo, lo cual es importante para entender las tendencias en el comportamiento de los consumidores y su impacto en la economía.
5.(EMPLEO/…. LABORAL)
x26 - Tasa de desempleo (porcentaje):
La tasa de desempleo es una medida directa de la salud del mercado laboral y, por ende, del bienestar económico de la población. Un desempleo alto suele estar asociado con dificultades económicas, mientras que un desempleo bajo refleja una economía con suficiente demanda de trabajo. x26 fue elegida sobre otras variables de empleo porque el porcentaje de desempleo permite comparar entre países o períodos de forma más estandarizada. El total de empleo no es tan claro, ya que depende del tamaño de la población activa y no muestra directamente la proporción de personas sin trabajo.
Cambio a no se
6.(TASAS E INTERESES)
Balanza por cuenta corriente como % del PIB (porcentaje):
La balanza por cuenta corriente es un indicador fundamental de la posición financiera de un país en relación con el resto del mundo. Expresarla como porcentaje del PIB permite evaluar el tamaño del superávit o déficit en proporción a la economía del país, lo cual ayuda a entender su sostenibilidad a largo plazo. Se eligió x1 y no otras variables como x3 o x4 (importaciones o exportaciones en volumen sin proporción), porque el porcentaje sobre el PIB muestra de manera más clara si el país depende demasiado de financiamiento externo o tiene un superávit significativo, aspectos que no son evidentes con los datos en términos absolutos.
(la cambio a x29)
##x16
library(ggplot2)
library(plotly)
library(scales)
color_x16 <- "#9B3C8F"
boxplot_x16 <- ggplot(Data, aes(y = x16)) +
geom_boxplot(fill = color_x16, color = "black") +
scale_y_continuous(labels = comma) +
labs(
title = "Crecimiento del volumen de importaciones de bienes y servicios",
y = "Crecimiento del volumen de importaciones de bienes y servicios"
) +
theme_bw()
ggplotly(boxplot_x16) %>% layout(width = 500, height = 500)##x18
library(ggplot2)
library(plotly)
library(scales)
color_x18 <- "#ae017e"
boxplot_x18 <- ggplot(Data, aes(y = x18)) +
geom_boxplot(fill = color_x18, color = "black") +
scale_y_continuous(labels = comma) +
labs(
title = "Crecimiento del PIB en valor nominal",
y = "Crecimiento del PIB en valor nominal"
) +
theme_bw()
ggplotly(boxplot_x18) %>% layout(width = 500, height = 500)##x20
color_x20 <- "#6A1B87"
boxplot_x20 <- ggplot(Data, aes(y = x20)) +
geom_boxplot(fill = color_x20, color = "black") +
scale_y_continuous(labels = comma) +
labs(
title = "Crecimiento de la formación bruta de capital fijo total",
y = "Crecimiento de la formación bruta de capital fijo total"
) +
theme_bw()
ggplotly(boxplot_x20) %>% layout(width = 500, height = 500)##x21
color_x21 <- "#F05C8D"
boxplot_x21 <- ggplot(Data, aes(y = x21)) +
geom_boxplot(fill = color_x21, color = "black") +
scale_y_continuous(labels = comma) +
labs(
title = "Crecimiento del gasto de consumo final privado",
y = "Crecimiento del gasto de consumo final privado"
) +
theme_bw()
ggplotly(boxplot_x21) %>% layout(width = 500, height = 500)##FALTA X26#######################
##x29
color_x29 <- "#FFB7C5"
boxplot_x29 <- ggplot(Data, aes(y = x26)) +
geom_boxplot(fill = color_x29, color = "black") +
scale_y_continuous(labels = comma) +
labs(
title = "Tasa de interés a corto plazo",
y = "Tasa de interés a corto plazo"
) +
theme_bw()
ggplotly(boxplot_x29) %>% layout(width = 500, height = 500)Análisis de cluster con variables
Inicialmente, se realizó un análisis de clustering utilizando el método de K-means, que sugirió un valor óptimo de k=2. Para corroborar esta información, se aplicó también el método de Ward o jerárquico, el cual coincidió en que el valor óptimo era k= 2. Sin embargo, al observar los resultados, se identificó una limitación importante, de los 42 países, el modelo agrupó 41 en un solo clúster, destacando a Korea como un valor atípico en un grupo que se conforma con un solo individuo.
Este resultado indica que, aunque el valor de k minimiza las distancias, la estructura de la agrupación no es óptima, ya que no diferencia adecuadamente entre las distintas características de los países. Los datos observados dentro del principal clúster indican que el valor de k=2 podría no capturar toda la variabilidad de los datos, reduciendo la efectividad del análisis para identificar patrones económicos significativos.
Dado que se busca una mejor eficiencia, se propone generar más grupos que permitan una segmentación más detallada y representativa entre los países. El método jerárquico, permite realizar cortes en el dendrograma para obtener una segmentación más flexible, fue elegido para continuar el análisis. A través de este enfoque, se determinó que el valor óptimo de k es 5, lo que permitió una partición más acorde con las características y la diversidad de los países analizados.
La distribución de los países en estos 5 grupos refleja las características específicas de cada clúster, las cuales se analizaron en función de 29 variables que representan factores económicos . El primer grupo quedó conformado por 28 países, mientras que el segundo grupo incluyó 11 países. Además, se identificaron tres países como atípicos, los cuales, debido a sus características únicas, fueron clasificados en clústeres individuales. Estos países atípicos fueron Argentina, Corea y Estados Unidos, cada uno de los cuales forma un grupo separado debido a sus comportamientos económicos distintos en comparación con los otros países en el análisis.
Una vez analizado el dendrograma, se procede con la clasificacion de los paises, Para esto, es necesario analizar las medias de las variables de cada clúster,lo cual permitió realizar un análisis detallado de comportamientos económicos de los países.
Cluster 1 (28 países). “Economías Estables con Crecimiento Moderado” Este cluster está compuesto por países con características económicas moderadas, pero más estables. Las exportaciones son moderadas y el gasto del gobierno es bajo. La importación también es moderada, con un crecimiento del PIB más bien plano, lo que refleja economías con crecimiento moderado y sostenido, pero sin grandes cambios. Este cluster podría incluir países en desarrollo, ya que representa países con una economía relativamente estable pero con un comercio exterior limitado y con monedas relativamente depreciadas.
Cluster 2. (11 países) “Economías en Transición con Déficit Comercial” Los países en este grupo muestran un déficit comercial significativo, con importaciones que superan a las exportaciones. La tasa de desempleo es más alta en este cluster, y el gasto privado está creciendo lentamente. Sin embargo, algunos indicadores, como el PIB nominal y el crecimiento económico, son relativamente positivos. Estos países pueden estar enfrentando desafíos en términos de competitividad o dependencia de las importaciones, pero siguen experimentando cierto crecimiento económico.
Los países identificados como atípicos , Argentina, Estados Unidos, Corea muestran valores extremos en variables clave, distinguiéndose notablemente de los otros grupos. Argentina tiene la tasa de cambio más alta, con un valor de 4.7801600, reflejando una moneda altamente devaluada en comparación con los demás países. Estados Unidos exhibe una media muy elevada en importaciones (5.211281131) y en exportaciones (4.20379977), lo que refuerza su perfil de economía con un alto nivel de comercio. Su tasa de cambio es de -0.3834608, lo cual destaca su estabilidad relativa en comparación con Argentina. Corea tiene un valor de exportaciones netas de 0.10480392, lo que indica una posición positiva en esta variable a diferencia de otros grupos, que muestran valores negativos. Corea también destaca por la media más alta en exportaciones por volumen (6.20845014), lo cual subraya su enfoque en la producción y el comercio internacional. Su tasa de cambio es 0.1897807, bastante estable comparado con Argentina. Estas características únicas en variables como tasa de cambio, importaciones y exportaciones hacen que cada uno de estos países se clasifique como atípico, reflejando estructuras y comportamientos económicos distintos de los demás grupos. Para estos datos atípicos se decide hacer una agrupacion individualmente, de la siguiente manera.
Cluster 3 (Corea) “Economía Estable y en crecimiento” Este país tiene un gasto gubernamental alto y un crecimiento económico moderado. Su tasa de desempleo es baja y muestra estabilidad en las exportaciones. Sin embargo, la importación de bienes no está creciendo tanto como en otros clusters, lo que podría indicar una economía más avanzada o en una fase de estabilización económica. Este país podría ser un ejemplo de una economía más desarrollada con un enfoque en políticas de sostenibilidad y estabilidad
Cluster 4. (Estados unidos) “Economía Fuerte y en Crecimiento” Este país tiene una economía fuerte, con un PIB nominal alto y un crecimiento económico notable. Las exportaciones son sólidas, y aunque el gasto del gobierno está disminuyendo, el país sigue mostrando una gran capacidad económica. Es posible que sea un país con una economía avanzada o en rápido crecimiento, que puede estar experimentando un alto nivel de desarrollo en el sector externo.
Cluster 5 (Argentina) “Economías en Crecimiento con Déficit Comercial” Este país presenta un fuerte déficit comercial, con un crecimiento moderado tanto en exportaciones como en importaciones. El gasto gubernamental está en aumento, pero la tasa de desempleo también es relativamente alta, lo que indica posibles desafíos económicos. El país está en una fase de transición económica, donde el aumento en el gasto gubernamental podría estar impulsando el crecimiento, aunque aún enfrenta retos en términos de competitividad y empleo.
Para este método, es importante analizar la matriz de correlación, ya que permite identificar las relaciones entre las variables. Esto facilita la reducción de la dimensionalidad, manteniendo la mayor parte de la variabilidad en los datos.
Al analizar las matrices de correlación, se observó que algunas variables no presentan una fuerte relación. Por lo tanto, se decidió eliminar estas variables para evaluar su impacto en el rendimiento del modelo.
En un análisis de componentes principales (ACP), es recomendable seleccionar variables que tengan una correlación más fuerte con las demás, ya que el objetivo es captar la mayor varianza posible en un conjunto reducido de componentes. Las variables que muestran menor correlación con el resto contribuyen menos a los patrones que el ACP intenta capturar, lo cual justifica su exclusión.
x26 Tasa de desempleo: Esta variable mide el porcentaje de la población activa sin empleo que busca trabajo, y refleja principalmente las condiciones del mercado laboral. Aunque el empleo puede afectar indirectamente la economía general, no siempre está correlacionado de forma directa con variables de comercio y producción, lo que la hace menos relevante para el análisis de tendencias comerciales o de inversión en el ACP.
x15 Exportaciones de bienes y servicios, volumen, crecimiento (base cuentas nacionales): Esta variable mide el crecimiento en el volumen de exportaciones, pero al centrarse en el cambio porcentual, puede no reflejar patrones consistentes con el volumen total de exportaciones o comercio global. Por tanto, su crecimiento específico puede comportarse de manera distinta a otras métricas de comercio más amplias, mostrando menor relación con ellas en el ACP.
x1 Saldo de cuenta corriente como porcentaje del PIB: Este indicador refleja la diferencia entre exportaciones e importaciones en relación con el PIB, mostrando la dependencia de un país en su comercio exterior. Sin embargo, el saldo de cuenta corriente depende de factores externos, como el tipo de cambio o políticas comerciales internacionales, que pueden diferir de las condiciones internas de producción o consumo, y por eso muestra menor relación con estas otras variables.
x8 Exportaciones netas, contribuciones a los cambios en el PIB real: Aunque esta variable también está relacionada con el comercio, se enfoca en el impacto específico de las exportaciones netas en el crecimiento del PIB real. Este enfoque diferenciado puede hacer que su comportamiento sea menos correlacionado con las variables de volumen o de crecimiento total del PIB, ya que mide contribuciones específicas más que cantidades absolutas.
x29 Tasa de interés a corto plazo: Esta tasa depende en gran medida de la política monetaria del país y afecta principalmente el acceso al crédito y las decisiones de inversión en el corto plazo. La variabilidad de la tasa de interés suele responder a políticas del banco central más que a la dinámica comercial o productiva de un país, de ahí que tenga una relación más débil con las demás variables centradas en comercio y producción.
Dado que contamos con 24 variables, el ACP generará 24 factores, cada uno con un porcentaje distinto de varianza explicada. En este análisis, seleccionaremos solo el número de factores que nos permita acumular más del 70% de la varianza total, se muestra un gráfico con los primeros 10 factores y su porcentaje de varianza explicada.
En este caso se eligen los primeros 3 factores, con los cuales se acumula un 76,93% de varianza explicada lo que significa que estos tres factores capturan el 76,93% de la información total contenida en las 24 variables originales.
Para describir los factores, se analizan las variables que más contribuyen a su formación. A partir del significado de estas variables, es posible interpretar y asignar un nombre a los tres factores seleccionados.
A continuación se presentan 2 gráficos, uno con los factores 1 y 2 y otro con los factores 1 y 3, en los cuales se puede visualizar qué variables tienen más relación con los factores. Estos se usarán como una herramienta visual que ayudará a la interpretación de los factores.
Gráfico del factor 1 y 2 y las variables más relacionadas.
Factor 1: Por el gráfico se observa que las variables con más relación con la dimensión 1 las cuales se muestran de color naranja intenso cercanas al eje vertical eje que representa a la dimension 1, esto puede validarse con la información de las 5 variables que más apotan a la creación de este factor, las cuales son las siguientes:
x6 Gasto de consumo final del gobierno, volumen: 12,88 x10 Producto interno bruto, volumen, precios de mercado: 12,85 x12 Formación bruta de capital fijo, total, volumen: 12,84 x13 Importaciones de bienes y servicios, volumen (base cuentas nacionales): 12,63
Dado el aporte de las variables al primer componente, podríamos interpretarlo como un factor de “Actividad Económica Interna y Demanda Agregada”. La razón es que todas las variables que más contribuyen a este factor están relacionadas con el nivel de gasto y producción en la economía. Este factor, por tanto, parece capturar aspectos clave de la actividad económica total y la demanda agregada, lo cual lo convierte en un buen indicador de la salud económica general y el nivel de inversión y consumo en el país.
Factor 2: Tanto en el gráfico como en los resultados se observa que las variables que más aportan a la formación del factor 2 son: x24 Importaciones de bienes y servicios, deflactor (base cuentas nacionales): 12,57 x23 Exportaciones de bienes y servicios, deflactor: 12,45 x25 Producto interno bruto, precios de mercado, deflactor: 11.71 x19 Producto interno bruto, precios de mercado, deflactor, crecimiento: 11,71
Este conjunto de variables podría interpretarse como un factor de “Niveles de Precios y Competitividad Externa”. Las variables que contribuyen más a este factor están relacionadas con los cambios en los precios de bienes y servicios tanto dentro del país como en el comercio exterior, lo que sugiere que este factor captura la inflación y la competitividad en el mercado global. Este factor podría interpretarse como un indicador de las presiones inflacionarias internas y externas, así como de la competitividad del país en los mercados internacionales.
Para este gráfico solo nos enfocaremos en el factor 3 , ya que el factor 1 ya fue analizado.
Factor 3: En el gráfico se observa que las variables que más se relacionan con el factor 3 son las variables x3,x4,x5,x11, además por los resultados del modelo podemos ver sus respectivos aportes a la formación de este factor:
x3 importaciones de bienes y servicios, volumen en USD (base de cuentas nacionales): 17,07 x4 Comercio de bienes y servicios, volumen en USD: 16,86 x11 Producto interno bruto, volumen en dólares estadounidenses, a paridades de poder adquisitivo constantes: 15,99 x5 Exportaciones de bienes y servicios, volumen en USD (base de cuentas nacionales): 15,96
Para este factor se decidió llamarlo “Comercio Exterior y PIB Ajustado por PPA”. Este conjunto de variables está relacionado principalmente con el comercio de bienes y servicios (importaciones y exportaciones) y el Producto Interno Bruto ajustado por paridad de poder adquisitivo (PPA), lo cual sugiere que este factor captura la dinámica del comercio exterior en relación con el tamaño y el poder adquisitivo de la economía del país.
En este gráfico se puede observar que países están mejor relacionados con cada factor.
Para el factor 1“Actividad Económica Interna y Demanda Agregada” nos encontramos con Korea, y entre los resultados del modelo vemos también a Colombia y Japan. Lo que indica que estos países destacan en esta categoría.
Para el factor 2 “Niveles de Precios y Competitividad Externa” tanto en el gráfico como en los resultados vemos que Argentina es principalmente representado por esta categoría, aunque también podemos ver en menor medida a Türkiye e Ireland.
En este gráfico se encuentra el factor 3 “Comercio Exterior y PIB Ajustado por PPA” en el cual vemos que destacan países como United States, Japan y Germany.
La relación entre los países y los factores identificados hasta ahora nos indica cuáles son los países más destacables en cada factor. Sin embargo, surge la pregunta de si esta relación es positiva o negativa. En los gráficos, ¿los factores ubicados de forma horizontal significan que los países hacia la derecha tienen una relación positiva? ¿Y para los factores ubicados de forma vertical, los países más arriba también representan una relación positiva? Dado que estos gráficos no necesariamente siguen los mismos signos que un plano cartesiano convencional, analizaremos esto con ayuda de la relación entre los países y las variables que más representan a cada factor, lo cual puede verse en el siguiente gráfico.
En el Factor 1 “Actividad Económica Interna y Demanda Agregada”. , se observa una fuerte relación entre Korea y las variables x6, x10y x12. De estas, la variable x6, que representa el “Gasto de consumo final del gobierno, en volumen”, es la que más contribuye a este factor. Al analizar la relación entre esta variable y Korea, se observa que el valor promedio de x6 es 16,150,000,000,000, mientras que el valor para Korea es 337,684,600,000,000. dado que korea está significativamente por encima de la media, podemos concluir que tiene una relación positiva, y los países que se encuentren a la derecha representados por esta dimensión tendrán una relación negativa respecto a la “Actividad Económica Interna y Demanda Agregada”.
En cuanto al Factor 2, “Niveles de Precios y Competitividad Externa”, se observa una relación entre Argentina y la variable que más contribuye a la formación de este factor, x24. Al analizar esta relación, vemos que la media de esta variable, “Importaciones de bienes y servicios, deflactor (base cuentas nacionales)”, es 2.3092, mientras que el valor para Argentina es 41.50. Dado que el valor de Argentina está significativamente por encima de la media, podemos concluir que, cuanto más abajo se encuentren los países en esta dimensión, tendrán una relación más positiva con el factor.
Por último, para el Factor 3, “Comercio Exterior y PIB Ajustado por PPA”, observamos una relación entre United States y la variable x3, que representa las “importaciones de bienes y servicios, volumen en USD (base de cuentas nacionales)”. Al analizar esta relación, vemos que la media de la variable x3 es 382,000,000,000, mientras que el valor para United States es 3,245,332,000,000. Dado que el valor de United States está por encima de la media, esto indica que los países ubicados a la izquierda en este factor tendrán una relación más positiva con el mismo.
Luego de analizar los factores se procedió a visualizar la clusterización por factores, este proceso nos llevó a probar distintos números de clusters para conseguir grupos homólogos y se eligió que este número sería
INSERTAR IMAGEN
Como se observa, se obtuvo un clúster de 27 países, otro de 12, y tres clusters que contienen solo un país cada uno. Esto se debe a que, como hemos analizado, estos países presentan valores muy atípicos en algunas de las variables. Cabe destacar que consideramos la posibilidad de eliminar estas variables para observar cómo cambian los factores y los clústeres, y encontramos que, aunque en menor medida, también se formaban clústeres de un solo país. Por esta razón, decidimos conservar estos países en lugar de excluirlos, y seguir teniendo clústeres de un solo país.
Este presenta cómo se relacionan los clusters con el factor 1 en el eje horizontal, y el factor 2 en el eje vertical, y se observa al cluster 3 donde esta Korea muy representado por el factor 1 “Actividad Económica Interna y Demanda Agregada”, esta relación fue analizada anteriormente, al igual que la relación de Argentina, que se encuentra en el cluster 5, con el factor 2 “Niveles de Precios y Competitividad Externa”.
En este gráfico, podemos observar que el Factor 3, “Comercio Exterior y PIB Ajustado por PPA”, está representado en el eje vertical. El clúster 4, conformado por United States, se encuentra bien posicionado en este factor, lo que refleja su relación positiva con él. Por otro lado, el clúster 1 y el clúster 2 son opuestos en el Factor 3; esto indica que el clúster 2 presenta un mayor nivel de “Comercio Exterior y PIB Ajustado por PPA” en comparación con el clúster 1
Asimismo, se observa que el clúster 3, conformado por Korea, y el clúster 5, conformado por Argentina, son opuestos en el Factor 1, “Actividad Económica Interna y Demanda Agregada”. Dado que Korea tiene una relación positiva con este factor, se infiere que Argentina presenta un nivel menor de “Actividad Económica Interna y Demanda Agregada”.
INSRTAR CODIGO
Este cluster está compuesto por 27 países
-Colombia, Turkiye, India,Chile,Perú ,New Zealand, Iceland,Luxembourg,Slovenia ,Estonia,Croatia, Greece, Israel,Finland,Slovak Republic,Norway ,Poland,South Africa,Hungary,Portũgal, Romania,Australia,Belgium ,Czech Republic ,Sweden,Austria,Denmark.
Con base en los resultados, podemos observar que este grupo de países se caracteriza principalmente por mostrar una media más alta en comparación con la media global en variables como la tasa de crecimiento en el volumen de importaciones, lo que indica un crecimiento en las importaciones. Además, estos países presentan un gasto elevado en consumo final privado, lo que sugiere una fuerte demanda de consumo privado en sus economías.
Por otro lado, encontramos que las variables relacionadas con la fuerza laboral y el empleo total están por debajo de la media global, lo que sugiere que estas economías tienen un mercado laboral más pequeño. Asimismo, los valores en variables relacionadas con el comercio exterior también están por debajo de la media, lo que indica que estos países son más independientes del comercio exterior. Finalmente, el PIB en volumen a precios de paridad de poder adquisitivo también se encuentra por debajo de la media global, lo que sugiere que, cuando se ajustan por el costo de vida y las diferencias de precios, los países en este grupo tienen economías menos robustas en comparación con la media global.
INSERTAR CODIGO
-Germany,Japón ,México,BraziL,Netherlands,Ireland,Switzerland,France,United Kingdom,Spain, Canada,Italy.
Para este clúster, se puede observar que las medias de las variables relacionadas con la actividad económica en el extranjero están por encima de la media global, como es el caso de las exportaciones de bienes y servicios y el volumen de comercio de bienes y servicios. Esto indica que las exportaciones son una parte importante de las economías de estos países, los cuales dependen en mayor medida del comercio internacional.
Además, se observa que en la variable “crecimiento del gasto en consumo final privado”, estos países tienen una media por debajo de la media global. Esto sugiere que el crecimiento económico de estos países se enfoca más en el comercio exterior que en la demanda interna, lo cual puede reflejar un modelo de crecimiento basado en las exportaciones.
Por último, el crecimiento del volumen de importaciones también se encuentra por debajo de la media global. Este comportamiento podría estar relacionado con un enfoque de autosuficiencia, donde los países en este clúster se centran más en producir internamente los bienes que necesitan, reduciendo su dependencia de importaciones. Esto sugiere que, aunque estos países tienen una gran participación en el comercio exterior, mantienen un control más riguroso sobre sus importaciones, probablemente debido a su capacidad de producción interna.
INsertar codigo
Para este clúster, que está compuesto exclusivamente por Korea, se puede observar que las medias de las variables relacionadas con la actividad económica en el extranjero están notablemente por encima de la media global. Esto es evidente en variables como las exportaciones de bienes y servicios y el volumen de comercio de bienes y servicios, lo que indica que las exportaciones son una parte clave de la economía de Korea, y que el país depende en gran medida del comercio internacional para su crecimiento económico. Sin embargo, cuando observamos el “crecimiento del gasto en consumo final privado”, la media de Korea está por debajo de la media global. Esto sugiere que el crecimiento de la economía coreana está más orientado hacia el comercio exterior que hacia el consumo interno. En otras palabras, el país parece seguir un modelo de crecimiento centrado en las exportaciones, donde las demandas externas juegan un papel más relevante que la expansión de la demanda interna. Finalmente, el crecimiento del volumen de importaciones también se encuentra por debajo de la media global. Este comportamiento podría estar relacionado con una estrategia de autosuficiencia, donde Korea se enfoca más en producir internamente los bienes que necesita, disminuyendo su dependencia de importaciones. A pesar de su fuerte participación en el comercio exterior, este patrón sugiere que Korea mantiene un control más estricto sobre sus importaciones, apoyado en su capacidad de producción interna.
INSERTAR CODIGO
Para el clúster correspondiente a los Estados Unidos, se observa que las medias de las variables relacionadas con el comercio internacional y la actividad económica están significativamente por encima de la media global. En particular, las exportaciones de bienes y servicios y el volumen total de comercio (importaciones y exportaciones) son notablemente altos en comparación con los promedios globales. Esto indica que las exportaciones juegan un papel fundamental en la economía de Estados Unidos, el cual mantiene una participación destacada en el comercio internacional.
Por otro lado, aunque el volumen de importaciones también es elevado, se observa que el crecimiento de las importaciones es más bajo en relación con las exportaciones. Este comportamiento sugiere que Estados Unidos mantiene un alto nivel de integración en el comercio exterior, pero su economía está estructurada de manera que también favorece la producción interna para satisfacer muchas de sus necesidades, lo que reduce parcialmente su dependencia de las importaciones.
En términos de empleo y fuerza laboral, las cifras son considerablemente superiores a la media global, lo que refleja una economía robusta que genera una amplia gama de oportunidades laborales. Esto refuerza la idea de que la economía estadounidense no solo está orientada al comercio internacional, sino también al empleo interno, promoviendo la participación activa de su población en diversas industrias.
Insertar
En el clúster 5, que corresponde a un solo país, se observan varios indicios de una economía con altos niveles de precios e inflación. El deflactor del PIB, así como los deflactores de exportaciones e importaciones, son significativamente mayores que la media global, lo que sugiere que los precios internos y los de los productos exportados e importados son relativamente altos. Esto puede indicar que el país está enfrentando una inflación elevada, lo que podría estar relacionado con un rápido crecimiento económico impulsado por la demanda interna e internacional.
Además, el país muestra un sólido crecimiento en su PIB nominal y en la formación de capital fijo, lo que refleja una economía en expansión y con fuertes inversiones en infraestructura y activos productivos. A pesar de la alta inflación, el crecimiento económico parece estar en una fase positiva, con un aumento significativo en la producción y el empleo.
En términos laborales, el país cuenta con una fuerza laboral y un empleo total considerablemente altos en comparación con la media global, lo que podría reflejar una población activa grande o una alta participación en el mercado laboral
-Una posible explicación para estas incoherencias en el método jerárquico es que, si las variables no están suficientemente correlacionadas, el modelo no encuentra patrones significativos para diferenciar a los países de manera eficaz. En este contexto, el modelo tiende a agrupar países con características superficiales similares, sin capturar diferencias importantes.
-Al analizar los datos, se observa que la relación entre el número de variables y países tiene un impacto significativo en la predicción del modelo. Dado que existen muchas más variables económicas que países en el conjunto de datos, es probable que el modelo termine agrupando a la mayoría de los países en función de estas variables. Esto se debe a que el número limitado de países no ofrece suficiente diversidad para diferenciar de manera precisa los efectos de cada variables.