Introducción

Este informe explora distintos métodos de aprendizaje no supervisado aplicados a una base de datos que contiene 29 variables económicas de 41 países, definidos según la Organización para la Cooperación y el Desarrollo Económicos (OCDE). A partir de esta información, utilizaremos técnicas de análisis no supervisado, en particular el Análisis de Componentes Principales (ACP) y la clusterización, para agrupar los países en función de sus características económicas. Estas herramientas permiten identificar grupos de países con patrones económicos similares, simplificando así la interpretación de grandes volúmenes de datos y facilitando la elaboración de recomendaciones en el ámbito de políticas y estrategias económicas.

El aprendizaje no supervisado es una técnica que permite a un modelo encontrar patrones o estructuras en los datos sin contar con etiquetas o resultados conocidos de antemano. A diferencia del aprendizaje supervisado, donde se le dan al modelo ejemplos con etiquetas para que aprenda, en el aprendizaje no supervisado el modelo explora los datos por su cuenta para identificar su estructura interna. Los algoritmos de este enfoque buscan relaciones o patrones ocultos en los datos, lo que ayuda a comprenderlos en mayor profundidad.

Como consecuencia de lo anterior, este trabajo destaca el análisis y la segmentación de países en función de sus indicadores económicos para identificar similitudes y diferencias estructurales entre diversas economías. Esta clasificación facilita un análisis detallado, que aporta información útil para la clasificación de los clusters y factores de los métodos de aprendizaje no supervisado.

Metodología

Para realizar una segmentación eficiente de los países primeramente se estandarizaron los datos, ya que cuando se estandariza la información cada variable se transforma para tener una media de cero y una desviación estándar de uno. Esto se debe realizar para poner todas las variables en la misma escala, independientemente de sus unidades originales (por ejemplo, dólares, porcentajes o cantidades). La estandarización es útil en métodos de análisis como el ACP o el clustering, donde las variables con rangos de valores más amplios podrían influir desproporcionadamente en los resultados si no se ajustan, entonces podemos notar la diferencia en que cuando no se estandariza la información cada variable conserva su escala y unidad original. Esto es necesario sólo si se quiere analizar el impacto absoluto de cada variable, especialmente en casos donde las magnitudes son importantes o tienen un significado particular en su valor original. Teniendo en cuenta lo anterior se procede a desarrollar las siguientes técnicas para realizar nuestro análisis:

Análisis de Componentes Principales (ACP)

El Análisis de Componentes Principales es una técnica de reducción de dimensionalidad que tiene como objetivo simplificar el conjunto de datos manteniendo la mayor cantidad posible de su variabilidad. En lugar de analizar cada indicador económico individualmente, ACP permite transformar las variables originales en un conjunto de “componentes principales”, que son combinaciones lineales de las variables originales y que capturan patrones importantes en los datos.

Procedimiento del ACP:

El Análisis de Componentes Principales (ACP) es una técnica utilizada para sintetizar información o reducir la dimensionalidad de los datos, con el fin de minimizar el error cuadrático. Su objetivo es transformar un conjunto de variables, conocidas como variables originales, en un nuevo conjunto llamado componentes principales. Estos nuevos componentes son combinaciones lineales de las variables originales y están diseñados para ser independientes y no correlacionados entre sí. Un aspecto clave, y también uno de los mayores desafíos del ACP, es la interpretación de los componentes principales. Esta interpretación no se define de antemano, sino que se logra al analizar la relación entre los componentes y las variables originales, las cuales vienen dadas por la siguiente combinación lineal:

\[ Z = \lambda_1 X_1 + \lambda_2 X_2 + \dots + \lambda_p X_p \] -Primero, se calcula la matriz de covarianza o correlación entre las variables. -A partir de esta matriz, se determinan los valores y vectores propios, los cuales representan la varianza de los datos en diferentes direcciones. -Los componentes principales son los vectores propios asociados con los valores propios más grandes, ya que estos representan la mayor variabilidad. -A continuación, se seleccionan los componentes que explican el mayor porcentaje de varianza acumulada, facilitando el análisis al reducir las dimensiones originales.

En el Análisis de Componentes Principales (ACP), cuando hablamos de ortogonalidad en factores, nos referimos a que los componentes principales son perpendiculares entre sí en el espacio de los datos, lo cual implica que no comparten información ni están correlacionados. Esta propiedad asegura que cada componente principal aporta una visión única sobre la variabilidad de los datos, sin duplicar lo que ya capturaron otros componentes. Gracias a esta independencia, la ortogonalidad permite que los resultados del análisis sean más claros y específicos, ya que cada componente representa una dimensión diferente de la información contenida en los datos.

Interpretación de los Componentes: Cada componente principal combina varias variables económicas en una “dimensión” que captura un patrón común. Por ejemplo, un componente podría agrupar variables de crecimiento económico, inversión y empleo, mientras otro podría estar más asociado con indicadores de inflación y deuda. Esta técnica nos permite observar relaciones complejas entre las variables sin perder de vista las tendencias más significativas.

1.Clusterización (Método de Ward y K-means): La clusterización es una técnica de agrupamiento que permite dividir los datos en subconjuntos homogéneos llamados “clusters”. Esto facilita la segmentación de los países según sus características económicas principales.

Método de Ward: El método de Ward es una técnica jerárquica que agrupa datos minimizando la varianza dentro de cada clúster. Funciona de la siguiente manera: -Cada país empieza siendo su propio cluster individual. -Los clusters se van fusionando progresivamente, seleccionando siempre la combinación que minimice el incremento de varianza en el grupo resultante. -Este proceso continúa hasta que todos los países estén en un único cluster o hasta alcanzar el número de clusters deseado.

El método de Ward es ideal para obtener clusters bien diferenciados, ya que minimiza la heterogeneidad interna, lo cual lo hace útil para identificar agrupaciones naturales de países con economías similares.

Los métodos jerárquicos se subdividen en aglomerativos y disociativos. Los métodos aglomerativos realizan un análisis con tantos grupos como individuos existan. A partir de estas unidades iniciales se van formando los grupos, de forma ascendente, con el fin de englobar estos en un mismo conglomerado. Los métodos disociativos o descendentes son el proceso inverso a los métodos aglomerativos. Estos métodos comienzan con un único conglomerado que agrupa todos los casos, formando así el grupo inicial. A través de divisiones sucesivas, se generan grupos cada vez más pequeños. Al final de este proceso, se obtienen tantas agrupaciones como casos individuales se hayan analizado.

K-means: El método K-means es una técnica no jerárquica que requiere establecer el número de clusters, k, de antemano. Funciona de la siguiente forma: -Inicialmente, se eligen k puntos como “centroides” iniciales, cada país se asigna al centroide más cercano, formando k grupos Luego, los centroides se recalculan en función de las nuevas asignaciones, y los países se vuelven a asignar al centroide más cercano. -Este proceso se repite hasta que los centroides ya no cambian significativamente, es decir, hasta que el agrupamiento se estabiliza. Los objetos se representan con vectores reales de dimensiones (x1, x2,…,xn) y el algoritmo k-means construye k grupos donde se minimiza la suma de distancias de los objetos, dentro de cada grupo S={S1,S2,…,Sk} a su centroide, el problema se formula de la siguiente manera:

\[ MinSE(\mu_i) = \text{MinS} \sum_{i=1}^{k} \sum_{x_j \in s_i} \| x_j - \mu_i \|^2 \]

Donde S es el conjunto de datos cuyos elementos son los objetos xj representados por vectores, donde cada uno de sus elementos representa una característica o atributo. Así se obtienen los k grupos o clusters con su correspondiente centroide i.

Este método es eficaz para analizar y clasificar países en clusters específicos, especialmente cuando se tiene una idea aproximada de la cantidad de segmentos económicos relevantes. Ambos métodos ofrecen perspectivas únicas sobre la segmentación. El método de Ward permite explorar jerarquías en los grupos de países, mientras que K-means es útil para obtener agrupaciones claras y con límites definidos. En este estudio, compararemos ambas técnicas para obtener los clusters más representativos según los indicadores económicos disponibles.

Descripción General de las Variables y su Importancia en la Segmentación:

-Producto Interno Bruto (PIB) y Crecimiento Económico: Variables relacionadas con el PIB, crecimiento anual y PIB per cápita representan el tamaño y nivel de desarrollo de una economía. El PIB mide la producción económica total de un país y es uno de los indicadores más importantes para evaluar el bienestar general.

Las economías con PIB alto y crecimiento sostenido suelen tener mayores recursos para invertir en infraestructura y servicios, mientras que las economías con PIB más bajo o decreciente enfrentan mayores desafíos de desarrollo.

1.Variables de Cuenta Corriente y Comercio Exterior

-Saldo de cuenta corriente como porcentaje del PIB: Muestra si un país es netamente exportador o importador en términos de bienes, servicios y transferencias. Un saldo positivo indica superávit, mientras que uno negativo refleja un déficit.

Importancia en la segmentación: Esta variable ayuda a clasificar países en función de su posición en el comercio internacional. Un superávit en cuenta corriente indica que el país podría estar acumulando reservas, mientras que un déficit podría reflejar dependencia de financiamiento externo.

-Exportaciones e Importaciones de bienes y servicios, volumen y crecimiento: Indican el valor total y el crecimiento de bienes y servicios que un país exporta e importa, ajustados por inflación.

Importancia en la Segmentación: La diferencia en los niveles de exportaciones e importaciones permite agrupar países en función de su apertura económica y especialización en sectores exportadores o dependientes de importaciones. El crecimiento en estos volúmenes ayuda a identificar economías en expansión comercial.

-Exportaciones netas, contribuciones a los cambios en el PIB real: Mide la contribución del comercio neto (exportaciones menos importaciones) al crecimiento del PIB real.

Importancia en la Segmentación: Ayuda a identificar la influencia del comercio exterior en el crecimiento económico, diferenciando economías orientadas al comercio de aquellas con un mercado interno predominante.

2. Variables de Tipo de Cambio e Indicadores de Precios

-Tipo de cambio, moneda nacional por USD: Refleja el valor de la moneda nacional frente al dólar estadounidense, siendo un indicador de competitividad internacional.

Importancia en la Segmentación: Un tipo de cambio favorable puede indicar competitividad exportadora, mientras que un tipo de cambio alto puede sugerir presiones inflacionarias o dependencia de la moneda extranjera.

-Deflactores de exportaciones, importaciones y PIB: Miden el cambio en los precios de exportaciones, importaciones y de toda la economía.

Importancia en la Segmentación: Los deflactores indican el comportamiento de precios de los productos específicos y del conjunto económico, permitiendo clasificar países según sus dinámicas inflacionarias y su exposición a cambios de precios internacionales.

3. Variables de Consumo e Inversión

-Gasto de consumo final del gobierno y privado (volumen y crecimiento): Reflejan el gasto en bienes y servicios por parte de los gobiernos y los hogares.

Importancia en la Segmentación: Estas variables permiten identificar economías con alto gasto público frente a aquellas donde el consumo privado es predominante, lo cual puede reflejar el rol del estado y el nivel de bienestar en la economía.

-Formación bruta de capital fijo, total y crecimiento: Representa la inversión en infraestructura, edificios y maquinaria, y su crecimiento.

Importancia en la Segmentación: Permite agrupar economías en función de su tasa de inversión en activos productivos, un indicador clave del potencial de crecimiento y desarrollo económico.

4.Variables de Producto Interno Bruto (PIB)

-Producto interno bruto, valor nominal y volumen, crecimiento: Mide el tamaño de la economía en términos actuales y reales, y su crecimiento.

Importancia en la Segmentación: Estas variables ayudan a identificar el tamaño y dinamismo de las economías, clasificando a los países según su nivel de desarrollo económico y su crecimiento.

-PIB en dólares constantes a paridades de poder adquisitivo (PPA): Ajusta el PIB en dólares según la paridad de poder adquisitivo, permitiendo una comparación estandarizada entre países.

Importancia en la Segmentación: Facilita la comparación entre economías ajustando las diferencias de precios, lo que permite clasificar países en función de su poder adquisitivo relativo.

5. Variables de Empleo y Tasa de Interés

-Tasa de desempleo: Porcentaje de la población activa sin empleo.

Importancia en la segmentación: Indica el nivel de empleo y la capacidad de absorción laboral de la economía.Países con baja tasa de desempleo suelen tener economías estables o en crecimiento, mientras que altas tasas pueden indicar problemas estructurales.

-Empleo total y fuerza laboral: Muestra el número de personas empleadas y la cantidad de personas activas en la economía. Importancia en la segmentación: Facilita la clasificación de países según su tamaño laboral y la capacidad de empleo, diferenciando economías con alta participación laboral de aquellas con limitaciones estructurales. Variables como la tasa de empleo y desempleo brindan información sobre el mercado laboral y la actividad económica general. Las tasas de desempleo elevadas pueden indicar dificultades en la economía, mientras que las bajas tasas de desempleo suelen asociarse con economías en crecimiento. Estas variables también permiten identificar economías con alta capacidad de generación de empleo frente a aquellas con desafíos estructurales en su mercado laboral.

-Tasa de interés a corto plazo: Refleja el costo del dinero a corto plazo, usualmente controlado por el banco central.

Importancia en la segmentación: Una tasa de interés baja puede indicar políticas de estímulo económico, mientras que una alta sugiere controles contra la inflación. Esto permite agrupar economías según su contexto monetario.

-Deuda Pública y Déficit Fiscal: Variables que reflejan la deuda pública y el déficit fiscal son cruciales para comprender la sostenibilidad de una economía. Los países con altos niveles de deuda pueden tener menos flexibilidad para invertir en crecimiento a futuro y más vulnerabilidad ante crisis. En cambio, una deuda controlada sugiere una economía más saludable y con mayor capacidad de respuesta ante cambios económicos.

-Inflación y Estabilidad de Precios: Indicadores de inflación muestran la variación en los precios de bienes y servicios. Una inflación alta generalmente sugiere una economía inestable, lo cual puede desincentivar la inversión y el ahorro. Los países con baja inflación tienden a atraer más inversiones y tienen una mayor estabilidad en el poder adquisitivo, siendo más atractivos para inversionistas y empresas.

Justificación de la segmentación

-La segmentación de los países en estos clusters permite entender mejor la diversidad de estructuras económicas, niveles de desarrollo y desafíos que enfrenta cada grupo. Esta clasificación es útil para diseñar políticas específicas para cada tipo de economía, facilitar la cooperación internacional, y realizar comparaciones precisas. Los clusters también proporcionan una base para identificar patrones de convergencia o divergencia entre las economías a lo largo del tiempo, ayudando a anticipar tendencias en el desarrollo global.

-Al segmentar países con base en estos datos, el análisis no supervisado permite descubrir patrones que revelan similitudes económicas y estructurales, ofreciendo una base sólida para la toma de decisiones y la formulación de políticas.

ANALISIS DESCRIPTIVO

GRupos de variables segun su naturaleza.

1. Comercio Exterior

x3 - Importaciones de bienes y servicios (volumen en USD) x4 - Comercio de bienes y servicios (volumen en USD) x5 - Exportaciones de bienes y servicios (volumen en USD) x13 - Importaciones de bienes y servicios (volumen) x14 - Exportaciones de bienes y servicios (volumen) x15 - Crecimiento del volumen de exportaciones de bienes y servicios x16 - Crecimiento del volumen de importaciones de bienes y servicios x23 - Deflactor de exportaciones de bienes y servicios x24 - Deflactor de importaciones de bienes y servicios

2. Producto Interno Bruto (PIB)

x9 - Producto interno bruto (valor nominal) x10 - Producto interno bruto (volumen, precios de mercado) x11 - Producto interno bruto (volumen en USD a paridades de poder adquisitivo) x17 - Crecimiento del volumen del PIB x18 - Crecimiento del PIB en valor nominal x19 - Crecimiento del deflactor del PIB x25 - Deflactor del PIB (precios de mercado)

3. Consumo

x6 - Gasto de consumo final del gobierno (volumen) x7 - Gasto de consumo final privado (volumen) x21 - Crecimiento del gasto de consumo final privado (volumen) x22 - Crecimiento del gasto de consumo final del gobierno (volumen)

4. Inversión y Formación de Capital

x12 - Formación bruta de capital fijo total (volumen) x20 - Crecimiento de la formación bruta de capital fijo total

5. Empleo y Fuerza Laboral

x26 - Tasa de desempleo x27 - Empleo total (encuesta de fuerza laboral) x28 - Fuerza laboral 6. Tasas e Intereses x1 - Balanza por cuenta corriente como porcentaje del PIB x2 - Tipo de cambio (moneda nacional por USD) x8 - Exportaciones netas, contribución al cambio en el PIB real x29 - Tasa de interés a corto plazo

Variables Elegidas y Justificación

COMERCIO EXTERIOR x14 - Exportaciones de bienes y servicios (volumen): Esta variable representa la cantidad total de productos y servicios exportados por un país, excluyendo los efectos de precios y tipo de cambio, ofreciendo así una perspectiva precisa de la verdadera capacidad exportadora de la economía. A diferencia de los valores monetarios de exportaciones, que pueden cambiar debido a la inflación o a la fluctuación de las divisas, la cantidad de exportaciones refleja la demanda internacional de productos y servicios de un país, así como su competitividad en el mercado mundial. Comparar este crecimiento en volumen entre países hace más sencillo el estudio de su desempeño de exportación y su reacción ante modificaciones en la demanda mundial, lo cual es fundamental para economías abiertas y dependientes.

PIB x18 - Crecimiento del PIB en valor nominal: Esta variable mide el crecimiento económico en términos absolutos, considerando tanto el incremento en la producción como los cambios en los precios. A diferencia del PIB ajustado por inflación, el crecimiento nominal del PIB muestra la expansión total de la economía, incluyendo la inflación y los precios del entorno. Esto permite medir el dinamismo económico de un país y comparar la expansión entre distintas economías de forma más completa. Un gran incremento en el PIB nominal indica no sólo un aumento en la producción, sino también un entorno económico activo, donde la demanda y los precios se ven afectados de manera positiva, lo cual es fundamental para atraer inversiones y promover el comercio internacional.

INVERSION Y FORMACION DEL CAPITAL x20 - Crecimiento de la formación bruta de capital fijo total (porcentaje): Seleccionamos esta variable porque se centra en el aumento de la inversión en activos que generan ingresos, algo fundamental para el progreso económico a largo plazo. En comparación con otros indicadores de inversión, el aumento en la formación bruta de capital fijo brinda información clara sobre cómo una economía está expandiendo su capacidad productiva y su infraestructura, lo cual es esencial para mantener y fortalecer la competitividad. Sin una inversión constante en activos fijos, las economías pueden experimentar restricciones en su crecimiento futuro, dado que la capacidad de producir bienes y servicios está estrechamente ligada a estos recursos.

CONSUMO x21 - Crecimiento del gasto de consumo final privado (porcentaje): Seleccionamos esta variable porque el aumento del gasto privado es importante debido a que refleja la actividad y la seguridad de las familias en la economía. A diferencia de simplemente mirar el gasto en términos absolutos, el aumento en el consumo privado refleja cómo cambia el poder de compra y el consumo de productos y servicios. Este medidor es esenciall en economías que dependen del consumo, ya que muestra la estabilidad y dirección del mercado interno, ofreciendo una perspectiva más específica sobre la demanda que puede impulsar el desarrollo.

EMPLEO/ LABORAL x26 - Tasa de desempleo (porcentaje): La tasa de desempleo es una medida directa de la salud del mercado laboral y, por ende, del bienestar económico de la población. Un desempleo alto suele estar asociado con dificultades económicas, mientras que un desempleo bajo refleja una economía con suficiente demanda de trabajo. Esta fue elegida sobre otras variables de empleo porque el porcentaje de desempleo permite comparar entre países o períodos de forma más estandarizada. El total de empleo no es tan claro, ya que depende del tamaño de la población activa y no muestra directamente la proporción de personas sin trabajo.

TASAS E INTERESES x29 - Tasa de interés a corto plazo: Seleccionamos esta variable porque es esencial, ya que afecta directamente en el precio del crédito, tiene efecto en el consumo, la inversión y la tasa de cambio a corto plazo. Esta es clave de la política monetaria, esta variable nos ayuda a ver cómo los bancos centrales gestionan la cantidad de dinero en circulación, controlan la inflación y fomentan el crecimiento económico. Comparar la tasa de interés a corto plazo entre naciones revela la estrategia económica y monetaria de cada una y su impacto en la atracción de inversiones

x14 Este gráfico muestra la distribución del volumen de exportaciones de bienes y servicios en los países de la base de datos. La línea dentro de la caja representa la mediana, que indica el nivel típico de exportación en volumen, reflejando la capacidad exportadora habitual de estos países. La caja abarca el rango intercuartílico (IQR), que incluye al 50% de los países con volúmenes de exportación más comunes, proporcionando una visión de la variabilidad entre las economías. Los puntos fuera de los bigotes representan valores atípicos, es decir, países con volúmenes de exportación significativamente más altos o bajos que el resto. Los valores atípicos altos podrían indicar países con una fuerte demanda internacional de sus productos y servicios, o una alta competitividad en el mercado global. Estos países probablemente tienen sectores exportadores fuertes y economías abiertas con gran integración en el comercio global. Los valores atípicos que aparecen debajo de los bigotes representan países con volúmenes de exportación significativamente bajos en comparación con el resto. Estos pueden indicar economías menos competitivas en el mercado global, con baja demanda internacional de sus productos y servicios. Esto podría deberse a factores como una infraestructura exportadora limitada, menor diversificación en los sectores exportables, o barreras comerciales.

x18 Este gráfico muestra el crecimiento del Producto Interno Bruto en términos nominales en los países incluidos en la base de datos. La línea en la caja muestra la mediana, indicando el crecimiento típico del Producto Interno Bruto (PIB) nominal en la mayoría de los países. Esto muestra tanto el aumento en la producción como las modificaciones en los precios, ofreciendo una visión general de la actividad económica. La mitad de países experimenta un crecimiento económico por debajo de esta cifra y la otra mitad por encima. La caja muestra el rango intercuartílico (IQR), que abarca al 50% de países con el crecimiento del PIB más frecuente. Los bigotes muestran el rango de crecimiento típico de la mayoría de los países, a excepción de los valores atípicos. En este caso, se pueden ver puntos por fuera de los bigotes, los cuales son considerados valores atípicos. Estas naciones destacan por su aumento en el Producto Interno Bruto nominal en comparación con otras. Este aumento significativo puede ser causado por una fuerte demanda interna, políticas económicas favorables o un incremento en los precios de los productos básicos que el país exporta, lo que impulsa la producción y los precios en la economía

x20: Este gráfico indica el crecimiento de la formación bruta de capital fijo total en los países de la base de datos. La línea dentro de la caja representa la mediana, la cual muestra el crecimiento típico del desarrollo de capital fijo. Esto involucra la inversión en infraestructura y bienes de capital que ayuda a aumentar la capacidad productiva de las naciones. La mitad de países tiene un crecimiento de inversión en capital menor que este número y la otra mitad mayor. La caja muestra el rango intercuartílico (IQR), que incluye al 50% de países con crecimiento más común en inversión de capital. Los bigotes señalan el rango de crecimiento en el cual se encuentran la mayoría de los países sin ser considerados valores atípicos. En este caso, se notan puntos por fuera de los bigotes, que indican valores atípicos. Estos países podrían destacar por su crecimiento en inversión de capital en comparación con otros. Los valores atípicos hacia arriba pueden indicar países que están invirtiendo mucho en infraestructura o desarrollo económico, mientras que los valores negativos o muy bajos pueden indicar países con problemas económicos o falta de inversión en capital.

x20: Este gráfico indica el crecimiento de la formación bruta de capital fijo total en los países de la base de datos. La línea dentro de la caja representa la mediana, la cual muestra el crecimiento típico del desarrollo de capital fijo. Esto involucra la inversión en infraestructura y bienes de capital que ayuda a aumentar la capacidad productiva de las naciones. La mitad de países tiene un crecimiento de inversión en capital menor que este número y la otra mitad mayor. La caja muestra el rango intercuartílico (IQR), que incluye al 50% de países con crecimiento más común en inversión de capital. Los bigotes señalan el rango de crecimiento en el cual se encuentran la mayoría de los países sin ser considerados valores atípicos. En este caso, se notan puntos por fuera de los bigotes, que indican valores atípicos. Estos países podrían destacar por su crecimiento en inversión de capital en comparación con otros. Los valores atípicos hacia arriba pueden indicar países que están invirtiendo mucho en infraestructura o desarrollo económico, mientras que los valores negativos o muy bajos pueden indicar países con problemas económicos o falta de inversión en capital.

X21: Este gráfico indica que el aumento del gasto en consumo final privado es relativamente estable en la mayoría de los países incluidos en la base de datos. La mediana, la cual es aquella representada por la línea en el centro de la caja muestra el crecimiento “típico” del consumo privado en los países: la mitad está por encima y la otra mitad por debajo de este valor. La caja misma indica el rango donde está el 50% central de las naciones, mostrando el rango de incremento más común. Los bigotes, que se extienden desde la caja indican el alcance del crecimiento sin ser considerado un valor atípico. Los puntos arriba de los bigotes indican países con un aumento en el consumo privado mucho mayor que la mayoría, posiblemente reflejando economías en crecimiento acelerado o con medidas para estimular el consumo. Esto podría indicar que en estos pocos países existe una expansión en el poder adquisitivo de los hogares o políticas de incentivo al consumo.

x26: Este gráfico muestra la distribución de la tasa de desempleo en los países de la base de datos. La línea en la caja muestra la mediana, que señala el nivel típico de desempleo. Una mediana baja indica que la mitad de los países tienen tasas de desempleo menores que este valor, lo cual generalmente indica una demanda laboral saludable y menor inestabilidad económica en estos países. La caja muestra el rango intercuartílico (IQR), que representa el 50% de los países con las tasas de desempleo más comunes. Los bigotes indican el rango en el cual se encuentran la mayoría de los países, excluyendo valores atípicos. Los puntos fuera de los bigotes son valores atípicos, es decir, países con tasas de desempleo inusualmente altas o bajas en comparación con otros. Los valores atípicos en la parte superior podrían indicar países con problemas significativos en el mercado laboral o dificultades económicas que limitan la oferta de trabajo. Por otro lado, los valores atípicos en la parte inferior reflejan países con tasas de desempleo bajas.

Análisis de Clúster con Variables

Análisis de cluster con variables

Inicialmente, se realizó un análisis de clustering utilizando el método de K-means, que sugirió un valor óptimo de k=2. Para corroborar esta información, se aplicó también el método de Ward o jerárquico, el cual coincidió en que el valor óptimo era k= 2. Sin embargo, al observar los resultados, se identificó una limitación importante, de los 42 países, el modelo agrupó 41 en un solo clúster, destacando a Korea como un valor atípico en un grupo que se conforma con un solo individuo.

Este resultado indica que, aunque el valor de k minimiza las distancias, la estructura de la agrupación no es óptima, ya que no diferencia adecuadamente entre las distintas características de los países. Los datos observados dentro del principal clúster indican que el valor de k=2 podría no capturar toda la variabilidad de los datos, reduciendo la efectividad del análisis para identificar patrones económicos significativos.

Dado que se busca una mejor eficiencia, se propone generar más grupos que permitan una segmentación más detallada y representativa entre los países. El método jerárquico, permite realizar cortes en el dendrograma para obtener una segmentación más flexible, fue elegido para continuar el análisis. A través de este enfoque, se determinó que el valor óptimo de k es 5, lo que permitió una partición más acorde con las características y la diversidad de los países analizados.

Resultados Método jerárquico

La distribución de los países en estos 5 grupos refleja las características específicas de cada clúster, las cuales se analizaron en función de 29 variables que representan factores económicos . El primer grupo quedó conformado por 28 países, mientras que el segundo grupo incluyó 11 países. Además, se identificaron tres países como atípicos, los cuales, debido a sus características únicas, fueron clasificados en clústeres individuales. Estos países atípicos fueron Argentina, Corea y Estados Unidos, cada uno de los cuales forma un grupo separado debido a sus comportamientos económicos distintos en comparación con los otros países en el análisis.

Interpretación.

Una vez analizado el dendrograma, se procede con la clasificacion de los paises, Para esto, es necesario analizar las medias de las variables de cada clúster,lo cual permitió realizar un análisis detallado de comportamientos económicos de los países.

Cluster 1 (28 países). “Economías Estables con Crecimiento Moderado” Este cluster está compuesto por países con características económicas moderadas, pero más estables. Las exportaciones son moderadas y el gasto del gobierno es bajo. La importación también es moderada, con un crecimiento del PIB más bien plano, lo que refleja economías con crecimiento moderado y sostenido, pero sin grandes cambios. Este cluster podría incluir países en desarrollo, ya que representa países con una economía relativamente estable pero con un comercio exterior limitado y con monedas relativamente depreciadas.

Cluster 2. (11 países) “Economías en Transición con Déficit Comercial” Los países en este grupo muestran un déficit comercial significativo, con importaciones que superan a las exportaciones. La tasa de desempleo es más alta en este cluster, y el gasto privado está creciendo lentamente. Sin embargo, algunos indicadores, como el PIB nominal y el crecimiento económico, son relativamente positivos. Estos países pueden estar enfrentando desafíos en términos de competitividad o dependencia de las importaciones, pero siguen experimentando cierto crecimiento económico.

Grupos atípicos.

Los países identificados como atípicos , Argentina, Estados Unidos, Corea muestran valores extremos en variables clave, distinguiéndose notablemente de los otros grupos. Argentina tiene la tasa de cambio más alta, con un valor de 4.7801600, reflejando una moneda altamente devaluada en comparación con los demás países. Estados Unidos exhibe una media muy elevada en importaciones (5.211281131) y en exportaciones (4.20379977), lo que refuerza su perfil de economía con un alto nivel de comercio. Su tasa de cambio es de -0.3834608, lo cual destaca su estabilidad relativa en comparación con Argentina. Corea tiene un valor de exportaciones netas de 0.10480392, lo que indica una posición positiva en esta variable a diferencia de otros grupos, que muestran valores negativos. Corea también destaca por la media más alta en exportaciones por volumen (6.20845014), lo cual subraya su enfoque en la producción y el comercio internacional. Su tasa de cambio es 0.1897807, bastante estable comparado con Argentina. Estas características únicas en variables como tasa de cambio, importaciones y exportaciones hacen que cada uno de estos países se clasifique como atípico, reflejando estructuras y comportamientos económicos distintos de los demás grupos. Para estos datos atípicos se decide hacer una agrupacion individualmente, de la siguiente manera.

Cluster 3 (Corea) “Economía Estable y en crecimiento” Este país tiene un gasto gubernamental alto y un crecimiento económico moderado. Su tasa de desempleo es baja y muestra estabilidad en las exportaciones. Sin embargo, la importación de bienes no está creciendo tanto como en otros clusters, lo que podría indicar una economía más avanzada o en una fase de estabilización económica. Este país podría ser un ejemplo de una economía más desarrollada con un enfoque en políticas de sostenibilidad y estabilidad

Cluster 4. (Estados unidos) “Economía Fuerte y en Crecimiento” Este país tiene una economía fuerte, con un PIB nominal alto y un crecimiento económico notable. Las exportaciones son sólidas, y aunque el gasto del gobierno está disminuyendo, el país sigue mostrando una gran capacidad económica. Es posible que sea un país con una economía avanzada o en rápido crecimiento, que puede estar experimentando un alto nivel de desarrollo en el sector externo.

Cluster 5 (Argentina) “Economías en Crecimiento con Déficit Comercial” Este país presenta un fuerte déficit comercial, con un crecimiento moderado tanto en exportaciones como en importaciones. El gasto gubernamental está en aumento, pero la tasa de desempleo también es relativamente alta, lo que indica posibles desafíos económicos. El país está en una fase de transición económica, donde el aumento en el gasto gubernamental podría estar impulsando el crecimiento, aunque aún enfrenta retos en términos de competitividad y empleo.

Método ACP

Para este método, es importante analizar la matriz de correlación, ya que permite identificar las relaciones entre las variables. Esto facilita la reducción de la dimensionalidad, manteniendo la mayor parte de la variabilidad en los datos.

MATRIZ DE CORRELACIONES

Al analizar las matrices de correlación, se observó que algunas variables no presentan una fuerte relación. Por lo tanto, se decidió eliminar estas variables para evaluar su impacto en el rendimiento del modelo.

¿POR QUÉ ELIMINAR ESTAS VARIABLES?

En un análisis de componentes principales (ACP), es recomendable seleccionar variables que tengan una correlación más fuerte con las demás, ya que el objetivo es captar la mayor varianza posible en un conjunto reducido de componentes. Las variables que muestran menor correlación con el resto contribuyen menos a los patrones que el ACP intenta capturar, lo cual justifica su exclusión.

x26 Tasa de desempleo: Esta variable mide el porcentaje de la población activa sin empleo que busca trabajo, y refleja principalmente las condiciones del mercado laboral. Aunque el empleo puede afectar indirectamente la economía general, no siempre está correlacionado de forma directa con variables de comercio y producción, lo que la hace menos relevante para el análisis de tendencias comerciales o de inversión en el ACP.

x15 Exportaciones de bienes y servicios, volumen, crecimiento (base cuentas nacionales): Esta variable mide el crecimiento en el volumen de exportaciones, pero al centrarse en el cambio porcentual, puede no reflejar patrones consistentes con el volumen total de exportaciones o comercio global. Por tanto, su crecimiento específico puede comportarse de manera distinta a otras métricas de comercio más amplias, mostrando menor relación con ellas en el ACP.

x1 Saldo de cuenta corriente como porcentaje del PIB: Este indicador refleja la diferencia entre exportaciones e importaciones en relación con el PIB, mostrando la dependencia de un país en su comercio exterior. Sin embargo, el saldo de cuenta corriente depende de factores externos, como el tipo de cambio o políticas comerciales internacionales, que pueden diferir de las condiciones internas de producción o consumo, y por eso muestra menor relación con estas otras variables.

x8 Exportaciones netas, contribuciones a los cambios en el PIB real: Aunque esta variable también está relacionada con el comercio, se enfoca en el impacto específico de las exportaciones netas en el crecimiento del PIB real. Este enfoque diferenciado puede hacer que su comportamiento sea menos correlacionado con las variables de volumen o de crecimiento total del PIB, ya que mide contribuciones específicas más que cantidades absolutas.

x29 Tasa de interés a corto plazo: Esta tasa depende en gran medida de la política monetaria del país y afecta principalmente el acceso al crédito y las decisiones de inversión en el corto plazo. La variabilidad de la tasa de interés suele responder a políticas del banco central más que a la dinámica comercial o productiva de un país, de ahí que tenga una relación más débil con las demás variables centradas en comercio y producción.

APLICACIÓN DEL APC

Dado que contamos con 24 variables, el ACP generará 24 factores, cada uno con un porcentaje distinto de varianza explicada. En este análisis, seleccionaremos solo el número de factores que nos permita acumular más del 70% de la varianza total, se muestra un gráfico con los primeros 10 factores y su porcentaje de varianza explicada.

En este caso se eligen los primeros 3 factores, con los cuales se acumula un 76,93% de varianza explicada lo que significa que estos tres factores capturan el 76,93% de la información total contenida en las 24 variables originales.

DESCRIPCIÓN DE FACTORES

Para describir los factores, se analizan las variables que más contribuyen a su formación. A partir del significado de estas variables, es posible interpretar y asignar un nombre a los tres factores seleccionados.

A continuación se presentan 2 gráficos, uno con los factores 1 y 2 y otro con los factores 1 y 3, en los cuales se puede visualizar qué variables tienen más relación con los factores. Estos se usarán como una herramienta visual que ayudará a la interpretación de los factores.

Gráfico del factor 1 y 2 y las variables más relacionadas.

Factor 1: Por el gráfico se observa que las variables con más relación con la dimensión 1 las cuales se muestran de color naranja intenso cercanas al eje vertical eje que representa a la dimension 1, esto puede validarse con la información de las 5 variables que más apotan a la creación de este factor, las cuales son las siguientes:

x6 Gasto de consumo final del gobierno, volumen: 12,88 x10 Producto interno bruto, volumen, precios de mercado: 12,85 x12 Formación bruta de capital fijo, total, volumen: 12,84 x13 Importaciones de bienes y servicios, volumen (base cuentas nacionales): 12,63

Dado el aporte de las variables al primer componente, podríamos interpretarlo como un factor de “Actividad Económica Interna y Demanda Agregada”. La razón es que todas las variables que más contribuyen a este factor están relacionadas con el nivel de gasto y producción en la economía. Este factor, por tanto, parece capturar aspectos clave de la actividad económica total y la demanda agregada, lo cual lo convierte en un buen indicador de la salud económica general y el nivel de inversión y consumo en el país.

Factor 2: Tanto en el gráfico como en los resultados se observa que las variables que más aportan a la formación del factor 2 son: x24 Importaciones de bienes y servicios, deflactor (base cuentas nacionales): 12,57 x23 Exportaciones de bienes y servicios, deflactor: 12,45 x25 Producto interno bruto, precios de mercado, deflactor: 11.71 x19 Producto interno bruto, precios de mercado, deflactor, crecimiento: 11,71

Este conjunto de variables podría interpretarse como un factor de “Niveles de Precios y Competitividad Externa”. Las variables que contribuyen más a este factor están relacionadas con los cambios en los precios de bienes y servicios tanto dentro del país como en el comercio exterior, lo que sugiere que este factor captura la inflación y la competitividad en el mercado global. Este factor podría interpretarse como un indicador de las presiones inflacionarias internas y externas, así como de la competitividad del país en los mercados internacionales.

Gráfico del factor 1 y 3 con las variables más relacionadas.

Para este gráfico solo nos enfocaremos en el factor 3 , ya que el factor 1 ya fue analizado.

Factor 3: En el gráfico se observa que las variables que más se relacionan con el factor 3 son las variables x3,x4,x5,x11, además por los resultados del modelo podemos ver sus respectivos aportes a la formación de este factor:

x3 importaciones de bienes y servicios, volumen en USD (base de cuentas nacionales): 17,07 x4 Comercio de bienes y servicios, volumen en USD: 16,86 x11 Producto interno bruto, volumen en dólares estadounidenses, a paridades de poder adquisitivo constantes: 15,99 x5 Exportaciones de bienes y servicios, volumen en USD (base de cuentas nacionales): 15,96

Para este factor se decidió llamarlo “Comercio Exterior y PIB Ajustado por PPA”. Este conjunto de variables está relacionado principalmente con el comercio de bienes y servicios (importaciones y exportaciones) y el Producto Interno Bruto ajustado por paridad de poder adquisitivo (PPA), lo cual sugiere que este factor captura la dinámica del comercio exterior en relación con el tamaño y el poder adquisitivo de la economía del país.

RELACIÓN DE LOS FACTORES CON LOS PAÍSES

En este gráfico se puede observar que países están mejor relacionados con cada factor.

Para el factor 1“Actividad Económica Interna y Demanda Agregada” nos encontramos con Korea, y entre los resultados del modelo vemos también a Colombia y Japan. Lo que indica que estos países destacan en esta categoría.

Para el factor 2 “Niveles de Precios y Competitividad Externa” tanto en el gráfico como en los resultados vemos que Argentina es principalmente representado por esta categoría, aunque también podemos ver en menor medida a Türkiye e Ireland.

En este gráfico se encuentra el factor 3 “Comercio Exterior y PIB Ajustado por PPA” en el cual vemos que destacan países como United States, Japan y Germany.

La relación entre los países y los factores identificados hasta ahora nos indica cuáles son los países más destacables en cada factor. Sin embargo, surge la pregunta de si esta relación es positiva o negativa. En los gráficos, ¿los factores ubicados de forma horizontal significan que los países hacia la derecha tienen una relación positiva? ¿Y para los factores ubicados de forma vertical, los países más arriba también representan una relación positiva? Dado que estos gráficos no necesariamente siguen los mismos signos que un plano cartesiano convencional, analizaremos esto con ayuda de la relación entre los países y las variables que más representan a cada factor, lo cual puede verse en el siguiente gráfico.

En el Factor 1 “Actividad Económica Interna y Demanda Agregada”. , se observa una fuerte relación entre Korea y las variables x6​, x10y x12​. De estas, la variable x6​, que representa el “Gasto de consumo final del gobierno, en volumen”, es la que más contribuye a este factor. Al analizar la relación entre esta variable y Korea, se observa que el valor promedio de x6​ es 16,150,000,000,000, mientras que el valor para Korea es 337,684,600,000,000. dado que korea está significativamente por encima de la media, podemos concluir que tiene una relación positiva, y los países que se encuentren a la derecha representados por esta dimensión tendrán una relación negativa respecto a la “Actividad Económica Interna y Demanda Agregada”.

En cuanto al Factor 2, “Niveles de Precios y Competitividad Externa”, se observa una relación entre Argentina y la variable que más contribuye a la formación de este factor, x24​. Al analizar esta relación, vemos que la media de esta variable, “Importaciones de bienes y servicios, deflactor (base cuentas nacionales)”, es 2.3092, mientras que el valor para Argentina es 41.50. Dado que el valor de Argentina está significativamente por encima de la media, podemos concluir que, cuanto más abajo se encuentren los países en esta dimensión, tendrán una relación más positiva con el factor.

Por último, para el Factor 3, “Comercio Exterior y PIB Ajustado por PPA”, observamos una relación entre United States y la variable x3​, que representa las “importaciones de bienes y servicios, volumen en USD (base de cuentas nacionales)”. Al analizar esta relación, vemos que la media de la variable x3 es 382,000,000,000, mientras que el valor para United States es 3,245,332,000,000. Dado que el valor de United States está por encima de la media, esto indica que los países ubicados a la izquierda en este factor tendrán una relación más positiva con el mismo.

CLUSTERIZACIÓN POR FACTORES.

Luego de analizar los factores se procedió a visualizar la clusterización por factores, este proceso nos llevó a probar distintos números de clusters para conseguir grupos homólogos y se eligió que este número sería 5.

dendograma Como se observa, se obtuvo un clúster de 27 países, otro de 12, y tres clusters que contienen solo un país cada uno. Esto se debe a que, como hemos analizado, estos países presentan valores muy atípicos en algunas de las variables. Cabe destacar que consideramos la posibilidad de eliminar estas variables para observar cómo cambian los factores y los clústeres, y encontramos que, aunque en menor medida, también se formaban clústeres de un solo país. Por esta razón, decidimos conservar estos países en lugar de excluirlos, y seguir teniendo clústeres de un solo país.

RELACIÓN DE LOS CLUSTER Y LOS FACTORES.

factor1y2
factor1y2
factor2
factor2

Este presenta cómo se relacionan los clusters con el factor 1 en el eje horizontal, y el factor 2 en el eje vertical, y se observa al cluster 3 donde esta Korea muy representado por el factor 1 “Actividad Económica Interna y Demanda Agregada”, esta relación fue analizada anteriormente, al igual que la relación de Argentina, que se encuentra en el cluster 5, con el factor 2 “Niveles de Precios y Competitividad Externa”.

factor3
factor3

En este gráfico, podemos observar que el Factor 3, “Comercio Exterior y PIB Ajustado por PPA”, está representado en el eje vertical. El clúster 4, conformado por United States, se encuentra bien posicionado en este factor, lo que refleja su relación positiva con él. Por otro lado, el clúster 1 y el clúster 2 son opuestos en el Factor 3; esto indica que el clúster 2 presenta un mayor nivel de “Comercio Exterior y PIB Ajustado por PPA” en comparación con el clúster 1

Asimismo, se observa que el clúster 3, conformado por Korea, y el clúster 5, conformado por Argentina, son opuestos en el Factor 1, “Actividad Económica Interna y Demanda Agregada”. Dado que Korea tiene una relación positiva con este factor, se infiere que Argentina presenta un nivel menor de “Actividad Económica Interna y Demanda Agregada”.

INTERPRETACIÓN DE LOS CLUSTERS

  1. Este cluster está compuesto por 27 países

-Colombia, Turkiye, India,Chile,Perú ,New Zealand, Iceland,Luxembourg,Slovenia ,Estonia,Croatia, Greece, Israel,Finland,Slovak Republic,Norway ,Poland,South Africa,Hungary,Portũgal, Romania,Australia,Belgium ,Czech Republic ,Sweden,Austria,Denmark.

Con base en los resultados, podemos observar que este grupo de países se caracteriza principalmente por mostrar una media más alta en comparación con la media global en variables como la tasa de crecimiento en el volumen de importaciones, lo que indica un crecimiento en las importaciones. Además, estos países presentan un gasto elevado en consumo final privado, lo que sugiere una fuerte demanda de consumo privado en sus economías.

Por otro lado, encontramos que las variables relacionadas con la fuerza laboral y el empleo total están por debajo de la media global, lo que sugiere que estas economías tienen un mercado laboral más pequeño. Asimismo, los valores en variables relacionadas con el comercio exterior también están por debajo de la media, lo que indica que estos países son más independientes del comercio exterior. Finalmente, el PIB en volumen a precios de paridad de poder adquisitivo también se encuentra por debajo de la media global, lo que sugiere que, cuando se ajustan por el costo de vida y las diferencias de precios, los países en este grupo tienen economías menos robustas en comparación con la media global.

  1. Esta compuesto por 12

Germany,Japón ,México,BraziL,Netherlands,Ireland,Switzerland,France,United Kingdom,Spain, Canada,Italy.

Para este clúster, se puede observar que las medias de las variables relacionadas con la actividad económica en el extranjero están por encima de la media global, como es el caso de las exportaciones de bienes y servicios y el volumen de comercio de bienes y servicios. Esto indica que las exportaciones son una parte importante de las economías de estos países, los cuales dependen en mayor medida del comercio internacional.

Además, se observa que en la variable “crecimiento del gasto en consumo final privado”, estos países tienen una media por debajo de la media global. Esto sugiere que el crecimiento económico de estos países se enfoca más en el comercio exterior que en la demanda interna, lo cual puede reflejar un modelo de crecimiento basado en las exportaciones.

Por último, el crecimiento del volumen de importaciones también se encuentra por debajo de la media global. Este comportamiento podría estar relacionado con un enfoque de autosuficiencia, donde los países en este clúster se centran más en producir internamente los bienes que necesitan, reduciendo su dependencia de importaciones. Esto sugiere que, aunque estos países tienen una gran participación en el comercio exterior, mantienen un control más riguroso sobre sus importaciones, probablemente debido a su capacidad de producción interna.

Cluster 3

korea

Para este clúster, que está compuesto exclusivamente por Korea, se puede observar que las medias de las variables relacionadas con la actividad económica en el extranjero están notablemente por encima de la media global. Esto es evidente en variables como las exportaciones de bienes y servicios y el volumen de comercio de bienes y servicios, lo que indica que las exportaciones son una parte clave de la economía de Korea, y que el país depende en gran medida del comercio internacional para su crecimiento económico. Sin embargo, cuando observamos el “crecimiento del gasto en consumo final privado”, la media de Korea está por debajo de la media global. Esto sugiere que el crecimiento de la economía coreana está más orientado hacia el comercio exterior que hacia el consumo interno. En otras palabras, el país parece seguir un modelo de crecimiento centrado en las exportaciones, donde las demandas externas juegan un papel más relevante que la expansión de la demanda interna. Finalmente, el crecimiento del volumen de importaciones también se encuentra por debajo de la media global. Este comportamiento podría estar relacionado con una estrategia de autosuficiencia, donde Korea se enfoca más en producir internamente los bienes que necesita, disminuyendo su dependencia de importaciones. A pesar de su fuerte participación en el comercio exterior, este patrón sugiere que Korea mantiene un control más estricto sobre sus importaciones, apoyado en su capacidad de producción interna.

cluster 4

United States

Para el clúster correspondiente a los Estados Unidos, se observa que las medias de las variables relacionadas con el comercio internacional y la actividad económica están significativamente por encima de la media global. En particular, las exportaciones de bienes y servicios y el volumen total de comercio (importaciones y exportaciones) son notablemente altos en comparación con los promedios globales. Esto indica que las exportaciones juegan un papel fundamental en la economía de Estados Unidos, el cual mantiene una participación destacada en el comercio internacional.

Por otro lado, aunque el volumen de importaciones también es elevado, se observa que el crecimiento de las importaciones es más bajo en relación con las exportaciones. Este comportamiento sugiere que Estados Unidos mantiene un alto nivel de integración en el comercio exterior, pero su economía está estructurada de manera que también favorece la producción interna para satisfacer muchas de sus necesidades, lo que reduce parcialmente su dependencia de las importaciones.

En términos de empleo y fuerza laboral, las cifras son considerablemente superiores a la media global, lo que refleja una economía robusta que genera una amplia gama de oportunidades laborales. Esto refuerza la idea de que la economía estadounidense no solo está orientada al comercio internacional, sino también al empleo interno, promoviendo la participación activa de su población en diversas industrias.

Cluster 5

Argentina

En el clúster 5, que corresponde a un solo país, se observan varios indicios de una economía con altos niveles de precios e inflación. El deflactor del PIB, así como los deflactores de exportaciones e importaciones, son significativamente mayores que la media global, lo que sugiere que los precios internos y los de los productos exportados e importados son relativamente altos. Esto puede indicar que el país está enfrentando una inflación elevada, lo que podría estar relacionado con un rápido crecimiento económico impulsado por la demanda interna e internacional.

Además, el país muestra un sólido crecimiento en su PIB nominal y en la formación de capital fijo, lo que refleja una economía en expansión y con fuertes inversiones en infraestructura y activos productivos. A pesar de la alta inflación, el crecimiento económico parece estar en una fase positiva, con un aumento significativo en la producción y el empleo.

En términos laborales, el país cuenta con una fuerza laboral y un empleo total considerablemente altos en comparación con la media global, lo que podría reflejar una población activa grande o una alta participación en el mercado laboral

CONCLUSIONES

-La base de datos presenta valores atípicos que dificultan una agrupación equilibrada de los países, ya que estos datos extremos agregan ruido en el modelo, afectando la precisión y la interpretación de los clusters formados. -Una posible explicación para estas incoherencias en el método jerárquico es que, si las variables están muy correlacionadas, el modelo no encuentra patrones significativos para diferenciar a los países de manera eficaz. En este contexto, el modelo tiende a agrupar países con características similares, sin capturar diferencias importantes.

-La comparación entre los grupos formados mediante el método de Ward y aquellos obtenidos tras la reducción de dimensionalidad muestra una variación significativa en la organización y el número de clusters, aunque los países atípicos permanecen identificables en ambos enfoques. Esto muestra que cada método prioriza y agrupa de forma distinta las características relevantes para definir los grupos.

-La aplicación de ACP no solo permite reducir la dimensionalidad, simplificando así el análisis, sino que también ofrece herramientas adicionales que favorecen la interpretación de los resultados. Esto facilita una mejor comprensión de las características más influyen en la estructura de los datos y mejora la eficiencia del análisis.