Análisis de componentes principales y clúster del mercado de divisas Latinoamérica

Sara Betancourt - Evelyn Diaz - Breyner Santos

El mercado de divisas es el mercado de capitales más grande y profundo del mundo. Se negocian prácticamente las 24 horas del día, en todo el mundo, todos los días. La última Encuesta Trienal del BPI informó que todas las transacciones cambiarias a nivel mundial ascendían a un promedio de 5,3 billones de dólares por día.

Conjunto de Datos

Serie de tiempo de los precios de cierre del mercado de divisas. En este, encontramos 7 pares de divisas en relación con el dólar americano (USD) durante el año 2023. La serie de tiempo se extrae desde Yahoo Finance desde su librería en Python y con el correspondiente ticket de cada moneda. data = yf.download(ticker, start=“2018-01-01”, end=“2023-12-31”

Analisis Exploratorio

describe(Price2023[-1])
##          vars   n    mean     sd  median trimmed    mad     min     max   range
## EURUSD.X    1 260    1.08   0.02    1.08    1.08   0.02    1.05    1.12    0.08
## GBPUSD.X    2 260    1.24   0.03    1.24    1.24   0.03    1.18    1.31    0.13
## USDBRL.X    3 260    4.99   0.15    4.97    4.99   0.14    4.72    5.48    0.76
## USDCLP.X    4 260  838.65  44.00  822.21  834.34  42.37  777.91  946.58  168.67
## USDCOP.X    5 260 4320.71 316.69 4191.99 4303.53 346.19 3832.75 4967.50 1134.75
## USDMXN.X    6 260   17.74   0.69   17.60   17.69   0.74   16.68   19.46    2.78
## USDPEN.X    7 260    3.71   0.08    3.71    3.71   0.10    3.50    3.87    0.37
##           skew kurtosis    se
## EURUSD.X  0.05    -0.61  0.00
## GBPUSD.X  0.05    -0.69  0.00
## USDBRL.X  0.52    -0.25  0.01
## USDCLP.X  0.63    -0.79  2.73
## USDCOP.X  0.37    -1.32 19.64
## USDMXN.X  0.50    -0.76  0.04
## USDPEN.X -0.21    -0.61  0.01

Boxplot de los precios.

El gráfico de boxplot presentado muestra la distribución de los precios escalados de diversas divisas frente al dólar estadounidense durante el año 2023. En este gráfico, el eje X representa las diferentes divisas, mientras que el eje Y refleja los valores de cambio escalados. Cada caja del boxplot indica la distribución de los precios de una divisa en función de su rango intercuartílico, que cubre el 50% de los valores centrales, mientras que los bigotes muestran los valores máximos y mínimos dentro de un rango razonable. Los puntos fuera de los bigotes son considerados valores atípicos.

Este tipo de visualización es útil para comparar las divisas y entender su volatilidad a lo largo del tiempo. Al observar las cajas y los valores atípicos, se puede apreciar cómo ciertas divisas de mercados emergentes, como el real brasileño (USDBRL), el peso colombiano (USDCOP) y el peso mexicano (USDMXN), tienden a mostrar una mayor desvalorización en comparación con las divisas de mercados desarrollados, como el euro (EURUSD) y la libra esterlina (GBPUSD).

En particular, las divisas de mercados emergentes presentan con frecuencia precios por encima de la media, lo que sugiere una mayor volatilidad y, en algunos casos, una mayor desvalorización frente al dólar. Este comportamiento puede reflejar factores como la inestabilidad económica, riesgos políticos y fluctuaciones del mercado global que afectan de manera desproporcionada a las economías emergentes.

Escalado de Datos.

Transformación: En este análisis, se trabajará con los datos escalados para garantizar que todas las divisas se encuentren en la misma escala. Esta transformación es esencial para modelar y detectar patrones estadísticos, ya que permite comparar de manera equitativa las fluctuaciones y tendencias de los diferentes tipos de cambio, eliminando las diferencias que podrían surgir debido a las magnitudes absolutas de cada divisa.

Adicionalmente, podemos ver las correlaciones de las divisas con los precios escalados:

Finalmente, observermos la correlación en un grafico de redes, de forma mas visual:

Componentes Principales

En este análisis, aplicaremos Análisis de Componentes Principales (PCA) para comprender cómo se distribuyen las diferentes divisas y qué componentes principales explican la mayor parte de la varianza en los datos. El PCA nos permitirá reducir la dimensionalidad del conjunto de datos de las divisas, identificando las combinaciones lineales de las variables que capturan la máxima variabilidad en los tipos de cambio. Este enfoque facilitará la interpretación de las relaciones subyacentes entre las monedas, destacando las que tienen un comportamiento similar o diferente, y nos ayudará a identificar las direcciones principales en las que se concentran las fluctuaciones de los precios.

En este análisis, se han visualizado las cuatro primeras componentes principales (PC1, PC2, PC3 y PC4) resultantes del Análisis de Componentes Principales (PCA). Estas componentes reflejan la mayor parte de la variabilidad en los datos de divisas, con PC1 y PC2 capturando las principales fuentes de variación. Aunque las cuatro componentes ofrecen una visión global de las relaciones entre las monedas, nos centraremos principalmente en las dos primeras componentes, PC1 y PC2, ya que son las que explican la mayor proporción de la varianza y proporcionan una representación más clara y significativa de cómo se agrupan y se relacionan las monedas en términos de sus fluctuaciones. Las componentes adicionales (PC3 y PC4) son importantes, pero su contribución a la variabilidad es menor y no serán el foco principal en este análisis.

Las primeras dos componentes principales (PC1 y PC2) muestran cómo se distribuyen las monedas en un espacio bidimensional, donde cada punto representa una moneda y su posición está determinada por sus valores en estas dos componentes. PC1 captura la mayor parte de la varianza de los datos y, por lo tanto, refleja las fluctuaciones más significativas en los tipos de cambio de las divisas. PC2, por su parte, captura una variabilidad adicional que no está explicada por PC1 y proporciona una segunda dimensión importante para entender las relaciones entre las monedas.

En el gráfico resultante, las monedas que están cerca en el espacio de las componentes principales tienen comportamientos similares en términos de sus movimientos de tipo de cambio, mientras que las que se encuentran más distantes muestran diferencias más pronunciadas en su evolución. Las líneas rojas de referencia en x = 0 y y = 0 permiten identificar claramente las divisiones entre las monedas que tienen valores positivos o negativos en cada componente. Al observar estas dos componentes, podemos entender mejor cómo se agrupan las monedas y cuáles son sus patrones comunes de fluctuación.

En este análisis, realizaremos un cluster en el espacio bidimensional generado por las dos primeras componentes principales (PC1 y PC2). El objetivo es identificar grupos de monedas que presenten comportamientos similares en cuanto a sus fluctuaciones de tipo de cambio, utilizando las distancias entre las monedas en este espacio de componentes principales.

El clustering nos permitirá clasificar las monedas en diferentes grupos, lo que puede revelar patrones interesantes, como monedas que se comportan de manera similar frente a factores económicos o que reaccionan de manera parecida ante eventos del mercado. A través de esta técnica, podemos observar cómo las monedas se agrupan de acuerdo a sus características comunes y cómo se diferencian entre sí en términos de sus movimientos en el tiempo. Este enfoque ayudará a comprender mejor las dinámicas de las divisas y proporcionará una base sólida para análisis más profundos.

## K-means clustering with 3 clusters of sizes 2, 4, 1
## 
## Cluster means:
##          PC1        PC2        PC3
## 1 -17.455279   4.476501  0.6459698
## 2   9.819461   1.858097  0.3658121
## 3  -4.367287 -16.385389 -2.7551881
## 
## Clustering vector:
## EURUSD.X GBPUSD.X USDBRL.X USDCLP.X USDCOP.X USDMXN.X USDPEN.X 
##        1        1        2        3        2        2        2 
## 
## Within cluster sum of squares by cluster:
## [1]  28.30055 173.91914   0.00000
##  (between_SS / total_SS =  86.9 %)
## 
## Available components:
## 
## [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
## [6] "betweenss"    "size"         "iter"         "ifault"

En este gráfico tridimensional de las tres primeras componentes principales, la tercera componente (PC3) se representará como la dimensión z, es decir, la profundidad en el espacio 3D. En este contexto, la PC1 y PC2 ocuparán las dimensiones x e y respectivamente, mientras que PC3 agregará una tercera capa de información sobre la variabilidad de las monedas. Esta componente reflejará las fluctuaciones o patrones adicionales en los precios de las divisas que no son capturados completamente por PC1 y PC2.

Al visualizarlo tridimensionalmente, los puntos representarán a las monedas en función de su comportamiento en PC1, PC2 y PC3. Las relaciones entre las monedas y sus posiciones en el espacio 3D permitirán identificar agrupamientos o separaciones basadas en las tres componentes, donde PC3 añadirá una dimensión adicional que podría proporcionar más contexto sobre las variaciones no observadas en las dos primeras componentes. Los puntos más cercanos entre sí en este espacio tridimensional indican monedas con comportamientos similares, mientras que los puntos más distantes sugieren monedas con patrones de comportamiento más disímiles.

Conclusiones

En conclusión, el análisis de las componentes principales revela que el peso mexicano, colombiano, brasileño y peruano se agrupan en el mismo cluster en el espacio bidimensional, lo que indica comportamientos similares en sus fluctuaciones de precios. Sin embargo, al observar el comportamiento en tres dimensiones, podemos notar que el sol peruano se aleja ligeramente de este cluster en la tercera componente (PC3), lo que sugiere una variabilidad adicional que no es capturada completamente en las dos primeras componentes. Este patrón refleja cómo el mercado emergente, representado por estas monedas, presenta características comunes, pero el PCA permite identificar pequeñas diferencias, como la del sol peruano. Además, se observa una clara separación entre el mercado desarrollado y el mercado emergente, lo cual es consistente con las expectativas teóricas: las monedas de mercados emergentes tienden a mostrar más volatilidad y comportamientos contrarios a las monedas de mercados desarrollados. El PCA ha logrado capturar esta varianza de manera efectiva, proporcionando una herramienta valiosa para modelar y tomar decisiones informadas sobre la dinámica de los precios de las divisas en diferentes contextos de mercado.