En este análisis de riesgo, se han seleccionado cuatro activos que representan sectores económicos divergentes y cotizan en la Bolsa de Nueva York (NYSE/NASDAQ), lo que permite un análisis estandarizado en dólares (USD):
El análisis comienza con la observación de las series en niveles. Inicialmente se hace la descarga de los precios desde Yahoo Finance y se grafica cada activo.
| Fecha | Activo | Precio |
|---|---|---|
| 2020-01-02 | PFE | 27.04836 |
| 2020-01-03 | PFE | 26.90324 |
| 2020-01-06 | PFE | 26.86868 |
| 2020-01-07 | PFE | 26.77884 |
| 2020-01-08 | PFE | 26.99308 |
| 2020-01-09 | PFE | 26.87560 |
Los precios de los activos seleccionados muestran trayectorias muy distintas entre sí, lo que evidencia la diversidad de los sectores que representan. Mientras algunos activos mantienen tendencias alcistas claras, otros enfrentan periodos de alta variación, caídas profundas o fases de recuperación.
Bancolombia (CIB) presenta una trayectoria con una tendencia alcista acelerada en el último tramo, mostrando una recuperación notable que ha llevado el precio a máximos recientes tras superar periodos de lateralidad. Por su parte, Mercado Libre (MELI) exhibe una dinámica de crecimiento con caídas fuertes y recuperaciones agresivas, caracterizándose por una escala de precios mucho mayor y una alta sensibilidad a los ciclos del sector tecnológico.
En contraste, Toyota (TM) mantiene una evolución más estable y predecible, con una tendencia alcista constante y correcciones menos profundas que el resto del grupo. Finalmente, Pfizer (PFE) muestra un comportamiento atípico con una caída sostenida después de un periodo de auge, atravesando una fase de corrección prolongada que lo ha devuelto a niveles cercanos a los iniciales.
Aunque los activos operan en escalas de precios muy distintas, el hecho de que ninguna serie mantenga una media o varianza constante confirma visualmente que los precios no son estacionarios. Este diagnóstico es fundamental, ya que justifica técnicamente la necesidad de aplicar logaritmos y diferenciación antes de proceder con la modelación ARIMA.
En el análisis de series de tiempo financieras, trabajar con precios nominales suele ser ineficiente debido a la naturaleza no estacionaria de dichas series. Por ello, se procede a la transformación de los datos hacia retornos logarítmicos. Esta transformación normaliza las series, permitiendo la comparabilidad entre activos de distintas escalas monetarias y ofrece una aproximación más cercana a la distribución normal, requisitos indispensables para la posterior modelación mediante algoritmos ARIMA.
En términos de riesgo relativo, MELI destaca por presentar la mayor dispersión y ruido, con fluctuaciones que frecuentemente superan el +/- 10%, mientras que TM exhibe el comportamiento más estable y defensivo. Por su parte, la presencia de picos aislados en las series de CIB y PFE sugiere distribuciones con colas pesadas o alta curtosis, reflejando una sensibilidad marcada a eventos sistémicos y regulatorios. Esta combinación de media estable pero con heterocedasticidad justifica técnicamente el avance hacia las pruebas formales de raíz unitaria y la identificación de la estructura de rezagos.
Al observar los histogramas de manera individual, podemos notar perfiles de riesgo muy distintos que los promedios suelen ocultar:
Este detalle confirma que en riesgo no solo miramos el promedio: mientras TM ofrece tranquilidad, MELI exige estar preparados para escenarios extremos en las colas de la distribución.
| Activo | Media | Volatilidad | Minimo | Maximo | Asimetria | Curtosis |
|---|---|---|---|---|---|---|
| CIB | 0.05% | 2.54% | -22.77% | 25.60% | -0.46 | 20.03 |
| MELI | 0.07% | 3.22% | -18.49% | 17.93% | -0.23 | 6.65 |
| PFE | 0.00% | 1.70% | -8.05% | 10.31% | 0.22 | 6.47 |
| TM | 0.03% | 1.69% | -9.02% | 12.79% | 0.36 | 7.93 |
Una vez transformadas las series, el análisis de los retornos nos permite identificar características que no eran visibles en los precios nominales:
Reversión a la media: Se observa que ahora todas las series se mueven alrededor de cero. A diferencia de los precios, que tenían una tendencia creciente o decreciente, los retornos muestran un comportamiento estable en su promedio, lo que es un primer indicio de estacionariedad.
Clústeres de volatilidad: En las gráficas se identifican claramente días tranquilos y días turbulentos. Los periodos de alta agitación (como el inicio de 2020 o mediados de 2022) tienden a agruparse, mostrando picos de variabilidad que luego regresan a estados de calma.
Identificación del riesgo: Es en esta representación donde ya se empieza a ver el riesgo de cada activo. Por ejemplo, mientras que Toyota (TM) mantiene sus oscilaciones mayormente dentro de un rango estrecho, Mercado Libre (MELI) y Bancolombia (CIB) presentan barras mucho más largas (superando el +/- 10% en algunos casos), lo que refleja una mayor exposición a movimientos bruscos de mercado.
Este comportamiento de “varianza no constante” sugiere que, aunque la media se haya estabilizado, los activos presentan una dinámica de riesgo que debe ser considerada al ajustar los modelos de pronóstico.
Para determinar si las series son aptas para el modelado ARIMA, se realizó un análisis en dos etapas: la prueba estadística de Dickey-Fuller (ADF) y la inspección visual.
| Fecha | Activo | Precio | log_precio | diferencia_log |
|---|---|---|---|---|
| 2020-01-03 | PFE | 26.90324 | 3.292247 | -0.0053796 |
| 2020-01-06 | PFE | 26.86868 | 3.290961 | -0.0012853 |
| 2020-01-07 | PFE | 26.77884 | 3.287612 | -0.0033494 |
| 2020-01-08 | PFE | 26.99308 | 3.295580 | 0.0079685 |
| 2020-01-09 | PFE | 26.87560 | 3.291219 | -0.0043618 |
Para visualizar el efecto de la diferenciación en la estacionariedad, se comparó la serie del log-precio (en niveles) frente a su primera diferencia (retornos) para todos los activos seleccionados.
Como se observa en la comparativa, mientras que el log-precio conserva la trayectoria histórica y la tendencia de los activos (haciendo que la serie no sea estacionaria), la diferencia del log-precio (retorno logarítmico) logra estabilizar la media en torno a cero. Este proceso de diferenciación es fundamental, ya que elimina la raíz unitaria y transforma la serie en un proceso estacionario. Visualmente, se confirma que los retornos presentan una varianza más homogénea, permitiendo identificar clústeres de volatilidad diferenciados por activo (por ejemplo, la mayor amplitud en MELI frente a la estabilidad de TM).
| Activo | Serie | Estadístico ADF | p-valor | Lectura |
|---|---|---|---|---|
| CIB | Precio ajustado | -1.877 | 0.630 | No se rechaza raíz unitaria |
| CIB | Retorno logarítmico | -11.819 | 0.010 | Evidencia de estacionariedad |
| MELI | Precio ajustado | -2.210 | 0.489 | No se rechaza raíz unitaria |
| MELI | Retorno logarítmico | -11.393 | 0.010 | Evidencia de estacionariedad |
| PFE | Precio ajustado | -1.932 | 0.607 | No se rechaza raíz unitaria |
| PFE | Retorno logarítmico | -11.434 | 0.010 | Evidencia de estacionariedad |
| TM | Precio ajustado | -2.537 | 0.351 | No se rechaza raíz unitaria |
| TM | Retorno logarítmico | -12.539 | 0.010 | Evidencia de estacionariedad |
Para complementar la prueba ADF, se analizó si la media y la volatilidad se mantienen constantes en el tiempo utilizando una ventana móvil de 63 días (un trimestre de negociación).
A través del análisis de ventanas móviles, se confirmó que los retornos de los cuatro activos son estacionarios en media, ya que sus promedios trimestrales oscilan de forma persistente alrededor del 0%. Esto indicó que, a diferencia de los precios originales que tienen tendencia, los retornos no se desvían de su valor central a largo plazo. No obstante, las gráficas de volatilidad móvil revelaron que la varianza no es constante, evidenciando claros clústeres de volatilidad, especialmente visibles en MELI y CIB, que presentaron desviaciones mucho más agresivas que PFE o TM.
A continuación se presenta el análisis de rezagos con el fin de observar si el rendimiento de hoy tiene alguna relación lineal con los rendimientos de días anteriores.
Una vez alcanzada la estacionariedad de las series, el paso crítico en la metodología de Box-Jenkins es la identificación de la estructura estocástica de los retornos. Para ello, se utilizaron las funciones de autocorrelación simple (ACF) y parcial (PACF), las cuales actúan como diagnósticos del proceso generador de datos.
| Activo | Fecha | Retorno hoy | Rezago 1 | Rezago 2 | Rezago 3 |
|---|---|---|---|---|---|
| CIB | 2020-01-08 | 0.79% | 0.51% | 0.40% | -0.40% |
| CIB | 2020-01-09 | -2.66% | 0.79% | 0.51% | 0.40% |
| MELI | 2020-01-08 | 1.34% | 3.00% | -0.21% | -0.39% |
| MELI | 2020-01-09 | 2.03% | 1.34% | 3.00% | -0.21% |
| PFE | 2020-01-08 | 0.80% | -0.33% | -0.13% | -0.54% |
| PFE | 2020-01-09 | -0.44% | 0.80% | -0.33% | -0.13% |
| TM | 2020-01-08 | -0.25% | 0.52% | 0.01% | -1.05% |
| TM | 2020-01-09 | -0.46% | -0.25% | 0.52% | 0.01% |
Al observar las gráficas de dispersión para los cuatro activos, se hace evidente la ausencia de un patrón lineal claro. Si el retorno de ayer determinara el de hoy, los puntos formarían una diagonal definida; sin embargo, lo que observamos es una nube de puntos dispersa y una línea de tendencia casi horizontal.
Esta falta de estructura sugiere que los retornos presentan independencia temporal, lo que valida la eficiencia del mercado: la información pasada ya está incorporada en el precio y no sirve para predecir movimientos inmediatos de forma simple. Esta desconexión visual justifica la necesidad de utilizar herramientas más avanzadas, como las funciones de autocorrelación (ACF y PACF), para identificar componentes autorregresivos o de medias móviles en el modelo ARIMA.
| Activo | Cor. Rezago 1 | Cor. Rezago 2 | Cor. Rezago 3 |
|---|---|---|---|
| CIB | 0.0729 | 0.0847 | 0.0823 |
| MELI | -0.0144 | 0.0403 | -0.0476 |
| PFE | -0.0566 | 0.0009 | 0.0451 |
| TM | -0.0185 | 0.0440 | -0.0288 |
A continuación se presentan las funciones de autocorrelación ACF y PACF, las cuales se calculan a partir de la estructura de rezagos analizada previamente. El objetivo de estas pruebas es validar estadísticamente si las relaciones temporales observadas en la matriz poseen la significancia suficiente para ser modeladas, o si por el contrario, los activos se comportan como un ruido blanco donde los rendimientos pasados no condicionan los resultados futuros.
El ACF de los retornos de Pfizer mostró que la mayoría de los rezagos
iniciales permanecieron dentro de las bandas de confianza, sugiriendo
que los choques de corto plazo se disiparon de forma inmediata. Aunque
se registraron picos en los rezagos 9 y 10, estos se atribuyeron a
fluctuaciones aleatorias aisladas, lo que validó la asignación de un
orden \(q = 0\). Paralelamente, el PACF
exhibió rezagos significativos dispersos que no conformaron una
estructura persistente ni un patrón de decaimiento identificable. Ante
la falta de una dependencia autorregresiva continua, se priorizaron
modelos con valores de \(p\) entre 0 y
1 para evitar el sobreajuste y preservar la parsimonia del modelo.
El análisis del ACF para Bancolombia reveló correlaciones positivas y
significativas hasta el tercer rezago, sugiriendo un componente de
medias móviles \(MA(3)\) para capturar
la persistencia de los choques. Complementariamente, el PACF mostró un
corte tras el rezago 3, comportamiento consistente con un proceso
autorregresivo \(AR(3)\). Esta
estructura justificó la evaluación de modelos ARIMA con parámetros \(p\) y \(q\) en el rango \([1, 3]\), con el objetivo de modelar la
memoria lineal de la serie y asegurar residuos caracterizados como ruido
blanco.
El ACF de los retornos de Toyota exhibió un comportamiento de ruido
blanco en todos sus niveles, dado que ninguna de las barras de los
primeros rezagos logró cruzar las bandas de confianza estadística. Esta
ausencia de autocorrelación confirmó que los choques de días previos no
poseían memoria o impacto persistente sobre el retorno actual,
sugiriendo un orden \(q = 0\). Por su
parte, el PACF presentó una dinámica similar, con autocorrelaciones
parciales que oscilaron alrededor de cero sin mostrar patrones de corte
definidos. Este comportamiento fue consistente con una serie de limitada
dependencia lineal, lo cual validó la elección de un modelo de baja
complejidad, como un ARIMA(0,1,0) o camino aleatorio,
priorizando la parsimonia y el análisis de residuos.
El ACF de los retornos de Mercado Libre exhibió un comportamiento
predominante de ruido blanco, ya que las barras iniciales se mantuvieron
dentro de las bandas de confianza. Aunque se registraron picos
marginales en los rezagos 8 y 9, se consideraron ruidos aleatorios sin
relevancia para la modelación, sugiriendo un orden \(q = 0\). Por su parte, el PACF mostró una
estructura dispersa sin patrones de corte claros, confirmando la
ausencia de dependencia lineal autorregresiva significativa. En
consecuencia, los resultados validaron una dinámica de ruido blanco,
justificando la evaluación de modelos con órdenes mínimos (entre 0 y 1)
priorizando la parsimonia.
Para definir la configuración adecuada de los modelos ARIMA, se implementó un procedimiento de búsqueda por cuadrícula (Grid Search), mediante el cual se evaluaron de forma sistemática distintas combinaciones de los componentes autorregresivos (p) y de medias móviles (q).
Los rangos considerados para cada parámetro fueron establecidos a partir del análisis previo de las ACF y PACF, permitiendo restringir el espacio de búsqueda a configuraciones estadísticamente plausibles para cada activo.
La selección preliminar de modelos se realizó mediante la minimización del Criterio de Información de Akaike (AIC), el cual permite evaluar simultáneamente la calidad del ajuste y la complejidad de la especificación estimada, penalizando la incorporación excesiva de parámetros.
En la siguiente tabla se presentan las tres mejores configuraciones obtenidas para cada activo de acuerdo con el criterio AIC:
| Activo | especificacion | AIC | BIC |
|---|---|---|---|
| CIB | ARIMA(2,1,3) | -7182.523 | -7150.294 |
| CIB | ARIMA(0,1,3) | -7182.016 | -7160.530 |
| CIB | ARIMA(1,1,2) | -7181.772 | -7160.286 |
| MELI | ARIMA(0,1,3) | -6408.047 | -6386.561 |
| MELI | ARIMA(0,1,0) | -6407.156 | -6401.785 |
| MELI | ARIMA(2,1,2) | -6406.380 | -6379.523 |
| PFE | ARIMA(2,1,3) | -8462.626 | -8430.397 |
| PFE | ARIMA(1,1,3) | -8457.546 | -8430.689 |
| PFE | ARIMA(1,1,0) | -8453.248 | -8442.505 |
| TM | ARIMA(1,1,3) | -8462.624 | -8435.766 |
| TM | ARIMA(0,1,0) | -8461.955 | -8456.583 |
| TM | ARIMA(2,1,2) | -8461.675 | -8434.817 |
Durante el proceso de estimación surgió la necesidad de evaluar si la ampliación de los rangos de búsqueda para los parámetros p y q generaban mejoras sustanciales en los modelos seleccionados. Los resultados evidenciaron que, en los casos de TM y MELI, la incorporación de configuraciones más amplias producían únicamente variaciones marginales en el valor del AIC, sin modificar de manera significativa la capacidad explicativa del modelo. Este comportamiento sustentó la hipótesis inicial derivada de las pruebas anteriores, donde se manifestó la presencia de ruido blanco.
En contraste, para los activos restantes las mejores configuraciones se mantuvieron estables aun cuando se modificaron los límites de búsqueda, lo cual respaldó la consistencia de los rangos inicialmente definidos a partir del análisis de las funciones ACF y PACF. En consecuencia, los límites establecidos para cada activo resultaron coherentes con la estructura temporal observada en las series y permitieron evitar especificaciones excesivamente complejas.
A continuación, se muestran las especificaciones seleccionadas como modelos finales, derivadas del procedimiento manual de identificación y validadas mediante el análisis conjunto de las pruebas estadísticas y los criterios de información.
| Activo | especificacion | AIC | BIC |
|---|---|---|---|
| CIB | ARIMA(2,1,3) | -7182.523 | -7150.294 |
| MELI | ARIMA(0,1,3) | -6408.047 | -6386.561 |
| PFE | ARIMA(2,1,3) | -8462.626 | -8430.397 |
| TM | ARIMA(1,1,3) | -8462.624 | -8435.766 |
Con los modelos definidos, empleamos la función forecast
para proyectar la trayectoria esperada durante los próximos 20 días
bursátiles.
En las gráficas generadas, los intervalos de confianza se representan mediante bandas sombreadas para ilustrar la incertidumbre progresiva: la zona con un tono más intenso corresponde al intervalo del 80% de confianza, mientras que la zona más clara abarca el intervalo del 95%.
Análisis del pronóstico por activo:
Para interpretar los resultados desde una perspectiva monetaria, aplicamos la función matemática exponencial inversa para retornar las estimaciones de su escala logarítmica a Dólares nominales (USD).
Análisis de la Asimetría del Riesgo:
La reconstrucción visualiza un fenómeno financiero fundamental: dado que el precio de una acción está acotado en cero (pérdida del 100%) pero tiene un crecimiento teóricamente ilimitado, los intervalos de confianza en dólares se deforman y pierden la simetría de la escala logarítmica.
Para concluir el análisis y validar la calidad del modelado
matemático realizado, extraemos las métricas de precisión de los modelos
dentro de la muestra de entrenamiento mediante la función
accuracy(). Estas métricas cuantifican cuánto se desvían
nuestras estimaciones de la realidad observada.
| Activo | RMSE | MAE | MAPE |
|---|---|---|---|
| CIB | 0.0252 | 0.0170 | 0.5642 |
| MELI | 0.0322 | 0.0229 | 0.3219 |
| PFE | 0.0168 | 0.0122 | 0.3642 |
| TM | 0.0168 | 0.0122 | 0.2421 |
Análisis Comparativo de Errores: