Modelación ARIMA sobre Retornos Financieros

Introducción y contextualización
Estacionariedad y transformación
- 4. Pruebas de estacionariedad
Rezagos, ACF y PACF

Introducción y contextualización

1. Descripción de los activos seleccionados

En este análisis de riesgo, se han seleccionado cuatro activos que representan sectores económicos divergentes y cotizan en la Bolsa de Nueva York (NYSE/NASDAQ), lo que permite un análisis estandarizado en dólares (USD):

Pfizer (PFE): Sector Salud. Representa la estabilidad y el riesgo regulatorio de la industria farmacéutica.
Bancolombia (CIB): Sector Financiero. Activo cíclico que refleja la salud económica de la región andina.
Toyota (TM): Sector Automotriz. Referente del sector industrial y de consumo discrecional global.
Mercado Libre (MELI): Sector E-commerce. Activo de crecimiento (growth) con alta sensibilidad a la volatilidad tecnológica.

2. Gráfico de precios ajustados

El análisis comienza con la observación de las series en niveles. Inicialmente se hace la descarga de los precios desde Yahoo Finance y se grafica cada activo.

Primeros registros de los precios descargados
Fecha	Activo	Precio
2020-01-02	PFE	27.04836
2020-01-03	PFE	26.90324
2020-01-06	PFE	26.86868
2020-01-07	PFE	26.77884
2020-01-08	PFE	26.99308
2020-01-09	PFE	26.87560

Los precios de los activos seleccionados muestran trayectorias muy distintas entre sí, lo que evidencia la diversidad de los sectores que representan. Mientras algunos activos mantienen tendencias alcistas claras, otros enfrentan periodos de alta variación, caídas profundas o fases de recuperación.

Bancolombia (CIB) presenta una trayectoria con una tendencia alcista acelerada en el último tramo, mostrando una recuperación notable que ha llevado el precio a máximos recientes tras superar periodos de lateralidad. Por su parte, Mercado Libre (MELI) exhibe una dinámica de crecimiento con caídas fuertes y recuperaciones agresivas, caracterizándose por una escala de precios mucho mayor y una alta sensibilidad a los ciclos del sector tecnológico.

En contraste, Toyota (TM) mantiene una evolución más estable y predecible, con una tendencia alcista constante y correcciones menos profundas que el resto del grupo. Finalmente, Pfizer (PFE) muestra un comportamiento atípico con una caída sostenida después de un periodo de auge, atravesando una fase de corrección prolongada que lo ha devuelto a niveles cercanos a los iniciales.

Aunque los activos operan en escalas de precios muy distintas, el hecho de que ninguna serie mantenga una media o varianza constante confirma visualmente que los precios no son estacionarios. Este diagnóstico es fundamental, ya que justifica técnicamente la necesidad de aplicar logaritmos y diferenciación antes de proceder con la modelación ARIMA.

3. Cálculo y gráfico de retornos logarítmicos

En el análisis de series de tiempo financieras, trabajar con precios nominales suele ser ineficiente debido a la naturaleza no estacionaria de dichas series. Por ello, se procede a la transformación de los datos hacia retornos logarítmicos. Esta transformación normaliza las series, permitiendo la comparabilidad entre activos de distintas escalas monetarias y ofrece una aproximación más cercana a la distribución normal, requisitos indispensables para la posterior modelación mediante algoritmos ARIMA.

En términos de riesgo relativo, MELI destaca por presentar la mayor dispersión y ruido, con fluctuaciones que frecuentemente superan el +/- 10%, mientras que TM exhibe el comportamiento más estable y defensivo. Por su parte, la presencia de picos aislados en las series de CIB y PFE sugiere distribuciones con colas pesadas o alta curtosis, reflejando una sensibilidad marcada a eventos sistémicos y regulatorios. Esta combinación de media estable pero con heterocedasticidad justifica técnicamente el avance hacia las pruebas formales de raíz unitaria y la identificación de la estructura de rezagos.

Al observar los histogramas de manera individual, podemos notar perfiles de riesgo muy distintos que los promedios suelen ocultar:

CIB (Bancolombia): Presenta la distribución más “estrecha” y alta (mayor curtosis), lo que indica que sus retornos son muy estables la mayor parte del tiempo. Sin embargo, tiene una cola izquierda con caídas que superan el -10%, lo que refleja un riesgo de eventos extremos puntuales muy marcados.
MELI (Mercado Libre): Es el histograma más “ancho”. Muchos de sus retornos están lejos de cero, lo que significa que sus cambios diarios suelen ser grandes. Sus colas son las más extensas de todo el grupo, confirmando que es el activo con mayor riesgo financiero y volatilidad.
PFE (Pfizer): Muestra una distribución más simétrica, pero con una base amplia. Esto indica que, aunque no tiene tantos valores extremos como MELI, sus variaciones diarias son constantes y el precio “salta” con frecuencia, reflejando la incertidumbre del sector farmacéutico.
TM (Toyota): Es el histograma que mejor se comporta. Los retornos están muy concentrados cerca de cero y sus colas son cortas (rara vez pasan del +/- 5%). Esto demuestra que es un activo maduro, donde los “malos escenarios” son mucho menos severos que en los otros activos.

Este detalle confirma que en riesgo no solo miramos el promedio: mientras TM ofrece tranquilidad, MELI exige estar preparados para escenarios extremos en las colas de la distribución.

Estadísticos Descriptivos de los Retornos Logarítmicos
Activo	Media	Volatilidad	Minimo	Maximo	Asimetria	Curtosis
CIB	0.05%	2.54%	-22.77%	25.60%	-0.46	20.03
MELI	0.07%	3.22%	-18.49%	17.93%	-0.23	6.65
PFE	0.00%	1.70%	-8.05%	10.31%	0.22	6.47
TM	0.03%	1.69%	-9.02%	12.79%	0.36	7.93

Una vez transformadas las series, el análisis de los retornos nos permite identificar características que no eran visibles en los precios nominales:

Reversión a la media: Se observa que ahora todas las series se mueven alrededor de cero. A diferencia de los precios, que tenían una tendencia creciente o decreciente, los retornos muestran un comportamiento estable en su promedio, lo que es un primer indicio de estacionariedad.
Clústeres de volatilidad: En las gráficas se identifican claramente días tranquilos y días turbulentos. Los periodos de alta agitación (como el inicio de 2020 o mediados de 2022) tienden a agruparse, mostrando picos de variabilidad que luego regresan a estados de calma.
Identificación del riesgo: Es en esta representación donde ya se empieza a ver el riesgo de cada activo. Por ejemplo, mientras que Toyota (TM) mantiene sus oscilaciones mayormente dentro de un rango estrecho, Mercado Libre (MELI) y Bancolombia (CIB) presentan barras mucho más largas (superando el +/- 10% en algunos casos), lo que refleja una mayor exposición a movimientos bruscos de mercado.

Este comportamiento de “varianza no constante” sugiere que, aunque la media se haya estabilizado, los activos presentan una dinámica de riesgo que debe ser considerada al ajustar los modelos de pronóstico.

Estacionariedad y transformación

4. Pruebas de estacionariedad

Para determinar si las series son aptas para el modelado ARIMA, se realizó un análisis en dos etapas: la prueba estadística de Dickey-Fuller (ADF) y la inspección visual.

Muestra de la transformación de datos
Fecha	Activo	Precio	log_precio	diferencia_log
2020-01-03	PFE	26.90324	3.292247	-0.0053796
2020-01-06	PFE	26.86868	3.290961	-0.0012853
2020-01-07	PFE	26.77884	3.287612	-0.0033494
2020-01-08	PFE	26.99308	3.295580	0.0079685
2020-01-09	PFE	26.87560	3.291219	-0.0043618

Para visualizar el efecto de la diferenciación en la estacionariedad, se comparó la serie del log-precio (en niveles) frente a su primera diferencia (retornos) para todos los activos seleccionados.

Como se observa en la comparativa, mientras que el log-precio conserva la trayectoria histórica y la tendencia de los activos (haciendo que la serie no sea estacionaria), la diferencia del log-precio (retorno logarítmico) logra estabilizar la media en torno a cero. Este proceso de diferenciación es fundamental, ya que elimina la raíz unitaria y transforma la serie en un proceso estacionario. Visualmente, se confirma que los retornos presentan una varianza más homogénea, permitiendo identificar clústeres de volatilidad diferenciados por activo (por ejemplo, la mayor amplitud en MELI frente a la estabilidad de TM).

Resultados de la prueba ADF por activo
Activo	Serie	Estadístico ADF	p-valor	Lectura
CIB	Precio ajustado	-1.877	0.630	No se rechaza raíz unitaria
CIB	Retorno logarítmico	-11.819	0.010	Evidencia de estacionariedad
MELI	Precio ajustado	-2.210	0.489	No se rechaza raíz unitaria
MELI	Retorno logarítmico	-11.393	0.010	Evidencia de estacionariedad
PFE	Precio ajustado	-1.932	0.607	No se rechaza raíz unitaria
PFE	Retorno logarítmico	-11.434	0.010	Evidencia de estacionariedad
TM	Precio ajustado	-2.537	0.351	No se rechaza raíz unitaria
TM	Retorno logarítmico	-12.539	0.010	Evidencia de estacionariedad

Para complementar la prueba ADF, se analizó si la media y la volatilidad se mantienen constantes en el tiempo utilizando una ventana móvil de 63 días (un trimestre de negociación).

A través del análisis de ventanas móviles, se confirmó que los retornos de los cuatro activos son estacionarios en media, ya que sus promedios trimestrales oscilan de forma persistente alrededor del 0%. Esto indicó que, a diferencia de los precios originales que tienen tendencia, los retornos no se desvían de su valor central a largo plazo. No obstante, las gráficas de volatilidad móvil revelaron que la varianza no es constante, evidenciando claros clústeres de volatilidad, especialmente visibles en MELI y CIB, que presentaron desviaciones mucho más agresivas que PFE o TM.

Rezagos, ACF y PACF

A continuación se presenta el análisis de rezagos con el fin de observar si el rendimiento de hoy tiene alguna relación lineal con los rendimientos de días anteriores.

5. ACF y PACF de los Retornos

Una vez alcanzada la estacionariedad de las series, el paso crítico en la metodología de Box-Jenkins es la identificación de la estructura estocástica de los retornos. Para ello, se utilizaron las funciones de autocorrelación simple (ACF) y parcial (PACF), las cuales actúan como diagnósticos del proceso generador de datos.

Estructura de Rezagos para los Retornos Logarítmicos
Activo	Fecha	Retorno hoy	Rezago 1	Rezago 2	Rezago 3
CIB	2020-01-08	0.79%	0.51%	0.40%	-0.40%
CIB	2020-01-09	-2.66%	0.79%	0.51%	0.40%
MELI	2020-01-08	1.34%	3.00%	-0.21%	-0.39%
MELI	2020-01-09	2.03%	1.34%	3.00%	-0.21%
PFE	2020-01-08	0.80%	-0.33%	-0.13%	-0.54%
PFE	2020-01-09	-0.44%	0.80%	-0.33%	-0.13%
TM	2020-01-08	-0.25%	0.52%	0.01%	-1.05%
TM	2020-01-09	-0.46%	-0.25%	0.52%	0.01%

Al observar las gráficas de dispersión para los cuatro activos, se hace evidente la ausencia de un patrón lineal claro. Si el retorno de ayer determinara el de hoy, los puntos formarían una diagonal definida; sin embargo, lo que observamos es una nube de puntos dispersa y una línea de tendencia casi horizontal.

Esta falta de estructura sugiere que los retornos presentan independencia temporal, lo que valida la eficiencia del mercado: la información pasada ya está incorporada en el precio y no sirve para predecir movimientos inmediatos de forma simple. Esta desconexión visual justifica la necesidad de utilizar herramientas más avanzadas, como las funciones de autocorrelación (ACF y PACF), para identificar componentes autorregresivos o de medias móviles en el modelo ARIMA.

Matriz de Correlación Serial por Activo
Activo	Cor. Rezago 1	Cor. Rezago 2	Cor. Rezago 3
CIB	0.0729	0.0847	0.0823
MELI	-0.0144	0.0403	-0.0476
PFE	-0.0566	0.0009	0.0451
TM	-0.0185	0.0440	-0.0288

A continuación se presentan las funciones de autocorrelación ACF y PACF, las cuales se calculan a partir de la estructura de rezagos analizada previamente. El objetivo de estas pruebas es validar estadísticamente si las relaciones temporales observadas en la matriz poseen la significancia suficiente para ser modeladas, o si por el contrario, los activos se comportan como un ruido blanco donde los rendimientos pasados no condicionan los resultados futuros.

Análisis de Autocorrelación: PFE

El ACF de los retornos de Pfizer mostró que la mayoría de los rezagos iniciales permanecieron dentro de las bandas de confianza, sugiriendo que los choques de corto plazo se disiparon de forma inmediata. Aunque se registraron picos en los rezagos 9 y 10, estos se atribuyeron a fluctuaciones aleatorias aisladas, lo que validó la asignación de un orden \(q = 0\). Paralelamente, el PACF exhibió rezagos significativos dispersos que no conformaron una estructura persistente ni un patrón de decaimiento identificable. Ante la falta de una dependencia autorregresiva continua, se priorizaron modelos con valores de \(p\) entre 0 y 1 para evitar el sobreajuste y preservar la parsimonia del modelo.

Análisis de Autocorrelación: CIB

El análisis del ACF para Bancolombia reveló correlaciones positivas y significativas hasta el tercer rezago, sugiriendo un componente de medias móviles \(MA(3)\) para capturar la persistencia de los choques. Complementariamente, el PACF mostró un corte tras el rezago 3, comportamiento consistente con un proceso autorregresivo \(AR(3)\). Esta estructura justificó la evaluación de modelos ARIMA con parámetros \(p\) y \(q\) en el rango \([1, 3]\), con el objetivo de modelar la memoria lineal de la serie y asegurar residuos caracterizados como ruido blanco.

Análisis de Autocorrelación: TM

El ACF de los retornos de Toyota exhibió un comportamiento de ruido blanco en todos sus niveles, dado que ninguna de las barras de los primeros rezagos logró cruzar las bandas de confianza estadística. Esta ausencia de autocorrelación confirmó que los choques de días previos no poseían memoria o impacto persistente sobre el retorno actual, sugiriendo un orden \(q = 0\). Por su parte, el PACF presentó una dinámica similar, con autocorrelaciones parciales que oscilaron alrededor de cero sin mostrar patrones de corte definidos. Este comportamiento fue consistente con una serie de limitada dependencia lineal, lo cual validó la elección de un modelo de baja complejidad, como un ARIMA(0,1,0) o camino aleatorio, priorizando la parsimonia y el análisis de residuos.

Análisis de Autocorrelación: MELI

El ACF de los retornos de Mercado Libre exhibió un comportamiento predominante de ruido blanco, ya que las barras iniciales se mantuvieron dentro de las bandas de confianza. Aunque se registraron picos marginales en los rezagos 8 y 9, se consideraron ruidos aleatorios sin relevancia para la modelación, sugiriendo un orden \(q = 0\). Por su parte, el PACF mostró una estructura dispersa sin patrones de corte claros, confirmando la ausencia de dependencia lineal autorregresiva significativa. En consecuencia, los resultados validaron una dinámica de ruido blanco, justificando la evaluación de modelos con órdenes mínimos (entre 0 y 1) priorizando la parsimonia.

6. Selección del mejor modelo ARIMA

Para definir la configuración adecuada de los modelos ARIMA, se implementó un procedimiento de búsqueda por cuadrícula (Grid Search), mediante el cual se evaluaron de forma sistemática distintas combinaciones de los componentes autorregresivos (p) y de medias móviles (q).

Los rangos considerados para cada parámetro fueron establecidos a partir del análisis previo de las ACF y PACF, permitiendo restringir el espacio de búsqueda a configuraciones estadísticamente plausibles para cada activo.

La selección preliminar de modelos se realizó mediante la minimización del Criterio de Información de Akaike (AIC), el cual permite evaluar simultáneamente la calidad del ajuste y la complejidad de la especificación estimada, penalizando la incorporación excesiva de parámetros.

En la siguiente tabla se presentan las tres mejores configuraciones obtenidas para cada activo de acuerdo con el criterio AIC:

Paso Intermedio: Comparativa de Modelos Candidatos (Top 3 por Activo)
Activo	especificacion	AIC	BIC
CIB	ARIMA(2,1,3)	-7182.523	-7150.294
CIB	ARIMA(0,1,3)	-7182.016	-7160.530
CIB	ARIMA(1,1,2)	-7181.772	-7160.286
MELI	ARIMA(0,1,3)	-6408.047	-6386.561
MELI	ARIMA(0,1,0)	-6407.156	-6401.785
MELI	ARIMA(2,1,2)	-6406.380	-6379.523
PFE	ARIMA(2,1,3)	-8462.626	-8430.397
PFE	ARIMA(1,1,3)	-8457.546	-8430.689
PFE	ARIMA(1,1,0)	-8453.248	-8442.505
TM	ARIMA(1,1,3)	-8462.624	-8435.766
TM	ARIMA(0,1,0)	-8461.955	-8456.583
TM	ARIMA(2,1,2)	-8461.675	-8434.817

Durante el proceso de estimación surgió la necesidad de evaluar si la ampliación de los rangos de búsqueda para los parámetros p y q generaban mejoras sustanciales en los modelos seleccionados. Los resultados evidenciaron que, en los casos de TM y MELI, la incorporación de configuraciones más amplias producían únicamente variaciones marginales en el valor del AIC, sin modificar de manera significativa la capacidad explicativa del modelo. Este comportamiento sustentó la hipótesis inicial derivada de las pruebas anteriores, donde se manifestó la presencia de ruido blanco.

En contraste, para los activos restantes las mejores configuraciones se mantuvieron estables aun cuando se modificaron los límites de búsqueda, lo cual respaldó la consistencia de los rangos inicialmente definidos a partir del análisis de las funciones ACF y PACF. En consecuencia, los límites establecidos para cada activo resultaron coherentes con la estructura temporal observada en las series y permitieron evitar especificaciones excesivamente complejas.

A continuación, se muestran las especificaciones seleccionadas como modelos finales, derivadas del procedimiento manual de identificación y validadas mediante el análisis conjunto de las pruebas estadísticas y los criterios de información.

Mejores Modelos ARIMA Seleccionados (Minimización estricta de AIC)
Activo	especificacion	AIC	BIC
CIB	ARIMA(2,1,3)	-7182.523	-7150.294
MELI	ARIMA(0,1,3)	-6408.047	-6386.561
PFE	ARIMA(2,1,3)	-8462.626	-8430.397
TM	ARIMA(1,1,3)	-8462.624	-8435.766

7. Pronóstico de Retornos

Con los modelos definidos, empleamos la función forecast para proyectar la trayectoria esperada durante los próximos 20 días bursátiles.

En las gráficas generadas, los intervalos de confianza se representan mediante bandas sombreadas para ilustrar la incertidumbre progresiva: la zona con un tono más intenso corresponde al intervalo del 80% de confianza, mientras que la zona más clara abarca el intervalo del 95%.

Análisis del pronóstico por activo:

Toyota (TM): Exhibe las bandas más estrechas y controladas del grupo. Tanto en la zona de tono intenso (80%) como en la clara (95%), la amplitud del cono es mínima, confirmando que es un activo maduro y altamente estable a corto plazo.
Pfizer (PFE): Proyecta un leve sesgo negativo en su línea central, prolongando estadísticamente la tendencia bajista reciente. Sus bandas de confianza son moderadas.
Bancolombia (CIB): Presenta una trayectoria con un ligero sesgo de recuperación positiva, aunque con una apertura de bandas perceptible que obedece a los episodios recientes de volatilidad.
Mercado Libre (MELI): Despliega un “cono de incertidumbre” masivo. La amplitud entre la línea base y la zona más clara (95%) refleja matemáticamente la alta varianza detectada en los histogramas del punto 3. El modelo reconoce que MELI es susceptible a sufrir saltos o caídas extremas en un marco de solo 20 días.

8. Reconstrucción de Precios

Para interpretar los resultados desde una perspectiva monetaria, aplicamos la función matemática exponencial inversa para retornar las estimaciones de su escala logarítmica a Dólares nominales (USD).

Análisis de la Asimetría del Riesgo:

La reconstrucción visualiza un fenómeno financiero fundamental: dado que el precio de una acción está acotado en cero (pérdida del 100%) pero tiene un crecimiento teóricamente ilimitado, los intervalos de confianza en dólares se deforman y pierden la simetría de la escala logarítmica.

Bancolombia (CIB): La reconstrucción refleja una trayectoria que intenta dar continuidad a la recuperación alcista reciente observada en sus precios históricos. No obstante, las bandas de confianza capturan la sensibilidad inherente al sector financiero regional; el intervalo (banda azul) permite escenarios de fluctuación relevantes que exigen un monitoreo táctico.
Mercado Libre (MELI): Muestra la asimetría más salvaje. Su límite superior de confianza se expande hacia arriba en una curva fuertemente acelerada, denotando un inmenso potencial de crecimiento técnico, pero a costa de un riesgo extremo hacia la baja.
Toyota (TM) y Pfizer (PFE): Por su baja volatilidad intrínseca, las bandas se ven casi como líneas rectas paralelas a la predicción central, validando su naturaleza defensiva frente a los activos de perfil growth.

9. Comparación de Errores de Pronóstico

Para concluir el análisis y validar la calidad del modelado matemático realizado, extraemos las métricas de precisión de los modelos dentro de la muestra de entrenamiento mediante la función accuracy(). Estas métricas cuantifican cuánto se desvían nuestras estimaciones de la realidad observada.

Métricas de Precisión en la Muestra de Entrenamiento
Activo	RMSE	MAE	MAPE
CIB	0.0252	0.0170	0.5642
MELI	0.0322	0.0229	0.3219
PFE	0.0168	0.0122	0.3642
TM	0.0168	0.0122	0.2421

Análisis Comparativo de Errores:

El RMSE (Raíz del Error Cuadrático Medio) penaliza fuertemente los errores grandes (outliers). Activos con alta varianza intrínseca y colas extensas, como Mercado Libre (MELI) y Bancolombia (CIB), presentan lógicamente los niveles de RMSE más elevados. Sus shocks pasados hacen que el ajuste estrictamente lineal del ARIMA sufra mayores desviaciones absolutas ante eventos impredecibles que en los activos estables.
El MAE (Error Absoluto Medio) confirma que, en términos de desviación nominal promedio, los residuos son significativamente más bajos para Toyota (TM) y Pfizer (PFE), rectificando su bajo perfil de riesgo.
El MAPE (Error Porcentual Absoluto Medio) resulta crucial en esta fase comparativa, ya que al estandarizar el error de forma porcentual, observamos que todos los modelos logran capturar la dinámica de sus respectivas series con una precisión relativa muy similar y competitiva. Esto valida metodológicamente el uso de la búsqueda por cuadrícula (Grid Search) y demuestra que los modelos ARIMA seleccionados capturan eficientemente la estructura subyacente de los datos dentro del horizonte temporal evaluado.