Un modelo ARIMA (Autoregressive Integrated Moving Average) es una herramienta estadística utilizada para analizar y predecir series de tiempo. En términos simples, es como una “bola de cristal matemática” que usa datos pasados para estimar valores futuros, especialmente útil en finanzas para preveer precios, ventas o ingresos.
Desglose del nombre ARIMA 1. Autoregressive o autorregresivo (AR) → Usa valores pasados para predecir el futuro 2. Integrated (I) → Ajusta tendencias en los datos para hacerlos estacionarios (sin patrones cambiantes en el tiempo). 3.MAving Average o media móvil (MA)- → Suaviza fluctuaciones aleatorias a partir de errores pasados.
ARIMA combina estos tres elementos para crear una predicción más precisa.
La metodología Box-Jenkins es un enfoque sistemático para construir modelos ARIMA con el objetivo de analizar y pronosticar series de tiempo. Fue desarrollada por George Box y Gwilym Jenkins y se basa en cuatro etapas clave:
1️⃣ Identificación 2️⃣ Estimación 3️⃣ Validación 4️⃣ Pronóstico
Se usa especialmente cuando se quiere encontrar el modelo ARIMA más adecuado para una serie de tiempo.
Análisis exploratorio de la variable o extracción de señales Antes de ajustar un modelo ARIMA, es necesario entender la estructura de la serie de tiempo.
## # A tibble: 6 × 2
## Fecha Último
## <date> <dbl>
## 1 2014-01-01 3520
## 2 2014-02-01 3500
## 3 2014-03-01 4030
## 4 2014-04-01 3605
## 5 2014-05-01 3430
## 6 2014-06-01 3410
## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2014 3520 3500 4030 3605 3430 3410 3180 3325 3165 2750 2290 2080
## 2015 1955 2085 1975 2030 1815 1730 1610 1595 1330 1350 1305 1110
## 2016 1030 1140 1310 1415 1340 1395 1300 1320 1250 1310 1320 1380
## 2017 1375 1320 1350 1360 1335 1380 1395 1370 1400 1665 1750 2210
## 2018 2660 2510 2615 3100 3090 3025 3070 3420 4030 3740 3105 2645
## 2019 2920 3120 3415 2985 2765 2920 2940 2740 2950 3040 3290 3315
## 2020 3180 3105 1900 2090 1990 2075 2080 2190 1895 1791 2081 2245
## 2021 2030 2250 2366 2210 2190 2722 2633 2643 2734 2847 2600 2690
## 2022 2905 3263 3538 3206 3120 2253 2280 2257 2074 2450 2290 2420
## 2023 2669 2698 2450 2288 2036 2140 2292 2357 2365 2423 2520 2340
## 2024 2335 2290 2075 2280 2360 2320 2175 2055 1880 1700 1800 1675
## Min Max Media Mediana DesviacionEstandar CoefVar
## 1 1030 4030 2326.674 2289 711.6106 0.3058488
## [1] 120
## [1] 120
## [1] 120
*Muchas series de tiempo son una combinación de varias influencias. Es por eso que, separar la tendencia, la estacionalidad y los componentes aleatorios permite entender mejor qué está impulsando los cambios en la serie.
Si analizamos la creación de microempresas en Cali, podríamos querer saber si el crecimiento se debe a una tendencia real o a fluctuaciones estacionales.
Los modelos de pronóstico funcionan mejor cuando las señales subyacentes están bien definidas. Por ejemplo, si eliminamos la estacionalidad de una serie financiera, los modelos predictivos pueden enfocarse en la tendencia real y reducir errores. *Detectar cambios inesperados en la serie es más fácil cuando se eliminan componentes predecibles. Ejemplo: Si hay una caída abrupta en la variable podemos verificar si es una anomalía (ruido) o un cambio estructural en la economía.
En conclusión, la descomposición de series de tiempo permite comprender mejor los datos, mejorar predicciones y tomar decisiones más estratégicas. Es una herramienta clave en la analítica de negocios, especialmente en entornos donde las fluctuaciones en los datos pueden afectar inversiones, políticas económicas y estrategias empresariales.
#Gráfico inicial de la variable 1 en niveles -Original
#Extracción señales variable 1
#Extracción señales variable 2
#Extracción señales variable 3
Después de la descomposición temporal de cada variable, se extrae la variable ajustada por estacionalidad para graficarla junto con la serie original:
Se crea la variable1 ajustada por estacionalidad.
Se crea la variable2 ajustada por estacionalidad
Se crea la variable3 ajustada por estacionalidad
Ahora si se puede graficar las series originales versus la ajustada por estacionalidad
Gráfico serie original VS ajustada Variable 1
Gráfico serie original VS ajustada Variable 2
Gráfico serie original VS ajustada Variable 3
Ahora graficamos serie original vs tendencia
La extracción de la tendencia permite centrarse en los cambios estructurales de la serie.
Analizar la tendencia ayuda a prever escenarios futuros y anticipar posibles crisis o oportunidades en el sector o variable de análisis
Primero se debe obtener la tendencia de cada variable y luego graficarla
Tendencia Variable 1
Tendencia Variable 2
Tendencia Variable 3
Ahora calculamos la tasa de crecimiento de la serie original vs tendencia:
Tasa de crecimiento de la serie de tendencia y original para la variable 1
## [1] 120
## [1] 120
## [1] 120
Ahora calculamos la tasa de crecimiento de la serie original vs tendencia: variable 2
## [1] 120
## [1] 120
## [1] 120
## [1] 120
## [1] 120
## [1] 120
Conclusiones Generales Volatilidad Alta: La serie de Ecopetrol ha experimentado variaciones significativas en su tasa de crecimiento anual, con picos en 2017-2018 y caídas abruptas posteriores. Ciclos Marcados: Se identifican fases de expansión y contracción en la tendencia, lo que sugiere un comportamiento cíclico en el precio de la acción. Efecto Estacional: Existe una estacionalidad clara en la serie, lo que indica que ciertos periodos del año pueden influir en los precios de Ecopetrol. Tendencia de Largo Plazo: La tendencia general muestra que, a pesar de la recuperación después de 2020, los valores no han alcanzado los máximos históricos previos.