¿Qué es el modelo ARIMA?

Un modelo ARIMA (Autoregressive Integrated Moving Average) es una herramienta estadística utilizada para analizar y predecir series de tiempo. En términos simples, es como una “bola de cristal matemática” que usa datos pasados para estimar valores futuros, especialmente útil en finanzas para preveer precios, ventas o ingresos.

Desglose del nombre ARIMA 1. Autoregressive o autorregresivo (AR) → Usa valores pasados para predecir el futuro 2. Integrated (I) → Ajusta tendencias en los datos para hacerlos estacionarios (sin patrones cambiantes en el tiempo). 3.MAving Average o media móvil (MA)- → Suaviza fluctuaciones aleatorias a partir de errores pasados.

ARIMA combina estos tres elementos para crear una predicción más precisa.

Metodología Box-Jenkins

La metodología Box-Jenkins es un enfoque sistemático para construir modelos ARIMA con el objetivo de analizar y pronosticar series de tiempo. Fue desarrollada por George Box y Gwilym Jenkins y se basa en cuatro etapas clave:

1️⃣ Identificación 2️⃣ Estimación 3️⃣ Validación 4️⃣ Pronóstico

Se usa especialmente cuando se quiere encontrar el modelo ARIMA más adecuado para una serie de tiempo.

Paso 1. Identificación del Modelo

Análisis exploratorio de la variable o extracción de señales Antes de ajustar un modelo ARIMA, es necesario entender la estructura de la serie de tiempo.

  1. Verificar estacionariedad (media y varianza constantes en el tiempo) 2. Diferenciar los datos por si hay una tendencia para hacer los datos estacionarios 3. Examinar los gráficos ACF y PACF para determinar los parámetro p y q
## # A tibble: 6 × 2
##   Fecha      Último
##   <date>      <dbl>
## 1 2014-01-01   3520
## 2 2014-02-01   3500
## 3 2014-03-01   4030
## 4 2014-04-01   3605
## 5 2014-05-01   3430
## 6 2014-06-01   3410
##       Jan  Feb  Mar  Apr  May  Jun  Jul  Aug  Sep  Oct  Nov  Dec
## 2014 3520 3500 4030 3605 3430 3410 3180 3325 3165 2750 2290 2080
## 2015 1955 2085 1975 2030 1815 1730 1610 1595 1330 1350 1305 1110
## 2016 1030 1140 1310 1415 1340 1395 1300 1320 1250 1310 1320 1380
## 2017 1375 1320 1350 1360 1335 1380 1395 1370 1400 1665 1750 2210
## 2018 2660 2510 2615 3100 3090 3025 3070 3420 4030 3740 3105 2645
## 2019 2920 3120 3415 2985 2765 2920 2940 2740 2950 3040 3290 3315
## 2020 3180 3105 1900 2090 1990 2075 2080 2190 1895 1791 2081 2245
## 2021 2030 2250 2366 2210 2190 2722 2633 2643 2734 2847 2600 2690
## 2022 2905 3263 3538 3206 3120 2253 2280 2257 2074 2450 2290 2420
## 2023 2669 2698 2450 2288 2036 2140 2292 2357 2365 2423 2520 2340
## 2024 2335 2290 2075 2280 2360 2320 2175 2055 1880 1700 1800 1675

##    Min  Max    Media Mediana DesviacionEstandar   CoefVar
## 1 1030 4030 2326.674    2289           711.6106 0.3058488

Graficamos serie original VS ajustada por estacionalidad

## [1] 120
## [1] 120
## [1] 120

Extracción de señales

*Muchas series de tiempo son una combinación de varias influencias. Es por eso que, separar la tendencia, la estacionalidad y los componentes aleatorios permite entender mejor qué está impulsando los cambios en la serie.

Si analizamos la creación de microempresas en Cali, podríamos querer saber si el crecimiento se debe a una tendencia real o a fluctuaciones estacionales.

Los modelos de pronóstico funcionan mejor cuando las señales subyacentes están bien definidas. Por ejemplo, si eliminamos la estacionalidad de una serie financiera, los modelos predictivos pueden enfocarse en la tendencia real y reducir errores. *Detectar cambios inesperados en la serie es más fácil cuando se eliminan componentes predecibles. Ejemplo: Si hay una caída abrupta en la variable podemos verificar si es una anomalía (ruido) o un cambio estructural en la economía.

En conclusión, la descomposición de series de tiempo permite comprender mejor los datos, mejorar predicciones y tomar decisiones más estratégicas. Es una herramienta clave en la analítica de negocios, especialmente en entornos donde las fluctuaciones en los datos pueden afectar inversiones, políticas económicas y estrategias empresariales.

#Gráfico inicial de la variable 1 en niveles -Original

#Extracción señales variable 1

#Extracción señales variable 2

#Extracción señales variable 3

Después de la descomposición temporal de cada variable, se extrae la variable ajustada por estacionalidad para graficarla junto con la serie original:

Se crea la variable1 ajustada por estacionalidad.

Se crea la variable2 ajustada por estacionalidad

Se crea la variable3 ajustada por estacionalidad

Ahora si se puede graficar las series originales versus la ajustada por estacionalidad

Gráfico serie original VS ajustada Variable 1

Gráfico serie original VS ajustada Variable 2

Gráfico serie original VS ajustada Variable 3

Ahora graficamos serie original vs tendencia

La extracción de la tendencia permite centrarse en los cambios estructurales de la serie.

Analizar la tendencia ayuda a prever escenarios futuros y anticipar posibles crisis o oportunidades en el sector o variable de análisis

Primero se debe obtener la tendencia de cada variable y luego graficarla

Tendencia Variable 1

Tendencia Variable 2

Tendencia Variable 3

Ahora calculamos la tasa de crecimiento de la serie original vs tendencia:

Tasa de crecimiento de la serie de tendencia y original para la variable 1

## [1] 120
## [1] 120
## [1] 120

Ahora calculamos la tasa de crecimiento de la serie original vs tendencia: variable 2

## [1] 120
## [1] 120
## [1] 120
## [1] 120
## [1] 120
## [1] 120

Análisis de la Serie Temporal de Ecopetrol

  1. Tasa de Crecimiento Anual de la Serie Original y la Tendencia Observaciones Claves: Se observa una volatilidad significativa en la tasa de crecimiento anual, con picos notables entre 2017 y 2018, donde el crecimiento anual superó el 150%. Posteriormente, hay una caída abrupta después de 2018, lo que sugiere una fase de corrección o crisis en el valor de la acción. Entre 2020 y 2022, el crecimiento se estabiliza con oscilaciones menos pronunciadas, aunque persisten momentos de alta variabilidad. La tendencia suavizada (línea discontinua negra) sigue un comportamiento más estable, capturando los cambios estructurales de la serie sin el ruido presente en la serie original.
  2. Serie Original vs Tendencia Observaciones Claves: La serie original muestra fluctuaciones abruptas, con variaciones marcadas en ciertos periodos, reflejando alta volatilidad en el precio de la acción de Ecopetrol. La tendencia suavizada permite identificar los ciclos de largo plazo, mostrando una fase bajista hasta 2016, seguida de un crecimiento hasta 2018 y una nueva caída posterior. A partir de 2020, la tendencia indica una leve recuperación con altibajos, pero sin alcanzar los niveles máximos previos.
  3. Serie Original vs Serie Ajustada por Estacionalidad Observaciones Claves: Se observa que la serie original tiene patrones cíclicos pronunciados, posiblemente debido a efectos estacionales en el comportamiento del mercado o la producción de Ecopetrol. La serie ajustada por estacionalidad (línea negra) elimina estos patrones recurrentes, permitiendo un análisis más claro de la evolución subyacente del precio.
  4. Descomposición Temporal de Ecopetrol Observaciones Claves: Componente Estacional: Presenta un patrón regular, lo que sugiere la presencia de una estacionalidad marcada en la serie. Residuo: Se observan variaciones irregulares que pueden deberse a eventos externos o factores inesperados en el mercado. Serie Original y Tendencia: La tendencia muestra ciclos de crecimiento y caída bien definidos, lo que puede estar relacionado con la dinámica del mercado petrolero o eventos macroeconómicos.

Conclusiones Generales Volatilidad Alta: La serie de Ecopetrol ha experimentado variaciones significativas en su tasa de crecimiento anual, con picos en 2017-2018 y caídas abruptas posteriores. Ciclos Marcados: Se identifican fases de expansión y contracción en la tendencia, lo que sugiere un comportamiento cíclico en el precio de la acción. Efecto Estacional: Existe una estacionalidad clara en la serie, lo que indica que ciertos periodos del año pueden influir en los precios de Ecopetrol. Tendencia de Largo Plazo: La tendencia general muestra que, a pesar de la recuperación después de 2020, los valores no han alcanzado los máximos históricos previos.