Series de Tiempo

Integrantes

  • Johan Caicedo.

  • Carlos Rincon.

  • Santiago Guitierrez.

  • Jhon Diaz.

ÍNDICE

  1. Introducción.

  2. Presentación de la variable.

  3. Adecuación de la serie.

  4. Modelo SARIMA

  5. Analisis de resultados.

  6. Conclusiones

INTRODUCCIÓN


Como parte de un análisis exhaustivo del mercado automotriz del Reino Unido, se ha recopilado una serie temporal de datos sobre las matrículas de vehículos nuevos obtenidos de la OCDE (Organización para la Cooperación y el Desarrollo Económicos). Esta información, con una periodicidad mensual (12 observaciones por año), abarca el periodo comprendido entre 2014 y 2020.

PRESENTACIÓN DE LA VARIABLE


Medida: Primeras matriculaciones
Unidad de medida: Vehiculos
Modo de transporte: Carretera
Cobertura: incluye los microcoches, los taxis y los automoviles de pasajeros de alquiler siempre que tengan menos de diez plazas. esta variable tambien incluye las camionetas

ANALISIS GRÁFICO

Correlograma de la serie

Test de dickey- fuller de la serie


    Augmented Dickey-Fuller Test

data:  Datos_train
Dickey-Fuller = -2.1413, Lag order = 12, p-value = 0.5178
alternative hypothesis: stationary


- Hipótesis nula (\(H_0\)): La serie no es estacionaria.
- Hipótesis alternativa (\(H_1\)): La serie es estacionaria.

El valor p es mayor a 0.05 por lo cual no se rechaza la hipotsis nula lo que indica que la serie es no estacionaria.

Correlograma de la serie diferenciada estacionalmente

Test de dickey- fuller Serie diferenciada estacionalmente


    Augmented Dickey-Fuller Test

data:  serie_DE
Dickey-Fuller = -1.8691, Lag order = 12, p-value = 0.6279
alternative hypothesis: stationary


- Hipótesis nula (\(H_0\)): La serie no es estacionaria.
- Hipótesis alternativa (\(H_1\)): La serie es estacionaria.

El valor p es mayor a 0.05 por lo cual no se rechaza la hipotsis nula lo que indica que la serie es no estacionaria.

Serie con primera diferencia

Test Dickey- fuller


    Augmented Dickey-Fuller Test

data:  serie_dif
Dickey-Fuller = -4.954, Lag order = 3, p-value = 0.01
alternative hypothesis: stationary


- Hipótesis nula (\(H_0\)): La serie no es estacionaria.
- Hipótesis alternativa (\(H_1\)): La serie es estacionaria.

Como el valor p es de 0.01 se rechaza \(H_0\)

Modelo SARIMA

Sarima es un acrónimo que significa Modelo Autorregresivo Integrado de Medias Móviles con Estacionalidad, este modelo es muy utilizado para analizar y predecir series temporales que presentan patrones estacionales.

Componentes adicionales del modelo :

Estacional(S): Captura patrones que se repiten en intervalos fijos

Notación Matematica

El modelo SARIMA se representa como SARIMA(p,d,q)(P,D,Q)m, donde:

  • p: Orden del componente autorregresivo no estacional
  • d: Grado de diferenciación no estacional
  • q: Orden del componente de medias móviles no estacional
  • P: Orden del componente autorregresivo estacional
  • D: Grado de diferenciación estacional
  • Q: Orden del componente de medias móviles estacional
  • m: Número de periodos por ciclo estacional

Selección de orden (p,q,P,Q)

Posibles candidatos

  • p: 1,2,5
  • q: 1,6,7
  • P estacional: 0
  • Q estacional: 0

Modelos resultantes


Modelo AICc
7 SARIMA (5,1,1)(0,1,0)[12] 1398.463
1 SARIMA (1,1,1)(0,1,0)[12] 1399.403
4 SARIMA (2,1,1)(0,1,0)[12] 1399.723
3 SARIMA (1,1,7)(0,1,0)[12] 1399.924
2 SARIMA (1,1,6)(0,1,0)[12] 1401.916
6 SARIMA (2,1,7)(0,1,0)[12] 1402.677
5 SARIMA (2,1,6)(0,1,0)[12] 1403.482
8 SARIMA (5,1,6)(0,1,0)[12] 1408.764
9 SARIMA (5,1,7)(0,1,0)[12] 1408.932
10 AUTO SARIMA (0,0,1) 1929.432

Comprobación de residuales


    Ljung-Box test

data:  Residuals from ARIMA(5,1,1)(0,1,0)[12]
Q* = 2.4067, df = 4, p-value = 0.6614

Model df: 6.   Total lags used: 10

Accuaracy

Métricas de precisión del modelo
Metric Value
ME -1988.1651933
RMSE 17958.6816714
MAE 10538.6207423
MPE -12.5651850
MAPE 16.9457175
MASE 0.0519666
ACF1 -0.0193518

MAPE: Mide el error promedio porcentual en las predicciones


MASE: Mide la magnitud del error en comparación con la magnitud del error de un pronóstico ingenuo.

Pronóstico

Pronóstico SARIMA vs Datos Reales
Fecha Pronostico Lo_95 Hi_95 Real
2020-03-01 458845.45 418017.547 499673.35 254125
2020-04-01 145040.64 104201.260 185880.02 4221
2020-05-01 162765.66 121650.805 203880.51 20459
2020-06-01 215248.02 173063.580 257432.47 143383
2020-07-01 143712.89 101320.408 186105.37 172857
2020-08-01 51638.18 9120.645 94155.72 86478
2020-09-01 333568.45 285764.680 381372.22 326936
2020-10-01 127642.43 79644.684 175640.19 139261
2020-11-01 136063.46 87634.938 184491.99 113558
2020-12-01 137528.54 87934.110 187122.97 133107

Comparación gráfica

Conclusiones

visualizando los datos obtenidos del pronóstico del modelo comparado con la serie original, denotamos que hay una predicción bastante similar a los valores reales de la serie, con ello podemos inferir que el modelo y la selección de P;D;Q estacional y no estacional fueron bien seleccionadas. No obstante, debido al fenómeno “la pandemia” ocurrido en el periodo seleccionado para realizar la predicción, se genera un desfase levemente significativo que se pudo haber evitado seleccionando otro periodo más estable para realizar la predicción.

¡Muchas Gracias!