Johan Caicedo.
Carlos Rincon.
Santiago Guitierrez.
Jhon Diaz.
Introducción.
Presentación de la variable.
Adecuación de la serie.
Modelo SARIMA
Analisis de resultados.
Conclusiones
Como parte de un análisis exhaustivo del mercado automotriz del Reino Unido, se ha recopilado una serie temporal de datos sobre las matrículas de vehículos nuevos obtenidos de la OCDE (Organización para la Cooperación y el Desarrollo Económicos). Esta información, con una periodicidad mensual (12 observaciones por año), abarca el periodo comprendido entre 2014 y 2020.
Medida: Primeras matriculaciones
Unidad de medida: Vehiculos
Modo de transporte: Carretera
Cobertura: incluye los microcoches, los taxis y los automoviles de pasajeros de alquiler siempre que tengan menos de diez plazas. esta variable tambien incluye las camionetas
Augmented Dickey-Fuller Test
data: Datos_train
Dickey-Fuller = -2.1413, Lag order = 12, p-value = 0.5178
alternative hypothesis: stationary
- Hipótesis nula (\(H_0\)): La serie no es estacionaria.
- Hipótesis alternativa (\(H_1\)): La serie es estacionaria.
El valor p es mayor a 0.05 por lo cual no se rechaza la hipotsis nula lo que indica que la serie es no estacionaria.
Augmented Dickey-Fuller Test
data: serie_DE
Dickey-Fuller = -1.8691, Lag order = 12, p-value = 0.6279
alternative hypothesis: stationary
- Hipótesis nula (\(H_0\)): La serie no es estacionaria.
- Hipótesis alternativa (\(H_1\)): La serie es estacionaria.
El valor p es mayor a 0.05 por lo cual no se rechaza la hipotsis nula lo que indica que la serie es no estacionaria.
Augmented Dickey-Fuller Test
data: serie_dif
Dickey-Fuller = -4.954, Lag order = 3, p-value = 0.01
alternative hypothesis: stationary
- Hipótesis nula (\(H_0\)): La serie no es estacionaria.
- Hipótesis alternativa (\(H_1\)): La serie es estacionaria.
Como el valor p es de 0.01 se rechaza \(H_0\)
Sarima es un acrónimo que significa Modelo Autorregresivo Integrado de Medias Móviles con Estacionalidad, este modelo es muy utilizado para analizar y predecir series temporales que presentan patrones estacionales.
Componentes adicionales del modelo :
Estacional(S): Captura patrones que se repiten en intervalos fijos
El modelo SARIMA se representa como SARIMA(p,d,q)(P,D,Q)m, donde:
Modelo | AICc | |
---|---|---|
7 | SARIMA (5,1,1)(0,1,0)[12] | 1398.463 |
1 | SARIMA (1,1,1)(0,1,0)[12] | 1399.403 |
4 | SARIMA (2,1,1)(0,1,0)[12] | 1399.723 |
3 | SARIMA (1,1,7)(0,1,0)[12] | 1399.924 |
2 | SARIMA (1,1,6)(0,1,0)[12] | 1401.916 |
6 | SARIMA (2,1,7)(0,1,0)[12] | 1402.677 |
5 | SARIMA (2,1,6)(0,1,0)[12] | 1403.482 |
8 | SARIMA (5,1,6)(0,1,0)[12] | 1408.764 |
9 | SARIMA (5,1,7)(0,1,0)[12] | 1408.932 |
10 | AUTO SARIMA (0,0,1) | 1929.432 |
Ljung-Box test
data: Residuals from ARIMA(5,1,1)(0,1,0)[12]
Q* = 2.4067, df = 4, p-value = 0.6614
Model df: 6. Total lags used: 10
Metric | Value |
---|---|
ME | -1988.1651933 |
RMSE | 17958.6816714 |
MAE | 10538.6207423 |
MPE | -12.5651850 |
MAPE | 16.9457175 |
MASE | 0.0519666 |
ACF1 | -0.0193518 |
MAPE: Mide el error promedio porcentual en las predicciones
MASE: Mide la magnitud del error en comparación con la magnitud del error de un pronóstico ingenuo.
Fecha | Pronostico | Lo_95 | Hi_95 | Real |
---|---|---|---|---|
2020-03-01 | 458845.45 | 418017.547 | 499673.35 | 254125 |
2020-04-01 | 145040.64 | 104201.260 | 185880.02 | 4221 |
2020-05-01 | 162765.66 | 121650.805 | 203880.51 | 20459 |
2020-06-01 | 215248.02 | 173063.580 | 257432.47 | 143383 |
2020-07-01 | 143712.89 | 101320.408 | 186105.37 | 172857 |
2020-08-01 | 51638.18 | 9120.645 | 94155.72 | 86478 |
2020-09-01 | 333568.45 | 285764.680 | 381372.22 | 326936 |
2020-10-01 | 127642.43 | 79644.684 | 175640.19 | 139261 |
2020-11-01 | 136063.46 | 87634.938 | 184491.99 | 113558 |
2020-12-01 | 137528.54 | 87934.110 | 187122.97 | 133107 |
visualizando los datos obtenidos del pronóstico del modelo comparado con la serie original, denotamos que hay una predicción bastante similar a los valores reales de la serie, con ello podemos inferir que el modelo y la selección de P;D;Q estacional y no estacional fueron bien seleccionadas. No obstante, debido al fenómeno “la pandemia” ocurrido en el periodo seleccionado para realizar la predicción, se genera un desfase levemente significativo que se pudo haber evitado seleccionando otro periodo más estable para realizar la predicción.