Está representada por la serie cronológica o histórica del conjunto de datos numéricos que expresan las ventas en períodos regulares y específicos a través del tiempo para conocer su evolución, tendecia y estacionalidad, la siguiente gráfica presenta periodicidad mensual de las ventas.
La observación del función de Autocorrelación ACF
permite conocer si estamos frente a una serie estacionario o
no, si los resultados se encuentran dentro de los límites de
significacia (espacio entre las líneas punteadas) estamos frente a
estacionalidad, en caso contrario se trata de una serie no
estacionaria.
Es de gran importancia realizar pruebas formales para comprobar si
estamos frente a una serie estacional o no, y la prueba de Dickey-Fuller
aumentada para la hipótesis nula de una raíz unitaria de una serie de
tiempo. Básicamente el resultado del p-value si es
< .05 es una serie que no tiene raices unitarias, es
decir que es Estacionaria, de lo contrario si
p-value es >.05 es una serie de raices
unitarias, es decir, una serie No estacionaria.
##
## Augmented Dickey-Fuller Test
##
## data: ts_ventas
## Dickey-Fuller = -2.1508, Lag order = 2, p-value = 0.5149
## alternative hypothesis: stationary
En el análisis de Series temporales, la metodología de Box-Jenkins, nombrada así en honor a los estadísticos George E. P. Box y Gwilym Jenkins, se aplica a los modelos autorregresivos de media móvil (ARMA) o a los modelos autorregresivos integrados de media móvil (ARIMA) para encontrar el mejor ajuste de una serie temporal de valores, a fin de que los pronósticos sean más acertados.
La función auto.arima de la librería
forecast de R, proporciona una opción rápida
para construir pronósticos con series temporales, debido a que evalúa
entre todos los posibles modelos, al mejor modelo considerando diversos
criterios: estacionariedad, estacionalidad,
diferencias, entre otras.
En estadística y econometría, en particular en series temporales, un modelo autorregresivo integrado de promedio móvil o ARIMA (acrónimo del inglés autoregressive integrated moving average) es un modelo estadístico que utiliza variaciones y regresiones de datos estadísticos con el fin de encontrar patrones para una predicción hacia el futuro. Se trata de un modelo dinámico de series temporales, es decir, las estimaciones futuras vienen explicadas por los datos del pasado y no por variables independientes. Fuente wikipedia
## Series: ts_ventas
## ARIMA(0,1,0)(0,1,0)[12]
##
## sigma^2 = 23123586140: log likelihood = -146.86
## AIC=295.72 AICc=296.17 BIC=296.12
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE ACF1
## Training set -23953.06 102948.1 46619.43 -80.26662 92.33588 0.540044 -0.1544856
Al llevar a cabo el modelo de pronóstico ARIMA siempre es necesario analizar el comportamiento de los residuos, en este caso nos interesa analizar si estos residuos se comportan como ruido blanco.
##
## Box-Ljung test
##
## data: residuals(modelo_ventas)
## X-squared = 0.64749, df = 1, p-value = 0.421
##
## Ljung-Box test
##
## data: Residuals from ARIMA(0,1,0)(0,1,0)[12]
## Q* = 2.2899, df = 5, p-value = 0.8077
##
## Model df: 0. Total lags used: 5
La prueba de normalidad de Shapiro-Wilk otorga brinda la distribución de los residuales, y lo que se espera que tengan promedio alrededor de “0”.
##
## Shapiro-Wilk normality test
##
## data: modelo_ventas$residuals
## W = 0.62941, p-value = 0.000001338
forecast##
## Forecast method: ARIMA(0,1,0)(0,1,0)[12]
##
## Model Information:
## Series: ts_ventas
## ARIMA(0,1,0)(0,1,0)[12]
##
## sigma^2 = 23123586140: log likelihood = -146.86
## AIC=295.72 AICc=296.17 BIC=296.12
##
## Error measures:
## ME RMSE MAE MPE MAPE MASE ACF1
## Training set -23953.06 102948.1 46619.43 -80.26662 92.33588 0.540044 -0.1544856
##
## Forecasts:
## Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
## Dec 2011 -232390 -427268.4 -37511.61 -530430.8 65650.78
## Jan 2012 -277825 -553424.7 -2225.34 -699318.3 143668.31
## Feb 2012 -233731 -571270.3 103808.27 -749952.8 282490.77
## Mar 2012 -276065 -665821.8 113691.78 -872146.6 320016.55
## Apr 2012 -214272 -650033.3 221489.32 -880711.4 452167.43
## May 2012 -204474 -681826.6 272878.61 -934521.8 525573.82
Los pronósticos se basan en patrones de los datos existentes en la serie analizada, tomando en cuenta la autocorrelación (dependencia) entre los datos, tendencia, estacionalidad y cambios estructurales.
| Point Forecast | Lo 80 | Hi 80 | Lo 95 | Hi 95 | |
|---|---|---|---|---|---|
| Dec 2011 | -232390 | -427268.4 | -37511.61 | -530430.8 | 65650.78 |
| Jan 2012 | -277825 | -553424.7 | -2225.34 | -699318.3 | 143668.31 |
| Feb 2012 | -233731 | -571270.3 | 103808.27 | -749952.8 | 282490.77 |
| Mar 2012 | -276065 | -665821.8 | 113691.78 | -872146.6 | 320016.55 |
| Apr 2012 | -214272 | -650033.3 | 221489.32 | -880711.4 | 452167.43 |
| May 2012 | -204474 | -681826.6 | 272878.61 | -934521.8 | 525573.82 |
Para el pronóstico de los próximos 6 meses, de las ventas, se aplicaron técnicas de análisis de series temporales evaluando su estacionalidad y finalmente se realizó en forecast, que muestra los resultados con 80% y 95% de intérvalo de confianza.