Serie de tiempo de las Ventas

Está representada por la serie cronológica o histórica del conjunto de datos numéricos que expresan las ventas en períodos regulares y específicos a través del tiempo para conocer su evolución, tendecia y estacionalidad, la siguiente gráfica presenta periodicidad mensual de las ventas.

Evaluación de la estacionalidad de la serie

La observación del función de Autocorrelación ACF permite conocer si estamos frente a una serie estacionario o no, si los resultados se encuentran dentro de los límites de significacia (espacio entre las líneas punteadas) estamos frente a estacionalidad, en caso contrario se trata de una serie no estacionaria.

Prueba de Dickey-Fuller

Es de gran importancia realizar pruebas formales para comprobar si estamos frente a una serie estacional o no, y la prueba de Dickey-Fuller aumentada para la hipótesis nula de una raíz unitaria de una serie de tiempo. Básicamente el resultado del p-value si es < .05 es una serie que no tiene raices unitarias, es decir que es Estacionaria, de lo contrario si p-value es >.05 es una serie de raices unitarias, es decir, una serie No estacionaria.

## 
##  Augmented Dickey-Fuller Test
## 
## data:  ts_ventas
## Dickey-Fuller = -2.1508, Lag order = 2, p-value = 0.5149
## alternative hypothesis: stationary

Exploración gráfica formal de la serie

Crear el modelo ARIMA

En el análisis de Series temporales, la metodología de Box-Jenkins, nombrada así en honor a los estadísticos George E. P. Box y Gwilym Jenkins, se aplica a los modelos autorregresivos de media móvil (ARMA) o a los modelos autorregresivos integrados de media móvil (ARIMA) para encontrar el mejor ajuste de una serie temporal de valores, a fin de que los pronósticos sean más acertados.

La función auto.arima de la librería forecast de R, proporciona una opción rápida para construir pronósticos con series temporales, debido a que evalúa entre todos los posibles modelos, al mejor modelo considerando diversos criterios: estacionariedad, estacionalidad, diferencias, entre otras.

Resumen del modelo

En estadística y econometría, en particular en series temporales, un modelo autorregresivo integrado de promedio móvil o ARIMA (acrónimo del inglés autoregressive integrated moving average) es un modelo estadístico que utiliza variaciones y regresiones de datos estadísticos con el fin de encontrar patrones para una predicción hacia el futuro. Se trata de un modelo dinámico de series temporales, es decir, las estimaciones futuras vienen explicadas por los datos del pasado y no por variables independientes. Fuente wikipedia

## Series: ts_ventas 
## ARIMA(0,1,0)(0,1,0)[12] 
## 
## sigma^2 = 23123586140:  log likelihood = -146.86
## AIC=295.72   AICc=296.17   BIC=296.12
## 
## Training set error measures:
##                     ME     RMSE      MAE       MPE     MAPE     MASE       ACF1
## Training set -23953.06 102948.1 46619.43 -80.26662 92.33588 0.540044 -0.1544856

Revisión de los Residuales para evaluar la calidad del modelo

Al llevar a cabo el modelo de pronóstico ARIMA siempre es necesario analizar el comportamiento de los residuos, en este caso nos interesa analizar si estos residuos se comportan como ruido blanco.

Aplicamos la prueba Box-Pierce o Ljung-Box para examinar la hipótesis nula de independencia en una serie de tiempo.

## 
##  Box-Ljung test
## 
## data:  residuals(modelo_ventas)
## X-squared = 0.64749, df = 1, p-value = 0.421

Observamos la normalidad de los residuales

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(0,1,0)(0,1,0)[12]
## Q* = 2.2899, df = 5, p-value = 0.8077
## 
## Model df: 0.   Total lags used: 5

Prueba de normalidad de los residuales

La prueba de normalidad de Shapiro-Wilk otorga brinda la distribución de los residuales, y lo que se espera que tengan promedio alrededor de “0”.

## 
##  Shapiro-Wilk normality test
## 
## data:  modelo_ventas$residuals
## W = 0.62941, p-value = 0.000001338

Cálculo del pronóstico con la función forecast

Resumen del pronóstico

## 
## Forecast method: ARIMA(0,1,0)(0,1,0)[12]
## 
## Model Information:
## Series: ts_ventas 
## ARIMA(0,1,0)(0,1,0)[12] 
## 
## sigma^2 = 23123586140:  log likelihood = -146.86
## AIC=295.72   AICc=296.17   BIC=296.12
## 
## Error measures:
##                     ME     RMSE      MAE       MPE     MAPE     MASE       ACF1
## Training set -23953.06 102948.1 46619.43 -80.26662 92.33588 0.540044 -0.1544856
## 
## Forecasts:
##          Point Forecast     Lo 80     Hi 80     Lo 95     Hi 95
## Dec 2011        -232390 -427268.4 -37511.61 -530430.8  65650.78
## Jan 2012        -277825 -553424.7  -2225.34 -699318.3 143668.31
## Feb 2012        -233731 -571270.3 103808.27 -749952.8 282490.77
## Mar 2012        -276065 -665821.8 113691.78 -872146.6 320016.55
## Apr 2012        -214272 -650033.3 221489.32 -880711.4 452167.43
## May 2012        -204474 -681826.6 272878.61 -934521.8 525573.82

Tabla del pronóstico

Los pronósticos se basan en patrones de los datos existentes en la serie analizada, tomando en cuenta la autocorrelación (dependencia) entre los datos, tendencia, estacionalidad y cambios estructurales.

Pronóstico de Ventas
Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
Dec 2011 -232390 -427268.4 -37511.61 -530430.8 65650.78
Jan 2012 -277825 -553424.7 -2225.34 -699318.3 143668.31
Feb 2012 -233731 -571270.3 103808.27 -749952.8 282490.77
Mar 2012 -276065 -665821.8 113691.78 -872146.6 320016.55
Apr 2012 -214272 -650033.3 221489.32 -880711.4 452167.43
May 2012 -204474 -681826.6 272878.61 -934521.8 525573.82

Gráfica de la serie histórica con el pronóstico incorporado

Conclusión

Para el pronóstico de los próximos 6 meses, de las ventas, se aplicaron técnicas de análisis de series temporales evaluando su estacionalidad y finalmente se realizó en forecast, que muestra los resultados con 80% y 95% de intérvalo de confianza.