Introdução

Trata-se de um desafio de previsão de Demanda de itens de loja, onde o objetivo é prever tres meses de vendas desses itens em diferentes lojas. Os dados apresentam 913.000 observações de 4 variáveis. Sabe-se que quando se trabalha com vendas a sazonalidade pode interferir positivamente ou não. Qual é a melhor maneira de lidar com a sazonalidade? As lojas devem ser modeladas separadamente ou voce pode agrupá-las?

Análise Exploratória

Impressão dos Dados

##       date                store           item          sales       
##  Min.   :2013-01-01   Min.   : 1.0   Min.   : 1.0   Min.   :  0.00  
##  1st Qu.:2014-04-02   1st Qu.: 3.0   1st Qu.:13.0   1st Qu.: 30.00  
##  Median :2015-07-02   Median : 5.5   Median :25.5   Median : 47.00  
##  Mean   :2015-07-02   Mean   : 5.5   Mean   :25.5   Mean   : 52.25  
##  3rd Qu.:2016-10-01   3rd Qu.: 8.0   3rd Qu.:38.0   3rd Qu.: 70.00  
##  Max.   :2017-12-31   Max.   :10.0   Max.   :50.0   Max.   :231.00

Observa-se que neste estudo levou-se em consideração as vendas iniciadas em 2013 até 2018, 5 anos. É possível verificar também que 50 itens distintos foram comercializados por dez lojas diferentes e que em um determinado dia conseguiram vender 231 itens.

Histograma de Frequencia das Vendas

Boxplot Vendas x Itens

Nota-se que o item mais vendido é o 15. O segundo que obteve melhor venda foi o item 22.

Boxplot da Variavel Venda

Boxplot da variavel venda, apenas confirma o que foi dito acima referente a mesma.

Criando uma Série Temporal

## Warning: package 'bindrcpp' was built under R version 3.4.4

Modelo Autoarima

## Series: sales.ts.s1i1 
## ARIMA(5,1,2) 
## 
## Coefficients:
##          ar1      ar2      ar3      ar4      ar5      ma1     ma2
##       0.0489  -0.1937  -0.1789  -0.1682  -0.1409  -0.9194  0.1306
## s.e.  0.0895   0.0394   0.0355   0.0336   0.0365   0.0873  0.0798
## 
## sigma^2 estimated as 26.72:  log likelihood=-4501.08
## AIC=9018.16   AICc=9018.26   BIC=9060.51
## 
## Training set error measures:
##                      ME     RMSE      MAE       MPE     MAPE      MASE
## Training set 0.02087789 5.154899 4.040738 -8.124554 24.56263 0.7011124
##                      ACF1
## Training set -0.005029703

#Decomposição 

fit <- stl(sales.ts.s1i1, t.window=13, s.window="periodic",
           robust=TRUE)
autoplot(fit)

f90dias <- forecast(fit, h = 90) 

f90dias %>% autoplot

f90dias$mean
## Time Series:
## Start = c(2017, 13) 
## End = c(2017, 102) 
## Frequency = 365 
##  [1] 12.32812 17.76383 13.66740 13.57305 18.12926 13.51517 16.85472
##  [8] 14.00165 11.62229 12.67686 18.28957 19.45285 20.06128 16.70083
## [15] 14.02260 14.56794 12.68501 13.66715 18.20869 16.36593 19.00829
## [22] 15.52636 11.74377 17.87708 15.69706 16.86576 16.14061 16.76573
## [29] 15.18952 17.08326 14.66852 17.76647 18.14900 19.73805 15.19853
## [36] 17.66988 15.38018 15.63997 14.98160 19.20381 18.17360 15.34078
## [43] 10.70672 13.63446 15.50397 15.35570 16.15129 18.97544 17.41966
## [50] 17.26534 18.66736 16.79105 19.74184 19.91163 16.94340 17.46124
## [57] 18.14664 19.14654 23.26821 19.88424 16.97795 19.71273 14.02273
## [64] 21.81151 17.88896 22.35148 22.42189 23.27228 23.50544 21.76756
## [71] 20.79509 16.66933 18.70191 18.60295 16.49603 20.75291 20.92792
## [78] 19.01896 20.77892 19.18472 25.30113 24.27266 21.74474 24.35133
## [85] 22.14734 20.43958 21.46803 23.00601 21.41107 21.33647

## # A tibble: 1 x 1
##     EMQ
##   <dbl>
## 1  35.9

TRABALHO EM ANDAMENTO…