Modelo univariante

Vamos a utilizar la variable histórica PED_TOT (original)- dataset (código) de la suma de los 10 grupos al finalizar los 21 días de las 18 campañas del 2019 y 2020, con el objetivo de pronosticar dicha variable para las primeras 4 campañas del año 2021.

1. Analisis de la series de tiempo

Inicialmente al ser una serie de tiempo se evaluó 3 características (Tendencia, estacionalidad y autocorrelación) para darnos un acercamiento al posible modelo de pronóstico que se podría llegar adecuar a los datos.

Nota: Independiente de los resultados se van a utilizar todos los modelos conocidos para el pronostico de una serie de tiempo univariante para realizar un comparativo de los indicadores de calidad de las predicciones del modelo y de la calidad del ajuste del modelo a los datos.

Figura 1. Se observa que existe una significativa tendencia en los datos con pendiente negativa.”
Figura 2. Se observa una estacionalidad en alguas campañas del año”
Figura 3. Se puede llegar a inferir una autocorrelacion en la serie de datos que podria indicar un modelo (AR2)”
Nota: Como se logro ver una clara tendencia y posible estacionalidad y autocorrelación de la serie de tiempo los modelos que tiene mayor probabilidad de que se ajusten al comportamiento de la variable será un Modelo ARIMA de orden 2, suavización exponencial y de regresión.

2. MODELO DE LA SERIE DE TIEMPO UNIVARIANTE


De las gráficas anteriormente expuestas podemos visualmente identificar que el método que tiene mayor calidad de ajuste es “Regresión Si observamos tendencia y estacionalidad”. Esto podemos confirmarlo con las medidas de calidad del ajuste del modelo y su calidad para predecir el futuro:

Nota: Redondeando los valores a 10 cifras decimales.

Realizando el análisis de los indicadores de la calidad del ajuste del modelo de los datos (ME,RMSE,MAE,MPE,MAPE,MASE,ACF1) podemos ratificamos que el modelo “Regresión Si observamos tendencia y estacionalidad” es favorecedor para el pronóstico de los datos de la presente serie. De igual forma si realizamos un análisis del ACF1 (Indicador de una mayor capacidad para predecir futuros) en el cuarto lugar tenemos al modelo presentado, desfavoreciendo los puestos anteriores a ellos debido a sus desfavorecedores indicadores de la calidad del ajuste.

## $mean
## Time Series:
## Start = c(2021, 1) 
## End = c(2021, 4) 
## Frequency = 18 
##     1     2     3     4 
## 43456 48210 48626 53659

Modelo multivariante

Debido a que los datos dependen de cuanto se vende por cada uno de los grupos, los modelos multivariable se deberían de ajustar con mejores indicadores a esta serie.

Método de regresión lineal multivariable

Para este método la variable respuesta van a ser los PED_TOT21, y por el análisis en la serie univariante sabemos que tiene tendencia y estacionalidad el resultante de la variable respuesta. Esto quiere decir que vamos a tomar como una variable de interes el numero de la campaña.

Cuando se realiza el modelo podemos identificar cuales son las variables que son significativas o estas haciendo ruido para el pronóstico de las variables. Al realizar el primer modelo y buscar cual seria uno mas adecuado el sistema nos arroja que las variables que son relevantes y tienen un impacto significativo en la variable de interés son:

• CAMPAÑA

• GR1

• GR2

• GR3

• GR6

• GR8

• GR9

• GR10

Por lo tanto se realizo el ajuste del modelo, para ahora si realizar el pronostico

## Start:  AIC=474
## PED_TOT21 ~ CAMPANA + GR1 + GR2 + GR3 + GR4 + GR5 + GR6 + GR7 + 
##     GR8 + GR9 + GR10
## 
##           Df Sum of Sq      RSS AIC
## - GR5      1      6229  3982960 472
## - GR7      1     70315  4047047 473
## - GR4      1    132221  4108952 473
## <none>                  3976731 474
## - GR8      1   1048130  5024861 480
## - GR2      1   1121508  5098239 481
## - GR9      1   1571250  5547981 484
## - GR10     1   2762583  6739314 491
## - GR6      1   2868941  6845672 492
## - GR3      1   3764359  7741090 496
## - GR1      1   4682551  8659282 500
## - CAMPANA 17  53753706 57730437 536
## 
## Step:  AIC=472
## PED_TOT21 ~ CAMPANA + GR1 + GR2 + GR3 + GR4 + GR6 + GR7 + GR8 + 
##     GR9 + GR10
## 
##           Df Sum of Sq      RSS AIC
## - GR7      1    106532  4089493 471
## - GR4      1    126369  4109330 471
## <none>                  3982960 472
## + GR5      1      6229  3976731 474
## - GR2      1   1152731  5135692 479
## - GR8      1   1939347  5922307 484
## - GR6      1   2872773  6855733 490
## - GR9      1   3140437  7123398 491
## - GR10     1   3343355  7326315 492
## - GR1      1   4676339  8659299 498
## - GR3      1  10904980 14887940 518
## - CAMPANA 17  57278835 61261796 536
## 
## Step:  AIC=471
## PED_TOT21 ~ CAMPANA + GR1 + GR2 + GR3 + GR4 + GR6 + GR8 + GR9 + 
##     GR10
## 
##           Df Sum of Sq      RSS AIC
## - GR4      1    172186  4261679 471
## <none>                  4089493 471
## + GR7      1    106532  3982960 472
## + GR5      1     42446  4047047 473
## - GR8      1   1997717  6087209 483
## - GR2      1   3082747  7172239 489
## - GR10     1   3252351  7341844 490
## - GR6      1   3363769  7453261 491
## - GR9      1   4506086  8595578 496
## - GR1      1   5685531  9775023 500
## - GR3      1  13501040 17590532 522
## - CAMPANA 17  67559154 71648647 540
## 
## Step:  AIC=471
## PED_TOT21 ~ CAMPANA + GR1 + GR2 + GR3 + GR6 + GR8 + GR9 + GR10
## 
##           Df Sum of Sq      RSS AIC
## <none>                  4261679 471
## + GR4      1    172186  4089493 471
## + GR7      1    152349  4109330 471
## + GR5      1     15715  4245964 472
## - GR8      1   2378125  6639804 485
## - GR2      1   2946092  7207771 487
## - GR10     1   3085759  7347438 488
## - GR6      1   3382861  7644540 490
## - GR9      1   5336152  9597831 498
## - GR1      1   5620005  9881684 499
## - GR3      1  13368013 17629692 520
## - CAMPANA 17  79735036 83996715 544

Los indicadores de la calidad del ajuste de este modelo vendrian siendo:

##                  ME RMSE MAE    MPE MAPE MASE
## Training set -8e-13  344 274 -0.004  0.5 0.06

De estos indicadores de la calidad del ajuste podemos observar que son considerablemente menores a los determinados en los métodos univariante, lo que nos indica que el método de “Regresión lineal múltiple” es mejor método de pronostico para esta serie obteniendo los resultados siguientes

Prediccion_202101

##     fit   lwr   upr
## 1 39786 37322 42250

Prediccion_202102

##     fit   lwr   upr
## 1 43804 40657 46952

Prediccion_202103

##     fit   lwr   upr
## 1 48874 46297 51452

Prediccion_202104

##     fit   lwr   upr
## 1 51318 49113 53522
Nota: Se podria llegar a realizar un metodo VAR al igual que un ARIMAX, para ver si tienen mejores indicadores que este modelo.