
Modelo univariante
Vamos a utilizar la variable histórica PED_TOT
(original)- dataset (código) de la suma de los 10
grupos al finalizar los 21 días de las 18 campañas del 2019 y 2020, con
el objetivo de pronosticar dicha variable para las primeras 4 campañas
del año 2021.
1. Analisis de la series de tiempo
Inicialmente al ser una serie de tiempo se evaluó 3 características
(Tendencia, estacionalidad y autocorrelación) para darnos un
acercamiento al posible modelo de pronóstico que se podría llegar
adecuar a los datos.
Nota: Independiente de los resultados se van a utilizar todos
los modelos conocidos para el pronostico de una serie de tiempo
univariante para realizar un comparativo de los indicadores de calidad
de las predicciones del modelo y de la calidad del ajuste del modelo a
los datos.

Figura 1. Se observa que existe una significativa
tendencia en los datos con pendiente negativa.”
Figura 2. Se observa una estacionalidad en alguas
campañas del año”
Figura 3. Se puede llegar a inferir una
autocorrelacion en la serie de datos que podria indicar un modelo
(AR2)”
Nota: Como se logro ver una clara tendencia y posible
estacionalidad y autocorrelación de la serie de tiempo los modelos que
tiene mayor probabilidad de que se ajusten al comportamiento de la
variable será un Modelo ARIMA de orden 2, suavización exponencial y de
regresión.
2. MODELO DE LA SERIE DE TIEMPO UNIVARIANTE

De las gráficas anteriormente expuestas podemos visualmente
identificar que el método que tiene mayor calidad de ajuste es
“Regresión Si observamos tendencia y estacionalidad”. Esto podemos
confirmarlo con las medidas de calidad del ajuste del modelo y su
calidad para predecir el futuro:
Nota: Redondeando los valores a 10 cifras decimales.
Modelo multivariante
Debido a que los datos dependen de cuanto se vende por cada uno de
los grupos, los modelos multivariable se deberían de ajustar con mejores
indicadores a esta serie.
Método de regresión lineal multivariable
Para este método la variable respuesta van a ser los PED_TOT21, y
por el análisis en la serie univariante sabemos que tiene tendencia y
estacionalidad el resultante de la variable respuesta. Esto quiere decir
que vamos a tomar como una variable de interes el numero de la
campaña.
Cuando se realiza el modelo podemos identificar cuales son las
variables que son significativas o estas haciendo ruido para el
pronóstico de las variables. Al realizar el primer modelo y buscar cual
seria uno mas adecuado el sistema nos arroja que las variables que son
relevantes y tienen un impacto significativo en la variable de interés
son:
• CAMPAÑA
• GR1
• GR2
• GR3
• GR6
• GR8
• GR9
• GR10
Por lo tanto se realizo el ajuste del modelo, para ahora si realizar
el pronostico
## Start: AIC=474
## PED_TOT21 ~ CAMPANA + GR1 + GR2 + GR3 + GR4 + GR5 + GR6 + GR7 +
## GR8 + GR9 + GR10
##
## Df Sum of Sq RSS AIC
## - GR5 1 6229 3982960 472
## - GR7 1 70315 4047047 473
## - GR4 1 132221 4108952 473
## <none> 3976731 474
## - GR8 1 1048130 5024861 480
## - GR2 1 1121508 5098239 481
## - GR9 1 1571250 5547981 484
## - GR10 1 2762583 6739314 491
## - GR6 1 2868941 6845672 492
## - GR3 1 3764359 7741090 496
## - GR1 1 4682551 8659282 500
## - CAMPANA 17 53753706 57730437 536
##
## Step: AIC=472
## PED_TOT21 ~ CAMPANA + GR1 + GR2 + GR3 + GR4 + GR6 + GR7 + GR8 +
## GR9 + GR10
##
## Df Sum of Sq RSS AIC
## - GR7 1 106532 4089493 471
## - GR4 1 126369 4109330 471
## <none> 3982960 472
## + GR5 1 6229 3976731 474
## - GR2 1 1152731 5135692 479
## - GR8 1 1939347 5922307 484
## - GR6 1 2872773 6855733 490
## - GR9 1 3140437 7123398 491
## - GR10 1 3343355 7326315 492
## - GR1 1 4676339 8659299 498
## - GR3 1 10904980 14887940 518
## - CAMPANA 17 57278835 61261796 536
##
## Step: AIC=471
## PED_TOT21 ~ CAMPANA + GR1 + GR2 + GR3 + GR4 + GR6 + GR8 + GR9 +
## GR10
##
## Df Sum of Sq RSS AIC
## - GR4 1 172186 4261679 471
## <none> 4089493 471
## + GR7 1 106532 3982960 472
## + GR5 1 42446 4047047 473
## - GR8 1 1997717 6087209 483
## - GR2 1 3082747 7172239 489
## - GR10 1 3252351 7341844 490
## - GR6 1 3363769 7453261 491
## - GR9 1 4506086 8595578 496
## - GR1 1 5685531 9775023 500
## - GR3 1 13501040 17590532 522
## - CAMPANA 17 67559154 71648647 540
##
## Step: AIC=471
## PED_TOT21 ~ CAMPANA + GR1 + GR2 + GR3 + GR6 + GR8 + GR9 + GR10
##
## Df Sum of Sq RSS AIC
## <none> 4261679 471
## + GR4 1 172186 4089493 471
## + GR7 1 152349 4109330 471
## + GR5 1 15715 4245964 472
## - GR8 1 2378125 6639804 485
## - GR2 1 2946092 7207771 487
## - GR10 1 3085759 7347438 488
## - GR6 1 3382861 7644540 490
## - GR9 1 5336152 9597831 498
## - GR1 1 5620005 9881684 499
## - GR3 1 13368013 17629692 520
## - CAMPANA 17 79735036 83996715 544
Los indicadores de la calidad del ajuste de este modelo vendrian
siendo:
## ME RMSE MAE MPE MAPE MASE
## Training set -8e-13 344 274 -0.004 0.5 0.06
De estos indicadores de la calidad del ajuste podemos observar que
son considerablemente menores a los determinados en los métodos
univariante, lo que nos indica que el método de “Regresión lineal
múltiple” es mejor método de pronostico para esta serie obteniendo los
resultados siguientes
Prediccion_202101
## fit lwr upr
## 1 39786 37322 42250
Prediccion_202102
## fit lwr upr
## 1 43804 40657 46952
Prediccion_202103
## fit lwr upr
## 1 48874 46297 51452
Prediccion_202104
## fit lwr upr
## 1 51318 49113 53522
Nota: Se podria llegar a realizar un metodo VAR al igual que un
ARIMAX, para ver si tienen mejores indicadores que este
modelo.