Modelos Predictivos y Análisis de Tendencias

Examen 2 (Grupal): ESTA-4501

La planificación estratégica es clave para el crecimiento sostenible de Café Borinquen, especialmente ante su reciente expansión y las fluctuaciones en ventas observadas entre 2015 y 2025. Con interés en abrir nuevas sucursales en 2026, la empresa requiere pronósticos confiables que permitan optimizar contratación, mercadeo y decisiones de inversión. Este informe analiza la serie histórica de ventas mediante técnicas de series de tiempo, con el fin de identificar patrones, evaluar estacionalidad y generar proyecciones que respalden la toma de decisiones futuras.

1. Exploración visual inicial de la base de datos:

Realice visualizaciones que muestren:

• El comportamiento general de la serie de tiempo.

CafeBorinquen <- Cafe_Borinquen%>%
  mutate(date=as.Date(fecha,format="%m/%d/%Y")) 
str(CafeBorinquen)
## 'data.frame':    132 obs. of  3 variables:
##  $ fecha : chr  "1/1/2015" "2/1/2015" "3/1/2015" "4/1/2015" ...
##  $ ventas: num  236 250 253 242 246 ...
##  $ date  : Date, format: "2015-01-01" "2015-02-01" ...

Formato de serie de tiempo:

attach(CafeBorinquen)
CafeBorinquen.ts<-ts(Cafe_Borinquen,start = c(1/1/2015,236.3),frequency = 12)
summary(CafeBorinquen)
##     fecha               ventas           date           
##  Length:132         Min.   :236.3   Min.   :2015-01-01  
##  Class :character   1st Qu.:283.3   1st Qu.:2017-09-23  
##  Mode  :character   Median :323.1   Median :2020-06-16  
##                     Mean   :325.7   Mean   :2020-06-16  
##                     3rd Qu.:366.2   3rd Qu.:2023-03-08  
##                     Max.   :420.0   Max.   :2025-12-01

Inicio

start(CafeBorinquen.ts)
## [1] 19.60883

Fin

end(CafeBorinquen.ts)
## [1] 30.5255

Frecuencia

frequency(CafeBorinquen.ts)
## [1] 12

La serie y el análisis de Café Borinquen que estamos generando, contiene 132 observaciones mensuales entre enero de 2015 y diciembre de 2025. Los valores dentro de esta serie representan las ventas mensuales totales (en miles de dólares) de Café Borinquen. Los valores se encuentran entre $236.3 mil y $420 mil, mostrando un aumento claro en los niveles de venta a lo largo del tiempo. Tanto la media ($325.7 mil) como la mediana ($323.1 mil) indican que la mayor parte del periodo las ventas se mantienen en ese rango central, mientras que los cuartiles reflejan un desplazamiento gradual hacia valores más altos en los años más recientes. En conjunto, el resumen estadístico sugiere una trayectoria de crecimiento sostenido en las ventas durante el periodo analizado.

Comportamiento:

plot_ly(CafeBorinquen, x = ~date, y = ~ventas, type = "scatter", mode = "lines") %>%layout(xaxis = list(title = "Fecha"),yaxis = list(title = "Ventas (%)"),hovermode = "x unified")

En la gráfica de esta serie, podemos observar una tendencia creciente en las ventas mensuales de Café Borinquen a lo largo del tiempo, al igual que podemos observar estacionalidad donde en cada época de verano, las ventas de ellos incrementan de una manera uniforme/repetitiva. De esto podemos concluir que el “high season” de Café Borinquen es la época de verano. Las ventas muestran un patrón de fluctuaciones periódicas, con ciclos constantes de alto y bajo consumo a lo largo del año. Por último, cabe mencionar que a finales de la serie hubo una caída significativa que distorsionó el patrón de crecimiento constante; sin embargo, en 2025 se puede observar una recuperación lenta en las ventas.

• Su descomposición en tendencia, estacionalidad y residuales.

CafeBorinquen.ts2 <- ts(Cafe_Borinquen$ventas,
                       start = c(2015, 1),
                       frequency = 12)
descomp <- decompose(CafeBorinquen.ts2, type = "additive")
plot(descomp)

En esta sección, vamos a analizar los componentes fundamentales que nos ayudan a entender y modelar el comportamiento de las ventas de Café Borinquen:

1. Tendencia: La serie muestra un crecimiento sostenido de la demanda/ventas a lo largo del período 2015–2025. Este crecimiento es casi lineal y puede asociarse con la expansión que ha experimentado Café Borinquen en comparación con sus inicios en 2015.

2. Estacionalidad: Se observa un patrón anual con picos constantes en la demanda y caídas cada año. La serie muestra las fluctuaciones específicas de las épocas de verano, donde las ventas fueron más altas.

3. Componente Aleatorio: Los residuales siguen un patrón irregular e indefinido, representando las fluctuaciones aleatorias o ruido blanco que afecta la demanda inesperadamente.Sin embargo, demuestra una fluctuación de alta magnitud al final de 2025.

• La estacionalidad y la autocorrelación (AFC y PACF).

monthplot(CafeBorinquen.ts2, main ="Patrón Estacional Mensual",
         ylab = "Ventas Mensuales (En miles de dólares)",
        xlab = "Mes")

La estacionalidad de esta serie muestra un patrón estable, exponiendo precisamente que los picos más altos se encuentran entre los meses de mayo y agosto, mientras que los más bajos se encuentran entre enero y abril, al igual que septiembre a diciembre. Esto evidencia aún más que las ventas de Café Borinquen son afectadas por el “season”. Estas fluctuaciones siguen una media relativamente constante y, aunque presenta variación en la demanda, esta se repite de manera consistente anualmente, indicando que es una serie con estacionalidad.

acf(CafeBorinquen.ts2, lag.max = 36)

La autocorrelación de la serie inicia con un valor muy alto y va disminuyendo de manera gradual a medida que aumentan los rezagos. Este patrón indica que las ventas mensuales actuales están más relacionadas con las ventas recientes que con las más lejanas en el tiempo.

2. Selección y ajuste del modelo:

Considerando los modelos estudiados (AR, MA, ARMA y ARIMA):

• Realice la prueba de estacionariedad.

adf.test(CafeBorinquen.ts2)
## 
##  Augmented Dickey-Fuller Test
## 
## data:  CafeBorinquen.ts2
## Dickey-Fuller = -8.3348, Lag order = 5, p-value = 0.01
## alternative hypothesis: stationary

Ya que la prueba de estacionariedad nos dió un p-value de 0.01, se rechaza la hipótesis nula, lo cual significa que tenemos un modelo estacionario.

• Ajuste los modelos posibles y compare el AIC para seleccionar el modelo final.

x.ar   <- arima(CafeBorinquen.ts2, order = c(1, 0, 0))
x.ma   <- arima(CafeBorinquen.ts2, order = c(0, 0, 1))
x.arma <- arima(CafeBorinquen.ts2, order = c(1, 0, 1))
library(forecast)
mod_arima <- auto.arima(CafeBorinquen.ts2,stepwise = T, approximation = T)
mod_arima
## Series: CafeBorinquen.ts2 
## ARIMA(2,0,1)(1,1,1)[12] with drift 
## 
## Coefficients:
##          ar1     ar2     ma1     sar1     sma1   drift
##       0.4391  0.0897  0.2442  -0.2147  -0.4845  1.2623
## s.e.  0.9784  0.6371  0.9650   0.3413   0.3240  0.0512
## 
## sigma^2 = 28.71:  log likelihood = -371.96
## AIC=757.93   AICc=758.93   BIC=777.44
AIC(x.ma,x.ar,x.arma, mod_arima)
##           df       AIC
## x.ma       3 1262.1731
## x.ar       3 1023.5257
## x.arma     4 1016.2179
## mod_arima  7  757.9274

Según los ajustes de modelo, los resultados del criterio AIC indican que el mejor modelo para la serie de Café Borinquen es el ARIMA(2,0,1)(1,1,1) , con un valor de AIC = 757.93, el cual fue menor comparado con los modelos AR, MA, ARM, indicando ser el más adecuado para la tendencia y estacionalidad observada en los datos

3. Pronósticos:

Usando el modelo final ajustado:

• Realice el pronóstico para enero–diciembre 2026 usando el modelo seleccionado. Presente una visualización que incluya la serie histórica, los pronósticos y los intervalos de confianza.

prediccion <- forecast(mod_arima, h=12)
autoplot(prediccion) +
  scale_x_continuous(
    breaks = seq(2015, 2026, 1),
    labels = seq(2015, 2026, 1)
  )
## Scale for x is already present.
## Adding another scale for x, which will replace the existing scale.

El pronóstico muestra que las ventas de 2026 siguen la tendencia creciente observada en años previos, manteniendo el patrón estacional con picos y valles recurrentes que reflejan la fluctuacion mensual de la demanda. Las ventas proyectadas rondan entre $400 mil y $430 mil, y las bandas de confianza se mantienen relativamente estrechas, lo que indica una predicción estable y consistente con el comportamiento histórico. El intervalo de confianza del 95% se amplía gradualmente, indicando mayor incertidumbre en predicciones más lejanas.

Conclusión

El análisis de la serie de tiempo de las ventas mensuales de Café Borinquen entre 2015 y 2025 evidencia un patrón claro compuesto por una tendencia creciente y una estacionalidad marcada, causado especialmente en los meses de verano. Los resultados del modelo seleccionado, un ARIMA(2,0,1)(1,1,1)[12] con drift, confirmaron que este captura adecuadamente tanto la dinámica estacional como el comportamiento general de la serie.

El pronóstico para el 2026 sugiere que las ventas continuarán aumentando, manteniendo el mismo patrón estacional observado históricamente. Las proyecciones se mantienen estables y dentro de bandas de confianza razonablemente estrechas, lo que indica buena capacidad predictiva. En conjunto, estos hallazgos ofrecen una base cuantitativa sólida para la planificación estratégica de Café Borinquen.