Planeación estratégica basada en analítica prescriptiva

Grupo 503

Profesor Rodolfo Miguel Gameros

Equipo 7:

A00833113 - Avril Lobato

A01771127 - Lesly Darian Romero Vázquez

A00831105 - Jazmín del Carmen Cortez Mendoza

A01284611 - Lisset Hernández

Actividad - Series de Tiempo

Análisis Exploratorio

Carga de base de datos

Aplica la metodología Box-Jenkins a la serie de precios ajustados de la empresa Meta (META) del día 01/Enero/2013 al 31/Marzo/2024; además se convierte a serie de tiempo.

getSymbols("META", src = "yahoo", from = "2013-01-01", to = "2025-02-28")
## [1] "META"
df <- data.frame(Date = index(META), coredata(META))
colnames(df) <- c("Date", "Open", "High", "Low", "Close", "Volume", "Adjusted")

df <- df %>% select(Date, Adjusted)

ts_meta <- ts(df$Adjusted, frequency = 252, start = c(2013, 1))
head(ts_meta)
## Time Series:
## Start = c(2013, 1) 
## End = c(2013, 6) 
## Frequency = 252 
## [1] 27.86865 27.63973 28.62509 29.28200 28.92368 30.44651

Revisión de valores nulos

La base de datos está compuesta por dos variables: Date, que representa la fecha de emisión del precio de la acción, y Adjusted, que corresponde al precio ajustado de la acción, siendo esta última nuestra variable de interés.

Tras la revisión, se confirma que no existen valores nulos en la base de datos.

# Nulos Totales
sum(is.na(df))
## [1] 0
# Nulos por Columna
gg_miss_var(df)

Conversión de tipo de datos

Se realiza conversión de variables a los tipos de datos correspondientes para garantizar un adecuado procesamiento y análisis de los datos:

  • Date se transformó en una variable de tipo fecha (Date), permitiendo su correcta manipulación en análisis temporales.

  • Adjusted se convirtió en una variable de tipo numérico (numeric), asegurando que pueda ser utilizada en cálculos estadísticos y modelos de predicción.

df$Adjusted<-as.numeric(df$Adjusted) 
df$Date<-as.Date(df$Date) 

clases2 <- sapply(df, class)
clases2
##      Date  Adjusted 
##    "Date" "numeric"

Distribución de variable “Adjusted”

La mayoría de los datos se encuentran en un rango aproximado de 100 a 300, concentrándose dentro de la caja del diagrama de caja y bigotes.

El precio ajustado de META ha seguido una clara tendencia alcista, con un incremento significativo en los valores recientes. Lo anterior, se evidencia en la presencia de múltiples outliers por encima del bigote superior, lo que indica que los precios de las acciones han sido significativamente más altos que el resto de la distribución en ciertos periodos. Dicho comportamiento podría estar asociado con factores como inversiones en nuevas tecnologías, cambios estratégicos dentro de la empresa o un auge en el sector tecnológico.

En general, los datos reflejan un crecimiento sostenido en los últimos años, acompañado de episodios de valorización abrupta que se apartan de la tendencia típica.

boxplot(df$Adjusted, main = "Price_Adjusted", col = "lightblue")

Estadísticos descriptivos

El análisis muestra una tendencia de crecimiento sostenido en el precio de la acción de META, con valores significativamente más altos en los últimos años. La diferencia entre la mediana y la media sugiere la presencia de valores extremos o outliers, lo que podría estar relacionado con eventos clave en la empresa o en el mercado.

Variable: Date (Fecha) * Rango de fechas: La base de datos abarca desde el 2 de enero de 2013 hasta el 27 de febrero de 2025, proporcionando más de 12 años de información histórica sobre el precio ajustado de las acciones.

  • Mediana (2019-01-29) y media (2019-01-27): Indican que la distribución de datos es bastante equilibrada en términos de tiempo, con un punto central cercano a 2019.

Variable: Adjusted (Precio Ajustado de la Acción) * Primer cuartil (Q1 - 104.42): El 25% de los valores están por debajo de este precio, es decir, en los primeros años o en momentos específicos, el precio de la acción estuvo en un rango relativamente bajo.

  • Mediana (170.31): La mitad de los valores de la serie están por debajo de este precio, lo que sugiere que durante gran parte del período el precio ajustado se mantuvo en un rango moderado.

  • Tercer cuartil (Q3 - 263.61): Indica que el 75% de los valores están por debajo de este umbral, con el 25% restante superando dicho valor.

  • Valor máximo (736.02) y Valor mínimo (22.79): Representa el punto más bajo y alto alcanzado por el precio ajustado, lo que podría indicar un fuerte crecimiento en el valor de la acción en los últimos años.

summary(df)
##       Date               Adjusted     
##  Min.   :2013-01-02   Min.   : 22.79  
##  1st Qu.:2016-01-14   1st Qu.:104.42  
##  Median :2019-01-29   Median :170.31  
##  Mean   :2019-01-27   Mean   :198.88  
##  3rd Qu.:2022-02-08   3rd Qu.:263.61  
##  Max.   :2025-02-27   Max.   :736.02

Estadísticos de dispersión y normalidad

Se muestra la distribución de la variable Adjusted”, que representa el precio ajustado de las acciones de META de 2013 a 2025. Se observa una distribución sesgada a la derecha con una acumulación de valores en el rango de 0 a 300 y una cola larga extendiéndose más allá de los 600. Ante lo cual según el gráfico de normalidad se recomienda realizar una transformación logarítmica para tener una distirbución normal. Sin embargo, enn este caso, no se llevará a cabo alguna transformación ya que, en el contexto del análisis de acciones, los valores ajustados deben interpretarse en su escala original para mantener la relación con los precios reales del mercado. También, modificar la escala afectaría la interpretación y comparación con otros activos financieros o períodos de tiempo.

desviacion <- sd(df$Adjusted, na.rm = TRUE)
print(desviacion)
## [1] 137.3567
plot_histogram(df)

plot_normality(df)

Paso 1: Visualizar

La serie de tiempo del precio ajustado de las acciones de META de 2013 a 2025 muestra una clara tendencia alcista con períodos de volatilidad. A partir del gráfico:

  • Tendencia general: Se observa un crecimiento sostenido en el precio de las acciones de META a lo largo del tiempo. Desde 2013, el precio ha aumentado de manera constante, con aceleraciones notables a partir de 2020 y especialmente después de 2023. Sin embargo, en 2021-2022 hay una disminución temporal, posiblemente por factores externos como caídas del mercado o problemas internos de la empresa.

  • Volatilidad: Hay fluctuaciones significativas en 2021 y 2022, reflejando momentos de incertidumbre en el mercado.

  • Crecimiento acelerado reciente: A partir de 2023, la acción muestra un crecimiento exponencial, lo que podría estar relacionado con factores como innovaciones tecnológicas, incremento de ingresos o confianza del mercado.

En relación a la descomposición de la serie, se observa:

  • Tendencia: Desde 2013, el precio ha aumentado de manera constante, con aceleraciones notables a partir de 2020 y especialmente después de 2023.

  • Estacionalidad: Se aprecian fluctuaciones repetitivas a lo largo del tiempo, lo que indica patrones estacionales en el precio de la acción. Estas oscilaciones pueden deberse a eventos recurrentes como anuncios de ganancias trimestrales, lanzamientos de productos o tendencias macroeconómicas que afectan la valoración de META de manera cíclica.

  • Componente aleatorio: Se observa una mayor volatilidad en ciertos períodos, particularmente alrededor de 2021-2022 y 2023-2024, lo cual podría estar relacionado con eventos inesperados como cambios regulatorios, crisis económicas o movimientos especulativos en el mercado.

Con base en lo anterior, la acción de META ha tenido un crecimiento fuerte, con algunas correcciones en el camino, pero su tendencia a largo plazo es claramente alcista.

plot(ts_meta, main="META de 2013 a 2025", ylab="Adjusted Price", xlab="Fecha")

meta.decomp = decompose(ts_meta, type = "additive")
plot(meta.decomp)

Paso 2: Estacionariza la serie

Se realizó un test de tendencia determinística mediante regresión, en el cual se obtuvo que el coeficiente de la variable tiempo (t) es significativo, lo cual indica que hay una relación lineal fuerte entre el tiempo y los valores de la serie, lo que confirma la presencia de una tendencia determinística. Además, el p-value obtenido (2.2e-16) es menor a 0.05, lo que refuerza la alta significancia del modelo y la existencia de dicha tendencia.

Asimismo, de acuerdo a la prueba de Dickey-Fuller, se obtuvo un p-value de 0.99, es decir mayor a 0.05, por ende, se determina que la serie no es estacionaria. Acorde al resultado de la función ndiffs, se sugiere realizar una diferencia de 1 para que la serie sea estacionaria.

# Identificación de Tendencia Dterminística
t <- 1:length(ts_meta)
modelo_trend <- lm(ts_meta ~ t)
summary(modelo_trend)
## 
## Call:
## lm(formula = ts_meta ~ t)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -233.75  -26.77    6.35   19.83  339.59 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 0.162165   2.733683   0.059    0.953    
## t           0.129922   0.001548  83.930   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 75.57 on 3056 degrees of freedom
## Multiple R-squared:  0.6974, Adjusted R-squared:  0.6973 
## F-statistic:  7044 on 1 and 3056 DF,  p-value: < 2.2e-16
# Diferenciación
ndiffs(ts_meta) # Según ndiffs necesitamos diferenciar 1 vez
## [1] 1
tseries::adf.test(ts_meta) # ES MAYOR A 0.05 = NO ES STATIONARITY
## 
##  Augmented Dickey-Fuller Test
## 
## data:  ts_meta
## Dickey-Fuller = -0.064367, Lag order = 14, p-value = 0.99
## alternative hypothesis: stationary

Se aplica la diferenciación sugerida de d=1, ante lo cual se vuelve a realizar la prueba de Dickey-Fuller, y con base al resultado de pvalue = 0.01 (es menor a 0.05), se determina que la serie ya es estacionaria.

# Diferenciacion
dif_meta <- diff(ts_meta, differences=1)
adf.test(dif_meta) #AL SER MENOR A 0.05 = ES STATIONARITY
## Augmented Dickey-Fuller Test 
## alternative: stationary 
##  
## Type 1: no drift no trend 
##       lag   ADF p.value
##  [1,]   0 -57.1    0.01
##  [2,]   1 -40.3    0.01
##  [3,]   2 -32.1    0.01
##  [4,]   3 -28.1    0.01
##  [5,]   4 -25.4    0.01
##  [6,]   5 -23.4    0.01
##  [7,]   6 -21.1    0.01
##  [8,]   7 -19.8    0.01
##  [9,]   8 -17.7    0.01
## Type 2: with drift no trend 
##       lag   ADF p.value
##  [1,]   0 -57.2    0.01
##  [2,]   1 -40.4    0.01
##  [3,]   2 -32.2    0.01
##  [4,]   3 -28.2    0.01
##  [5,]   4 -25.5    0.01
##  [6,]   5 -23.5    0.01
##  [7,]   6 -21.2    0.01
##  [8,]   7 -20.0    0.01
##  [9,]   8 -17.9    0.01
## Type 3: with drift and trend 
##       lag   ADF p.value
##  [1,]   0 -57.3    0.01
##  [2,]   1 -40.4    0.01
##  [3,]   2 -32.3    0.01
##  [4,]   3 -28.2    0.01
##  [5,]   4 -25.6    0.01
##  [6,]   5 -23.6    0.01
##  [7,]   6 -21.3    0.01
##  [8,]   7 -20.1    0.01
##  [9,]   8 -17.9    0.01
## ---- 
## Note: in fact, p.value = 0.01 means p.value <= 0.01
# Se determina que el valor de d = 1

Paso 3: Identifica los valor \(p\) y \(q\)

Observando las funciones pacf para Autocorrelación Parcial, y acf para Autocorrelación Serial, pacf nos muestra una p= de 9 o 0, y acf nos muestra una q= de 0.

pacf(dif_meta) # p = 9 o 0

acf(dif_meta) #q = 0

Paso 4: Ajusta el Modelo ARIMA

Con base en los resultados de los valores de p, d y q; se generaron tres modelos ARIMA ante los cuales se revisará sus residuales, su valor AIC y su comparativa con el proceso estacionario (ruido blanco).

Modelo 1 - ARIMA(0,1,0)

  • Evaluación de los Residuales en el Tiempo: La evolución de los residuales oscilan en torno a cero, pero presentan valores atípicos y posible heterocedasticidad (varianza no constante). Idealmente, los residuales deben distribuirse de manera uniforme y aleatoria. La presencia de fluctuaciones sugiere que el modelo no captura completamente la estructura de los datos.

  • Función de Autocorrelación de los Residuales: El gráfico de la función de autocorrelación (ACF) indica que existen correlaciones significativas en algunos rezagos, lo que implica que los errores no son puramente aleatorios. Esto sugiere que el modelo podría mejorarse, ya que aún hay patrones predecibles en la serie.

  • Distribución de los Residuales: El histograma muestra que los residuales tienen colas más pesadas que una distribución normal, lo que implica la presencia de eventos extremos más frecuentes de lo esperado. Aunque la normalidad no es un requisito estricto, su ausencia puede afectar la confiabilidad de las predicciones.

  • Prueba de Ljung-Box: El p-valor (5.107e−15) indica que los residuales no son ruido blanco, lo que confirma la presencia de dependencia temporal no capturada.

Por lo tanto, se determina que el modelo ARIMA(0,1,0) es bueno pero presenta áreas de oportunidad en términos de heterocedasticidad ante lo cual se debe considerar transformaciones para mejorar la estabilidad de la serie.

#P=0, D=1, Q=0
arima_meta <- arima(ts_meta, order=c(0,1,0)) #pdq
arima_meta$aic
## [1] 18948.82
bic_meta <- arima_meta$aic + log(length(df)) * (length(arima_meta$coef) - 1)
print(bic_meta)
## [1] 18948.13
checkresiduals(arima_meta)

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(0,1,0)
## Q* = 790.18, df = 504, p-value = 5.107e-15
## 
## Model df: 0.   Total lags used: 504
print("Coeficientes del modelo ARIMA (0,1,0):")
## [1] "Coeficientes del modelo ARIMA (0,1,0):"
print(arima_meta$coef)
## numeric(0)

Modelo 2 - ARIMA(9,1,0)

  • Evaluación de los Residuales en el Tiempo: El gráfico muestra que los residuales siguen centrados en torno a cero, pero persisten valores atípicos y una posible heterocedasticidad. En comparación con el modelo ARIMA(0,1,0), la dispersión de los residuales no parece haber mejorado significativamente, lo que sugiere que el modelo no ha reducido considerablemente los errores.

  • Función de Autocorrelación de los Residuales: Se observa que la autocorrelación sigue presente en varios rezagos. Aunque el modelo ARIMA(9,1,0) incorpora más términos autorregresivos, los residuales aún muestran dependencia temporal, por ende, el modelo no ha eliminado por completo los patrones en los datos.

  • Distribución de los Residuales: Los residuales siguen una distribución con colas más pesadas que la normal, similar al modelo anterior. Por lo tanto, los errores extremos siguen ocurriendo con mayor frecuencia de lo esperado, lo que puede afectar la estabilidad de las predicciones.

  • Prueba de Ljung-Box: El p-value de la prueba de Ljung-Box (7.105e−15) sigue siendo extremadamente bajo, confirmando que los residuales no son ruido blanco y que hay dependencia no capturada.

El modelo ARIMA(9,1,0) no ha mejorado significativamente el ajuste en comparación con ARIMA(0,1,0). Por lo tanto, el modelo es bueno pero no lo suficiente para mejorar heterocedasticidad y estabilidad de la serie.

#P=9, D=1, Q=0
arima_meta2 <- arima(ts_meta, order=c(9,1,0))
arima_meta2$aic
## [1] 18952.03
bic_meta2 <- arima_meta2$aic + log(length(df)) * (length(arima_meta2$coef) - 1)
print(bic_meta2)
## [1] 18957.58
checkresiduals(arima_meta2)

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(9,1,0)
## Q* = 777.25, df = 495, p-value = 7.105e-15
## 
## Model df: 9.   Total lags used: 504
print("Coeficientes del modelo ARIMA (9,1,0):")
## [1] "Coeficientes del modelo ARIMA (9,1,0):"
print(arima_meta2$coef)
##          ar1          ar2          ar3          ar4          ar5          ar6 
## -0.034046631 -0.015043424  0.013323440 -0.012179738 -0.014704041 -0.017200556 
##          ar7          ar8          ar9 
##  0.016741582 -0.009390534  0.047534235

Modelo 3 - ARIMA(0,1,1)

El presente modelo se realizó utilizando la función AutoARIMA con el fin de verificar la tendencia, la estacionalidad y posibles patrones en los datos; así como el comportamiento de la serie temporal en comparación con los valores de p, d y q de los dos modelos anteriores, también generados manualmente.

  • Evaluación de los Residuales en el Tiempo: Los residuales están centrados en torno a cero, pero con algunos valores atípicos significativos, similares a los observados en modelos previos. Aunque la dispersión de los errores no parece haber aumentado drásticamente, sigue habiendo picos que pueden impactar la precisión del modelo.

  • Función de Autocorrelación de los Residuales: La ACF muestra que la mayoría de los rezagos caen dentro de los intervalos de confianza (líneas azules), lo que indica una reducción en la autocorrelación respecto a modelos anteriores. Sin embargo, aún persisten algunos valores fuera del rango esperado, sugiriendo que la estructura del modelo podría mejorarse.

  • Distribución de los Residuales: Muestra una distribución sesgada con colas más pesadas que la normal. Esto indica que los errores extremos ocurren con mayor frecuencia de lo esperado, lo que podría afectar la robustez de las predicciones.

  • Prueba de Ljung-Box: El p-value de la prueba de Ljung-Box (8.771e−15) sigue siendo bajo, lo que indica que los residuales aún presentan autocorrelación y no se comportan completamente como ruido blanco.

El modelo ARIMA(0,1,1) muestra una ligera mejora en comparación con modelos anteriores, con menor autocorrelación en los residuales. Sin embargo, la presencia de valores atípicos y colas pesadas sugiere que podrían explorarse modelos alternativos como SARIMA o modelos híbridos con ML para mejorar la precisión y robustez de las predicciones.

# auto.arima(Y)
auto_meta <- auto.arima(ts_meta) #(0,1,1)
auto_meta$aic
## [1] 18944.25
bic_auto <- auto_meta$aic + log(length(df)) * (length(auto_meta$coef) - 1)
print(bic_auto)
## [1] 18944.94
checkresiduals(auto_meta)

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(0,1,1) with drift
## Q* = 789.23, df = 503, p-value = 4.885e-15
## 
## Model df: 1.   Total lags used: 504
print("Coeficientes del modelo ARIMA (0,1,1):")
## [1] "Coeficientes del modelo ARIMA (0,1,1):"
print(auto_meta$coef)
##         ma1       drift 
## -0.03702498  0.20603978
auto_meta
## Series: ts_meta 
## ARIMA(0,1,1) with drift 
## 
## Coefficients:
##           ma1   drift
##       -0.0370  0.2060
## s.e.   0.0183  0.0933
## 
## sigma^2 = 28.73:  log likelihood = -9469.13
## AIC=18944.25   AICc=18944.26   BIC=18962.33

Modelo seleccionado

La selección del modelo ARIMA(0,1,0) con un AIC de 18948.82 se justifica por varias razones, a pesar de que los modelos ARIMA(9,1,0) con un AIC de 18952.03 y ARIMA(0,1,1) con un AIC de 18944.25 tienen AICs ligeramente más altos o más bajos, respectivamente.

  • Simplicidad del Modelo: El modelo ARIMA(0,1,0) es el más simple y, por lo tanto, más interpretativo.Según, la regla de parsimony se sugiere que, cuando los modelos tienen un rendimiento similar, es preferible seleccionar el más simple, ya que minimiza el riesgo de sobreajuste (overfitting). Un modelo más complejo puede ajustarse excesivamente a los ruidos o variaciones aleatorias en los datos, lo cual puede resultar en un peor desempeño predictivo a largo plazo.

  • Leve diferencia en AIC: Aunque el AIC de los modelos ARIMA(9,1,0) y ARIMA(0,1,1) es ligeramente más alto que el de ARIMA(0,1,0), las diferencias en los valores del AIC son muy pequeñas. En este caso, la diferencia en AIC entre los tres modelos es de solo 4 puntos, lo que sugiere que no hay una mejora significativa en el ajuste del modelo con modelos más complejos.

  • Comportamiento de los Parámetros: El modelo ARIMA(0,1,0) es el que presenta los parámetros más sencillos y no incluye términos de autorregresión ni de media móvil, lo cual es adecuado cuando los datos muestran una tendencia a ser estacionarios en la primera diferencia y no requieren ajustes adicionales de complejidad para capturar patrones estacionales o dependencias más complejas.

En conclusión, el modelo ARIMA(0,1,0) es el más adecuado debido a su simplicidad, la mínima diferencia en el AIC con respecto a los otros modelos y su capacidad para generalizar sin sobreajustarse a los datos.

Paso 5: Proyecciones

Con base al modelo seleccionado de ARIMA(0,1,0) a causa de su simplicidad y poca diferencia en relación al valor de AIC, se realizaron los siguientes escenarios a futuro.

Pronósticos para próximos dos años

Se generaron proyecciones para los próximos dos años, con frecuencia diaria. El rango de fechas es del día hábil número de 35 del 2025 al día 8 del 2028.

h <- 730 

# Generar predicciones
preds <- predict(arima_meta, n.ahead=h)

# Obtener inicio y fin de la predicción
start(preds$pred)
## [1] 2025   35
end(preds$pred)
## [1] 2028    8
# Graficar predicciones
plot.ts(cbind(ts_meta, preds$pred), lty=c(1,3), col=c("black", "blue"), main="Proyección ARIMA(0,1,0)")

Visualizamos ambas series de tiempo, en la parte superior y la proyección en la parte baja.

# Simulación de pronósticos con ruido
proys <- preds$pred + rnorm(h, 0, sqrt(arima_meta$sigma2))
ts.plot(cbind(tail(ts_meta, 169), proys), lty=c(1,3), col=c("black", "blue"))

Generamos una simulación de las predicciones con ruido. Se generaron 730 valores aleatorios con una distribución normal con media 0 y utilizando como desviación estándar, la varianza del error del modelo. Y se suma a la predicción para simular la incertidumbre en el pronósticos. De esta manera no tenemos solamente la predicción suavizada, sino una proyección que toma en cuenta más de la incertidumbre.

# Usando forecast para pronósticos y graficación
prons <- forecast::forecast(arima_meta, level=90, h=h)
plot(prons, main="Pronósticos ARIMA para 2 años")

Pronósticos para próximos dos años con escenario optimista y pesimista (intervalos)

También, se presenta la proyección con intervalos de escenarios optimistas y pesimistas, utilizando un intervalo de confianza de 90%. El escenario pesimista siendo el límite inferior del intervalo y el escenario optimista siendo el límite superior, en el cual se observa que el comportamiento del Escenario_Real, que se mantiene constante en 657.6549 en todos los periodos, se debe a la estructura del modelo ARIMA(0,1,0). Dicho modelo es equivalente a un random walk (caminata aleatoria), lo que implica que la mejor estimación de la siguiente observación es simplemente el último valor observado.

# Generar predicciones con intervalos de confianza
prons <- forecast::forecast(arima_meta, level=90, h=h)

# Crear un data frame con los escenarios
escenarios_df <- data.frame(
  Periodo = 1:h,
  Escenario_Pesimista = prons$lower[,1],  # Límite inferior
  Escenario_Real = prons$mean,            # Predicción central
  Escenario_Optimo = prons$upper[,1]      # Límite superior
)

# Imprimir los escenarios
head(escenarios_df)
##   Periodo Escenario_Pesimista Escenario_Real Escenario_Optimo
## 1       1            648.8295       657.6549         666.4803
## 2       2            645.1739       657.6549         670.1359
## 3       3            642.3688       657.6549         672.9410
## 4       4            640.0041       657.6549         675.3058
## 5       5            637.9207       657.6549         677.3892
## 6       6            636.0371       657.6549         679.2727
# Graficar los escenarios
ggplot(escenarios_df, aes(x = Periodo)) +
  geom_line(aes(y = Escenario_Pesimista, color = "Pesimista"), size = 1, linetype = "dashed") +
  geom_line(aes(y = Escenario_Real, color = "Real"), size = 1) +
  geom_line(aes(y = Escenario_Optimo, color = "Óptimo"), size = 1, linetype = "dashed") +
  labs(title = "Escenarios de Predicción ARIMA(0,1,0)",
       x = "Periodo", y = "Valor Predicho") +
  scale_color_manual(values = c("Pesimista" = "red", "Real" = "blue", "Óptimo" = "green")) +
  theme_minimal()

# Bandas de confianza
lowband <- preds$pred - 1.65 * preds$se
upband <- preds$pred + 1.65 * preds$se

ts.plot(cbind(ts_meta, preds$pred, lowband, upband), lty=c(1,3,3,3), col=c("black", "blue", "red", "red"), main="Predicción con Intervalos de Confianza")

ts.plot(cbind(tail(ts_meta, 169), preds$pred, lowband, upband), lty=c(1,3,3,3), col=c("black", "blue", "red", "red"), main="Predicción con Intervalos de Confianza (Zoom)")

Conclusiones

En conclusión, dado que nuestro modelo ARIMA(0,1,0) sigue un comportamiento de random walk, la proyección del precio de las acciones de Meta se representa como una línea recta, lo que refleja su impredecibilidad a largo plazo.

La metodología Box-Jenkins permitió capturar patrones históricos y generar pronósticos basados en tendencias pasadas, incorporando un margen de incertidumbre mediante ruido aleatorio y bandas de confianza. Sin embargo, dado que este enfoque se basa únicamente en datos pasados, resaltamos la importancia de complementarlo con otros métodos de análisis, como el análisis fundamental y el estudio de factores macroeconómicos, para mejorar la precisión en la toma de decisiones y obtener una visión más completa del comportamiento futuro de la acción.

