1.Se tienen las series de tiempo de demanda mensual de pasajeros en miles de estados unidos(enero-1949 hasta diciembre -1960) y La demanda real de energia en MWh de la ciudad de sincelejo del mercado no regulado (enero de 2000 hasta septiembre de 2023). Con esta determine la siguiente informacion:

A. Grafique las series y analice a priori si existe patrones de estacionalidad y en que mes se dan esos efectos de calendario.Explique por que se dan estos efectos estacionales luego descomponga la serie(tanto en su forma aditiva como multiplicativa) para verificarlo.

#Analisis de series de tiempo para la demanda mensual de pasajeros en miles de Estados unidos

data("AirPassengers")
library(readxl)
library(stargazer)
library(lmtest)
library(ggrepel)
library(tsibble)
library(fUnitRoots)
library(forecast)
library(timetk)
library(TSstudio)
library(urca)
library(texreg)
library(dplyr)
library(slider)
library(tseries)


datos_ap <- data.frame(
  fecha = as.Date(time(AirPassengers)),
  pasajeros = as.numeric(AirPassengers))

#Analisis de series de tiempo para la demanda mensual de pasajeros en miles de Estados unidos #La serie temporal que muestra la demanda mensual de pasajeros (en miles) en los Estados Unidos desde enero de 1949 hasta diciembre de 1960 evidencia un comportamiento sistemático y estructurado,a simple vista, se observa una tendencia creciente sostenida a lo largo del tiempo, lo que indica que el número de pasajeros aumentó de forma constante durante el período analizado. Este tipo de comportamiento sugiere una evolución positiva del sector del transporte, probablemente impulsada por factores como el crecimiento demográfico, el desarrollo del turismo, la expansión de la infraestructura aérea y el aumento del poder adquisitivo de la población.

#Antes de aplicar cualquier modelo de series temporales, es necesario considerar los efectos del calendario, ya que la serie presenta fluctuaciones cíclicas muy claras que se repiten año tras año y estas variaciones coinciden con meses específicos, lo que sugiere la influencia de eventos como las vacaciones de verano, Navidad, Semana Santa u otras festividades que promueven una mayor movilidad de personas,por ello,este comportamiento estacional no es aleatorio, sino que forma parte de una pauta predecible del consumo y uso del transporte, lo cual debe ser tenido en cuenta al momento de analizar la serie o realizar pronósticos.

ts_plot(AirPassengers, slider = TRUE ,
       title = "Demanda mensual de pasajeros en EE.UU\n 1940-1960",
       ylab("numeros de pasajeros en miles"),
       xlab("años"))

#Descomposicion de la serie #La descomposición de la serie de tiempo AirPassengers, que representa la demanda mensual de pasajeros en miles en Estados Unidos, puede observarse desde dos enfoques el aditivo y el multiplicativo,ambos enfoques permiten identificar los mismos componentes: tendencia, estacionalidad y la parte aleatoria o irregular,sin embargo, cada uno los interpreta de manera distinta.

#Enfoque Aditivo: Observado = Tendencia + Estacional + Aleatorio #En el modelo aditivo, se asume que la estacionalidad y el componente aleatorio tienen una magnitud constante a lo largo del tiempo y se añaden directamente a la tendencia,por ello, al analizar los componentes, se observa lo siguiente:

#Tendencia: Muestra un crecimiento constante en la cantidad de pasajeros desde 1949 hasta 1960, lo que refleja el aumento general del interés por los viajes aéreos,mostrando un crecimiento que parece ser lineal, con una pendiente que se mantiene relativamente constante.

#Estacionalidad:Esta presenta oscilaciones de magnitud constante a lo largo de toda la serie,si bien se aprecian repeticiones periódicas cada 12 meses, con picos y valles que mantienen una intensidad similar sin importar si el número total de pasajeros es bajo o alto, lo que indica que el efecto de la temporada alta de viajes es el mismo en los primeros años de la serie que en los últimos.

#Componente Aleatorio: Concentra las fluctuaciones no explicadas por la tendencia ni por la estacionalidad. Los valores se distribuyen alrededor de cero, mostrando irregularidades esporádicas a lo largo del período, que pueden deberse a factores imprevistos como crisis económicas o eventos políticos que afectan los viajes.

#Enfoque Multiplicativo: Observado = Tendencia × Estacional × Aleatorio #En el modelo multiplicativo, la estacionalidad y el componente aleatorio se expresan como una proporción de la tendencia,es decir, su magnitud crece o decrece a medida que la tendencia sube o baja.

#Tendencia: se muestra un crecimiento sostenido en el número de pasajeros, con un ascenso más notorio en los últimos años de la década de 1950, reflejando la popularización del transporte aéreo.

#Estacionalidad: Las oscilaciones estacionales son más atenuadas en los primeros años y se vuelven más pronunciadas en los períodos más recientes, cuando la cantidad total de pasajeros es mayor,sugiriendo que el impacto de los picos de la temporada alta aumenta en proporción al volumen total de viajes.

#Componente Aleatorio: Estas oscilaciones son más tenues al principio de la serie y adquieren mayor visibilidad en los años más recientes, destacando que las fluctuaciones inesperadas tienen un impacto proporcionalmente mayor a medida que el mercado crece.

#En este análisis se trabajó con el modelo aditivo, el cual resulta adecuado porque refleja de manera consistente la tendencia creciente, los patrones estacionales recurrentes y las fluctuaciones aleatorias de la demanda de pasajeros en EE.UU

ts_decompose(AirPassengers,type = "both")

#B. Desestacionalice la serie y compare con la serie original.¿Que tanto se redujo el efecto calendario?

#La gráfica ilustra una comparación entre dos versiones de la misma serie temporal ,la serie original de pasajeros aéreos (en azul) y la serie desestacionalizada (en anaranjado),en la parte de arriba se observa en la serie original, una tendencia en aumento sostenida con el tiempo que va acompañada de cambios cíclicos constantes y que demuestran que existe estacionalidad, estos cambios continuos se deben a fluctuaciones sistemáticas relacionadas con meses específicos del año que probablemente están relacionadas con períodos de gran demanda como el fin de año, las vacaciones y las festividades. Este patrón estacional, si bien en algunas situaciones resulta útil, puede obstaculizar la identificación precisa de la tendencia subyacente y del desarrollo estructural a largo plazo de la serie ,ya que ,introduce ruido recurrente que no tiene relación con elementos económicos o estructurales reales.Sin embargo, la gráfica de abajo muestra la serie desestacionalizada ,en otras palabras se ha eliminado el componente estacional mediante un procedimiento estadístico y Como resultado se obtiene una línea más suave, continua y estable lo cual permite observar con mayor claridad el comportamiento estructural de la demanda del transporte aéreo. Estos cambios también facilitan un análisis más preciso de las tendencias y mejora las condiciones para implementar modelos econométricos como los modelos ARIMA no estacionales o las regresiones lineales, ya que , al eliminar las oscilaciones cíclicas previsibles se logra reducir la autocorrelación estacional y se llega a una representación más limpia del fenómeno, lo que permite mejorar la predicciones y a su vez se logra aislar el crecimiento real de una serie lo que es indispensable para el pronostico y planificación mas efectiva.

demanda_descom<- decompose(AirPassengers,type = "additive")
demanda_des <- AirPassengers- demanda_descom$seasonal
demanda<-data.frame("demanda_obs"=as.numeric(AirPassengers))%>%
  mutate(demanda_des=as.numeric(demanda_des),
         fecha=datos_ap$fecha)
ts_plot(demanda, slider = TRUE ,
       title = "Demanda mensual de pasajeros en EE.UU\n observada y desestacionalizada 1940-1960",
       ylab("numeros de pasajeros en miles"),
       xlab("años"))
ts_plot(demanda, slider = T ,
       title = "Demanda mensual de pasajeros en EE.UU 1940-1960 \n normal y desestacionalizada",
       ylab("numeros de pasajeros en miles"),
       xlab("años"))

C.Revise si la serie es estacionaria o no de forma apriri,explique por que considera que es o no estacionaria. Luego , pruebe estadisticamente la existencia de estacionariedad a traves de :

#1. Correlograma ¿la correclacion disminuye lenta o rapidamente a medida que nos alejamos en el tiempo?

#2.La pruena Dickey fuller(o DF aumentado). Si la serie o es estacionaria ¿Que haria para volverla estacionaria?

#probar si la serie es estacionaria

#Según Hamilton (1994), una serie de tiempo estacionaria se distingue por poseer características estadísticas que no varían a lo largo del tiempo, entre las cuales se incluyen una media invariable, una varianza constante y un patrón de autocorrelación estable. En la serie analizada, se aprecia un comportamiento de crecimiento persistente, lo que sugiere que la media no permanece estable, porque los valores tienen una tendencia al aumento progresivo,entonces, de acuerdo con Box y Jenkins (1976), este comportamiento indica que una serie temporal no es estacionaria,además, se observa que a medida que pasa el tiempo, la dispersión de los datos crece,lo que significa que la varianza no es constante, lo cual constituye otro criterio de no estacionariedad según las bases de series temporales definidas por Gujarati y Porter (2009). Además, se presentan elementos estacionales, los cuales pueden identificarse por medio de la aparicion de picos en ciertos momentos del año.

#test de Dickey Fuller

##p-value

##Si p-value ≤ a se rechaza H₀

##Si p-value > a no se rechaza H₀

##Con estadístico ADF

##Si ADF ≤ Valor crítico (VC) se rechaza H₀

##Si ADF > Valor crítico (VC) no se rechaza H₀

#Al aplicar la prueba Dickey-Fuller aumentada se obtuvo un estadístico de -4.6392, el cual es más negativo que los valores críticos al 1%, 5% y 10%, por lo que se puede rechazar la hipótesis nula de raíz unitaria, de igual manera , el p-value también resulta menor al nivel de significancia del 5%, lo cual confirma que la serie es estacionaria.

df <- ur.df(AirPassengers,type = "trend",lags = 0)
summary(df)
## 
## ############################################### 
## # Augmented Dickey-Fuller Test Unit Root Test # 
## ############################################### 
## 
## Test regression trend 
## 
## 
## Call:
## lm(formula = z.diff ~ z.lag.1 + 1 + tt)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -74.244 -21.848   0.092  18.107 106.445 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 25.95168    7.32595   3.542 0.000539 ***
## z.lag.1     -0.26819    0.05781  -4.639 7.95e-06 ***
## tt           0.71076    0.16706   4.255 3.81e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 31.65 on 140 degrees of freedom
## Multiple R-squared:  0.1333, Adjusted R-squared:  0.1209 
## F-statistic: 10.76 on 2 and 140 DF,  p-value: 4.483e-05
## 
## 
## Value of test-statistic is: -4.6392 7.4143 10.764 
## 
## Critical values for test statistics: 
##       1pct  5pct 10pct
## tau3 -3.99 -3.43 -3.13
## phi2  6.22  4.75  4.07
## phi3  8.43  6.49  5.47
dwtest(df@testreg)
## 
##  Durbin-Watson test
## 
## data:  df@testreg
## DW = 1.2541, p-value = 1.791e-06
## alternative hypothesis: true autocorrelation is greater than 0

#Si DW ≈ 2 no se rechaza H₀

#Si DW < 2 posible autocorrelación positiva.

#Si DW > 2 posible autocorrelación negativa.

#Con p-value

#Si p-value ≤ 0.05 se rechaza H₀

#Si p-value > 0.05 no se rechaza H₀

#En la prueba de Durbin-Watson se obtuvo un estadístico de DW = 1.2541 y un p-value =1.791e-06. Como el valor de DW es menor a 2 y el p-value es menor a 0.05, se rechaza H₀, lo que indica que existe evidencia de autocorrelación positiva en los residuos.

#Test de correlograma

#La ACF muestra una decadencia gradual con picos decrecientes, indicando que la autocorrelación disminuye con el aumento de los rezagos, mientras que el PACF corta de manera pronunciada en el primer rezago, con un segundo rezago apenas notable, mientras que los rezagos posteriores se mantienen cercanos a cero.Entonces los correlogramas evidencian que la autocorrelación se concentra en los rezagos iniciales y disminuye progresivamente, por tanto, segun estos correlogramas la serie presenta no estacionariedad tanto por tendencia como por estacionalidad.

par(mfcol= c(1,2))
acf(AirPassengers,)
pacf(AirPassengers)

#Con la serie estacionaria revise nuevamente los correlogrmas (FACS Y FACP) e identifique los valores aprobados p,d y q ¿ Que modelo ARIMA sugiere los correlogramas?

#Aunque la prueba Dickey–Fuller indicó que la serie era estacionaria, la gráfica original muestra una tendencia creciente a lo largo del tiempo.Entonces, siguiendo las afirmaciones de clase y la práctica común en series de tiempo, se aplicó una diferenciación para eliminar la tendencia y centrar los valores alrededor de cero, asegurando que la serie sea adecuada para la modelación ARIMA y facilitando el análisis de la autocorrelación en los rezagos.

la serie estacionaria

#Antes de diferenciar, la serie de pasajeros mostraba tendencia creciente y picos cada vez mayores, indicando que no era estacionaria y tenía varianza creciente, luego de la diferenciación se eliminó la tendencia, centrando la serie alrededor de cero, aunque los cambios siguen mostrando variabilidad creciente.

ap_diff <- diff(AirPassengers, differences = 1)
plot(ap_diff, main = "AirPassengers diferenciada (d=1)")

#Test de dickey fuller

##p-value

##Si p-value ≤ a se rechaza H₀

##Si p-value > a no se rechaza H₀

##Con estadístico ADF

##Si ADF ≤ Valor crítico (VC) se rechaza H₀

##Si ADF > Valor crítico (VC) no se rechaza H₀

#Al aplicar la prueba Dickey-Fuller aumentada se obtuvo un estadístico de -8.5472, el cual es más negativo que los valores críticos al 1%, 5% y 10%, por lo que se puede rechazar la hipótesis nula de raíz unitaria, asi mismo, el p-value también resulta menor al nivel de significancia del 5%, lo cual confirma que la serie es estacionaria.

df2<- ur.df(ap_diff,type = "trend",lags = 0)
summary(df2)
## 
## ############################################### 
## # Augmented Dickey-Fuller Test Unit Root Test # 
## ############################################### 
## 
## Test regression trend 
## 
## 
## Call:
## lm(formula = z.diff ~ z.lag.1 + 1 + tt)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -106.951  -18.672   -4.909   22.711   67.829 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  1.519755   5.489055   0.277    0.782    
## z.lag.1     -0.694109   0.081209  -8.547 2.03e-14 ***
## tt           0.001296   0.066542   0.019    0.984    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 32.5 on 139 degrees of freedom
## Multiple R-squared:  0.3446, Adjusted R-squared:  0.3352 
## F-statistic: 36.55 on 2 and 139 DF,  p-value: 1.762e-13
## 
## 
## Value of test-statistic is: -8.5472 24.3672 36.5465 
## 
## Critical values for test statistics: 
##       1pct  5pct 10pct
## tau3 -3.99 -3.43 -3.13
## phi2  6.22  4.75  4.07
## phi3  8.43  6.49  5.47

#test de durbin watson

#Si DW ≈ 2 no se rechaza H₀

#Si DW < 2 posible autocorrelación positiva.

#Si DW > 2 posible autocorrelación negativa.

#Con p-value

#Si p-value ≤ 0.05 se rechaza H₀

#Si p-value > 0.05 no se rechaza H₀

#En la prueba de Durbin-Watson se obtuvo un estadístico de DW = 1.8385, y un p-value = 0.1392, entonces como el valor de DW es cercano a 2 y el p-value es mayor a 0.05, no se rechaza H₀, lo que indica que no existe evidencia de autocorrelación en los residuos.

dwtest(df2@testreg)
## 
##  Durbin-Watson test
## 
## data:  df2@testreg
## DW = 1.8385, p-value = 0.1392
## alternative hypothesis: true autocorrelation is greater than 0

#test de corrrelogramas

#Tras la diferenciación, los correlogramas de la serie muestran que la autocorrelación se concentra principalmente en los primeros rezagos, mientras que los rezagos más lejanos presentan valores dispersos. La ACF indica que los cambios recientes dependen parcialmente de los cambios inmediatos anteriores, y la PACF confirma que la dependencia parcial residual es baja en los rezagos más lejanos,este patrón refleja que la serie oscila alrededor de cero y no presenta autocorrelación prolongada ni tendencia persistente, lo que es consistente con que la serie es estacionaria.

#Se eligió el modelo ARIMA(1,1,1) porque la serie original mostraba tendencia y se aplicó una diferenciación (d = 1) para lograr estacionariedad,tambien, la PACF corta al inicio, indicando dependencia inmediata (AR = 1), y la ACF corta rápidamente, sugiriendo un componente de media móvil de bajo orden (MA = 1), lo que permite capturar la dinámica de la serie y mantener residuos aproximados a ruido blanco.

par(mfcol=c(1,2))
acf(ap_diff,)
pacf(ap_diff)

#estimar modelo ARIMA(1,1,1)

arima_1<-arima(AirPassengers,c(1,1,1))
stargazer(arima_1,type="text")
## 
## =============================================
##                       Dependent variable:    
##                   ---------------------------
##                          AirPassengers       
## ---------------------------------------------
## ar1                        -0.474***         
##                             (0.116)          
##                                              
## ma1                        0.863***          
##                             (0.072)          
##                                              
## ---------------------------------------------
## Observations                  143            
## Log Likelihood             -694.342          
## sigma2                      962.187          
## Akaike Inf. Crit.          1,394.683         
## =============================================
## Note:             *p<0.1; **p<0.05; ***p<0.01

#e) Una vez identificada la especificación adecuada, interprete los parámetros estimados con sentido económico, revise el ajuste del modelo, así como la normalidad de los errores. Si los errores son normales, proceda a pronosticar los siguientes 5 meses a partir de la última observación. Si no son normales, use la función “auto.arima” del paquete “forecast” para automatizar el proceso de elección del modelo y revise nuevamente el ajuste y la normalidad de los errores para pronosticar.

#Analsis de la estimacion del modelo

#El modelo ARIMA(1,1,1) aplicado a la serie de pasajeros aéreos muestra que la dinámica de la demanda combina ajustes internos y efectos de choques externos,si bien,el coeficiente AR(1) negativo (-0.474) refleja un comportamiento correctivo,es decir, aumentos fuertes en un mes suelen moderarse al siguiente y caídas pronunciadas tienden a revertirse parcialmente, lo que significa que la serie no crece de manera explosiva, sino que se regula en el corto plazo. Por su parte, el coeficiente MA(1) positivo y elevado (0.863) revela que los choques imprevistos, como factores estacionales o variaciones económicas, tienen un efecto persistente que se transmite a los periodos siguientes,por tanto, el modelo sugiere que el crecimiento de largo plazo del sector aéreo se ve acompañado por fluctuaciones de corto plazo que responden tanto a correcciones naturales de la demanda como a perturbaciones externas.

demanda<-demanda%>%
  mutate(resid=arima_1$residuals,
         demanda_est=as.numeric(demanda_obs-resid))

#verificar ajuste

#El gráfico de comparación entre la demanda observada y la estimada muestra que el modelo ARIMA(1,1,1) logra un ajuste adecuado, es decir,la serie ajustada reproduce de manera consistente la tendencia creciente en el número de pasajeros y sigue de cerca los ciclos de expansión y contracción que se repiten cada año,si bien,se observa que los picos y valles característicos de la demanda aérea son representados con bastante precisión, lo que indica que el modelo captura correctamente tanto la dinámica de largo plazo como las fluctuaciones de corto plazo

demanda<-demanda  %>% 
select(demanda_obs,demanda_est,fecha)
ts_plot(demanda, slider = T ,
       title = "Demanda mensual de pasajeros en EE.UU 1940-1960 \n normal y ajustada",
       ylab("numeros de pasajeros en miles"),
       xlab("años"))

#graficar los errores

#La gráfica de los residuos confirma que el modelo ARIMA(1,1,1) presenta un ajuste adecuado, ya que los errores se comportan como un ruido blanco, centrados en cero y sin estructura aparente,lo que sugiere que la información relevante de la serie fue bien captada por el modelo y que los pronósticos derivados de él resultan confiables.

ts_plot(arima_1$residuals,slider = T,
       title = "Residuos",
       ylab(""),
       xlab("años"))

#Histograma de errores

#El análisis del histograma y del gráfico Q-Q de los residuos muestra que la condición de normalidad no se cumple plenamente, ya que los errores se distribuyen en torno a cero y presentan cierta simetría y el histograma evidencia una distribuecion no normal completa, por su parte el gráfico Q-Q confirma este comportamiento al mostrar desviaciones en los extremos respecto a la línea teórica, mostrando la presencia de colas pesadas y de valores atípicos que el modelo no logra capturar del todo, por lo que los supuestos de normalidad se ven parcialmente vulnerados.

par(mfcol=c(1,2))
hist(arima_1$residuals)
qqnorm(arima_1$residuals)
qqline(arima_1$residuals,col="red")

jarque.bera.test(arima_1$residuals)
## 
##  Jarque Bera Test
## 
## data:  arima_1$residuals
## X-squared = 2.2734, df = 2, p-value = 0.3209

#El test de Jarque–Bera arroja un p-value de 0.3209 con 2 grados de libertad, por lo que no se rechaza la hipótesis nula de normalidad y, en términos estadísticos, los residuos pueden considerarse consistentes con una distribución normal. Sin embargo, para evitar posibles sesgos y garantizar un ajuste más robusto, se procederá a la estimación de un modelo automático.

#modelo automatico

#La selección automática de modelos sugiere que, tras evaluar distintas especificaciones bajo criterios de información, el mejor ajuste corresponde a un ARIMA(2,1,1)(0,1,0)[12],indicando que el proceso de la serie se explica a partir de dos componentes autorregresivos y un término de media móvil en la parte no estacional, además de una diferencia estacional de periodo 12,por ello,el modelo se elige por ofrecer el menor valor del criterio de información, lo que refleja un mayor poder explicativo y un ajuste más adecuado respecto a las alternativas consideradas.

arima_auto<-auto.arima(AirPassengers,trace = T)
## 
##  ARIMA(2,1,2)(1,1,1)[12]                    : Inf
##  ARIMA(0,1,0)(0,1,0)[12]                    : 1031.539
##  ARIMA(1,1,0)(1,1,0)[12]                    : 1020.582
##  ARIMA(0,1,1)(0,1,1)[12]                    : 1021.192
##  ARIMA(1,1,0)(0,1,0)[12]                    : 1020.488
##  ARIMA(1,1,0)(0,1,1)[12]                    : 1021.103
##  ARIMA(1,1,0)(1,1,1)[12]                    : Inf
##  ARIMA(2,1,0)(0,1,0)[12]                    : 1022.583
##  ARIMA(1,1,1)(0,1,0)[12]                    : 1022.583
##  ARIMA(0,1,1)(0,1,0)[12]                    : 1020.733
##  ARIMA(2,1,1)(0,1,0)[12]                    : 1018.165
##  ARIMA(2,1,1)(1,1,0)[12]                    : 1018.395
##  ARIMA(2,1,1)(0,1,1)[12]                    : 1018.84
##  ARIMA(2,1,1)(1,1,1)[12]                    : Inf
##  ARIMA(3,1,1)(0,1,0)[12]                    : 1019.565
##  ARIMA(2,1,2)(0,1,0)[12]                    : 1019.771
##  ARIMA(1,1,2)(0,1,0)[12]                    : 1024.478
##  ARIMA(3,1,0)(0,1,0)[12]                    : 1023.984
##  ARIMA(3,1,2)(0,1,0)[12]                    : Inf
## 
##  Best model: ARIMA(2,1,1)(0,1,0)[12]
screenreg(list(coeftest(arima_auto)))
## 
## ==============
##      Model 1  
## --------------
## ar1   0.60 ***
##      (0.09)   
## ar2   0.21 *  
##      (0.09)   
## ma1  -0.98 ***
##      (0.03)   
## ==============
## *** p < 0.001; ** p < 0.01; * p < 0.05

#El análisis de los coeficientes muestra que todos los parámetros del modelo seleccionado son estadísticamente significativos,en particular, el término autorregresivo de primer orden (AR1 = 0.60) y el de segundo orden (AR2 = 0.21) resultan positivos y relevantes, lo que sugiere una dependencia directa de la serie con sus valores pasados. Por su parte, el componente de media móvil de primer orden (MA1 = -0.98) es altamente significativo y con signo negativo, lo que indica un ajuste correctivo fuerte frente a los choques aleatorios de corto plazo,estos parámetros respaldan la solidez del modelo y confirma que capta de manera adecuada la dinámica temporal de la serie.

#ajuste del modelo

#La comparación entre la línea azul demanda observada y la anaranjada que es la serie estimada por el modelo automático evidencia un buen ajuste, ya que ambas se superponen de manera cercana a lo largo del periodo,indicando que el modelo logra reproducir con precisión el comportamiento real de la demanda de pasajeros, capturando tanto su tendencia descendente como las fluctuaciones de corto plazo, sin presentar desviaciones significativas.

 demanda<-demanda%>%
 mutate(resid=arima_auto$residuals,
         demanda_est=as.numeric(demanda_obs-resid))%>%
  select(demanda_obs,demanda_est,fecha)
ts_plot(demanda, slider = T ,
       title = "Demanda mensual de pasajeros en EE.UU 1940-1960 \n normal y ajustada",
       ylab("numeros de pasajeros en miles"),
       xlab("años"))

#histograma de errores

#El histograma de los residuos del modelo automático muestra una distribución aproximadamente simétrica en torno a cero, lo que indica ausencia de sesgo marcado. Sin embargo, el gráfico Q-Q revela ligeras desviaciones en los extremos, lo que sugiere la presencia de colas algo más pesadas que las de una distribución normal, pero aun con estas diferencias, la mayor parte de los puntos se alinean con la recta teórica, lo que respalda que los residuos se aproximan razonablemente a la normalidad,implicando que el modelo logra capturar adecuadamente la dinámica de la serie, aunque conserva cierta variabilidad extrema que debe ser tenida en cuenta en la interpretación de los resultados.

par(mfcol=c(1,2))
hist(arima_auto$residuals)
qqnorm(arima_auto$residuals)
qqline(arima_auto$residuals,col="red")

#test de jarque bera

#el test de Jarque–Bera arroja un p-value de 0.0005181 con 2 grados de libertad, por lo que se rechaza la hipótesis nula de normalidad y, en términos estadísticos, los residuos pueden considerarse no consistentes con una distribución normal.

jarque.bera.test(arima_auto$residuals)
## 
##  Jarque Bera Test
## 
## data:  arima_auto$residuals
## X-squared = 15.131, df = 2, p-value = 0.0005181

#Debido a que en el modelo estimado de forma automática los residuos no cumplieron con la normalidad según el test de Jarque–Bera, en el modelo ajustado manualmente dicho test arrojó un p-valor alto, por lo que no se rechazó la hipótesis nula de normalidad. Entonces, dado que este último modelo presenta un mejor comportamiento de los errores, se procede a utilizarlo para la etapa de pronóstico(arima_1).

#pronostico

#La tabla presenta los pronósticos de la demanda de pasajeros aéreos en Estados Unidos para los primeros meses de 1961, los valores esperados se ubican entre 455 y 475 mil pasajeros, lo que refleja la continuidad del patrón estacional de la serie,es decir, meses con mayor afluencia de viajeros seguidos de caídas temporales, este comportamiento se relaciona con la variación de la demanda por motivos turísticos, laborales y de negocios, que genera picos en ciertas épocas del año y descensos en otras,por ello,los resultados muestran un mercado dinámico, influenciado más por la estacionalidad que por un crecimiento lineal.

furval<-forecast(arima_1,h=5,level = c(0.95))
furval
##          Point Forecast    Lo 95    Hi 95
## Jan 1961       475.7282 414.9318 536.5246
## Feb 1961       454.9963 350.9269 559.0656
## Mar 1961       464.8255 337.5660 592.0850
## Apr 1961       460.1654 310.6088 609.7219
## May 1961       462.3748 294.5970 630.1525

#grafica de la serie

#La gráfica de pronóstico prolonga la serie hacia 1961 y confirma lo señalado en la tabla,es decir,la demanda de pasajeros conserva un marcado comportamiento estacional,si bien,La línea de valores esperados inicia en un nivel alto, luego presenta una leve disminución y posteriormente vuelve a repuntar, reproduciendo los ciclos de alzas y bajas que caracterizan la serie histórica,al mismo tiempo, la banda sombreada se amplía conforme aumenta el horizonte de predicción, lo que refleja la mayor incertidumbre inherente a las estimaciones de más largo plazo, esto indica que el sector transporte continúa regido por la dinámica estacional de la demanda, influida por factores turísticos, laborales y de consumo, mientras que el ensanchamiento de la banda evidencia la dificultad de anticipar con precisión el impacto de dichos factores conforme se proyectan periodos más lejanos.

plot(furval)

#bibliografia #Hamilton, J. D. (1994). Time Series Analysis. Princeton, NJ: Princeton University Press. #Box, G. E. P., & Jenkins, G. M. (1976)