Proyecto Series de Tiempo

Situación

El Aeropuerto Internacional de la Ciudad de México es atendido por 26 líneas aéreas de pasajeros nacionales e internacionales y por 12 aerolíneas de carga. Además, es el principal centro de conexiones de la aerolínea más grande del país. Por ello es importante obtener previsiones futuras en los siguientes ámbitos:

  • Control oferta-demanda de vuelos
  • Evolución del tráfico de carga
  • Demanda turística

Objetivo

Realizar, mediante series de tiempo, predicciones para evaluar el comportamiento de las variables en estudio para el año 2020.

El presente trabajo se centrará en la cantidad de los pasajero nacionales como internacionales para luego obtener predcciones sobre su comportamiento en el año siguiente. Así como la carga aproximada en toneladas y para el rubro las operaciones que se realizan en el AICM se pretende dar respuesta a la pregunta ¿Realmente es necesario otro Aeropuerto? Mediante análisis de series de tiempo se pretende dar respuesta a esta problemática

Análisis de Series de tiempo

  1. Visualización de datos
  2. Examinar los componentes de las series, los diagramas de autocorrelación, también conocidos como ACF y PACF, y elección del orden del modelo.
  3. Ajuste de un modelo ARIMA
  4. Predicción. Una vez seleccionado el mejor modelo candidato se pueden hacer pronósticos en términos probabilísticos de los valores futuros.

Comencemos con la variable Pasajeros:

Los estudios sobre movilidad en los aeropuertos son de gran importancia debido al actual incremento de viajes que se ha producido en las ultimas décadas, conocer las condiciones futuras de los viajes permite planear de forma adecuada políticas publicas y planes de acción que ayuden a contrarrestar este fenómeno,
Debido a la saturación en su capacidad que fue declarada en el año 2013, el AICM se ha encontrado en diversos procesos de reestructuración y remodelación. Éste está planeado para prestar servicio a un promedio de 32 millones de pasajeros anualmente, hoy opera por encima de su capacidad, pues sólo en el 2018 recibió 44,732,418. pasajeros.

Notemos que se tiene cierta variabilidad que parece no aumentar demasiado a partir del año 2015 en vuelos nacionales e internacionales. Sin embargo, se observa tendencia en ambos datos y tenemos que los puntos más altos se dan en el mes de Julio y siguiendo Diciembre de cada año, las cifras más bajas de movimientos en AICM son en Febrero lo cual parece un comportamieno esperado debido a los periodos vacacionales.
Además, como la tendencia es creciente en ambas series, podemos ver que la amplitud de los periodos también aumenta, por lo tanto, tenemos series multiplicativas.

Componentes de la serie

  • Tendencia casi lineal en aumento
  • Estacionalidad con periodo de 12 meses, se observa mayor actividad en el mes de Julio, menor actividad en Febrero y Septiembre, así como una pequeña variabilidad en los periodos Marzo-Junio y Septiembre-Noviembre lo cual es muy razonable debido a periodos vacacionales y escolares

  • Tendencia casi lineal en aumento
  • Estacionalidad con periodo de 12 meses, se observa hay menos variaciones pero más acentuadas que en el caso de Pasajeros Nacionales, sin embargo, el comportamiento es similar en cuanto a mayor y menor actividad.

En el año 2016 utilizaron la terminal aérea 41 millones 710 mil pasajeros, de los cuales 27 millones 654 mil fueron nacionales y poco más de 14 millones internacionales, mientras que en 2017 se recibieron 44 millones 732 mil pasajeros; es decir, 7.24 más con respecto al año anterior. Así,el número de pasajeros en el AICM ha crecido de manera ininterrumpida y nos interesa predecir su comportamiento en los próximos años. Se obtienen las componentes aleatorias de los pasajerona nacionales e internacionales .

Se puede ver que ya no tienen tendencia ni estacionalidad por lo que se procede a ajustarles un modelo ARMA(p,q) para lo cual se analizarán los correlogramas.

Correlaciones

En el gráfico de correlacion, tenemos que el primer y unico lag significante (en los primeros 40) es el 2.

Notemos que hay tres lags significantes que son 1, 6 y 36.

Estos lags son los valores candidatos para q de un modelo MA(q).

En el gráfico de correlacion parcial, tenemos significancia en los lag 1 y 14. Así, nos interesa probar los modelos AR(p) con p=1,14

El primer lag significante para el modelo es el 5. Así, nos interesa probar el modelo AR(p) con p=5.

Por último se ve que no necesitan diferencias para quitarle la tendencia por lo que la d para ambas variables es igual a cero.

A partir de esto se generan modelos ARIMA(p,d,q) con todas las combinaciones de los coeficientes propuestos.

     [,1] [,2] [,3]
[1,]    1    0    2
[2,]   14    0    2
    df      AIC
m1n  5 1717.975
m2n 18 1728.089
    df      BIC
m1n  5 1729.359
m2n 18 1769.069
     [,1] [,2] [,3]
[1,]    5    0    1
[2,]    5    0    6
[3,]    5    0   36
    df      AIC
m1i  8 1647.802
m2i 13 1650.201
m3i 43 1680.964
    df      BIC
m1i  8 1666.015
m2i 13 1679.798
m3i 43 1778.861

Según los coeficientes BIC y AIC el mejor modelo debería ser el primero, pero la preicción tiende inmediatamente a la media así que se escoge el modelo 2 que es un ARIMA( 14,0,2).

Igual aquí se obtiene que el mejor modelo es aquel cuya proyección tiende a la media de manera inmediata así que visualmente se escogió al mejor modelo que es el 3, es decir un ARIMA(5,0,36).

Forecast for univariate time series: 
    Lead Forecast   S.E   Lower  Upper
73     1 -14619.9 29151  -71755  42515
74     2 -15030.0 30016  -73860  43800
75     3  52154.5 31542   -9666 113975
76     4  -4321.5 31772  -66594  57951
77     5  56981.4 33147   -7986 121949
78     6   5326.2 33164  -59674  70326
79     7   8025.6 34347  -59292  75344
80     8   4333.2 34363  -63017  71683
81     9 -32196.6 34447  -99711  35318
82    10 -26141.1 34482  -93724  41442
83    11 -47370.0 34695 -115371  20631
84    12 -19468.6 34944  -87957  49020
85    13  -5196.2 35041  -73876  63483
86    14  14990.9 35051  -53707  83689
87    15   7343.0 35497  -62231  76917
 [ reached getOption("max.print") -- omitted 57 rows ]
------ 
Note: confidence level = 95 % 

Forecast for univariate time series: 
    Lead Forecast   S.E  Lower  Upper
73     1   -28495 12429 -52855  -4135
74     2   -37633 12992 -63097 -12170
75     3     1510 15171 -28225  31245
76     4    13853 15982 -17470  45177
77     5      291 16073 -31211  31793
78     6    -6510 16108 -38082  25062
79     7   -15046 16243 -46881  16789
80     8    33322 16488   1005  65639
81     9    -6777 16571 -39254  25701
82    10    -4044 16755 -36884  28795
83    11    20336 16757 -12508  53179
84    12    14734 17572 -19707  49174
85    13    -4222 18173 -39841  31398
86    14     8489 18314 -27405  44383
87    15     2263 18806 -34596  39122
 [ reached getOption("max.print") -- omitted 57 rows ]
------ 
Note: confidence level = 95 % 

Ya por último se les suma la tendencia y estacionalidad para obtener la proyección de la variable original.

  • En febrero de 2020 habrá una baja en la actividad de pasajeros nacionales de hasta 2,250,000
  • En Julio se espera una alta actividad de hasta 3,500,000
  • La tendencia positiva continua
  • Notamos un decremento a finales del 2019 desde Octubre, esto puede deberse al reciente clima, causa por la cual algunos vuelos han sido suspensidos en los días recientes

  • En Julio no se refleja un aumento considerable comparado con el 2019. Notemos que hablamos del mes con más actividad
  • Tendencia positiva continua, sin embargo no resulta muy acentuada

Durante la Primera Sesión Ordinaria 2019, del Gabinete Turístico, Ferrando Bravo señaló que el AICM tendrá capacidad de 50 millones de pasajeros, una vez que se terminen las obras de ampliación en la Terminal 2 y en la Pista 05L, y el AIT podría recibir 10 millones de pasajeros anuales. Sin embargo, tenemos que para el 2020 tendremos más de 30 millones de pasajeros nacionales y cerca de 20 millones de pasajeros internacionales por lo que la demanda apenas lograría satisfacerce para el 2020.

Continuemos con la variable Operaciones

Al referirnos por operaciones del AICM nos referimos a los despegues y aterrizajes que realiza

Trabajaremos esta variable como despegues y aterrizajes nacionales e internacionales por separado analizando su comportamiento desde el año 2012 a junio 2019

Para comenzar a realizar el trabajo de series de tiempo visualizaremos la misma

Del grafico observamos a simple vista distintas cosas, obsevamos que las series presentan una tendencia año con año, notamos los picos mas bajos se presentan en el mes de febrero y semptiembre tanto para operaciones nacionales como internacionales, sin emabrgo los puntos mas altos no los comparten pero predominan los meses junio-julio y diciembre. A su vez notamos que las series de tiempo son de tipo aditivas pues no se presentan saltos abruptos los picos se ve que conservan una distancia similar. Esto nos lleva a preguntarnos? Realmente hace falta la construcción de un nuevo aeropuerto en el area metropolina?

Observemos los componentes de las series

Se puede observar una estacionalidad muy marcada para cada año, obteniendo su punto más bajo en el mes de febrero y el punto mas alto en diciembre, a su vez notamos que la serie tiene una tendencia que crecia lentamente del 2012 al 2014 posteriormente obtuvo un comportamiento constante, después se observa que comieza a cambiar su tendencia de manera creciente esto se debe a que hubo una sustitución de flota y aumento en los factores de ocupación obteniendo un cambio positivo con ello, sin embargo vuelve a caer esta tendencia debido a a que terminal incluyó el retiro de cerca de 19,000 slots (espacios de despegue y aterrizaje)a aerolíneas que no cumplieron con los horarios establecidos y la cancelación de vuelos que no tenían slot asignado y aun así se comercializaban. Y sobre todo la implementación de tecnología con el sistema Slotix (que controla en tiempo real despegues y aterrizajes). Para las operaciones Internacionales se nota que tiene también una estacionalidad muy marcando conservanodo valores máximos y mínimos al igual que en las operaciones nacionales, sin embargo la tendencia cambia para estas operaciones esta predomina una tendencia creciente, obteniendo su pico mas alto en 2018

Desde el 2004 la Secretaría de Comunicaciones y Transportes (SCT) emitió una declaratoria de saturación para la terminal aérea.

El decreto establece que solo pueden realizarse 61 operaciones por hora, pero no se cumple.

De acuerdo con la SCT, en horarios pico en el AICM se llevan a cabo hasta 180 maniobras de aterrizaje y despegue. Casi el triple de lo autorizado, lo cual nos lleva a pensar que realmente es urgente que se construya y se opere un nuevo aeropuerto para ayudar con la saturación de vuelos del AICM

Como vimos nuestras series de tiempo presentan tendencias y estacionalidad marcadas por lo que para realizar una buena predicción quitaremos estos factores después analizaremos las gráficas de correlación para poder ajustar un buen modelo.

Ahora revisaremos la correlación

Observamos un pico grande en el desfase 1 seguido por una onda decreciente que alterna entre correlaciones positivas y negativas, pero no vemos datos que sobresalgan de la bandas de confianza.Mismo comportamiento para ambas graficas

Ahora revisaremos la correlación parcial

En la correlacion parcial, podemos decir que se le puede asumir un modelo ARIMA(1,0,0) o bien uno (6,0,0) inclusive uno (12,0,0) Para las Operaciones Internacionales se observa que el modelo que mejor se le ajuste es un ARIMA(1,0,0)

Ajustamos el modelo
       df      AIC
arima1  3 1094.172
arima2  8 1088.968
arima3 14 1090.567
       df      BIC
arima1  3 1101.044
arima2  8 1107.292
arima3 14 1122.634
[1] 174100.1
[1] 139197.1
[1] 117178.5
Series: y 
ARIMA(1,0,0) with zero mean 

Coefficients:
         ar1
      0.3707
s.e.  0.1100

sigma^2 estimated as 14504:  log likelihood=-452.9
AIC=909.8   AICc=909.97   BIC=914.38
Analizando el AIC, el BIC y el error estandar tomaremos una decisión para cual es el mejor modelo, en este caso revisando el AIC indicaría que el mejor modelo es el ARIMA(1,0,0) sin embargo analizando el BIC y el error estandar nos arroja que el mejor modelo es un ARIMA(6,0,0) y su AIC no presenta tanta diferencia con el el modelo 1 , por lo cual el modelo ARIMA (6,0,0) sera el que utilizaremos

Para las Operaciones Internacionales realizamos la función auto.arima para comprobar que el pronostico que realizamos es correcto y en efecto nos arroja que el mejor modelo para esta serie de tiempo es un ARIMA(1,0,0)

Realicemos la predicción

Como predicción observamos que si habrá picos importantes sin embargo entre el pico mas bajo y el mas alto hay una diferencia de 4mil operaciones nacionales. No se observan tendencias a la alta lo cual con buena organización y planeacion en las operaciones se podrían solventar las futuras pues su comportamiento es contante. Sin embargo p ara las operaciones internacionales notamos un comportamiento totalmente a la inversa observamos que seguira creciendo las operaciones en el area internacional, crece de manera rapida por lo cual hay evidencia para decir que en efecto se necesita un nuevo aeropuerto que ayude a controlar estas operaciones a la alta pues se observa que año con año se van a requerir mas operaciones sin embargo el AICM no tiene la capacidad de solventarlo pues el AICM es uno de los 20 aeropuertos con mayor número de operaciones anuales en el mundo según el Consejo Internacional de Aeropuertos,esto lo convierte en el aeropuerto con mayor conectividad de América Latina por ello es fundamental el controlar las operaciones de los aviones ya que si no se tiene el espacio suficiente las operaciones podrían demorar de 30 a 10 horas.

Finalmente la variable Carga:

Podemos ver que los valores(toneladas) de carga internacional son mayores respecto a los de Carga nacional hasta 5 veces mas. LA carga nacional hasta el momento no sobrepasa las 10000 toneladas y sigue un patron que no sobrepasa la cifra antes mencionada desde el 2012 hasta ahora. En cambio la carga internacional a ido incrementando desde estar entre los 20 mil y 30 mil toneladas hasta hasta llegar a sobrepasar las 40 mil toneldas. Los meses importantes donde hay alza es en noviembre y marzo, y donde hay bajos valores son en agosto y enero principalmente.

Dados los graficos anteriores notamos que la autocorrelacion muestra puntos muy altos en casi todos tiempos, lo que sugiere una tendencia. Sin embargo la varianza parece ser constante en el tiempo para ambas series por lo que para descomponerse se usará un modelo aditivo.

Veamos los componenetes de la serie:

Con los componentes de la serie , podemos ver la serie , tendencia , estacionariedad. Nos reafirma que la carga internacional sigue una tendencia la alza , mientras que la carga nacional tuvo un declive en 2012 y logro recuperarse si no hasta el año 2015. La estacionariedad nos reafirma los decrementos y aumentos que habiamos detectado en los meses antes mencionados. Sin embargo para la componente aleatoria de la serie CargaInternacional la varianza parece crecer un poco con el tiempo, por lo que para el modelado se cambia a una descomposición del tipo multiplicativo.

Analizamos las componentes aleatorias de las variables:

Se puede ver que ya no tienen tendencia ni estacionalidad por lo que se procede a ajustarles un modelo ARMA(p,q) para lo cual se analizarán los correlogramas.

Veremos la Correlación Parcial de la Variable para ajustarle un modelo óptimo y, con éste, realizar las prediciones deseadas.

Aquí la autocorrelación parcial sugiere que se utilice un modelo AR(p) con los posibles valores de p: 4 y 11.

Por este lado se sugieren unas posibles p’s iguales a 4,9.

La gráfica sugiere unas posibles q’s iguales a 5, 14 y 18 para un modelo MA(q).

Por este lado se sugieren unas posibles q’s iguales a 1, 5, 10 y 16.

Por último para serciorarse de que las variables no tienen tendencia se utiliza la función ndiffs que indica cuantas diferencias necesita la serie para quitarle la tendencia, es decir, la d del modelo ARIMA(p,d,q).
[1] 0
[1] 0

En ambas resulta que d=0.

A partir de esto se generan modelos ARIMA(p,d,q) con todas las combinaciones de los coeficientes propuestos.

     [,1] [,2] [,3]
[1,]    4    0    5
[2,]   11    0    5
[3,]    4    0   14
[4,]   11    0   14
[5,]    4    0   18
[6,]   11    0   18
    df      AIC
m1n 11 1019.519
m2n 18 1018.587
m3n 20 1023.973
m4n 27 1028.320
m5n 24 1025.658
m6n 31 1036.204
    df      BIC
m1n 11 1044.562
m2n 18 1059.567
m3n 20 1069.506
m4n 27 1089.790
m5n 24 1080.298
m6n 31 1106.780
     [,1] [,2] [,3]
[1,]    4    0    1
[2,]    4    0    5
[3,]    4    0   10
[4,]    4    0   16
[5,]    9    0    1
[6,]    9    0    5
[7,]    9    0   10
[8,]    9    0   16
    df       AIC
m1i  7 -278.8875
m2i 11 -279.3913
m3i 16 -281.0997
m4i 22 -274.8085
m5i 12 -277.3855
m6i 16 -282.8127
m7i 21 -279.4885
m8i 27 -276.1357
    df       BIC
m1i  7 -262.9508
m2i 11 -254.3480
m3i 16 -244.6730
m4i 22 -224.7218
m5i 12 -250.0655
m6i 16 -246.3861
m7i 21 -231.6785
m8i 27 -214.6657

Para la variable cn se le ajusta el modelo 3 que representa un ARIMA(4,0,14) y se obtiene la siguiente predicción

Forecast for univariate time series: 
    Lead Forecast S.E Lower Upper
73     1  -133.51 206  -537   270
74     2    78.59 208  -329   487
75     3   144.22 209  -265   553
76     4    44.45 215  -377   466
77     5    63.06 218  -364   491
78     6    22.01 225  -419   463
79     7    72.63 226  -370   515
80     8  -151.65 227  -597   293
81     9   -64.49 227  -510   381
82    10  -120.93 239  -590   348
83    11  -221.40 249  -709   266
84    12   -34.14 250  -524   455
85    13  -118.06 257  -623   387
86    14   -26.07 267  -549   497
87    15   105.25 272  -428   639
 [ reached getOption("max.print") -- omitted 57 rows ]
------ 
Note: confidence level = 95 % 

Como se decidió tener un modelo aditivo con la variable CargaNacional a la proyección se le suma la tendencia y estacionalidad y queda lo siguiente. Donde la línea azul es la predicción.

Para la variable CI se obtuvo dos posibles candidatos, el modelo 1 y el modelo 6, pero la predicción del primero es la media así que no es buena predicción, así que se escoge el modelo 6 con un ARIMA(9,0,5).
Se proyectan 72 periodos que es lo equivalente a un sexenio con observaciones mensuales.

Forecast for univariate time series: 
    Lead Forecast    S.E Lower Upper
73     1    0.986 0.0257 0.936  1.04
74     2    0.979 0.0261 0.928  1.03
75     3    0.998 0.0272 0.945  1.05
76     4    0.993 0.0272 0.939  1.05
77     5    1.003 0.0278 0.949  1.06
78     6    0.964 0.0286 0.908  1.02
79     7    1.006 0.0287 0.950  1.06
80     8    1.000 0.0290 0.943  1.06
81     9    1.029 0.0291 0.972  1.09
82    10    1.012 0.0315 0.950  1.07
83    11    0.979 0.0315 0.917  1.04
84    12    0.998 0.0315 0.936  1.06
85    13    0.977 0.0322 0.914  1.04
86    14    1.018 0.0325 0.954  1.08
87    15    0.991 0.0325 0.927  1.05
 [ reached getOption("max.print") -- omitted 57 rows ]
------ 
Note: confidence level = 95 % 

Como es la componente aleatoria de la variable CargaInternacional que sigue un modelo multiplicativo se le multiplicará a esta proyección la estacionalidad y la tendencia para obtener una proyección de la variable original y queda lo siguiente.

Esta serie también tiende a seguir creciendo aunque la capacidad del areopuerto no pueda crecer de igual manera, a menos que se inventen aviones más grandes el arepuerto no podrá satisfacer la demanda.

Tambien recalcamos que apesar que en 2013 el AICM haya reportado estar al limite operacional , el aumento de las cifras respecto a la carga han sido gracias a la implementacion de aviones mas grandes por parte de las empresas, y es notablemente mayor en la carga internacional representando que las empresas que realizan transporte de carga internacional tienen mayor poder adquisitivo .

Es importante recalcar que AICM lleva alrededor de 7 años funcionando a nivel maximo operacional , y las cifras nos sugieren que la demanda seguira y tiene una tendencia a la alza tanto para el trasporte de carga nacional e internacional. Los problemas sobre trafico aereo se mantienen sin llegar a ser caoticos , pues solo se usan naves cada vez mas grandes. Sin embargo cada vez llega mas carga y con eso mas oportunidades para el narcotrafico.

México es uno de los centros de operacion mas importantes del mundo, donde los carteles de droga lo aprovechan por su conexion con todo el mundo. Aunque la informacion se extiende aun mas de este estudio , la alza en la trasportaciòn de carga tambien coincide con la alza en el numero de eventos relacionados con el transporte de droga.

Arreola Silva Marisol ,Escutia Rivera Itzel Ariadne, García Herrera Gabriela, García Montaño Daniel, Navarrete Pérez José Alberto

23 noviembre 2019