[Ilustración de un vagón del metro de la Ciudad de México] Recuperado de https://www.cuartocontactomexico.com/2018/04/innovaciones-metro-metrobus-cdmx-trasporte-movilidad.html

Planteamiento del Problema


En septiembre de 1969 se inaguró el Sistema de Transporte Colectivo en la Ciudad de México con la necesidad de satisfacer una elevada demanda de transporte.

Actualmente, el metro como se conoce coloquialmente, representa una opción de traslado para 25,106,261 de habitantes de la Zona Metropolitana del Valle de México, según la encuesta intercensal del 2015 realizada por el INEGI.

Al ser una de las principales formas de transporte, el Gobierno de la Ciudad de México ha implementado planes a lo largo del tiempo para mejorarlo.

Sabemos que la población crece cada vez más, por lo que es necesario realizar un análisis a través del tiempo del STC para tener bases con las que se pueda trabajar una propuesta a partir de un pronóstico de las métricas que se tienen.


[Fotografía de 1969 del metro de la CDMX] Recuperada de “http://academica.mx/#/blog/el-transporte-mas-comun-cumple-hoy-44-anos

Los datos con los que se trabajara son estadísticas registradas de 1986 a 2019 para el Sistema de Transporte Colectivo Metro de la Ciudad de México.

Nota: Son cifras preliminares a partir de la fecha en que se indica. A partir del 29 de noviembre de 2015, se regularizó el servicio de la línea 12 y la Fecha de actualización es Lunes, 22 de Abril de 2019.

Las variables con las que se trabajan son:

Análisis

La longitud del metro

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   115.0   158.0   200.0   185.2   201.0   226.0


La longitud del metro consiste en la creación de nuevas líneas o ampliaciones, podemos notar que hasta el año 2000 la serie de tiempo iba aumentando por pedazos debido a que la construcción de una nueva línea es tardado.

En el 2000 se puede ver que empiezan las disminución de la longitud en una mínima proporción, en 2003 vuelve a bajar, en una proporción mayor pero se normaliza hasta aumentar a 226 KM con la construcción de la Línea en 2013 y un año después disminuye notablemente y se intenta normalizar dos años después y podemos recordar que en esas fechas fueron los problemas técnicos que se tuvieron con esa Línea que se intentaron solucionar con cierres parciales de la línea.




Notemos que el correlograma tiene una tendencia muy marcada, es decir, la serie cuenta con una tendencia con lo cual para el modelo AR damos un parámetro de orden 1.



Se observa que tiene un solo valor atípico en el primer punto con lo cual decidimos darle un parametro para MA de orden 1.

Trenes en Servicio

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   152.0   230.0   256.0   248.4   276.0   299.0


Podemos ver que se parece mucho a la serie de la Longitud, lo que nos hace inferir que existe una relación entre ellas, pues al haber menos longitud de las vías, menos trenes pueden circular.

Notando que las disminuciones más notables suceden en 1990 baja drásticamente debido a que fue la primera vez que hubo reemplazas en los trenes, en 1999 a pesar de que ese mismo año se inaguró la línea B, se cerró por un tiempo para su ampliación que se inaguró en el 2000 y finalmente, disminuyendo en el periodo del cierre de la línea 12.




Al igual que la anterior serie tiene una marcada tendencia, con lo que le damos al modelo AR un parámetro de orden 1



Tiene un valor atípico por lo cual de damos orden 1 al modelo MA.

Kilometros Recorridos

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    65.4    88.9   105.9   101.8   112.2   129.6


Está serie se comporta muy similar a las dos anteriores (Longitud y Trenes) por lo que también puede estar relacionada con ellas, lo podemos notar en su comportamiento en las mismas fechas.




Tendencia marcada, se otorga orden 1 para modelo AR.



Tiene un valor atípico, se le otorga orden 1 para modelo MA.

Pasajeros Transportados

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    3097    3800    3957    3995    4154    4991


Sabemos que la población crece por lo cual, el metro transporta cada vez a más pasajeros, pero podemos notar que a pesar de esto, hay fechas importantes que se puede observar un comportamiento de la serie, por ejemplo, en 1994 fue un año muy conflictivo economicamente, se podría decir que la crisis economica se vio reflejada en los viajes registrados, de igual manera en 2008 con el aumento del boleto.

De igual manera se puede notar las fechas en que la Línea 12 afecto a los pasajeros pero podemos enfatizar que a diferencia de las otras series ésta no aumenta después como estaba antes del cierre de esta línea.

Finalmente en 2017 es cuando más bajo la serie debido al sismo que se presentó ese año.

Además, con el crecimiento de la población también se han ido creando otras alternativas de transporte como es el Metrobus que fue inagurado en 2005, la creación del Tren Suburbano en 2008, implementación de Ecobici en 2010 y aplicaciones como Uber, han hecho que tambíen los pasajeros del metro bajen.




Tendencia Variable decreciente, se da orden 2 al modelo MA.



Tiene varios valores atípicos decrecientes, es decir la variabilidad es alta en el ruido blanco, por lo cual se da de orden 3 para modelo MA.

Energía

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   53320   72951   79444   80579   88865  104653


Se nota una baja de consumo de energía en los mismos periodos en las que la Línea 12 tuvo cierre parciales. Sin embargo, en los últimos años ha disminuido muy notable por lo que podemos inferir que es debido a la implementacion de nueva tecnología para operar los trenes con lo cual lleva a un menor consumo, como el caso de la linea 12, el uso de otro tipo de trenes y la remodelación de diferentes estaciones principales de las lineas.




Tendencia variable decreciente, se da orden 2 para el modelo AR



Varios valores atípicos, variablidad alta en ruido blanco, se da orden 4. Sin embargo, podemos otorgar orden 3 por que los valores atípicos están dispersos, para modelo MA.

Modelo Lineal


Ahora consideremos primero ver el comportamiento de nuestras variables, con respecto a las relaciones que tienen entre ellas, para ello consideremos las correlaciones y además de los posibles modelos lineales entre las variables. El cual se representa de manera gráfica con lo siguiente:

Aquí podemos observar que las correlaciones más altas, se dan entre todas las variables por par sin considerar a los pasajeros.

Sin embargo por terminos de nuestro análisis, únicamente consideraremos dos variables, el número de trenes en servicio con respecto a la cantidad de energía gastada. Para ello veamos si las correlaciones que hay entre ambas variables si son significativas:

## 
##  Pearson's product-moment correlation
## 
## data:  serie1$Trenes.en.servicio..b and serie1$Energ..a.el..ctrica.consumida......Miles.de.KWH...e
## t = 23.759, df = 396, p-value < 2.2e-16
## alternative hypothesis: true correlation is greater than 0
## 95 percent confidence interval:
##  0.730285 1.000000
## sample estimates:
##      cor 
## 0.766629

Con la prueba de correlación de Pearson, nos determinó que el p-value es menor a nuestro nivel de significancia de la prueba, lo que quiere decir es que la correlación si es significativa. Ahora ajustando un modelo tenemos lo siguiente:

## 
## Call:
## lm(formula = log(y) ~ x)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.23993 -0.06010 -0.01069  0.05804  0.21852 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 10.543900   0.029361  359.11   <2e-16 ***
## x            0.002994   0.000117   25.59   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.08255 on 396 degrees of freedom
## Multiple R-squared:  0.6232, Adjusted R-squared:  0.6223 
## F-statistic:   655 on 1 and 396 DF,  p-value: < 2.2e-16
## [1] 37945.26

Así considerando el resumen del modelo que en este caso es exponencial, los valores estimados de nuestros parámetros, además los p-value correspondientes para cada uno, debido a ello podemos decir que el modelo es aceptado.

Teniendo así el siguiente modelo \(Y_{Energía}=37945.26 e^{0.002994x_{Trenes}}\) kWH

Este modelo lo que nos dice en resumen es la proporción con la que aumenta la energía de consumo con respecto a la cantidad de trenes en el servicio de transporte, sin embargo hace falta analizar como será el comportamiento de la energía y de la cantidad de trenes con respecto al tiempo, y ver si tiene sentido el modelo para fines prácticos.


Pronóstico


Pronóstico para el número de pasajeros.

Vamos a hacer el pronóstico correspondiente a esta serie que representa los pasajeros. La cual tenía la siguiente grafica:

Para lo cual haremos varios ajustes.

Obtenemos así la siguiente serie, donde solo cambiamos los últimos datos, comparándola con la anterior.


Ahora para el pronóstico vamos a usar esta nueva serie. Para el cual vamos a suavizar un poco la serie con medias móviles. Para los pronósticos usamos el modelo ARIMA correspondiente a la serie por el análisis anterior. Ahora ya para los pronósticos obtenemos algo como esto:



Lo cual es un pronóstico un poco ingenuo que se llegue a cumplir ese comportamiento periódico, entonces lo que se hizo para de alguna manera atenuar este efecto es agregar ruido blanco.

Un ruido blanco no es otra cosa que datos de una variable aleatoria normal con media cero y en este caso usaremos la desviación estándar que nos pareció interesante del comportamiento de la serie antes del año 2014. Agregamos este ruido blanco para obtener un mejor pronóstico.

Se hizo el pronóstico de la serie con medias móviles, usando intervalos de dos y cuatro meses donde se obtuvieron dos tipos de pronósticos: uno más reservado que se va estancando en el tiempo (usando intervalos de dos meses) y el otro que tiene un comportamiento creciente a lo largo del tiempo (usando intervalos de 4 meses).

Obteniendo los siguientes resultados

Tomando intervalos de dos meses

para cuatro meses

Como podemos apreciar en cada uno de los pronósticos hay que considerar nuestro intervalo de confianza que es considerablemente amplio a medida que pasa el tiempo. Las bandas de confianza son los posibles escenarios, y esto asegura que con un nivel de significancia del .99 los posibles datos caerán en esa banda; es decir que con una probabilidad del .99 los posibles datos futuros caerán ahí.

Un error, o un escenario diferente a nuestro pronóstico solo dentro de esas bandas de confianza presentarían diferencias destacables, más aun en tiempos mayores. Este modelo no está muy bien preparado para grandes aumentos en el futuro, el problema aquí es que nunca se ha estado preparado para ello.

El STCM ha tenido siempre problemas en el sobrecupo de pasajeros, y hay declaraciones que indican que se sobrepasa la capacidad en casi un millón de personas al día. Todo esto debe ser considerado porque en principio lo que se está modelando es que tanto podría crecer en el futuro un problema que se tiene ya hoy en día. Un error en el pronóstico a 30 años puede significar serios problemas, pues suponiendo que el número de pasajeros rebase nuestras expectativas, los planes ya hechos va a ser insuficientes.

Comparaciones

Ya tenemos una predicción acerca del número de pasajeros, pero, ¿como podemos identificar la magnitud de estos datos?, pues hay que compararlos. La manera más congruente de hacerlo es comparar los pasajeros con la capacidad del metro.

Para ello utilizamos las variables de trenes en servicio y kilómetros construidos del metro. Se estima que aproximadamente el STCM puede, en óptimas condiciones y a su máxima capacidad, transportar alrededor de 4.5 millones de personas al día, cifra que se supera frecuentemente aunado a las deficiencias presentes.

De manera muy general podemos sacar un promedio de cuánta gente representa cada tren y cada kilómetro en cuestión de la capacidad de pasajeros. Para lo cual se obtiene en promedio 12 mil personas por cada tren y 20 mil personas por cada kilómetro, estos valores nos ayudarán a estimar la capacidad.

Entonces usando los datos históricos y la predicción de los trenes en servicio podemos sacar un estimado del número de pasajeros soportados, considerando como estándar de capacidad los trenes en servicio, lo cual tiene mucho sentido pues son estos los que realizan el servicio de transportar a los pasajeros.

Así que comparamos los datos del número de pasajeros con el estimado de capacidad a partir de los datos históricos y el pronóstico del número de trenes (considerando que en promedio cada tren puede transportar 12 mil personas al día). Obteniendo los siguientes resultados:

Cómo se puede ver hay una notable deficiencia en la capacidad en cuanto a los trenes, por lo que hay un sobrecupo a lo largo de todo el tiempo, lo cual es evidente para todos los usuarios de este medio de transporte. Sí las tendencias siguen así, los problemas de sobrecupo van a ser mucho más grandes.

Ahora para la capacidad vista desde el punto de vista de los kilómetros construidos en servicio de vías del STCM se observa lo siguiente:

Se puede ver como la infraestructura del STCM tiene la capacidad de transportar a los pasajeros de manera suficiente, en casi todo el intervalo del tiempo. Esto nos dice que la planeación de las líneas y extensión de estas ha sido acertada y que de seguir así se puede cubrir la demanda.

Conclusiones

A partir de esto podemos identificar el problema principal, que no son el número de líneas o estaciones, pues estas parece que en si pueden soportar la capacidad requerida. El problema principal se presenta en los trenes, que no están teniendo un desempeño optimo. Hay muchos trenes fuera de servicio y eso hace que no se pueda dar el servicio suficiente para los pasajeros, y bajo esa tendencia el problema se agrava, pues habría menos trenes disponibles.

La solución a este problema en particular viene de recuperar y rehabilitar los trenes las que estén todos o casi todos disponibles para dar servicio, sin embargo es un proceso complejo. La antigüedad de los trenes, las fallas en el mantenimiento, incluso el mal uso de los servicios dificultan este objetivo, pero es justo y necesario poner gran atención en este, la rehabilitación de los trenes es un punto clave.

También hay que hacer una evaluación de costos de cuales si es posible reparar y volver a poner en circulación, y cuáles definitivamente no es posible recuperarlos y se deben comprar trenes nuevos. Todo esto debe hacerse, en cuanto el presupuesto lo permita, lo más pronto posible, para poder alcanzar la tendencia del número de pasajeros y reducir el efecto del sobrecupo.


Pronóstico para trenes en servicio

Recordemos como se ve la serie de esta variable.


Notemos que la serie no es estacionaria pues tiene cierta tendencia y una variabilidad no constante, además de que se presenta una estacionaridad.

Vamos a eliminar la tendencia que presenta.


Ahora vamos a ver eliminar la estacionaridad de los periodos (12).



Prueba de autocorrelacion.


## 
##  Box-Ljung test
## 
## data:  dif_est_tren
## X-squared = 123.83, df = 12, p-value < 2.2e-16


Como p < 0.05 nuestra hipótesis es alternativa y con lo cual eliminamos la tendencia y la estacionaridad que tenia la serie ahora vamos a hacer un una predicción de los datos.


## Series: dif_est_tren 
## ARIMA(1,0,0)(2,0,0)[12] with non-zero mean 
## 
## Coefficients:
##           ar1     sar1     sar2     mean
##       -0.2833  -0.5740  -0.3245  -0.0425
## s.e.   0.0491   0.0486   0.0495   0.1433
## 
## sigma^2 estimated as 45.31:  log likelihood=-1277.67
## AIC=2565.34   AICc=2565.5   BIC=2585.09


Ahora vamos a regresar los datos para agregar nuevamente la tendencia y la estacionaridad con la que contaban los datos, lo que vamos a hacer será aplicar el modelo a los datos originales de la serie.


Notemos que entre 2010 y mediados de 2012 hay un enorme decremento de los trenes lo cual afecta nuestra predicción pues esta considerando el no uso de trenes que tuvo la linea 12 por ese periodo por cierto mantenimiento a dicha linea.

Otro factor esta afectando la predicción es la constante que se tiene a partir de mediados de 2012 que no tiene nuevos trenes, lo cual incurre a que si no se lleva el mantenimiento adecuado bajen el numero de trenes por el desgaste de uso.


Pronóstico para energía consumida

Recordemos como se ve la serie para la energía.


Vamos a eliminar la tendencia que presenta.



Ahora vamos a ver eliminar la estacionaridad de los periodos (12).



Grafiquemos de nuevo el correlograma.



Aqui ya notamos que tiene menor variabilidad de los datos y hacemos la prueba de autocorrelación


## 
##  Box-Ljung test
## 
## data:  dif_est_energ
## X-squared = 155.82, df = 12, p-value < 2.2e-16


Lo cual nos da un p-value menor a 0.05 por lo cual ya podemos afirmar la estacionaridad de la serie.

Ahora vamos a hacer un una prediccion de los datos.


## Series: dif_est_energ 
## ARIMA(2,0,2)(1,0,0)[12] with non-zero mean 
## 
## Coefficients:
##           ar1      ar2      ma1      ma2     sar1      mean
##       -0.5256  -0.1265  -0.0362  -0.1129  -0.4608  -31.7673
## s.e.   0.3422   0.1268   0.3412   0.1786   0.0460   55.8850
## 
## sigma^2 estimated as 9567698:  log likelihood=-3629.64
## AIC=7273.28   AICc=7273.58   BIC=7300.93

Nos dan los parametros para un modelo de Arima(2,0,2)(1,0,0)

Ahora vamos a regresar los datos para agregar nuevamente la tendencia y la estacionaridad con la que contaban los datos, lo que vamos a hacer ser? aplicar el modelo a los datos originales de la serie


Al parecer tenemos igual que en los años anteriores una predicción de los datos con estacionaridad, esto por los peridos vacacionales,escolares y laborales con los que se cuentan en los meses 1,2,6,7,8,12.

Se puede notar una disminución de consumo de energía, lo cual se puede ver que conforme al numero de trenes pronosticados tiene sentido por que va a bajar el consumo de energia pues el numero de trenes baja.

Como se habia inferido anteriormente, la baja de consumo de energia puede ser por la implementacion de nueva tecnologia para operar los trenes con lo cual lleva a un menor consumo, como el caso de la linea 12 y la remodelación de diferentes estaciones principales de las lineas.


Conclusiones


En cada uno de los dos escenarios pronosticados respecto a los pasajeros se espera un aumento y se debe hacer lo necesario para atender esta problemática.

Podemos ver a través del análisis de la serie, y por datos del STCM que la ampliación de las líneas del metro, así como la implementación de sistemas de transporte que ayuden a desahoguen el flujo de gente pueden ser las posibles soluciones a este problema.

En cuanto al aumento de pasajeros habría que ver un poco que esto sucede porque la ciudad de México desde hace ya varias décadas funge como el principal centro económico y político del país, y todo esto suele ser aprovechado por los estados vecinos. Esto genera un sobrecupo en los sistemas de transporte, desde hace ya mucho tiempo y que no se le ha dado una solución clara.

Es claro que el metro tiene que crecer muy rápidamente para poder alcanzar los niveles satisfactorios, de otra manera no se podría alcanzar el objetivo de llegar a la capacidad adecuada. Otro de los factores de gran importancia es el costo que esto significa, que es bastante elevado, se estima que cuesta 1200 millones de pesos cada kilómetro de expansión del metro.

Gracias al análisis de las series por separado de la cantidad de trenes y la energía consumida en todo el sistema de transporte, los pronósticos nos indican una disminución para ambos casos, en el caso de la energía puede ser debido a la inserción de nuevos metros, que posiblemente tienen una mejora con respecto al gasto de energía, y además de las instalaciones dentro de todo el esquema de transporte.

Para el caso de los trenes en servicio y su disminución, esto se puede deber a que algunos metros ya estan demasiado viejos, descompuestos algunos, tales que dejan de dar servicio para evitar accidentes.

Aquí podemos ver una gran diferencia con respecto al modelo exponencial ajustado que nos determina que la cantidad de trenes estará aumentando y con ello la energía eléctrica. Sin embargo esta relación unicamente se esta considerando entre las dos variables sin considerar el tiempo.

Como conclusiones genereles podemos decir:

  • Pronósticos: El número de pasajeros aumenta.
  • Pronósticos: La energía, el número de trenes en servicio disminuyen cuando aumenta el tiempo
  • Modelo exponencial: Nos determina que si aumenta el numero de trenes la energia aumenta de forma exponencial, sin embargo no considera los valores futuros pronosticados, lo que indica que es un modelo que no se adecua a dar alternativas.
  • A pesar del aumento de pasajeros, se considera una disminución de trenes.

Propuesta


Imagen utilizada con fines educativos

Las métricas que analizamos son suficientes para realizar una propuesta dirigida al Gobierno de la Ciudad de México con base en los resultados obtenidos, se tienen dos puntos primordiales: la solución a los pasajeros transportados y la energía consumida.

  • En cuanto al aumento de pasajeros del metro la única solución es poner como meta primordial la creación o mejoramiento constante de otras alternativas de transporte como las que ya se mencionarón al inicio de este trabajo. El ampliar o crear nuevas líneas del metro se debe hacer con una buena ampliación, pues ya vimos con la línea 12 que puede ser contraproducente y salir más costoso.

  • Respecto a la enegía que consume el STC Metro obtuvimos predicciones de disminución, que podemos inferir que ya se están realizando cambios para un mejor aprovechamiento de la misma.

En 2017 cuando Miguel Ángel Mancera era Jefe de Gobierno de la CDMX se planteó hacer una Termovalorizadora, es decir, una planta de tratamiento de residuos sólidos, para convertirlos en electricidad la cual se utilizaría como fuente del STC Metro. Sin embargo, en febrero del 2019 la actual Jefa de Gobierno, Claudia Sheinbaum, declaró el cancelamiento de esta planta.

Por lo que el Gobierno debería buscar otras alternativas que beneficien al Metro y al medio ambiente, por ejemplo, el metro de Amsterdan a Bélgica funciona con paneles solares instalados en un tunel o los trenes con paneles solares de la India.


Otra alternativa que se puede considerar son la energía eólica con las corrientes en los túneles del metro o generar electricidad con las pisadas de peatones, son dos de las propuestas para impulsar el rendimiento energético del subsuelo que se plantearon durante el I Congreso Internacional Madrid Subterra celebrado en 2016.

Se debe subrayar que este es un modelo atractivo, sostenible y simple que permite el ahorro en la factura eléctrica y la reducción de la huella ecológica.