Descripción

La información obtenida se conforma de las variables

  1. Fecha: Indica el día en el que se recibió este ingreso.

  2. Tipo de ingreso: Campo que especifíca si el ingreso fue por venta de boletos, venta de tarjetas o recarga de tarjetas.

  3. LÍnea 1: Indica los ingresos que recibía la ciudad para la línea 1.

  4. Línea 2: Indica los ingresos que recibía la ciudad para la línea 2.

  5. Línea 3: Indica los ingresos que recibía la ciudad para la línea 3.

  6. Línea 4: Indica los ingresos que recibía la ciudad para la línea 4.

  7. Línea 5: Indica los ingresos que recibía la ciudad para la línea 5.

  8. Línea 6: Indica los ingresos que recibía la ciudad para la línea 6.

  9. Línea 7: Indica los ingresos que recibía la ciudad para la línea 7.

  10. Línea 8: Indica los ingresos que recibía la ciudad para la línea 8.

  11. Línea 9: Indica los ingresos que recibía la ciudad para la línea 9.

  12. Línea 12: Indica los ingresos que recibía la ciudad para la línea 12.

  13. Línea A: Indica los ingresos que recibía la ciudad para la línea A.

  14. Línea B: Indica los ingresos que recibía la ciudad para la línea B.

Donde se tiene información semanal a partir del 1 de enero del 2012 hasta 30 de septiembre del 2019, se agruparon las cifras de manera mensual para construir la serie de tiempo y reducir varianza. Las cifras se encuentran en pesos, pero por fines de de visualización en se cambio la escala a millones.

Objetivo

El objetivo es identificar patrones de tendencia y estacionariedad para ajustar un modelo de series de tiempo y así predecir los ingresos en Boletos y Recargas en periodos futuro.

Determinar si se deben eliminar la venta de boletos o venta de tarjetas en algunas estaciones de metro y hasta inclusive retirar la venta de boletos y permitir únicamente la venta y recargo de tarjetas. #apoyando la actual situacion pro-ecológica, reduciendo el consumo en papel y tinta de impresión

Análisis Exploratorio

Comenzaremos con analizar el ingreso por tarjetas, recargas y boletos, para observar el comportamiento general del sistema y por cada línea del metro.

Ingresos por Sistema

Ingresos por Lineas

Sabemos que a finales del 2013 subió la tarifa del metro, es por eso que vemos un incremento masivo en la alza de ventas de boletos antes de que inicie el 2014

Podemos ver que el aumento en las recargas se ha incrementado con el paso del tiempo, y por ende hay un decremento en la compra de boletos

Notemos también que existen líneas donde la compra de tarjetas es nula.

Comparación de Ingresos por Boletos y por Recargas

Sistema

Notemos que existe una cantidad considerable de outliers, limpiaremos estos outliers y mostraremos la descomposición de la serie por tendencia y estacionalidad para los ingresos por boletos y por recargas.

Descomposición

Boletos

Podemos observar la tendencia a la baja para los ingresos de los boletos

Recargas

Observamos una tendencia a la alta

Ajuste de Modelos

Boletos

Para los ingresos por Boletos ajustamos un modelo ARIMA con los siguientes parámetros, y analizamos sus residuales

## 
## Call:
## arima(x = sbol, order = c(1, 0, 1))
## 
## Coefficients:
##          ar1      ma1  intercept
##       0.9484  -0.3218   264.8152
## s.e.  0.0317   0.0859    20.3431
## 
## sigma^2 estimated as 295.8:  log likelihood = -397.36,  aic = 802.73
## 
## Training set error measures:
##                     ME     RMSE      MAE        MPE     MAPE      MASE
## Training set 0.7608437 17.19763 13.60553 -0.1498948 5.048871 0.8449596
##                     ACF1
## Training set -0.08684655
## Don't know how to automatically pick scale for object of type ts. Defaulting to continuous.
## 
##  Anderson-Darling normality test
## 
## data:  arb$residuals
## A = 0.71627, p-value = 0.05962

Recargas

Para los ingresos por recargas ajustamos un modelo ARIMA con los siguientes parámetros, y analizamos sus residuales

## 
## Call:
## arima(x = srec, order = c(1, 0, 1))
## 
## Coefficients:
##          ar1      ma1  intercept
##       0.9928  -0.4992   211.7251
## s.e.  0.0085   0.0726    61.6492
## 
## sigma^2 estimated as 280.4:  log likelihood = -395.62,  aic = 799.25
## 
## Training set error measures:
##                    ME     RMSE      MAE     MPE    MAPE      MASE
## Training set 3.298421 16.74516 13.56757 1.14593 5.60018 0.8401072
##                    ACF1
## Training set -0.1936175
## Don't know how to automatically pick scale for object of type ts. Defaulting to continuous.
## 
##  Anderson-Darling normality test
## 
## data:  arc$residuals
## A = 0.13805, p-value = 0.9751

Forecast

Boletos

Recargas