La información obtenida se conforma de las variables
Fecha: Indica el día en el que se recibió este ingreso.
Tipo de ingreso: Campo que especifíca si el ingreso fue por venta de boletos, venta de tarjetas o recarga de tarjetas.
LÍnea 1: Indica los ingresos que recibía la ciudad para la línea 1.
Línea 2: Indica los ingresos que recibía la ciudad para la línea 2.
Línea 3: Indica los ingresos que recibía la ciudad para la línea 3.
Línea 4: Indica los ingresos que recibía la ciudad para la línea 4.
Línea 5: Indica los ingresos que recibía la ciudad para la línea 5.
Línea 6: Indica los ingresos que recibía la ciudad para la línea 6.
Línea 7: Indica los ingresos que recibía la ciudad para la línea 7.
Línea 8: Indica los ingresos que recibía la ciudad para la línea 8.
Línea 9: Indica los ingresos que recibía la ciudad para la línea 9.
Línea 12: Indica los ingresos que recibía la ciudad para la línea 12.
Línea A: Indica los ingresos que recibía la ciudad para la línea A.
Línea B: Indica los ingresos que recibía la ciudad para la línea B.
Donde se tiene información semanal a partir del 1 de enero del 2012 hasta 30 de septiembre del 2019, se agruparon las cifras de manera mensual para construir la serie de tiempo y reducir varianza. Las cifras se encuentran en pesos, pero por fines de de visualización en se cambio la escala a millones.
El objetivo es identificar patrones de tendencia y estacionariedad para ajustar un modelo de series de tiempo y así predecir los ingresos en Boletos y Recargas en periodos futuro.
Determinar si se deben eliminar la venta de boletos o venta de tarjetas en algunas estaciones de metro y hasta inclusive retirar la venta de boletos y permitir únicamente la venta y recargo de tarjetas. #apoyando la actual situacion pro-ecológica, reduciendo el consumo en papel y tinta de impresión
Comenzaremos con analizar el ingreso por tarjetas, recargas y boletos, para observar el comportamiento general del sistema y por cada línea del metro.
ggplotly(ggplot(rows1 %>% filter(Linea!='Sistema'), aes(x = date, y = monto,group=Linea, colour=Linea)) +
geom_line() +facet_wrap(~TIPO_INGRESO,scales = "free") +ylab("Millones de pesos")+xlab("")+ggtitle("STC Metro"))
Sabemos que a finales del 2013 subió la tarifa del metro, es por eso que vemos un incremento masivo en la alza de ventas de boletos antes de que inicie el 2014
Podemos ver que el aumento en las recargas se ha incrementado con el paso del tiempo, y por ende hay un decremento en la compra de boletos
Notemos también que existen líneas donde la compra de tarjetas es nula.
Podemos observar la tendencia a la baja para los ingresos de los boletos
Observamos una tendencia a la alta
Para los ingresos por Boletos ajustamos un modelo ARIMA con los siguientes parámetros, y analizamos sus residuales
##
## Call:
## arima(x = sbol, order = c(1, 0, 1))
##
## Coefficients:
## ar1 ma1 intercept
## 0.9484 -0.3218 264.8152
## s.e. 0.0317 0.0859 20.3431
##
## sigma^2 estimated as 295.8: log likelihood = -397.36, aic = 802.73
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set 0.7608437 17.19763 13.60553 -0.1498948 5.048871 0.8449596
## ACF1
## Training set -0.08684655
## Don't know how to automatically pick scale for object of type ts. Defaulting to continuous.
##
## Anderson-Darling normality test
##
## data: arb$residuals
## A = 0.71627, p-value = 0.05962
Para los ingresos por recargas ajustamos un modelo ARIMA con los siguientes parámetros, y analizamos sus residuales
##
## Call:
## arima(x = srec, order = c(1, 0, 1))
##
## Coefficients:
## ar1 ma1 intercept
## 0.9928 -0.4992 211.7251
## s.e. 0.0085 0.0726 61.6492
##
## sigma^2 estimated as 280.4: log likelihood = -395.62, aic = 799.25
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set 3.298421 16.74516 13.56757 1.14593 5.60018 0.8401072
## ACF1
## Training set -0.1936175
## Don't know how to automatically pick scale for object of type ts. Defaulting to continuous.
##
## Anderson-Darling normality test
##
## data: arc$residuals
## A = 0.13805, p-value = 0.9751