Serie:“Pasajeros transportados en metro de la CDMX”" Es el promedio diario de pasajeros transportados. Incluye a los pasajeros con boleto pagado y usuarios de acceso gratutito (personas de la tercera edad, Discapacitados, menores de 5 años y derechohabientes del Sistema de Transporte Colectivo, principalmente).
-Unidad de medida: Miles de pasajeros -Periodicidad: Mensual -Fecha inicial: Enero/1986 -Fecha final: Junio/ 2018 -Última actualización 2018/08/20 Fuente:(http://www.inegi.org.mx/sistemas/bie/) -Ruta:Comunicaciones y transportes> Principales características del sistema de transporte colectivo metro de la Ciudad de México.> Pasajeros transportados
library(readr)
## Warning: package 'readr' was built under R version 3.4.4
library(gridExtra)
library(forecast)
## Warning: package 'forecast' was built under R version 3.4.4
library(fpp2)
## Warning: package 'fpp2' was built under R version 3.4.4
## Loading required package: ggplot2
## Loading required package: fma
## Loading required package: expsmooth
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
library(TSA)
## Warning: package 'TSA' was built under R version 3.4.4
##
## Attaching package: 'TSA'
## The following object is masked from 'package:readr':
##
## spec
## The following objects are masked from 'package:stats':
##
## acf, arima
## The following object is masked from 'package:utils':
##
## tar
metro <- read.csv("C:/Users/family/Desktop/metro.csv")
st<-ts(metro$Dato,frequency = 12, start = c(1986,1))
La serie muestra patrones de estacionalidad y de tendencia ciclo creciente
autoplot(st, main="Pasajeros transportados", xlab = "Años", ylab = "Pasajeros")
Con base a la siguiente gráfica se ve más el patron de estacionalidad de la serie , ya que ciertos meses la cantida de pasajeros transportados puede ser casi igual
ggseasonplot(st)
##Tarea 2##
ma3<- autoplot(st, series ="Data") +autolayer(ma(st,3), series ="3-MA")+xlab("Años")+ylab("Pasajeros")+ggtitle("Pasajeros transportados en metro de la CDMX")
ma5<- autoplot(st, series ="Data") +autolayer(ma(st,5),series ="5-MA")+xlab("Años")+ylab("Pasajeros")+ ggtitle("Pasajeros transportados en metro de la CDMX")
ma7<- autoplot(st, series ="Data") +autolayer(ma(st,7), series ="7-MA")+xlab("Años")+ylab("Pasajeros")+ggtitle("Pasajeros transportados en metro de la CDMX")
ma9<- autoplot(st, series ="Data") +autolayer(ma(st,9), series ="9-MA")+xlab("Años")+ylab("Pasajeros")+ggtitle("Pasajeros transportados en metro de la CDMX")
grid.arrange(ma3, ma5, ma7, ma9)
## Warning: Removed 2 rows containing missing values (geom_path).
## Warning: Removed 4 rows containing missing values (geom_path).
## Warning: Removed 6 rows containing missing values (geom_path).
## Warning: Removed 8 rows containing missing values (geom_path).
Se eligió la descomposición aditiva, en el siguiente gráfico se pudede visualizar cada componente de la serie, los datos originales, la tendencia, la estacionalidad, y los residuos
fit<- decompose(st, type ="additive")
autoplot(fit)
autoplot(st,series="Datos")+ autolayer(seasadj(fit), series="Datos ajustados estacionalmente")+ xlab("años")+ylab("Pasajeros")+ggtitle("Pasajeros transportados")
mes.<-season(st)
modelo1<-lm(st~mes.+time(st)+ I(time(st)^2))
summary(modelo1)
##
## Call:
## lm(formula = st ~ mes. + time(st) + I(time(st)^2))
##
## Residuals:
## Min 1Q Median 3Q Max
## -1386.67 -122.67 8.78 105.02 643.47
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.775e+06 5.494e+05 12.332 < 2e-16 ***
## mes.February 1.724e+02 5.242e+01 3.288 0.00110 **
## mes.March 8.669e+01 5.242e+01 1.654 0.09904 .
## mes.April -1.476e+01 5.242e+01 -0.282 0.77839
## mes.May 9.592e+01 5.242e+01 1.830 0.06809 .
## mes.June 1.496e+02 5.242e+01 2.853 0.00456 **
## mes.July 5.843e+01 5.283e+01 1.106 0.26947
## mes.August 2.165e+02 5.284e+01 4.098 5.11e-05 ***
## mes.September 1.438e+02 5.284e+01 2.723 0.00678 **
## mes.October 3.245e+02 5.284e+01 6.141 2.09e-09 ***
## mes.November 2.456e+02 5.284e+01 4.648 4.65e-06 ***
## mes.December 1.657e+01 5.284e+01 0.314 0.75403
## time(st) -6.778e+03 5.488e+02 -12.351 < 2e-16 ***
## I(time(st)^2) 1.696e+00 1.370e-01 12.377 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 212.9 on 376 degrees of freedom
## Multiple R-squared: 0.5083, Adjusted R-squared: 0.4913
## F-statistic: 29.9 on 13 and 376 DF, p-value: < 2.2e-16
La R cuadrad nos demuestra que el modelo se ajusta en un 49% y el intercepto explica que en enero en promedio se transportan 6.775e+06 miles de pasajeros en metro
plot(y=rstandard(modelo1), x=time(st), type='l')
#C.2)Gráfico cuantil cuantil No existe normalidad ya que no se encuentran la mayoría de los datos dentro de la línea de normalidad
qqnorm(rstandard(modelo1)); qqline(rstandard(modelo1))
El siguente gráfico demuestra un sesgo
hist(rstandard(modelo1),type="o")
## Warning in plot.window(xlim, ylim, "", ...): graphical parameter "type" is
## obsolete
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...):
## graphical parameter "type" is obsolete
## Warning in axis(1, ...): graphical parameter "type" is obsolete
## Warning in axis(2, ...): graphical parameter "type" is obsolete
El siguiente gráfico nos demuestra que existe autocorrelacion entre los datos
acf(rstandard(modelo1))
Ho=No hay normalidad Ha=Hay normalidad Se acepta la hipótesis nula de que no hay normalidad ya que el valor P es mayor a .05
shapiro.test(rstandard(modelo1))
##
## Shapiro-Wilk normality test
##
## data: rstandard(modelo1)
## W = 0.95797, p-value = 4.08e-09
Al analizar los residuos se puede ver que existe autocorrelación nos los datos en función del tiempo, la prueba Shapiro y el gráfico cuantil cuantil nos demuestra que no existe normalidad.