TAREA1

A) Elegir una serie de tiempo y describir sus características de frecuencia y unidad de medida,asimismo citar la fuente de información.

Serie:“Pasajeros transportados en metro de la CDMX”" Es el promedio diario de pasajeros transportados. Incluye a los pasajeros con boleto pagado y usuarios de acceso gratutito (personas de la tercera edad, Discapacitados, menores de 5 años y derechohabientes del Sistema de Transporte Colectivo, principalmente).

-Unidad de medida: Miles de pasajeros -Periodicidad: Mensual -Fecha inicial: Enero/1986 -Fecha final: Junio/ 2018 -Última actualización 2018/08/20 Fuente:(http://www.inegi.org.mx/sistemas/bie/) -Ruta:Comunicaciones y transportes> Principales características del sistema de transporte colectivo metro de la Ciudad de México.> Pasajeros transportados

library(readr)
## Warning: package 'readr' was built under R version 3.4.4
library(gridExtra)
library(forecast)
## Warning: package 'forecast' was built under R version 3.4.4
library(fpp2)
## Warning: package 'fpp2' was built under R version 3.4.4
## Loading required package: ggplot2
## Loading required package: fma
## Loading required package: expsmooth
library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
library(TSA)
## Warning: package 'TSA' was built under R version 3.4.4
## 
## Attaching package: 'TSA'
## The following object is masked from 'package:readr':
## 
##     spec
## The following objects are masked from 'package:stats':
## 
##     acf, arima
## The following object is masked from 'package:utils':
## 
##     tar
metro <- read.csv("C:/Users/family/Desktop/metro.csv")
st<-ts(metro$Dato,frequency = 12, start = c(1986,1))

B)Graficar y describir las características de la serie

La serie muestra patrones de estacionalidad y de tendencia ciclo creciente

autoplot(st, main="Pasajeros transportados", xlab = "Años", ylab = "Pasajeros")

C)Analizar si la serie elegida presenta estacionalidad

Con base a la siguiente gráfica se ve más el patron de estacionalidad de la serie , ya que ciertos meses la cantida de pasajeros transportados puede ser casi igual

ggseasonplot(st)

##Tarea 2##

A)Usando la serie elegida previamente, presentar en un mismo panel MA(3), MA(5), MA(7) y MA(9) (usar la funcion ma() del paquete forecast).

ma3<- autoplot(st, series ="Data") +autolayer(ma(st,3), series ="3-MA")+xlab("Años")+ylab("Pasajeros")+ggtitle("Pasajeros transportados en metro de la CDMX")

ma5<- autoplot(st, series ="Data") +autolayer(ma(st,5),series ="5-MA")+xlab("Años")+ylab("Pasajeros")+ ggtitle("Pasajeros transportados en metro de la CDMX")

ma7<- autoplot(st, series ="Data") +autolayer(ma(st,7), series ="7-MA")+xlab("Años")+ylab("Pasajeros")+ggtitle("Pasajeros transportados en metro de la CDMX")

ma9<- autoplot(st, series ="Data") +autolayer(ma(st,9), series ="9-MA")+xlab("Años")+ylab("Pasajeros")+ggtitle("Pasajeros transportados en metro de la CDMX")
grid.arrange(ma3, ma5, ma7, ma9)
## Warning: Removed 2 rows containing missing values (geom_path).
## Warning: Removed 4 rows containing missing values (geom_path).
## Warning: Removed 6 rows containing missing values (geom_path).
## Warning: Removed 8 rows containing missing values (geom_path).

B)Realizar una descomposicion clasica (aditiva o multiplicativa). Interpretar.

Se eligió la descomposición aditiva, en el siguiente gráfico se pudede visualizar cada componente de la serie, los datos originales, la tendencia, la estacionalidad, y los residuos

fit<- decompose(st, type ="additive")
autoplot(fit)

C)Existe evidencia de estacionalidad , se genera grafico de serie original y serie desestacionalizada

autoplot(st,series="Datos")+ autolayer(seasadj(fit), series="Datos ajustados estacionalmente")+ xlab("años")+ylab("Pasajeros")+ggtitle("Pasajeros transportados")

TAREA 3

a) Presentar la estimación del modelo de regresión en función del tiempo, el tiempo al cuadrado y/o medias estacionales

mes.<-season(st)
modelo1<-lm(st~mes.+time(st)+ I(time(st)^2))
summary(modelo1)
## 
## Call:
## lm(formula = st ~ mes. + time(st) + I(time(st)^2))
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1386.67  -122.67     8.78   105.02   643.47 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    6.775e+06  5.494e+05  12.332  < 2e-16 ***
## mes.February   1.724e+02  5.242e+01   3.288  0.00110 ** 
## mes.March      8.669e+01  5.242e+01   1.654  0.09904 .  
## mes.April     -1.476e+01  5.242e+01  -0.282  0.77839    
## mes.May        9.592e+01  5.242e+01   1.830  0.06809 .  
## mes.June       1.496e+02  5.242e+01   2.853  0.00456 ** 
## mes.July       5.843e+01  5.283e+01   1.106  0.26947    
## mes.August     2.165e+02  5.284e+01   4.098 5.11e-05 ***
## mes.September  1.438e+02  5.284e+01   2.723  0.00678 ** 
## mes.October    3.245e+02  5.284e+01   6.141 2.09e-09 ***
## mes.November   2.456e+02  5.284e+01   4.648 4.65e-06 ***
## mes.December   1.657e+01  5.284e+01   0.314  0.75403    
## time(st)      -6.778e+03  5.488e+02 -12.351  < 2e-16 ***
## I(time(st)^2)  1.696e+00  1.370e-01  12.377  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 212.9 on 376 degrees of freedom
## Multiple R-squared:  0.5083, Adjusted R-squared:  0.4913 
## F-statistic:  29.9 on 13 and 376 DF,  p-value: < 2.2e-16

B) Interpretar los coeficientes estimados, significancia estadisstica y R cuadrada.

La R cuadrad nos demuestra que el modelo se ajusta en un 49% y el intercepto explica que en enero en promedio se transportan 6.775e+06 miles de pasajeros en metro

C) Presentar y analizar gráfico de los residuos: gráfica en el tiempo, grafico cuantil-cuantil, histograma y funcion de autocorrelacioon (correlograma).

C.1)Gráfico de los residuos

plot(y=rstandard(modelo1), x=time(st), type='l')

#C.2)Gráfico cuantil cuantil No existe normalidad ya que no se encuentran la mayoría de los datos dentro de la línea de normalidad

qqnorm(rstandard(modelo1)); qqline(rstandard(modelo1))

C.3)Histograma

El siguente gráfico demuestra un sesgo

hist(rstandard(modelo1),type="o")
## Warning in plot.window(xlim, ylim, "", ...): graphical parameter "type" is
## obsolete
## Warning in title(main = main, sub = sub, xlab = xlab, ylab = ylab, ...):
## graphical parameter "type" is obsolete
## Warning in axis(1, ...): graphical parameter "type" is obsolete
## Warning in axis(2, ...): graphical parameter "type" is obsolete

C.4)Autocorrelación

El siguiente gráfico nos demuestra que existe autocorrelacion entre los datos

acf(rstandard(modelo1))

D) Evaluar la normalidad de los residuos ocupando la prueba Shapiro-Wilk.

Ho=No hay normalidad Ha=Hay normalidad Se acepta la hipótesis nula de que no hay normalidad ya que el valor P es mayor a .05

shapiro.test(rstandard(modelo1))
## 
##  Shapiro-Wilk normality test
## 
## data:  rstandard(modelo1)
## W = 0.95797, p-value = 4.08e-09

CONCLUSIONES

Al analizar los residuos se puede ver que existe autocorrelación nos los datos en función del tiempo, la prueba Shapiro y el gráfico cuantil cuantil nos demuestra que no existe normalidad.