*EJERCICIO 1

*EJERCICIO 2

*EJERCICIO 4



Ejercicio 1

  1. Elegir una serie de tiempo y describir sus características de frecuencia y unidad de medida, asimismo citar la fuente de información.

Se eligió como serie El gasto mensual en apuestas en Victoria Australia en el periodo de julio de 1999 a noviembre del 2006, con una frecuencia mensual, unidad de medida millones de dolares por día.
La fuente es: https://datamarket.com/data/set/22m8/monthly-gambling-expenditure-in-victoria-australia-july-1999-to-november-2006-units-are-millions-of-dollars-per-day-smoking-ban-introduced-in-gaming-venues-in-september-2002#!ds=22m8&display=line

  1. Graficar y describir las características de la serie.
library(fpp2)
## Loading required package: ggplot2
## Loading required package: forecast
## Loading required package: fma
## Loading required package: expsmooth
library(gridExtra)
library(readxl)
library(TSA)
## 
## Attaching package: 'TSA'
## The following objects are masked from 'package:stats':
## 
##     acf, arima
## The following object is masked from 'package:utils':
## 
##     tar
Datos <- read.csv("juegoAustralia.csv") 
st <- ts(Datos$Monthlygambling,frequency =12,start = c (1999,7))


plot(st,col="purple",ylab="Millones de dólares",xlab="Años",lwd=.5,main="Gasto Mensual de Apuestas en Victoria Australia (1999-2006)",type="l",pch=5)

En la gráfica se puede observar una tendencia creciente en los intervalos de tiempo entre 1999-2002 y 2004-2006 y una tendencia decreciente en el intervalo del 2002-2004 aproximadamente.

  1. Analizar si la serie elegida presenta estacionalidad.
monthplot(st)

ggseasonplot(st)

Ejercicio 2

  1. Usando la serie elegida previamente, presentar en un mismo panel MA(3), MA(5), MA(7) y MA(9) (usar la función ma() del paquete forecast).
p1<-autoplot(st, series="Gasto")+autolayer(ma(st,3),series="3-MA")+xlab("Años")+ylab("Millones de dólares")+ggtitle("Gasto Mensual de Apuestas en Victoria Australia (1999-2006)")

p2<-autoplot(st, series="Gasto")+autolayer(ma(st,5),series="5-MA")+xlab("Años")+ylab("Millones de dólares")+ggtitle("Gasto Mensual de Apuestas en Victoria Australia (1999-2006)")

p3<-autoplot(st, series="Gasto")+autolayer(ma(st,7),series="7-MA")+xlab("Años")+ylab("Millones de dólares")+ggtitle("Gasto Mensual de Apuestas en Victoria Australia (1999-2006)")

p4<-autoplot(st, series="Gasto")+autolayer(ma(st,9),series="9-MA")+xlab("Años")+ylab("Millones de dólares")+ggtitle("Gasto Mensual de Apuestas en Victoria Australia (1999-2006)")

grid.arrange(p1,p2,p3,p4)
## Warning: Removed 2 rows containing missing values (geom_path).
## Warning: Removed 4 rows containing missing values (geom_path).
## Warning: Removed 6 rows containing missing values (geom_path).
## Warning: Removed 8 rows containing missing values (geom_path).

  1. Realizar una descomposición clásica (aditiva o multiplicativa). Interpretar
fit <- decompose(st, type='additive')
autoplot(fit)+xlab("Años") + ylab("Millones de dólares") +
ggtitle("Gasto Mensual de Apuestas en Victoria Australia (1999-2006)")

En el panel número dos se muestra la componente estacional, la cual tiene máximos en agosto y mínimos al inicio del año. En el panel numero tres se grafica la componente de tendencia, la cual como ya se había descrito tiene incrementos en los periódos entre 1999-2002 y 2004-2006 y decrementos en el intervalo del 2002-2004. Por último en el panel cuatro se grafica la componente recidual que corresponde a una serie aleatoria.

  1. En un mismo gráfico presentar:
  1. Si existe evidencia de estacionalidad generar gráfico de serie original y serie desestacionalizada, o
  2. Si no existe evidencia de estacionalidad generar gráfico de serie original y componente tendencia-ciclo.

Como se pudo observar en el ejercicio anterior al descomponer la serie esta muestra una componente estacional. Graficamos entonces la serie original y la serie desetacinalizada.

autoplot(st, series="Produccion")+autolayer(seasadj(fit), series="Seasonally adj. data") +
xlab("Años") + ylab("Millones de dólares") +
ggtitle("Gasto Mensual de Apuestas en Victoria Australia (1999-2006)")

Ejercicio 4

  1. De acuerdo con las características de la serie elegida en los ejercicios 1 y 2, se pide presentar una propuesta de modelo de tendencia con el mejor ajuste. Específicamente se solicita:
  1. Presentar la estimación del modelo de regresión en función del tiempo, el tiempo al cuadrado y/o medias estacionales.

Modelo de tendencia lineal \(\mu_t=\beta_0+\beta_1 t\)

mes. <- season(st)
modelo1 <- lm(st ~ time(st))
summary(modelo1)
## 
## Call:
## lm(formula = st ~ time(st))
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -43.243 -17.150  -1.164  16.460  38.510 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)  
## (Intercept) -4226.5645  1938.0846  -2.181   0.0318 *
## time(st)        2.1278     0.9674   2.199   0.0304 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.87 on 91 degrees of freedom
## Multiple R-squared:  0.05048,    Adjusted R-squared:  0.04004 
## F-statistic: 4.837 on 1 and 91 DF,  p-value: 0.03038
win.graph(width=4.875, height=2.5,pointsize=8)
plot(st,type='o',ylab='y')
abline(modelo1)

Al aplicar el modelo de tendencia lineal se obtiene un coeficiente \(R^2\) de \(0.05048\) lo que no indica que el modelo no es adecuado para esta serie,

Modelo de tendencia cuadratica

mes. <- season(st)
modelo2 <- lm(st ~ time(st) + I(time(st)^2)+mes.)
summary(modelo2)
## 
## Call:
## lm(formula = st ~ time(st) + I(time(st)^2) + mes.)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -35.285 -14.753   0.201  12.468  36.643 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)   
## (Intercept)   -4.423e+06  1.787e+06  -2.474  0.01549 * 
## time(st)       4.413e+03  1.784e+03   2.473  0.01555 * 
## I(time(st)^2) -1.101e+00  4.454e-01  -2.472  0.01560 * 
## mes.February   3.836e+00  9.541e+00   0.402  0.68875   
## mes.March      7.687e+00  9.542e+00   0.806  0.42291   
## mes.April      1.776e+01  9.894e+00   1.795  0.07644 . 
## mes.May        1.598e+01  9.893e+00   1.615  0.11022   
## mes.June       2.079e+01  9.892e+00   2.101  0.03880 * 
## mes.July       2.518e+01  9.551e+00   2.637  0.01008 * 
## mes.August     3.093e+01  9.548e+00   3.239  0.00175 **
## mes.September  2.619e+01  9.545e+00   2.743  0.00752 **
## mes.October    2.896e+01  9.543e+00   3.035  0.00326 **
## mes.November   2.400e+01  9.542e+00   2.515  0.01392 * 
## mes.December   1.843e+01  9.541e+00   1.932  0.05699 . 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 19.08 on 79 degrees of freedom
## Multiple R-squared:  0.311,  Adjusted R-squared:  0.1976 
## F-statistic: 2.743 on 13 and 79 DF,  p-value: 0.00296
win.graph(width=4.875, height=2.5,pointsize=8)
plot(st,type='o',ylab='y')
abline(modelo2)
## Warning in abline(modelo2): only using the first two of 14 regression
## coefficients

Al aplicar el modelo de tendencia cuadratica se obtiene un coeficiente \(R^2\) de \(0.311\) que indica un una mejora con respecto al ajuste lineal pero aun el valor no es significativo, lo que no indica que este modelo tampoco es el adecuado para esta serie,

Modelo de tendencia estacional

mes. <- season(st)
modelo3 <- lm(st ~ mes.-1)
summary(modelo3)
## 
## Call:
## lm(formula = st ~ mes. - 1)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -43.75 -15.75   0.50  13.14  37.12 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## mes.January     17.875      7.213   2.478 0.015289 *  
## mes.February    21.875      7.213   3.033 0.003257 ** 
## mes.March       25.875      7.213   3.587 0.000571 ***
## mes.April       36.429      7.711   4.724 9.59e-06 ***
## mes.May         34.857      7.711   4.520 2.08e-05 ***
## mes.June        39.857      7.711   5.169 1.66e-06 ***
## mes.July        41.750      7.213   5.788 1.30e-07 ***
## mes.August      47.750      7.213   6.620 3.62e-09 ***
## mes.September   43.250      7.213   5.996 5.38e-08 ***
## mes.October     46.250      7.213   6.412 8.98e-09 ***
## mes.November    41.500      7.213   5.753 1.50e-07 ***
## mes.December    36.125      7.213   5.008 3.16e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.4 on 81 degrees of freedom
## Multiple R-squared:  0.793,  Adjusted R-squared:  0.7623 
## F-statistic: 25.85 on 12 and 81 DF,  p-value: < 2.2e-16
  1. Presentar y analizar gráfico de los residuos: gráfica en el tiempo, gráfico cuantil-cuantil, histograma y función de autocorrelación (correlograma).
plot(y=rstandard(modelo1), x=as.vector(time(st)),xlab='Tiempo',ylab='Residuales estandarizados', type='o')

Modelo de tendencia cuadratica componente residual grafica en el tiempo

plot(y=rstandard(modelo2), x=as.vector(time(st)),xlab='Tiempo',ylab='Residuales estandarizados', type='o')

Modelo de tendencia estacional componente residual grafica en el tiempo

plot(y=rstandard(modelo3), x=as.vector(time(st)),xlab='Tiempo',ylab='Residuales estandarizados', type='o')

Grafica cuantil cuantil modelo 1

qqnorm(rstandard(modelo1)); qqline(rstandard(modelo1)) 

Grafica cuantil cuantil modelo 2

qqnorm(rstandard(modelo2)); qqline(rstandard(modelo2)) 

Grafica cuantil cuantil modelo 3

qqnorm(rstandard(modelo3)); qqline(rstandard(modelo3)) 

ggAcf(rstandard(modelo1))

Hay autocorrelación significante en 1,2,3,15,16,17,18 y 19

ggAcf(rstandard(modelo2))

Hay autocorrelación significante de 1 a 8 y de 16 a 19

ggAcf(rstandard(modelo3))

Hay autocorrelación significante de 1 a 8 y de 15 a 19

Histograma

hist(rstandard(modelo1))

hist(rstandard(modelo2))

hist(rstandard(modelo3))

shapiro.test(rstandard(modelo1))
## 
##  Shapiro-Wilk normality test
## 
## data:  rstandard(modelo1)
## W = 0.97277, p-value = 0.04881
shapiro.test(rstandard(modelo2))
## 
##  Shapiro-Wilk normality test
## 
## data:  rstandard(modelo2)
## W = 0.97694, p-value = 0.09865
shapiro.test(rstandard(modelo3))
## 
##  Shapiro-Wilk normality test
## 
## data:  rstandard(modelo3)
## W = 0.98263, p-value = 0.2536

No hay evidencia de normalidad para los términos de error en ninguno de los modelos, lo que concuerda con lo observado en los histogramas.

La serie presenta tendencia creciente y decreciente en ciertos intervalos, el modelo de tendencia tanto lineal, cuadratico y estacional no se ajustan adecuadamente por lo que es necesario realizar un analisis mas detallado.