*EJERCICIO 1
*EJERCICIO 2
*EJERCICIO 4
Se eligió como serie El gasto mensual en apuestas en Victoria Australia en el periodo de julio de 1999 a noviembre del 2006, con una frecuencia mensual, unidad de medida millones de dolares por dÃa.
La fuente es: https://datamarket.com/data/set/22m8/monthly-gambling-expenditure-in-victoria-australia-july-1999-to-november-2006-units-are-millions-of-dollars-per-day-smoking-ban-introduced-in-gaming-venues-in-september-2002#!ds=22m8&display=line
library(fpp2)
## Loading required package: ggplot2
## Loading required package: forecast
## Loading required package: fma
## Loading required package: expsmooth
library(gridExtra)
library(readxl)
library(TSA)
##
## Attaching package: 'TSA'
## The following objects are masked from 'package:stats':
##
## acf, arima
## The following object is masked from 'package:utils':
##
## tar
Datos <- read.csv("juegoAustralia.csv")
st <- ts(Datos$Monthlygambling,frequency =12,start = c (1999,7))
plot(st,col="purple",ylab="Millones de dólares",xlab="Años",lwd=.5,main="Gasto Mensual de Apuestas en Victoria Australia (1999-2006)",type="l",pch=5)
En la gráfica se puede observar una tendencia creciente en los intervalos de tiempo entre 1999-2002 y 2004-2006 y una tendencia decreciente en el intervalo del 2002-2004 aproximadamente.
monthplot(st)
ggseasonplot(st)
p1<-autoplot(st, series="Gasto")+autolayer(ma(st,3),series="3-MA")+xlab("Años")+ylab("Millones de dólares")+ggtitle("Gasto Mensual de Apuestas en Victoria Australia (1999-2006)")
p2<-autoplot(st, series="Gasto")+autolayer(ma(st,5),series="5-MA")+xlab("Años")+ylab("Millones de dólares")+ggtitle("Gasto Mensual de Apuestas en Victoria Australia (1999-2006)")
p3<-autoplot(st, series="Gasto")+autolayer(ma(st,7),series="7-MA")+xlab("Años")+ylab("Millones de dólares")+ggtitle("Gasto Mensual de Apuestas en Victoria Australia (1999-2006)")
p4<-autoplot(st, series="Gasto")+autolayer(ma(st,9),series="9-MA")+xlab("Años")+ylab("Millones de dólares")+ggtitle("Gasto Mensual de Apuestas en Victoria Australia (1999-2006)")
grid.arrange(p1,p2,p3,p4)
## Warning: Removed 2 rows containing missing values (geom_path).
## Warning: Removed 4 rows containing missing values (geom_path).
## Warning: Removed 6 rows containing missing values (geom_path).
## Warning: Removed 8 rows containing missing values (geom_path).
fit <- decompose(st, type='additive')
autoplot(fit)+xlab("Años") + ylab("Millones de dólares") +
ggtitle("Gasto Mensual de Apuestas en Victoria Australia (1999-2006)")
En el panel número dos se muestra la componente estacional, la cual tiene máximos en agosto y mÃnimos al inicio del año. En el panel numero tres se grafica la componente de tendencia, la cual como ya se habÃa descrito tiene incrementos en los periódos entre 1999-2002 y 2004-2006 y decrementos en el intervalo del 2002-2004. Por último en el panel cuatro se grafica la componente recidual que corresponde a una serie aleatoria.
Como se pudo observar en el ejercicio anterior al descomponer la serie esta muestra una componente estacional. Graficamos entonces la serie original y la serie desetacinalizada.
autoplot(st, series="Produccion")+autolayer(seasadj(fit), series="Seasonally adj. data") +
xlab("Años") + ylab("Millones de dólares") +
ggtitle("Gasto Mensual de Apuestas en Victoria Australia (1999-2006)")
Modelo de tendencia lineal \(\mu_t=\beta_0+\beta_1 t\)
mes. <- season(st)
modelo1 <- lm(st ~ time(st))
summary(modelo1)
##
## Call:
## lm(formula = st ~ time(st))
##
## Residuals:
## Min 1Q Median 3Q Max
## -43.243 -17.150 -1.164 16.460 38.510
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -4226.5645 1938.0846 -2.181 0.0318 *
## time(st) 2.1278 0.9674 2.199 0.0304 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 20.87 on 91 degrees of freedom
## Multiple R-squared: 0.05048, Adjusted R-squared: 0.04004
## F-statistic: 4.837 on 1 and 91 DF, p-value: 0.03038
win.graph(width=4.875, height=2.5,pointsize=8)
plot(st,type='o',ylab='y')
abline(modelo1)
Al aplicar el modelo de tendencia lineal se obtiene un coeficiente \(R^2\) de \(0.05048\) lo que no indica que el modelo no es adecuado para esta serie,
Modelo de tendencia cuadratica
mes. <- season(st)
modelo2 <- lm(st ~ time(st) + I(time(st)^2)+mes.)
summary(modelo2)
##
## Call:
## lm(formula = st ~ time(st) + I(time(st)^2) + mes.)
##
## Residuals:
## Min 1Q Median 3Q Max
## -35.285 -14.753 0.201 12.468 36.643
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -4.423e+06 1.787e+06 -2.474 0.01549 *
## time(st) 4.413e+03 1.784e+03 2.473 0.01555 *
## I(time(st)^2) -1.101e+00 4.454e-01 -2.472 0.01560 *
## mes.February 3.836e+00 9.541e+00 0.402 0.68875
## mes.March 7.687e+00 9.542e+00 0.806 0.42291
## mes.April 1.776e+01 9.894e+00 1.795 0.07644 .
## mes.May 1.598e+01 9.893e+00 1.615 0.11022
## mes.June 2.079e+01 9.892e+00 2.101 0.03880 *
## mes.July 2.518e+01 9.551e+00 2.637 0.01008 *
## mes.August 3.093e+01 9.548e+00 3.239 0.00175 **
## mes.September 2.619e+01 9.545e+00 2.743 0.00752 **
## mes.October 2.896e+01 9.543e+00 3.035 0.00326 **
## mes.November 2.400e+01 9.542e+00 2.515 0.01392 *
## mes.December 1.843e+01 9.541e+00 1.932 0.05699 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 19.08 on 79 degrees of freedom
## Multiple R-squared: 0.311, Adjusted R-squared: 0.1976
## F-statistic: 2.743 on 13 and 79 DF, p-value: 0.00296
win.graph(width=4.875, height=2.5,pointsize=8)
plot(st,type='o',ylab='y')
abline(modelo2)
## Warning in abline(modelo2): only using the first two of 14 regression
## coefficients
Al aplicar el modelo de tendencia cuadratica se obtiene un coeficiente \(R^2\) de \(0.311\) que indica un una mejora con respecto al ajuste lineal pero aun el valor no es significativo, lo que no indica que este modelo tampoco es el adecuado para esta serie,
Modelo de tendencia estacional
mes. <- season(st)
modelo3 <- lm(st ~ mes.-1)
summary(modelo3)
##
## Call:
## lm(formula = st ~ mes. - 1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -43.75 -15.75 0.50 13.14 37.12
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## mes.January 17.875 7.213 2.478 0.015289 *
## mes.February 21.875 7.213 3.033 0.003257 **
## mes.March 25.875 7.213 3.587 0.000571 ***
## mes.April 36.429 7.711 4.724 9.59e-06 ***
## mes.May 34.857 7.711 4.520 2.08e-05 ***
## mes.June 39.857 7.711 5.169 1.66e-06 ***
## mes.July 41.750 7.213 5.788 1.30e-07 ***
## mes.August 47.750 7.213 6.620 3.62e-09 ***
## mes.September 43.250 7.213 5.996 5.38e-08 ***
## mes.October 46.250 7.213 6.412 8.98e-09 ***
## mes.November 41.500 7.213 5.753 1.50e-07 ***
## mes.December 36.125 7.213 5.008 3.16e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 20.4 on 81 degrees of freedom
## Multiple R-squared: 0.793, Adjusted R-squared: 0.7623
## F-statistic: 25.85 on 12 and 81 DF, p-value: < 2.2e-16
plot(y=rstandard(modelo1), x=as.vector(time(st)),xlab='Tiempo',ylab='Residuales estandarizados', type='o')
Modelo de tendencia cuadratica componente residual grafica en el tiempo
plot(y=rstandard(modelo2), x=as.vector(time(st)),xlab='Tiempo',ylab='Residuales estandarizados', type='o')
Modelo de tendencia estacional componente residual grafica en el tiempo
plot(y=rstandard(modelo3), x=as.vector(time(st)),xlab='Tiempo',ylab='Residuales estandarizados', type='o')
Grafica cuantil cuantil modelo 1
qqnorm(rstandard(modelo1)); qqline(rstandard(modelo1))
Grafica cuantil cuantil modelo 2
qqnorm(rstandard(modelo2)); qqline(rstandard(modelo2))
Grafica cuantil cuantil modelo 3
qqnorm(rstandard(modelo3)); qqline(rstandard(modelo3))
ggAcf(rstandard(modelo1))
Hay autocorrelación significante en 1,2,3,15,16,17,18 y 19
ggAcf(rstandard(modelo2))
Hay autocorrelación significante de 1 a 8 y de 16 a 19
ggAcf(rstandard(modelo3))
Hay autocorrelación significante de 1 a 8 y de 15 a 19
Histograma
hist(rstandard(modelo1))
hist(rstandard(modelo2))
hist(rstandard(modelo3))
shapiro.test(rstandard(modelo1))
##
## Shapiro-Wilk normality test
##
## data: rstandard(modelo1)
## W = 0.97277, p-value = 0.04881
shapiro.test(rstandard(modelo2))
##
## Shapiro-Wilk normality test
##
## data: rstandard(modelo2)
## W = 0.97694, p-value = 0.09865
shapiro.test(rstandard(modelo3))
##
## Shapiro-Wilk normality test
##
## data: rstandard(modelo3)
## W = 0.98263, p-value = 0.2536
No hay evidencia de normalidad para los términos de error en ninguno de los modelos, lo que concuerda con lo observado en los histogramas.
La serie presenta tendencia creciente y decreciente en ciertos intervalos, el modelo de tendencia tanto lineal, cuadratico y estacional no se ajustan adecuadamente por lo que es necesario realizar un analisis mas detallado.