Librerias

uu="https://raw.githubusercontent.com/vmoprojs/DataLectures/master/CAEMP.DAT"
datos=read.csv(url(uu),sep=",",header=T)
d2s=ts(datos,st=1962,frequency = 4)
plot(d2s)

interpretar: La gráfica muestra que desde 1960 hasta mediados de los 70 los valores fueron subiendo, pero después la serie se volvió muy inestable con caídas y recuperaciones, por lo que no tiene una tendencia de crecimiento constante. No se nota un patrón que se repita cada cierto tiempo, así que no hay estacionalidad, pero sí se ven ciclos económicos de subidas y bajadas. Los cambios parecen ser de tipo aditivo porque las variaciones no dependen del nivel de la serie. Los valores más altos se dieron alrededor de 1975 y 1990, mientras que los más bajos fueron al inicio de los 60 y a comienzos de los 90. Para que la serie sea estacionaria haría falta aplicar por lo menos una diferencia.

7.1.1. Estacionariedad

acf(d2s)

library(tseries)
## Registered S3 method overwritten by 'quantmod':
##   method            from
##   as.zoo.data.frame zoo
adf.test(d2s)
## 
##  Augmented Dickey-Fuller Test
## 
## data:  d2s
## Dickey-Fuller = -2.6391, Lag order = 5, p-value = 0.3106
## alternative hypothesis: stationary

Basado en la prueba de dicker Fuller la serie no es estacionaria, ademas la funcion de autocorrelacion muestra un decenso suave en los 12 primeros resagos o valores.

d2sd=diff(d2s)
acf(d2sd)

adf.test(d2sd)
## Warning in adf.test(d2sd): p-value smaller than printed p-value
## 
##  Augmented Dickey-Fuller Test
## 
## data:  d2sd
## Dickey-Fuller = -4.0972, Lag order = 5, p-value = 0.01
## alternative hypothesis: stationary

El p-valor de la prueba de dickey Fuller dicta que la serie es estacional, por que este es menor que alfa=5% o 0,05

7.1.3. Modelo ARIMA

acf(d2sd)

pacf(d2sd)

m1=arima(d2s,order = c(0,1,2))
m1$aic
## [1] 488.5535
m2=arima(d2s,order = c(1,1,0))
m2$aic
## [1] 485.4119
m3=arima(d2s,order = c(1,1,2))
m3$aic
## [1] 489.1799

De los tres modelos presentes se escoge aquel que presente el valor mas bajo del indicador de AIC. En este caso el modelo 2 (aic=485.41)

7.1.4. Pronostico

d2sp=predict(m2,3)
d2sp
## $pred
##          Qtr1     Qtr2     Qtr3
## 1996 92.17202 92.24426 92.27748
## 
## $se
##          Qtr1     Qtr2     Qtr3
## 1996 1.437907 2.544385 3.499883

7.1.5. Exportación de Datos

start(d2s)
## [1] 1962    1
end(d2s)
## [1] 1995    4
start(d2sp)
## [1] 1 1
end(d2sp)
## [1] 2 1
str(d2s)
##  Time-Series [1:136, 1] from 1962 to 1996: 83.1 82.8 84.6 85.4 86.2 ...
##  - attr(*, "dimnames")=List of 2
##   ..$ : NULL
##   ..$ : chr "caemp"
str(d2sp)
## List of 2
##  $ pred: Time-Series [1:3] from 1996 to 1996: 92.2 92.2 92.3
##  $ se  : Time-Series [1:3] from 1996 to 1996: 1.44 2.54 3.5
inicio=1962.
final=1996.5
fecha=seq(inicio,final,by=0.25)
length(fecha)
## [1] 139
desempleo=rbind(d2s,d2sp)
## Warning in rbind(d2s, d2sp): number of columns of result is not a multiple of
## vector length (arg 2)
length(desempleo)
## [1] 137
data=c(rep("real",136),rep("pronostico",3))
length(data)
## [1] 139
#datosd=data.frame(fecha,desempleo,data)