ANALISIS DE SERIES DE TIEMPO

Analisis básico de series de tiempo

Para este ejemplo utilizaremos datos de las busquedas acerca de spiderman en Google, desde 2004 hasta la actualidad.

library(readr)
spider <- read_csv("spiderman.csv", show_col_types = FALSE)

Para tratar este vector numérico como serie de tiempo, utilizaremos el comando ts (time-series objects)

spider.ts <- ts(spider, start=c(2004,1), frequency = 12)
## Warning: One or more parsing issues, see `problems()` for details

frecuency= 12 meses es igual a 1 año.

start = 2004, año de inicio.

print(spider.ts)
##      Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2004  24  29   6   8  11   3  19  27  31  10   4  14
## 2005  32  25   1   7  21  26   2  12  17  23  28  30
## 2006  13  20   5  22  15  18  33  16   9

Ahora que tenemos una variable orientado a tiempo, podemos tener una gráfica

plot(spider.ts)

Ahora haremos una comparación interanual del aumento de las busquedas acerca del dia del padre

boxplot(spider.ts~cycle(spider.ts))

Entendamos los ciclos de las busquedas sobre el día del padre. Se puede observar que los meses en los que más se busca esto, es en mayo y en junio.

cycle(spider.ts)
##      Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2004   1   2   3   4   5   6   7   8   9  10  11  12
## 2005   1   2   3   4   5   6   7   8   9  10  11  12
## 2006   1   2   3   4   5   6   7   8   9

Descomposición de una serie de tiempo

Componentes estructurales de una serie de tiempo.

Serie observada = Tendencia + efecto estacional + residuo

spider.ts.desc <- decompose(spider.ts)
plot(spider.ts.desc, xlab="Year")

Transformaciones básicas de una serie de tiempo

Estabilización de la varianza

Antes de hacer la estabilizacion de varianza vamos a hacer nuestra a una logaritmica

plot(log(spider.ts))

Eliminación de la tendencia

x <- log(spider.ts)
dif1.x <- diff(x)
plot(dif1.x)

Eliminación de la estabilidad

dif12.dif1.x <- diff(dif1.x, lag=12)
plot(dif12.dif1.x)

Las funciones de autocovarianza y autocorrelaciones

Transformamos la serie del consumo de gasolina de manera que un modelo estacionario sea apropiado para la serie transformada. El siguiente código se puede utilizar para representar el correlograma de la serie. El correlograma es una representación gráfica de las autocorrelaciones ρ(k) , es decir, las correlaciones entre xt y xt+k en función de k

y = dif12.dif1.x 
acf(y)

Siempre se tiene que ρ(0)=1 . Las líneas discontinuas representan las bandas de confianza de ρ(k) de nivel 95% bajo la hipótesis de que la serie es un ruido blanco (incorrelada). En el ejemplo las autocorrelaciones más significativas son las correlaciones entre la observación de un mes y la del mes siguiente, y la observación de un mes con la del mismo mes del año siguiente.

Connclusión

En conclusion podemos ver como es que con el paso de los años la busqueda de spiderman fue creciendo poco a poco a comparacion del 2004 donde las busquedas eran pocas.