ANALISIS DE SERIES DE TIEMPO

Analisis básico de series de tiempo

Para este ejemplo utilizaremos datos de las busquedas acerca del dia del padre en Google, desde 2004 hasta la actualidad.

library(readr)
padre <- read_csv("Dia del padre.csv", show_col_types = FALSE)

Grafiquemos los datos

plot(padre)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introduced by coercion

Para tratar este vector numérico como serie de tiempo, utilizaremos el comando ts (time-series objects)

padre.ts <- ts(padre, start=c(2004,1), frequency = 12)

frecuency= 12 meses es igual a 1 año.

start = 2004, año de inicio.

print(padre.ts)
##      Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2004   1   2   1  24  16   1   1   3   1   1   1   1
## 2005   1   2   3  27  13   3   1   2   1   1   1   2
## 2006   1   1   1  22  10   2   1   1   1   1   1   1
## 2007   1   1   3  15  11   1   2   1   1   1   1   1
## 2008   1   3   3  22  16   1   1   1   1   1   1   1
## 2009   1   1   3  20  14   1   1   1   1   1   1   1
## 2010   1   1   3  20  12   3   1   3   1   1   2   1
## 2011   1   1   3  22  17   3   9   9   1   1   1   1
## 2012   1   3   3  24  18   3   3   3   1   1   1   1
## 2013   1   3   3  27  19   3   3   3   1   1   1   1
## 2014   1   3   3  29  21   3   3   3   1   1   1   1
## 2015   1   3   3   4  30   9   3   3   1   1   1   1
## 2016   1   3   3  31  28   3   3   3   1   1   1   1
## 2017   1   3   3   6  26   3   3   3   1   1   1   1
## 2018   1   3   3   6  23   3   3   3   1   1   1   1
## 2019   1   3   3   7  25   3   3   1   1   1   1   3
## 2020   1   3   3   7  32   9   3   3   1   1   1   1
## 2021   3   9   3   8   5   9   3   3   3

Ahora que tenemos una variable orientado a tiempo, podemos tener una gráfica

plot(padre.ts)

Ahora haremos una comparación interanual del aumento de las busquedas acerca del dia del padre

boxplot(padre.ts~cycle(padre.ts))

Entendamos los ciclos de las busquedas sobre el día del padre. Se puede observar que los meses en los que más se busca esto, es en mayo y en junio.

cycle(padre.ts)
##      Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2004   1   2   3   4   5   6   7   8   9  10  11  12
## 2005   1   2   3   4   5   6   7   8   9  10  11  12
## 2006   1   2   3   4   5   6   7   8   9  10  11  12
## 2007   1   2   3   4   5   6   7   8   9  10  11  12
## 2008   1   2   3   4   5   6   7   8   9  10  11  12
## 2009   1   2   3   4   5   6   7   8   9  10  11  12
## 2010   1   2   3   4   5   6   7   8   9  10  11  12
## 2011   1   2   3   4   5   6   7   8   9  10  11  12
## 2012   1   2   3   4   5   6   7   8   9  10  11  12
## 2013   1   2   3   4   5   6   7   8   9  10  11  12
## 2014   1   2   3   4   5   6   7   8   9  10  11  12
## 2015   1   2   3   4   5   6   7   8   9  10  11  12
## 2016   1   2   3   4   5   6   7   8   9  10  11  12
## 2017   1   2   3   4   5   6   7   8   9  10  11  12
## 2018   1   2   3   4   5   6   7   8   9  10  11  12
## 2019   1   2   3   4   5   6   7   8   9  10  11  12
## 2020   1   2   3   4   5   6   7   8   9  10  11  12
## 2021   1   2   3   4   5   6   7   8   9

Descomposición de una serie de tiempo

Componentes estructurales de una serie de tiempo.

Serie observada = Tendencia + efecto estacional + residuo

padre.ts.desc <- decompose(padre.ts)
plot(padre.ts.desc, xlab="Year")

Transformaciones básicas de una serie de tiempo

Estabilización de la varianza

Antes de hacer la estabilizacion de varianza vamos a hacer nuestra a una logaritmica

plot(log(padre.ts))

Eliminación de la tendencia

x <- log(padre.ts)
dif1.x <- diff(x)
plot(dif1.x)

Eliminación de la estabilidad

dif12.dif1.x <- diff(dif1.x, lag=12)
plot(dif12.dif1.x)

Las funciones de autocovarianza y autocorrelaciones

Transformamos la serie del consumo de gasolina de manera que un modelo estacionario sea apropiado para la serie transformada. El siguiente código se puede utilizar para representar el correlograma de la serie. El correlograma es una representación gráfica de las autocorrelaciones ρ(k) , es decir, las correlaciones entre xt y xt+k en función de k

y = dif12.dif1.x 
acf(y)

Siempre se tiene que ρ(0)=1 . Las líneas discontinuas representan las bandas de confianza de ρ(k) de nivel 95% bajo la hipótesis de que la serie es un ruido blanco (incorrelada). En el ejemplo las autocorrelaciones más significativas son las correlaciones entre la observación de un mes y la del mes siguiente, y la observación de un mes con la del mismo mes del año siguiente.

Connclusión

Después de observar como se comportan los ciclos de las busquedas su puede concluir parcialmente que las busquedas en el año 2004 eran pocas, pero conforme pasa el tiempo fueron aumentando poco a poco estas.