AI8UC1_10

Oscar Roman

13/10/2021

Analisis de series de tiempo.

Análisis básico de series de tiempo utilizando Google Trends como fuente.

Busquedas de ‘Aguinaldo’ en México desde 2004.

Para esta asignación usaremos datos de las busquedas de ‘Aguinaldo’ en méxico desde 2004 hasta 2021.

library(readr)
setwd("~/ESTADISTICA")
ag = scan("aguinaldo.csv")

Grafiquemos los datos

plot(ag)

Para tratar este vector numérico como una serie de timepo, utilizaremos el comando ts (time-series objects)

Le indicamos que los datos empiezan en 2004, en el mes 1 (Enero), y establecemos que la frecuencia en la que se repite uno de los años es 12, por lo tanto, cada 12 datos o 12 meses será un año y este será nuestro ciclo.

ag.ts <- ts(ag, start = c (2004,1), frequency = 12)

frequency = 12 meses en un año (un ciclo) start = inicio enero de 2004

De esta forma, ahora se pueden observar las cantidades de busquedas de aguinaldo per cápita organizados mensualmente por cada año.

print(ag.ts)
##      Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2004   3   5   6   1   2   4   2   1   1   2  21  31
## 2005   3   1   1   1   2   1   1   1   3   6  11  38
## 2006   4   2   3   2   1   3   3   3   1   3   8  35
## 2007   6   4   3   1   2   2   2   1   3   5  11  41
## 2008   3   2   1   2   4   2   2   2   3   4  11  49
## 2009   3   4   3   4   2   2   3   1   3   4  12  47
## 2010   4   3   4   2   4   3   2   3   2   4  14  51
## 2011   5   3   4   2   2   2   2   2   3   4  33  45
## 2012   8   9   6   2   3   2   3   3   4   7  24  48
## 2013   7   5   3   3   3   2   2   3   3   5  22  51
## 2014   7   5   4   2   3   2   3   3   4   8  24  68
## 2015   6   4   3   4   3   3   3   3   4   8  26  76
## 2016   5   3   3   2   3   3   2   3   4   7  27  73
## 2017   6   3   3   3   3   3   4   4   4   9  33  91
## 2018   6   3   4   4   4   5   4   5   6  19  51  96
## 2019   7   4   5   4   4   4   4   5   6  14  61 111
## 2020   8   4   4   5   4   5   3   4   6  21  56  81
## 2021   7   4   4   4   5   4   4   5   8  11

Ahora que tenemos una variable que es un objeto orientado a tiempo, podemos tener una gráfica en la cual se entienda la periodicidad de los aumentos de las busquedas de aguinaldo per capita.

Ya con los datos bien organizados podemos interpretar de una forma más sencilla que existe un patrón, por ejemplo: se observa que las busquedas de aguinaldo se concentran en los ultimos 3 meses, octubre, noviembre y diciembre, siendo diciembre el mes en el que se busca más acerca del aguinaldo.

plot(ag.ts)

Ahora haremos una comparacion interanual de las busquedas de Aguinaldo.

Construimos graficos de caja y bigotes ciclando nuestro objeto, tenemos todos los datos para cada més agrupados y analizados, por lo tanto se nos muestra el sumario estadístico de manera gráfica.

Y así podemos concluir que cada año existe el mismo patrón de busqueda, se comienza a buscar en Octubre, pero alcanza la mayor cantidad de busquedas en el mes de Diciembre, ya que el aguinaldo es pagado en diciembre.

boxplot(ag.ts ~ cycle(ag.ts))

Entendamos los ciclos del comportamiento de las busquedas de Black Friday per capita

Con esta tabla podemos entender los gráficos de caja y bigotes, los numeros enteros representan a los meses.

cycle(ag.ts)
##      Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2004   1   2   3   4   5   6   7   8   9  10  11  12
## 2005   1   2   3   4   5   6   7   8   9  10  11  12
## 2006   1   2   3   4   5   6   7   8   9  10  11  12
## 2007   1   2   3   4   5   6   7   8   9  10  11  12
## 2008   1   2   3   4   5   6   7   8   9  10  11  12
## 2009   1   2   3   4   5   6   7   8   9  10  11  12
## 2010   1   2   3   4   5   6   7   8   9  10  11  12
## 2011   1   2   3   4   5   6   7   8   9  10  11  12
## 2012   1   2   3   4   5   6   7   8   9  10  11  12
## 2013   1   2   3   4   5   6   7   8   9  10  11  12
## 2014   1   2   3   4   5   6   7   8   9  10  11  12
## 2015   1   2   3   4   5   6   7   8   9  10  11  12
## 2016   1   2   3   4   5   6   7   8   9  10  11  12
## 2017   1   2   3   4   5   6   7   8   9  10  11  12
## 2018   1   2   3   4   5   6   7   8   9  10  11  12
## 2019   1   2   3   4   5   6   7   8   9  10  11  12
## 2020   1   2   3   4   5   6   7   8   9  10  11  12
## 2021   1   2   3   4   5   6   7   8   9  10

DESCOMPOSICION DE UNA SERIE DE TIEMPO

Componentes de una serie de tiempo:

Serie observada = Tendencia + Efecto estacional + Residuos

ag.ts.desc <- decompose(ag.ts)
plot(ag.ts.desc, xlab="Year")

TRANSFORMACIONES BASICAS DE UNA SERIE DE TIMEPO

Estabilizacion de la varianza

Antes de hacer la estabilizacion de la varianza, transformaremos nuestra seria a una logaritmica

plot(log(ag.ts))

Eliminacion de la tendencia

x <- log(ag.ts)
dif1.x <- diff(x)
plot(dif1.x)

Eliminacion de la estacionalidad

dif12.dif1.x <- diff(dif1.x, lag = 12)
plot(dif12.dif1.x)

Funciones de autocovarianza y autocorrelaciones

Transformamos la serie del consumo de gasolina de manera que un modelo estacionario sea apropiado para la serie transformada. El siguiente código se puede utilizar para representar el correlograma de la serie. El correlograma es una representación gráfica de las autocorrelaciones ρ(k) , es decir, las correlaciones entre xt y xt+k en función de k

y = dif12.dif1.x
acf(y)

Conclusion

Para alguien familiarizado con el concepto de aguinaldo, es facil deducir que en los meses donde se concentrarán más las busquedas de esta palabra serán Noviembre y Diciembre, acercandose a las fechas de entregas de aguinaldo. Pero estas herramientas estadísticas también me ayudaron a concluir que a lo largo del tiempo la tendencia a buscar aguinaldo en Google iba en aumento, con excepcion del 2020. Este aumento podría ser causado por las dudas que tienen las personas acerca del aguinaldo y tomando en cuenta que a dia de hoy ya es muy popular el uso de internet en comparación con los años pasados.