Primer Ejemplo

para este primer ejemplo usaremos datos del consumo de combustible en españa de los años 1966 hasta 1977

gas = scan("http://verso.mat.uam.es/~joser.berrendero/datos/gas6677.dat")
plot(gas)

Para tratar este vector numerico como una serie de tiempo, utilizaremos el comando ts (time-series objects)

gas.ts<-ts(gas,start=c(1996,1),frequency=12)

frequency = 12 meses es un anio (un ciclo ) start = inicio enero de 1966

print(gas.ts)
##          Jan     Feb     Mar     Apr     May     Jun     Jul     Aug     Sep
## 1996  92.718  91.380 111.643 118.888 119.432 127.796 158.943 178.013 143.385
## 1997 113.661 108.224 142.256 129.835 150.735 149.554 185.792 201.758 166.565
## 1998 135.951 126.615 146.647 165.822 163.365 169.294 215.538 233.427 184.402
## 1999 154.844 143.552 171.573 188.322 192.756 195.296 252.288 268.379 218.810
## 2000 179.759 173.821 211.387 210.551 218.371 232.057 294.173 312.700 251.891
## 2001 193.916 188.375 236.187 249.037 235.957 258.980 321.085 334.562 276.932
## 2002 225.010 225.742 265.159 271.986 290.953 285.108 362.687 386.347 314.205
## 2003 268.578 256.063 312.041 326.741 315.157 353.016 403.662 451.098 356.811
## 2004 289.186 296.881 302.589 334.091 325.790 337.782 423.297 454.172 353.727
## 2005 317.760 298.188 363.429 350.203 372.149 371.877 472.458 485.517 406.223
## 2006 352.200 334.938 372.891 397.388 385.657 416.961 492.480 512.209 411.514
## 2007 363.367 342.979 384.936 421.718 402.877 427.615 538.254 528.007        
##          Oct     Nov     Dec
## 1996 127.179 114.403 124.900
## 1997 148.048 131.581 141.315
## 1998 178.432 155.179 163.355
## 1999 203.545 172.148 198.381
## 2000 235.560 202.876 224.383
## 2001 258.269 233.532 251.755
## 2002 292.124 261.740 291.810
## 2003 352.566 305.580 410.614
## 2004 353.413 315.272 341.902
## 2005 377.262 329.794 384.350
## 2006 392.380 369.671 400.243
## 2007

Ahora que tenemos una variable que es un objeto orientado a tiempo, podemos tener una grafica en la cual se entienda la periodicidad de los aumentos del consumo de gas per capita

plot(gas.ts)

Ahora haremos una comparacion interanual del aumento del consumo de combustible

boxplot (gas.ts ~ cycle(gas.ts))

Entendamos los ciclos del comportamiento de consumo de gasolina per capital

cycle(gas.ts)
##      Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 1996   1   2   3   4   5   6   7   8   9  10  11  12
## 1997   1   2   3   4   5   6   7   8   9  10  11  12
## 1998   1   2   3   4   5   6   7   8   9  10  11  12
## 1999   1   2   3   4   5   6   7   8   9  10  11  12
## 2000   1   2   3   4   5   6   7   8   9  10  11  12
## 2001   1   2   3   4   5   6   7   8   9  10  11  12
## 2002   1   2   3   4   5   6   7   8   9  10  11  12
## 2003   1   2   3   4   5   6   7   8   9  10  11  12
## 2004   1   2   3   4   5   6   7   8   9  10  11  12
## 2005   1   2   3   4   5   6   7   8   9  10  11  12
## 2006   1   2   3   4   5   6   7   8   9  10  11  12
## 2007   1   2   3   4   5   6   7   8

Descomposicion de una serie de tiempo

serie observada= tendencias + Efectos Estacional + residuos

gas.ts.desc<- decompose(gas.ts)
plot(gas.ts.desc, xlab="YEAR")

TRANSFORMACIONES BASICAS DE UNA SERIE DE TIEMPO

Estabilizacion de la Varianza

Antes Transformacion

plot(log(gas.ts))

Eliminacion de Tendencia

x<- log(gas.ts)
dif1.x<- diff(x)
plot(dif1.x)

## Eliminar Estacional Quitar para entender como varian los datos con respecto al tiempo

dif12.dif1.x<- diff(dif1.x, log=12)
plot(dif12.dif1.x)

##Las funciones de autocovarianza y autocorrelaciones

Transformamos la serie del consumo de gasolina de manera que un modelo estacionario sea apropiado para la serie transformada. El siguiente código se puede utilizar para representar el correlograma de la serie. El correlograma es una representación gráfica de las autocorrelaciones ρ(k) , es decir, las correlaciones entre xt y xt+k en función de k

y = dif12.dif1.x 
acf(y)

Siempre se tiene que ρ(0)=1 . Las líneas discontinuas representan las bandas de confianza de ρ(k) de nivel 95% bajo la hipótesis de que la serie es un ruido blanco (incorrelada). En el ejemplo las autocorrelaciones más significativas son las correlaciones entre la observación de un mes y la del mes siguiente, y la observación de un mes con la del mismo mes del año siguiente.

#Analisis de serie de tiempo utilizando datos de google trends En este caso usare datos de busquedas de laa palabras dia de muertos desde 2004

setwd("~/ESTADISTICA")
library(readr)
diaMuertos <- read_csv("diaMuertos.csv")
## Rows: 213 Columns: 1
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (1): 2
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(diaMuertos)

Grafiquemos los datos

plot(diaMuertos)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introduced by coercion

Para tratar este vector numerico como una serie de tiempo, utilizaremos el comando ts (time-series objects)

diaMuertos.ts <- ts(diaMuertos, start = c (2004,1), frequency = 12     )

frequency = 12 meses es un anio (un ciclo ) start = inicio enero de 1966

print(diaMuertos.ts)
##      Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2004   2   2   2   2   2   2   2  27   3  15  11  11
## 2005   2   2   2   2   2   2  11  17  30  13   2   2
## 2006   2   2   2   2   2   2   2  17  29  12   2   2
## 2007   2   2   2   2   2   2   2  14  28  10   2   2
## 2008   2   2   2   2   2   2   2  11  26   8   2   2
## 2009   2   2   2   2   2   2   2  11  25   6  11   2
## 2010   2   2   2   2   2   2   2  11  22   8   2   2
## 2011   2   2   2   2   2   2   2  11  18  10  14  17
## 2012  11   2   2   2   2   1   2  11  20   8   2   2
## 2013  11   2   2   2   2   2   2  11  19   7   2  11
## 2014  11   2   2   2   2   2   2  14  21   5   2   2
## 2015  11   2   2   2   2   2   2  14  25   6   2   2
## 2016   2   2   2   2   2   2   2  17  23   8   2   2
## 2017   2   2   2   2   2   2   2  14  20  10   2   2
## 2018   2   2   2   2   2   2  11  24  22   7   2   2
## 2019   2   2   2   2   2   2  11  24  25   9   2   2
## 2020   2   2   2   2   2   2   2  14  16   6   2   2
## 2021   2   2   2   2   2   2   2  17   4

Ahora que tenemos una variable que es un objeto orientado a tiempo, podemos tener una grafica en la cual se entienda la periodicidad de los aumentos de la busqueda de la palabra dia de muertos

plot(diaMuertos.ts)

Ahora haremos una comparacion interanual del aumento de la busqueda de la palabra

boxplot (diaMuertos.ts ~ cycle(diaMuertos.ts))

Entendamos los ciclos del comportamiento de consumo de gasolina per capita

cycle(diaMuertos.ts)
##      Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2004   1   2   3   4   5   6   7   8   9  10  11  12
## 2005   1   2   3   4   5   6   7   8   9  10  11  12
## 2006   1   2   3   4   5   6   7   8   9  10  11  12
## 2007   1   2   3   4   5   6   7   8   9  10  11  12
## 2008   1   2   3   4   5   6   7   8   9  10  11  12
## 2009   1   2   3   4   5   6   7   8   9  10  11  12
## 2010   1   2   3   4   5   6   7   8   9  10  11  12
## 2011   1   2   3   4   5   6   7   8   9  10  11  12
## 2012   1   2   3   4   5   6   7   8   9  10  11  12
## 2013   1   2   3   4   5   6   7   8   9  10  11  12
## 2014   1   2   3   4   5   6   7   8   9  10  11  12
## 2015   1   2   3   4   5   6   7   8   9  10  11  12
## 2016   1   2   3   4   5   6   7   8   9  10  11  12
## 2017   1   2   3   4   5   6   7   8   9  10  11  12
## 2018   1   2   3   4   5   6   7   8   9  10  11  12
## 2019   1   2   3   4   5   6   7   8   9  10  11  12
## 2020   1   2   3   4   5   6   7   8   9  10  11  12
## 2021   1   2   3   4   5   6   7   8   9

#DESCOMPOSICION DE UNA SERIE DE TIEMPO Componentes estructurales de una serie de tiempo:

Serie observada = Tendencia + Efecto Estacional + Residuos

diaMuertos.ts.desc <- decompose(diaMuertos.ts)
plot(diaMuertos.ts.desc, xlab = "Year")

#TRANSFORMACIONES BASICAS DE UNA SERIE DE TIEMPO

plot(log(diaMuertos.ts))

Eliminacion de la tendencia

Una forma sencilla de eliminar una tendencia aproximadamente lineal es diferenciar la serie, es decir, considerar la serie de diferencias entre una observación y la anterior en lugar de la serie original. Si xt es una serie contenida en x, para calcular \[ ∇xt=xt−xt−1 \]

x <- log(diaMuertos.ts)
dif1.x <- diff(x)
plot(dif1.x)

#Eliminacion de la estacionalidad Para eliminar la estacionalidad de una serie mensual se pueden tomar diferencias estacionales de orden 12. Si xt es la serie que queremos desestacionalizar, se trata de calcular

\[ ∇12xt=xt−xt−12 \]

dif12.dif1.x <- diff(dif1.x, lag=12)
plot(dif12.dif1.x)

#Las funciones de autocovarianza y autocorrelaciones Transformamos la serie del consumo de gasolina de manera que un modelo estacionario sea apropiado para la serie transformada. El siguiente código se puede utilizar para representar el correlograma de la serie. El correlograma es una representación gráfica de las autocorrelaciones ρ(k) , es decir, las correlaciones entre xt y xt+k en función de k

y = dif12.dif1.x 
acf(y)

###¿Que es una serie de tiempo? Por serie de tiempo nos referimos a datos estadísticos que se recopilan, observan o registran en intervalos de tiempo regulares (diario, semanal, semestral, anual, entre otros).

Link: http://www.estadistica.mat.uson.mx/Material/seriesdetiempo.pdf

###¿que es un ciclo? Un ciclo es una fase o estado que se repite una y otra vez de forma muy similar

###¿cómo se comportan los patrones de consumo? Se comporta de forma regular ya que suben y bajan de forma regular cada año

###¿porque los valores se ciclan de esa forma? Los valores se ciclan de esa forma porque depende del consumo que le den al gas en españa ya que hay muchos factores que influyen como las vaccaciones que se toman lo que provoca que se usan menos los carros o el hecho de que sus calles son mucho mejores para andar sobre ellas y aparte españa cuenta con mejor servicio publico

###¿sería este mismo comportamiento en méxico?

No lo creo simplemente por el hecho de que son paises distintos con desarrollas distintos, un hecho que se podria suponer es que en mexico el tener carro ayuda mas y se puede suponer que es mas necesario ya que te ayuda ir hacia donde ocupas ir de manera mas rapida, por todo esto yo creo que en mexico el comportamiento seria mas lineal incrementando poco a poco cada año