setwd("~/R")

Series de tiempo

Con frecuencia se realizan observaciones de datos a través del tiempo. Cualquier variable que conste de datos reunidos, registrados u observados sobre incrementos sucesivos de tiempo se denomina serie de tiempo.

Una serie de tiempo es un conjunto de observaciones producidas en determinados momentos durante un periodo, semanal, mensual, trimestral o anual, generalmente a intervalos iguales.

Si bien el comportamiento de cualquier serie de tiempo puede observarse gráficamente, no en todos los casos es posible distinguir las particularidades que cada una puede contener. La experiencia basada en muchos ejemplos se series de tiempo, sin embargo, ha revelado que existen ciertos movimientos o variaciones características que pueden medirse y observarse por separado. Estos movimientos, llamados a menudo componentes, de una serie de tiempo y que se supone son causados por fenómenos distintos.

Para este caso utilizaremos la variables gas extraidos del siguiente link: http://verso.mat.uam.es/~joser.berrendero/datos/gas6677.dat

gas <- scan("http://verso.mat.uam.es/~joser.berrendero/datos/gas6677.dat")
gas.ts <- ts(gas, start= c(1966,1), frequency = 12)
print(gas.ts)
##          Jan     Feb     Mar     Apr     May     Jun     Jul     Aug     Sep
## 1966  92.718  91.380 111.643 118.888 119.432 127.796 158.943 178.013 143.385
## 1967 113.661 108.224 142.256 129.835 150.735 149.554 185.792 201.758 166.565
## 1968 135.951 126.615 146.647 165.822 163.365 169.294 215.538 233.427 184.402
## 1969 154.844 143.552 171.573 188.322 192.756 195.296 252.288 268.379 218.810
## 1970 179.759 173.821 211.387 210.551 218.371 232.057 294.173 312.700 251.891
## 1971 193.916 188.375 236.187 249.037 235.957 258.980 321.085 334.562 276.932
## 1972 225.010 225.742 265.159 271.986 290.953 285.108 362.687 386.347 314.205
## 1973 268.578 256.063 312.041 326.741 315.157 353.016 403.662 451.098 356.811
## 1974 289.186 296.881 302.589 334.091 325.790 337.782 423.297 454.172 353.727
## 1975 317.760 298.188 363.429 350.203 372.149 371.877 472.458 485.517 406.223
## 1976 352.200 334.938 372.891 397.388 385.657 416.961 492.480 512.209 411.514
## 1977 363.367 342.979 384.936 421.718 402.877 427.615 538.254 528.007        
##          Oct     Nov     Dec
## 1966 127.179 114.403 124.900
## 1967 148.048 131.581 141.315
## 1968 178.432 155.179 163.355
## 1969 203.545 172.148 198.381
## 1970 235.560 202.876 224.383
## 1971 258.269 233.532 251.755
## 1972 292.124 261.740 291.810
## 1973 352.566 305.580 410.614
## 1974 353.413 315.272 341.902
## 1975 377.262 329.794 384.350
## 1976 392.380 369.671 400.243
## 1977

Decomposición de una serie

La descomposición de series de tiempo Descomposición de series de tiempo deconstruye una serie de tiempo en varios componentes, cada uno de los cuales representa una de las categorías subyacentes de patrones. Hay dos tipos principales de descomposición, que se describen a continuación. Descomposición de series de tiempo.

La descomposición de series temporales es una actividad fundamental además de frecuente en los análisis de coyuntura económica y, en general, en el estudio de la evolución económica y social de las sociedades. A veces, el objetivo es la obtención de la componente estacional, mientras que, en otras, se desea extraer la tendencia o la denominada ciclo-tendencia, componente que agrupa la tendencia secular y la componente cíclica. Como es conocido, ambas son componentes inidentificables de la serie temporal, en el sentido de que sin restricciones adicionales la descomposición es arbitraria.

La ventaja de una serie temporal reside en que, además de los valores que presenta la variable, se recoge su evolución temporal, aspecto dinámico que también tiene interés práctico. El primer intento de describir y comprender cómo evoluciona una serie temporal consiste en descomponerla en un conjunto de componentes no observables que sean fácilmente identificables y asignables a causas concretas; así, se podrían analizar características como el comportamiento general a largo plazo, la influencia de factores que se repiten periódicamente o el impacto de circunstancias anómalas. Así, se denomina descomposición de series temporales al proceso de identificar y calcular las diversas componentes existentes en una serie así como la forma en que estas se relacionan entre sí.

gas.ts.desc <- decompose(gas.ts)
plot(gas.ts.desc, xlab="Año")

l análisis clásico de las series de tiempo se basa en la suposición de que los valores que toma la variable de observación es la consecuencia de tres componentes, cuya actuación conjunta da como resultado los valores medidos. Los componentes de una sere de tiempo son:

Tendencia Tt Estacionalidad St Componente aleatoria Et

Componentes de una serie temporal

Tendencia

Consiste en la evolución a largo plazo de la serie. Es usual encontrarse con series temporales que presentan un movimiento sostenido en la misma dirección durante un amplio período de tiempo, con independencia de pequeñas oscilaciones al alza o a la baja. La tendencia suele ser representada mediante curvas “suaves”, siendo habitual que se represente mediante funciones lineales, dando lugar a las rectas de tendencia.

Para la determinación de esta componente existen dos enfoques alternativos:

  1. Ajuste de curvas En primer lugar, se puede “ajustar” una curva suave que recoja el perfil de la serie, dando lugar a tendencias lineales, polinómicas, exponenciales, etc. Este planteamiento presenta la ventaja de proporcionar una ecuación analítica que permite extrapolar dicha tendencia a un futuro próximo, proporcionando una primera aproximación a la predicción de los valores de la serie. Por el contrario, la elección de la forma funcional determina drásticamente dicha extrapolación, por lo que una mala elección se traduce directamente en la mala calidad de las predicciones. Dentro de este enfoque, el método más sencillo, y origen de otros más elaborados, consiste en la estimación de una tendencia lineal por el método de mínimos cuadrados, originando la denominada recta de tendencia.
  2. Filtrado de series En segundo lugar, se puede intentar eliminar de la serie las componentes no deseadas, “filtrando” los datos originales, y sin presumir ninguna forma funcional para la tendencia. Dentro de este amplio campo, los filtros más utilizados por su sencillez son los lineales, que presentan buenos resultados cuando se trata de calcular la tendencia o de hacer predicciones a corto plazo. Entre los filtros lineales destacan las medias móviles, los filtros exponenciales.

Componente cíclica

Está formada por fluctuaciones alrededor de la tendencia que se repiten de forma más o menos periódica y de amplitud superior al año. En muchas series es habitual encontrar factores que modifican lentamente los valores de la variable, produciendo alteraciones al alza y a la baja. Un ejemplo típico es el efecto que sobre series económicas presenta el ciclo general de crecimiento y recesión económica.

En la práctica, la distinción entre tendencia y componente cíclica es problemática ya que, en ambos casos, se está involucrando un amplio período de tiempo. Cuando se tienen pocas observaciones es difícil detectar los movimientos oscilatorios, confundiéndose estos con la tendencia. En otros casos, cuando la variable presenta un comportamiento cíclico pronunciado, la observación de pocos años puede ser confundida fácilmente con una tendencia al alza o a la baja. Por ello, algunos autores prefieren no diferenciar ambas componentes, englobando sus efectos en una única denominada ciclo-tendencia.

Componente estacional

Engloba los movimientos oscilatorios alrededor de las componentes de tendencia y cíclica que se repiten de forma periódica y con amplitud inferior al año. Estas variaciones son atribuidas, en su mayor parte, a factores relacionados con las estaciones del año y de ahí su nombre. Todos estos efectos tienen en común la persistencia a lo largo de los años, lo que origina unos altibajos que pueden predecirse con relativa fiabilidad, por lo que incrementan el conocimiento que se tiene del fenómeno estudiado y permiten mejorar de forma apreciable las predicciones de valores futuros.

El interés que presenta esta componente puede ser doble: por un lado, proporciona información sobre el comportamiento a corto plazo de la serie; por otro, se puede plantear su eliminación para analizar mejor la marcha general del fenómeno estudiado. Este último proceso se conoce como desestacionalización.

Para la correcta determinación de esta componente hay que eliminar con anterioridad el efecto de la tendencia. Como este depende en gran medida del esquema de agregación de la serie, existen diferentes métodos según sea multiplicativo o aditivo. En el primer caso, y con la componente tendencial calculada previamente, el cociente entre la serie original y la serie de tendencia proporciona el efecto conjunto de la componente estacional e irregular, obteniéndose los denominados índices de variación estacional brutos (IVEb s). Bajo el supuesto de que la estacionalidad es estable, las diferencias entre IVEb s para el mismo período de distintos años se deberán a la componente irregular. En este caso, promediando dichos IVEb s se obtendría un valor medio que, normalizado, representa el efecto que la componente estacional tiene en cada período del año y que se denominan índices de variación estacional (IVEs). En aquellos períodos en los que el IVE sea superior a la unidad ello indicará que los valores observados son, en media, superiores a los de tendencia, indicando que la componente estacional actúa elevando los valores tendenciales. Por contra, en los períodos en los que el IVE sea inferior a la unidad la componente estacional actuará disminuyendo los valores tendenciales. Para la obtención de la serie desestacionalizada, basta con eliminar la componente estacional, dividiendo cada observación entre su IVE correspondiente.

Cuando el esquema de agregación es aditivo, se introducen ligeros cambios. Restando a los datos originales la componente tendencial se obtiene el efecto conjunto de las componentes estacional e irregular. Para aislar el efecto estacional, igual que en el método anterior, se calculan las medias para cada período. Las diferencias entre estas medias y la media global de la serie serán, por tanto, atribuibles exclusivamente a la componente estacional, constituyendo las denominadas diferencias estacionales. Su interpretación es análoga a la de los IVE solo que centrada en cero. Es decir, en aquellos períodos en los que la diferencia estacional sea positiva la componente estacional actúa, en media, elevando los valores respecto a los de tendencia. Si la diferencia estacional es negativa se producirá el efecto contrario, disminuyendo los valores respecto a la tendencia a causa de la componente estacional.

También es posible abordar el cálculo conjunto de las componentes tendencial y estacional. El filtro lineal conocido como método de Holt-Winters es una variante el alisado exponencial doble de Holt diseñado para realizar predicciones en series con tendencia aproximadamente lineal y con clara influencia de la componente estacional. Dependiendo del esquema de agregación elegido para la tendencia y la componente estacional, se habla del método de Holt-Winters multiplicativo o aditivo. En ambos casos, la componente irregular interviene aditivamente en el modelo.

Componente irregular

También conocida como accidental, errática, aleatoria o residual. Consiste en movimientos irregulares y pasajeros provocados por factores esporádicos e imprevisibles. Son efectos impredecibles que no son asignables a ninguna de las componentes anteriores, por lo que constituyen el residuo que queda cuando se estiman las otras componentes.

Podemos encontrar información práctica aqui:

https://rstudio-pubs-static.s3.amazonaws.com/546278_da6272365edd4444a4e7ccf6b17978fe.html#introduccion

https://rpubs.com/Paigeolga/423647