Series de Tiempo

D. S. Fernández del Viso
20190925

Introducción

Serie de Tiempo

Una variable que se mide en una secuencia en el tiempo, a un intervalo fijo (intervalo de muestreo), constituye lo que se conoce como datos en una serie de tiempo.

Ejemplo de datos en una serie de tiempo

Número de pasajeros internacionales (en miles) mensuales, en una aerolínea

     Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
1949 112 118 132 129 121 135 148 148 136 119 104 118
1950 115 126 141 135 125 149 170 170 158 133 114 140
1951 145 150 178 163 172 178 199 199 184 162 146 166
1952 171 180 193 181 183 218 230 242 209 191 172 194
1953 196 196 236 235 229 243 264 272 237 211 180 201
1954 204 188 235 227 234 264 302 293 259 229 203 229
1955 242 233 267 269 270 315 364 347 312 274 237 278
1956 284 277 317 313 318 374 413 405 355 306 271 306
1957 315 301 356 348 355 422 465 467 404 347 305 336
1958 340 318 362 348 363 435 491 505 404 359 310 337
1959 360 342 406 396 420 472 548 559 463 407 362 405
1960 417 391 419 461 472 535 622 606 508 461 390 432

Gráfica de serie de tiempo

plot of chunk unnamed-chunk-2

Análisis de series de tiempo con R

R posee una buena cantidad de procedimientos para analizar series de tiempo, incluyendo:

  • formato de serie de tiempo para los datos, usando ts.
  • descomposición estacional de los datos usando la función stl.
  • modelos exponenciales y ARIMA.
  • predicciones usando el paquete forecast.

Formato ts en R

En el ejemplo anterior, el archivo original AirPassengers, está en un formato de serie de tiempo:

class(AirPassengers)
[1] "ts"

Función ts en R

Si tenemos nuestros datos en formato de vector (datos unidimensionales), podemos transformarlos al formato ts, usando la función ts en R.

Los parámetros de ts son:

  • start=c(año, mes)
  • end=c(año, mes)
  • frequency= 1=annual, 4=trimestral, 12=mensual, et c.

Ejemplo de datos para análisis de serie de tiempo

Datos de incidencia semanal de casos de dengue en el área de San Juan, Puerto Rico. El archivo original es una tabla de datos en formato .csv, que cargamos a R usando la función read_csv del paquete readr:

library(readr)
SJdengue <- read_csv("San_Juan_Training_Data.csv")
#variable a llevar a serie de tiempo
names(SJdengue[ ,10])
[1] "total_cases"

Una variable a serie de tiempo

Del archivo SJdengue vamos a tomar los datos de la variable total_cases como el vector a transformar en serie de tiempo:

tsd <- ts(SJdengue$total_cases, start = c(1990, 4), end = c(2009, 4), frequency = 52)
str(tsd)
 Time-Series [1:989] from 1990 to 2009: 4 5 4 3 6 2 4 5 10 6 ...

Gráfica de una serie de tiempo

plot

Para graficar la serie de tiempo de los datos se puede usar la función plot que automáticamente selecciona los ejes:

plot(tsd)

plot of chunk unnamed-chunk-6

Descomposición de serie de tiempo

En la siguiente gráfica podemos observar los componentes estacionales, de tendencia, y residuales de la serie de tiempo.

fit.dengue <- stl(tsd, s.window = "periodic")
plot(fit.dengue)

plot of chunk unnamed-chunk-8

Análisis de la estacionalidad

En la siguiente gráfica podemos observar los patrones estacionales para cada año. Usamos la función seasonplot del paquete forecast.

library(forecast)
seasonplot(tsd, year.labels = TRUE, main = "", type = "l")

plot of chunk unnamed-chunk-10

Predicciones con modelos

Finalmente vamos a ver un ejemplo de predicción, usando modelos de series de tiempo. En este caso usaremos un modelo estacional (stl), automático. Estos modelos se encuentran en el paquete forecast.

pred.dengue <- stl(tsd, s.window = "periodic")
plot(forecast(pred.dengue), xlab = "Año", ylab = "Casos", flty = 2)

plot of chunk unnamed-chunk-12