Series de Tiempo Univariadas

Kleider Stiven Vásquez Gómez

05/02/2022

Detección de Outliers

1. Explorar las funciones locate.outliers() y find.consecutive.outliers(x, type) de la librería tsoutliers sobre el modelo que se encontró más adecuado para modelar la serie que corresponde a la producción anual de tabaco en los EU (desde 1871 hasta 1985 en millones de libras).

Nota: En caso de que no se detecte ningún outlier, considere alguna otra de las otras series.

Inicialmente, se cargan y leen los paquetes necesarios para el desarrollo de dicho trabajo. También se procede a hacer lectura de la base de datos.

Luego, por medio del método EACF se estima un modelo ARIMA

## AR/MA
##   0 1 2 3 4 5 6 7 8 9 10 11 12 13
## 0 x x x x x x x x x x x  x  x  x 
## 1 x o o o o o o o o o o  o  o  o 
## 2 x o o o o o o o o o o  o  o  o 
## 3 x x o o o o o o o o o  o  o  o 
## 4 x o o o o o o o o o o  o  o  o 
## 5 x x x x o o o o o o o  o  o  o 
## 6 x x x x o o o o o o o  o  o  o 
## 7 x o x o o o x o o o o  o  o  o

Con los resultados obtenidos del método EACF se observa que un modelo ARIMA(0,0,1) puede ajustarse a los datos de la serie:

## Series: residual 
## ARIMA(0,0,1) with non-zero mean 
## 
## Coefficients:
##           ma1     mean
##       -0.0186   0.0162
## s.e.   0.1066  19.9321
## 
## sigma^2 estimated as 42078:  log likelihood=-673.25
## AIC=1352.5   AICc=1352.75   BIC=1360.31

a) ¿Qué tipo de outliers: AO, IO, LC, TS detecta en el conjunto de datos analizado?

Se detectan ciertos outliers en el modelo:

Tabla 1: Tipos de outliers
type ind coefhat tstat
AO 99 -639.4178 -3.915234
TC 63 462.3522 4.016336

Por tanto, se logran apreciar 2 tipos de outliers detectados en este conjunto de datos. Se detectó un individuo 99 que es un outlier de tipo AO, es decir, un Outlier Aditivo, y así mismo se observa que existe otro individuo 63 que corresponde a un outlier de tipo TC “Cambio Temporal”.

b) Explique el efecto sobre la serie de cada uno de los tipos de outliers que se detecta en la misma.

Se puede apreciar de la gráfica que existe 1 año (1933) donde la producción anual de tabaco en los EU presenta un outlier tipo TC (Cambio Temporal) que representa a la observación 63. Este tipo de outlier “TC” es similar a los valores atípicos de cambio de nivel, sin embargo su efecto se reduce exponencialmente en las siguientes observaciones, es por esta razón que para la observación 63 se tiene un pico que tardará algunos períodos en desaparecer, es decir, es un efecto temporal que disminuye exponencialmente a través del tiempo.

Y también, gráficamente se evidencia la existencia de 1 año (1969), en dicha serie temporal, donde hay un outlier tipo AO (Outlier Aditivo), que representa a la observación 99. Es decir, para dicha observación se tiene un valor inesperadamente alto o bajo, el cual se produce para una única observación. Así, dicho valor no afecta el comportamiento de las demás observaciones, por lo cual se observa como un simple salto. No se evidencia presencia de parches de valores atípicos aditivos ya que no existen en esta serie valores atípicos aditivos consecutivos.

Bibliografía

  • Abraham y Lodolter. (2005). Statistical Methods for Forecasting.

  • Box y Jenkins. (1986). Time Series Analysis: Forecasting and Control.

  • Breitung, Brüggemann, Herwartz, Krätzig, Lütkepohl, Terärsvirta, Tschernig. (2004). Applied Time Series Econometrics, Editado por Lütkepohl y Krätzig.

  • Brockwell y Davis. (1996). Introduction to Time Series and Forecasting.

  • Castaño, E. (s.f.). Análisis de Series de Tiempo Lineales.

  • Enders, W. (2004). Applied Econometric Time Series.

  • Gómez, C. (2021). Series de Tiempo Univariadas. Material de clase STU presencial: semestre 2021-II.

  • Guerrero, V. (2003). Análisis Estadístico de Series de Tiempo Económicas.

  • Liu (2005). Time Series Analysis and Forecasting.

  • Maddala y Kim. (2000). Unit roots, Cointegration and Structural Changes.

  • Pascual, Romo y Ruiz. (2004). Bootstrap prediction intervals for power-transformed time series.

  • Wei, W. (2005). Time Series Analysis: Univariate and Multivariate Methods.