Proyecto final

En este trabajo, realizaré un análisis gráfico de las Series Temporales , con la ayuda de: Gráficos de línea y Boxplot. Por lo pronto respondamos a la pregunta ¿Qué es una Serie de Tiempo?

Definición

Una serie de tiempo, es un conjunto de datos registrados durante un período diario, semanal, mensual o anual. Formalmente, una serie de tiempo es un conjunto de observaciones \(y_1,y_2,...,y_n\) de una variable Y, registradas o medidas en los tiempos: 1, 2, …, n .

Se denota como \(Y_t\) o \(Y(t)\).

Objetivo

Su objetivo es pronosticar, cantidades a futuro basándose en el pasado. Generando modelos estadísticos.

Enfoques para el análisis de las Series de Tiempo

Enfoque por Descomposición:

Parte sistemática + Parte aleatoria

  • Aditivo: \[ Z_t= T_t + C_t+ E_t + A_t \]

  • Multiplicativo: \[Z_t= T_t * C_t* E_t* A_t\]

  • Mixto: \[ Z_t= T_t * C_t* E_t + A_t \]

Enfoque de Dominio del tiempo:

Pasado inmediato + Variable

  • Procesos de Media Móvil (MA(q)) \[ Z_t= \delta+ a_t - \theta_1* a_{t-1} - \theta_2* a_{t-2} - ... - \theta_q* a_{t-q}\]
  • Autoregresivos: AR (p) \[ Z_t= \delta+ \varphi_1* Z_{t-1}+ \varphi_2* Z_{t-2} + ... + \varphi_p* Z_{t-p} + a_t\]

Enfoque de Dominio de Frecuencias:

  • Periodograma de Schuter:

\[I(W) = (a(w))^2 + (b(w))^2\] Donde: \[a(w)=\frac{1}{n}\sum{Y_t*sen(wt)} \] \[b(w)=\frac{1}{n}\sum{Y_t*cos(wt)} \] W= Frecuencia regular, \(w \quad \epsilon\quad (-\pi, \pi)\)

Cita

“Una serie tiempo es una secuencia de observaciones, medidos en determinados momentos del tiempo, ordenados cronológicamente y, espaciados entre sí de manera uniforme, así los datos usualmente son dependientes entre sí”.

J Villavicencio

Ejemplo:

A continuación presentaré el análisis exploratorio de la serie Producción de aceros en el Perú, desde el año 1991 hasta el año 2009.

Librería a emplear

library(haven)

Lectura de datos

data <- read_sav("aceroPERU.sav")
a <- data.frame(data);
knitr::kable(head(a), col.names = c("País", "Producción","Año","Mes","Fecha"), 
             caption = "Tabla N°1: Producción de Acero en el Perú", align = 'c', format= "html")
Tabla N°1: Producción de Acero en el Perú
País Producción Año Mes Fecha
Peru 30 1991 1 JAN 1991
Peru 13 1991 2 FEB 1991
Peru 30 1991 3 MAR 1991
Peru 35 1991 4 APR 1991
Peru 36 1991 5 MAY 1991
Peru 33 1991 6 JUN 1991

Conversión de los datos

La función ts() convierte un objeto a serie temporal. En este caso, de data.frame() a serie de tiempo

a.ts <- ts(a$Producción,start = c(1991,1), frequency = 12 );a.ts
##      Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 1991  30  13  30  35  36  33  43  38  34  44  47  46
## 1992  39  21  20  30  35  17  17  32  41  25  31  33
## 1993  35  28  37   8  48  40  33  41  32  40  41  33
## 1994  41  44  50  45  50  46  48  37  39  28  29  30
## 1995  47  44  50  49  44  35  47  44  30  41  41  41
## 1996  46  40  44  39  55  50  56  54  51  51  45  49
## 1997  50  54  58  36  39  47  58  59  57  56  42  48
## 1998  55  53  59  59  60  48  48  60  52  46  45  44
## 1999  42  46  58  60  52  44  38  54  42  41  40  47
## 2000  64  62  67  68  66  55  54  63  61  59  66  67
## 2001  67  60  69  62  69  63  56  62  65  64  58  62
## 2002  49  48  48  54  55  57  49  37  38  59  60  59
## 2003  52  47  57  50  42  57  62  64  61  60  64  53
## 2004  58  63  72  64  65  66  64  61  66  34  47  66
## 2005  69  58  48  57  70  65  67  70  68  71  68  79
## 2006  77  67  75  73  74  74  75  74  73  74  78  81
## 2007  76  68  78  62  43  45  66  74  90  87  97  96
## 2008  97  87  95  92  99  97  98 106 104 101  82   0
## 2009  39  90  47  45  45  45  58  72  74  75  73  57

Gráfico de línea

Con la función plot() podremos visualizar el gráfico de la serie temporal.

plot(a.ts, ylab="Producción de aceros",xlab="Años", 
     main="Gráfico de Producción de aceros en el Perú")

Evaluaremos las características de la Serie Temporal

  1. Tendencia: Creciente
  2. Estacionalidad: No se observa
  3. Tipo de modelo: multiplicativo
  4. Ciclos: No se observa

Gráfico de cajas

boxplot(a.ts ~ cycle(a.ts), xlab = "Meses", ylab = "Producción")

  1. Estacionariedad

    1.1 Por nivel: Sí presenta

    1.2 Por variabilidad: Sí presenta

  2. Presencia de outliers: Sí presenta

Descomposición

Tendencia

Se presenta la Tendencia de la serie. Eliminando la influencia de las demás componentes

a.decomp <- decompose(a.ts, type = "mult")
Tena <- a.decomp$trend
plot(Tena, main= "Tendencia de la Producción de aceros",xlab="Años", ylab=" ")

Estacionalidad

Se presenta la Estacionalidad de la serie. Eliminando la influencia de las demás componentes

a.decomp <- decompose(a.ts, type = "mult")
Estaa <- a.decomp$seasonal
plot(Estaa, main= "Estacionalidad de la Producción de aceros", xlab="Años", ylab=" ")

Aleatoriedad

Se presenta la Aleatoriedad de la serie. Eliminando la influencia de las demás componentes

a.decomp <- decompose(a.ts, type = "mult")
Aleaa <- a.decomp$random
plot(Aleaa, main= "Aleatoriedad de la Producción de aceros", xlab="Años", ylab=" ")