Proyecto final
En este trabajo, realizaré un análisis gráfico de las Series Temporales , con la ayuda de: Gráficos de línea y Boxplot. Por lo pronto respondamos a la pregunta ¿Qué es una Serie de Tiempo?
Definición
Una serie de tiempo, es un conjunto de datos registrados durante un período diario, semanal, mensual o anual. Formalmente, una serie de tiempo es un conjunto de observaciones \(y_1,y_2,...,y_n\) de una variable Y, registradas o medidas en los tiempos: 1, 2, …, n .
Se denota como \(Y_t\) o \(Y(t)\).
Objetivo
Su objetivo es pronosticar, cantidades a futuro basándose en el pasado. Generando modelos estadísticos.
Enfoques para el análisis de las Series de Tiempo
Enfoque por Descomposición:
Parte sistemática + Parte aleatoria
Aditivo: \[ Z_t= T_t + C_t+ E_t + A_t \]
Multiplicativo: \[Z_t= T_t * C_t* E_t* A_t\]
Mixto: \[ Z_t= T_t * C_t* E_t + A_t \]
Enfoque de Dominio del tiempo:
Pasado inmediato + Variable
- Procesos de Media Móvil (MA(q)) \[ Z_t= \delta+ a_t - \theta_1* a_{t-1} - \theta_2* a_{t-2} - ... - \theta_q* a_{t-q}\]
- Autoregresivos: AR (p) \[ Z_t= \delta+ \varphi_1* Z_{t-1}+ \varphi_2* Z_{t-2} + ... + \varphi_p* Z_{t-p} + a_t\]
Enfoque de Dominio de Frecuencias:
- Periodograma de Schuter:
\[I(W) = (a(w))^2 + (b(w))^2\] Donde: \[a(w)=\frac{1}{n}\sum{Y_t*sen(wt)} \] \[b(w)=\frac{1}{n}\sum{Y_t*cos(wt)} \] W= Frecuencia regular, \(w \quad \epsilon\quad (-\pi, \pi)\)
Cita
“Una serie tiempo es una secuencia de observaciones, medidos en determinados momentos del tiempo, ordenados cronológicamente y, espaciados entre sí de manera uniforme, así los datos usualmente son dependientes entre sí”.
J Villavicencio
Ejemplo:
A continuación presentaré el análisis exploratorio de la serie Producción de aceros en el Perú, desde el año 1991 hasta el año 2009.
Librería a emplear
library(haven)Lectura de datos
data <- read_sav("aceroPERU.sav")
a <- data.frame(data);
knitr::kable(head(a), col.names = c("País", "Producción","Año","Mes","Fecha"),
caption = "Tabla N°1: Producción de Acero en el Perú", align = 'c', format= "html")| País | Producción | Año | Mes | Fecha |
|---|---|---|---|---|
| Peru | 30 | 1991 | 1 | JAN 1991 |
| Peru | 13 | 1991 | 2 | FEB 1991 |
| Peru | 30 | 1991 | 3 | MAR 1991 |
| Peru | 35 | 1991 | 4 | APR 1991 |
| Peru | 36 | 1991 | 5 | MAY 1991 |
| Peru | 33 | 1991 | 6 | JUN 1991 |
Conversión de los datos
La función ts() convierte un objeto a serie temporal. En este caso, de data.frame() a serie de tiempo
a.ts <- ts(a$Producción,start = c(1991,1), frequency = 12 );a.ts## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 1991 30 13 30 35 36 33 43 38 34 44 47 46
## 1992 39 21 20 30 35 17 17 32 41 25 31 33
## 1993 35 28 37 8 48 40 33 41 32 40 41 33
## 1994 41 44 50 45 50 46 48 37 39 28 29 30
## 1995 47 44 50 49 44 35 47 44 30 41 41 41
## 1996 46 40 44 39 55 50 56 54 51 51 45 49
## 1997 50 54 58 36 39 47 58 59 57 56 42 48
## 1998 55 53 59 59 60 48 48 60 52 46 45 44
## 1999 42 46 58 60 52 44 38 54 42 41 40 47
## 2000 64 62 67 68 66 55 54 63 61 59 66 67
## 2001 67 60 69 62 69 63 56 62 65 64 58 62
## 2002 49 48 48 54 55 57 49 37 38 59 60 59
## 2003 52 47 57 50 42 57 62 64 61 60 64 53
## 2004 58 63 72 64 65 66 64 61 66 34 47 66
## 2005 69 58 48 57 70 65 67 70 68 71 68 79
## 2006 77 67 75 73 74 74 75 74 73 74 78 81
## 2007 76 68 78 62 43 45 66 74 90 87 97 96
## 2008 97 87 95 92 99 97 98 106 104 101 82 0
## 2009 39 90 47 45 45 45 58 72 74 75 73 57
Gráfico de línea
Con la función plot() podremos visualizar el gráfico de la serie temporal.
plot(a.ts, ylab="Producción de aceros",xlab="Años",
main="Gráfico de Producción de aceros en el Perú")Evaluaremos las características de la Serie Temporal
- Tendencia: Creciente
- Estacionalidad: No se observa
- Tipo de modelo: multiplicativo
- Ciclos: No se observa
Gráfico de cajas
boxplot(a.ts ~ cycle(a.ts), xlab = "Meses", ylab = "Producción")Estacionariedad
1.1 Por nivel: Sí presenta
1.2 Por variabilidad: Sí presenta
Presencia de outliers: Sí presenta
Descomposición
Tendencia
Se presenta la Tendencia de la serie. Eliminando la influencia de las demás componentes
a.decomp <- decompose(a.ts, type = "mult")
Tena <- a.decomp$trend
plot(Tena, main= "Tendencia de la Producción de aceros",xlab="Años", ylab=" ")Estacionalidad
Se presenta la Estacionalidad de la serie. Eliminando la influencia de las demás componentes
a.decomp <- decompose(a.ts, type = "mult")
Estaa <- a.decomp$seasonal
plot(Estaa, main= "Estacionalidad de la Producción de aceros", xlab="Años", ylab=" ")Aleatoriedad
Se presenta la Aleatoriedad de la serie. Eliminando la influencia de las demás componentes
a.decomp <- decompose(a.ts, type = "mult")
Aleaa <- a.decomp$random
plot(Aleaa, main= "Aleatoriedad de la Producción de aceros", xlab="Años", ylab=" ")