Indicaciones: El taller debe ser desarrollado en R. Una vez terminado,debe ser disponibilizado en la plataforma, se pide subir a la plataforma:
Códigos de R
Archivo en pdf, word, o enlace html de rpubs
Sea exhaustivo en la resolución del taller. Más que resultados precisos, se espera un uso correcto de los conceptos y un correcto desarrollo teórico.
El taller lo pueden trabajar y entregar en grupos de hasta 2 integrantes.
Por favor, no dude en ponerse en contacto el profesor encargado del módulo en caso de problemas de índole estadístico: wsandovalr@libertadores.edu.co
Punto 1. Explore los datos birth del paquete astsa.
Obtenga los soportes visuales y los aspectos descriptivos de la serie a
partir de los comandos dados.
#install.packages("astsa")
library(astsa)
data(birth)
birth #Representación numérica de la serie:## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 1948 295 286 300 278 272 268 308 321 313 308 291 296
## 1949 294 273 300 271 282 285 318 323 313 311 291 293
## 1950 297 273 294 259 276 294 316 325 315 312 292 301
## 1951 304 282 313 296 313 307 328 334 329 329 304 312
## 1952 312 300 317 292 300 311 345 350 344 336 315 323
## 1953 322 296 315 287 307 321 354 356 348 334 320 340
## 1954 332 302 324 305 318 329 359 363 359 352 335 342
## 1955 329 306 332 309 326 325 354 367 362 354 337 345
## 1956 339 325 345 309 315 334 370 383 375 370 344 355
## 1957 346 317 348 331 345 348 380 381 377 376 348 356
## 1958 344 320 347 326 343 338 361 368 378 374 347 358
## 1959 349 323 358 331 338 343 374 380 377 368 346 358
## 1960 338 329 347 327 335 336 370 399 385 368 351 362
## 1961 358 333 356 335 348 346 374 386 384 372 343 346
## 1962 346 318 359 328 333 329 366 373 367 363 337 346
## 1963 355 314 343 322 336 327 362 366 361 358 327 330
## 1964 336 326 337 316 331 331 359 350 356 347 328 336
## 1965 315 292 322 291 302 310 330 335 333 318 305 313
## 1966 301 281 302 291 297 291 311 319 317 317 296 307
## 1967 295 265 300 271 291 290 310 318 310 304 285 288
## 1968 277 260 282 274 288 287 308 312 306 304 282 305
## 1969 284 273 286 284 294 288 315 322 317 309 295 306
## 1970 300 275 301 292 298 306 326 332 329 328 308 324
## 1971 299 284 306 290 292 285 295 306 317 305 294 287
## 1972 278 261 275 256 270 264 265 284 284 275 269 275
## 1973 259 244 267 255 260 253 267 277 277 264 255 260
## 1974 261 238 257 246 254 255 273 276 286 283 261 276
## 1975 264 243 259 250 262 253 280 288 270 273 241 266
## 1976 257 242 266 241 252 250 281 278 286 278 260 272
## 1977 274 256 276 259 273 272 297 296 290 282 262 275
## 1978 262 251 285 260 272 265 296 312 289 282 274 281
## 1979 277
Los datos observados corresponden a la cantidad en miles de nacidos vivos por mes en los Estados Unidos, en un tiempo comprendido entre enero de 1948 a enero de 1979.
Aspectos descriptivos de la serie de tiempo:
start(birth) #Conocer el tiempo de comienzo o inicio de la serie## [1] 1948 1
end(birth) #Conocer el tiempo de fin de la serie## [1] 1979 1
frequency(birth) #Conocer la frecuencia de la serie## [1] 12
Unidad de tiempo a la que pertenece cada observación de la serie:
cycle(birth)## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 1948 1 2 3 4 5 6 7 8 9 10 11 12
## 1949 1 2 3 4 5 6 7 8 9 10 11 12
## 1950 1 2 3 4 5 6 7 8 9 10 11 12
## 1951 1 2 3 4 5 6 7 8 9 10 11 12
## 1952 1 2 3 4 5 6 7 8 9 10 11 12
## 1953 1 2 3 4 5 6 7 8 9 10 11 12
## 1954 1 2 3 4 5 6 7 8 9 10 11 12
## 1955 1 2 3 4 5 6 7 8 9 10 11 12
## 1956 1 2 3 4 5 6 7 8 9 10 11 12
## 1957 1 2 3 4 5 6 7 8 9 10 11 12
## 1958 1 2 3 4 5 6 7 8 9 10 11 12
## 1959 1 2 3 4 5 6 7 8 9 10 11 12
## 1960 1 2 3 4 5 6 7 8 9 10 11 12
## 1961 1 2 3 4 5 6 7 8 9 10 11 12
## 1962 1 2 3 4 5 6 7 8 9 10 11 12
## 1963 1 2 3 4 5 6 7 8 9 10 11 12
## 1964 1 2 3 4 5 6 7 8 9 10 11 12
## 1965 1 2 3 4 5 6 7 8 9 10 11 12
## 1966 1 2 3 4 5 6 7 8 9 10 11 12
## 1967 1 2 3 4 5 6 7 8 9 10 11 12
## 1968 1 2 3 4 5 6 7 8 9 10 11 12
## 1969 1 2 3 4 5 6 7 8 9 10 11 12
## 1970 1 2 3 4 5 6 7 8 9 10 11 12
## 1971 1 2 3 4 5 6 7 8 9 10 11 12
## 1972 1 2 3 4 5 6 7 8 9 10 11 12
## 1973 1 2 3 4 5 6 7 8 9 10 11 12
## 1974 1 2 3 4 5 6 7 8 9 10 11 12
## 1975 1 2 3 4 5 6 7 8 9 10 11 12
## 1976 1 2 3 4 5 6 7 8 9 10 11 12
## 1977 1 2 3 4 5 6 7 8 9 10 11 12
## 1978 1 2 3 4 5 6 7 8 9 10 11 12
## 1979 1
La unidad de tiempo asignada es numerica por cada uno de los meses del año, es decir, mes 1 corresponde a enero y asi sucesivamente
Representación gráfica de la serie:
library(tseries)
library(ggplot2)
library(ggfortify)
library(dplyr)
library(plotly)
library(TSstudio)Grafico sencillo:
g<-autoplot(birth,ts.colour = "red")+
ggtitle("Nacimientos vivos mensuales de EE.UU.")+
xlab("Año")+
ylab("Nacimientos por mes")
gAhora con un grafico dinamico que permite ver la fecha y volumen al señalarlo con el puntero:
ggplotly(g)Con el grafico dinamico puedo ver el año y mes exacto con mayor y menor cantidad de nacimientos, tal es el caso de agosto de 1960 con 399 nacidos vivos frente al año con menor cantidad de nacidos vivos de 238 el cual fue en febrero de 1974.
Descomposición aditiva de la serie de tiempo
birth: en sus componentes de tendencia, estacional
y componente aleatorio.
library(highcharter)
hchart(stl(birth, s.window='periodic'))## Warning: Deprecated function. Use the `create_axis` function.
En los graficos de la descomposicion aditiva de la seria se observan 4 graficas dentro de una misma, la primera presenta los datos en el eje x para los años (1948 a 1979) y para el eje Y la cantidad de nacimientos vivos en miles.
El segundo grafico presenta el componente estacional (seasonal) donde se puede observar una variacion para un cierto periodo especifico.
El tercer grafico presenta el componente de tendencia (trend) mostrando crecimiento desde 1955 hasta 1965 cuando inicia el decrecimiento de los nacimientos en EU.
El cuarto y ultimo grafico representa el componente aleatorio, los residuos (remainder), es decir, lo que no absorbe el modelo y se espera se encuentren lo mas cercano a cero.
Boxplot por mes
boxplot(birth ~ cycle(birth))En el diagrama de cajas se observa a los nacidos vivos en el eje y frente a los meses de enero a diciembre del periodo comprendido entre 1948 a 1979 en el eje x con el fin de identificar una tendencia dentro de los meses con mayores o menores nacimientos segun sea el interes, para el caso de estudio se observa que en los meses de julio a octubre se da la mayor cantidad nacimientos vivos.
Gráficos de estacionalidad
ts_seasonal(birth, type = "all")Otra forma de visualizar la serie de tiempo son los graficos de estacionalidad que presenta 3 graficas diferentes dentro de la misma. El primer grafico representa en lineas los nacimientos frente a los meses con el fin de observar tendencia de crecimiento o decreecimiento en meses especificos a traves de los años.
El segundo grafico similar al anterior, tambien representacion en lineas pero ahora de los nacimientos frente a los años con el fin de observar tendencias, es decir, el año con mayor o menos cantidad en miles de nacimientos en EU.
Por ultimo, encontramos un grafico de Box Plots y al lado de cada uno sus datos reales, en el eje y la cantidad de nacidos, eje x meses; se observa en el mes de agosto la mayor cantidad de nacimientos.
Mapa de calor
ts_heatmap(birth)Dentro de un mapa de calor tambien se puede representar una serie de datos e identificar segun intensidad del color la mayor cantidad de nacimientos, en este caso, el cuadro azul oscuro, al colocarnos sobre el arroja la informacion correspondiente:
Value:399
Year:1960
Month:8
Confirmando asi que en el mes de agostos de 1960 se tuvieron 399 nacimientos, el mayor valor obtenido dentro del periodo analizado.Y para el color mas tenue, el valor mas bajo obtenido en nacimientos para el periodo de tiempo:
Value:238
Year:1974
Month:2
Es decir, menos cantidad de nacimientos para el mes de febrero de 1974 con 238 nacimientos vivos en EU.
Punto 2. Cargue y Explore los datos IPC.
- Cargue en R la serie con:
- Fecha de inicio: Enero 2000
- Fecha de Finalización: Diciembre de 2019
- Frecuencia mensual
Obtenga los soportes visuales y los aspectos descriptivos de la serie, obtenga los ciclos de la serie realice un boxplot, y haga un breve análisis.
library(readxl)
df <- read_excel("C:/Users/Ingrid/OneDrive - Fundacion Universitaria los Libertadores/2022_Jul_SERIES DE TIEMPO/TALLER 1_/IPC.xlsx")
IPC<-ts(df, start=c(2000,1),end= c(2019,12), frequency = 12)Representación numérica de la serie:
IPC## Jan Feb Mar Apr May Jun Jul Aug Sep
## 2000 0.0129 0.0230 0.0171 0.0100 0.0052 -0.0002 -0.0004 0.0032 0.0043
## 2001 0.0105 0.0189 0.0148 0.0115 0.0042 0.0004 0.0011 0.0026 0.0037
## 2002 0.0080 0.0126 0.0071 0.0092 0.0060 0.0043 0.0002 0.0009 0.0036
## 2003 0.0117 0.0111 0.0105 0.0115 0.0049 -0.0005 -0.0014 0.0031 0.0022
## 2004 0.0089 0.0120 0.0098 0.0046 0.0038 0.0060 -0.0003 0.0003 0.0030
## 2005 0.0082 0.0102 0.0077 0.0044 0.0041 0.0040 0.0005 0.0000 0.0043
## 2006 0.0054 0.0066 0.0070 0.0045 0.0033 0.0030 0.0041 0.0039 0.0029
## 2007 0.0077 0.0117 0.0121 0.0090 0.0030 0.0012 0.0017 -0.0013 0.0008
## 2008 0.0106 0.0151 0.0081 0.0071 0.0093 0.0086 0.0048 0.0019 -0.0019
## 2009 0.0059 0.0084 0.0050 0.0032 0.0001 -0.0006 -0.0004 0.0004 -0.0011
## 2010 0.0069 0.0083 0.0025 0.0046 0.0010 0.0011 -0.0004 0.0011 -0.0014
## 2011 0.0091 0.0060 0.0027 0.0012 0.0028 0.0032 0.0014 -0.0003 0.0031
## 2012 0.0073 0.0061 0.0012 0.0014 0.0030 0.0008 -0.0002 0.0004 0.0029
## 2013 0.0030 0.0044 0.0021 0.0025 0.0028 0.0023 0.0004 0.0008 0.0029
## 2014 0.0049 0.0063 0.0039 0.0046 0.0048 0.0009 0.0015 0.0020 0.0014
## 2015 0.0064 0.0115 0.0059 0.0054 0.0026 0.0010 0.0019 0.0048 0.0072
## 2016 0.0129 0.0128 0.0094 0.0050 0.0051 0.0048 0.0052 -0.0032 -0.0005
## 2017 0.0102 0.0101 0.0047 0.0047 0.0023 0.0011 -0.0005 0.0014 0.0004
## 2018 0.0063 0.0071 0.0024 0.0046 0.0025 0.0015 -0.0013 0.0012 0.0016
## 2019 0.0060 0.0057 0.0043 0.0050 0.0031 0.0027 0.0022 0.0009 0.0023
## Oct Nov Dec
## 2000 0.0015 0.0033 0.0046
## 2001 0.0019 0.0012 0.0034
## 2002 0.0056 0.0078 0.0027
## 2003 0.0006 0.0035 0.0061
## 2004 -0.0001 0.0028 0.0030
## 2005 0.0023 0.0011 0.0007
## 2006 -0.0014 0.0024 0.0023
## 2007 0.0001 0.0047 0.0049
## 2008 0.0035 0.0028 0.0044
## 2009 -0.0013 -0.0007 0.0008
## 2010 -0.0009 0.0019 0.0065
## 2011 0.0019 0.0014 0.0042
## 2012 0.0016 -0.0014 0.0009
## 2013 -0.0026 -0.0022 0.0026
## 2014 0.0016 0.0013 0.0027
## 2015 0.0068 0.0060 0.0062
## 2016 -0.0006 0.0011 0.0042
## 2017 0.0002 0.0018 0.0038
## 2018 0.0012 0.0012 0.0030
## 2019 0.0016 0.0010 0.0026
Aspectos descriptivos de la serie de tiempo:
start(IPC) #Conocer el tiempo de comienzo o inicio de la serie## [1] 2000 1
end(IPC) #Conocer el tiempo de fin de la serie## [1] 2019 12
frequency(IPC) #Conocer la frecuencia de la serie## [1] 12
Unidad de tiempo a la que pertenece cada observación de la serie:
cycle(IPC)## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2000 1 2 3 4 5 6 7 8 9 10 11 12
## 2001 1 2 3 4 5 6 7 8 9 10 11 12
## 2002 1 2 3 4 5 6 7 8 9 10 11 12
## 2003 1 2 3 4 5 6 7 8 9 10 11 12
## 2004 1 2 3 4 5 6 7 8 9 10 11 12
## 2005 1 2 3 4 5 6 7 8 9 10 11 12
## 2006 1 2 3 4 5 6 7 8 9 10 11 12
## 2007 1 2 3 4 5 6 7 8 9 10 11 12
## 2008 1 2 3 4 5 6 7 8 9 10 11 12
## 2009 1 2 3 4 5 6 7 8 9 10 11 12
## 2010 1 2 3 4 5 6 7 8 9 10 11 12
## 2011 1 2 3 4 5 6 7 8 9 10 11 12
## 2012 1 2 3 4 5 6 7 8 9 10 11 12
## 2013 1 2 3 4 5 6 7 8 9 10 11 12
## 2014 1 2 3 4 5 6 7 8 9 10 11 12
## 2015 1 2 3 4 5 6 7 8 9 10 11 12
## 2016 1 2 3 4 5 6 7 8 9 10 11 12
## 2017 1 2 3 4 5 6 7 8 9 10 11 12
## 2018 1 2 3 4 5 6 7 8 9 10 11 12
## 2019 1 2 3 4 5 6 7 8 9 10 11 12
De lo anterior tenemos que la serie inicia en el año 2000 mes de enero, termina en diciembre de 2019, su frecuencia es 12, es decir, es mensual y la unidad de tiempo son cada uno de los meses del año representados de 1 a 12.
Representación gráfica de la serie:
plot(IPC) ts_plot(IPC) autoplot(IPC)hchart(IPC)Los diferentes graficos presentados muestran el comportamiento de la serie de datos, el IPC y su comportamiento en el intervalo de tiempo desde el 2000 hasta el 2019, con valor de IPC extremo en el 2000 y el mas bajo para el 2016.
Descomposición aditiva de la serie de tiempo
IPC: en sus componentes de tendencia, estacional y
componente aleatorio.
library(highcharter)
hchart(stl(IPC, s.window='periodic'))## Warning: Deprecated function. Use the `create_axis` function.
Los graficos de descomposicion aditiva de la serie muestra 4 graficas dentro de una misma.
El primer grafico es la representacion de los datos, en el eje x los años (2000 al 2109) y para el eje Y el IPC.
El segundo grafico presenta el componente estacional (seasonal) donde se puede observar una variacion para un cierto periodo especifico.
El tercer grafico presenta el componente de tendencia (trend) mostrando valores de IPC altos y bajos, en especial para el año 2000, 2008 y 2015.
El cuarto y ultimo grafico representa el componente aleatorio, los residuos (remainder), es decir, lo que no absorbe el modelo y se espera se encuentren lo mas cercano a cero, para la presente seria se observan datos alejados de cero, es decir, que los residuos puede que no cumplan el criterio permitido para ellos.
Boxplot por mes
boxplot(IPC ~ cycle(IPC))En el diagrama Boxplot se observan los valores del IPC en el eje y frente a los meses de enero a diciembre del periodo comprendido entre el 2000 al 2019 en el eje x, con el fin de identificar una tendencia dentro de los meses con mayores o menores valores del IPC segun sea el interes, para el caso de estudio, se observa que en los meses de febrero y marzo se ubican los valores mas altos del IPC. Tambien se observan datos atipicos representados por los circulos fuera de los bigote de cada caja.
Gráficos de estacionalidad
ts_seasonal(IPC, type = "all")En el grafico de estacionalidad encontramos 3 graficas diferentes dentro de una misma.
El primer grafico representa en lines el comportamiento del IPC frente a cada uno de los meses contemplados entre el 2000 al 2019 con el fin de observar tendencia de crecimiento o decrecimiento en algun mes especifico a traves de los años, en este caso sobresale el mes de febrero por valores altos del IPC.
El segundo grafico similar al anterior, tambien representacion en lineas del IPC frente al intervalos de años, con el fin de observar tendencias y es en el año 2000 donde se presenta el valor mas alto del IPC y el año 2016 el valor mas bajo para el IPC.
Por ultimo, encontramos un grafico de Box Plots y al lado de cada uno sus datos reales, en el eje y los valores del IPC y para el eje x los meses del año, confirmando de nuevo al mes de febrero con el IPC mas alto y al mes de agosto con el valor mas bajo.
Mapa de calor
ts_heatmap(IPC)En el mapa de calor al color azul mas intenso como el mayor IPC, al colocarnos sobre el recuadro arroja la informacion correspondiente:
Value:0.023
Year:2000
Month:2
Confirmando asi que en el mes de febrero del 2000 se obtuvo el IPC mas alto de 0.023 para periodo analizado.
El color mas tenue dentro de l mapa representa al valor mas bajo obtenido de IPC de -0.0032 en el año 2016.
Value:-0.0032
Year:2016
Month:8
Punto 3. Simule y obtenga los soportes visuales de un Ruido blanco de media 0 realice el ACF y PACF. Describa brevemente lo que puede observar.
Un Ruido Blanco es una serie tal que su media es cero, la varianza es constante y es incorrelacionada.
Genero datos 5.000 datos aleatorios, con media cero y varianza 1, es decir varianza constante.
set.seed(123) #123 color verde
ruido_blanco=rnorm(5000,0,1)Graficamos la serie de tiempo
plot.ts(ruido_blanco, main="Serie de Ruido Blanco", xlab="Tiempo", ylab="Valores",col="123")Se observa en la grafica de 5000 datos aleatorios que los datos oscilan en 0, es decir, la media es cero y varian entre 1 y -1, tal como lo programado y cumpliendo los parametros para un ruido blanco.
Este ruido blanco respresentado en la grafica es el optimo, el que se busca obtener en una serie de tiempo idealmente.
Descripcion de las funciones ACF y PACF del ruido blanco
library(forecast)## Registered S3 methods overwritten by 'forecast':
## method from
## autoplot.Arima ggfortify
## autoplot.acf ggfortify
## autoplot.ar ggfortify
## autoplot.bats ggfortify
## autoplot.decomposed.ts ggfortify
## autoplot.ets ggfortify
## autoplot.forecast ggfortify
## autoplot.stl ggfortify
## autoplot.ts ggfortify
## fitted.ar ggfortify
## fortify.ts ggfortify
## residuals.ar ggfortify
##
## Attaching package: 'forecast'
## The following object is masked from 'package:astsa':
##
## gas
ggtsdisplay(ruido_blanco)Dentro de un mismo grafico observamos los datos reales, la funcion de Autocorrelacion (ACF) y la funcion de autocorrelacion parcial (PACF) con el fin de identificar resagos (valores significativos dentro de la serie de tiempo) y son aquellos que se encuentren fuera de los limites (lineas azules).
Punto 4. En sus propias palabras, explique los modelos autorregresivos y genere 100 datos de un modelo AR(2) cuyos parámetros sean 0.2 y 0.6.
- Obtenga los soportes visuales correspondientes,
- Obtener el ACF y el PACF
- Escriba la ecuación del modelo
set.seed(123)
AR2 = arima.sim(n = 100, list(ar = c(0.2,0.6)))ggtsdisplay(AR2)En un mismo grafico se obtienen tres graficas incluidas, en la primera se observan los datos reales, en la segunda la funcion ACF y la tercera la funcion PACF reconociendo el modelo como un AR(2).
El modelo AR(2) se identifica con la funcion PACF donde son notorias 2 barras al inicio del grafico y que se encuentran fuera de los limites, es decir, con correlacion significativa. Por lo tanto, con dos resagos confirmamos que el modelo es un AR(2).
Respecto al grafico de la funcion ACF se observa un comportamiento de decaimiento exponencial, propio de este modelo.
Otra forma de graficar las funciones ACF y PACF es utilizando ts_cor:
ts_cor(AR2)En este tipo de graficos soko se grafican las funciones (no se incluyen los datos reales) y es mas notoria la escala confirmando los dos resagos en la grafica PACF para el modelo AR(2)
Ecuación del modelo AR(2):
\[x_t = \delta + \phi_1 x_{t-1}+ \phi_2 x_{t-2} + w_t\] \[x_t = \delta + 0.2 x_{t-1}+ 0.6 x_{t-2} + w_t\]
Son reemplazdos los valores de teta por 0.2 y 0.6.
\(w_t \overset{iid}{\sim} N(0, \sigma^2_w)\) lo que significa que los errores se distribuyen independientemente con una distribución normal que tiene media 0 y varianza constante
Propiedades de los errores. \(w_t\) son independientes de \(x\).
Punto 5. En sus propias palabras, explique los modelos medias móviles y genere 100 datos de un modelo MA(2) cuyos parámetros sean -0.1 y 0.3.
- Obtenga los soportes visuales correspondientes.
- Obtener el ACF y el PACF
- Escriba la ecuación del modelo
set.seed(123)
MA2 = arima.sim(n = 100, list(ma =c(-0.1,0.3)))
ggtsdisplay(MA2)En un mismo grafico se obtienen tres graficas incluidas, en la primera se observan los datos reales, en la segunda la funcion ACF reconociendo el modelo como un MA(2) y la tercera la funcion PACF.
El modelo MA(2) se identifica con la grafica de la funcion AFC donde son notorias 2 barras en el grafico para el modelo MA(2).
Respecto al grafico de la funcion PAFC se observa un comportamiento alterado.
Ecuación del modelo MA(2):
\[x_t = \mu + w_t +\theta_1w_{t-1}+\theta_2w_{t-2} \\ w_t \overset{iid}{\sim} N(0, \sigma^2_w)\]
\[x_t = \mu + w_t -0.1w_{t-1}+0.3w_{t-2}\] En la ecuacion del Modelo MA(2) se realizan los reemplazos para teta de -0.1 y 0.3.
Punto 6. (Libre) Encuentre una serie de tiempo del tema que usted desee, carguela en R y realice un breve análisis descriptivo.
library(readxl)
particulas <- read_excel("C:/Users/Ingrid/OneDrive - Fundacion Universitaria los Libertadores/2022_Jul_SERIES DE TIEMPO/TALLER 1_/Material particulado 2014 al 2019.xlsx")
particulas1<-ts(particulas[,2], start=c(2014,1),end= c(2019,12), frequency = 12)Representación numérica de la serie:
particulas1## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2014 36 41 42 32 32 23 32 24 25 30 30 37
## 2015 29 34 34 27 29 19 21 22 28 28 28 25
## 2016 43 30 36 29 25 22 22 28 30 33 33 35
## 2017 15 34 30 27 24 24 19 25 25 26 32 30
## 2018 26 33 32 27 21 17 17 20 22 23 25 28
## 2019 25 35 37 28 23 16 18 20 24 26 26 27
La base de datos particulas1 contiene los valores de material particulado menor a 2.5 micras en ug/m3 tomados en la estacion de monitoreo de Kennedy para los años 2014 al 2019.
Aspectos descriptivos de la serie de tiempo:
start(particulas1) #Conocer el tiempo de comienzo o inicio de la serie## [1] 2014 1
end(particulas1) #Conocer el tiempo de fin de la serie## [1] 2019 12
frequency(particulas1) #Conocer la frecuencia de la serie## [1] 12
Unidad de tiempo a la que pertenece cada observación de la serie:
cycle(particulas1)## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2014 1 2 3 4 5 6 7 8 9 10 11 12
## 2015 1 2 3 4 5 6 7 8 9 10 11 12
## 2016 1 2 3 4 5 6 7 8 9 10 11 12
## 2017 1 2 3 4 5 6 7 8 9 10 11 12
## 2018 1 2 3 4 5 6 7 8 9 10 11 12
## 2019 1 2 3 4 5 6 7 8 9 10 11 12
De lo anterior tenemos que la serie inicia en el mes de enero de 2014, termina en diciembre de 2019, su frecuencia es 12, es decir, cada año cuenta con valores por mes de material particulado y la unidad de tiempo son cada uno de los meses del año representados de 1 a 12.
Representación gráfica de la serie:
ts_plot(particulas1) Esta grafico es dinamico, permite visualizar el año y mes exacto con mayor y menor cantidad de material particulado menor a 2.5 micras, para el 2016 la medicion fue de 43 ug/cm3 de y el año con menor cantidad fue 2017 con 15 ug/cm3.
Descomposición aditiva de la serie de tiempo
particulas1: en sus componentes de tendencia,
estacional y componente aleatorio.
autoplot(stl(particulas1[,1], s.window='periodic'))Los graficos de descomposicion aditiva de la serie muestra 4 graficas dentro de una misma.
El primer grafico es la representacion de los datos, en el eje x los años (2014 al 2019) y para el eje Y la cantidad de material particulado en ug/m3.
El segundo grafico presenta el componente de tendencia (trend) mostrando valores de material particulado con una tendencia decreciente, la cantidad de material particulado ha disminuido a traves de los años.
El tercer grafico presenta el componente estacional (seasonal) donde se puede observar una variacion para un cierto periodo especifico.
El cuarto y ultimo grafico representa el componente aleatorio, los residuos (remainder), es decir, lo que no absorbe el modelo y se espera se encuentren lo mas cercano a cero, para la presente serie se observan datos extremos, no cercanos a cero, es decir, que los residuos no cumplan el criterio permitido para ellos.
Boxplot por mes
boxplot(particulas1 ~ cycle(particulas1))En el diagrama Boxplot se observan los valores del Material particulado en el eje y frente a los meses del año en el eje x, con el fin de identificar una tendencia dentro de los meses con mayores o menores valores de material particulado segun sea el interes, para el caso de estudio, se observa que en los meses de enero y febrero se ubican los valores mas altos de particulas y el mes de enero con el valor mas bajo. Tambien se observan datos atipicos representados por los circulos fuera de los bigote de la caja para el mes de febrero y julio.
Gráficos de estacionalidad
ts_seasonal(particulas1, type = "all")summary(particulas1)## Kennedy - Ken\r\n(µg/m³)
## Min. :15.00
## 1st Qu.:23.75
## Median :27.00
## Mean :27.51
## 3rd Qu.:32.00
## Max. :43.00
En el grafico de estacionalidad encontramos 3 graficas diferentes dentro de una misma.
El primer grafico representa en lines el comportamiento del material particulado frente a cada uno de los meses contemplados entre el 2014 al 2019 con el fin de observar tendencia de crecimiento o decrecimiento en algun mes especifico a traves de los años, en este caso sobresale el mes de enero por contener el valor mas alto 43 ug/cm3, pero tambien el mas bajo 15 ug/cm3 de material particulado.
El segundo grafico similar al anterior, tambien representacion en lineas el material particulado frente al intervalos de años, con el fin de observar tendencias y es en el año 2016 donde se presenta el valor mas alto de particulas y el año 2017 el valor mas bajo para con 15 ug/cm3.
Por ultimo, encontramos un grafico de Box Plots y al lado de cada uno sus datos reales, en el eje y los valores de material particulado y para el eje x los meses del año contemplados entre el 2014 al 2019, confirmando de nuevo al mes de enero con los valores mas altos y mas bajos de material particualdo.
Mapa de calor
ts_heatmap(particulas1)Dentro del mapa de calor encontramos al color azul intenso con el mayor nuemro de particulas, al colocarnos sobre el recuadro arroja la informacion correspondiente:
Value:43
Year:2016
Month:1
Confirmando asi que en el mes de enero del 2016 se obtuvo el mayor numero de particulas de 43 ug/cm3 para periodo analizado.
El color mas tenue dentro del mapa representa al valor mas bajo obtenido de material particulado en el año 2017.
Value:15
Year:2017
Month:1