Este documento reúne los gráficos generados en el curso Visualizing Time Series Data in R de DataCamp, el cual forma parte del programa
Time Series with R de esta compañía dedicada a la capacitación en Ciencia de Datos. Todos los códigos y materiales del curso son propiedad de DataCamp.
Los ejemplos están principalmente enfocados a aplicaciones financieras pero, una vez aprendidas las técnicas de procesamiento y visualización, es posible trabajar con datos para las ciencias sociales.
El trabajo tiene por objeto construir un archivo en R Markdown que pueda ser visto como una página web por los visitantes de GitHub sin que deban descargar ningún archivo o correr código en R. El usuario en GitHub es Raquel-Arcos.
Se requieren las librerías de R: xts, zoo, TTR, corrplot y PerformanceAnalytics. El diseño especial de los gráficos se logra gracias a la última.
La conexión entre RStudio y GitHub se realizó utilizando los implementos que el IDE tiene para ello, lo que reduce sustancialmente la posibilidad de cometer errores al actualizar los archivos y el tiempo que toma este proceso.
## yahoo microsoft citigroup dow_chemical
## 2015-01-02 50.17 44.30501 53.45259 42.48209
## 2015-01-05 49.13 43.89759 51.76803 41.16821
## 2015-01-06 49.21 43.25329 49.94556 40.50662
## yahoo microsoft citigroup dow_chemical
## 2016-12-28 38.73 62.99 59.86861 57.90
## 2016-12-29 38.64 62.90 59.21050 57.42
## 2016-12-30 38.67 62.14 59.26035 57.22
A continuación se presentan los cuatro gráficos de series de tiempo.
Gráfica_1
Gráfica_2
Gráfica_3
Gráfica_4
Gráfica_5
Gráfica_5
Gráfica_6
Gráfica_6
Gráfica_7
Gráfica_8
Gráfica_10
Gráfica_11
Gráfica_12
Para observar la distribución de los retornos de los precios de las acciones de la compañía Apple, elaboramos un histograma de los mismos junto con la función de densidad correspondiente.
Gráfica_13
Gráfica_14
Gráfica_15
Gráfica_16
Gráfica_17
## sp500 citigroup
## 2015-01-05 -0.027743151 -0.032022201
## 2015-01-06 -0.005330421 -0.035839143
## 2015-01-07 0.010081542 0.009227448
## 2015-01-08 0.016507641 0.014935802
##
## Call:
## lm(formula = citi ~ sp500)
##
## Coefficients:
## (Intercept) sp500
## 0.0001495 0.6927371
Gráfica_18
Ahora tenemos las series de tiempo de los retornos diarios de los precios de las acciones de seis compañías: SP500, Citigroup, Microsoft, Apple, DowChemical y Yahoo. Se trata de trabajar con datos multivariados por lo que, para su visualización, necesitamos técnicas distintas a las utilizadas cuando trabajamos con datos univariados. Iniciamos calculando la matriz de correlación que tendrá una dimensión de 6*6, primero con el método de Pearson y posteriormente con el método de Spearman.
## sp500 citigroup microsoft apple dowchemical yahoo
## sp500 1.0000 0.5098 0.3743 0.3577 0.5217 0.2901
## citigroup 0.5098 1.0000 0.4841 0.4292 0.5085 0.4029
## microsoft 0.3743 0.4841 1.0000 0.5133 0.3955 0.4329
## apple 0.3577 0.4292 0.5133 1.0000 0.3628 0.3414
## dowchemical 0.5217 0.5085 0.3955 0.3628 1.0000 0.2939
## yahoo 0.2901 0.4029 0.4329 0.3414 0.2939 1.0000
## sp500 citigroup microsoft apple dowchemical yahoo
## sp500 1.0000 0.5193 0.4244 0.3519 0.5316 0.3262
## citigroup 0.5193 1.0000 0.4976 0.4375 0.5608 0.3781
## microsoft 0.4244 0.4976 1.0000 0.5128 0.4684 0.4448
## apple 0.3519 0.4375 0.5128 1.0000 0.3682 0.3681
## dowchemical 0.5316 0.5608 0.4684 0.3682 1.0000 0.3465
## yahoo 0.3262 0.3781 0.4448 0.3681 0.3465 1.0000
La función pairs genera los diagramas de dispersión de todas las combinaciones de tamaño 2 de las variables en la matriz de datos por analizar.
Gráfica_19
Gráfica_19
La librería corrplot permite visualizar la matriz de correlación en una forma más clara, al presentar las correlaciones como números, símbolos o colores. El primer argumento de la función corrplot es la matriz de correlación.
Gráfica_20
Gráfica_20
Gráfica_20
Gráfica_20
A continuación se presentan los gráficos que nos permiten describir la serie del portafolio en su estado inicial.
Gráfica_21
Gráfica_21
Gráfica_21
Gráfica_22