Introducción

Este documento reúne los gráficos generados en el curso Visualizing Time Series Data in R de DataCamp, el cual forma parte del programa
Time Series with R de esta compañía dedicada a la capacitación en Ciencia de Datos. Todos los códigos y materiales del curso son propiedad de DataCamp.

Los ejemplos están principalmente enfocados a aplicaciones financieras pero, una vez aprendidas las técnicas de procesamiento y visualización, es posible trabajar con datos para las ciencias sociales.

El trabajo tiene por objeto construir un archivo en R Markdown que pueda ser visto como una página web por los visitantes de GitHub sin que deban descargar ningún archivo o correr código en R. El usuario en GitHub es Raquel-Arcos.

Librerías requeridas y conexión entre R Studio y GitHub.

Se requieren las librerías de R: xts, zoo, TTR, corrplot y PerformanceAnalytics. El diseño especial de los gráficos se logra gracias a la última.

La conexión entre RStudio y GitHub se realizó utilizando los implementos que el IDE tiene para ello, lo que reduce sustancialmente la posibilidad de cometer errores al actualizar los archivos y el tiempo que toma este proceso.

Los datos

##            yahoo microsoft citigroup dow_chemical
## 2015-01-02 50.17  44.30501  53.45259     42.48209
## 2015-01-05 49.13  43.89759  51.76803     41.16821
## 2015-01-06 49.21  43.25329  49.94556     40.50662
##            yahoo microsoft citigroup dow_chemical
## 2016-12-28 38.73     62.99  59.86861        57.90
## 2016-12-29 38.64     62.90  59.21050        57.42
## 2016-12-30 38.67     62.14  59.26035        57.22
A continuación se presentan los cuatro gráficos de series de tiempo.
Gráfica_1

Gráfica_1

Gráfica_2

Gráfica_2

Gráfica_3

Gráfica_3

Gráfica_4

Gráfica_4

Gráfica_5

Gráfica_5

Gráfica_5

Gráfica_5

Gráfica_6

Gráfica_6

Gráfica_6

Gráfica_6

Gráfica_7

Gráfica_7

Gráfica_8

Gráfica_8

Gráfica_10

Gráfica_10

Gráfica_11

Gráfica_11

Gráfica_12

Gráfica_12

Para observar la distribución de los retornos de los precios de las acciones de la compañía Apple, elaboramos un histograma de los mismos junto con la función de densidad correspondiente.

Gráfica_13

Gráfica_13

Para observar en qué medida se asemeja la distribución de los retornos de los precios de las acciones de la compañía Apple a un conjunto de datos que siguen una distribución normal estándar, comparamos los gráficos de caja y brazo (boxplot) respectivos, lo que nos ayuda a visualizar tanto el sesgo como la asimetría de los datos de interés.
Gráfica_14

Gráfica_14

Gráfica_15

Gráfica_15

Un gráfico q-q plot contrasta los cuantiles de un primer conjunto de datos con los de un segundo conjunto de datos. Se usa para estudiar si los datos de interés se asemejan a una distribucion normal. Si los datos de interés siguen aproximadamente una distribución normal, los puntos en el gráfico se apegarán a una recta diagonal. Esta vía es útil para verificar de forma visual la normalidad, pero no es una prueba estadística.
Gráfica_16

Gráfica_16

Gráfica_17

Gráfica_17

##                   sp500    citigroup
## 2015-01-05 -0.027743151 -0.032022201
## 2015-01-06 -0.005330421 -0.035839143
## 2015-01-07  0.010081542  0.009227448
## 2015-01-08  0.016507641  0.014935802
## 
## Call:
## lm(formula = citi ~ sp500)
## 
## Coefficients:
## (Intercept)        sp500  
##   0.0001495    0.6927371
Gráfica_18

Gráfica_18

Ahora tenemos las series de tiempo de los retornos diarios de los precios de las acciones de seis compañías: SP500, Citigroup, Microsoft, Apple, DowChemical y Yahoo. Se trata de trabajar con datos multivariados por lo que, para su visualización, necesitamos técnicas distintas a las utilizadas cuando trabajamos con datos univariados. Iniciamos calculando la matriz de correlación que tendrá una dimensión de 6*6, primero con el método de Pearson y posteriormente con el método de Spearman.

##              sp500 citigroup microsoft  apple dowchemical  yahoo
## sp500       1.0000    0.5098    0.3743 0.3577      0.5217 0.2901
## citigroup   0.5098    1.0000    0.4841 0.4292      0.5085 0.4029
## microsoft   0.3743    0.4841    1.0000 0.5133      0.3955 0.4329
## apple       0.3577    0.4292    0.5133 1.0000      0.3628 0.3414
## dowchemical 0.5217    0.5085    0.3955 0.3628      1.0000 0.2939
## yahoo       0.2901    0.4029    0.4329 0.3414      0.2939 1.0000
##              sp500 citigroup microsoft  apple dowchemical  yahoo
## sp500       1.0000    0.5193    0.4244 0.3519      0.5316 0.3262
## citigroup   0.5193    1.0000    0.4976 0.4375      0.5608 0.3781
## microsoft   0.4244    0.4976    1.0000 0.5128      0.4684 0.4448
## apple       0.3519    0.4375    0.5128 1.0000      0.3682 0.3681
## dowchemical 0.5316    0.5608    0.4684 0.3682      1.0000 0.3465
## yahoo       0.3262    0.3781    0.4448 0.3681      0.3465 1.0000
La función pairs genera los diagramas de dispersión de todas las combinaciones de tamaño 2 de las variables en la matriz de datos por analizar.
Gráfica_19

Gráfica_19

Gráfica_19

Gráfica_19

La librería corrplot permite visualizar la matriz de correlación en una forma más clara, al presentar las correlaciones como números, símbolos o colores. El primer argumento de la función corrplot es la matriz de correlación.

Gráfica_20

Gráfica_20

Gráfica_20

Gráfica_20

Gráfica_20

Gráfica_20

Gráfica_20

Gráfica_20

A continuación se presentan los gráficos que nos permiten describir la serie del portafolio en su estado inicial.

Gráfica_21

Gráfica_21

Gráfica_21

Gráfica_21

Gráfica_21

Gráfica_21

Gráfica_22

Gráfica_22