Análisis cuantitativo sobre activos financieros en R
Clase 1: Técnico en Finanzas Cuantitativas
Hechos estilizados de los retronos financieros
El conocimiento profundo de los hechos estilizados en las series financieras es una necesidad práctica en el mundo del análisis financiero y de inversión, tener una comprensión clara de estos conceptos permite una mejor evaluación de riesgos, el desarrollo de modelos predictivos robustos y la formulación de estrategias de inversión más efectivas.
Cómo parte de este proceso es indispensable revisar y analizar las características típicas de los datos de los mercados financieros. Estos se resumen en la literatura como “hechos estilizados” (ver Campbell et al. 1997; McNeil et al. 2005).
Series financieras univariadas
Las series financieras univariadas son una herramienta crucial en el análisis de mercados financieros, revelando patrones y tendencias que ayudan a comprender mejor estos mercados. Estos patrones, conocidos como hechos estilizados, se mantienen consistentes a través de diferentes mercados y periodos de tiempo.
Las propiedades observadas tienen implicaciones importantes para evaluar si los modelos elegidos son apropiados o no. Dicho de otra manera, un modelo de financiero o de riesgo que no capture adecuadamente las características de las series temporales de los datos del mercado financiero tampoco será útil para derivar medidas de riesgo y desempeño.
Los principales hechos identificados se muestra a continuación:
- La volatilidad de los retornos no es constante con respecto al tiempo.
- Los rendimientos absolutos o al cuadrado están altamente autocorrelacionados.
- La distribución de los rendimientos de los mercados financieros es leptocúrtica, por lo que la ocurrencia de eventos extremos es más probable en comparación con la distribución normal.
- Los rendimientos extremos se observan muy de cerca en el tiempo (agrupación de volatilidad).
- La distribución empírica de los rendimientos está sesgada hacia la izquierda; es más probable que se produzcan rendimientos negativos que positivos.
A modo de ejemplo, comprobaremos ahora si estos hechos estilizados son aplicables a los rendimientos de las acciones de Siemens. El conjunto de datos de rendimientos diarios inicia el 2 de enero de 1973 y finaliza el 23 de julio de 1996 y comprende 6146 observaciones.
A simple vista se observa que los retornos están sesgados hacia la izquierda como puede verse en el diagrama de caja (panel superior derecho). La mayor pérdida ocurrió el 16 de octubre de 1989, con un −12.01%. El mayor retorno, del 7.67%, se registró el 17 de enero de 1991. La asimetría es de −0.52 y la curtosis excesiva de 7.74, lo que indica claramente la presencia de colas pesadas.
La función de autocorrelación (ACF) y la función de autocorrelación parcial (PACF) sugieren una ligera autocorrelación de primer orden. Cabe destacar que la serie muestra cierta variación sistemática a una frecuencia semanal; aunque significativa, es mucho menos pronunciada que la autocorrelación diaria.
Por su parte, se han extraído los 100 retornos absolutos más grandes del objeto SieRet. Estos valores se muestran en el panel inferior derecho. Esta serie temporal confirma con mayor claridad lo que ya se podía inferir, la existencia de agrupamiento de volatilidad (volatility clustering) y segundo, que los retornos se vuelven más volátiles en la segunda mitad del período de análisis.
Aunque estos hechos estilizados se han ejemplificado únicamente con los retornos bursátiles de Siemens, no solo se aplican prácticamente a todas las acciones, sino que también son válidos para otras clases de activos, como bonos, monedas y futuros de materias primas.
Series financieras multivariadas
Desde la perspectiva de cartera, las características de las series de rentabilidad multivariadas son de interés, los siguientes los hechos estilizados:
- Las correlaciones contemporáneas no son constantes en el tiempo.
- Las observaciones extremas en una serie de retornos suelen ir acompañadas de extremos en la otra serie de retornos.
- El valor absoluto de las correlaciones cruzadas entre series de resultados es menos pronunciado y las correlaciones contemporáneas son en general las más fuertes.
- En cambio, los rendimientos absolutos o cuadráticos sí muestran altas correlaciones cruzadas. Este hallazgo empírico es similar al caso univariado.
En este caso, se emplean datos diarios de los mercados bursátiles europeos de Francia, Alemania y el Reino Unido, cómo se puede observar el movimiento conjunto entre estos tres mercados bursátiles europeos es bastante evidente.
Los hechos estilizados se reflejan en las correlaciones cruzadas de los retornos absolutos, los retornos en sí presentan escasa correlación cruzada entre mercados y tienden a disiparse con relativa rapidez. Sin embargo, se evidencian correlaciones cruzadas significativas en sus contrapartes absolutas. Este efecto es especialmente pronunciado entre el mercado bursátil alemán y el británico.
Por su parte, se estiman las correlaciones basadas en una ventana móvil de 250 observaciones, este cálculo se realiza luego mediante la función rollapply(), los gráficos de estas correlaciones son bastante similares para todos los pares representados, al igual que sus rangos. Para el par DAX/CAC, la correlación oscila entre 0.505 y 0.838; para DAX/FTSE, los valores se sitúan entre 0.42 y 0.749; y, por último, para CAC/FTSE, la correlación se encuentra en el intervalo de 0.451 a 0.76.
Además, para mostrar dependencias, similitudes o correlaciones entre activos financieros individuales, se utilizan gráficos estandarizados para proporcionar diferentes un punto de vista diferente de la cartera de activos.
Conclusiones de los hechos estilizados
Los hechos estilizados para rendimientos financieros univariados y multivariados presentados tienen un impacto en los modelos de riesgo y las medidas de riesgo que de ellos se derivan, ahora este momento podemos concluir lo siguiente:
- Los modelos de riesgo que asumen procesos fluidos para las pérdidas no son adecuados durante todos los episodios del mercado.
- Los modelos de riesgo que se basan en la distribución normal no lograrán predecir la frecuencia de eventos extremos (pérdidas).
- Los modelos de riesgo deberían poder abarcar y abordar los diferentes regímenes de volatilidad. Esto significa que las medidas de riesgo derivadas deben adaptarse a entornos cambiantes de baja y alta volatilidad.
- En el contexto de la cartera, el modelo empleado debe ser lo suficientemente flexible como para permitir dependencias cambiantes entre los activos; en particular, se debe tener en cuenta el movimiento conjunto de pérdidas.
Modelación de los retornos de los activos
La imagen muestra la distribución normal estándar, también conocida como campana de Gauss. Esta curva es fundamental en estadística y finanzas cuantitativas, ya que describe cómo se distribuyen muchas variables aleatorias en la naturaleza y en los mercados financieros bajo supuestos ideales.
En el eje horizontal se representan los valores de una variable aleatoria expresados en términos de desviaciones estándar respecto a la media (μ = 0), mientras que en el eje vertical se representa la densidad de probabilidad.
El 68,26% de los datos se encuentra dentro de una desviación estándar de la media (entre −1σ y +1σ). El 95,44% está comprendido entre −2σ y +2σ. El 99,74% se encuentra dentro del rango de −3σ a +3σ.
Existen múltiples funciones en R para probar si un conjunto de rendimientos de activos multivariante se distribuye normalmente. Las pruebas implementadas en esta clase son la prueba multivariante de Shapiro (Royston, 1982) y la prueba de estadística E no paramétrica, también llamada prueba de energía (Szekely, 1989; Rizzo, 2002; Szekely y Rizzo, 2005; Szekely, Rizzo y Bakirov, 2007).
Para realizar una prueba Shapiro multivariable, utilizaremos el conjunto de datos “LPP2005.RET” llamamos a la función assetsTest() con method=“shapiro”. Esta es la configuración predeterminada, por lo que la especificación del argumento method es opcional.
Prueba de Shapiro
Shapiro-Wilk normality test
data: Z
W = 0.98379, p-value = 0.0003096
Prueba electrónica
Como alternativa, podemos realizar una prueba de estadística electrónica multivariante. Para ello, debemos establecer el argumento method=“energy” explícitamente.
Energy test of multivariate normality: estimated parameters
data: x, sample size 377, dimension 4, replicates 99
E-statistic = 2.5605, p-value < 2.2e-16
El resultado devuelto por la prueba de estadísticas electrónicas ofrece una lista con todas las entradas de la prueba original, ka cual también rechaza la hipótesis de que los retornos son distribuidos normalmente de forma multivariada.
La prueba de Jarque-Bera
Esta es una prueba de bondad de ajuste para comprobar si una muestra de datos tiene la asimetría y la curtosis de una distribución normal. La prueba recibe el nombre de Carlos Jarque y Anil K. Bera y fue propuesta en 1980.
Jarque Bera Test
data: x[, "SBI"]
X-squared = 0.76045, df = 2, p-value = 0.6837
Jarque Bera Test
data: x[, "LMI"]
X-squared = 1.2082, df = 2, p-value = 0.5466
La estadística X-cuadrado muestra valores grandes para el índice SBI, el cual muestra el fuertes desviaciones de la normalidad por lo que se rechaza la hipótesis de que esta serie tengan una distribución normal. Mientras, el índice LMI si tiene en principio una distribución normal según los resultados obtenidos.
Estadísticas de los activos financieros
La función summary() para objetos timeSeries se comporta de la misma manera que para matrices numéricas. La función devuelve los valores mínimo y máximo para cada serie, el primer y tercer cuartil, y los valores medio y mediano. El siguiente ejemplo calcula estadísticas de resumen para los retornos logarítmicos del conjunto de datos SWX.
La función basicStats() se comporta de manera similar a summary() pero devuelve un espectro más amplio de medidas estadísticas.
SBI SPI SII
"Min. :-6.868e-03 " "Min. :-0.0690391 " "Min. :-1.587e-02 "
"1st Qu.:-7.238e-04 " "1st Qu.:-0.0047938 " "1st Qu.:-1.397e-03 "
"Median : 0.000e+00 " "Median : 0.0002926 " "Median : 4.868e-05 "
"Mean : 4.661e-06 " "Mean : 0.0002153 " "Mean : 2.034e-04 "
"3rd Qu.: 7.847e-04 " "3rd Qu.: 0.0056807 " "3rd Qu.: 1.851e-03 "
"Max. : 5.757e-03 " "Max. : 0.0578604 " "Max. : 1.541e-02 "
LP25
"Min. :-0.0131541 "
"1st Qu.:-0.0012479 "
"Median : 0.0002474 "
"Mean : 0.0001389 "
"3rd Qu.: 0.0015866 "
"Max. : 0.0132868 "
SBI SPI SII LP25
nobs 1916.000000 1916.000000 1916.000000 1916.000000
NAs 0.000000 0.000000 0.000000 0.000000
Minimum -0.006868 -0.069039 -0.015867 -0.013154
Maximum 0.005757 0.057860 0.015411 0.013287
1. Quartile -0.000724 -0.004794 -0.001397 -0.001248
3. Quartile 0.000785 0.005681 0.001851 0.001587
Mean 0.000005 0.000215 0.000203 0.000139
Median 0.000000 0.000293 0.000049 0.000247
Sum 0.008930 0.412553 0.389689 0.266111
SE Mean 0.000030 0.000248 0.000069 0.000058
LCL Mean -0.000054 -0.000270 0.000069 0.000025
UCL Mean 0.000063 0.000701 0.000338 0.000253
Variance 0.000002 0.000118 0.000009 0.000006
Stdev 0.001298 0.010843 0.003005 0.002542
Skewness -0.313206 -0.221507 0.084294 -0.134810
Kurtosis 1.516963 5.213489 2.592051 2.893592
From Trough To Depth Length ToTrough Recovery
1 2001-05-23 2001-09-21 2003-08-22 -0.08470881 588 88 500
2 2006-02-23 2006-06-13 2006-09-04 -0.03874938 138 79 59
3 2001-02-07 2001-03-22 2001-05-17 -0.03113929 72 32 40
4 2004-03-09 2004-06-14 2004-11-12 -0.03097196 179 70 109
5 2000-09-06 2000-10-12 2001-02-06 -0.02103069 110 27 83
6 2005-10-04 2005-10-28 2005-11-24 -0.01821392 38 19 19
7 2003-09-19 2003-09-30 2003-11-03 -0.01743572 32 8 24
8 2000-03-23 2000-05-22 2000-07-11 -0.01732134 79 43 36
9 2000-01-04 2000-01-06 2000-01-17 -0.01691072 10 3 7
10 2000-01-18 2000-02-22 2000-03-17 -0.01668657 44 26 18
Mientras, las medidas de caída describen la caída desde un pico histórico en alguna variable de precio o índice. Esto suele ocurrir en series de rendimiento acumulado de una estrategia de operaciones financieras.
Asimetria de las series de tiempo financieras
La asimetría (o skewness) es una medida estadística que describe la simetría o falta de simetría en la distribución de los rendimientos financieros en una serie de tiempo.
Una asimetría positiva (derecha): La cola derecha de la distribución es más larga o está más dispersa. Implica una mayor probabilidad de obtener ganancias extremas.
La cola izquierda es más larga o más pesada, indica mayor probabilidad de pérdidas extremas.
La distribución es simétrica, es una característica típica de la distribución normal (pero rara vez ocurre en la práctica financiera).
Curtosis de las series de tiempo financieras
La custosis, esta mide el grado de concentración de los datos alrededor de la media y la proporción de valores extremos (colas) en comparación con una distribución normal.
Curtosis mesocúrtica (≈ 3): Distribución “normal”. Nivel estándar de valores extremos.
Curtosis leptocúrtica (> 3): Colas más gruesas y un pico más alto, Implica mayor probabilidad de eventos extremos, tanto positivos como negativos, muy común en los rendimientos financieros.
Curtosis platicúrtica (< 3): Colas más delgadas, distribución más achatada, menor probabilidad de eventos extremos.
Distribución de error generalizada (GED)
En 1991 Nelson introdujo la distribución de error generalizada para modelar procesos de series temporales GARCH. La GED tiene colas alargadas exponencialmente. La GED incluye la distribución normal como un caso especial, junto con muchas otras distribuciones. Algunas tienen colas más gruesas que la normal, por ejemplo, la exponencial doble, y otras tienen colas más delgadas, como la distribución uniforme.
Si queremos comprobar si los tres índices de fondos de pensiones suizos tienen una distribución normal. Se trata de los denominados índices LPP de Pictet, denominados LPP25, LPP40 y LPP60. Los números reflejan la cantidad de acciones incluidas, por lo que los índices reflejan índices de referencia con niveles de riesgo crecientes. El archivo tiene 10 columnas: la primera contiene las fechas, las siguientes 6 datos de índices de bonos, REIT y acciones, y la última, los índices de referencia de los fondos de pensiones suizos. Descargue los datos y seleccione las columnas 2 a 5.
SII LP25 LP40 LP60
1 146.264 99.81 99.71 99.55
2 146.266 98.62 97.93 96.98
3 145.543 98.26 97.36 96.11
4 146.099 98.13 97.20 95.88
5 146.009 98.89 98.34 97.53
6 146.357 99.19 98.79 98.21
De acuerdo con los gráficos, las barras celestes representan la distribución original de los datos, la línea naranja presenta la media de los retornos, la línea roja indica la forma de la distribución normal, mientras que en verde se muestra la distribución de error generalizada ajustada (GED).
En términos generales, podemos concluir que todas las series tienen una asimetría negativa y están sesgadas a la izquierda; en el caso de la curtosis, se aprecia que estas series son leptocúrticas.
Descomposición de series de tiempo
La descomposición de series de tiempo financieras es una técnica que divide una serie temporal en componentes fundamentales como tendencia, estacionalidad, ciclo y residuales. Esto facilita el análisis de patrones subyacentes y la interpretación de los datos.
La descomposición de series de tiempo es una herramienta crucial en el análisis financiero porque permite:
Identificar Tendencias a Largo Plazo:Detectar el movimiento general de los precios de las acciones, tipos de cambio, o precios de las materias primas a largo plazo.
Detectar Patrones Estacionales: Reconocer los efectos recurrentes, como las fluctuaciones en las ventas en función de la época del año, o los movimientos de las acciones durante un trimestre específico.
Analizar Ciclos: Identificar los patrones de oscilación (subidas y bajadas) que pueden durar varios años o décadas.
Establecer Residuales: Determinar los factores restantes que no se explican por la tendencia, la estacionalidad o el ciclo, lo que puede indicar eventos específicos o ruido en los datos.
Descomposición del Índice S&P500
Ahora para la aplicación de estos conocimientos vamos a realizar la descomposición del Índice S&P500 de enero de 2018 a la fecha.
Modelado de residuos del Índice S&P500 con GARCH
GARCH significa “Generalized Autoregressive Conditional Heteroskedasticity”. Es un modelo más sofisticado que también estima volatilidad cambiante en el tiempo, pero con una estructura más flexible que aprende patrones de la propia varianza.
Detecta y modela “agrupamientos de volatilidad”: momentos donde los movimientos del mercado (grandes o pequeños) tienden a durar varios días o meses.
Conclusiones sobre el modelo GARCH
La línea de volatilidad GARCH se ajusta de forma dinámica a lo que “aprende” del mercado, si hubo una crisis o evento, la volatilidad GARCH se eleva y permanece alta por varios periodos.Nos da pistas sobre cuándo el mercado podría volverse más riesgoso o más estable.
Modelado de residuos del Índice S&P500 con EWMA
EWMA significa “Media Móvil Exponencialmente Ponderada”, es un modelo muy simple para estimar la volatilidad de una serie de tiempo financiera, como los rendimientos del S&P 500.
Este le da más peso a los datos recientes y menos a los antiguos, el argumento λ (lambda) es el peso: si es 0.94, quiere decir que el 94% de la varianza del día anterior se mantiene, y solo el 6% se actualiza con el nuevo dato.
Conclusiones sobre el modelo EWMA
Cuando los rendimientos recientes son más extremos o volátiles, la volatilidad EWMA sube rápidamente.Cuando el mercado está estable, la EWMA se aplana.
De acuerdo con el gráfico anterior los picos de volatilidad nos muestran momentos de mayor incertidumbre del mercado (puede ser crisis, noticias fuertes, etc. La zona sombreada muestra niveles “altos” de volatilidad (por encima del promedio histórico).