Stock Price Simulation using Geometric Brownian Motion (GBM) & Error Analysis

El GBM (Geometric Brownian Motion) es un modelo matemático utilizado en finanzas para describir la evolución de los precios de activos como acciones. Se basa en un movimiento browniano con un crecimiento exponencial, considerando una tasa de retorno constante y una volatilidad aleatoria. Es ampliamente usado en la valoración de opciones y en simulaciones de precios de activos.

Collect real stock price data from Yahoo Finance

Recolectamos datos de apple de la base de datos de yahoo finance con la ayuda de la librería quantmod de R

Instalar paquetes y llamar librerias

#install.packages("quantmod")
#install.packages("ggplot2")
#install.packages("dplyr")
#install.packages("tidyr")

library(quantmod)
library(ggplot2)
library(dplyr)
library(tidyr)

Paso 1: Recolectar datos reales de Yahoo Finance

symbol <- "AAPL"
start_date <- "2010-01-01"
end_date <- Sys.Date()

Descargar los datos

getSymbols(symbol, src = "yahoo", from = start_date, to = end_date)
## [1] "AAPL"

Extraer los precios de cierre

real_prices <- Cl(get(symbol))
summary(real_prices)
##      Index              AAPL.Close     
##  Min.   :2010-01-04   Min.   :  6.859  
##  1st Qu.:2013-10-14   1st Qu.: 20.600  
##  Median :2017-07-25   Median : 38.295  
##  Mean   :2017-07-24   Mean   : 71.104  
##  3rd Qu.:2021-05-05   3rd Qu.:131.560  
##  Max.   :2025-02-18   Max.   :259.020
head(real_prices)
##            AAPL.Close
## 2010-01-04   7.643214
## 2010-01-05   7.656429
## 2010-01-06   7.534643
## 2010-01-07   7.520714
## 2010-01-08   7.570714
## 2010-01-11   7.503929

Simulate stock prices using Geometric Brownian Motion (GBM)

Este fragmento de código en R simula precios utilizando el modelo Geométrico de Movimiento Browniano (GBM), que es útil para la modelización financiera y la predicción de precios futuros de activos basados en datos históricos.

Con μ=0.0009113= 0.0009113: Los precios tienen una ligera tendencia al alza. Con σ=0.01757= 0.01757: Los precios pueden mostrar variaciones diarias considerables alrededor de esa tendencia, reflejando la volatilidad del mercado. En conjunto, estos valores indican un activo financiero con un crecimiento esperado positivo a largo plazo, pero con fluctuaciones diarias moderadas. Esto es típico de muchos instrumentos financieros donde se espera un retorno a largo plazo pero con movimientos de precios diarios impredecibles.

Parámetros del modelo GBM

log_returns <- diff(log(real_prices))
mu <- mean(log_returns, na.rm = TRUE)
sigma <- sd(log_returns, na.rm = TRUE)
S0 <- as.numeric(head(real_prices, 1)) # precio inicial (primer precio real)

Verificar los parámetros calculados

cat("Mu: ", mu, "\n")
## Mu:  0.0009109554
cat("Sigma: ", sigma, "\n")
## Sigma:  0.01757749

Número de simulaciones y pasos

n_simulations <- 10  # Reducido para visualización
n_steps <- length(real_prices)
dt <- 1 / 252 # Asumimos 252 días de trading por año

Ajustar la tendencia con un modelo de regresión lineal

time_index <- 1:n_steps
lm_model <- lm(log(real_prices) ~ time_index)
trend <- lm_model$coefficients[1] + lm_model$coefficients[2] * time_index

Simular los precios usando el modelo GBM

set.seed(123)
simulated_prices <- matrix(0, nrow = n_steps, ncol = n_simulations)

for (i in 1:n_simulations) {
  W <- c(0, cumsum(rnorm(n_steps - 1, 0, sqrt(dt)))) # Caminata aleatoria de Wiener
  S <- exp(trend + (mu - 0.5 * sigma^2) * (0:(n_steps - 1)) * dt + sigma * W) # Modelo GBM ajustado con tendencia
  simulated_prices[, i] <- S
}

Verificar si hay NAs en los precios simulados

print(any(is.na(simulated_prices)))
## [1] FALSE

Compare the real and simulated prices using error metrics and interpret the results

Dado el rango amplio de precios y la naturaleza volátil de los datos bursátiles, estos errores no son excesivamente altos. son relativamente buenos

  • MSE: 208.1941: Este valor puede parecer alto, pero en el contexto de precios que han oscilado desde 7.64 hasta 241.53, es menos preocupante.

  • MAE: 10.01358: Este valor sugiere que, en promedio, los precios simulados difieren en aproximadamente 10 unidades de los precios reales.

En el contexto de precios que van desde 7.64 hasta 241.53, un MAE de 10 unidades no es extremadamente alto e indica que hay una discrepancia promedio notable que podría necesitar ajustes si se requiere una precisión más alta.

En esta tabla podemos observar los valores de las simulaciones comparadas con el precio real

How well did GBM simulate the real stock prices? compare with results from part 01 Las simulaciones en el GBM fueron más acertadas que las de la parte 1

What do the error metrics indicate about the model’s accuracy? Ambos errores tanto el MSE como el MAE fueron más bajos en el modelo de GBM lo que significa que tiene una precisión mayor ya que un MSE más bajo indica que las simulaciones están muy cerca de los precios reales en promedio. Es una medida de precisión global y un MAE más bajo indica que las diferencias absolutas entre los precios simulados y reales son pequeñas, lo que sugiere una buena precisión del modelo.

Error métricas

real_prices_vector <- as.numeric(real_prices)

Error cuadrático medio (MSE) y Error absoluto medio (MAE)

MSE <- mean((real_prices_vector - simulated_prices[,1])^2, na.rm = TRUE)  
MAE <- mean(abs(real_prices_vector - simulated_prices[,1]), na.rm = TRUE)  

cat("MSE: ", MSE, "\n")
## MSE:  208.1369
cat("MAE: ", MAE, "\n")
## MAE:  10.01158
# Calcular R-squared
SST <- sum((real_prices_vector - mean(real_prices_vector))^2)  # Suma total de los cuadrados
SSE <- sum((real_prices_vector - simulated_prices[,1])^2)  # Suma de los cuadrados de los errores
R_squared <- 1 - (SSE / SST)

cat("R-squared: ", R_squared, "\n")
## R-squared:  0.9532094
# Calcular MAPE (Mean Absolute Percentage Error)
MAPE <- mean(abs((real_prices_vector - simulated_prices[,1]) / real_prices_vector) * 100, na.rm = TRUE)

cat("MAPE: ", MAPE, "%\n")
## MAPE:  17.53245 %

Visualize and interpret the results

Interpretación La línea azul muestra una tendencia ascendente en los precios de las acciones de Apple Inc. desde 2010, reflejando un crecimiento constante en su valor. Los picos indican momentos de máximos históricos, posiblemente ligados a lanzamientos de productos o anuncios financieros positivos, mientras que los valles reflejan caídas por factores como crisis de mercado o informes negativos. Además, las líneas de diferentes colores representan precios simulados, y su similitud con la línea azul sugiere que las simulaciones capturan correctamente las tendencias generales del mercado.

Crear un dataframe para los gráficos

simulated_df <- data.frame(Date = index(real_prices), Real = real_prices_vector)

Convertir simulated_prices en un dataframe con nombres explícitos para las simulaciones

simulated_df <- cbind(simulated_df, simulated_prices)
colnames(simulated_df)[-(1:2)] <- paste0("Sim_", 1:n_simulations)

Convertir el dataframe a formato largo para ggplot

simulated_df_long <- simulated_df %>%
  pivot_longer(cols = starts_with("Sim_"), 
               names_to = "Simulation", 
               values_to = "Price")

Graficar precios reales vs simulados

ggplot(simulated_df_long) +
  geom_line(aes(x = Date, y = Price, color = Simulation)) +  # Mostrar todas las simulaciones
  geom_line(data = simulated_df, aes(x = Date, y = Real), color = "blue", size = 1) +  # Mostrar precios reales
  labs(title = "Comparación de precios reales y simulados",
       x = "Fecha", y = "Precio") +
  theme_minimal() +
  theme(legend.title = element_blank())
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

