![]()
Stock Price Simulation using Geometric
Brownian Motion (GBM) & Error Analysis
El GBM (Geometric Brownian Motion) es un modelo
matemático utilizado en finanzas para describir la evolución de los
precios de activos como acciones. Se basa en un movimiento browniano con
un crecimiento exponencial, considerando una tasa de retorno constante y
una volatilidad aleatoria. Es ampliamente usado en la valoración de
opciones y en simulaciones de precios de activos.
Collect real stock price data from Yahoo
Finance
Recolectamos datos de apple de la base de datos de yahoo finance con
la ayuda de la librería quantmod de R
Instalar paquetes y llamar
librerias
#install.packages("quantmod")
#install.packages("ggplot2")
#install.packages("dplyr")
#install.packages("tidyr")
library(quantmod)
library(ggplot2)
library(dplyr)
library(tidyr)
Paso 1: Recolectar datos reales de Yahoo
Finance
symbol <- "AAPL"
start_date <- "2010-01-01"
end_date <- Sys.Date()
Descargar los datos
getSymbols(symbol, src = "yahoo", from = start_date, to = end_date)
## [1] "AAPL"
Simulate stock prices using Geometric
Brownian Motion (GBM)
Este fragmento de código en R simula precios utilizando el modelo
Geométrico de Movimiento Browniano (GBM), que es útil para la
modelización financiera y la predicción de precios futuros de activos
basados en datos históricos.
Con μ=0.0009113= 0.0009113: Los precios tienen una
ligera tendencia al alza. Con σ=0.01757= 0.01757: Los
precios pueden mostrar variaciones diarias considerables alrededor de
esa tendencia, reflejando la volatilidad del mercado. En conjunto, estos
valores indican un activo financiero con un crecimiento esperado
positivo a largo plazo, pero con fluctuaciones diarias moderadas. Esto
es típico de muchos instrumentos financieros donde se espera un retorno
a largo plazo pero con movimientos de precios diarios impredecibles.
Parámetros del modelo GBM
log_returns <- diff(log(real_prices))
mu <- mean(log_returns, na.rm = TRUE)
sigma <- sd(log_returns, na.rm = TRUE)
S0 <- as.numeric(head(real_prices, 1)) # precio inicial (primer precio real)
Verificar los parámetros
calculados
cat("Mu: ", mu, "\n")
## Mu: 0.0009109554
cat("Sigma: ", sigma, "\n")
## Sigma: 0.01757749
Número de simulaciones y pasos
n_simulations <- 10 # Reducido para visualización
n_steps <- length(real_prices)
dt <- 1 / 252 # Asumimos 252 días de trading por año
Ajustar la tendencia con un modelo de
regresión lineal
time_index <- 1:n_steps
lm_model <- lm(log(real_prices) ~ time_index)
trend <- lm_model$coefficients[1] + lm_model$coefficients[2] * time_index
Simular los precios usando el modelo
GBM
set.seed(123)
simulated_prices <- matrix(0, nrow = n_steps, ncol = n_simulations)
for (i in 1:n_simulations) {
W <- c(0, cumsum(rnorm(n_steps - 1, 0, sqrt(dt)))) # Caminata aleatoria de Wiener
S <- exp(trend + (mu - 0.5 * sigma^2) * (0:(n_steps - 1)) * dt + sigma * W) # Modelo GBM ajustado con tendencia
simulated_prices[, i] <- S
}
Verificar si hay NAs en los precios
simulados
print(any(is.na(simulated_prices)))
## [1] FALSE
Compare the real and simulated prices
using error metrics and interpret the results
Dado el rango amplio de precios y la naturaleza volátil de los datos
bursátiles, estos errores no son excesivamente altos. son relativamente
buenos
MSE: 208.1941: Este valor puede parecer alto, pero en el contexto
de precios que han oscilado desde 7.64 hasta 241.53, es menos
preocupante.
MAE: 10.01358: Este valor sugiere que, en promedio, los precios
simulados difieren en aproximadamente 10 unidades de los precios
reales.
En el contexto de precios que van desde 7.64 hasta 241.53, un MAE de
10 unidades no es extremadamente alto e indica que hay una discrepancia
promedio notable que podría necesitar ajustes si se requiere una
precisión más alta.
En esta tabla podemos observar los valores de las simulaciones
comparadas con el precio real

How well did GBM simulate the real stock prices? compare with
results from part 01 Las simulaciones en el GBM fueron más
acertadas que las de la parte 1
What do the error metrics indicate about the model’s
accuracy? Ambos errores tanto el MSE como el MAE fueron más
bajos en el modelo de GBM lo que significa que tiene una precisión mayor
ya que un MSE más bajo indica que las simulaciones están muy cerca de
los precios reales en promedio. Es una medida de precisión global y un
MAE más bajo indica que las diferencias absolutas entre los precios
simulados y reales son pequeñas, lo que sugiere una buena precisión del
modelo.

Error métricas
real_prices_vector <- as.numeric(real_prices)
Error cuadrático medio (MSE) y Error
absoluto medio (MAE)
MSE <- mean((real_prices_vector - simulated_prices[,1])^2, na.rm = TRUE)
MAE <- mean(abs(real_prices_vector - simulated_prices[,1]), na.rm = TRUE)
cat("MSE: ", MSE, "\n")
## MSE: 208.1369
cat("MAE: ", MAE, "\n")
## MAE: 10.01158
# Calcular R-squared
SST <- sum((real_prices_vector - mean(real_prices_vector))^2) # Suma total de los cuadrados
SSE <- sum((real_prices_vector - simulated_prices[,1])^2) # Suma de los cuadrados de los errores
R_squared <- 1 - (SSE / SST)
cat("R-squared: ", R_squared, "\n")
## R-squared: 0.9532094
# Calcular MAPE (Mean Absolute Percentage Error)
MAPE <- mean(abs((real_prices_vector - simulated_prices[,1]) / real_prices_vector) * 100, na.rm = TRUE)
cat("MAPE: ", MAPE, "%\n")
## MAPE: 17.53245 %
Visualize and interpret the
results
Interpretación La línea azul muestra una tendencia
ascendente en los precios de las acciones de Apple Inc. desde 2010,
reflejando un crecimiento constante en su valor. Los picos indican
momentos de máximos históricos, posiblemente ligados a lanzamientos de
productos o anuncios financieros positivos, mientras que los valles
reflejan caídas por factores como crisis de mercado o informes
negativos. Además, las líneas de diferentes colores representan precios
simulados, y su similitud con la línea azul sugiere que las simulaciones
capturan correctamente las tendencias generales del mercado.
Crear un dataframe para los
gráficos
simulated_df <- data.frame(Date = index(real_prices), Real = real_prices_vector)
Convertir simulated_prices en un dataframe
con nombres explícitos para las simulaciones
simulated_df <- cbind(simulated_df, simulated_prices)
colnames(simulated_df)[-(1:2)] <- paste0("Sim_", 1:n_simulations)
Graficar precios reales vs
simulados
ggplot(simulated_df_long) +
geom_line(aes(x = Date, y = Price, color = Simulation)) + # Mostrar todas las simulaciones
geom_line(data = simulated_df, aes(x = Date, y = Real), color = "blue", size = 1) + # Mostrar precios reales
labs(title = "Comparación de precios reales y simulados",
x = "Fecha", y = "Precio") +
theme_minimal() +
theme(legend.title = element_blank())
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

---
title: "Tarea 4 parte 2"
author: "Equipo 1"
date: "2025-02-19"
output: 
  html_document: 
    toc: TRUE
    toc_float: TRUE
    code_download: TRUE
    theme: journal
---
![]()

# <span style = "color:blue;">Stock Price Simulation using Geometric Brownian Motion (GBM) & Error Analysis</span>
El **GBM (Geometric Brownian Motion)** es un modelo matemático utilizado en finanzas para describir la evolución de los precios de activos como acciones. Se basa en un movimiento browniano con un crecimiento exponencial, considerando una tasa de retorno constante y una volatilidad aleatoria. Es ampliamente usado en la valoración de opciones y en simulaciones de precios de activos.

# <span style = "color:blue;">Collect real stock price data from Yahoo Finance</span>
Recolectamos datos de apple de la base de datos de yahoo finance con la ayuda de la librería quantmod de R

## <span style = "color:blue;">Instalar paquetes y llamar librerias</span>
```{r message=FALSE, warning=FALSE}
#install.packages("quantmod")
#install.packages("ggplot2")
#install.packages("dplyr")
#install.packages("tidyr")

library(quantmod)
library(ggplot2)
library(dplyr)
library(tidyr)
```

## <span style = "color:blue;">Paso 1: Recolectar datos reales de Yahoo Finance</span>
```{r}
symbol <- "AAPL"
start_date <- "2010-01-01"
end_date <- Sys.Date()
```

## <span style = "color:blue;">Descargar los datos</span>
```{r}
getSymbols(symbol, src = "yahoo", from = start_date, to = end_date)
```

## <span style = "color:blue;">Extraer los precios de cierre</span>
```{r}
real_prices <- Cl(get(symbol))
summary(real_prices)
head(real_prices)
```

# <span style = "color:blue;"> Simulate stock prices using Geometric Brownian Motion (GBM)</span>
Este fragmento de código en R simula precios utilizando el modelo Geométrico de Movimiento Browniano (GBM), que es útil para la modelización financiera y la predicción de precios futuros de activos basados en datos históricos. 

Con **μ=0.0009113\mu = 0.0009113:** Los precios tienen una ligera tendencia al alza.
Con **σ=0.01757\sigma = 0.01757:** Los precios pueden mostrar variaciones diarias considerables alrededor de esa tendencia, reflejando la volatilidad del mercado.
En conjunto, estos valores indican un activo financiero con un crecimiento esperado positivo a largo plazo, pero con fluctuaciones diarias moderadas. Esto es típico de muchos instrumentos financieros donde se espera un retorno a largo plazo pero con movimientos de precios diarios impredecibles.


## <span style = "color:blue;">Parámetros del modelo GBM</span>
```{r}
log_returns <- diff(log(real_prices))
mu <- mean(log_returns, na.rm = TRUE)
sigma <- sd(log_returns, na.rm = TRUE)
S0 <- as.numeric(head(real_prices, 1)) # precio inicial (primer precio real)
```

## <span style = "color:blue;">Verificar los parámetros calculados</span>
```{r}
cat("Mu: ", mu, "\n")
cat("Sigma: ", sigma, "\n")
```

## <span style = "color:blue;">Número de simulaciones y pasos</span>
```{r}
n_simulations <- 10  # Reducido para visualización
n_steps <- length(real_prices)
dt <- 1 / 252 # Asumimos 252 días de trading por año
```

## <span style = "color:blue;">Ajustar la tendencia con un modelo de regresión lineal</span>
```{r}
time_index <- 1:n_steps
lm_model <- lm(log(real_prices) ~ time_index)
trend <- lm_model$coefficients[1] + lm_model$coefficients[2] * time_index
```

## <span style = "color:blue;">Simular los precios usando el modelo GBM</span>
```{r}
set.seed(123)
simulated_prices <- matrix(0, nrow = n_steps, ncol = n_simulations)

for (i in 1:n_simulations) {
  W <- c(0, cumsum(rnorm(n_steps - 1, 0, sqrt(dt)))) # Caminata aleatoria de Wiener
  S <- exp(trend + (mu - 0.5 * sigma^2) * (0:(n_steps - 1)) * dt + sigma * W) # Modelo GBM ajustado con tendencia
  simulated_prices[, i] <- S
}

```

## <span style = "color:blue;">Verificar si hay NAs en los precios simulados</span>
```{r}
print(any(is.na(simulated_prices)))
```

# <span style = "color:blue;">Compare the real and simulated prices using error metrics and interpret the results</span>
Dado el rango amplio de precios y la naturaleza volátil de los datos bursátiles, estos errores no son excesivamente altos.  son relativamente buenos

* MSE: 208.1941: Este valor puede parecer alto, pero en el contexto de precios que han oscilado desde 7.64 hasta 241.53, es menos preocupante.

* MAE: 10.01358: Este valor sugiere que, en promedio, los precios simulados difieren en aproximadamente 10 unidades de los precios reales.

En el contexto de precios que van desde 7.64 hasta 241.53, un MAE de 10 unidades no es extremadamente alto e indica que hay una discrepancia promedio notable que podría necesitar ajustes si se requiere una precisión más alta.

En esta tabla podemos observar los valores de las simulaciones comparadas con el precio real

![](C:\\Users\\Luis Mendoza\\Downloads\\Simulaciones.png)

**How well did GBM simulate the real stock prices? compare with results from part 01**
Las simulaciones en el GBM fueron más acertadas que las de la parte 1
 
**What do the error metrics indicate about the model’s accuracy?**
Ambos errores tanto el MSE como el MAE fueron más bajos en el modelo de GBM lo que significa que tiene una precisión mayor ya que un MSE más bajo indica que las simulaciones están muy cerca de los precios reales en promedio. Es una medida de precisión global y un MAE más bajo indica que las diferencias absolutas entre los precios simulados y reales son pequeñas, lo que sugiere una buena precisión del modelo.


![](C:\\Users\\Luis Mendoza\\Downloads\\MAE MSE.png)

## <span style = "color:blue;">Error métricas</span>
```{r}
real_prices_vector <- as.numeric(real_prices)
```

## <span style = "color:blue;">Error cuadrático medio (MSE) y Error absoluto medio (MAE)</span>
```{r}
MSE <- mean((real_prices_vector - simulated_prices[,1])^2, na.rm = TRUE)  
MAE <- mean(abs(real_prices_vector - simulated_prices[,1]), na.rm = TRUE)  

cat("MSE: ", MSE, "\n")
cat("MAE: ", MAE, "\n")

# Calcular R-squared
SST <- sum((real_prices_vector - mean(real_prices_vector))^2)  # Suma total de los cuadrados
SSE <- sum((real_prices_vector - simulated_prices[,1])^2)  # Suma de los cuadrados de los errores
R_squared <- 1 - (SSE / SST)

cat("R-squared: ", R_squared, "\n")

# Calcular MAPE (Mean Absolute Percentage Error)
MAPE <- mean(abs((real_prices_vector - simulated_prices[,1]) / real_prices_vector) * 100, na.rm = TRUE)

cat("MAPE: ", MAPE, "%\n")
```

# <span style = "color:blue;">Visualize and interpret the results</span>
**Interpretación**
La línea azul muestra una tendencia ascendente en los precios de las acciones de Apple Inc. desde 2010, reflejando un crecimiento constante en su valor. Los picos indican momentos de máximos históricos, posiblemente ligados a lanzamientos de productos o anuncios financieros positivos, mientras que los valles reflejan caídas por factores como crisis de mercado o informes negativos. Además, las líneas de diferentes colores representan precios simulados, y su similitud con la línea azul sugiere que las simulaciones capturan correctamente las tendencias generales del mercado.


## <span style = "color:blue;">Crear un dataframe para los gráficos</span>
```{r}
simulated_df <- data.frame(Date = index(real_prices), Real = real_prices_vector)
```

## <span style = "color:blue;">Convertir simulated_prices en un dataframe con nombres explícitos para las simulaciones</span>
```{r}
simulated_df <- cbind(simulated_df, simulated_prices)
colnames(simulated_df)[-(1:2)] <- paste0("Sim_", 1:n_simulations)
```

## <span style = "color:blue;">Convertir el dataframe a formato largo para ggplot</span>
```{r}
simulated_df_long <- simulated_df %>%
  pivot_longer(cols = starts_with("Sim_"), 
               names_to = "Simulation", 
               values_to = "Price")
```

## <span style = "color:blue;">Graficar precios reales vs simulados</span>
```{r}
ggplot(simulated_df_long) +
  geom_line(aes(x = Date, y = Price, color = Simulation)) +  # Mostrar todas las simulaciones
  geom_line(data = simulated_df, aes(x = Date, y = Real), color = "blue", size = 1) +  # Mostrar precios reales
  labs(title = "Comparación de precios reales y simulados",
       x = "Fecha", y = "Precio") +
  theme_minimal() +
  theme(legend.title = element_blank())
```



