Thiết lập phương pháp Monte Carlo mô phỏng giá trị lợi nhuận
Trong ứng dụng này, mã cổ phiếu được lựa chọn phân tích từ tệp dữ
liệu là mã DVN trong 120 ngày tới. Dữ liệu bao gồm lịch sử các mã cổ
phiếu từ 04/01/2021 tới 30/12/2022 và được tải xuống dưới định dạng file
csv. Link file dữ liệu: https://bom.so/6FlMwf
#Tải xuống các packages sau
install.packages("tidyquant")
install.packages("quantmod")
install.packages("zoo")
#Sử dụng các thư viện sau
library(tidyquant)
library(quantmod)
library(zoo)
Trước khi bắt đầu phân tích dữ liệu cổ phiếu, ta cần tải xuống các
gói thư viện liên quan phục vụ cho quá trình sử dụng sau này.
#Thay đổi thư mục làm việc phù hợp với thư mục đang sử dụng hiện tại
setwd("D:/KPIM/PVI")
#Tải dữ liệu lên R
Stock <- read.csv("StockData.csv", header = TRUE)
#Lọc dữ liệu với mã cổ phiếu mong muốn phân tích
DVN <- Stock[Stock$ma == "DVN",]
#Định dạng ngày của dữ liệu
DVN$ngay <- as.Date(DVN$ngay)
#Chuyển đổi dữ liệu của mã cổ phiếu thành dữ liệu theo chuỗi thời gian và chọn giá đóng cửa làm giá trị phân tích lợi nhuận hàng ngày
DVN_xts <- xts(DVN$gia_dong_cua, start = min(DVN$ngay), end = max(DVN$ngay), order.by = DVN$ngay, frequency = 1)
Để tải dữ liệu vào sử dụng, cần thiết lập thư mục làm việc hiện tại
và tất cả tệp dữ liệu cần được lưu trong thư mục này.
#Tính lợi nhuận hàng ngày
daily_returns <- dailyReturn(DVN_xts)
# Tính giá trị trung bình của lợi nhuận hàng ngày
daily_mean <- mean(daily_returns)
# Tính độ lệch chuẩn của lợi nhuận hàng ngày
daily_std_dev <- sd(daily_returns)
Trong mô phỏng này, lợi nhuận thị trường cổ phiếu được giả định là
phân phối chuẩn và các thông số được tính toán như lợi nhuận hàng ngày,
giá trị trung bình của lợi nhuận hàng ngày, độ lệch chuẩn của lợi nhuận.
Các thông số này sẽ được sử dụng để tạo ra các biến ngẫu nhiên trong mô
hình.
# Xác định số ngày cần mô phỏng
no_of_days <- 120
# Xác định giá khởi điểm của quá trình mô phỏng
starting_price <- last(DVN$gia_dong_cua)[[1]]
Dữ liệu sẽ được mô phỏng trong 120 ngày tới và giá khởi điểm của ngày
đầu tiên trong thời điểm mô phỏng sẽ là giá đóng cửa cuối cùng trong dữ
liệu giá lịch sử của mã cổ phiếu.
Lợi nhuận hàng ngày được tạo bằng cách sử dụng phân phối chuẩn với
giá trị trung bình và độ lệch chuẩn đã được tính toán trước đó. Để tính
giá của cổ phiếu, cần thực hiện tính tích lũy của lợi nhuận và giá khởi
điểm. Kết quả dưới đây là biểu đồ thể hiện giá mô phỏng của mã cổ phiếu
trong 120 ngày tới.
# Tạo cơ sở số lượng các mẫu ngẫu nhiên sẽ được tạo
set.seed(101)
# Tính giá trị lợi nhuận dựa trên các giá trị ngẫu nhiên
returns <- 1+rnorm(no_of_days, mean=daily_mean, sd=daily_std_dev)
# Tính giá cổ phiếu thông qua tích lũy của giá khởi điểm và lợi nhuận
prices <- cumprod(c(starting_price, returns))
# Vẽ biểu đồ thể hiện mô phỏng của giá cổ phiếu trong tương lai
plot(prices, type='l', ylab="Giá cổ phiếu", xlab="Số ngày", main = "Mô phỏng giá của mã cổ phiếu DVN")

Tuy nhiên, chỉ chạy một mô phỏng sẽ không đủ để đưa ra kết luận. Vì
vậy, để đưa ra kết quả sát với thực tế nhất, ta sẽ thực hiện chạy 1001
mô phỏng trong 120 ngày với mỗi mô phỏng. Dữ liệu được lưu trữ hai chiều
dưới dạng ma trận và 50 mô phỏng đầu tiên được biểu diễn trong đồ thị
dưới đây.
# Số lượng thực hiện vòng lặp mô phỏng
no_of_sims <- 1001
# Danh sách giá trị của lợi nhuận
returns_list <- matrix(0, nrow = no_of_sims, ncol = no_of_days)
# Danh sách giá của cổ phiếu
prices_list <- matrix(0, nrow = no_of_sims, ncol = no_of_days+1)
# Vòng lặp thực hiện mô phỏng trong số ngày được chỉ định
for(i in 1:no_of_sims) {
returns_list[i,] <- rnorm(no_of_days, mean=daily_mean, sd=daily_std_dev)
prices_list[i,] <- cumprod(c(starting_price, 1+returns_list[i,]))
}
# Biểu diễn dưới dạng đồ thị 50 mô phỏng đầu tiên
plot(prices_list[1,], type='l', ylab="Giá cổ phiếu", xlab="Số ngày", main = "Mô phỏng giá của mã cổ phiếu DVN", ylim=c(10000, 50000))
for(i in 1:50) {
lines(prices_list[i, ], type = 'l', col=i)
}

Như chúng ta có thể thấy, kết quả của các mô phỏng có sự đa dạng khác
nhau. Một số kết thúc dưới điểm bắt đầu và một số tăng rất nhanh. Dựa
trên 50 mô phỏng đầu tiên, mã cổ phiếu có xu hướng lợi nhuận âm trong
thời gian tới. Để xem xét cụ thể hơn, ta sẽ tính tổng lợi nhuận thu
về:
# Tạo mảng đa chiều chứa dữ liệu của lợi nhuận
total_returns <- array(NA, dim= no_of_sims, dimnames=NULL)
# Vòng lặp nhằm tính giá trị của tổng lợi nhuận với mỗi mô phỏng
for (i in 1:no_of_sims) {
total_returns[i] <- (prices_list[i, 121]-prices_list[i, 1])/prices_list[i,1]
}
# Thống kê kết quả của lợi nhuận thu về
summary(total_returns)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-0.69017 -0.27815 -0.12232 -0.10020 0.03253 0.96066
Kết luận cho thấy mô phỏng có xu hướng lợi nhuận âm, hơn 50% kết quả
mô phỏng cho ra giá trị < 0 bởi giá trị trung vị, giá trị trung bình
và phân vị thứ nhất đều thể hiện điều này. Để trực quan hóa kết quả, ta
có thể xem xét 1 số biểu đồ sau:
par(mfrow=c(1,3))
hist(total_returns, col="blue")
boxplot(total_returns, col="yellow")
plot(density(total_returns))

Các giá trị ngoại lai của biểu đồ Boxplot thường thể hiện mặt dương
của lợi nhuận và biểu đồ thể hiện sự phân phối lệch phải rõ rệt. Điều
này có thể xác nhận dựa trên thông số độ lệch dưới đây:
# Tính độ lệch của dữ liệu lợi nhuận
skewness(total_returns)
[1] 0.7771115
Để hiển thị biểu đồ dễ đọc hơn, sẽ chỉ có ba mô phỏng sẽ được đưa
vào: giá trị trung bình, giá trị tối thiểu và giá trị tối đa. Các dữ
liệu này được lấy từ phân tích dữ liệu với biểu đồ phía trên. Tiếp tục
thực hiện với sự lặp lại của 1001 mô phỏng.
# Tìm vị trí giá trị lớn nhất của lợi nhuận
max <- which.max(total_returns)
# Tìm vị trí giá trị nhỏ nhất của lợi nhuận
min <- which.min(total_returns)
# Tìm vị trí của giá trị trung vị
if (no_of_sims %% 2 != 0) {med <- match(median(total_returns), total_returns)}
# Biểu diễn đồ thị với 3 giá trị trên
plot(prices_list[min,], type='l', ylab="Giá cổ phiếu", xlab="Số ngày", main ="Mô phỏng giá của mã cổ phiếu DVN", ylim=c(9000, 60000), col="red")
if (no_of_sims %% 2 != 0) {lines(prices_list[med, ], type = 'l', col='yellow')}
lines(prices_list[max, ], type = 'l', col='green')

Qua đó, chúng ta có thể dễ dàng nhìn thấy trường hợp giá trị mô phỏng
tốt nhất, xấu nhất và trung bình. Để trả lời câu hỏi đầu tiên, dựa trên
các biểu đồ và dữ liệu, ta có thể kỳ vọng mức lợi nhuận nằm trong khoảng
từ -69.02% đến 96.07%.
# Tính giá trị lợi nhuận có thể đạt được lớn nhất
max_return <- max(total_returns)
max_return
[1] 0.960663
# Tính giá trị lợi nhuận có thể đạt được nhỏ nhất
min_return <- min(total_returns)
min_return
[1] -0.6901731
Để trả lời 2 câu hỏi cuối, ta sẽ thực hiện tính xác suất nhằm đạt
được kết quả mong muốn.
# Mức lợi nhuận cần lớn hơn
condition1 <- sum(total_returns > 0.12)
# Mức lợi nhuận cần nhỏ hơn
condition2 <- sum(total_returns < -0.2)
# Xác suất xảy ra các trường hợp
probability1 <- condition1/no_of_sims
probability2 <- condition2/no_of_sims
# Kết quả đạt được
cat("Xác suất để đạt được lợi nhuận tối thiểu 12% là: ", probability1*100, "%", ". Xác suất để lỗ nhiều hơn 20% khoản đầu tư là: ", probability2*100, "%")
Xác suất để đạt được lợi nhuận tối thiểu 12% là: 17.08292 % . Xác suất để lỗ nhiều hơn 20% khoản đầu tư là: 37.66234 %
---
title: "Mô phỏng lợi nhuận cổ phiếu sử dụng phương pháp Monte Carlo"
author: "Lan Pham"
date: "2023-04-10"
output: html_notebook
---

## Giới thiệu về phương pháp Monte Carlo
Phương pháp Monte Carlo là một phương pháp tính toán dựa trên việc xây dựng mô hình toán học và sử dụng số ngẫu nhiên để mô phỏng các giá trị đầu vào của mô hình. Kết quả của các phép tính được thực hiện trên các giá trị này được sử dụng để tính toán giá trị đầu ra của vấn đề.

Thị trường chứng khoán trở thành một đề tài được quan tâm bởi tính biến động khó lường.Vì vậy, ứng dụng phương pháp Monte Carlo trong phân tích cổ phiếu đóng vai trò quan trọng giúp đưa ra các dự báo về giá cổ phiếu dựa trên một mô hình toán học chính xác, đồng thời, giúp các nhà đầu tư đưa ra các quyết định đầu tư thông minh hơn. Tuy nhiên, cần lưu ý rằng các dự báo này chỉ là ước tính và không đảm bảo rằng kết quả thực tế sẽ diễn ra theo dự báo.

Mỗi loại mô phỏng Monte Carlo đều có các bước thực hiện sau đây:

- Xác định một tập hợp các đầu vào có thể và phân bố của chúng

- Tạo ra các đầu vào ngẫu nhiên từ một phân bố xác suất

- Thực hiện tính toán xác định

- Phân tích kết quả

## Bài toán mô phỏng lợi nhuận cổ phiếu
Một trong những bài toán về cổ phiếu có thể ứng dụng phương pháp Monte Carlo để giải quyết chính là đưa ra các dự báo về lợi nhuận trong tương lai. Ta có thể tạo ra mô hình toán học của giá trị lợi nhuận dựa trên các yếu tố lịch sử theo thời gian của mã cổ phiếu. Mô hình này có thể là một mô hình ngẫu nhiên, trong đó các giá trị của các yếu tố ảnh hưởng được tạo ra bằng cách sử dụng số ngẫu nhiên.

Kết quả của mô phỏng Monte Carlo này sẽ cung cấp cho chúng ta một cái nhìn về khả năng xảy ra lợi nhuận của cổ phiếu trong tương lai, giúp ta đưa ra quyết định đầu tư thông minh hơn. Những câu hỏi phương pháp này có thể trả lời bao gồm: 

- Lợi nhuận kỳ vọng trên thị trường cổ phiếu trong một khoảng thời gian tới?
(Ví dụ: Lợi nhuận kỳ vọng có thể đạt được trong vòng 120 ngày tới là bao nhiêu?)

- Xác suất của việc tạo nên một giá trị lợi nhuận nhất định trong một khoảng thời gian tới?
(Ví dụ: Xác suất của việc đạt 12% lợi nhuận trong 120 ngày tới là bao nhiêu?)

- Xác suất của việc mất nhiều hơn một giá trị đầu tư nhất định trong một khoảng thời gian tới?
(Ví dụ: Xác suất của việc lỗ nhiều hơn 20% khoản đầu tư trong vòng 120 ngày tới là bao nhiêu?)

## Thiết lập phương pháp Monte Carlo mô phỏng giá trị lợi nhuận
Trong ứng dụng này, mã cổ phiếu được lựa chọn phân tích từ tệp dữ liệu là mã DVN trong 120 ngày tới. Dữ liệu bao gồm lịch sử các mã cổ phiếu từ 04/01/2021 tới 30/12/2022 và được tải xuống dưới định dạng file csv. Link file dữ liệu: https://bom.so/6FlMwf

```{r}
#Tải xuống các packages sau
install.packages("tidyquant")
install.packages("quantmod")
install.packages("zoo")

#Sử dụng các thư viện sau
library(tidyquant)
library(quantmod)
library(zoo)
```
Trước khi bắt đầu phân tích dữ liệu cổ phiếu, ta cần tải xuống các gói thư viện liên quan phục vụ cho quá trình sử dụng sau này.

```{r}
#Thay đổi thư mục làm việc phù hợp với thư mục đang sử dụng hiện tại
setwd("D:/KPIM/PVI")

#Tải dữ liệu lên R
Stock <- read.csv("StockData.csv", header = TRUE)

#Lọc dữ liệu với mã cổ phiếu mong muốn phân tích
DVN <- Stock[Stock$ma == "DVN",]

#Định dạng ngày của dữ liệu
DVN$ngay <- as.Date(DVN$ngay)

#Chuyển đổi dữ liệu của mã cổ phiếu thành dữ liệu theo chuỗi thời gian và chọn giá đóng cửa làm giá trị phân tích lợi nhuận hàng ngày
DVN_xts <- xts(DVN$gia_dong_cua, start = min(DVN$ngay), end = max(DVN$ngay), order.by = DVN$ngay, frequency = 1)
```
Để tải dữ liệu vào sử dụng, cần thiết lập thư mục làm việc hiện tại và tất cả tệp dữ liệu cần được lưu trong thư mục này.

```{r}
#Tính lợi nhuận hàng ngày
daily_returns <- dailyReturn(DVN_xts)

# Tính giá trị trung bình của lợi nhuận hàng ngày
daily_mean <- mean(daily_returns)

# Tính độ lệch chuẩn của lợi nhuận hàng ngày
daily_std_dev <- sd(daily_returns)
```
Trong mô phỏng này, lợi nhuận thị trường cổ phiếu được giả định là phân phối chuẩn và các thông số được tính toán như lợi nhuận hàng ngày, giá trị trung bình của lợi nhuận hàng ngày, độ lệch chuẩn của lợi nhuận. Các thông số này sẽ được sử dụng để tạo ra các biến ngẫu nhiên trong mô hình. 


```{r}
# Xác định số ngày cần mô phỏng
no_of_days <- 120

# Xác định giá khởi điểm của quá trình mô phỏng
starting_price <- last(DVN$gia_dong_cua)[[1]]
```
Dữ liệu sẽ được mô phỏng trong 120 ngày tới và giá khởi điểm của ngày đầu tiên trong thời điểm mô phỏng sẽ là giá đóng cửa cuối cùng trong dữ liệu giá lịch sử của mã cổ phiếu.

Lợi nhuận hàng ngày được tạo bằng cách sử dụng phân phối chuẩn với giá trị trung bình và độ lệch chuẩn đã được tính toán trước đó. Để tính giá của cổ phiếu, cần thực hiện tính tích lũy của lợi nhuận và giá khởi điểm. Kết quả dưới đây là biểu đồ thể hiện giá mô phỏng của mã cổ phiếu trong 120 ngày tới.
```{r}
# Tạo cơ sở số lượng các mẫu ngẫu nhiên sẽ được tạo
set.seed(101)

# Tính giá trị lợi nhuận dựa trên các giá trị ngẫu nhiên
returns <- 1+rnorm(no_of_days, mean=daily_mean, sd=daily_std_dev)

# Tính giá cổ phiếu thông qua tích lũy của giá khởi điểm và lợi nhuận
prices <- cumprod(c(starting_price, returns))

# Vẽ biểu đồ thể hiện mô phỏng của giá cổ phiếu trong tương lai
plot(prices, type='l', ylab="Giá cổ phiếu", xlab="Số ngày", main = "Mô phỏng giá của mã cổ phiếu DVN")
```

Tuy nhiên, chỉ chạy một mô phỏng sẽ không đủ để đưa ra kết luận. Vì vậy, để đưa ra kết quả sát với thực tế nhất, ta sẽ thực hiện chạy 1001 mô phỏng trong 120 ngày với mỗi mô phỏng. Dữ liệu được lưu trữ hai chiều dưới dạng ma trận và 50 mô phỏng đầu tiên được biểu diễn trong đồ thị dưới đây.
```{r}
# Số lượng thực hiện vòng lặp mô phỏng
no_of_sims <- 1001

# Danh sách giá trị của lợi nhuận
returns_list <- matrix(0, nrow = no_of_sims, ncol = no_of_days)

# Danh sách giá của cổ phiếu
prices_list <- matrix(0, nrow = no_of_sims, ncol = no_of_days+1) 

# Vòng lặp thực hiện mô phỏng trong số ngày được chỉ định
for(i in 1:no_of_sims) {
  returns_list[i,] <- rnorm(no_of_days, mean=daily_mean, sd=daily_std_dev)
  prices_list[i,] <- cumprod(c(starting_price, 1+returns_list[i,]))
  }

# Biểu diễn dưới dạng đồ thị 50 mô phỏng đầu tiên
plot(prices_list[1,], type='l', ylab="Giá cổ phiếu", xlab="Số ngày", main = "Mô phỏng giá của mã cổ phiếu DVN", ylim=c(10000, 50000))
for(i in 1:50) {
  lines(prices_list[i, ], type = 'l', col=i)
}
```
Như chúng ta có thể thấy, kết quả của các mô phỏng có sự đa dạng khác nhau. Một số kết thúc dưới điểm bắt đầu và một số tăng rất nhanh. Dựa trên 50 mô phỏng đầu tiên, mã cổ phiếu có xu hướng lợi nhuận âm trong thời gian tới. Để xem xét cụ thể hơn, ta sẽ tính tổng lợi nhuận thu về:

```{r}
# Tạo mảng đa chiều chứa dữ liệu của lợi nhuận
total_returns <- array(NA, dim= no_of_sims, dimnames=NULL)

# Vòng lặp nhằm tính giá trị của tổng lợi nhuận với mỗi mô phỏng
for (i in 1:no_of_sims) {
  total_returns[i] <- (prices_list[i, 121]-prices_list[i, 1])/prices_list[i,1]
}

# Thống kê kết quả của lợi nhuận thu về
summary(total_returns)
```
Kết luận cho thấy mô phỏng có xu hướng lợi nhuận âm, hơn 50% kết quả mô phỏng cho ra giá trị < 0 bởi giá trị trung vị, giá trị trung bình và phân vị thứ nhất đều thể hiện điều này. Để trực quan hóa kết quả, ta có thể xem xét 1 số biểu đồ sau:
```{r}
par(mfrow=c(1,3))
hist(total_returns, col="blue")
boxplot(total_returns, col="yellow")
plot(density(total_returns))
```
Các giá trị ngoại lai của biểu đồ Boxplot thường thể hiện mặt dương của lợi nhuận và biểu đồ thể hiện sự phân phối lệch phải rõ rệt. Điều này có thể xác nhận dựa trên thông số độ lệch dưới đây:

```{r}
# Tính độ lệch của dữ liệu lợi nhuận
skewness(total_returns)
```

Để hiển thị biểu đồ dễ đọc hơn, sẽ chỉ có ba mô phỏng sẽ được đưa vào: giá trị trung bình, giá trị tối thiểu và giá trị tối đa. Các dữ liệu này được lấy từ phân tích dữ liệu với biểu đồ phía trên. Tiếp tục thực hiện với sự lặp lại của 1001 mô phỏng.
```{r}
# Tìm vị trí giá trị lớn nhất của lợi nhuận
max <- which.max(total_returns)

# Tìm vị trí giá trị nhỏ nhất của lợi nhuận
min <- which.min(total_returns)

# Tìm vị trí của giá trị trung vị
if (no_of_sims %% 2 != 0) {med <- match(median(total_returns), total_returns)}

# Biểu diễn đồ thị với 3 giá trị trên
plot(prices_list[min,], type='l', ylab="Giá cổ phiếu", xlab="Số ngày", main ="Mô phỏng giá của mã cổ phiếu DVN", ylim=c(9000, 60000), col="red")
if (no_of_sims %% 2 != 0) {lines(prices_list[med, ], type = 'l', col='yellow')}
lines(prices_list[max, ], type = 'l', col='green')
```

Qua đó, chúng ta có thể dễ dàng nhìn thấy trường hợp giá trị mô phỏng tốt nhất, xấu nhất và trung bình. Để trả lời câu hỏi đầu tiên, dựa trên các biểu đồ và dữ liệu, ta có thể kỳ vọng mức lợi nhuận nằm trong khoảng từ -69.02% đến 96.07%.
```{r}
# Tính giá trị lợi nhuận có thể đạt được lớn nhất
max_return <- max(total_returns)
max_return

# Tính giá trị lợi nhuận có thể đạt được nhỏ nhất
min_return <- min(total_returns)
min_return
```
Để trả lời 2 câu hỏi cuối, ta sẽ thực hiện tính xác suất nhằm đạt được kết quả mong muốn.
```{r}
# Mức lợi nhuận cần lớn hơn
condition1 <- sum(total_returns > 0.12)

# Mức lợi nhuận cần nhỏ hơn
condition2 <- sum(total_returns < -0.2)

# Xác suất xảy ra các trường hợp
probability1 <- condition1/no_of_sims
probability2 <- condition2/no_of_sims

# Kết quả đạt được
cat("Xác suất để đạt được lợi nhuận tối thiểu 12% là: ", probability1*100, "%", ". Xác suất để lỗ nhiều hơn 20% khoản đầu tư là: ", probability2*100, "%")
```
## Kết luận
Phương pháp này đã cung cấp nhiều hiểu biết sâu sắc về thị trường chứng khoán mà rất khó để tính toán theo cách khác. Ví dụ này minh họa rằng Mô phỏng Monte Carlo có thể được ứng dụng thực tiễn bởi các nhà đầu tư, quỹ phòng hộ và các tổ chức tài chính khác vào quá trình ra quyết định của họ.
