Thiết lập phương pháp Monte Carlo mô phỏng giá trị lợi nhuận
Trong ứng dụng này, mã cổ phiếu được lựa chọn phân tích từ tệp dữ
liệu là mã DVN trong 120 ngày tới. Dữ liệu bao gồm lịch sử các mã cổ
phiếu từ 04/01/2021 tới 30/12/2022 và được tải xuống dưới định dạng file
csv. Link file dữ liệu: https://bom.so/6FlMwf
#Tải xuống các packages sau
install.packages("tidyquant")
install.packages("quantmod")
install.packages("zoo")
#Sử dụng các thư viện sau
library(tidyquant)
library(quantmod)
library(zoo)
Trước khi bắt đầu phân tích dữ liệu cổ phiếu, ta cần tải xuống các
gói thư viện liên quan phục vụ cho quá trình sử dụng sau này.
#Thay đổi thư mục làm việc phù hợp với thư mục đang sử dụng hiện tại
setwd("D:/KPIM/PVI")
#Tải dữ liệu lên R
Stock <- read.csv("StockData.csv", header = TRUE)
#Lọc dữ liệu với mã cổ phiếu mong muốn phân tích
DVN <- Stock[Stock$ma == "DVN",]
#Định dạng ngày của dữ liệu
DVN$ngay <- as.Date(DVN$ngay)
#Chuyển đổi dữ liệu của mã cổ phiếu thành dữ liệu theo chuỗi thời gian và chọn giá đóng cửa làm giá trị phân tích lợi nhuận hàng ngày
DVN_xts <- xts(DVN$gia_dong_cua, start = min(DVN$ngay), end = max(DVN$ngay), order.by = DVN$ngay, frequency = 1)
Để tải dữ liệu vào sử dụng, cần thiết lập thư mục làm việc hiện tại
và tất cả tệp dữ liệu cần được lưu trong thư mục này.
#Tính lợi nhuận hàng ngày
daily_returns <- dailyReturn(DVN_xts)
# Tính giá trị trung bình của lợi nhuận hàng ngày
daily_mean <- mean(daily_returns)
# Tính độ lệch chuẩn của lợi nhuận hàng ngày
daily_std_dev <- sd(daily_returns)
Trong mô phỏng này, lợi nhuận thị trường cổ phiếu được giả định là
phân phối chuẩn và các thông số được tính toán như lợi nhuận hàng ngày,
giá trị trung bình của lợi nhuận hàng ngày, độ lệch chuẩn của lợi nhuận.
Các thông số này sẽ được sử dụng để tạo ra các biến ngẫu nhiên trong mô
hình.
# Xác định số ngày cần mô phỏng
no_of_days <- 120
# Xác định giá khởi điểm của quá trình mô phỏng
starting_price <- last(DVN$gia_dong_cua)[[1]]
Dữ liệu sẽ được mô phỏng trong 120 ngày tới và giá khởi điểm của ngày
đầu tiên trong thời điểm mô phỏng sẽ là giá đóng cửa cuối cùng trong dữ
liệu giá lịch sử của mã cổ phiếu.
Lợi nhuận hàng ngày được tạo bằng cách sử dụng phân phối chuẩn với
giá trị trung bình và độ lệch chuẩn đã được tính toán trước đó. Để tính
giá của cổ phiếu, cần thực hiện tính tích lũy của lợi nhuận và giá khởi
điểm. Kết quả dưới đây là biểu đồ thể hiện giá mô phỏng của mã cổ phiếu
trong 120 ngày tới.
# Tạo cơ sở số lượng các mẫu ngẫu nhiên sẽ được tạo
set.seed(101)
# Tính giá trị lợi nhuận dựa trên các giá trị ngẫu nhiên
returns <- 1+rnorm(no_of_days, mean=daily_mean, sd=daily_std_dev)
# Tính giá cổ phiếu thông qua tích lũy của giá khởi điểm và lợi nhuận
prices <- cumprod(c(starting_price, returns))
# Vẽ biểu đồ thể hiện mô phỏng của giá cổ phiếu trong tương lai
plot(prices, type='l', ylab="Giá cổ phiếu", xlab="Số ngày", main = "Mô phỏng giá của mã cổ phiếu DVN")

Tuy nhiên, chỉ chạy một mô phỏng sẽ không đủ để đưa ra kết luận. Vì
vậy, để đưa ra kết quả sát với thực tế nhất, ta sẽ thực hiện chạy 1001
mô phỏng trong 120 ngày với mỗi mô phỏng. Dữ liệu được lưu trữ hai chiều
dưới dạng ma trận và 50 mô phỏng đầu tiên được biểu diễn trong đồ thị
dưới đây.
# Số lượng thực hiện vòng lặp mô phỏng
no_of_sims <- 1001
# Danh sách giá trị của lợi nhuận
returns_list <- matrix(0, nrow = no_of_sims, ncol = no_of_days)
# Danh sách giá của cổ phiếu
prices_list <- matrix(0, nrow = no_of_sims, ncol = no_of_days+1)
# Vòng lặp thực hiện mô phỏng trong số ngày được chỉ định
for(i in 1:no_of_sims) {
returns_list[i,] <- rnorm(no_of_days, mean=daily_mean, sd=daily_std_dev)
prices_list[i,] <- cumprod(c(starting_price, 1+returns_list[i,]))
}
# Biểu diễn dưới dạng đồ thị 50 mô phỏng đầu tiên
plot(prices_list[1,], type='l', ylab="Giá cổ phiếu", xlab="Số ngày", main = "Mô phỏng giá của mã cổ phiếu DVN", ylim=c(10000, 50000))
for(i in 1:50) {
lines(prices_list[i, ], type = 'l', col=i)
}

Như chúng ta có thể thấy, kết quả của các mô phỏng có sự đa dạng khác
nhau. Một số kết thúc dưới điểm bắt đầu và một số tăng rất nhanh. Dựa
trên 50 mô phỏng đầu tiên, mã cổ phiếu có xu hướng lợi nhuận âm trong
thời gian tới. Để xem xét cụ thể hơn, ta sẽ tính tổng lợi nhuận thu
về:
# Tạo mảng đa chiều chứa dữ liệu của lợi nhuận
total_returns <- array(NA, dim= no_of_sims, dimnames=NULL)
# Vòng lặp nhằm tính giá trị của tổng lợi nhuận với mỗi mô phỏng
for (i in 1:no_of_sims) {
total_returns[i] <- (prices_list[i, 121]-prices_list[i, 1])/prices_list[i,1]
}
# Thống kê kết quả của lợi nhuận thu về
summary(total_returns)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-0.69017 -0.27815 -0.12232 -0.10020 0.03253 0.96066
Kết luận cho thấy mô phỏng có xu hướng lợi nhuận âm, hơn 50% kết quả
mô phỏng cho ra giá trị < 0 bởi giá trị trung vị, giá trị trung bình
và phân vị thứ nhất đều thể hiện điều này. Để trực quan hóa kết quả, ta
có thể xem xét 1 số biểu đồ sau:
par(mfrow=c(1,3))
hist(total_returns, col="blue")
boxplot(total_returns, col="yellow")
plot(density(total_returns))

Các giá trị ngoại lai của biểu đồ Boxplot thường thể hiện mặt dương
của lợi nhuận và biểu đồ thể hiện sự phân phối lệch phải rõ rệt. Điều
này có thể xác nhận dựa trên thông số độ lệch dưới đây:
# Tính độ lệch của dữ liệu lợi nhuận
skewness(total_returns)
[1] 0.7771115
Để hiển thị biểu đồ dễ đọc hơn, sẽ chỉ có ba mô phỏng sẽ được đưa
vào: giá trị trung bình, giá trị tối thiểu và giá trị tối đa. Các dữ
liệu này được lấy từ phân tích dữ liệu với biểu đồ phía trên. Tiếp tục
thực hiện với sự lặp lại của 1001 mô phỏng.
# Tìm vị trí giá trị lớn nhất của lợi nhuận
max <- which.max(total_returns)
# Tìm vị trí giá trị nhỏ nhất của lợi nhuận
min <- which.min(total_returns)
# Tìm vị trí của giá trị trung vị
if (no_of_sims %% 2 != 0) {med <- match(median(total_returns), total_returns)}
# Biểu diễn đồ thị với 3 giá trị trên
plot(prices_list[min,], type='l', ylab="Giá cổ phiếu", xlab="Số ngày", main ="Mô phỏng giá của mã cổ phiếu DVN", ylim=c(9000, 60000), col="red")
if (no_of_sims %% 2 != 0) {lines(prices_list[med, ], type = 'l', col='yellow')}
lines(prices_list[max, ], type = 'l', col='green')

Qua đó, chúng ta có thể dễ dàng nhìn thấy trường hợp giá trị mô phỏng
tốt nhất, xấu nhất và trung bình. Để trả lời câu hỏi đầu tiên, dựa trên
các biểu đồ và dữ liệu, ta có thể kỳ vọng mức lợi nhuận nằm trong khoảng
từ -69.02% đến 96.07%.
# Tính giá trị lợi nhuận có thể đạt được lớn nhất
max_return <- max(total_returns)
max_return
[1] 0.960663
# Tính giá trị lợi nhuận có thể đạt được nhỏ nhất
min_return <- min(total_returns)
min_return
[1] -0.6901731
Để trả lời 2 câu hỏi cuối, ta sẽ thực hiện tính xác suất nhằm đạt
được kết quả mong muốn.
# Mức lợi nhuận cần lớn hơn
condition1 <- sum(total_returns > 0.12)
# Mức lợi nhuận cần nhỏ hơn
condition2 <- sum(total_returns < -0.2)
# Xác suất xảy ra các trường hợp
probability1 <- condition1/no_of_sims
probability2 <- condition2/no_of_sims
# Kết quả đạt được
cat("Xác suất để đạt được lợi nhuận tối thiểu 12% là: ", probability1*100, "%", ". Xác suất để lỗ nhiều hơn 20% khoản đầu tư là: ", probability2*100, "%")
Xác suất để đạt được lợi nhuận tối thiểu 12% là: 17.08292 % . Xác suất để lỗ nhiều hơn 20% khoản đầu tư là: 37.66234 %
