
Portfolios with Three Risky Assets
Xét một danh mục đầu tư (Portfolio) gồm ba tài sản là A, B và C. Kí hiệu \(R_i\) (\(i = A, B, C\)) là lợi tức tương ứng của ba tài sản và giả định rằng các lợi tức là biến ngẫu nhiên (Random Variable) thỏa mãn:
\[R_{i}\sim N(\mu_i,\sigma_i^2)\]
Ngoài ra với \(i \ne j\) thì covariance của gặp tài sản bất kì \(i\) và \(j\):
\[\mathrm{cov}\left(R_i, R_j \right) = \sigma_{ij}\]
Nếu tỉ trọng của ba tài sản này trong danh mục đầu tư là \(x_A\), \(x_B\) và \(x_C\) (lưu ý rằng \(x_A + x_B + x_C = 1\)) thì lợi tức của danh mục, kí hiệu là \(R_p,_x\) cũng sẽ là một biến ngẫu nhiên:
\[\begin{equation}
\tag{1}
R_p = x_AR_A + x_BR_B + x_CR_C
\end{equation}\]
Và lợi tức kì vọng của danh mục \(\mu_p,_x\), nếu kí hiệu \(\mu_A\), \(\mu_B\) và \(\mu_C\) lần lượt là lợi tức kì vọng của ba tài sản A, B và C sẽ được tính theo công thức:
\[\begin{equation}
\tag{2}
\mu_p = E[R_p] = x_A\mu_A + x_B\mu_B + x_C\mu_C
\end{equation}\]
Còn rủi ro của danh mục, kí hiệu là \(\sigma_p\) sẽ là:
\[\begin{equation}
\tag{3}
\sigma^2_p = \mathrm{var(R_p) = x^2_A\sigma^2_A + x^2_B\sigma^2_B + x^2_C\sigma^2_C + 2x_Ax_B\sigma_{AB} + 2x_Bx_C\sigma_{BC} + 2x_Ax_C\sigma_{AC}}
\end{equation}\]
Các công thức được mô tả bằng các phương trình đại số ở trên bạn đọc có thể tìm thất ở bất kì cuốn sách nào về Investment và Portfolio Theory. Còn theo ngôn ngữ của ma trận và tính toán ma trận (Matrix Calculation) thì lợi tức của danh mục tính theo công thức (2) sẽ được biểu diễn là:
\[\mu_p = X\mu\]
Còn rủi ro của danh mục theo công thức (3), với chú ý rằng \(X'\) là ma trận chuyển vị của ma trận \(X\), sẽ là:
\[\sigma^2_p = X'\Sigma X\]
Trong đó \(X\), \(\mu\) và \(\Sigma\) được định nghĩa và mô tả dưới đây:
- \(\mu\) là ma trận lợi tức của ba tài sản A, B và C. Đây là ma trận có kích thước 3×1:
\[\mu =
\begin{pmatrix}
\mu_A \\
\mu_B \\
\mu_C
\end{pmatrix}\]
- \(X\) là ma trận tỉ trọng của ba tài sản A, B và C (kích thước 3×1):
\[X =
\begin{pmatrix}
x_A & x_B & x_C
\end{pmatrix}\]
- \(\Sigma\) là ma trận hiệp phương sai (Covariance Matrix) của ba tài sản trong danh mục đầu tư. Đây là một ma trận đối xứng (symmetric) kích thước 3×3 vì rằng \(\mathrm{cov}\left(R_i, R_j \right) = \mathrm{cov}\left(R_j, R_i \right)\):
\[\begin{equation*}
\Sigma =
\begin{pmatrix}
\sigma^2_A & \sigma_{AB} & \sigma_{AC} \\
\sigma_{AB} & \sigma^2_B & \sigma_{BC} \\
\sigma_{AC} & \sigma_{BC} & \sigma^2_C
\end{pmatrix}
\end{equation*}\]
Những mục dưới đây chúng ta sẽ triển khai tính toán lợi tức - rủi ro của danh mục đầu tư và những bài toán cơ bản của Portfolio Theory bằng tính toán ma trận với ngôn ngữ R.
A Simple Example
Xét một danh mục đầu tư gồm ba cổ phiếu A, B và C với lợi tức (kí hiệu \(\mu_i\)), rủi ro (kí hiệu \(\sigma_i\)) và covariance theo từng cặp (kí hiệu \(\sigma_{ij}\)) được cho ở Table 1 dưới đây:
Table 1: A Real-world example data
|
Stock \(i\)
|
\(\mu_i\)
|
\(\sigma_i\)
|
Pair \((i,j)\)
|
\(\sigma_{ij}\)
|
|
A
|
0.0013128
|
0.0203511
|
(A,B)
|
0.0002519
|
|
B
|
0.0008900
|
0.0199235
|
(A,C)
|
0.0002366
|
|
C
|
-0.0005860
|
0.0002720
|
(B,C)
|
0.0002720
|
Xét một danh mục đầu tư mà tỉ trọng của các tài sản A, B, C là như nhau (equally weighted portfolio). Dưới đây là R codes cho tính toán lợi tức và rủi ro của danh mục đầu tư này. Trước hết là nhập số liệu cho các ma trận \(X\), \(\mu\) và \(\Sigma\) dựa trên Table 1:
# Clear workspace:
rm(list = ls())
# Symbol:
my_symbols <- LETTERS[1:3]
# Asset Weights:
X <- rep(1 / 3, 3)
# Asset returns:
mu <- c(0.0013127958, 0.0008899841, -0.0005860124)
# Asset risks:
sigma_i <- c(0.02035107, 0.01992348, 0.03098048)
# Covariance:
sigma_ij <- c(0.0002518696, 0.0002366285, 0.0002719917)
# Create covariance matrix:
sigma_matrix_3 <- matrix(c(sigma_i[1]*sigma_i[1], sigma_ij[1], sigma_ij[2],
sigma_ij[1], sigma_i[2]*sigma_i[2], sigma_ij[3],
sigma_ij[2], sigma_ij[3], sigma_i[3]*sigma_i[3]),
nrow = 3, byrow = TRUE)
# Set name for covariance matrix:
dimnames(sigma_matrix_3) <- list(my_symbols, my_symbols)
Ma trận hiệp phương sai:
Table 2: Covariance matrix
|
|
A
|
B
|
C
|
|
A
|
0.0004142
|
0.0002519
|
0.0002366
|
|
B
|
0.0002519
|
0.0003969
|
0.0002720
|
|
C
|
0.0002366
|
0.0002720
|
0.0009598
|
Tính toán lợi tức và rủi ro cho danh mục đầu tư:
## [1] 0.0005389225
## [1] 0.01912497
Danh mục đầu tư này tuy lợi tức chỉ bằng 41% so với tài sản B nhưng rủi ro lại gần bằng. Một nhà đầu tư duy lí đương nhiên sẽ ưa thích đầu tư toàn bộ tài sản của mình vào B hơn là phân bổ đều vào ba tài sản. Do vậy mà trọng tâm của lí thuyết danh mục (Portfolio Theory) và lựa chọn danh mục đầu tư (Portfolio Selection) là trả lời câu hỏi kiểu như sau:
Có hay không một sự kết hợp cụ thể nào đó của các tài sản mà cùng với mức lợi tức như tài sản A - tài sản có lợi tức cao nhất trong số ba tài sản nhưng có rủi ro thấp hơn?
Có hay không một sự kết hợp cụ thể nào đó của các tài sản mà cùng với mức lợi tức như tài sản B nhưng rủi ro lại thấp hơn 0.0199235?
Có hay không một sự kết hợp cụ thể nào đó của các tài sản mà với một mức lợi tức mục tiêu định trước là, ví dụ, 1% nhưng rủi ro là thấp nhất có thể được, thậm chí là thấp hơn cả rủi ro của tài sản C - là tài sản có rủi ro thấp nhất trong số ba tài sản?
Những câu hỏi này sẽ dần được sáng tỏ trong các mục kế tiếp.
A Real-world Application
Trong thế giới thực chúng ta cần tính được Table 1 từ dữ liệu thô (raw data). Để minh họa chúng ta chọn ba công ti là Microsoft, Starbucks và General Motor (tức là một công ti công nghệ, một công ti hàng tiêu dùng nhanh và một công ti công nghiệp nặng) và lấy dữ liệu lịch sử về giá cổ phiếu của ba công ti này bằng hàm tq_get() của thư viện tidyquant từ 2018-01-01 đến 2020-12-31:
Chúng ta có thể xem giá của ba cổ phiếu tại ngày cuối cùng trong mẫu dữ liệu đã lấy:
Table 3: Some Observations
|
symbol
|
date
|
open
|
high
|
low
|
close
|
volume
|
adjusted
|
|
GE
|
2020-12-30
|
10.58
|
10.85
|
10.55
|
10.71
|
50621000
|
10.71
|
|
MSFT
|
2020-12-30
|
225.23
|
225.63
|
221.47
|
221.68
|
20272300
|
221.68
|
|
SBUX
|
2020-12-30
|
105.99
|
106.62
|
105.78
|
105.97
|
3654100
|
105.97
|
Xu hướng biến động về giá hiệu chỉnh (adjusted) của ba cổ phiếu này (Figure 1):

Tính toán lợi tức của các tài sản được đo bằng log return theo công thức sau:
\[R_t=\ln\left(\frac{P_{t}} {P_{t-1}}\right)\]
Trong đó \(P_t\) là giá của tài sản ở thời điểm t và \(P_{t-1}\) là giá của tài sản tại thời điểm trước đó 1 ngày (còn gọi là trễ 1, kí hiệu là \(lag_1\)).
Phân phối của lợi tức có vẻ là phân phối chuẩn như ta có thể thấy ở Figure 2 dưới đây:

Để có kết luận chính xác phân phối có phải là phân phối chuẩn hay không chúng ta có thể dựa vào một test thống kê là Jarque–Bera (JB) test. Trước hết viết hàm tính toán thống kê này cùng p-value tương ứng:
Hàm tính toán ba tiêu chí quan trọng khác là Skewness, Kurtosis và CV (Coefficient of variation):
Table 4 liệt kê các thống kê quan trọng cùng với kiểm định JB Test cho lợi tức của ba tài sản:
# Apply funtions for our stock:
daily_returns %>%
group_by(symbol) %>%
summarise(Skewness = my_s(daily_return),
Kurtosis = my_k(daily_return),
CV = my_cv(daily_return),
JB_test = my_JB(daily_return),
p_value = my_stas(daily_return),
Mean = mean(daily_return),
Min = min(daily_return),
Max = max(daily_return),
SD = sd(daily_return),
N = n()) -> df_statistics
# Some main statistics for stocks:
df_statistics %>%
mutate_if(is.numeric, function(x) {round(x, 3)}) %>%
kbl(caption = "Table 4: Main Statistics for Symbol", escape = TRUE) %>%
kable_classic(full_width = FALSE, html_font = "Cambria")
Table 4: Main Statistics for Symbol
|
symbol
|
Skewness
|
Kurtosis
|
CV
|
JB_test
|
p_value
|
Mean
|
Min
|
Max
|
SD
|
N
|
|
GE
|
-0.043
|
3.531
|
-52.867
|
395.857
|
0
|
-0.001
|
-0.164
|
0.137
|
0.031
|
754
|
|
MSFT
|
-0.385
|
9.398
|
15.502
|
2812.889
|
0
|
0.001
|
-0.159
|
0.133
|
0.020
|
754
|
|
SBUX
|
-0.381
|
15.961
|
22.386
|
8071.986
|
0
|
0.001
|
-0.177
|
0.137
|
0.020
|
754
|
Các giá trị p_value này rất thấp do vậy có thể chấp nhận giả thuyết rằng các lợi tức có phân phối chuẩn. Dưới đây là R codes để tính toán lợi tức và rủi ro cho ba cổ phiếu:
## MSFT SBUX GE
## 0.0013127958 0.0008899841 -0.0005860124
Tính Covariance Matrix của ba tài sản:
## MSFT SBUX GE
## MSFT 0.0004141659 0.0002518696 0.0002366285
## SBUX 0.0002518696 0.0003969449 0.0002719917
## GE 0.0002366285 0.0002719917 0.0009597900
Xét một danh mục đầu tư mà các trọng số của các tài sản là như nhau (Equal-weight portfolio). Dưới đây là R codes tính toán lợi tức và rủi ro của danh mục đầu tư này theo ngôn ngữ ma trận:
## [1] 0.0005389225
## [1] 0.01912497
Xét một danh mục đầu tư có các trọng số (weights) của các tài sản là 40%, 80% và -20%. Trọng số âm có nghĩa là nguồn tài chính để đầu tư vào cổ phiếu của GE bằng cách “mượn” (thuật ngữ tiếng Anh là Short Sell). Loại danh mục đầu tư có trọng số âm này được gọi là Long-Short portfolio. Tương tự như ở trên, trước hết chúng ta tạo X là vector các trọng số:
Dễ dàng thấy rằng tổng các trọng số luôn bằng 1. Lợi tức và rủi ro của danh mục đầu tư này:
Chúng ta nên lưu lại các kết quả đã có:
Table 5: Risk-return trade-off
|
symbol
|
risk
|
return
|
|
GE
|
0.0310
|
-0.0006
|
|
MSFT
|
0.0204
|
0.0013
|
|
SBUX
|
0.0199
|
0.0009
|
|
EQUA
|
0.0191
|
0.0005
|
|
SHORT
|
0.0199
|
0.0014
|
Table 5 chỉ ra rằng Long-Short portfolio (kí hiệu SHORT) có lợi tức lớn nhất và cao hơn lợi tức của mã MSFT - cổ phiếu có lợi tức cao nhất trong số ba tài sản nhưng rủi ro của danh mục này lại thấp hơn rủi ro của MSFT. Liệu rằng việc đa dạng hóa bằng cách đầu tư vào ba tài sản trên với trọng số lần lượt là 40% cho MSFT, 80% cho SBUX và -20% cho GE có phải là lựa chọn tối ưu hay chí ít là hiệu quả? Chúng ta sẽ trả lời câu hỏi này ở mục kế tiếp ngay sau đây.
Efficient Portfolios by Simulation
Như ở trên đã phân tích, bằng cách thay đổi các trọng số chúng ta có hai danh mục đầu tư. Danh mục đầu tư thứ nhất (kí hiệu EQUA) có các trọng số bằng nhau (và đều bằng 33.33%) còn danh mục thứ hai (kí hiệu SHORT) có các trọng số lần lượt là 40%, 80% và -20%. Để tìm được danh mục đầu tư hiệu quả một trong những cách mà chúng ta có thể sử dụng là bằng mô phỏng (Simulation). Theo cách tiếp cận này chúng ta sẽ khảo sát cặp risk-return của, chẳng hạn, 10000 danh mục đầu tư khác nhau tương ứng với 10000 bộ trọng số khác nhau cho các tài sản cấu thành nên danh mục. Dựa trên khảo sát về cặp risk-return của 10000 danh mục đầu tư này chúng ta có thể trả lời một số câu hỏi như phải chăng còn tồn tại một danh mục với bộ trọng số nào đó mà lợi tức thì còn cao hơn lợi tức của SHORT nhưng rủi ro còn thấp hơn cả rủi ro của SHORT?.
Lưu ý rằng cho đến hiện tại, từ Table 5 thì SHORT chính là danh mục đầu tư “tốt nhất” căn cứ vào return còn EQUA là danh mục đầu tư có rủi ro thấp nhất căn cứ vào risk.
Để thực hiện simulation trước hết chúng ta viết một hàm có tên là portfolio_risk_return() tính toán cặp risk-return của một danh mục đầu tư nếu cho trước các trọng số tương ứng với ba tài sản MSFT, SBUX và GE:
library(rportfolios)
portfolio_risk_return <- function(j) {
# Create random weights:
set.seed(j)
X <- random.bounded(n = n, x.t = 1, x.l = rep(-1, n), x.u = rep(1, n))
# Portfolio return:
mu_port_rand = crossprod(X, mu) %>% as.numeric()
# Portfolio risk:
sig_port_rand <- t(X) %*% sigma_matrix %*% X %>% as.numeric() %>% sqrt()
# Create a data frame of results:
df_poft <- tibble(symbol = my_symbols,
weight = X,
return = mu_port_rand,
risk = sig_port_rand,
port_index = j)
return(df_poft)
}
Các trọng số sử dụng trong tính toán của hàm trên được tạo ra từ hàm random.bounded() của thư viện rportfolios. Lưu ý rằng: (1) tổng các trọng số luôn là 1, và (2) trọng số có thể là âm như có thể thấy:
## [1] -0.1699776 0.1699776 1.0000000
Sử dụng hàm này tính toán cặp risk-return của 10000 danh mục đầu tư và lưu lại kết quả dưới dạng một Data Frame có tên df_return_mini_10000 như dưới đây:
## user system elapsed
## 28.12 0.43 28.61
Lấy ra danh mục đầu tư có rủi ro thấp nhất và danh mục đầu tư có lợi tức cao nhất:
Figure 3 dưới đây chỉ ra cặp risk-return cho 10002 danh mục (10000 danh mục + hai danh mục EQUA và SHORT):
library(ggrepel)
library(scales)
df_return_mini_10000 %>%
ggplot(aes(risk, return)) +
geom_point(alpha = 0.05, color = "blue") +
geom_point(data = min_risk, color = "red", size = 3, shape = 17) +
geom_text_repel(data = min_risk, aes(label = "Min Risk")) +
geom_point(data = max_return, color = "purple", size = 3, shape = 18) +
geom_text_repel(data = max_return, aes(label = "Max Return")) +
geom_point(data = df_total %>% filter(!symbol %in% c("EQUA", "SHORT")), color = "green", size = 2) +
geom_point(data = df_total %>% filter(symbol %in% c("EQUA", "SHORT")), color = "orange", size = 2) +
geom_text_repel(data = df_total, aes(label = symbol)) +
scale_y_continuous(labels = percent) +
scale_x_continuous(labels = percent) +
labs(x = expression("Risk" ~ (sigma)),
y = expression("Return" ~ (mu)),
title = "Figure 3: Portfolio Optimization & Efficient Frontier")

Ba tài sản đơn lẻ (có thể coi là ba danh mục đầu tư mà trong đó các trọng số của hai tài sản là 0% còn tài sản thứ ba có trọng số 100%) được biểu diễn bằng ba điểm màu xanh. Hai danh mục EQUA và SHORT là hai điểm màu vàng còn màu đỏ và tím lần lượt là hai danh mục có rủi ro thấp nhất và lợi tức cao nhất.
Figure 3 chỉ ra rằng:
- Vẫn tồn tại rất nhiều danh mục đầu tư mà so với SHORT thì: (1) lợi tức cao hơn, và (2) rủi ro thấp hơn.
- Vẫn còn tại rất nhiều danh mục đầu tư mà so với EQUA thì: (1) lợi tức cao hơn, và (2) rủi ro thấp hơn.
Chúng ta có thể xem tỉ trọng các tài sản có rủi ro thấp nhất trong số 10002 danh mục đầu tư (điểm màu đỏ):
Table 5: Minimum-variance Portfolio
|
symbol
|
weight
|
return
|
risk
|
|
MSFT
|
45.01%
|
0.001
|
0.018
|
|
SBUX
|
45.88%
|
0.001
|
0.018
|
|
GE
|
9.11%
|
0.001
|
0.018
|
Và danh mục đầu tư có lợi tức cao nhất (điểm màu tím):
Table 6: Maximun-return Portfolio
|
symbol
|
weight
|
return
|
risk
|
|
MSFT
|
99.97%
|
0.003
|
0.035
|
|
SBUX
|
100%
|
0.003
|
0.035
|
|
GE
|
-99.97%
|
0.003
|
0.035
|
Summary
Đa dạng hóa đầu tư nhằm giảm thiểu rủi ro là một trong những hệ quả quan trọng của lí thuyết danh mục đầu tư (Portfolio Theory). Phần 1 của trước hết điểm lại những điểm cốt lõi của lí thuyết danh mục đầu tư và việc tính toán theo ngôn ngữ ma trận với R cũng như cách tiếp cận trực quan để tìm ra danh mục đầu tư hiệu quả (Efficient Portfolio) bằng phương pháp mô phỏng. Trong trường hợp danh mục đầu tư có n tài sản khác nhau thì việc áp dụng và tính toán vẫn không có gì thay đổi.
Đối với các khía cạnh như lí thuyết về Portfolio Theory, cơ sở Toán - Thống Kê/tính toán ma trận (Matrix Calculation) với ngôn ngữ R là những mảng kiến thức/kĩ năng mà người viết bài này mặc định bạn đọc đã nắm được. Bạn đọc quan tâm có thể tham khảo các tài liệu liệt kê ở mục References.
---
title: 'Quantitative Finance: Portfolio Theory (P1)'
author: 'Author: Nguyen Chi Dung'
subtitle: "R Finance Series"
output:
  html_document: 
    code_download: true
    # code_folding: hide
    highlight: zenburn
    # number_sections: yes
    theme: "flatly"
    toc: TRUE
    toc_float: TRUE
---

```{r setup,include=FALSE}
knitr::opts_chunk$set(echo = TRUE, warning = FALSE, message = FALSE, cache = TRUE)

```

![](C:/Users/ADMIN/Documents/inv2.jpg)


# Portfolios with Three Risky Assets

Xét một danh mục đầu tư (Portfolio) gồm ba tài sản là A, B và C. Kí hiệu $R_i$ ($i = A, B, C$) là lợi tức tương ứng của ba tài sản và giả định rằng các lợi tức là biến ngẫu nhiên (Random Variable) thỏa mãn: 



$$R_{i}\sim N(\mu_i,\sigma_i^2)$$

Ngoài ra với $i \ne j$ thì covariance của gặp tài sản bất kì $i$ và $j$: 

$$\mathrm{cov}\left(R_i, R_j \right) = \sigma_{ij}$$

Nếu tỉ trọng của ba tài sản này trong danh mục đầu tư là $x_A$, $x_B$ và $x_C$ (lưu ý rằng $x_A + x_B + x_C = 1$) thì lợi tức của danh mục, kí hiệu là $R_p,_x$ cũng sẽ là một biến ngẫu nhiên: 

$$\begin{equation}
\tag{1}
R_p = x_AR_A + x_BR_B + x_CR_C
\end{equation}$$



Và lợi tức kì vọng của danh mục $\mu_p,_x$, nếu kí hiệu $\mu_A$, $\mu_B$ và $\mu_C$ lần lượt là lợi tức kì vọng của ba tài sản A, B và C sẽ được tính theo công thức: 

$$\begin{equation}
\tag{2}
\mu_p = E[R_p] = x_A\mu_A + x_B\mu_B + x_C\mu_C
\end{equation}$$ 



Còn rủi ro của danh mục, kí hiệu là $\sigma_p$ sẽ là:  

$$\begin{equation}
\tag{3}
\sigma^2_p = \mathrm{var(R_p) = x^2_A\sigma^2_A + x^2_B\sigma^2_B + x^2_C\sigma^2_C + 2x_Ax_B\sigma_{AB} + 2x_Bx_C\sigma_{BC} + 2x_Ax_C\sigma_{AC}}
\end{equation}$$


Các công thức được mô tả bằng các phương trình đại số ở trên bạn đọc có thể tìm thất ở bất kì cuốn sách nào về Investment và Portfolio Theory. Còn theo ngôn ngữ của ma trận và tính toán ma trận (Matrix Calculation) thì lợi tức của danh mục tính theo công thức (2) sẽ được biểu diễn là: 

$$\mu_p = X\mu$$

Còn rủi ro của danh mục theo công thức (3), với chú ý rằng $X'$ là ma trận chuyển vị của ma trận $X$, sẽ là: 


$$\sigma^2_p = X'\Sigma X$$

Trong đó $X$, $\mu$ và $\Sigma$ được định nghĩa và mô tả dưới đây: 

- $\mu$ là ma trận lợi tức của ba tài sản A, B và C. Đây là ma trận có kích thước 3×1: 

$$\mu = 
\begin{pmatrix}
\mu_A \\
\mu_B \\
\mu_C
\end{pmatrix}$$  

- $X$ là ma trận tỉ trọng của ba tài sản A, B và C (kích thước 3×1): 

$$X = 
\begin{pmatrix}
x_A & x_B & x_C
\end{pmatrix}$$  

- $\Sigma$ là ma trận hiệp phương sai (Covariance Matrix) của ba tài sản trong danh mục đầu tư. Đây là một ma trận đối xứng (symmetric) kích thước 3×3 vì rằng $\mathrm{cov}\left(R_i, R_j \right) = \mathrm{cov}\left(R_j, R_i \right)$: 

$$\begin{equation*}
\Sigma = 
\begin{pmatrix}
\sigma^2_A & \sigma_{AB} & \sigma_{AC} \\
\sigma_{AB} & \sigma^2_B & \sigma_{BC} \\
\sigma_{AC} & \sigma_{BC} & \sigma^2_C
\end{pmatrix}
\end{equation*}$$ 

Những mục dưới đây chúng ta sẽ triển khai tính toán lợi tức - rủi ro của danh mục đầu tư và những bài toán cơ bản của Portfolio Theory bằng tính toán ma trận với ngôn ngữ R. 

# A Simple Example

Xét một danh mục đầu tư gồm ba cổ phiếu A, B và C với lợi tức (kí hiệu $\mu_i$), rủi ro (kí hiệu $\sigma_i$) và covariance theo từng cặp (kí hiệu $\sigma_{ij}$) được cho ở Table 1 dưới đây: 

```{r, echo=FALSE}

rm(list = ls())
library(tidyverse)
library(kableExtra)

col_names <- c("Stock $i$", "$\\mu_i$", "$\\sigma_i$", "Pair $(i,j)$", "$\\sigma_{ij}$")

symbol <- c(LETTERS[1:3])

mu <- c(0.0013127958, 0.0008899841, -0.0005860124)

sigma_i <- c(0.02035107, 0.01992348, 0.0002719917)

pair <- c("(A,B)", "(A,C)", "(B,C)")

sigma_ij <- c(0.0002518696, 0.0002366285, 0.0002719917)

three_example <- tibble(symbol = symbol, mu = mu, my_sigma = sigma_i, pair = pair, sigma_ij = sigma_ij)

names(three_example) <- col_names

three_example %>%
  head() %>% 
  kbl(caption = "Table 1: A Real-world example data", 
      col.names = col_names, 
      escape = TRUE) %>%
  kable_classic(full_width = FALSE, html_font = "Cambria")

```

Xét một danh mục đầu tư mà tỉ trọng của các tài sản A, B, C là như nhau (equally weighted portfolio). Dưới đây là R codes cho tính toán lợi tức và rủi ro của danh mục đầu tư này. Trước hết là nhập số liệu cho các ma trận $X$, $\mu$ và $\Sigma$ dựa trên Table 1:

```{r}

# Clear workspace: 
rm(list = ls())

# Symbol: 
my_symbols <- LETTERS[1:3]

# Asset Weights: 
X <- rep(1 / 3, 3)

# Asset returns: 
mu <- c(0.0013127958, 0.0008899841, -0.0005860124)

# Asset risks: 
sigma_i <- c(0.02035107, 0.01992348, 0.03098048)

# Covariance: 
sigma_ij <- c(0.0002518696, 0.0002366285, 0.0002719917)

# Create covariance matrix: 
sigma_matrix_3 <- matrix(c(sigma_i[1]*sigma_i[1], sigma_ij[1], sigma_ij[2], 
                        sigma_ij[1], sigma_i[2]*sigma_i[2], sigma_ij[3], 
                        sigma_ij[2], sigma_ij[3], sigma_i[3]*sigma_i[3]),
                        nrow = 3, byrow = TRUE)

# Set name for covariance matrix:
dimnames(sigma_matrix_3) <- list(my_symbols, my_symbols)

```

Ma trận hiệp phương sai: 

```{r}
library(magrittr) # For using Pipe operator. 
library(kableExtra) # For presenting table. 

sigma_matrix_3 %>% 
  kbl(caption = "Table 2: Covariance matrix", escape = TRUE) %>%
  kable_classic(full_width = FALSE, html_font = "Cambria")
  
  
```

Tính toán lợi tức và rủi ro cho danh mục đầu tư: 

```{r}
# Portfolio return: 
mu_port = crossprod(X, mu)

mu_port <- mu_port %>% as.numeric()

# Portfolio risk: 

sig2_port <- t(X) %*% sigma_matrix_3 %*% X

sig_port <- sig2_port %>% as.numeric() %>% sqrt()

# Print results: 

print(mu_port) # Return
print(sig_port) # Risk
```

Danh mục đầu tư này tuy lợi tức chỉ bằng 41% so với tài sản B nhưng rủi ro lại gần bằng. Một nhà đầu tư duy lí đương nhiên sẽ ưa thích đầu tư toàn bộ tài sản của mình vào B hơn là phân bổ đều vào ba tài sản. Do vậy mà trọng tâm của lí thuyết danh mục (Portfolio Theory) và lựa chọn danh mục đầu tư (Portfolio Selection) là trả lời câu hỏi kiểu như sau: 

1. Có hay không một sự kết hợp cụ thể nào đó của các tài sản mà cùng với mức lợi tức như tài sản A - tài sản có lợi tức cao nhất trong số ba tài sản nhưng có rủi ro thấp hơn? 

2. Có hay không một sự kết hợp cụ thể nào đó của các tài sản mà cùng với mức lợi tức như tài sản B nhưng rủi ro lại thấp hơn 0.0199235? 

3. Có hay không một sự kết hợp cụ thể nào đó của các tài sản mà với một mức lợi tức mục tiêu định trước là, ví dụ, 1% nhưng rủi ro là thấp nhất có thể được, thậm chí là thấp hơn cả rủi ro của tài sản C - là tài sản có rủi ro thấp nhất trong số ba tài sản?

Những câu hỏi này sẽ dần được sáng tỏ trong các mục kế tiếp. 

# A Real-world Application

Trong thế giới thực chúng ta cần tính được Table 1 từ dữ liệu thô (raw data). Để minh họa chúng ta chọn ba công ti là Microsoft, Starbucks và General Motor (tức là một công ti công nghệ, một công ti hàng tiêu dùng nhanh và một công ti công nghiệp nặng) và lấy dữ liệu lịch sử về giá cổ phiếu của ba công ti này bằng hàm `tq_get()` của thư viện **tidyquant** từ 2018-01-01 đến 2020-12-31: 

```{r, fig.width=10, fig.height=4}
# Clear workspace: 
rm(list = ls())

# Some stocks selected (Microsoft, Starbucks and Apple): 

my_symbols <- c("MSFT", "SBUX", "GE")

# Number of stocks: 

n <- length(my_symbols)

# Collect data: 

library(tidyquant)
price_data <- tq_get(my_symbols,
                     from = "2018-01-01",
                     to = "2020-12-31",
                     get = "stock.prices")
```

Chúng ta có thể xem giá của ba cổ phiếu tại ngày cuối cùng trong mẫu dữ liệu đã lấy: 

```{r, fig.width=10, fig.height=4}

# Show some observations: 

library(knitr)
library(tidyverse)

price_data %>% 
  group_by(symbol) %>% 
  slice(which.max(date)) %>% 
  kbl(caption = "Table 3: Some Observations", escape = TRUE) %>%
  kable_classic(full_width = FALSE, html_font = "Cambria")

```

Xu hướng biến động về giá hiệu chỉnh (adjusted) của ba cổ phiếu này (Figure 1): 

```{r, fig.width=10, fig.height=4}

# Price trend: 

price_data %>% 
  ggplot(aes(date, adjusted, color = symbol)) +
  geom_line(show.legend = FALSE) + 
  facet_wrap(~ symbol, scales = "free") + 
  labs(x = NULL, y = NULL, 
       title = "Figure 1: Stock Price")

```

Tính toán lợi tức của các tài sản được đo bằng log return theo công thức sau: 


$$R_t=\ln\left(\frac{P_{t}} {P_{t-1}}\right)$$ 

Trong đó $P_t$ là giá của tài sản ở thời điểm t và $P_{t-1}$ là giá của tài sản tại thời điểm trước đó 1 ngày (còn gọi là trễ 1, kí hiệu là $lag_1$). 

```{r, fig.width=10, fig.height=4}

# Calculate daily return based on adjusted price: 

price_data %>%
  group_by(symbol) %>% 
  mutate(lag1 = lag(adjusted, n = 1L)) %>% 
  filter(!is.na(lag1)) %>% 
  mutate(daily_return = log(adjusted / lag1)) %>% 
  ungroup() %>% 
  select(symbol, date, daily_return) -> daily_returns
```

Phân phối của lợi tức có vẻ là phân phối chuẩn như ta có thể thấy ở Figure 2 dưới đây: 

```{r, fig.width=10, fig.height=4}  
# Return distribution: 

daily_returns %>% 
  ggplot(aes(daily_return, fill = symbol, color = symbol)) + 
  geom_density(alpha = 0.1, show.legend = FALSE) + 
  geom_histogram(aes(y = ..density..), alpha = 0.1, binwidth = 0.01, show.legend = FALSE) + 
  facet_wrap(~ symbol, scales = "free") + 
  labs(x = NULL, y = NULL, 
       title = "Figure 2: Daily Return Distribution")

```

Để có kết luận chính xác phân phối có phải là phân phối chuẩn hay không chúng ta có thể dựa vào một test thống kê là Jarque–Bera (JB) test. Trước hết viết hàm tính toán thống kê này cùng p-value tương ứng: 

```{r, fig.width=10, fig.height=4} 
# Function calculates Jarque–Bera (JB) test: 
my_JB <- function(x) {
  n <- length(x)
  m1 <- sum(x)/n
  m2 <- sum((x - m1)^2)/n
  m3 <- sum((x - m1)^3)/n
  m4 <- sum((x - m1)^4)/n
  b1 <- (m3/m2^(3/2))^2
  b2 <- (m4/m2^2)
  JB <- n * b1/6 + n * (b2 - 3)^2/24
  return(JB)
}

# Calculates p-value for JB test: 
my_stas <- function(x) {
  n <- length(x)
  m1 <- sum(x)/n
  m2 <- sum((x - m1)^2)/n
  m3 <- sum((x - m1)^3)/n
  m4 <- sum((x - m1)^4)/n
  b1 <- (m3/m2^(3/2))^2
  b2 <- (m4/m2^2)
  JB <- n * b1/6 + n * (b2 - 3)^2/24
  p_value = 1 - pchisq(JB, df = 2)
  return(p_value)
}
```

Hàm tính toán ba tiêu chí quan trọng khác là Skewness, Kurtosis và CV (Coefficient of variation): 

```{r, fig.width=10, fig.height=4} 

# Funtions calculates Skewness: 
my_s <- function(x) {
  n <- length(x)
  x <- x - mean(x)
  y <- sqrt(n) * sum(x^3)/(sum(x^2)^(3/2))
  y <- y * ((1 - 1/n))^(3/2)
  return(y)
}

# Funtions calculates kurtosis: 
my_k <- function(x) {
  n <- length(x)
  x <- x - mean(x)
  r <- n * sum(x^4)/(sum(x^2)^2)
  y <-  r * (1 - 1/n)^2 - 3
  return(y)
}

# Function calculates CV (Coefficient of variation): 
my_cv <- function(x) {
  cv <- sd(x) / mean(x)
  return(cv)
}
```

Table 4 liệt kê các thống kê quan trọng cùng với kiểm định JB Test cho lợi tức của ba tài sản: 

```{r, fig.width=10, fig.height=4} 
# Apply funtions for our stock: 

daily_returns %>% 
  group_by(symbol) %>% 
  summarise(Skewness = my_s(daily_return), 
            Kurtosis = my_k(daily_return), 
            CV = my_cv(daily_return), 
            JB_test = my_JB(daily_return), 
            p_value = my_stas(daily_return), 
            Mean = mean(daily_return), 
            Min = min(daily_return), 
            Max = max(daily_return), 
            SD = sd(daily_return), 
            N = n()) -> df_statistics

# Some main statistics for stocks: 

df_statistics %>% 
  mutate_if(is.numeric, function(x) {round(x, 3)}) %>% 
  kbl(caption = "Table 4: Main Statistics for Symbol", escape = TRUE) %>%
  kable_classic(full_width = FALSE, html_font = "Cambria")

```

Các giá trị p_value này rất thấp do vậy có thể chấp nhận giả thuyết rằng các lợi tức có phân phối chuẩn. Dưới đây là R codes để tính toán lợi tức và rủi ro cho ba cổ phiếu: 

```{r, fig.width=10, fig.height=4} 
# Calculate risk and return for assets:
  
daily_returns %>% 
  group_by(symbol) %>% 
  summarise(risk = sd(daily_return), return = mean(daily_return)) -> df_risk_return

# Convert to wide form: 

daily_returns %>% 
  pivot_wider(names_from = symbol, values_from = daily_return) %>% 
  select(-date) -> returns_wide

# Asset mean return: 

mu <- colMeans(returns_wide) 

print(mu)
```

Tính Covariance Matrix của ba tài sản: 

```{r, fig.width=10, fig.height=4} 
# Covariance matrix: 

sigma_matrix <- cov(returns_wide)

print(sigma_matrix)

```

Xét một danh mục đầu tư mà các trọng số của các tài sản là như nhau (Equal-weight portfolio). Dưới đây là R codes tính toán lợi tức và rủi ro của danh mục đầu tư này theo ngôn ngữ ma trận: 

```{r}
#--------------------------
#  Equal-weight portfolio
#--------------------------

X <- rep(1 / n, n)

# Portfolio return: 
mu_port = crossprod(X, mu)

mu_port_equ <- mu_port %>% as.numeric()

# Portfolio risk: 

sig2_port_equ <- t(X) %*% sigma_matrix %*% X

sig_port_equ <- sig2_port_equ %>% as.numeric() %>% sqrt()

# Print results: 

print(mu_port_equ) # Return
print(sig_port_equ) # Risk
```

Xét một danh mục đầu tư có các trọng số (weights) của các tài sản là 40%, 80% và -20%. Trọng số âm có nghĩa là nguồn tài chính để đầu tư vào cổ phiếu của GE bằng cách "mượn" (thuật ngữ tiếng Anh là Short Sell). Loại danh mục đầu tư có trọng số âm này được gọi là Long-Short portfolio. Tương tự như ở trên, trước hết chúng ta tạo X là vector các trọng số: 

```{r}
#-----------------------
# Long-Short portfolio
#----------------------

X <- c(0.4, 0.8, -0.2)
```

Dễ dàng thấy rằng tổng các trọng số luôn bằng 1. Lợi tức và rủi ro của danh mục đầu tư này: 

```{r}
# Portfolio return: 
mu_port_sho = crossprod(X, mu)

mu_port_sho <- mu_port_sho %>% as.numeric()

# Portfolio risk: 

sig2_port_sho <- t(X) %*% sigma_matrix %*% X

sig_port_sho <- sig2_port_sho %>% as.numeric() %>% sqrt()
```

Chúng ta nên lưu lại các kết quả đã có: 

```{r}

two_port <- tibble(symbol = c("EQUA", "SHORT"), 
                   risk = c(sig_port_equ, sig_port_sho), 
                   return = c(mu_port_equ, mu_port_sho))

df_risk_return %>% bind_rows(two_port) -> df_total

df_total %>% 
  mutate_if(is.numeric, function(x) {round(x, 4)}) %>% 
  kbl(caption = "Table 5: Risk-return trade-off", escape = TRUE) %>%
  kable_classic(full_width = FALSE, html_font = "Cambria")
  

```

Table 5 chỉ ra rằng Long-Short portfolio (kí hiệu SHORT) có lợi tức lớn nhất và cao hơn lợi tức của mã MSFT - cổ phiếu có lợi tức cao nhất trong số ba tài sản nhưng rủi ro của danh mục này lại thấp hơn rủi ro của MSFT. Liệu rằng việc đa dạng hóa bằng cách đầu tư vào ba tài sản trên với trọng số lần lượt là 40% cho MSFT, 80% cho SBUX và -20% cho GE có phải là lựa chọn tối ưu hay chí ít là hiệu quả? Chúng ta sẽ trả lời câu hỏi này ở mục kế tiếp ngay sau đây. 

# Efficient Portfolios by Simulation

Như ở trên đã phân tích, bằng cách thay đổi các trọng số chúng ta có hai danh mục đầu tư. Danh mục đầu tư thứ nhất (kí hiệu EQUA) có các trọng số bằng nhau (và đều bằng 33.33%) còn danh mục thứ hai (kí hiệu SHORT) có các trọng số lần lượt là 40%, 80% và -20%. Để tìm được danh mục đầu tư hiệu quả một trong những cách mà chúng ta có thể sử dụng là bằng mô phỏng (Simulation). Theo cách tiếp cận  này chúng ta sẽ khảo sát cặp risk-return của, chẳng hạn, 10000 danh mục đầu tư khác nhau tương ứng với 10000 bộ trọng số khác nhau cho các tài sản cấu thành nên danh mục. Dựa trên khảo sát về cặp risk-return của 10000 danh mục đầu tư này chúng ta có thể trả lời một số câu hỏi như **phải chăng còn tồn tại một danh  mục với bộ trọng số nào đó mà lợi tức thì còn cao hơn lợi tức của SHORT nhưng rủi ro còn thấp hơn cả rủi ro của SHORT?**. 

Lưu ý rằng cho đến hiện tại, từ Table 5 thì SHORT chính là danh mục đầu tư "tốt nhất" căn cứ vào return còn EQUA là danh mục đầu tư có rủi ro thấp nhất căn cứ vào risk. 


Để thực hiện simulation trước hết chúng ta viết một hàm có tên là `portfolio_risk_return()` tính toán cặp risk-return của một danh mục đầu tư nếu cho trước các trọng số tương ứng với ba tài sản MSFT, SBUX và GE:  


```{r}

library(rportfolios)

portfolio_risk_return <- function(j) {
  
  # Create random weights: 
  
  set.seed(j)
  
  X <- random.bounded(n = n, x.t = 1, x.l = rep(-1, n), x.u = rep(1, n))

  # Portfolio return: 
  mu_port_rand = crossprod(X, mu) %>% as.numeric()

  # Portfolio risk: 
  sig_port_rand <- t(X) %*% sigma_matrix %*% X %>% as.numeric() %>% sqrt()
  
  # Create a data frame of results: 
  df_poft <- tibble(symbol = my_symbols, 
                    weight = X, 
                    return = mu_port_rand, 
                    risk = sig_port_rand,
                    port_index = j)
  
  return(df_poft)

}
```

Các trọng số sử dụng trong tính toán của hàm trên được tạo ra từ hàm `random.bounded()` của thư viện **rportfolios**. Lưu ý rằng: (1) tổng các trọng số luôn là 1, và (2) trọng số có thể là âm như có thể thấy: 

```{r}
set.seed(29)
random.bounded(n = n, x.t = 1, x.l = rep(-1, n), x.u = rep(1, n))
```

Sử dụng hàm này tính toán cặp risk-return của 10000 danh mục đầu tư và lưu lại kết quả dưới dạng một Data Frame có tên **df_return_mini_10000** như dưới đây:  

```{r}
system.time(lapply(1:10000, portfolio_risk_return) -> all_return_port)

do.call("bind_rows", all_return_port) -> df_return_10000

df_return_10000 %>% 
  filter(!duplicated(port_index)) -> df_return_mini_10000
```

Lấy ra danh mục đầu tư có rủi ro thấp nhất và danh mục đầu tư có lợi tức cao nhất:  

```{r}
# Minimum risk portfolio: 
min_risk <- df_return_mini_10000 %>% slice(which.min(risk)) 

# Maximum return portfolio: 
max_return <- df_return_mini_10000 %>% slice(which.max(return)) 
```

Figure 3 dưới đây chỉ ra cặp risk-return cho 10002 danh mục (10000 danh mục + hai danh mục EQUA và SHORT): 

```{r}
library(ggrepel)
library(scales)

df_return_mini_10000 %>% 
  ggplot(aes(risk, return)) + 
  geom_point(alpha = 0.05, color = "blue") + 
  geom_point(data = min_risk, color = "red", size = 3, shape = 17) + 
  geom_text_repel(data = min_risk, aes(label = "Min Risk")) + 
  geom_point(data = max_return, color = "purple", size = 3, shape = 18) + 
  geom_text_repel(data = max_return, aes(label = "Max Return")) + 
  geom_point(data = df_total %>% filter(!symbol %in% c("EQUA", "SHORT")), color = "green", size = 2) + 
  geom_point(data = df_total %>% filter(symbol %in% c("EQUA", "SHORT")), color = "orange", size = 2) + 
  geom_text_repel(data = df_total, aes(label = symbol)) + 
  scale_y_continuous(labels = percent) + 
  scale_x_continuous(labels = percent) + 
  labs(x = expression("Risk" ~ (sigma)), 
       y = expression("Return" ~ (mu)), 
       title = "Figure 3: Portfolio Optimization & Efficient Frontier") 
```

Ba tài sản đơn lẻ (có thể coi là ba danh mục đầu tư mà trong đó các trọng số của hai tài sản là 0% còn tài sản thứ ba có trọng số 100%) được biểu diễn bằng ba điểm màu xanh. Hai danh mục EQUA và SHORT là hai điểm màu vàng còn màu đỏ và tím lần lượt là hai danh mục có rủi ro thấp nhất và lợi tức cao nhất. 

Figure 3 chỉ ra rằng: 

1. Vẫn tồn tại rất nhiều danh mục đầu tư mà so với SHORT thì: (1) lợi tức cao hơn, và (2) rủi ro thấp hơn.
2. Vẫn còn tại rất nhiều danh mục đầu tư mà so với EQUA thì: (1) lợi tức cao hơn, và (2) rủi ro thấp hơn. 


Chúng ta có thể xem tỉ trọng các tài sản có rủi ro thấp nhất trong số 10002 danh mục đầu tư (điểm màu đỏ): 


```{r}

df_return_10000 %>% 
  filter(port_index == min_risk$port_index) %>% 
  mutate(weight = round(weight*100, 2)) %>% 
  mutate(weight = as.character(weight)) %>% 
  mutate(weight = paste0(weight, "%")) %>% 
  select(-port_index) %>% 
  mutate_if(is.numeric, function(x) {round(x, 3)}) %>% 
  kbl(caption = "Table 5: Minimum-variance Portfolio", escape = TRUE) %>%
  kable_classic(full_width = FALSE, html_font = "Cambria")
  
```

Và danh mục đầu tư có lợi tức cao nhất (điểm màu tím): 

```{r}
df_return_10000 %>% 
  filter(port_index == max_return$port_index) %>% 
  mutate(weight = round(weight*100, 2)) %>% 
  mutate(weight = as.character(weight)) %>% 
  mutate(weight = paste0(weight, "%")) %>% 
  select(-port_index) %>% 
  mutate_if(is.numeric, function(x) {round(x, 3)}) %>% 
  kbl(caption = "Table 6: Maximun-return Portfolio", escape = TRUE) %>%
  kable_classic(full_width = FALSE, html_font = "Cambria")


```

# Summary

Đa dạng hóa đầu tư nhằm giảm thiểu rủi ro là một trong những hệ quả quan trọng của lí thuyết danh mục đầu tư (Portfolio Theory). Phần 1 của  trước hết điểm lại những điểm cốt lõi của lí thuyết danh mục đầu tư và việc tính toán theo ngôn ngữ ma trận với R cũng như cách tiếp cận trực quan để tìm ra danh mục đầu tư hiệu quả (Efficient Portfolio) bằng phương pháp mô phỏng. Trong trường hợp danh mục đầu tư có n tài sản khác nhau thì việc áp dụng và tính toán vẫn không có gì thay đổi. 

Đối với các khía cạnh như lí thuyết về Portfolio Theory, cơ sở Toán - Thống Kê/tính toán ma trận (Matrix Calculation) với ngôn ngữ R là những mảng kiến thức/kĩ năng mà người viết bài này mặc định bạn đọc đã nắm được. Bạn đọc quan tâm có thể tham khảo các tài liệu liệt kê ở mục References. 

# References

1. [Investments 10th Edition by Zvi Bodie, Alex Kane (Author), Alan J. Marcus](https://www.amazon.com/Investments-10th-Zvi-Bodie/dp/0077861671). 
2. [Modern Portfolio Theory and Investment Analysis, 9th Edition by Elton et al.](https://www.wiley.com/en-us/Modern+Portfolio+Theory+and+Investment+Analysis%2C+9th+Edition-p-9781118469941). 
3. [Basics of Matrix Algebra for Statistics with R by Nick Fieller](https://www.amazon.com/Basics-Matrix-Algebra-Statistics-Chapman-ebook/dp/B0116R46TQ/ref=sr_1_1?dchild=1&keywords=matrix+calculation+in+r&qid=1611491969&s=books&sr=1-1)




