
Portfolio Theory Again
Portfolio Theory đã được mô tả và giải thích trực quan trong trong phần 1 tập trung vào hai vấn đề chính:
- Những tính toán ban đầu liên quan đến lí thuyết này bằng ngôn ngữ ma trận (lợi tức và rủi ro).
- Tìm danh mục đầu tư mà rủi ro là bé nhất (Global Minimum Variance - GMV Portfolio) dựa trên phương pháp mô phỏng.
Trước hết chúng ta lặp lại việc tìm GMV Portfolio từ 10000 danh mục như đã biết từ phần 1:
# Clear workspace:
rm(list = ls())
# Some stocks selected (Microsoft, Starbucks and Apple):
my_symbols <- c("MSFT", "SBUX", "GE")
# Number of stocks:
n <- length(my_symbols)
# Collect data:
library(tidyquant)
price_data <- tq_get(my_symbols,
from = "2018-01-01",
to = "2020-12-31",
get = "stock.prices")
# Calculate log return:
library(tidyverse)
price_data %>%
group_by(symbol) %>%
mutate(lag1 = lag(adjusted, n = 1L)) %>%
filter(!is.na(lag1)) %>%
mutate(daily_return = log(adjusted / lag1)) %>%
ungroup() %>%
select(symbol, date, daily_return) -> daily_returns
# Calculate risk and return for assets:
daily_returns %>%
group_by(symbol) %>%
summarise(risk = sd(daily_return), return = mean(daily_return)) -> df_risk_return
# Convert to wide form:
daily_returns %>%
pivot_wider(names_from = symbol, values_from = daily_return) %>%
select(-date) -> returns_wide
# Asset mean return:
mu <- colMeans(returns_wide)
# Covariance matrix:
sigma_matrix <- cov(returns_wide)
# Function calculates risk-return for a random-weight portfolio:
library(rportfolios)
portfolio_risk_return <- function(j) {
# Create random weights:
set.seed(j)
X <- random.bounded(n = n, x.t = 1, x.l = rep(-1, n), x.u = rep(1, n))
# Portfolio return:
mu_port_rand = crossprod(X, mu) %>% as.numeric()
# Portfolio risk:
sig_port_rand <- t(X) %*% sigma_matrix %*% X %>% as.numeric() %>% sqrt()
# Create a data frame of results:
df_poft <- tibble(symbol = my_symbols,
weight = X,
return = mu_port_rand,
risk = sig_port_rand,
port_index = j)
return(df_poft)
}
# Use the function and combine results in form of data frame:
lapply(1:10000, portfolio_risk_return) -> all_return_port
do.call("bind_rows", all_return_port) -> df_return_10000
df_return_10000 %>%
filter(!duplicated(port_index)) -> df_return_mini_10000
# Minimum risk portfolio (GMV Portfolio) from simulation:
min_risk <- df_return_mini_10000 %>% slice(which.min(risk))
GMV Portfolio có rủi ro - lợi tức và trọng số của các tài sản được trình bày ở Table 1:
Table 1: Minimum Risk Portfolio by Simulation
symbol
|
weight
|
return
|
risk
|
MSFT
|
0.4500578
|
0.0009458
|
0.017933
|
SBUX
|
0.4588066
|
0.0009458
|
0.017933
|
GE
|
0.0911357
|
0.0009458
|
0.017933
|
Danh mục có rủi ro thấp nhất này đạt được khi các trọng số của MSFT, SBUX và GE lần lượt là 45%, 46% và 9%. Tuy nhiên đây là kết quả rút ra dựa trên mô phỏng. Nói chính xác hơn, đây là danh mục đầu tư có risk nhỏ nhất trong số 10000 danh mục có trọng số ngẫu nhiên.
GMV Portfolio
Portfolio Theory chỉ ra rằng các trọng số các tài sản của GMV Portfolio được tính toán dựa trên việc giải hệ ma trận dưới đây:
\[\begin{equation}
\tag{1}
z_m = A_mb
\end{equation}\]
Với \(z_m\), \(A_m\) và \(b\) là các ma trận dưới đây:
\[\begin{equation*}
A_m =
\begin{pmatrix}
2\Sigma & 1\\
1' & 0
\end{pmatrix}
\end{equation*}\]
\[\begin{equation*}
z_m =
\begin{pmatrix}
m \\
\lambda
\end{pmatrix}
\end{equation*}\]
\[\begin{equation*}
b =
\begin{pmatrix}
0 \\
1
\end{pmatrix}
\end{equation*}\]
Còn \(m\) là ma trận trọng số các tài sản:
\[\begin{equation*}
m =
\begin{pmatrix}
x_A & x_B & x_C
\end{pmatrix}
\end{equation*}\]
Lưu ý rằng tổng các trọng số luôn thoản mãn \(x_A + x_B + x_C = 1\). Dưới đây là R codes tìm tỉ trọng các tài sản cho GMV Portfolio bằng cách giải ma trận được mô tả trong phương trình 1:
## MSFT SBUX GE
## 0.43822562 0.46718882 0.09458556
Kết quả này chỉ ra rằng các trọng số của các tài sản cho GMV Portfolio có chút khác biệt nhỏ so với cách tìm bằng phương pháp mô phỏng. Điều này không có gì lạ vì Portfolio Theory đưa ra công thức chính xác để tìm trọng số cho GMV Portfolio còn phương pháp mô phỏng chỉ thì lại đi theo một hướng khác: chỉ ra ma trận có risk bé nhất trong số 10000 danh mục đầu tư. Dễ thấy rằng hai kết quả này sẽ tiệm cận nhau nếu chúng ta tìm kiếm danh mục có risk nhỏ nhất trong số 1.000.000 danh mục đầu tư ngẫu nhiên.
Để tiện lợi cho việc so sánh, chúng ta viết hàm tính rủi ro - lợi tức của một danh mục đầu tư bất kì khi biết thêm tỉ trọng của các tài sản:
Rồi sử dụng hàm này:
Table 2: GMV Portfolio by Portfolio Theory
symbol
|
weight
|
return
|
risk
|
MSFT
|
0.4382256
|
0.0009357
|
0.0179318
|
SBUX
|
0.4671888
|
0.0009357
|
0.0179318
|
GE
|
0.0945856
|
0.0009357
|
0.0179318
|
So sánh Table 1 và Table 2 chúng ta có thể thấy rằng sự sai khác về risk chỉ là 0.0067%.
Efficient Portfolio
Một Efficient Portfolio là danh mục đầu tư mà với một lợi tức kì vọng cố định trước nhưng lại có rủi ro thấp nhất. Giả sử đặt lợi tức mục tiêu của danh mục là bằng với lợi tức của mã MSFT. Danh mục có mức lợi tức mục tiêu này nhưng rủi ro thấp hơn rủi ro của MSFT sẽ có các trọng số được tính như sau:
#------------------------------------------------------------------
# Efficient portfolio with the same expected return as Microsoft
#------------------------------------------------------------------
return_target <- mu[my_symbols[1]]
top_mat <- cbind(2*sigma_matrix, mu, rep(1, n))
mid_vec <- c(mu, rep(0, n - 1))
bot_vec <- c(rep(1, n), rep(0, n - 1))
A_mat = rbind(top_mat, mid_vec, bot_vec)
bmsft_vec <- c(rep(0, n), return_target, 1)
z_mat <- solve(A_mat) %*% bmsft_vec
X_efficient_as_msft <- z_mat[1:3, 1]
# Print results:
print(X_efficient_as_msft)
## MSFT SBUX GE
## 0.6385378 0.4650062 -0.1035440
Với trọng số tìm ra ở trên chúng ta tính toán cặp risk-return tương ứng và so sánh với MSFT là điểm màu da cam (kí hiệu EFF1) trong Figure 2 dưới đây:
risk_return_portfolio(weights = X_efficient_as_msft) -> df_as_msft
library(ggrepel)
library(scales)
df_return_mini_10000 %>%
ggplot(aes(risk, return)) +
geom_point(alpha = 0.05, color = "blue") +
geom_point(data = min_var %>% slice(1), color = "red", size = 3, shape = 17) +
geom_text_repel(data = min_var %>% slice(1), aes(label = "GMV")) +
geom_point(data = df_risk_return, color = "green", size = 2) +
geom_text_repel(data = df_risk_return, aes(label = symbol)) +
geom_point(data = df_as_msft, color = "orange", size = 2) +
geom_text_repel(data = df_as_msft %>% slice(1), aes(label = "EFF1")) +
labs(x = expression("Risk" ~ (sigma)),
y = expression("Return" ~ (mu)),
title = "Figure 1: Efficient Portfolio with the same return as Microsoft")

Trong Figure 2 thì điểm màu đỏ chính là GMV Portfolio - danh mục có rủi ro thấp nhất với các trọng số được tính toán theo Portfolio Theory. Để hỗ trợ cho tính toán và so sánh chúng ta nên viết hàm tính toán tỉ trọng cho danh mục đầu tư hiệu quả (Efficient Portfolio) khi định trước lợi tức mục tiêu:
# Function find weights for a efficient portfolio with given return:
find_efficient_port <- function(given_return) {
top_mat <- cbind(2*sigma_matrix, mu, rep(1, n))
mid_vec <- c(mu, rep(0, n - 1))
bot_vec <- c(rep(1, n), rep(0, n - 1))
A_mat = rbind(top_mat, mid_vec, bot_vec)
my_vec <- c(rep(0, n), given_return, 1)
z_mat <- solve(A_mat) %*% my_vec
X_efficient <- z_mat[1:3, 1]
X_efficient %>%
risk_return_portfolio() %>%
return()
}
Với một mục tiêu khác về lợi tức - chẳng hạn r = 0.25% thì tỉ trọng các tài sản mà rủi ro thấp nhất là:
Table 3: Efficient Portfolio which Target Return = 0.25%
symbol
|
weight
|
return
|
risk
|
MSFT
|
1.2691154
|
0.0025
|
0.0305428
|
SBUX
|
0.4581352
|
0.0025
|
0.0305428
|
GE
|
-0.7272506
|
0.0025
|
0.0305428
|
Chúng ta khảo sát cơ cấu của danh mục đầu tư với một loạt ngưỡng lợi tức định trước nằm trong khoảng từ 0 đến 0.3%:
# Generate sequence of returns:
target_returns <- seq(0, 0.0025, length.out = 20) %>% unique()
lapply(target_returns, find_efficient_port) -> list_eff_port
do.call("bind_rows", list_eff_port) -> df_eff_port
paste0(round(target_returns*100, 2), "%") -> x_labels
my_colors <- c('#e41a1c','#377eb8','#4daf4a')
df_eff_port %>%
mutate(return = factor(return)) %>%
ggplot(aes(return, weight, fill = symbol)) +
geom_col() +
scale_x_discrete(labels = x_labels) +
scale_y_continuous(limits = c(-1, 2), breaks = seq(-1, 2, 0.25), labels = percent) +
scale_fill_manual(values = my_colors) +
theme(panel.grid.minor = element_blank()) +
theme(legend.title = element_blank()) +
theme(legend.position = c(0.1, 0.85)) +
theme(axis.text = element_text(size = 8)) +
labs(x = expression("Return" ~ (sigma)),
y = "Weight",
title = "Figure 2: Asset Weight of Efficient Portfolios")

Khi lợi tức yêu cầu của danh mục đầu tư tăng, thì từ Figure 3 có thể thấy:
- Tỉ trọng tài sản phân bổ cho MSFT tăng.
- Tỉ trọng tài sản phân bổ cho GE tăng nhưng đây là tài sản “vay mượn”.
- Tại bất kì ngưỡng nào của lực tức thì tỉ trọng của SBUX có vẻ như không thay đổi nhiều. Điều này ngụ ý rằng: lợi tức của danh mục đầu tư là “trơ”, gần như không nhạy trước sự thay đổi về tỉ trọng của mã cổ phiếu này.
Efficient Frontier
Giả sử có hai danh mục đầu tư hiệu quả dưới đây:
- Danh mục đầu tư có rủi ro là thấp nhất nhưng lợi tức là cao nhất có thể được. Đây chính là GMV Portfolio.
- Danh mục đầu tư có lợi tức định trước là 0.25% nhưng rủi ro là thấp nhất (kí hiệu là MaxReturn Portfolio).
Xét danh mục đầu tư được tạo thành từ sự kết hợp của hai danh mục đầu tư trên trong đó tỉ trọng đầu tư vào hai danh mục này là \(\alpha\) và \(\beta\), kí hiệu là Combined Portfolio - CP. Lúc này có hai khả năng xẩy ra:
- Nếu danh mục này có lợi tức cao hơn lợi tức của GMV Portfolio thì danh mục đầu tư này sẽ thuộc đường danh mục hiệu quả (Efficient Frontier).
- Ngược lại, nếu danh mục đầu tư này có lợi tức thấp hơn lợi tức của GMV Portfolio thì danh mục đầu tư này thuộc đường danh mục đầu tư phi hiệu quả (Inefficient Frontier).
Chúng ta xét danh mục đầu tư được hình thành từ hai danh mục đầu tư trên với các trọng số lần lượt là \(\alpha = 0.4\) và \(\beta = 1 - \alpha\) rồi tính toán cặp risk-return cho danh mục này:
Table 4: Risk and Return for Combined Portfolio
symbol
|
weight
|
return
|
risk
|
MSFT
|
0.9367595
|
0.0018743
|
0.0232728
|
SBUX
|
0.4617566
|
0.0018743
|
0.0232728
|
GE
|
-0.3985162
|
0.0018743
|
0.0232728
|
Table 4 cho thấy đây là danh mục thuộc Efficient Frontier vì lợi tức của danh mục này là 0.19% cao hơn lợi tức của GMV Portfolio chỉ có lợi tức là 0.09%. Dễ kiểm tra thấy rằng rủi ro của danh mục đầu tư này 0.0233 - một con số thấp hơn 0.0305 (là rủi ro của danh mục đầu tư hiệu quả có lợi tức mục tiêu 0.25$) nhưng thấp hơn 0.0179 (là rủi ro của GMV Portfolio).
Chúng ta có thể khảo sát và vẽ Efficient Frontier bằng cách tính toán cặp risk-return cho 100 ngưỡng khác nhau của lợi tức từ 0% đến 0.25% như dưới đây:
low_return <- 0
up_return <- df_efficient_025$return[1]
target_returns_100 <- seq(low_return, up_return, length.out = 100) %>% unique()
lapply(target_returns_100, find_efficient_port) -> list_eff_port_100
do.call("bind_rows", list_eff_port_100) -> df_eff_port_100
df_eff_port_100 %>%
filter(!duplicated(return)) -> df_eff_frontier
# GMV portfolio:
df_eff_frontier %>% slice(which.min(risk)) -> gmv_port
# Maximum return portfolio:
df_eff_frontier %>% slice(which.max(risk)) -> max_return_port
# Portfolios belong to Efficient Frontier:
df_eff_frontier %>% filter(return > gmv_port$return) -> df_eff_frontier_line
# Portfolio belong to Inefficient Frontier:
df_eff_frontier %>% filter(return < gmv_port$return) -> df_ineff_frontier
# Graph of Efficient Frontier:
df_return_mini_10000 %>%
ggplot(aes(risk, return)) +
geom_point(alpha = 0.05, color = "blue") +
geom_point(data = df_eff_frontier_line, color = "blue") +
geom_point(data = max_return_port, color = "purple", shape = 18, size = 3) +
geom_text_repel(data = max_return_port, aes(label = "Min25"), direction = "y") +
geom_point(data = df_ineff_frontier, color = "red") +
geom_point(data = gmv_port, color = "green", shape = 18, size = 3) +
geom_text_repel(data = gmv_port, aes(label = "GMV"), direction = "x") +
geom_point(data = df_risk_return, color = "orange", size = 3) +
geom_text_repel(data = df_risk_return, aes(label = symbol)) +
annotate("text", label = "Efficient Frontier", x = 0.022, y = 0.002) +
annotate("text", label = "Inefficient Frontier", x = 0.021, y = 0) +
scale_y_continuous(labels = percent) +
scale_x_continuous(labels = percent) +
labs(x = expression("Risk" ~ (sigma)),
y = expression("Return" ~ (mu)),
title = "Figure 3: Efficient Frontier")

Ở Figure 3 thì Efficient Frontier là đường cong tạo ra bằng cách nối các điểm màu xanh. Inefficient Frontier là đường cong tạo ra bằng cách nối các điểm màu đỏ.
Tangency Portfolio
Sharpe Ratio là một thước đo đánh giá hiệu quả của danh mục đầu tư và được tính theo công thức:
\[S=\frac{\mu_p - r_{f}}{\sigma_p}\] Trong đó \(\sigma_p\) và \(\mu_p\) lần lượt là rủi ro và lợi tức kì vọng của danh mục còn \(r_f\) là lợi tức của tài sản phi rủi ro. Ở đây lợi tức của tài sản phi rủi ro được chọn làm tham chiếu và thường là trái phiếu chính phủ (hoặc T-bills).
Tangency Portfolio là danh mục đầu tư mà có Sharpe Ratio là cao nhất. Dưới đây là R codes tìm tỉ trọng cho các tài sản cho Tangency Portfolio (kí hiệu là TAN) nếu biết trước lãi suất (daily return) của tài sản phi rủi ro (như trái phiếu chính phủ) là 0.01%:
## MSFT SBUX GE
## 1.2563678 0.4582741 -0.7146419
Với tỉ trọng các tài sản tìm được thì cặp risk-return của Tangency Portfolio được tính ở Table 5:
Table 4: Risk and Return for Tangency Portfolio
symbol
|
weight
|
return
|
risk
|
MSFT
|
1.2563678
|
0.002476
|
0.0302365
|
SBUX
|
0.4582741
|
0.002476
|
0.0302365
|
GE
|
-0.7146419
|
0.002476
|
0.0302365
|
Và Sharpe Ratio của danh mục này sẽ là:
## [1] 0.0785804
Mutual Fund Separation Theorem
Xét một danh mục đầu tư được hình thành từ việc phân bổ tỉ trọng là \(x_t\) cho Tangency Portfolio ở trên và phần còn lại là \(1 - x_t\) cho tài sản phi rủi ro T-bills. Rủi ro và lợi tức của danh mục đầu tư này, lần lượt kí hiệu là \(\sigma^{e}_p\) và \(\mu^{e}_p\) sẽ là:
\[\begin{equation} \tag{2} \sigma^{e}_p = x_t\sigma_p \end{equation}\]
\[\begin{equation} \tag{3} \mu^{e}_p = r_f + x_t(\mu_p - r_f) \end{equation}\]
Giả sử một nhà đầu tư thuộc nhóm ngại rủi ro (a highly risk averse investor) đầu tư vào Tangency Portfolio và T-bills với một mục tiêu khiêm tốn về lợi tức và \(\sigma^{e}_p = 0.02\). Danh mục đầu thư thỏa mãn yêu cầu này của nhà đầu tư sẽ có tỉ trọng cho T-bills theo công thức 2 là:
## [1] 0.6614513
Và tỉ trọng phân bổ cho T-bills là:
## [1] 0.3385487
Và lợi tức của danh mục đầu tư theo công thức 3 sẽ là:
## [1] 0.001671608
Cụ thể hơn, tỉ trọng đầu tư vào ba tài sản rủi ro sẽ là:
## MSFT SBUX GE
## 0.8310261 0.3031260 -0.4727008
Dễ suy ra rằng tổng tỉ trọng của các tài sản rủi ro sẽ bằng 0.6614513:
## [1] 0.6614513
Đặt tên cho danh mục đầu tư này là TAN1. Các thông tin về TAN1:
Table 5: Risk and Return for TAN1 Portfolio
symbol
|
weight
|
return
|
risk
|
MSFT
|
0.8310261
|
0.0016716
|
0.02
|
SBUX
|
0.3031260
|
0.0016716
|
0.02
|
GE
|
-0.4727008
|
0.0016716
|
0.02
|
T-bills
|
0.3385487
|
0.0016716
|
0.02
|
Trên hệ trục tọa độ risk-return TAN1 sẽ là điểm nằm trên đường thẳng nối hai điểm TAN và T-bills và đường thẳng này được gọi là Tangency Line. Dưới đây là R codes cho Tangency Line:
# Prepare data:
df_free_risk <- tibble(symbol = "T-bills", risk = 0, return = rf)
df_tangency %>%
slice(1) %>%
mutate(symbol = "TAN") %>%
bind_rows(df_tangency1 %>% slice(1) %>% mutate(symbol = "TAN1")) %>%
bind_rows(df_free_risk %>% mutate(symbol = "T-bills")) -> df_tangency_line
# Plot Tangency Line:
df_eff_frontier_line %>%
ggplot(aes(risk, return)) +
geom_point(color = "blue") +
geom_point(data = df_ineff_frontier, color = "red") +
geom_point(data = gmv_port, color = "green", shape = 18, size = 3) +
geom_text_repel(data = gmv_port, aes(label = "GMV"), direction = "x") +
geom_point(data = df_risk_return, color = "orange", size = 3) +
geom_text_repel(data = df_risk_return, aes(label = symbol)) +
geom_point(data = df_tangency_line, color = "purple", size = 3, shape = 18) +
geom_line(data = df_tangency_line, color = "purple", size = 1) +
geom_text_repel(data = df_tangency_line, aes(label = symbol), direction = "y") +
annotate("text", label = "Tangency Line", x = 0.01, y = 0.0011) +
scale_y_continuous(labels = percent) +
scale_x_continuous(labels = percent) +
labs(x = expression("Risk" ~ (sigma)),
y = expression("Return" ~ (mu)),
title = "Figure 4: Tangency Line")

Một nhà đầu tư có ngưỡng chịu rủi ro cao (a risk tolerant investor) rất có thể ưa thích một danh mục đầu tư có lợi tức cao hơn với cái giá phải trả là rủi ro cao hơn. Những danh mục đầu tư kiểu này sẽ: (1) vẫn nằm trên Tangency Line, và (2) nằm về phía trái của TAN1.
---
title: 'Quantitative Finance: Portfolio Theory (Part 2)'
author: 'Author: Nguyen Chi Dung'
subtitle: "R Finance Series"
output:
  html_document: 
    code_download: true
    # code_folding: hide
    highlight: zenburn
    # number_sections: yes
    theme: "flatly"
    toc: TRUE
    toc_float: TRUE
---

```{r setup,include=FALSE}
knitr::opts_chunk$set(echo = TRUE, warning = FALSE, message = FALSE, cache = TRUE, fig.height = 7, fig.width = 10)

```

![](C:/Users/ADMIN/Documents/inv2.jpg)

# Portfolio Theory Again

[Portfolio Theory](https://en.wikipedia.org/wiki/Modern_portfolio_theory) đã được mô tả và giải thích trực quan trong trong [phần 1](https://rpubs.com/chidungkt/716545) tập trung vào hai vấn đề chính: 

1. Những tính toán ban đầu liên quan đến lí thuyết này bằng ngôn ngữ ma trận (lợi tức và rủi ro).
2. Tìm danh mục đầu tư mà rủi ro là bé nhất (Global Minimum Variance - GMV Portfolio) dựa trên phương pháp mô phỏng. 

Trước hết chúng ta lặp lại việc tìm GMV Portfolio từ 10000 danh mục như đã biết từ phần 1: 

```{r}
# Clear workspace: 
rm(list = ls())

# Some stocks selected (Microsoft, Starbucks and Apple): 

my_symbols <- c("MSFT", "SBUX", "GE")

# Number of stocks: 

n <- length(my_symbols)

# Collect data: 

library(tidyquant)
price_data <- tq_get(my_symbols,
                     from = "2018-01-01",
                     to = "2020-12-31",
                     get = "stock.prices")

# Calculate log return: 

library(tidyverse)

price_data %>%
  group_by(symbol) %>% 
  mutate(lag1 = lag(adjusted, n = 1L)) %>% 
  filter(!is.na(lag1)) %>% 
  mutate(daily_return = log(adjusted / lag1)) %>% 
  ungroup() %>% 
  select(symbol, date, daily_return) -> daily_returns

# Calculate risk and return for assets:
  
daily_returns %>% 
  group_by(symbol) %>% 
  summarise(risk = sd(daily_return), return = mean(daily_return)) -> df_risk_return

# Convert to wide form: 

daily_returns %>% 
  pivot_wider(names_from = symbol, values_from = daily_return) %>% 
  select(-date) -> returns_wide

# Asset mean return: 

mu <- colMeans(returns_wide) 

# Covariance matrix: 

sigma_matrix <- cov(returns_wide)

# Function calculates risk-return for a random-weight portfolio: 
library(rportfolios)

portfolio_risk_return <- function(j) {
  
  # Create random weights: 
  set.seed(j)
  
  X <- random.bounded(n = n, x.t = 1, x.l = rep(-1, n), x.u = rep(1, n))

  # Portfolio return: 
  mu_port_rand = crossprod(X, mu) %>% as.numeric()

  # Portfolio risk: 
  sig_port_rand <- t(X) %*% sigma_matrix %*% X %>% as.numeric() %>% sqrt()
  
  # Create a data frame of results: 
  df_poft <- tibble(symbol = my_symbols, 
                    weight = X, 
                    return = mu_port_rand, 
                    risk = sig_port_rand,
                    port_index = j)
  
  return(df_poft)

}

# Use the function and combine results in form of data frame: 

lapply(1:10000, portfolio_risk_return) -> all_return_port

do.call("bind_rows", all_return_port) -> df_return_10000

df_return_10000 %>% 
  filter(!duplicated(port_index)) -> df_return_mini_10000

# Minimum risk portfolio (GMV Portfolio) from simulation: 
min_risk <- df_return_mini_10000 %>% slice(which.min(risk)) 

```

GMV Portfolio có rủi ro - lợi tức và trọng số của các tài sản được trình bày ở Table 1: 

```{r}
library(kableExtra) # For presenting table. 

df_return_10000 %>% 
  filter(port_index == min_risk$port_index) %>% 
  select(-port_index) %>% 
  kbl(caption = "Table 1: Minimum Risk Portfolio by Simulation", escape = TRUE) %>%
  kable_classic(full_width = FALSE, html_font = "Cambria")
```

Danh mục có rủi ro thấp nhất này đạt được khi các trọng số của MSFT, SBUX và GE lần lượt là 45%, 46% và 9%. Tuy nhiên đây là kết quả rút ra dựa trên mô phỏng. Nói chính xác hơn, đây là danh mục đầu tư có risk nhỏ nhất trong số 10000 danh mục có trọng số ngẫu nhiên. 


# GMV Portfolio

Portfolio Theory chỉ ra rằng các trọng số các tài sản của GMV Portfolio được tính toán dựa trên việc giải hệ ma trận dưới đây: 

$$\begin{equation}
\tag{1}
z_m = A_mb
\end{equation}$$  

Với $z_m$, $A_m$ và $b$ là các ma trận dưới đây: 


$$\begin{equation*}
A_m = 
\begin{pmatrix}
2\Sigma & 1\\
1' & 0  
\end{pmatrix}
\end{equation*}$$ 

$$\begin{equation*}
z_m = 
\begin{pmatrix}
m \\
\lambda  
\end{pmatrix}
\end{equation*}$$

$$\begin{equation*}
b = 
\begin{pmatrix}
0 \\
1  
\end{pmatrix}
\end{equation*}$$

Còn $m$ là ma trận trọng số các tài sản: 

$$\begin{equation*}
m = 
\begin{pmatrix}
x_A & x_B & x_C 
\end{pmatrix}
\end{equation*}$$

Lưu ý rằng tổng các trọng số luôn thoản mãn $x_A + x_B + x_C = 1$. Dưới đây là R codes tìm tỉ trọng các tài sản cho GMV Portfolio bằng cách giải ma trận được mô tả trong phương trình 1: 


```{r}

# Calculate weights for GMV Portfolio: 

top_mat <- cbind(2*sigma_matrix, rep(1, n))

bot_vec <- c(rep(1, n), 0)

Am_mat <- rbind(top_mat, bot_vec)

b_vec <- c(rep(0, n), 1)

zm_mat <- solve(Am_mat) %*% b_vec

X_minimum_var <- zm_mat[1:3, 1]

# Print results: 

print(X_minimum_var)

```

Kết quả này chỉ ra rằng các trọng số của các tài sản cho GMV Portfolio có chút khác biệt nhỏ so với cách tìm bằng phương pháp mô phỏng. Điều này không có gì lạ vì Portfolio Theory đưa ra công thức chính xác để tìm trọng số cho GMV Portfolio còn phương pháp mô phỏng chỉ thì lại đi theo một hướng khác: chỉ ra ma trận có risk bé nhất trong số 10000 danh mục đầu tư. Dễ thấy rằng hai kết quả này sẽ tiệm cận nhau nếu chúng ta tìm kiếm danh mục có risk nhỏ nhất trong số 1.000.000 danh mục đầu tư ngẫu nhiên. 

Để tiện lợi cho việc so sánh, chúng ta viết hàm tính rủi ro - lợi tức của một danh mục đầu tư bất kì khi biết thêm tỉ trọng của các tài sản: 

```{r}
# Function calculate risk-return with give weights:

risk_return_portfolio <- function(weights) {
  
  # Portfolio return: 
  mu_port <- crossprod(weights, mu) %>% as.numeric()

  # Portfolio risk: 

  sig2_port <- t(weights) %*% sigma_matrix %*% weights

  sig_port <- sig2_port %>% as.numeric() %>% sqrt()

  # Print results: 
  
  tibble(symbol = my_symbols, weight = weights, return = mu_port, risk = sig_port) -> df_results
  
  return(df_results)

}

```

Rồi sử dụng hàm này: 

```{r}
risk_return_portfolio(weights = X_minimum_var) -> min_var

min_var %>% 
  kbl(caption = "Table 2: GMV Portfolio by Portfolio Theory", escape = TRUE) %>%
  kable_classic(full_width = FALSE, html_font = "Cambria")
  
```

So sánh Table 1 và Table 2 chúng ta có thể thấy rằng sự sai khác về risk chỉ là 0.0067%. 

# Efficient Portfolio

Một Efficient Portfolio là danh mục đầu tư mà với một lợi tức kì vọng cố định trước nhưng lại có rủi ro thấp nhất. Giả sử đặt lợi tức mục tiêu của danh mục là bằng với lợi tức của mã MSFT. Danh mục có mức lợi tức mục tiêu này nhưng rủi ro thấp hơn rủi ro của MSFT sẽ có các trọng số được tính như sau: 


```{r}
#------------------------------------------------------------------
#  Efficient portfolio with the same expected return as Microsoft
#------------------------------------------------------------------

return_target <- mu[my_symbols[1]]

top_mat <- cbind(2*sigma_matrix, mu, rep(1, n))

mid_vec <- c(mu, rep(0, n - 1))

bot_vec <- c(rep(1, n), rep(0, n - 1))

A_mat = rbind(top_mat, mid_vec, bot_vec)

bmsft_vec <- c(rep(0, n), return_target, 1)

z_mat <- solve(A_mat) %*% bmsft_vec

X_efficient_as_msft <- z_mat[1:3, 1]

# Print results: 
print(X_efficient_as_msft)

```

Với trọng số tìm ra ở trên chúng ta tính toán cặp risk-return tương ứng và so sánh với MSFT là điểm màu da cam (kí hiệu EFF1) trong Figure 2 dưới đây: 

```{r}

risk_return_portfolio(weights = X_efficient_as_msft) -> df_as_msft

library(ggrepel)
library(scales)

df_return_mini_10000 %>% 
  ggplot(aes(risk, return)) + 
  geom_point(alpha = 0.05, color = "blue") + 
  geom_point(data = min_var %>% slice(1), color = "red", size = 3, shape = 17) + 
  geom_text_repel(data = min_var %>% slice(1), aes(label = "GMV")) + 
  geom_point(data = df_risk_return, color = "green", size = 2) + 
  geom_text_repel(data = df_risk_return, aes(label = symbol)) +  
  geom_point(data = df_as_msft, color = "orange", size = 2) + 
  geom_text_repel(data = df_as_msft %>% slice(1), aes(label = "EFF1")) + 
  labs(x = expression("Risk" ~ (sigma)), 
       y = expression("Return" ~ (mu)), 
       title = "Figure 1: Efficient Portfolio with the same return as Microsoft") 
  
```

Trong Figure 2 thì điểm màu đỏ chính là GMV Portfolio - danh mục có rủi ro thấp nhất với các trọng số được tính toán theo Portfolio Theory. Để hỗ trợ cho tính toán và so sánh chúng ta nên viết hàm tính toán tỉ trọng cho danh mục đầu tư hiệu quả (Efficient Portfolio) khi định trước lợi tức mục tiêu: 

```{r}
# Function find weights for a efficient portfolio with given return: 

find_efficient_port <- function(given_return) {
  
  top_mat <- cbind(2*sigma_matrix, mu, rep(1, n))
  
  mid_vec <- c(mu, rep(0, n - 1))

  bot_vec <- c(rep(1, n), rep(0, n - 1))

  A_mat = rbind(top_mat, mid_vec, bot_vec)

  my_vec <- c(rep(0, n), given_return, 1)

  z_mat <- solve(A_mat) %*% my_vec

  X_efficient <- z_mat[1:3, 1]
  
  X_efficient %>% 
    risk_return_portfolio() %>% 
    return()
}
```


Với một mục tiêu khác về lợi tức - chẳng hạn *r = 0.25%* thì tỉ trọng các tài sản mà rủi ro thấp nhất là: 

```{r}
find_efficient_port(given_return = 0.0025) -> df_efficient_025


df_efficient_025 %>% 
  kbl(caption = "Table 3: Efficient Portfolio which Target Return = 0.25%", escape = TRUE) %>%
  kable_classic(full_width = FALSE, html_font = "Cambria")
```

Chúng ta khảo sát cơ cấu của danh mục đầu tư với một loạt ngưỡng lợi tức định trước nằm trong khoảng từ 0 đến 0.3%: 

```{r}

# Generate sequence of returns: 
target_returns <- seq(0, 0.0025, length.out = 20) %>% unique()
lapply(target_returns, find_efficient_port) -> list_eff_port
do.call("bind_rows", list_eff_port) -> df_eff_port

paste0(round(target_returns*100, 2), "%") -> x_labels
my_colors <- c('#e41a1c','#377eb8','#4daf4a')

df_eff_port %>% 
  mutate(return = factor(return)) %>% 
  ggplot(aes(return, weight, fill = symbol)) + 
  geom_col() + 
  scale_x_discrete(labels = x_labels) + 
  scale_y_continuous(limits = c(-1, 2), breaks = seq(-1, 2, 0.25), labels = percent) + 
  scale_fill_manual(values = my_colors) + 
  theme(panel.grid.minor = element_blank()) + 
  theme(legend.title = element_blank()) + 
  theme(legend.position = c(0.1, 0.85)) + 
  theme(axis.text = element_text(size = 8)) + 
  labs(x = expression("Return" ~ (sigma)), 
       y = "Weight", 
       title = "Figure 2: Asset Weight of Efficient Portfolios") 
  
```

Khi lợi tức yêu cầu của danh mục đầu tư tăng, thì từ Figure 3 có thể thấy: 

1. Tỉ trọng tài sản phân bổ cho MSFT tăng. 
2. Tỉ trọng tài sản phân bổ cho GE tăng nhưng đây là tài sản "vay mượn". 
3. Tại bất kì ngưỡng nào của lực tức thì tỉ trọng của SBUX có vẻ như không thay đổi nhiều. Điều này ngụ ý rằng: lợi tức của danh mục đầu tư là "trơ", gần như không nhạy trước sự thay đổi về tỉ trọng của mã cổ phiếu này. 


# Efficient Frontier

Giả sử có hai danh mục đầu tư hiệu quả dưới đây: 

1. Danh mục đầu tư có rủi ro là thấp nhất nhưng lợi tức là cao nhất có thể được. Đây chính là GMV Portfolio. 
2. Danh mục đầu tư có lợi tức định trước là 0.25% nhưng rủi ro là thấp nhất (kí hiệu là MaxReturn Portfolio). 

Xét danh mục đầu tư được tạo thành từ sự kết hợp của hai danh mục đầu tư trên trong đó tỉ trọng đầu tư vào hai danh mục này là $\alpha$ và $\beta$, kí hiệu là Combined Portfolio - CP. Lúc này có hai khả năng xẩy ra: 

1. Nếu danh mục này có lợi tức cao hơn lợi tức của GMV Portfolio thì danh mục đầu tư này sẽ thuộc đường danh mục hiệu quả (Efficient Frontier).  
2. Ngược lại, nếu danh mục đầu tư này có lợi tức thấp hơn lợi tức của GMV Portfolio thì danh mục đầu tư này thuộc đường danh mục đầu tư phi hiệu quả (Inefficient Frontier). 

Chúng ta xét danh mục đầu tư được hình thành từ hai danh mục đầu tư trên với các trọng số lần lượt là $\alpha = 0.4$ và $\beta = 1 - \alpha$ rồi tính toán cặp risk-return cho danh mục này:


```{r}
# Asset weights for combined portfolio: 

alpha <- 0.4
beta <- 1 - alpha
X_combined <- alpha*min_var$weight + beta*df_efficient_025$weight

# Risk and Return: 

risk_return_portfolio(weights = X_combined) -> df_combined_port

df_combined_port %>% 
  kbl(caption = "Table 4: Risk and Return for Combined Portfolio", escape = TRUE) %>%
  kable_classic(full_width = FALSE, html_font = "Cambria")
```

Table 4 cho thấy đây là danh mục thuộc Efficient Frontier vì lợi tức của danh mục này là 0.19% cao hơn lợi tức của GMV Portfolio chỉ có lợi tức là 0.09%. Dễ kiểm tra thấy rằng rủi ro của danh mục đầu tư này 0.0233 - một con số thấp hơn 0.0305 (là rủi ro của danh mục đầu tư hiệu quả có lợi tức mục tiêu 0.25$) nhưng thấp hơn 0.0179 (là rủi ro của GMV Portfolio). 

Chúng ta có thể khảo sát và vẽ Efficient Frontier bằng cách tính toán cặp risk-return cho 100 ngưỡng khác nhau của lợi tức từ 0% đến 0.25% như dưới đây:  

```{r}
low_return <- 0

up_return <- df_efficient_025$return[1]

target_returns_100 <- seq(low_return, up_return, length.out = 100) %>% unique()

lapply(target_returns_100, find_efficient_port) -> list_eff_port_100

do.call("bind_rows", list_eff_port_100) -> df_eff_port_100

df_eff_port_100 %>% 
  filter(!duplicated(return)) -> df_eff_frontier

# GMV portfolio: 
df_eff_frontier %>% slice(which.min(risk)) -> gmv_port 

# Maximum return portfolio: 
df_eff_frontier %>% slice(which.max(risk)) -> max_return_port 

# Portfolios belong to Efficient Frontier: 
df_eff_frontier %>% filter(return > gmv_port$return) -> df_eff_frontier_line

# Portfolio belong to Inefficient Frontier: 
df_eff_frontier %>% filter(return < gmv_port$return) -> df_ineff_frontier

# Graph of Efficient Frontier: 

df_return_mini_10000 %>% 
  ggplot(aes(risk, return)) + 
  geom_point(alpha = 0.05, color = "blue") + 
  geom_point(data = df_eff_frontier_line, color = "blue") + 
  geom_point(data = max_return_port, color = "purple", shape = 18, size = 3) + 
  geom_text_repel(data = max_return_port, aes(label = "Min25"), direction = "y") + 
  geom_point(data = df_ineff_frontier, color = "red") + 
  geom_point(data = gmv_port, color = "green", shape = 18, size = 3) + 
  geom_text_repel(data = gmv_port, aes(label = "GMV"), direction = "x") + 
  geom_point(data = df_risk_return, color = "orange", size = 3) + 
  geom_text_repel(data = df_risk_return, aes(label = symbol)) + 
  annotate("text", label = "Efficient Frontier", x = 0.022, y = 0.002) + 
  annotate("text", label = "Inefficient Frontier", x = 0.021, y = 0) + 
  scale_y_continuous(labels = percent) + 
  scale_x_continuous(labels = percent) + 
  labs(x = expression("Risk" ~ (sigma)), 
       y = expression("Return" ~ (mu)), 
       title = "Figure 3: Efficient Frontier") 


```

Ở Figure 3 thì Efficient Frontier là đường cong tạo ra bằng cách nối các điểm màu xanh. Inefficient Frontier là đường cong tạo ra bằng cách nối các điểm màu đỏ. 

# Tangency Portfolio

[Sharpe Ratio](https://en.wikipedia.org/wiki/Sharpe_ratio) là một thước đo đánh giá hiệu quả của danh mục đầu tư và được tính theo công thức: 

$$S=\frac{\mu_p - r_{f}}{\sigma_p}$$
Trong đó $\sigma_p$ và $\mu_p$ lần lượt là rủi ro và lợi tức kì vọng của danh mục còn $r_f$ là lợi tức của tài sản phi rủi ro. Ở đây lợi tức của tài sản phi rủi ro được chọn làm tham chiếu và thường là trái phiếu chính phủ (hoặc T-bills). 

Tangency Portfolio là danh mục đầu tư mà có Sharpe Ratio là cao nhất. Dưới đây là R codes tìm tỉ trọng cho các tài sản cho Tangency Portfolio (kí hiệu là TAN) nếu biết trước lãi suất (daily return) của tài sản phi rủi ro (như trái phiếu chính phủ) là 0.01%: 

```{r}
# Calculate weights for Tangency Portfolio: 

rf <- 0.0001

sigma_inv_mat <- solve(sigma_matrix)

one_vec <- rep(1, n)

mu_minus_rf <- mu - rf*one_vec

top_mat <- sigma_inv_mat %*% mu_minus_rf

bot_val <- as.numeric(t(one_vec) %*% top_mat)

X_tangency <- top_mat[, 1] / bot_val

# Print results: 

print(X_tangency)

```

Với tỉ trọng các tài sản tìm được thì cặp risk-return của Tangency Portfolio được tính ở Table 5: 

```{r}
risk_return_portfolio(weights = X_tangency) -> df_tangency

df_tangency %>% 
  kbl(caption = "Table 4: Risk and Return for Tangency Portfolio", escape = TRUE) %>%
  kable_classic(full_width = FALSE, html_font = "Cambria")

```

Và Sharpe Ratio của danh mục này sẽ là: 

```{r}
df_tangency %>% 
  slice(1) %>% 
  mutate(premium = return - rf) %>% 
  mutate(sharpeRatio = premium / risk) %>% 
  pull(sharpeRatio)
```


# Mutual Fund Separation Theorem

Xét một danh mục đầu tư được hình thành từ việc phân bổ tỉ trọng là $x_t$ cho Tangency Portfolio ở trên và phần còn lại là $1 - x_t$ cho tài sản phi rủi ro T-bills. Rủi ro và lợi tức của danh mục đầu tư này, lần lượt kí hiệu là $\sigma^{e}_p$ và $\mu^{e}_p$ sẽ là: 

$$\begin{equation} \tag{2} \sigma^{e}_p = x_t\sigma_p \end{equation}$$

$$\begin{equation} \tag{3} \mu^{e}_p = r_f + x_t(\mu_p - r_f) \end{equation}$$

Giả sử một nhà đầu tư thuộc nhóm ngại rủi ro (a highly risk averse investor) đầu tư vào Tangency Portfolio và T-bills với một mục tiêu khiêm tốn về lợi tức và $\sigma^{e}_p = 0.02$. Danh mục đầu thư thỏa mãn yêu cầu này của nhà đầu tư sẽ có tỉ trọng cho T-bills theo công thức 2 là: 

```{r}
sigma_target <- 0.02

X_for_Tangency <- sigma_target /  df_tangency$risk[1]

print(X_for_Tangency)
```

Và tỉ trọng phân bổ cho T-bills là: 

```{r}
X_for_Tbills <- 1 - X_for_Tangency
print(X_for_Tbills)
```

Và lợi tức của danh mục đầu tư theo công thức 3 sẽ là: 

```{r}
mu_Tangency_Tbill <- rf + X_for_Tangency*(df_tangency$return[1] - rf)

print(mu_Tangency_Tbill)
```

Cụ thể hơn, tỉ trọng đầu tư vào ba tài sản rủi ro sẽ là: 

```{r}
X_tangency*X_for_Tangency
```

Dễ suy ra rằng tổng tỉ trọng của các tài sản rủi ro sẽ bằng 0.6614513: 

```{r}
sum(X_tangency*X_for_Tangency)
```

Đặt tên cho danh mục đầu tư này là TAN1. Các thông tin về TAN1: 

```{r}
df_tangency1 <- tibble(symbol = c(my_symbols, "T-bills"),
                       weight = c(X_tangency*X_for_Tangency, X_for_Tbills), 
                       return = mu_Tangency_Tbill, 
                       risk = sigma_target)

df_tangency1 %>% 
  kbl(caption = "Table 5: Risk and Return for TAN1 Portfolio", escape = TRUE) %>%
  kable_classic(full_width = FALSE, html_font = "Cambria")

```

Trên hệ trục tọa độ risk-return TAN1 sẽ là điểm nằm trên đường thẳng nối hai điểm TAN và T-bills và đường thẳng này được gọi là Tangency Line. Dưới đây là R codes cho Tangency Line: 

```{r}

# Prepare data: 

df_free_risk <- tibble(symbol = "T-bills", risk = 0, return = rf)

df_tangency %>% 
  slice(1) %>% 
  mutate(symbol = "TAN") %>% 
  bind_rows(df_tangency1 %>% slice(1) %>% mutate(symbol = "TAN1")) %>% 
  bind_rows(df_free_risk %>% mutate(symbol = "T-bills")) -> df_tangency_line

# Plot Tangency Line: 

df_eff_frontier_line %>% 
  ggplot(aes(risk, return)) + 
  geom_point(color = "blue") + 
  geom_point(data = df_ineff_frontier, color = "red") +  
  geom_point(data = gmv_port, color = "green", shape = 18, size = 3) + 
  geom_text_repel(data = gmv_port, aes(label = "GMV"), direction = "x") + 
  geom_point(data = df_risk_return, color = "orange", size = 3) + 
  geom_text_repel(data = df_risk_return, aes(label = symbol)) + 
  geom_point(data = df_tangency_line, color = "purple", size = 3, shape = 18) + 
  geom_line(data = df_tangency_line, color = "purple", size = 1) + 
  geom_text_repel(data = df_tangency_line, aes(label = symbol), direction = "y") +
  annotate("text", label = "Tangency Line", x = 0.01, y = 0.0011) + 
  scale_y_continuous(labels = percent) + 
  scale_x_continuous(labels = percent) + 
  labs(x = expression("Risk" ~ (sigma)), 
       y = expression("Return" ~ (mu)), 
       title = "Figure 4: Tangency Line")  

```

Một nhà đầu tư có ngưỡng chịu rủi ro cao (a risk tolerant investor) rất có thể ưa thích một danh mục đầu tư có lợi tức cao hơn với cái giá phải trả là rủi ro cao hơn. Những danh mục đầu tư kiểu này sẽ: (1) vẫn nằm trên Tangency Line, và (2) nằm về phía trái của TAN1. 

# References

1. [Investments 10th Edition by Zvi Bodie, Alex Kane (Author), Alan J. Marcus](https://www.amazon.com/Investments-10th-Zvi-Bodie/dp/0077861671). 
2. [Modern Portfolio Theory and Investment Analysis, 9th Edition by Elton et al.](https://www.wiley.com/en-us/Modern+Portfolio+Theory+and+Investment+Analysis%2C+9th+Edition-p-9781118469941). 
3. [Basics of Matrix Algebra for Statistics with R by Nick Fieller](https://www.amazon.com/Basics-Matrix-Algebra-Statistics-Chapman-ebook/dp/B0116R46TQ/ref=sr_1_1?dchild=1&keywords=matrix+calculation+in+r&qid=1611491969&s=books&sr=1-1). 
4. [Portfolio Theory with Matrix Algebra by Eric Zivot](https://faculty.washington.edu/ezivot/econ424/portfolioTheoryMatrix.pdf). 




