Kính gửi PGS.TS Nguyễn Tuấn Duy,
Em xin chân thành cảm ơn thầy đã tận tình hướng dẫn và hỗ trợ em trong quá trình thực hiện tiểu luận với đề tài “Phân tích sự phụ thuộc giữa VN-Index và TL-Index bằng phương pháp Copula”. Sự chỉ dẫn và kiến thức quý báu của thầy không chỉ giúp em hiểu sâu hơn về môn Mô hình ngẫu nhiên mà còn truyền cảm hứng cho em trong nghiên cứu. Em rất biết ơn vì sự tận tâm và nhiệt huyết của thầy. Những góp ý và phản hồi của thầy đã giúp em hoàn thiện và nâng cao chất lượng của bài tiểu luận. Em xin chân thành cảm ơn và chúc thầy nhiều sức khỏe.
Trân trọng,
Như Thủy
Trong bối cảnh toàn cầu hóa và sự phát triển mạnh mẽ của các thị trường tài chính, việc hiểu rõ mối quan hệ giữa các thị trường chứng khoán quốc tế là vô cùng quan trọng. VN-Index và TL-Index (SET-Index), đại diện cho thị trường chứng khoán Việt Nam và Thái Lan, là hai chỉ số quan trọng phản ánh sự phát triển kinh tế của hai quốc gia này. Tuy nhiên, mối quan hệ giữa hai chỉ số này chưa được nghiên cứu sâu rộng, đặc biệt là sử dụng phương pháp Copula để phân tích sự phụ thuộc. Việc lựa chọn đề tài này nhằm lấp đầy khoảng trống nghiên cứu và cung cấp cái nhìn sâu sắc về sự liên kết giữa hai thị trường chứng khoán, từ đó hỗ trợ các nhà đầu tư và quản lý danh mục đầu tư trong việc đưa ra các quyết định hiệu quả.
Mục tiêu chính của nghiên cứu này là phân tích sự phụ thuộc giữa VN-Index và TL-Index bằng cách sử dụng phương pháp Copula. Nghiên cứu về sự phụ thuộc giữa VN-Index và TL-Index không chỉ mang lại những hiểu biết sâu sắc về mối quan hệ giữa hai thị trường chứng khoán lớn trong khu vực Đông Nam Á, mà còn có ý nghĩa thực tiễn cao trong việc quản lý rủi ro và tối ưu hóa danh mục đầu tư. Trong bối cảnh toàn cầu hóa kinh tế, các thị trường tài chính ngày càng trở nên liên kết và phụ thuộc lẫn nhau. Việc hiểu rõ về sự phụ thuộc này giúp các nhà đầu tư có thể dự đoán và phản ứng kịp thời trước những biến động của thị trường, từ đó nâng cao hiệu quả đầu tư. Đồng thời, các nhà quản lý danh mục đầu tư có thể sử dụng thông tin này để đa dạng hóa danh mục, giảm thiểu rủi ro và tối đa hóa lợi nhuận.
Đối tượng nghiên cứu của đề tài này là hai chỉ số chứng khoán VN-Index và TL-Index, đại diện cho thị trường chứng khoán Việt Nam và Thái Lan.
Phạm vi nghiên cứu bao gồm dữ liệu từ tháng 1 năm 2018 đến tháng 7 năm 2024, được lấy từ trang web investing.com. Khoảng thời gian này đủ dài để phân tích các biến động và xu hướng của hai chỉ số, đồng thời cung cấp dữ liệu cần thiết để áp dụng các phương pháp phân tích tiên tiến như Copula.
Phương pháp nghiên cứu chủ yếu trong bài tiểu luận này là phương pháp Copula, một công cụ mạnh mẽ để phân tích sự phụ thuộc giữa các biến ngẫu nhiên.
Các bước nghiên cứu bao gồm thu thập dữ liệu về VN-Index và TL-Index cùng với các chỉ số chứng khoán khác trong khu vực Đông Nam Á (Malaysia và Philippines) để có cái nhìn toàn diện hơn, tính toán và lập ma trận tương quan giữa các chỉ số chứng khoán để có cái nhìn tổng quan về mối quan hệ giữa chúng, kiểm định và xác định các mô hình phân phối biên ARMA(p,q)-GJR-GARCH(1,1) phù hợp để mô tả sự biến động của VN-Index và TL-Index. Tiếp theo, áp dụng các loại Copula khác nhau (như Gaussian, t-Copula, Clayton, Gumbel, v.v.) để phân tích sự phụ thuộc giữa VN-Index và TL-Index. Cuối cùng, so sánh và đánh giá kết quả từ các Copula để tìm ra mô hình tốt nhất phản ánh sự phụ thuộc giữa hai chỉ số này.
Phần mềm R được sử dụng làm công cụ phân tích chính trong nghiên cứu này. R là một phần mềm mạnh mẽ và linh hoạt cho phân tích dữ liệu, thống kê và đồ họa…
Thị trường chứng khoán Việt Nam đã nổi bật lên như một điểm sáng trong khu vực Đông Nam Á với sự phát triển nhanh chóng và tiềm năng đáng kể. Từ khi chính thức hoạt động vào đầu những năm 2000, thị trường chứng khoán Việt Nam, với hai sàn giao dịch chính là Sở Giao dịch Chứng khoán TP.HCM (HOSE) và Sở Giao dịch Chứng khoán Hà Nội (HNX), đã chứng kiến sự tăng trưởng mạnh mẽ về số lượng niêm yết và khối lượng giao dịch. Các chỉ số chứng khoán chủ chốt như VN-Index và HNX-Index không chỉ phản ánh sức khỏe của nền kinh tế trong nước mà còn đóng vai trò quan trọng trong việc thu hút sự quan tâm của các nhà đầu tư quốc tế.
Trong khi đó, thị trường chứng khoán Đông Nam Á, với các trung tâm tài chính chính như Singapore, Bangkok, và Jakarta, là một khu vực năng động và đầy cơ hội đầu tư. Các thị trường chứng khoán ở khu vực này có đặc điểm chung là sự phát triển nhanh chóng, với sự gia tăng đáng kể về quy mô và đa dạng của các sản phẩm tài chính. Singapore Exchange (SGX), Bangkok Stock Exchange (SET), và Indonesia Stock Exchange (IDX) là những sàn giao dịch lớn nhất trong khu vực, với sự kết nối sâu rộng và sự tương tác chặt chẽ giữa các nền kinh tế.
Mối quan hệ giữa thị trường chứng khoán Việt Nam và Đông Nam Á thể hiện sự tương tác và phụ thuộc lẫn nhau trong bối cảnh toàn cầu hóa. Các yếu tố như chính sách tiền tệ, biến động tỷ giá, và xu hướng đầu tư quốc tế có thể tạo ra ảnh hưởng đồng thời trên cả hai thị trường. Sự phát triển mạnh mẽ của thị trường chứng khoán Việt Nam không chỉ nâng cao tính cạnh tranh trong khu vực mà còn thúc đẩy sự liên kết và hợp tác giữa các thị trường chứng khoán Đông Nam Á. Các nhà đầu tư quốc tế thường xem xét khu vực Đông Nam Á như một tập hợp các cơ hội đầu tư, trong đó Việt Nam đóng vai trò quan trọng. Ngược lại, các xu hướng và biến động trong các thị trường chứng khoán lớn khác trong khu vực có thể ảnh hưởng đến dòng vốn và hoạt động trên thị trường chứng khoán Việt Nam.
Như vậy, sự phát triển của thị trường chứng khoán Việt Nam không chỉ phản ánh xu hướng kinh tế quốc gia mà còn có tác động tích cực đến thị trường chứng khoán toàn khu vực Đông Nam Á, nhấn mạnh tầm quan trọng của việc theo dõi và phân tích mối quan hệ giữa các thị trường tài chính trong bối cảnh toàn cầu hóa và hội nhập kinh tế.
Tương quan là một chỉ số đo lường mức độ và hướng của mối quan hệ giữa hai biến. Hệ số tương quan có thể có giá trị từ -1 đến 1, trong đó -1 cho biết mối quan hệ hoàn toàn ngược chiều, 1 cho biết mối quan hệ hoàn toàn đồng chiều, và 0 cho biết không có mối quan hệ. Tương quan giúp xác định mức độ liên kết và sự đồng biến động giữa các biến trong dữ liệu.
Công thức tính hệ số tương quan Pearson giữa hai biến X và Y là:
\[ \rho_{XY} = \frac{\text{Cov}(X, Y)}{\sigma_X \sigma_Y} \]
Trong đó:
Cov(X,Y) là hiệp phương sai của X và Y
\(\sigma_X\) và \(\sigma_Y\) là độ lệch chuẩn của X và Y
Ma trận tương quan là bảng hiển thị hệ số tương quan giữa tất cả các cặp biến trong tập dữ liệu. Nếu có \(n\) biến, ma trận tương quan là một ma trận \(n \times n\), trong đó mỗi phần tử \((i,j)\) là hệ số tương quan giữa biến thứ \(i\) và biến thứ \(j\).
Trong nghiên cứu này, mô hình GJR-GARCH(r,m) theo quy trình tự hồi quy ARMA(p,q) được sử dụng để mô hình hóa cho mỗi chuỗi lợi suất, đề xuất bởi Engle & Ng (1993), Glosten & cộng sự (1993).
Mô hình GJR-GARCH, viết tắt từ Glosten Jagannathan Runkle GARCH, là một mở rộng của mô hình GARCH (Generalized Autoregressive Conditional Heteroskedasticity). Được phát triển để cải thiện khả năng mô hình hóa biến động trong chuỗi thời gian tài chính, GJR-GARCH đặc biệt chú trọng đến cách phản ứng của biến động với các cú sốc âm và dương khác nhau.
Trong khi mô hình GARCH cơ bản chỉ xem xét các hiệu ứng tổng quát của sự biến động, GJR-GARCH cho phép biến động phản ứng khác nhau đối với các cú sốc tích cực và tiêu cực, điều này giúp mô hình hóa các hiện tượng như hiệu ứng “leverage”. Hiệu ứng này chỉ ra rằng sự giảm giá của tài sản thường liên quan đến sự gia tăng biến động.
Thay vì dựa vào giả định rằng sai số của mô hình tuân theo phân phối chuẩn hoặc phân phối Student-t, nghiên cứu này áp dụng các phân phối khác như phân phối Skewed Student-t, phân phối lỗi tổng quát GED, và phân phối lệch Skewed GED. Những phân phối này được lựa chọn để bắt kịp đặc tính đuôi dày và bất đối xứng thường thấy trong hàm phân phối xác suất của các chuỗi lợi suất tài chính.
Mô hình biên cho chuỗi lợi suất ARMA(p,q) có dạng như sau: \[ r_t = c + \sum_{i=1}^p \phi_i r_{t-i} + \epsilon_t + \sum_{i=1}^q \theta_i \epsilon_{t-i} \]
Trong đó:
\(r_t\) đại diện cho lợi suất chứng khoán tại thời điểm t
\(\phi_i\) là hệ số tự hồi quy
\(\theta_i\) là hệ số của phần trung bình di động
\(\epsilon_t\) là sai số ngẫu nhiên
Mô hình biên cho chuỗi lợi suất GJR-GARCH(r,m) có dạng như sau: \[ \sigma_t^2 = \omega + \sum_{i=1}^r \beta_i \sigma_{t-i}^2 + \sum_{i=1}^m \alpha_i \epsilon_{t-i}^2 + \sum_{i=1}^m \gamma_i s_{t-i} \epsilon_{t-i}^2 \]
Trong đó:
\(\sigma_t^2\) đại diện cho phương sai có điều kiện tại thời điểm t
\(\gamma_i\) thể hiện hiệu ứng đòn bẩy
\(s_{t-i}=1\) khi \(\epsilon_{t-i}<0\) và \(s_{t-i}=0\) trong trường hợp ngược lại
Gọi \(df\) đại diện cho độ tự do của phân phối Skewed student-t và \(\Omega_{t-i}\) đại diện cho tập hợp các thông tin trước đó. Các phần dư chuẩn hóa của mỗi chuỗi lợi suất \(z_t|\Omega_{t-i}\) tuân theo các dạng phân phối như Skewed student-t, phân phối GED hoặc phân phối sGED:
\[ z_t|\Omega_{t-i} =\sqrt{\frac{\text{df}}{\sigma_t^2 (\text{df} - 2)}} \epsilon_t \]
Với \(z_t|\Omega_{t-i}\) ~ skewed-t hoặc \(z_t|\Omega_{t-i}\) ~ GED hoặc \(z_t|\Omega_{t-i}\) ~ sGED
Sau khi chọn mô hình ARMA(p,q)-GJR-GARCH(r,m) với phân phối biên phù hợp với chuỗi phần dư của lợi suất, ta sẽ tiến hành trích xuất phần dư chuẩn hóa \(z_t|\Omega_{t-i}\). Sau đó, sử dụng hàm phân phối biên thực nghiệm để chuyển đổi chuỗi phần dư chuẩn hóa này thành giá trị tích phân xác suất \(u_t = F(z_t|\Omega_{t-1})\), với \(u_t\) tuân theo phân phối chuẩn, \(F(z_t|\Omega_{t-1}) = Pr(Z_t \leq z_t|\Omega_{t-1})\). Hàm phân phối thực nghiệm \(F\), như được đề xuất bởi Genest và cộng sự (1995), sẽ được dùng như một công cụ biến đổi tích phân xác suất. Ước lượng phi tham số của hàm \(F\) sẽ được xác định như sau:
\[ U_t \equiv F(Z_t|\Omega_{t-1}) = \frac{1}{T + 1} \sum_{t=1}^T 1 \{z_t \leq Z_t|\Omega_{t-1}\} \]
Trong đó:
\(1\) là hàm số chỉ số (indicator function)
\(T\) đại diện cho cỡ mẫu
Các biến \(u_t\) được giả định là độc lập và phân phối đồng nhất trên \([0,1](iid)\). Để kiểm định giả định này, kiểm định Cramer-von Mises (Cv-M) và kiểm định Kolmogorov-Smornov (K-S) được vận dụng. Các giá trị của hai kiểm định trên được tính bởi công thức:
\[ KS = \max_{t} |U_t - \frac{t}{T}| \]
\[ CvM = \sum_{t=1}^T(U_t - \frac{t}{T})^2 \]
Nếu giả định các biến \(u_t\) là độc lập và phân phối đồng nhất trên \([0,1]\) được thỏa, các biến \(u_t\) được sử dụng như là biến đầu vào của mô hình copula nhằm xem xét mối quan hệ phụ thuộc giữa các biến \(u_t\).
Hàm copula lần đầu tiên được giới thiệu bởi Sklar vào năm 1959, người đã thiết lập các nguyên lý cơ bản của lý thuyết này. Từ “copula” có nguồn gốc từ từ Latinh “copulare,” có nghĩa là “kết nối”. Nghiên cứu đầu tiên liên quan đến copula và sự phụ thuộc giữa các biến ngẫu nhiên là công trình của Schweizer và Wol (1981), trong đó các tác giả trình bày các tính chất cơ bản của copula dưới các phép biến đổi đơn điệu của biến ngẫu nhiên.
Copula là một hàm phân phối tích lũy đa biến được định nghĩa trên một không gian n chiều, sao cho mọi phân phối biên đều xác định trong khoảng \([0,1]\). Copula được sử dụng để mô hình hóa sự phụ thuộc giữa các biến ngẫu nhiên vì nó mô tả mối quan hệ bên trong của chúng. Nó cũng cho phép xây dựng hàm phân phối đa biến với các phân phối biên khác nhau một cách độc lập, trong khi cấu trúc phụ thuộc giữa chúng được nắm bắt bởi copula.
Sự phát triển đáng kể trong lý thuyết copula đã xảy ra khi khả năng ứng dụng của nó gia tăng cùng với sự tiến bộ trong công nghệ tính toán nhờ vào các phần mềm hỗ trợ. Nhờ vào các đặc tính này, copula đã trở thành công cụ phổ biến trong việc xác định sự phụ thuộc giữa các tài sản tài chính và giữa tài sản tài chính với tài sản thực.
Cherubini và các cộng sự (2004) đã ứng dụng lý thuyết copula vào lĩnh vực tài chính vào đầu những năm 2000, chẳng hạn như nghiên cứu mức độ phụ thuộc giữa các thị trường tài chính trong các sự kiện cực biên và hiệu quả đầu tư của danh mục tài sản tài chính. Các thuộc tính cơ bản của copula được trình bày chi tiết trong nghiên cứu của Joe (1997) và Nelson (1999).
Trong nghiên cứu này, để đơn giản hóa, em sử dụng copula hai chiều để phân tích sự phụ thuộc giữa hai chuỗi lợi suất VN-INDEX và TL-INDEX. Bẳng cách ước lượng các loại Copula phổ biến là Gaussian, t-Copula, Clayton, Gumbel.
Gọi \(Z_1\) và \(Z_2\) là hai biến ngẫu nhiên đại diện cho phần dư chuẩn hóa của mỗi chuỗi lợi suất chứng khoán, hàm phân phối biên có điều kiện của chúng được xác định như sau:
\[ F_1(z_1|\Omega_{t-1}) = Pr(Z_1 \leq z_1|\Omega_{t-1}) = u \]
\[ F_2(z_2|\Omega_{t-1}) = Pr(Z_2 \leq z_2|\Omega_{t-1}) = v \]
Trong đó \(\Omega_{t-1}\) là tập hợp thông tin tại thời điểm \(t-1\), và hàm phân phối đồng thời có điều kiện là:
\[ H(z_1, z_2|\Omega_{t-1}) = Pr(Z_1 \leq z_1; Z_2 \leq z_2|\Omega_{t-1}) \]
Một copula có điều kiện duy nhất \(C\) liên kết phân phối biên với phân phối đồng thời có điều kiện được xác định bởi:
\[ H(z_1, z_2|\Omega_{t-1}) = C(u,v|\Omega_{t-1}) = C[F_1(z_1|\Omega_{t-1}), F_2(z_2|\Omega_{t-1})] \]
Khi \(C\) là copula hai biến có điều kiện và \(F_1(.)\), \(F_2(.)\) là các hàm phân phối biên có điều kiện, thì \(H\) là hàm phân phối đồng thời có điều kiện với các phân phối biên đã cho.
Theo định lý Sklar, nếu kết hợp hai hoặc nhiều phân phối biên khác nhau với một copula, ta có thể xác định một phân phối xác suất đồng thời hợp lệ. Điều này cho phép linh hoạt trong việc mô hình hóa danh mục đầu tư bằng cách sử dụng các hàm phân phối biên khác nhau cho từng tài sản và một copula để liên kết chúng.
Hàm copula có thể kết hợp các phân phối biên khác nhau (chuẩn, lệch, liên tục, rời rạc) để tạo ra phân phối đồng thời hợp lệ. Điều này đặc biệt hữu ích trong mô hình hóa sự phụ thuộc đuôi, đặc biệt là khi thị trường chứng khoán có các biến động cực biên.
Hàm copula của các giá trị chuyển đổi tích phân xác suất \(u\) và \(v\) được viết như sau:
\[ C(u,v) = P(U \leq u, V \leq v) = F[F_1^{-1}(u), F_2^{-1}(v)] \]
Trong đó \(F_1^{-1}\) và \(F_2^{-1}\) là hàm lượng tử của phân phối biên tương ứng. Copula liên kết các hàm lượng tử của các hàm phân phối biên, cho phép mô hình hóa cấu trúc phụ thuộc không bị ảnh hưởng bởi sự biến đổi đơn điệu của các biến.
Hàm mật độ xác suất hai chiều của \(H\) được biểu diễn bằng tích giữa hàm mật độ copula và các hàm mật độ biên có điều kiện, nắm bắt toàn bộ thông tin về cấu trúc phụ thuộc giữa các hàm mật độ xác suất biên.
Sự phụ thuộc đuôi đo lường mức độ phụ thuộc giữa hai biến ngẫu nhiên ở các phần đuôi góc phần tư của phân phối hai biến, đặc biệt là khi các biến đều vượt qua các giá trị cao hoặc thấp cho trước. Điều này được thể hiện qua xác suất có điều kiện khi một biến vượt qua một phân vị cụ thể của phân phối biên khi biến kia cũng vượt qua phân vị tương ứng. Đối với các phân phối biên liên tục, sự phụ thuộc đuôi là thuộc tính của copula và không thay đổi dưới phép biến đổi tăng nghiêm ngặt.
Định nghĩa sự phụ thuộc đuôi: Gọi \(Z_1\) và \(Z_2\) là hai biến ngẫu nhiên liên tục với các hàm phân phối biên \(F_1\) và \(F_2\), và các biến ngẫu nhiên chuẩn hóa \(U = F_1(Z_1)\) và \(V = F_2(Z_2)\). Hệ số phụ thuộc đuôi \(\lambda_U\) được xác định là giới hạn (nếu tồn tại) của xác suất có điều kiện khi \(\alpha\) tiến gần đến 1, tức là:
\[ \lambda_U = \lim_{\alpha \to 1^-} P \left( Z_2 > F_2^{-1}(\alpha) \mid Z_1 > F_1^{-1}(\alpha) \right) \]
Sự phụ thuộc đuôi đo lường xu hướng của hai biến cùng xảy ra các sự kiện cực biên, và là đặc điểm chính để phân biệt các họ copula khác nhau.
Sự phụ thuộc đuôi trên: \[ \lambda_U = \lim_{u \to 1^-} P \left( Z_2 > F_2^{-1}(u) \mid Z_1 > F_1^{-1}(u) \right) = \lim_{u \to 1^-} \frac{1 - 2u + C(u,u)}{1 - u} \]
Sự phụ thuộc đuôi dưới: \[ \lambda_L = \lim_{u \to 0^+} P \left( Z_2 \leq F_2^{-1}(u) \mid Z_1 \leq F_1^{-1}(u) \right) = \lim_{u \to 0^+} \frac{C(u,u)}{u} \]
Nếu \(\lambda_U\) thuộc khoảng \((0,1]\), copula \(C\) có sự phụ thuộc đuôi trên. Nếu \(\lambda_U = 0\), không có sự phụ thuộc đuôi trên. Tương tự cho \(\lambda_L\) nếu \(\lambda_L = 0\), không có sự phụ thuộc đuôi dưới.
Sự phụ thuộc đuôi là một đặc tính quan trọng trong việc phân biệt các họ copula khác nhau. Ví dụ, copula Gumbel chỉ có hệ số phụ thuộc đuôi trên, trong khi copula Gauss không có hệ số phụ thuộc đuôi nào. Các họ copula với các đặc tính phụ thuộc đuôi khác nhau sẽ được thảo luận chi tiết trong phần tiếp theo.
Hàm copula Gauss, còn được gọi là copula chuẩn (normal), được chuyển hóa từ phân phối chuẩn đa biến. Copula Gauss được sử dụng để đo lường mức độ phụ thuộc toàn phân phối giữa các chỉ số lợi suất chứng khoán trong điều kiện thị trường bình thường. Vectơ ngẫu nhiên \((u,v)\) của hai biến ngẫu nhiên u và v cũng có phân phối chuẩn nếu \(u\) và \(v\) đều có phân phối chuẩn. Theo Cherubini & cộng sự (2004), hàm copula Gauss có dạng:
\[ C_{Gauss}(u,v;\rho) = \Phi_{\rho} (\Phi^{-1}(u), \Phi^{-1}(v)), \rho \in (-1,1) \]
\[ = \int_{-\infty}^{\Phi^{-1}(u)} \int_{-\infty}^{\Phi^{-1}(v)} \frac{1}{2 \pi \sqrt{1 - \rho^2}} exp \{- \frac{x^2 - 2 \rho x y + y^2}{2(1 - \rho^2)} \}dxdy \]
Trong đó:
\(\Phi_{\rho}\) là hàm phân phối chuẩn hóa
\(\rho \in (-1,1)\) là hệ số tương quan tuyến tính giữa \(u\) và \(v\)
\(x = \Phi^{-1}(u)\) và \(y = \Phi^{-1}(v)\) với \(\Phi^{-1}\) là hàm ngược hàm phân phối biên chuẩn hóa \(\Phi\)
Copula Gauss xem xét mối tương quan giữa hai chuỗi lợi suất có phân phối chuẩn và không có phụ thuộc đuôi \((\lambda_U = \lambda_L = 0)\) khi \(\rho < 1\)
Hàm mật độ xác suất (PDF) của copula Gauss có dạng:
\[ c(u,v; \rho) = {\frac{1}{\sqrt{1 - \rho^2}}e} ^{- \frac{\rho^2 (x^2 + y^2) - 2 \rho xy}{2(1 - \rho^2)}} \]
Phân phối Student-t đa biến: Gọi \(X\) là biến ngẫu nhiên được định nghĩa bởi công thức:
\[ X = \mu + \frac{\sqrt{d}}{\sqrt{\chi_d^2}} Z \]
Trong đó:
\(\mu\) là vectơ trung bình
\(Z\) là vectơ các biến ngẫu nhiên độc lập với phân phối chuẩn
\(\chi_d^2\) là phân phối Chi bình phương với độ tự do \(d\)
Khi đó, \(X\) có phân phối Student-t đa biến với trung bình \(\mu\) và ma trận hiệp phương sai \(\frac{d}{d-2} \sum\), với \(d > 2\)
Copula Student-t: Đây là một copula thuộc họ Elip, được chuyển hóa từ phân phối Student-t đa biến. Công thức của Copula Student-t là:
\[ C_{ST}(u, v; \rho, d) = T_{d, \rho}(t_d^{-1}(u), t_d^{-1}(v)); \rho \in (-1,1), d \in (2,\infty) \]
\[ = \int_{-\infty}^{t_d^{-1}(u)} \int_{-\infty}^{t_d^{-1}(v)} \frac{1}{2\pi \sqrt{1-\rho^2}} (1 + \frac{x^2 + y^2 - 2\rho xy}{d(1- \rho^2)})^{-{\frac{v+2}{2}}} \]
Trong đó
\(x = t_d^{-1}(u)\), \(y = t_d^{-1}(v)\), \(t_d^{-1}(u)\), \(t_d^{-1}(v)\) là hàm ngược của hàm phân phối tích lũy biên Student-t của biến \(u, v\) với độ tự do \(d, t = F_t(.)\)
\(T_{d, \rho}\) là hàm phân phối tích lũy đồng thời của phân phối Student-t, với \(\rho\) là hệ số tương quan
Sự phụ thuộc đuôi: Copula Student-t thể hiện sự phụ thuộc đuôi dương khi \(\rho \neq 1\). Khi \(\rho > -1\), copula Student-t cho thấy sự phụ thuộc đuôi đối xứng khác 0, với hệ số phụ thuộc đuôi được tính theo:
\[ \lambda_U = \lambda_L = 2t_{d+1} (- \frac{\sqrt{d+1} \sqrt{1- \rho}}{\sqrt{1 + \rho}}) \]
Hàm mật độ xác suất (PDF): Hàm mật độ xác suất của Copula Student-t được tính bằng:
\[ c(u,v) = \frac{2}{2 \pi dt_d(x) dt_d(y) \sqrt{1- \rho^2}} (1 + \frac{x^2 + y^2 - 2\rho xy}{d(1- \rho^2)})^{-{\frac{d+2}{2}}} \]
Trong đó,
\[ dt_d(x) = \frac{\Gamma\left(\frac{d+1}{2}\right)}{\Gamma\left(\frac{d}{2}\right) \sqrt{\pi d}} (1 + \frac{\pi^2}{d}) ^{-{\frac{d+1}{2}}} \]
là hàm phân phối biên Student-t với độ tự do \(d\).
Hàm copula Clayton được Clayton (1978) giới thiệu, với hàm sinh \(\varphi(t) = (t^{- \alpha} -1)/ \alpha\) và được định nghĩa như sau:
\[ C_c(u, v; \alpha) = (u^{- \alpha} + v^{- \alpha} - 1)^ \frac {-1}{\alpha}, \alpha \in (0,\infty) \]
Khi \(\alpha \to 0\) các phân phối biên \(u,v\) trở nên độc lập hay sự phụ thuộc giảm dần. Khi \(\alpha \to \infty\), copula đạt được giới hạn trên Fréchet, đạt được sự phụ thuộc dương gần như hoàn toàn.
Copula Clayton có phụ thuộc đuôi dưới lớn hơn đuôi trên, với hệ số phụ thuộc đuôi dưới \(\lambda_L = 2^{-1/\alpha}\), hệ số đuôi trên \(\lambda_U = 0\). Hệ số tương quan hạng Kendall’s tau \(\tau\) đo mức độ tương thích giữa hai biến ngẫu nhiên, với \(\tau = \alpha / (\alpha + 2)\)
Hàm mật độ xác suất của copula Clayton có công thức:
\[ c(u,v) = (1 + \alpha)(uv)^{-1 - \alpha}(u^{- \alpha} + v^{- \alpha} - 1)^{-{\frac{1}{\alpha}} -2} \]
Trái ngược với hàm Clayton, hàm copula Gumbel cũng dùng để mô hình hóa cấu trúc phụ thuộc bất đối xứng nhưng tập trung đuôi trên.
Copula Gumbel với hàm sinh \(\varphi(t) = (- \log t)^ \gamma\) được Gumbel (1960) đề xuất có dạng:
\[ C_G(u, v; \alpha) = \exp \left\{-[(-\log u)^ \alpha + (- \log v)^ \alpha \right]^\frac {1}{\alpha} \}, \alpha \in [1,\infty) \]
Khi \(\alpha = 1\), copula Gumbel thể hiện tính độc lập giữa phân phối biên \(u\) và \(v\).
Khi \(\alpha \to \infty\), \(u\) và \(v\) phụ thuộc dương hoàn toàn.
Mối quan hệ giữa tham số Gumbel copula và Kendall tau \(\tau\) được xác định bởi \(\tau = 1 - 1/\alpha\). Hệ số phụ thuộc đuôi trên và đuôi dưới được xác định lần lượt bởi \(\lambda_U = 2 - 2^ \frac{-1}{\alpha}\), \(\lambda_L = 0\).
Hàm mật độ xác suất của copula Gumbel có công thức: \[ c(u,v) = \frac{C(u,v)}{uv} \times \frac{(\log u \log v)^{\alpha -1}}{((- \log u)^\alpha + (- \log u)^\alpha)^{2 - \frac{1}{\alpha}}} \times [((- \log u)^\alpha + (- \log u)^\alpha)^ \frac {1}{\alpha} + \alpha -1] \]
Lê Văn Thứ (2022) Phản ứng của thị trường chứng khoán Việt Nam đối với biến động của thị trường chứng khoán quốc tế. Mô tả việc sử dụng mô hình copula có điều kiện (ARMA-GJR-GARCH Copula) để phân tích cấu trúc phụ thuộc giữa TTCK Việt Nam và các TTCK quốc tế, bao gồm Mỹ, Anh, Pháp, Đức, Trung Quốc, Hồng Kông, Nhật Bản, Hàn Quốc, Đài Loan, Singapore, Thái Lan, Malaysia, và Indonesia. Nghiên cứu sử dụng dữ liệu lợi suất hàng ngày từ ngày 04/01/2006 đến ngày 30/12/2021. Kết quả cho thấy TTCK Việt Nam ít nhạy cảm với biến động từ các TTCK quốc tế, ngay cả trong điều kiện thị trường biến động bình thường và khi xảy ra cú sốc âm. Không có hiệu ứng lây lan biến động từ các TTCK quốc tế sang TTCK Việt Nam trong giai đoạn khủng hoảng tài chính năm 2008. Sau khủng hoảng, mức độ phụ thuộc giữa TTCK Việt Nam và TTCK quốc tế tăng đáng kể.
Lê Văn Thứ, Trần Ái Kết (24/07/2021) Mối quan hệ phụ thuộc giữa TTCK Việt Nam và TTCK Mỹ: Tiếp cận bằng mô hình COPULA-GJR-GARCH. Vận dụng mô hình copula có điều kiện (Copula-GJR-GARCH) để mô hình hóa cấu trúc phụ thuộc giữa thị trường chứng khoán Việt Nam và thị trường chứng khoán Mỹ. Kết quả chỉ ra rằng thị trường chứng khoán Mỹ và thị trường chứng khoán Việt Nam có mối quan hệ phụ thuộc nhưng ở mức độ yếu. Hơn nữa, sự phụ thuộc đuôi dưới giữa hai thị trường cũng được tìm thấy nhưng không đáng kể.
Dữ liệu của 4 chỉ số chứng khoán được thu thập từ tháng 1 năm 2018 đến tháng 7 năm 2024 theo ngày với cỡ mẫu là 1537 khi chưa tính toán lợi suất. Các chuỗi lợi suất được đo lường bởi công thức \(R_t = ln(P_t/P_{t-1})\), trong đó \(P_t, P_{t-1}\) đại diện lần lượt cho giá đóng cửa của chỉ số chứng khoán tại thời điểm \(t\) và \(t-1\). Sau khi tính toán chuỗi lợi suất thì cỡ mẫu còn lại là 1536 quan sát.
Đầu tiên, em sử dụng các kiểm định, sau đó xác định bậc p, q của mô hình ARMA (được mô tả ở phụ lục 2). Sau đó lựa chọn mô hình biên ARMA(p,q)-GJR-GARCH(1,1), xác định thông qua các mô hình biên tương ứng với độ trễ p, q và phần dư theo các phân phối Normal, Student-t, Skewed Student-t, Generalized Error Distribution (GED), và Skewed Generalized Error Distribution (sGED). Cuối cùng, các tiêu chí AIC, BIC được sử dụng để xác định mô hình biên phù hợp nhất. Mô hình ARMA(p,q)-GJR-GARCH(1,1) với phân phối phù hợp sẽ mô tả tốt nhất các đặc tính quan trọng của chuỗi lợi suất như đuôi dày, đối xứng, bất đối xứng, và hiệu ứng đòn bẩy.
Dựa vào mô hình biên tối ưu đã được xác định cho mỗi chuỗi lợi suất, em tiến hành trích xuất thu được phần dư chuẩn hóa \((z_{1t}, z_{2t})\). Sau đó sử dụng hàm phân phối biên thực nghiệm để chuyển đổi \(z_{1t}, z_{2t}\) sang giá trị xác suất hay giá trị tích phân \(u_t = F_1(z_{1t}|\Omega_{t-1})\) và \(v_t = F_2(z_{2t}|\Omega_{t-1})\). Chính vì vậy, em xây dựng được mô hình phi tham số, đó là mô hình copula \(C(u_t, v_t)\).
Trước khi áp dụng mô hình copula, biến \(u_t, v_t\) được giả định là độc lập và có phân phối đồng nhất trên đoạn \([0,1]\) \[ 0 \leq \frac{\partial}{\partial u_t}C(u_t,v_t) \leq 1, 0 \leq \frac{\partial}{\partial v_t}C(u_t,v_t) \leq 1 \]
Trong đó
\(C\) đại diện cho hàm copula
Với \(u_t,v_t \in [0,1]^2\), các vi phân từng phần \(\partial C(u_t,v_t)/\partial u_t, \partial C(u_t,v_t)/\partial v_t\) tồn tại cho từng biến \(u_t, v_t\) cũng lần lượt là hàm phân phối biên của biến \(u_t,v_t\)
Có ba loại kiểm định được dùng để xem xét tính phù hợp của hàm phân phối biên của \(z_t\) gồm kiểm định Anderson-Darling (A-D); kiểm định Cramer-von Mises (Cv-M) và kiểm định Kolmogorov-Smornov (K-S).
Phương pháp Ước lượng Hợp lý Tối đa (Maximum Likelihood Estimation - MLE) là một kỹ thuật quan trọng trong việc ước lượng tham số của các mô hình copula. MLE tìm kiếm các giá trị tham số làm tối đa hóa hàm hợp lý, thể hiện xác suất của dữ liệu quan sát được, dựa trên mô hình copula đã chọn. Quá trình này bao gồm việc xác định hàm hợp lý từ phân phối kết hợp của các biến và giải các phương trình để tìm giá trị tham số tối ưu.
\[ \hat {\theta_1} = \arg\max l^1 (\theta_1) = \arg \max \sum_{t=1}^T\log f_1 (z_{1t}|\Omega_{t-1},\theta_1) \]
\[ \hat {\theta_2} = \arg\max l^2 (\theta_2) = \arg \max \sum_{t=1}^T\log f_2 (z_{2t}|\Omega_{t-1},\theta_2) \]
Các kiểm định sự phù hợp được sử dụng để xếp hạng và xác định mô hình copula tốt nhất. Chi tiết được đề cập trong nghiên cứu của Chen và Fan (2005), Fermanian (2005), Genest và cộng sự (2006), Hans (2007), Berg (2009). Nghiên cứu này sử dụng tiêu chí để xếp hạng và lựa chọn mô hình như Tiêu chuẩn thông tin Akaike (AIC) và Tiêu chuẩn thông tin Bayesian (BIC).
Tiêu chí thông tin Akaike (AIC): là một công cụ quan trọng trong phân tích mô hình thống kê, được sử dụng để so sánh và lựa chọn mô hình phù hợp nhất từ một tập hợp các mô hình tiềm năng. AIC được định nghĩa là \(AIC = -2log(L) + 2k\), trong đó \(L\) là hàm khả năng (likelihood) của mô hình và \(k\) là số lượng tham số trong mô hình. Tiêu chí này cân nhắc cả độ phù hợp của mô hình với dữ liệu và độ phức tạp của mô hình. Mô hình có AIC thấp nhất được coi là lựa chọn tốt nhất, vì nó có thể mô tả dữ liệu một cách hiệu quả với số lượng tham số ít hơn, từ đó giảm nguy cơ overfitting.
Tiêu chí thông tin Bayesian (BIC), còn được gọi là tiêu chí Schwarz, là một phương pháp phổ biến để lựa chọn mô hình trong phân tích thống kê. BIC được tính theo công thức \(BIC = -2log(L) + k \log(n)\), trong đó \(L\) là hàm khả năng (likelihood) của mô hình \(k\) là số lượng tham số và \(n\) là kích thước mẫu. BIC thường được ưa chuộng khi có kích thước mẫu lớn, vì nó áp dụng hình phạt nặng hơn đối với số lượng tham số so với AIC, giúp giảm thiểu nguy cơ chọn lựa các mô hình quá phức tạp. Mô hình có BIC thấp nhất được xem là lựa chọn tốt nhất trong các mô hình được xem xét.
Để hiểu rõ hơn về mối quan hệ giữa các chỉ số chứng khoán trong khu vực Đông Nam Á và sự phụ thuộc của thị trường chứng khoán Việt Nam đối với các chỉ số đó, em tiến hành xây dựng một ma trận tương quan giữa bốn chỉ số chính: VN-Index, TL-Index, M-Index (KLCI-Index chỉ số chứng khoán Malaysia), và P-Index (PSEI-Index chỉ số chứng khoán Philippines). Việc phân tích ma trận tương quan cho phép chúng ta xác định mức độ liên kết và sự tương quan giữa các chỉ số này. Kết quả từ ma trận tương quan sẽ cung cấp cái nhìn sâu sắc về mức độ phụ thuộc của VN-Index vào các chỉ số khu vực, từ đó giúp chúng ta xác định chỉ số chứng khoán nào có mối tương quan mạnh nhất với VN-Index.
## Chỉ số có tương quan mạnh nhất với VNINDEX là: TLINDEX với hệ số tương quan là 0.2334385
Vì chỉ số TL-Index có tương quan mạnh nhất với VN-Index, vì thế em sẽ lấy chỉ số TL-Index để phân tích sự phụ thuộc.
Trước khi tiến hành phân tích chi tiết mối quan hệ giữa VN-Index và TL-Index, việc kiểm tra các đặc tính cơ bản của chuỗi lợi suất là cần thiết. Thống kê mô tả cung cấp cái nhìn tổng quan về hành vi của các chuỗi thời gian này, bao gồm các thông số như giá trị trung bình, độ lệch chuẩn, giá trị lớn nhất, giá trị nhỏ nhất. Điều này giúp chúng ta hiểu rõ hơn về đặc điểm biến động và mức độ rủi ro của từng chỉ số, từ đó làm nền tảng cho các phân tích sâu hơn tiếp theo.
##
## Thống kê mô tả các biến
## ========================================================
## Statistic N Mean St. Dev. Min Max
## --------------------------------------------------------
## VNINDEX_LogReturns 1,536 0.0001 0.0129 -0.0691 0.0620
## TLINDEX_LogReturns 1,536 -0.0002 0.0101 -0.1143 0.0765
## --------------------------------------------------------
Kết quả bảng thống kê mô tả cho chuỗi lợi suất của VN-Index và TL-Index cho thấy một số đặc điểm quan trọng về phân phối của hai chuỗi dữ liệu này:
Biến động: TL-Index có độ lệch chuẩn thấp hơn (0.0101) so với VN-Index (0.0129), điều này cho thấy VN-Index biến động mạnh hơn TL-Index.
Lợi suất trung bình: Cả hai chỉ số đều có lợi suất trung bình hàng ngày gần bằng 0, với VN-Index có giá trị dương nhỏ (0.0001) và TL-Index có giá trị âm nhỏ (-0.0002).
Giá trị cực đại và cực tiểu: TL-Index có giá trị lợi suất cực tiểu (-0.1143) lớn hơn về độ lớn so với VN-Index (-0.0691), cho thấy TL-Index trải qua những biến động mạnh hơn trong một số ngày nhất định. Giá trị cực đại của TL-Index (0.0765) cũng lớn hơn so với VN-Index (0.0620), chỉ ra rằng TL-Index có khả năng tăng mạnh hơn trong những ngày tốt nhất.
Từ hai biểu đồ, ta có thể nhận xét rõ hơn được sự biến động của hai chuỗi lợi suất như sau:
VN-Index: Biểu đồ lợi suất của VN-Index cho thấy có nhiều biến động mạnh. Đặc biệt, có những giai đoạn lợi suất tăng hoặc giảm đáng kể, cho thấy thị trường chứng khoán Việt Nam có tính biến động cao. Chuỗi lợi suất không có xu hướng rõ ràng theo thời gian, nhưng có sự xuất hiện của nhiều biến động lớn, đặc biệt là ở những giai đoạn gần cuối. Lợi suất dường như tập trung nhiều hơn quanh mức 0, nhưng cũng có nhiều khoảng thời gian lợi suất bị phân tán mạnh, đặc biệt là các đợt giảm mạnh.
TL-Index: Biểu đồ lợi suất của TL-Index cũng cho thấy nhiều biến động, nhưng mức độ biến động có vẻ ít hơn so với VN-Index. Tuy nhiên, có một sự giảm mạnh đáng kể, rõ ràng khoảng thời gian xung quanh điểm thứ 500. Tương tự như VN-Index, chuỗi lợi suất của TL-Index không có xu hướng rõ ràng, nhưng có những biến động lớn bất thường. Lợi suất của TL-Index tập trung nhiều hơn quanh mức 0. Sự giảm mạnh trong chuỗi lợi suất là một điểm nổi bật và đáng chú ý, cho thấy một sự kiện bất thường có thể đã xảy ra.
Trong nghiên cứu copula, việc chọn lựa mô hình phân phối biên phù hợp đóng vai trò quan trọng trong việc cải thiện độ chính xác của các dự đoán và phân tích. Để xác định mô hình phân phối biên tối ưu cho dữ liệu lợi suất của VN-Index và TL-Index, cả hai chuỗi đều có hiệu ứng ARCH (thông qua kiểm định ở phụ lục 2) em đã sử dụng các mô hình GARCH với cấu trúc ARMA và áp dụng nhiều loại phân phối khác nhau để so sánh hiệu quả. Cụ thể, em đã xây dựng và đánh giá các mô hình ARMA(1,0)-GJR-GARCH(1,1) cho VN-Index và ARMA(3,1)-GJR-GARCH(1,1) cho TL-Index (kết quả lựa chọn mô hình ARMA cho hai chuỗi lợi suất ở phụ lục 2), với các phân phối bao gồm phân phối chuẩn (Normal), phân phối Student-t (Std), phân phối Skewed Student-t (Sstd), phân phối phân tán tổng quát (Ged), và phân phối phân tán tổng quát lệch (Sged). Kết quả của phân tích dựa trên tiêu chí Akaike (AIC) và Bayesian (BIC) sẽ giúp em xác định mô hình phân phối biên phù hợp nhất cho từng chỉ số, từ đó cung cấp cái nhìn sâu sắc hơn về sự biến động và các yếu tố ảnh hưởng đến lợi suất của các chỉ số chứng khoán.
| Chuỗi lợi suất | Dạng mô hình phân phối biên |
|---|---|
| VN-Index | ARMA(1,0)-GJR-GARCH(1,1)-Sstd |
| TL-Index | ARMA(3,1)-GJR-GARCH(1,1)-Sstd |
Kết quả phân tích mô hình phân phối biên cho dữ liệu lợi suất của VN-Index và TL-Index cho thấy rằng mô hình ARMA(1,0)-GJR-GARCH(1,1) với phân phối Skewed Student-t là mô hình phân phối biên tối ưu cho VN-Index, trong khi TL-Index cũng đạt kết quả tối ưu với mô hình ARMA(3,1)-GJR-GARCH(1,1) sử dụng phân phối Skewed Student-t. Điều này chứng tỏ rằng, hàm phân phối biên của tất cả các chuỗi lợi suất không tuân theo phân phối chuẩn (như phụ lục 2 đã kiểm định).
Sau khi xác định mô hình phân phối biên tối ưu, bước tiếp theo là trình bày kết quả ước lượng tham số cho các mô hình này. Bảng dưới đây cung cấp các thông số ước lượng chính của mô hình phân phối biên, bao gồm các tham số của mô hình ARMA-GJR-GARCH và các tham số phân phối biên tương ứng. Những kết quả này cho phép chúng ta đánh giá chi tiết hơn về cấu trúc mô hình và mức độ phù hợp của chúng đối với dữ liệu lợi suất của VN-Index và TL-Index.
| Estimate | Std. Error | Pr(>|z|) | |
|---|---|---|---|
| mu | 0.0003360 | 0.0002694 | 0.2123030 |
| ar1 | 0.0364359 | 0.0259957 | 0.1610312 |
| omega | 0.0000117 | 0.0000004 | 0.0000000 |
| alpha1 | 0.0329587 | 0.0107511 | 0.0021721 |
| beta1 | 0.7977670 | 0.0191294 | 0.0000000 |
| gamma1 | 0.2080526 | 0.0408947 | 0.0000004 |
| skew | 0.8283839 | 0.0298853 | 0.0000000 |
| shape | 3.8384173 | 0.3297259 | 0.0000000 |
Kết quả ước lượng tham số của mô hình ARMA(1,0)-GJR-GARCH(1,1) với phân phối Sst của VN-Index cho thấy một số điểm quan trọng. Tham số trung bình (mu) có giá trị 0.0003360 và không có ý nghĩa thống kê cao với p-value là 0.2123030, cho thấy nó không có ảnh hưởng đáng kể. Tham số (ar1) có giá trị 0.0364359 và cũng không có ý nghĩa thống kê cao với p-value là 0.1610312.
Trong mô hình GARCH, các tham số omega, alpha1, beta1 và gamma1 đều cho thấy sự ảnh hưởng rõ rệt. Cụ thể, omega (0.0000117) và alpha1 (0.0329587) đều có giá trị p nhỏ hơn 0.05, cho thấy chúng có ý nghĩa thống kê và đóng vai trò quan trọng trong việc mô hình hóa sự biến động. Tham số beta1 (0.7977670) cũng có ý nghĩa thống kê mạnh với p-value gần bằng 0, chỉ ra rằng yếu tố này rất quan trọng trong việc điều chỉnh mức độ biến động.
Tham số gamma1 (0.2080526) có p-value nhỏ hơn 0.05, cho thấy sự ảnh hưởng của cú sốc không đồng đều đối với mức độ biến động là đáng kể. Cuối cùng, tham số skew (0.8283839) và shape (3.8384173) của phân phối Sst đều có ý nghĩa thống kê với p-value nhỏ hơn 0.05, cho thấy phân phối lệch với hình dạng cụ thể phù hợp với dữ liệu lợi suất của VN-Index.
| Estimate | Std. Error | Pr(>|z|) | |
|---|---|---|---|
| mu | -0.0004054 | 0.0001956 | 0.0382446 |
| ar1 | -0.6820297 | 1.8631080 | 0.7143122 |
| ar2 | 0.0076103 | 0.0811735 | 0.9253051 |
| ar3 | -0.0070097 | 0.0518693 | 0.8925004 |
| ma1 | 0.7190272 | 1.8606958 | 0.6991788 |
| omega | 0.0000034 | 0.0000012 | 0.0062228 |
| alpha1 | 0.0257477 | 0.0063654 | 0.0000523 |
| beta1 | 0.8689036 | 0.0148733 | 0.0000000 |
| gamma1 | 0.1207849 | 0.0279740 | 0.0000158 |
| skew | 0.8895172 | 0.0317856 | 0.0000000 |
| shape | 6.1041758 | 0.9212991 | 0.0000000 |
Kết quả ước lượng tham số cho mô hình ARMA(3,1)-GJR-GARCH(1,1) với phân phối Sst của TL-Index cho thấy một số điểm quan trọng.
Tham số trung bình (mu) có giá trị -0.0004054 với p-value là 0.0382446, cho thấy tham số này có ý nghĩa thống kê và ảnh hưởng đến mô hình. Các tham số (ar1), (ar2), (ar3), và (ma1) đều không có ý nghĩa thống kê cao, với p-value lần lượt là 0.7143122, 0.9253051, 0.8925004 và 0.6991788, cho thấy chúng không đóng vai trò quan trọng trong mô hình này.
Trong mô hình GARCH, các tham số omega, alpha1, beta1 và gamma1 đều cho thấy sự ảnh hưởng rõ rệt. Cụ thể, omega (0.0000034) có p-value nhỏ hơn 0.05, cho thấy nó có ý nghĩa thống kê trong việc mô hình hóa sự biến động. Tham số alpha1 (0.0257477) và beta1 (0.8689036) đều có p-value rất nhỏ, cho thấy chúng là những yếu tố quan trọng trong việc điều chỉnh mức độ biến động. Tham số gamma1 (0.1207849) cũng có ý nghĩa thống kê mạnh với p-value nhỏ hơn 0.05, cho thấy sự ảnh hưởng của cú sốc không đồng đều đối với mức độ biến động.
Cuối cùng, các tham số skew (0.8895172) và shape (6.1041758) của phân phối Skewed Student-t đều có ý nghĩa thống kê với p-value rất nhỏ, chứng minh rằng phân phối lệch với hình dạng cụ thể này phù hợp với dữ liệu lợi suất của TL-Index.
Để đánh giá tính phù hợp của mô hình phân phối biên, em đã thực hiện các kiểm định thống kê nhằm so sánh phân phối lý thuyết với phân phối thực tế của các phần dư từ mô hình. Cụ thể, em đã sử dụng ba kiểm định phổ biến: Anderson-Darling (A-D), Cramer-von Mises (Cv-M), và Kolmogorov-Smirnov (K-S). Các kiểm định này giúp xác định mức độ phù hợp của phân phối Skewed Student-t đối với các phần dư từ mô hình ARMA(1,0)-GJR-GARCH(1,1) cho VN-Index và ARMA(3,1)-GJR-GARCH(1,1) cho TL-Index. Bảng dưới đây trình bày kết quả của các kiểm định này, cung cấp cái nhìn sâu hơn về khả năng mô hình phù hợp với dữ liệu thực tế.
| Các kiểm định | Anderson-Darling | Cramer-von Mises | Kolmogorov-Smirnov |
|---|---|---|---|
| P_value Vn-Index | 0.5151984 | 0.4403764 | 0.3456677 |
| P_value TL-Index | 0.9995608 | 0.9989936 | 0.9990393 |
Kết quả kiểm định tính phù hợp cho mô hình phân phối biên cho thấy các p-value từ các kiểm định Anderson-Darling (A-D), Cramer-von Mises (Cv-M), và Kolmogorov-Smirnov (K-S) đều cao, cho cả VN-Index và TL-Index.
Cụ thể, đối với VN-Index, p-value của các kiểm định là 0.5151984 (A-D), 0.4403764 (Cv-M), và 0.3456677 (K-S). Những giá trị p này cho thấy không có bằng chứng thống kê mạnh mẽ để bác bỏ giả thuyết rằng phân phối Skewed Student-t là phù hợp với các dư của mô hình VN-Index.
Đối với TL-Index, p-value của các kiểm định đều rất cao: 0.9995608 (A-D), 0.9989936 (Cv-M), và 0.9990393 (K-S). Điều này cho thấy phân phối Skewed Student-t phù hợp rất tốt với các phần dư của mô hình TL-Index, không có bằng chứng để bác bỏ tính phù hợp của phân phối này.
Phương pháp Maximum Likelihood Estimation (MLE) được áp dụng để ước lượng các tham số của các mô hình copula, là công cụ chính trong phân tích cấu trúc phụ thuộc giữa các biến ngẫu nhiên. Trong nghiên cứu này, em ước lượng các tham số cho bốn loại copula phổ biến: Gaussian, Student-t, Clayton, và Gumbel. Phương pháp MLE được lựa chọn vì khả năng tối ưu hóa chính xác các tham số của mô hình, đảm bảo rằng các ước lượng nhận giá trị cao nhất của hàm khả năng sinh ra dữ liệu quan sát được.
| Chỉ số | Copula | Par | Par2 | Phụ thuộc đuôi |
|---|---|---|---|---|
| VNTL-Index | Gauss | 0.2228584 | 0.000000 | 0.0000000 |
| VNTL-Index | Student-t | 0.2205819 | 9.871722 | 0.0234109 |
| VNTL-Index | Clayton | 0.3114548 | 0.000000 | 0.1080118 |
| VNTL-Index | Gumbel | 1.1287484 | 0.000000 | 0.0000000 |
Đánh giá:
Gaussian Copula và Gumbel Copula không có phụ thuộc đuôi, điều này có thể không phản ánh đầy đủ sự phụ thuộc trong các trường hợp cực đoan.
Student-t Copula có phụ thuộc đuôi dưới, điều này có thể hữu ích khi xét đến các sự kiện thị trường cực đoan, và có mức độ phụ thuộc đuôi dưới thấp (0.0234109).
Clayton Copula có phụ thuộc đuôi dưới cao nhất (0.1080118), cho thấy nó có khả năng mô hình hóa tốt hơn các sự kiện phụ thuộc cực đoan.
Kết luận: Dựa trên các thông số này, Clayton Copula có thể phù hợp nhất để mô tả sự phụ thuộc giữa VN-Index và TL-Index, do nó có mức độ phụ thuộc đuôi dưới cao nhất. Điều này cho thấy nó có khả năng mô hình hóa tốt hơn các mối liên hệ mạnh mẽ trong các sự kiện cực đoan.
| Copula | Parameter | SE | logLik | AIC | BIC |
|---|---|---|---|---|---|
| Gaussian | 0.22 | 0.02 | 39.05 | -76.09 | -70.76 |
| Student-t | 0.22 | 0.03 | 46.17 | -88.34 | -77.67 |
| Clayton | 0.31 | 0.04 | 51.96 | -101.93 | -96.59 |
| Gumbel | 1.13 | 0.02 | 25.81 | -49.61 | -44.28 |
Từ bảng trên ta có thể kết luận được, Copula Clayton là phù hợp nhất vì có AIC và BIC nhỏ nhất. Tiếp theo ta tiến hành xem xét biểu đồ phân tán và phối cảnh PDF của Copula Clayton trong hình dưới đây.
Quan sát biểu đồ, ta thấy rằng mật độ cao hơn tập trung ở phần góc dưới bên trái, điều này thể hiện rằng các giá trị nhỏ của cả hai chỉ số có xu hướng xuất hiện đồng thời, củng cố nhận định rằng sự phụ thuộc đuôi giữa hai chỉ số là yếu.
Vì sự phụ thuộc đuôi yếu, rủi ro hệ thống khi cả hai chỉ số đồng thời giảm mạnh hoặc tăng mạnh là thấp. Với phụ thuộc đuôi chỉ có 0.1080118 chứng tỏ rằng khi TL-Index tăng (giảm) thì VN-Index chỉ tăng (giảm) theo khoảng 10,8%. Điều này có thể được xem là một yếu tố tích cực khi đa dạng hóa danh mục đầu tư giữa hai thị trường này.
Nghiên cứu này đã áp dụng phương pháp Copula, cụ thể là mô hình Clayton Copula, để phân tích sự phụ thuộc giữa VN-Index và TL-Index. Kết quả cho thấy sự phụ thuộc đuôi giữa hai chỉ số là yếu, với giá trị chỉ 0.1080118. Điều này có nghĩa là khi TL-Index tăng hoặc giảm mạnh, VN-Index chỉ biến động theo khoảng 10,8%. Sự phụ thuộc đuôi yếu này cho thấy rủi ro hệ thống khi cả hai chỉ số đồng thời biến động mạnh là thấp, tạo điều kiện thuận lợi cho việc đa dạng hóa danh mục đầu tư giữa hai thị trường, từ đó giảm thiểu rủi ro và tăng cường hiệu suất đầu tư.
Kết quả nghiên cứu cung cấp một bức tranh rõ ràng về mối quan hệ giữa VN-Index và TL-Index, minh chứng cho việc sử dụng mô hình Copula trong phân tích sự phụ thuộc giữa các chỉ số chứng khoán. Sự phụ thuộc yếu giữa VN-Index và TL-Index cho thấy rằng việc đầu tư vào cả hai thị trường này có thể giảm thiểu rủi ro tổng thể của danh mục đầu tư. Khi một chỉ số biến động mạnh, chỉ số kia ít bị ảnh hưởng, điều này giúp nhà đầu tư có thêm lợi thế trong việc quản lý rủi ro và tối ưu hóa lợi nhuận.
Dựa trên kết quả này, khuyến nghị nhà đầu tư nên xem xét việc sử dụng phương pháp Copula để phân tích sự phụ thuộc giữa các chỉ số chứng khoán. Phương pháp này không chỉ giúp nhận diện rõ ràng mối quan hệ giữa các thị trường mà còn cung cấp cơ sở vững chắc cho việc đa dạng hóa danh mục đầu tư. Đặc biệt, việc đa dạng hóa danh mục đầu tư giữa VN-Index và TL-Index có thể giúp giảm thiểu rủi ro và tối ưu hóa lợi nhuận. Các nhà quản lý quỹ và nhà hoạch định chính sách cần nhận thức rõ về sự phụ thuộc yếu giữa các thị trường này để xây dựng các chiến lược quản lý rủi ro hiệu quả hơn.
Trong tương lai, việc mở rộng nghiên cứu để áp dụng các mô hình Copula khác nhằm phân tích sự phụ thuộc giữa nhiều thị trường chứng khoán có thể cung cấp những khuyến nghị đầu tư đa dạng và toàn diện hơn. Điều này không chỉ giúp cải thiện hiệu quả đầu tư mà còn tạo ra những chiến lược quản lý rủi ro tinh vi hơn. Các nhà nghiên cứu có thể xem xét việc sử dụng các mô hình Copula khác như Gumbel, Frank, hoặc Student-t Copula để có cái nhìn toàn diện hơn về sự phụ thuộc giữa các thị trường chứng khoán. Đồng thời, việc kết hợp phân tích Copula với các mô hình kinh tế lượng khác có thể mang lại những kết quả phong phú và sâu sắc hơn, hỗ trợ đắc lực cho quá trình ra quyết định đầu tư.
[1] Mic (13/3/2016) How to fit a copula model in R [heavily revised]. Part 1: basic tools
[2] Michy Alice (18/10/2015) Modelling Dependence with Copulas in R
[3] Lê Văn Thứ (2022) Phản ứng của thị trường chứng khoán Việt Nam đối với biến động của thị trường chứng khoán quốc tế
[4] Lê Văn Thứ, Trần Ái Kết (24/07/2021) Mối quan hệ phụ thuộc giữa TTCK Việt Nam và TTCK Mỹ: Tiếp cận bằng mô hình COPULA-GJR-GARCH
##
## Jarque Bera Test
##
## data: LogReturns$VNINDEX_LogReturns
## X-squared = 1144.1, df = 2, p-value < 2.2e-16
##
## Jarque Bera Test
##
## data: LogReturns$TLINDEX_LogReturns
## X-squared = 40849, df = 2, p-value < 2.2e-16
Giả thuyết:
\(H_0\): Chuỗi lợi suất tuân theo phân phối chuẩn
\(H_1\): Chuỗi lợi suất không tuân theo phân phối chuẩn
Ta có \(P_{value}\) của hai chuỗi lợi suất đều bằng 2.2e-16 < \(\alpha\) = 0.05. Vì vậy bác bỏ \(H_0\), kết luận rằng hai chuỗi lợi suất VN-Index và TL-Index đều không tuân theo phân phối chuẩn.
##
## Augmented Dickey-Fuller Test
##
## data: LogReturns$VNINDEX_LogReturns
## Dickey-Fuller = -12.072, Lag order = 11, p-value = 0.01
## alternative hypothesis: stationary
##
## Augmented Dickey-Fuller Test
##
## data: LogReturns$TLINDEX_LogReturns
## Dickey-Fuller = -9.5466, Lag order = 11, p-value = 0.01
## alternative hypothesis: stationary
Giả thuyết:
\(H_0\): Chuỗi lợi suất là chuỗi không dừng
\(H_1\): Chuỗi lợi suất là chuỗi dừng
Ta có \(P_{value}\) của hai chuỗi lợi suất đều bằng 0.01 < \(\alpha\) = 0.05. Vì vậy bác bỏ \(H_0\), kết luận rằng hai chuỗi lợi suất VN-Index và TL-Index là hai chuỗi dừng.
##
## Box-Ljung test
##
## data: LogReturns$VNINDEX_LogReturns
## X-squared = 21.101, df = 10, p-value = 0.0204
##
## Box-Ljung test
##
## data: LogReturns$TLINDEX_LogReturns
## X-squared = 82.416, df = 10, p-value = 1.684e-13
Giả thuyết:
\(H_0\): Không có tự tương quan trong chuỗi
\(H_1\): Có tự tương quan trong chuỗi
Ta có \(P_{value}\) của VN-Index = 0.0204, và \(P_{value}\) của TL-Index = 1.684e-13, đều < \(\alpha\) = 0.05. Vì vậy bác bỏ \(H_0\), kết luận rằng hai chuỗi lợi suất VN-Index và TL-Index đều có tự tương quan.
##
## ARCH LM-test; Null hypothesis: no ARCH effects
##
## data: residuals1
## Chi-squared = 165.25, df = 10, p-value < 2.2e-16
##
## ARCH LM-test; Null hypothesis: no ARCH effects
##
## data: residuals2
## Chi-squared = 405.99, df = 10, p-value < 2.2e-16
Giả thuyết:
\(H_0\): Chuỗi lợi suất không có hiệu ứng ARCH
\(H_1\): Chuỗi lợi suất có hiệu ứng ARCH
Ta có \(P_{value}\) của hai chuỗi lợi suất đều nhỏ hơn 2.2e-16 < \(\alpha\) = 0.05. Vì vậy bác bỏ \(H_0\), kết luận rằng hai chuỗi lợi suất VN-Index và TL-Index đều có hiệu ứng ARCH.
## Series: LogReturns$VNINDEX_LogReturns
## ARIMA(1,0,0) with zero mean
##
## Coefficients:
## ar1
## 0.0603
## s.e. 0.0255
##
## sigma^2 = 0.0001663: log likelihood = 4503.7
## AIC=-9003.4 AICc=-9003.39 BIC=-8992.73
Kết quả trên cho thấy VN-Index với mô hình ARMA(1,0) là phù hợp nhất
## Series: LogReturns$TLINDEX_LogReturns
## ARIMA(3,0,1) with zero mean
##
## Coefficients:
## ar1 ar2 ar3 ma1
## -0.7321 0.0108 0.1249 0.7069
## s.e. 0.0698 0.0316 0.0263 0.0666
##
## sigma^2 = 9.942e-05: log likelihood = 4900.48
## AIC=-9790.97 AICc=-9790.93 BIC=-9764.28
Kết quả trên cho thấy TL-Index với mô hình ARMA(3,1) là phù hợp nhất