Lời đầu tiên, em xin gửi lời cảm ơn đến các thầy cô của trường Đại học Tài chính – Marketing, đặc biệt là các thầy cô bộ môn Khoa Kinh tế - Luật đã tận tình giảng dạy và chỉ dẫn em trong quá trình học tập vừa qua. Và em xin chân thành cảm ơn thầy Trần Mạnh Tường đã giúp đỡ, hướng dẫn em hoàn thành bài tiểu luận môn Phân tích dữ liệu định tính này một cách tốt nhất. Em xin chúc thầy cô có nhiều sức khỏe, hạnh phúc và thành công trên con đường sự nghiệp của mình.
Trong quá trình hoàn thành tiểu luận em khó tránh khỏi nhiều thiếu sót, em rất mong nhận được những ý kiến đóng góp từ thầy cô, từ đó giúp em hoàn thiện, học hỏi thêm được nhiều kinh nghiệm và củng cố thêm kiến thức của mình.
Lời cuối cùng, em xin kính chúc thầy, cô thật nhiều sức khỏe, đạt được nhiều thành công và phát triển.
Em xin chân thành cảm ơn!
Mục tiêu của tất cả các doanh nghiệp chính là việc tạo ra các giá trị cho cổ đông. Theo Fernandez (2002) “Một công ty tạo ra giá trị của cổ đông khi lợi nhuận của cổ đông vượt quá lợi nhuận yêu cầu của vốn chủ sở hữu hay nói cách khác khi lợi nhuận của cổ đông vượt quá giá trị mong đợi”. Có nhiều chỉ tiêu kế toán để đánh giá thành quả của một doanh nghiệp như lãi ròng, thu nhập hoạt động thuần sau thuế và lợi nhuận trên mỗi cổ phần, dòng tiền thuần (NOPAT, NI, EPS và OCF). Do đó, việc sử dụng thước đo tài chính nào phù hợp định giá thành quả doanh nghiệp để có tương quan cao với tài sản cổ đông
Một trong những bài toán về cổ phiếu có thể ứng dụng phương pháp Monte Carlo để giải quyết chính là đưa ra các dự báo về lợi nhuận trong tương lai. Ta có thể tạo ra mô hình toán học của giá trị lợi nhuận dựa trên các yếu tố lịch sử theo thời gian của mã cổ phiếu. Mô hình này có thể là một mô hình ngẫu nhiên, trong đó các giá trị của các yếu tố ảnh hưởng được tạo ra bằng cách sử dụng số ngẫu nhiên.
Kết quả của mô phỏng Monte Carlo này sẽ cung cấp cho chúng ta một cái nhìn về khả năng xảy ra lợi nhuận của cổ phiếu trong tương lai, giúp ta đưa ra quyết định đầu tư thông minh hơn. Những câu hỏi phương pháp này có thể trả lời bao gồm:
Lợi nhuận kỳ vọng trên thị trường cổ phiếu trong một khoảng thời gian tới?
Xác suất của việc tạo nên một giá trị lợi nhuận nhất định trong một khoảng thời gian tới?
Xác suất của việc mất nhiều hơn một giá trị đầu tư nhất định trong một khoảng thời gian tới?
Giá cổ phiếu của nhóm ngành chứng khoán bao gồn các mã: AGR, APG, BSI, CTS, FTS, HCM, SSI.
Thời gian thu thập từ 1/1/2022 đến 31/7/2023
Nội dung bài tiểu luận bao gồm:
Chương 1: Phần mở đầu
Chương 2: Tổng quan lý thuyết
Chương 3: Dữ liệu nghiên cứu và mô hình đề xuất
Chương 4: Kết quả
Chương 5: Kết luận
Thị trường chứng khoán giữ vai trò hết sức quan trọng trong hệ thống tài chính ở mỗi quốc gia. Trên thị trường, giá cổ phiếu là yếu tố được các nhà đầu tư đặc biệt quan tâm khi đưa ra quyết định đầu tư.
Chứng khoán là một công cụ tài chính có giá trị, có thể mua bán và nắm giữ như tiền. Lợi nhuận từ đầu tư chứng khoán thông thường đến từ chênh lệch giá mua và giá bán. Ngoài ra, nhà đầu tư có thể thu được lợi nhuận từ việc nhận cổ tức hay trái tức.
Mọi biến động trên thị trường chứng khoán Việt Nam đều có thể tác động đến nền kinh tế nước ta, vì đây là kênh dẫn vốn quan trọng cho nền kinh tế, cũng là kênh đầu tư tiềm năng của công chúng. Thị trường chứng khoán có khả năng tạo thanh khoản cao, tập trung phân phối vốn và chuyển thời hạn vốn phù hợp với nhu cầu phát triển kinh tế. Nhờ vào thị trường chứng khoán, Chính phủ có thể huy động các nguồn lực tài chính mà không phải chịu áp lực về lạm phát, đặc biệt khi nguồn vốn đầu tư khu vực của Nhà nước còn nhiều hạn chế.
Theo nhiều chuyên gia tài chính - kinh tế hàng đầu, thị trường chứng khoán có thể phản ánh chính xác triển vọng của một nền kinh tế thay đổi như thế nào theo chu kỳ nửa năm. Cụ thể là giá chứng khoán tăng sẽ cho thấy nền kinh tế đang phát triển và ngược lại, giá chứng khoán giảm lại là dự báo không mấy tốt đẹp về triển vọng của một nền kinh tế trong tương lai gần.
Thị trường chứng khoán Việt Nam đã hỗ trợ rất tốt cho hoạt động cổ phần hóa doanh nghiệp Nhà nước. Bên cạnh đó, TTCK cũng phối hợp với hệ thống tín dụng của ngân hàng tạo ra 1 cơ cấu thị trường vốn Việt Nam cân đối hơn, hiệu quả hơn, hỗ trợ mạnh mẽ cho nền kinh tế.
Thị trường chứng khoán Việt Nam có 5 chức năng hoạt động chính:
Huy động vốn đầu tư cho nền kinh tế Việt Nam
Cung cấp môi trường đầu tư cho công chúng
Tạo tính thanh khoản cho các loại chứng khoán
Đánh giá hoạt động của doanh nghiệp
Tạo môi trường hỗ trợ Chính phủ thực hiện các chính sách kinh tế vĩ mô
Ngành chứng khoán là nhóm ngành có độ nhạy cảm với VNINDEX rất cao, do đó tính đầu cơ đối với nhóm ngành cũng rất lớn. Trong năm 2022 ghi nhận số lượng tài khoản mở mới giảm mạnh bắt đầu từ quý 3 năm 2022. Bên cạnh đó là giá trị giao dịch cũng sụt giảm do thị trường giảm mạnh và cú sốc trong nửa cuối năm 2022. Thị trường bị tác động lớn do FED thực hiện việc tăng lãi suất, tác động đến các tài sản có tính rủi ro trên thị trường. Nền kinh tế Việt Nam là nền kinh tế nhỏ, rất khó có thể đứng ngoài trong đợt giảm toàn cầu này.
Biểu đồ tình hình biến động giá của các cổ phiếu nhóm ngành chứng khoán
library(readxl)
library(DT)
## Warning: package 'DT' was built under R version 4.3.1
ck <- read_excel("D:/dataCK.xlsx")
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.1
ggplot(ck) +
geom_line(aes(x = ck$Ngày, y = ck$AGR, color = "AGR")) +
geom_line(aes(x = ck$Ngày, y = ck$APG, color = "APG")) +
geom_line(aes(x = ck$Ngày, y = ck$BSI, color = "BSI")) +
geom_line(aes(x = ck$Ngày, y = ck$CTS, color = "CTS")) +
geom_line(aes(x = ck$Ngày, y = ck$FTS, color = "FTS")) +
geom_line(aes(x = ck$Ngày, y = ck$HCM, color = "HCM")) +
geom_line(aes(x = ck$Ngày, y = ck$SSI, color = "SSI")) +
labs(x = "Time", y = "price", title = "stock price", color = "stock price") +
scale_color_manual(values = c("AGR" = "deepskyblue4", "APG" = "brown", "BSI" = "darkseagreen", "CTS" = "goldenrod4", "FTS" = "cyan", "HCM" = "pink", "SSI" = "darkgreen"))
## Warning: Use of `ck$Ngày` is discouraged.
## ℹ Use `Ngày` instead.
## Warning: Use of `ck$AGR` is discouraged.
## ℹ Use `AGR` instead.
## Warning: Use of `ck$Ngày` is discouraged.
## ℹ Use `Ngày` instead.
## Warning: Use of `ck$APG` is discouraged.
## ℹ Use `APG` instead.
## Warning: Use of `ck$Ngày` is discouraged.
## ℹ Use `Ngày` instead.
## Warning: Use of `ck$BSI` is discouraged.
## ℹ Use `BSI` instead.
## Warning: Use of `ck$Ngày` is discouraged.
## ℹ Use `Ngày` instead.
## Warning: Use of `ck$CTS` is discouraged.
## ℹ Use `CTS` instead.
## Warning: Use of `ck$Ngày` is discouraged.
## ℹ Use `Ngày` instead.
## Warning: Use of `ck$FTS` is discouraged.
## ℹ Use `FTS` instead.
## Warning: Use of `ck$Ngày` is discouraged.
## ℹ Use `Ngày` instead.
## Warning: Use of `ck$HCM` is discouraged.
## ℹ Use `HCM` instead.
## Warning: Use of `ck$Ngày` is discouraged.
## ℹ Use `Ngày` instead.
## Warning: Use of `ck$SSI` is discouraged.
## ℹ Use `SSI` instead.
library(readxl)
library(DT)
ck <- read_excel("D:/dataCK.xlsx")
datatable(ck)
Bộ dữ liệu bao gồm 391 quan sát và 7 biến. Dữ liệu được thu thập từ ngày 1/1/2022 đến 31/7/2023.
Đơn vị: ngàn đồng
Biến AGR: là mã chứng khoán của Công ty Cổ phần Chứng khoán Agribank
Biến APG: là mã chứng khoán của Công ty Cổ phần Chứng khoán APG
Biến BSI: là mã chứng khoán của Công ty Cổ phần Chứng khoán Ngân hàng Đầu tư và Phát triển Việt Nam
Biến CTS: là mã chứng khoán của Công ty Cổ phần Chứng khoán Ngân hàng Công thương Việt Nam
Biến FTS: là mã chứng khoán của Công ty Cổ phần Chứng khoán FPT
Biến HCM: là mã chứng khoán của Công ty Cổ phần Chứng khoán Thành Phố Hồ Chí Minh
Biến SSI: là mã chứng khoán của Công ty Cổ phần Chứng khoán SSI
summary(ck)
## Ngày AGR APG
## Min. :2022-01-04 00:00:00.00 Min. : 5669 Min. : 2520
## 1st Qu.:2022-05-31 12:00:00.00 1st Qu.: 8263 1st Qu.: 6285
## Median :2022-10-18 00:00:00.00 Median :11700 Median : 7270
## Mean :2022-10-18 18:50:38.35 Mean :12285 Mean : 8871
## 3rd Qu.:2023-03-11 12:00:00.00 3rd Qu.:14732 3rd Qu.: 9195
## Max. :2023-07-31 00:00:00.00 Max. :25098 Max. :20700
## BSI CTS FTS HCM
## Min. :12050 Min. : 7540 Min. :11827 Min. :15073
## 1st Qu.:19600 1st Qu.:13600 1st Qu.:19755 1st Qu.:22390
## Median :27509 Median :16867 Median :26563 Median :25200
## Mean :26987 Mean :18062 Mean :27000 Mean :26147
## 3rd Qu.:32350 3rd Qu.:21322 3rd Qu.:32150 3rd Qu.:27945
## Max. :43645 Max. :36760 Max. :43530 Max. :44878
## SSI
## Min. :13900
## 1st Qu.:19575
## Median :22400
## Mean :24979
## 3rd Qu.:26567
## Max. :47092
hist(ck$AGR, main = "BIỂU ĐỒ GIÁ CỔ PHIẾU AGR",xlab = "AGR", ylab = "price",col = "#4682B4")
\(H_0\): Biến AGR có phân phối chuẩn
\(H_1\): Biến AGR không có phân phối chuẩn
shapiro.test(ck$AGR)
##
## Shapiro-Wilk normality test
##
## data: ck$AGR
## W = 0.89837, p-value = 1.772e-15
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối chuẩn
\(H_0\): Biến AGR có phân phối loga chuẩn
\(H_1\): Biến AGR không có phân phối loga chuẩn
ks.test(ck$AGR,y="plnorm")
## Warning in ks.test.default(ck$AGR, y = "plnorm"): ties should not be present
## for the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ck$AGR
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối loga chuẩn
\(H_0\): Biến AGR có phân phối mũ
\(H_1\): Biến AGR không có phân phối mũ
ks.test(ck$AGR,y="pexp")
## Warning in ks.test.default(ck$AGR, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ck$AGR
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối mũ
hist(ck$APG, main = "BIỂU ĐỒ GIÁ CỔ PHIẾU APG",xlab = "APG", ylab = "price",col = "#4682B4")
\(H_0\): Biến APG có phân phối chuẩn
\(H_1\): Biến APG không có phân phối chuẩn
shapiro.test(ck$APG)
##
## Shapiro-Wilk normality test
##
## data: ck$APG
## W = 0.79233, p-value < 2.2e-16
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối chuẩn
\(H_0\): Biến APG có phân phối loga chuẩn
\(H_1\): Biến APG không có phân phối loga chuẩn
ks.test(ck$APG,y="plnorm")
## Warning in ks.test.default(ck$APG, y = "plnorm"): ties should not be present
## for the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ck$APG
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối loga chuẩn
\(H_0\): Biến APG có phân phối mũ
\(H_1\): Biến APG không có phân phối mũ
ks.test(ck$APG,y="pexp")
## Warning in ks.test.default(ck$APG, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ck$APG
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối mũ
hist(ck$BSI, main = "BIỂU ĐỒ GIÁ CỔ PHIẾU APG",xlab = "BSI", ylab = "price",col = "#4682B4")
\(H_0\): Biến BSI có phân phối chuẩn
\(H_1\): Biến BSI không có phân phối chuẩn
shapiro.test(ck$BSI)
##
## Shapiro-Wilk normality test
##
## data: ck$BSI
## W = 0.9632, p-value = 2.438e-08
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối chuẩn
\(H_0\): Biến BSI có phân phối loga chuẩn
\(H_1\): Biến BSI không có phân phối loga chuẩn
ks.test(ck$BSI,y="plnorm")
## Warning in ks.test.default(ck$BSI, y = "plnorm"): ties should not be present
## for the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ck$BSI
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối loga chuẩn
\(H_0\): Biến BSI có phân phối mũ
\(H_1\): Biến BSI không có phân phối mũ
ks.test(ck$BSI,y="pexp")
## Warning in ks.test.default(ck$BSI, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ck$BSI
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối mũ
hist(ck$CTS, main = "BIỂU ĐỒ GIÁ CỔ PHIẾU CTS",xlab = "CTS", ylab = "price",col = "#4682B4")
\(H_0\): Biến CTS có phân phối chuẩn
\(H_1\): Biến CTS không có phân phối chuẩn
shapiro.test(ck$CTS)
##
## Shapiro-Wilk normality test
##
## data: ck$CTS
## W = 0.92937, p-value = 1.231e-12
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối chuẩn
\(H_0\): Biến CTS có phân phối loga chuẩn
\(H_1\): Biến CTS không có phân phối loga chuẩn
ks.test(ck$CTS,y="plnorm")
## Warning in ks.test.default(ck$CTS, y = "plnorm"): ties should not be present
## for the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ck$CTS
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối loga chuẩn
\(H_0\): Biến CTS có phân phối mũ
\(H_1\): Biến CTS không có phân phối mũ
ks.test(ck$CTS,y="pexp")
## Warning in ks.test.default(ck$CTS, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ck$CTS
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối mũ
hist(ck$FTS, main = "BIỂU ĐỒ GIÁ CỔ PHIẾU FTS",xlab = "FTS", ylab = "price",col = "#4682B4")
\(H_0\): Biến FTS có phân phối chuẩn
\(H_1\): Biến FTS không có phân phối chuẩn
shapiro.test(ck$FTS)
##
## Shapiro-Wilk normality test
##
## data: ck$FTS
## W = 0.97261, p-value = 9.994e-07
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối chuẩn
\(H_0\): Biến FTS có phân phối loga chuẩn
\(H_1\): Biến FTS không có phân phối loga chuẩn
ks.test(ck$FTS,y="plnorm")
## Warning in ks.test.default(ck$FTS, y = "plnorm"): ties should not be present
## for the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ck$FTS
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối loga chuẩn
\(H_0\): Biến FTS có phân phối mũ
\(H_1\): Biến FTS không có phân phối mũ
ks.test(ck$FTS,y="pexp")
## Warning in ks.test.default(ck$FTS, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ck$FTS
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối mũ
hist(ck$HCM, main = "BIỂU ĐỒ GIÁ CỔ PHIẾU HCM",xlab = "HCM", ylab = "price",col = "#4682B4")
\(H_0\): Biến HCM có phân phối chuẩn
\(H_1\): Biến HCM không có phân phối chuẩn
shapiro.test(ck$HCM)
##
## Shapiro-Wilk normality test
##
## data: ck$HCM
## W = 0.92774, p-value = 8.361e-13
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối chuẩn
\(H_0\): Biến HCM có phân phối loga chuẩn
\(H_1\): Biến HCM không có phân phối loga chuẩn
ks.test(ck$HCM,y="plnorm")
## Warning in ks.test.default(ck$HCM, y = "plnorm"): ties should not be present
## for the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ck$HCM
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối loga chuẩn
\(H_0\): Biến HCM có phân phối mũ
\(H_1\): Biến HCM không có phân phối mũ
ks.test(ck$HCM,y="pexp")
## Warning in ks.test.default(ck$HCM, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ck$HCM
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối mũ
hist(ck$SSI, main = "BIỂU ĐỒ GIÁ CỔ PHIẾU SSI",xlab = "SSI", ylab = "price",col = "#4682B4")
\(H_0\): Biến SSI có phân phối chuẩn
\(H_1\): Biến SSI không có phân phối chuẩn
shapiro.test(ck$SSI)
##
## Shapiro-Wilk normality test
##
## data: ck$SSI
## W = 0.85647, p-value < 2.2e-16
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối chuẩn
\(H_0\): Biến BSI có phân phối loga chuẩn
\(H_1\): Biến BSI không có phân phối loga chuẩn
ks.test(ck$SSI, "plnorm")
## Warning in ks.test.default(ck$SSI, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ck$SSI
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối loga chuẩn
\(H_0\): Biến BSI có phân phối mũ
\(H_1\): Biến BSI không có phân phối mũ
ks.test(ck$SSI,y="pexp")
## Warning in ks.test.default(ck$SSI, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: ck$SSI
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Với p-value < 0.05 , bác bỏ \(H_0\) nên dãy số liệu này không có phân phối mũ
Sau khi kiểm định các phân phối của các biến thì vẫn chưa thể xác định phân phối của của các biến đầu vào. Do đó, tôi sẽ sử dụng hàm sample() để tạo ra các mẫu ngẫu nhiên từ bộ dữ liệu với kích thước mẫu là 3 và 5. Sau đó sẽ kiểm tra xem mẫu có tuân theo phân phối chuẩn hay không bằng cách sử dụng phép kiểm định Shapiro-Wilk.
AGR <- sample(ck$AGR, 5)
hist(AGR)
\(H_0\): Biến AGR có phân phối chuẩn
\(H_1\): Biến AGR không có phân phối chuẩn
shapiro.test(AGR)
##
## Shapiro-Wilk normality test
##
## data: AGR
## W = 0.93282, p-value = 0.6157
Với p-value > 0.05 , chấp nhận \(H_0\) nên dãy số liệu này có phân phối chuẩn
APG <- sample(ck$APG, 5)
hist(APG)
\(H_0\): Biến APG có phân phối chuẩn
\(H_1\): Biến APG không có phân phối chuẩn
shapiro.test(APG)
##
## Shapiro-Wilk normality test
##
## data: APG
## W = 0.7585, p-value = 0.03561
Với p-value > 0.05 , chấp nhận \(H_0\) nên dãy số liệu này có phân phối chuẩn
BSI <- sample(ck$BSI, 5)
hist(BSI)
\(H_0\): Biến BSI có phân phối chuẩn
\(H_1\): Biến BSI không có phân phối chuẩn
shapiro.test(BSI)
##
## Shapiro-Wilk normality test
##
## data: BSI
## W = 0.97746, p-value = 0.9206
Với p-value > 0.05 , chấp nhận \(H_0\) nên dãy số liệu này có phân phối chuẩn
CTS <- sample(ck$CTS, 5)
hist(CTS)
\(H_0\): Biến CTS có phân phối chuẩn
\(H_1\): Biến CTS không có phân phối chuẩn
shapiro.test(CTS)
##
## Shapiro-Wilk normality test
##
## data: CTS
## W = 0.85654, p-value = 0.2161
Với p-value > 0.05 , chấp nhận \(H_0\) nên dãy số liệu này có phân phối chuẩn
FTS <- sample(ck$FTS, 5)
hist(FTS)
\(H_0\): Biến FTS có phân phối chuẩn
\(H_1\): Biến FTS không có phân phối chuẩn
shapiro.test(FTS)
##
## Shapiro-Wilk normality test
##
## data: FTS
## W = 0.87147, p-value = 0.2724
Với p-value > 0.05 , chấp nhận \(H_0\) nên dãy số liệu này có phân phối chuẩn
HCM <- sample(ck$HCM, 5)
hist(HCM)
\(H_0\): Biến HCM có phân phối chuẩn
\(H_1\): Biến HCM không có phân phối chuẩn
shapiro.test(HCM)
##
## Shapiro-Wilk normality test
##
## data: HCM
## W = 0.96309, p-value = 0.8293
Với p-value > 0.05 , chấp nhận \(H_0\) nên dãy số liệu này có phân phối chuẩn
SSI <- sample(ck$SSI, 5)
hist(SSI)
\(H_0\): Biến SSI có phân phối chuẩn
\(H_1\): Biến SSI không có phân phối chuẩn
shapiro.test(SSI)
##
## Shapiro-Wilk normality test
##
## data: SSI
## W = 0.79092, p-value = 0.06819
Với p-value > 0.05 , chấp nhận \(H_0\) nên dãy số liệu này có phân phối chuẩn
library(fBasics)
## Warning: package 'fBasics' was built under R version 4.3.1
datatable(basicStats(AGR))
AGR1 <- rnorm(n = 10000, mean = 11173.54, sd = 3173.182627 )
library(fBasics)
datatable(basicStats(APG))
APG1 <- rnorm(n = 10000, mean = 7782, sd = 2405.071725 )
library(fBasics)
datatable(basicStats(BSI))
BSI1 <- rnorm(n = 10000, mean = 20554.6, sd = 3257.937354 )
library(fBasics)
datatable(basicStats(CTS))
CTS1 <- rnorm(n = 10000, mean = 18607.92, sd = 9173.643852 )
library(fBasics)
datatable(basicStats(CTS))
FTS1 <- rnorm(n = 10000, mean = 18607.92, sd = 9173.643852 )
library(fBasics)
datatable(basicStats(HCM))
HCM1 <- rnorm(n = 10000, mean = 25818.4, sd = 2595.264977 )
library(fBasics)
datatable(basicStats(SSI))
HCM1 <- rnorm(n = 10000, mean = 25996.16, sd = 10752.125636 )