Tùy vào cá nhân kinh doanh mà mỗi người sẽ có kỳ vọng lợi nhuận khác nhau. Tuy nhiên trong phạm vi bài nghiên cứu này em quy ước trong 1 tháng:
Nếu lợi nhuận của tiệm hủ tiệu đạt lớn hơn 9.000.000 đồng gọi là tháng siêu lời.
Nếu lợi nhuận ở mức lớn hơn hoặc bằng 4.500.000 đồng nhưng nhỏ hơn 9.000.000 đồng gọi là tháng lời.
Nếu lợi nhuận ở mức lớn hơn hoặc bằng 3.000.000 đồng nhưng nhỏ hơn 4.500.000 đồng gọi là tháng hòa vốn.
Nếu lợi nhuận ở mức lớn hơn hoặc bằng 2000000 đồng nhưng nhỏ hơn 3.000.000 đồng gọi là tháng lỗ.
Nếu lợi nhuận nhỏ hơn 2000000 đồng gọi là tháng siêu lỗ.
Tiến hành mô phỏng lợi nhuận của tiệm hủ tiếu trong 1000 tháng:
SLDT1 <- rnorm(n = 1000, mean =1123.30, sd = 33.75 )
SLDT2 <- rnorm(n = 1000, mean =954.56, sd = 27.07 )
SLDT3 <- rnorm(n = 1000, mean =194.36, sd = 18.41 )
SLDT4 <- rnorm(n = 1000, mean =299.88, sd = 18.14 )
SLCP1 <- rnorm(n = 1000, mean =227.08, sd = 10.34 )
SLCP2 <- rnorm(n = 1000, mean =120.72, sd = 3.28 )
SLCP3 <- rnorm(n = 1000, mean =165.36, sd = 9.68 )
SLCP4 <- rnorm(n = 1000, mean =37.10, sd = 2.48 )
SLCP5 <- rnorm(n = 1000, mean =34.88, sd = 3.01 )
SLCP6 <- rnorm(n = 1000, mean =2.76, sd = 0.96 )
SLCP7 <- rnorm(n = 1000, mean =6.04, sd = 1.21 )
SLCP8 <- rnorm(n = 1000, mean =3.04, sd = 1.11 )
SLCP9 <- rnorm(n = 1000, mean =43.52, sd = 9.62 )
SLCP10 <- rnorm(n = 1000, mean =171.56, sd = 17.39 )
SLCP11 <- rnorm(n = 1000, mean =30.14, sd = 2.76)
SLCP12 <- rnorm(n = 1000, mean =20.64, sd = 1.91 )
SLCP13 <- rnorm(n = 1000, mean =109.90, sd = 6.53)
SLCP14 <- rnorm(n = 1000, mean =11.96, sd = 1.93 )
SLCP15 <- rnorm(n = 1000, mean =1.92, sd = 0.90 )
LN = SLDT1*20000+SLDT2*30000+SLDT3*10000+SLDT4*15000-(9150000+SLCP1*60000+SLCP2*120000+SLCP3*20000+SLCP4*20000+SLCP5*20000+SLCP6*90000+SLCP7*40000+SLCP8*250000+SLCP9*12000+SLCP10*12000+SLCP11*15000+SLCP12*25000+SLCP13*30000+SLCP14*80000+SLCP15*300000)
LN <- data.frame(LN)
Dựa vào kết quả mô phỏng lợi nhuận. Khi đó ta tính được kết quả mô phỏng xác suất lợi nhuận của tiệm hủ tiếu trong 1000 tháng như sau:
counts <- table(ifelse(LN > 9000000, "Thang sieu loi",
ifelse(LN >= 4500000, "Thang loi",
ifelse(LN >= 3000000, "Thang hoa von",
ifelse(LN >= 2000000, "Thang lo",
ifelse(any(LN < 2000000), "Thang sieu lo", "Thang sieu lo"))))))
Xacsuat <- counts / sum(counts) * 100
Ketqua <- data.frame(Phan_loai = names(counts), Xac_suat = paste(Xacsuat, "%"))
print(Ketqua)
## Phan_loai Xac_suat
## 1 Thang hoa von 14.9 %
## 2 Thang lo 1.7 %
## 3 Thang loi 81.6 %
## 4 Thang sieu lo 0.2 %
## 5 Thang sieu loi 1.6 %
Như vậy, lợi nhuận của tiệm được mô phỏng với xác suất tháng hòa vốn là 16,4%; tháng lỗ là 2,4%; tháng lời là 79,3%; tháng siêu lỗ là 0,7% và tháng siêu lời là 1,2%.
Mô hình mô phỏng lợi nhuận của tiệm hủ tiếu được xác định như sau:
\(LN = \sum_1^4 \mathrm{SLDT}_{\mathrm{i}} \cdot DGDT_{\textrm{i}}-\left(9.150 .000+\sum_1^{\mathrm{n}} \mathrm{SLCP}_{\mathrm{k}} \cdot DGCP_{\mathrm{k}}\right)\)
Tiến hành mô phỏng lợi nhuận của tiệm hủ tiếu trong 1000 tháng với giả định các biến độc lập có phân phối chuẩn.
Dựa vào dữ liệu thu thập, ta có thể tính được trung bình và độ lệch chuẩn của các biến độc lập từ 50 quan sát này như sau:
library(readxl)
library(psych)
dulieuthuthap <- read_excel("dulieuthuthap.xlsx")
describe(dulieuthuthap)
## vars n mean sd median trimmed mad min max range skew
## SLDT1 1 50 1123.30 33.75 1125.0 1124.35 37.06 1025 1182 157 -0.43
## SLDT2 2 50 954.56 27.07 952.5 954.58 32.62 895 1005 110 0.01
## SLDT3 3 50 194.36 18.41 197.5 194.80 18.53 155 232 77 -0.26
## SLDT4 4 50 299.88 18.14 299.5 299.08 18.53 267 345 78 0.35
## SLCP1 5 50 227.08 10.34 229.0 227.78 8.90 200 245 45 -0.57
## SLCP2 6 50 120.72 3.28 120.0 121.05 2.22 110 125 15 -0.83
## SLCP3 7 50 165.36 9.68 164.5 164.65 11.12 149 195 46 0.67
## SLCP4 8 50 37.10 2.48 37.0 37.05 2.97 32 45 13 0.44
## SLCP5 9 50 34.88 3.01 35.0 34.95 2.97 28 41 13 -0.11
## SLCP6 10 50 2.76 0.96 3.0 2.72 1.48 1 5 4 0.34
## SLCP7 11 50 6.04 1.21 6.0 6.00 1.48 4 10 6 0.53
## SLCP8 12 50 3.04 1.11 3.0 3.10 1.48 1 5 4 -0.25
## SLCP9 13 50 43.52 9.62 44.5 43.38 8.15 20 70 50 0.10
## SLCP10 14 50 171.56 17.39 170.0 170.98 14.83 130 215 85 0.25
## SLCP11 15 50 30.14 2.76 30.0 30.30 1.48 20 35 15 -0.93
## SLCP12 16 50 20.64 1.91 21.0 20.70 1.48 16 24 8 -0.26
## SLCP13 17 50 109.90 6.53 110.0 109.80 5.93 90 125 35 -0.10
## SLCP14 18 50 11.96 1.93 12.0 11.97 1.48 6 16 10 -0.28
## SLCP15 19 50 1.92 0.90 2.0 1.85 1.48 1 5 4 0.81
## kurtosis se
## SLDT1 -0.01 4.77
## SLDT2 -0.78 3.83
## SLDT3 -0.54 2.60
## SLDT4 -0.53 2.56
## SLCP1 0.12 1.46
## SLCP2 1.02 0.46
## SLCP3 0.46 1.37
## SLCP4 0.65 0.35
## SLCP5 -0.49 0.43
## SLCP6 -0.48 0.14
## SLCP7 0.82 0.17
## SLCP8 -0.88 0.16
## SLCP9 0.34 1.36
## SLCP10 0.14 2.46
## SLCP11 2.18 0.39
## SLCP12 -0.32 0.27
## SLCP13 0.75 0.92
## SLCP14 0.51 0.27
## SLCP15 0.66 0.13
Tiến hành mô phỏng các biến độc lập dựa theo trung bình và độ lệch chuẩn của các biến độc lập:
SLDT1 <- rnorm(n = 1000, mean =1123.30, sd = 33.75 )
SLDT2 <- rnorm(n = 1000, mean =954.56, sd = 27.07 )
SLDT3 <- rnorm(n = 1000, mean =194.36, sd = 18.41 )
SLDT4 <- rnorm(n = 1000, mean =299.88, sd = 18.14 )
SLCP1 <- rnorm(n = 1000, mean =227.08, sd = 10.34 )
SLCP2 <- rnorm(n = 1000, mean =120.72, sd = 3.28 )
SLCP3 <- rnorm(n = 1000, mean =165.36, sd = 9.68 )
SLCP4 <- rnorm(n = 1000, mean =37.10, sd = 2.48 )
SLCP5 <- rnorm(n = 1000, mean =34.88, sd = 3.01 )
SLCP6 <- rnorm(n = 1000, mean =2.76, sd = 0.96 )
SLCP7 <- rnorm(n = 1000, mean =6.04, sd = 1.21 )
SLCP8 <- rnorm(n = 1000, mean =3.04, sd = 1.11 )
SLCP9 <- rnorm(n = 1000, mean =43.52, sd = 9.62 )
SLCP10 <- rnorm(n = 1000, mean =171.56, sd = 17.39 )
SLCP11 <- rnorm(n = 1000, mean =30.14, sd = 2.76)
SLCP12 <- rnorm(n = 1000, mean =20.64, sd = 1.91 )
SLCP13 <- rnorm(n = 1000, mean =109.90, sd = 6.53)
SLCP14 <- rnorm(n = 1000, mean =11.96, sd = 1.93 )
SLCP15 <- rnorm(n = 1000, mean =1.92, sd = 0.90 )
LN = SLDT1*20000+SLDT2*30000+SLDT3*10000+SLDT4*15000-(9150000+SLCP1*60000+SLCP2*120000+SLCP3*20000+SLCP4*20000+SLCP5*20000+SLCP6*90000+SLCP7*40000+SLCP8*250000+SLCP9*12000+SLCP10*12000+SLCP11*15000+SLCP12*25000+SLCP13*30000+SLCP14*80000+SLCP15*300000)
LN <- data.frame(LN)
library(psych)
describe(LN)
## vars n mean sd median trimmed mad min max range
## LN 1 1000 5916586 1401979 5937169 5913839 1395010 1470854 10566405 9095551
## skew kurtosis se
## LN -0.03 0.09 44334.48
Từ kết quả thống kê mô tả cho thấy:
Lợi nhuận trung bình của tiệm hủ tiếu là 5.810.118 đồng
Lợi nhuận nhỏ nhất của tiệm hủ tiếu là 957.799 đồng
Lợi nhuận lớn nhất của tiệm hủ tiếu là 11.279.664 đồng
Độ lệch chuẩn thể hiện mức độ biến động và phân tán của dữ liệu. Độ lệch chuẩn của LN là 1502541
Độ lệch (Skewness)và độ nhọn (Kurtosis) có giá trị gần bằng 0 cho thấy dữ liệu có phân phối gần chuẩn.
Trực quan hóa dữ liệu bằng biểu đồ histogram
library(ggplot2)
##
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
##
## %+%, alpha
library(scales)
##
## Attaching package: 'scales'
## The following objects are masked from 'package:psych':
##
## alpha, rescale
ggplot(data = LN, aes(x = LN)) +
geom_histogram ( fill = "blue", col = "white") +
labs(x = "Số tiền lợi nhuận",
y = "Số tháng",
title = "Biểu đồ lợi nhuận của tiệm hủ tiếu") +
scale_x_continuous(labels = comma)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Dựa vào kết quả câu 2, mô hình mô phỏng lợi nhuận của tiệm hủ tiếu được xác định là:
LN = \(\sum_1^4 \mathrm{SLDT}_{\mathrm{i}} \cdot DGDT_{\textrm{i}}-\left(9.150 .000+\sum_1^{\mathrm{n}} \mathrm{SLCP}_{\mathrm{k}} \cdot DGCP_{\mathrm{k}}\right)\)
Dựa vào kết quả tuần 2, ta biết để mô phỏng lợi nhuận cần mô phỏng số lượng chi phí biến đổi và doanh thu của tiệm hủ tiếu.
Tiến hành khảo sát doanh thu và chi phí thực tế của các tiệm hủ tiếu có quy mô tương tương tự (quy mô nhỏ, có lượng khách từ 70 đến 90 khách/ngày) tại Rạch Giá. Em thu được bảng số lượng gồm 50 tháng với 19 biến như sau:
library(readxl)
dulieuthuthap <- read_excel("dulieuthuthap.xlsx")
library(DT)
dulieuthuthap %>% DT::datatable(dulieuthuthap)
Thống kê mô tả dữ liệu thu thập
library(psych)
describe(dulieuthuthap)
## vars n mean sd median trimmed mad min max range skew
## SLDT1 1 50 1123.30 33.75 1125.0 1124.35 37.06 1025 1182 157 -0.43
## SLDT2 2 50 954.56 27.07 952.5 954.58 32.62 895 1005 110 0.01
## SLDT3 3 50 194.36 18.41 197.5 194.80 18.53 155 232 77 -0.26
## SLDT4 4 50 299.88 18.14 299.5 299.08 18.53 267 345 78 0.35
## SLCP1 5 50 227.08 10.34 229.0 227.78 8.90 200 245 45 -0.57
## SLCP2 6 50 120.72 3.28 120.0 121.05 2.22 110 125 15 -0.83
## SLCP3 7 50 165.36 9.68 164.5 164.65 11.12 149 195 46 0.67
## SLCP4 8 50 37.10 2.48 37.0 37.05 2.97 32 45 13 0.44
## SLCP5 9 50 34.88 3.01 35.0 34.95 2.97 28 41 13 -0.11
## SLCP6 10 50 2.76 0.96 3.0 2.72 1.48 1 5 4 0.34
## SLCP7 11 50 6.04 1.21 6.0 6.00 1.48 4 10 6 0.53
## SLCP8 12 50 3.04 1.11 3.0 3.10 1.48 1 5 4 -0.25
## SLCP9 13 50 43.52 9.62 44.5 43.38 8.15 20 70 50 0.10
## SLCP10 14 50 171.56 17.39 170.0 170.98 14.83 130 215 85 0.25
## SLCP11 15 50 30.14 2.76 30.0 30.30 1.48 20 35 15 -0.93
## SLCP12 16 50 20.64 1.91 21.0 20.70 1.48 16 24 8 -0.26
## SLCP13 17 50 109.90 6.53 110.0 109.80 5.93 90 125 35 -0.10
## SLCP14 18 50 11.96 1.93 12.0 11.97 1.48 6 16 10 -0.28
## SLCP15 19 50 1.92 0.90 2.0 1.85 1.48 1 5 4 0.81
## kurtosis se
## SLDT1 -0.01 4.77
## SLDT2 -0.78 3.83
## SLDT3 -0.54 2.60
## SLDT4 -0.53 2.56
## SLCP1 0.12 1.46
## SLCP2 1.02 0.46
## SLCP3 0.46 1.37
## SLCP4 0.65 0.35
## SLCP5 -0.49 0.43
## SLCP6 -0.48 0.14
## SLCP7 0.82 0.17
## SLCP8 -0.88 0.16
## SLCP9 0.34 1.36
## SLCP10 0.14 2.46
## SLCP11 2.18 0.39
## SLCP12 -0.32 0.27
## SLCP13 0.75 0.92
## SLCP14 0.51 0.27
## SLCP15 0.66 0.13
Từ kết quả thống kê mô tả cho thấy:
Biến SLDT1 có giá trị nhỏ nhất là 1025; giá trị lớn nhất là 1182; giá trị trung bình là 1123.30; độ lệch chuẩn là 33.75
Biến SLDT2 có giá trị nhỏ nhất là 895; giá trị lớn nhất là 1005; giá trị trung bình là 954.56; độ lệch chuẩn là 27.07
Biến SLDT3 có giá trị nhỏ nhất là 155; giá trị lớn nhất là 345; giá trị trung bình là 194.36; độ lệch chuẩn là 18.41
Biến SLDT4 có giá trị nhỏ nhất là 267; giá trị lớn nhất là 345; giá trị trung bình là 299.88; độ lệch chuẩn là 18.14
Biến SLCP1 có giá trị nhỏ nhất là 200; giá trị lớn nhất là 245; giá trị trung bình là 227.08; độ lệch chuẩn là 10.34
Biến SLCP2 có giá trị nhỏ nhất là 110; giá trị lớn nhất là 125; giá trị trung bình là 120.72; độ lệch chuẩn là 3.28
Biến SLCP3 có giá trị nhỏ nhất là 149; giá trị lớn nhất là 195; giá trị trung bình là 165.36; độ lệch chuẩn là 9.68
Biến SLCP4 có giá trị nhỏ nhất là 32; giá trị lớn nhất là 45; giá trị trung bình là 37.10; độ lệch chuẩn là 2.48
Biến SLCP5 có giá trị nhỏ nhất là 28; giá trị lớn nhất là 41; giá trị trung bình là 34.88; độ lệch chuẩn là 3.01
Biến SLCP6 có giá trị nhỏ nhất là 1; giá trị lớn nhất là 5; giá trị trung bình là 2.76; độ lệch chuẩn là 0.96
Biến SLCP7 có giá trị nhỏ nhất là 4; giá trị lớn nhất là 10; giá trị trung bình là 6.04; độ lệch chuẩn là 1.21
Biến SLCP8 có giá trị nhỏ nhất là 1; giá trị lớn nhất là 5; giá trị trung bình là 3.04; độ lệch chuẩn là 1.11
Biến SLCP9 có giá trị nhỏ nhất là 20; giá trị lớn nhất là 70; giá trị trung bình là 43.52; độ lệch chuẩn là 9.62
Biến SLCP10 có giá trị nhỏ nhất là 130; giá trị lớn nhất là 215; giá trị trung bình là 171.56; độ lệch chuẩn là 17.39
Biến SLCP11 có giá trị nhỏ nhất là 20; giá trị lớn nhất là 35; giá trị trung bình là 30.14; độ lệch chuẩn là 2.76
Biến SLCP12 có giá trị nhỏ nhất là 16; giá trị lớn nhất là 24; giá trị trung bình là 20.64; độ lệch chuẩn là 1.91
Biến SLCP13 có giá trị nhỏ nhất là 90; giá trị lớn nhất là 125; giá trị trung bình là 109.90; độ lệch chuẩn là 6.53
Biến SLCP14 có giá trị nhỏ nhất là 6; giá trị lớn nhất là 16; giá trị trung bình là 11.96; độ lệch chuẩn là 1.93
Biến SLCP15 có giá trị nhỏ nhất là 1; giá trị lớn nhất là 5; giá trị trung bình là 1.92; độ lệch chuẩn là 0.90
Sử dụng Kiểm định Shapiro-Wilk Test và biểu đồ QQ-plot để kiểm định dữ liệu có phân bố chuẩn hay không.
Giả thuyết thống kê của SHapiro-Wilk Test:
H0: Biến cần kiểm định tuân theo phân phối chuẩn.
H1: Biến cần kiểm định không tuân theo phân phối chuẩn
Giá trị của thống kê Shapiro-Wilk:
\[ W = (\sum_{i=1}^{n} \alpha_ix_i)^2/(\sum_{i=1}^{n} x_i-\overline{x})^2 \]
Với: \(x_i\): giá trị thứ i nhỏ nhất của x. \(\alpha_i\): Hằng số Shapiro - Wilk.
shapiro.test(dulieuthuthap$SLDT1)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLDT1
## W = 0.97243, p-value = 0.2898
library(ggpubr)
ggqqplot(dulieuthuthap$SLDT1)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.2898 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLDT1 tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLDT2)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLDT2
## W = 0.9812, p-value = 0.6034
library(ggpubr)
ggqqplot(dulieuthuthap$SLDT2)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.6034 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLDT2 tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLDT3)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLDT3
## W = 0.97574, p-value = 0.3893
library(ggpubr)
ggqqplot(dulieuthuthap$SLDT3)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.3893 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLDT3 tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLDT4)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLDT4
## W = 0.97875, p-value = 0.5007
library(ggpubr)
ggqqplot(dulieuthuthap$SLDT4)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.5007 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLDT4 tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP1)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP1
## W = 0.95691, p-value = 0.06601
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP1)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.06601 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP1 tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP2)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP2
## W = 0.88155, p-value = 0.0001247
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP2)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.0001247 < 0.05 nên bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần không nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP2 không tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP3)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP3
## W = 0.96139, p-value = 0.1016
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP3)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.1016 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP3 tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP4)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP4
## W = 0.96679, p-value = 0.1709
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP4)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.96679 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP4 tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP5)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP5
## W = 0.97859, p-value = 0.4941
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP5)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.97859 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP5 tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP6)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP6
## W = 0.89322, p-value = 0.0002892
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP6)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.0002892 < 0.05 nên bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần không nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP6 không tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP7)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP7
## W = 0.9139, p-value = 0.001429
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP7)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.001429 < 0.05 nên bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần không nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP7 không tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP8)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP8
## W = 0.90232, p-value = 0.0005738
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP8)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.0005738 < 0.05 nên chấp nhận giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần không nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP8 không tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP9)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP9
## W = 0.97594, p-value = 0.3961
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP9)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.3961 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP9 tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP10)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP10
## W = 0.98285, p-value = 0.6768
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP10)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.6768 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP10 tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP11)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP11
## W = 0.91994, p-value = 0.002347
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP11)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.002347 < 0.05 nên chấp nhận giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần không nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP11 không tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP12)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP12
## W = 0.95712, p-value = 0.06734
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP12)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.06734 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP12 tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP13)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP13
## W = 0.97623, p-value = 0.406
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP13)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.406 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP13 tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP14)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP14
## W = 0.96355, p-value = 0.1252
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP14)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.1252 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP14 tuân theo luật phân phối chuẩn.
shapiro.test(dulieuthuthap$SLCP15)
##
## Shapiro-Wilk normality test
##
## data: dulieuthuthap$SLCP15
## W = 0.81543, p-value = 2.026e-06
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP15)
Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 2.026e-06 < 0.05 nên bác bỏ giả thuyết H0
Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần không nằm trên đường thẳng kì vọng của phân phối chuẩn.
Vậy ta có thể kết luận biến SLCP15 không tuân theo luật phân phối chuẩn.
Như vậy, các biến SLDT1, SLDT2, SLDT3, SLDT4, SLCP1, SLCP3, SLCP4, SLCP5, SLCP8, SLCP9, SLCP10, SLCP11, SLCP12, SLCP13, SLCP14 tuân theo quy luật phân phối chuẩn. Còn các biến SLCP2, SLCP6,SLCP7, SLCP15 không tuân theo quy luận phân phối chuẩn.
Mô phỏng lợi nhuận của một tiệm hủ tiếu nhỏ ở Rạch Giá. Để tính được lợi nhuận thì cần phải dự kiến được doanh thu và chi phí khi hoạt động.
SLDT1: Số lượng tô (hủ tiếu/ hủ tiếu mì/ hoành thánh) thịt
SLDT2: Số lượng tô (hủ tiếu/ hủ tiếu mì/ hoành thánh) thịt + xương hoặc giò
SLDT3: Thêm hủ tiếu/hủ tiếu mì/hoành thánh
SLDT4: Thêm thịt/ xương hoặc giò
ĐG1: 20.000 đồng/tô thịt
ĐG2: 30.000 đồng/tô thịt + xương hoặc giò
ĐG3: 10.000 đồng/ 1 phần thêm hủ tiếu/hủ tiếu mì/hoành thánh thêm
ĐG4: 15.000 đồng/ 1 phần thêm thịt/ xương hoặc giò thêm
Vậy tổng doanh thu dự kiến của tiệm: \(\mathrm{DT}=\sum_1^4 \mathrm{SLDT}_{\mathrm{i}}. \mathrm{DGDT}_{\mathrm{i}}\)
Xe bán + bàn ghế + xoong nồi + tô chén đũa muỗng: 6.000.000/60= 100.000 đồng
Mặt bằng( đã bao gồm tiền nước): 2.000.000 đồng
Lương chủ: 5.000.000 đồng
Lương nhân viên phụ: 1.800.000 đồng
Đá: 150.000 đồng
Trà: 100.000 đồng
=> Tổng chi phí cố định = 9.150.000 đồng
SLCP1: Giò xương (đơn vị: kg)
SLCP2: Thịt (đơn vị: kg)
SLCP3: Hủ tiếu (đơn vị: kg)
SLCP4: Mì (đơn vị: kg)
SLCP5: Hoành thánh (đơn vị: kg)
SLCP6: Nước mắm (đơn vị: chai)
SLCP7: Tương ớt + Tương đen (đơn vị: chai)
SLCP8: Gia vị gồm 5 kg đường + 5 kg muối + 5 kg bột ngọt
SLCP9: Hành hẹ (đơn vị: kg)
SLCP10: Giá (đơn vị: kg)
SLCP11: Chanh (đơn vị: kg)
SLCP12: Ớt (đơn vị: kg)
SLCP13: Rau (đơn vị: kg)
SLCP14: Hành phi (đơn vị: kg)
SLCP15: Bao bì + giấy ăn
\[ \begin{array}{|l|l|} \hline \text { - Giò xương (đơn vị: đồng/kg) } & 60.000 \\ \hline \text { - Thịt (đơn vi: đồng/kg) } & 120.000 \\ \hline \text { - Hủ tiếu (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Mì (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Hoành thánh (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Nước mắm (đơn vị: đồng/bầu) } & 90.000 \\ \hline \text { - Tương ớt + Tương đen (đơn vị: đồng/bầu) } & 40.000 \\ \hline \text { - Gia vị (đơn vị: đồng/lần) } & 250.000 \\ \hline \text { - Hành hẹ (đơn vị: đồng/kg) } & 12.000 \\ \hline \text { - Giá (đơn vị: đồng/kg) } & 12.000 \\ \hline \text { - Chanh (đơn vị: đồng/kg) } & 15.000 \\ \hline \text { - Ớt (đơn vị: đồng/kg) } & 25.000 \\ \hline \text { - Rau (đơn vị: đồng/kg) } & 30.000 \\ \hline \text { - Hành phi (đơn vị: đồng/kg) } & 80.000 \\ \hline \text { - Bao bì + giấy ăn (đơn vị: đồng/lần) } & 300.000 \\ \hline \end{array} \] => Tổng chi phí biến đổi = \(\sum_1^{\mathrm{n}} \mathrm{SLCP}_{\mathrm{k}} \cdot \mathrm{DGCP}_{\mathrm{k}}\)**
Vậy tổng chi phí dự kiến của tiệm:
CP = 9.150.000 + \(\sum_1^{\mathrm{n}} \mathrm{SLCP}_{\mathrm{k}} \cdot \mathrm{DGCP}_{\mathrm{k}}\)
Khi đó, lợi nhuận dự kiến của tiệm:
= Doanh thu - Chi phí
= \(\sum_1^4 \mathrm{SLDT}_{\mathrm{i}} \cdot DGDT_{\textrm{i}}-\left(9.150 .000+\sum_1^{\mathrm{n}} \mathrm{SLCP}_{\mathrm{k}} \cdot DGCP_{\mathrm{k}}\right)\)
Như vậy, để mô phỏng lợi nhuận cần mô phỏng số lượng doanh thu và số lượng chi phí biến đổi của tiệm hủ tiếu.
Phân phối Poisson là phân phối cho biết xác xuất của sự kiện rời rạc xảy ra nhiều lần tại thời điểm ngẫu nhiên, trong một khoảng thời gian quy định. Sự kiện rời rạc có nghĩa là các sự kiện không ảnh hưởng trực tiếp đến nhau
Công thức
\(P(X=k)=e^-λ.\frac{λ ^k}{k!}\) k=0,1,2…
Đặc trưng số :
Kỳ vọng E(x) = λ
Phương sai Var(x)= λ
Mô phỏng ngẫu nhiên số ly nước cam bán được trong ngày có phân phối Poisson với tham số λ = 30 trong 1000 ngày.
a <- rpois(1000,30)
summary(a)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 16.00 26.00 30.00 30.16 34.00 46.00
Trung bình số ly nước cam bán được là 30 ly mỗi ngày trong 1000 ngày khảo sát, trong đó nhiều nhất là 50 ly, ít nhất là 14 ly.
hist(a, main= "Phân phối possion", xlab = "Số ly nước cam bán được trong ngày")
Biến ngẫu nhiên x được gọi là có phân phối đều trên đoạn:\([a,b]\)(a<b), ký hiệu X ~ U[a,b] nếu X có hàm mật độ là :
\[ f(x)=\left\{\begin{array}{cc} \frac{1}{b-a} & x \in[a, b] \\ 0 & x \notin[a, b] \end{array}\right. \] Đặc trưng số
Kỳ vọng \[ \mathrm{E}(\mathrm{X})=\frac{\mathrm{a}+\mathrm{b}}{2} \] Phương sai \[ \operatorname{Var}(X)=\frac{(\mathrm{b}-\mathrm{a})^2}{12} \] Mod(X) la giá trị bất kỳ nào trên đoạn a,b
Mô phỏng ngẫu nhiên số bánh mì bán được trong 1 ngày có phân phối đều trong khoảng 50-80 cái, trong 500 ngày
b <- runif(500,50,80)
summary(b)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 50.03 56.51 64.56 64.51 72.50 79.93
Số bánh trung bình mà quán bán được trong 500 ngày là 66 cái, ngày bán nhiều nhất 80 cái, ít nhất 50 cái
hist(b, main= "Phân phối đều", xlab = "Số bánh bán trong ngày")
Phân phối nhị thức với tham số p và n là tổng của n phép thử Bernoulli với xác suất p độc lập với nhau. Biến ngẫu nhiên có phân phối nhị thức nhận giá trị từ 0 đến n và xác suất để chọn ra x phần tử mong muốn trong n phần tử là \(\left(\begin{array}{l}n \\ x\end{array}\right) p^x(1-p)^{n-x}\) với \(\mathrm{x}=0,1,2, \ldots \mathrm{n}\).
Hàm xác xuất \(f(x)=\left(\begin{array}{l}n \\ x\end{array}\right) p^x(1-p)^{n-x} ; x=0,1,2, \ldots, n\)
Trung bình \(\mu=n p\)
Phương sai \(\sigma^2=n p(1-p)=n p q\)
Hàm sinh moment \(m(t)=\left(p e^t+q\right)^n\)
Biết rằng trong một quần thể dân số có khoảng 20% người mắc bệnh cao huyết áp; nếu chúng ta tiến hành chọn mẫu 500 lần ,mỗi lần chọn 30 người trong quần thể đó một cách ngẫu nhiên, sự phân phối số bệnh nhân cao huyết áp sẽ như thế nào ? Để trả lời câu hỏi này, chúng ta có thể ứng dụng hàm rbinom (n, k, p) trong R với những thông số như sau
c <- rbinom(500,30,0.2)
table(c)
## c
## 1 2 3 4 5 6 7 8 9 10 11 12 13
## 3 12 32 62 67 100 91 65 36 22 5 3 2
Dòng thứ nhất ( 0,1,2….13) là số bệnh nhân cao huyết áp trong 30 người ta chọn.Dòng thứ 2 cho ta biết số lần chọn mẫu trong 500 lần xảy ra, có 2 mẫu không có bệnh nhân cao huyết áp, có 5 mẫu chỉ có 1 bệnh nhân cao huyết áp.
hist(c, main= "Phân phối nhị thức Binomial", xlab = "Bệnh nhân cao huyết áp")
Phân phối số bệnh nhân cao huyết áp trong số 30 người được chọn ngẫu nhiên trong một quần thề gồm 20% bệnh nhân cao huyết áp, và chọn mẫu được lặp lại 500 lần
Phân phối chuẩn, còn gọi là phân phối Gauss, là một phân phối xác suất cực kì quan trọng trong nhiều lĩnh vực. Nó là họ phân phối có dạng tổng quát giống nhau, chỉ khác tham số vị trí (giá trị trung bình \(\mu\) ) và tỉ lệ (phương sai \(\sigma^2\) ). BNN X có hàm mật độ xác xuất f phụ thuộc vào 2 tham số \(\mu\) và \(\sigma\) ( \(\sigma\) >0 )
Hàm mật độ \(f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{(x-\mu)^2}{2 \sigma^2}} ; x \in R\)
Trung bình \(\mu\)
Phương sai \(\sigma^2\)
Hàm sinh moment \(m(t)=e^{\mu t+\frac{t^2 \sigma^2}{2}}\)
Khảo sát mức tiêu thụ điện của các hộ gia đình ở Cần Thơ trung bình là 150KWh,độ lệch chuẩn 30KW.Mô phỏng mức tiêu thụ điện trong 500 ngày tiếp theo
d <- rnorm(500,mean = 150, sd= 30)
summary(d)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 44.09 132.53 153.00 151.87 173.52 231.32
Mức tiêu thụ điện trung bình của người dân Cần Thơ là 149kwh,lượng tiêu thụ thấp nhất là 53kwh và cao nhất là 232kwh.
hist(d, main= "Phân phối chuẩn", xlab = "Mức tiêu thụ điện trung bình")
Phân phối mũ (Exponential Distribution) hoặc phân phối mũ phủ định đại diện cho một phân phối xác suất giúp mô tả thời gian giữa hai sự kiện trong một quá trình Poisson. Trong quá trình Poisson, các sự kiện xảy ra liên tục và độc lập theo một tần suất trung bình không đổi. Phân phối mũ là một trường hợp đặc biệt của phân phối gamma.
Hàm mật độ xác suất của phân phối mũ được tính bởi công thức:
\[ \begin{cases}\lambda e^{-\lambda x}, & \text { if } x \geq 0 \\ 0, & \text { if } x<0\end{cases} \] Với
\(\lambda\) = biến số tần suất
\(x=\) biến ngẫu nhiên
Hàm phân phối tích lũy của phân phối mũ được tính bởi công thức:
\[ \begin{cases}1-e^{-\lambda x}, & \text { nếu } x \geq 0 \\ 0, & \text { nếu } x<0\end{cases} \]
với
\(\lambda\) = biến tỉ lệ
x = biến ngẫu nhiên
Mô phỏng số máy tính bảng bán ra tại một cửa hàng trong 500 ngày có phân phối mũ với xác xuất 20 %
e <- rexp(500,0.2)
summary(e)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00783 1.43253 3.58324 4.97048 6.57481 39.17730
Trung bình trong 500 ngày, có ngày cửa hàng không bán được cái nào, ngày cao nhất bán được 31 cái, trung bình bán được 3 cái/ ngày.
hist(e, main= "Phân phối mũ", xlab = "Số lượng máy tính bảng ")