Chọn và giải thích về đối tượng ( vấn đề ) cần mô phỏng ( có ít nhất 6 biến ngẫu
nhiên đầu vào)
Doanh thu = Số lượng * Đơn giá
Thông tin và dữ liệu về đơn giá,số lượng các món nước bán ra hàng ngày của quán trong 1
năm (6 món với 365 quan sát).
Tên cửa hàng : Thái Phúc Tea
Địa chỉ: 92 Nguyễn Công Trứ, phường Tự An, TP Buôn Ma Thuột, Tỉnh Đak Lak
Lĩnh vực kinh doanh: Ăn uống
Đối tượng kinh doanh: Tất cả các đối tượng có khả năng chi trả kinh tế;
Hình thức kinh doanh: phục vụ tại quán, mang đi
Diện tích: 200m2
Menu
Sữa tươi trân châu đường đen: 35.000đ/ly
Trà sữa truyền thống: 25.000đ/ly
Trà sữa hoàng kim: 30.000đ/ly
Trà sen tứ quý: 35.000đ/ ly
Trà vải: 35.000đ/ly
Cà phê: 20.000đ/ly
library(readxl)
## Warning: package 'readxl' was built under R version 4.3.1
MPNN <- read_excel("~/MPNN.xlsx")
View(MPNN)
MPNN
## # A tibble: 365 × 6
## STTCDD TSTT TSHK TSTQ TV CF
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 26 16 8 8 21 12
## 2 30 17 9 9 15 15
## 3 22 9 8 18 4 12
## 4 26 15 7 16 6 9
## 5 17 17 4 10 8 3
## 6 15 22 9 4 11 3
## 7 28 2 6 19 13 13
## 8 7 6 3 17 22 10
## 9 12 20 10 11 26 9
## 10 26 14 2 3 6 9
## # ℹ 355 more rows
summary(MPNN)
## STTCDD TSTT TSHK TSTQ
## Min. : 1.00 Min. : 1.00 Min. : 2.000 Min. : 1.000
## 1st Qu.: 8.00 1st Qu.: 6.00 1st Qu.: 4.000 1st Qu.: 4.000
## Median :16.00 Median :12.00 Median : 6.000 Median : 9.000
## Mean :15.66 Mean :12.47 Mean : 6.375 Mean : 9.389
## 3rd Qu.:24.00 3rd Qu.:18.00 3rd Qu.: 9.000 3rd Qu.:14.000
## Max. :30.00 Max. :25.00 Max. :11.000 Max. :20.000
## TV CF
## Min. : 1.00 Min. : 1.000
## 1st Qu.: 8.00 1st Qu.: 5.000
## Median :15.00 Median : 8.000
## Mean :15.25 Mean : 7.918
## 3rd Qu.:22.00 3rd Qu.:11.000
## Max. :30.00 Max. :15.000
sd(MPNN$STTCDD)
## [1] 8.861863
Biến STTCĐĐ có giá trị trung bình là 15.14 và độ lệch chuẩn là 8.576192
sd(MPNN$TSTT)
## [1] 7.122351
Biến TSTT có giá trị trung bình là 12.5 và độ lệch chuẩn là 7.18577
sd(MPNN$TSHK)
## [1] 2.889721
Biến TSHK có giá trị trung bình là 6.542 và độ lệch chuẩn là 2.768837
sd(MPNN$TSTQ)
## [1] 5.501437
Biến TSTQ có giá trị trung bình là 9.89 và độ lệch chuẩn là 5.562733
sd(MPNN$TV)
## [1] 8.38166
Biến TV có giá trị trung bình là 14.69 và độ lệch chuẩn là 8.330012
sd(MPNN$CF)
## [1] 4.165377
Biến CF có giá trị trung bình là 8.186 và độ lệch chuẩn là 4.40633
hist(MPNN$STTCDD)
Kiểm định phân phối chuẩn
Gỉa thuyết:
H0: STTCĐĐ theo phân phối chuẩn
H1: STTCĐĐ không theo phân phối chuẩn
LNG<- as.data.frame(MPNN$STTCDD)
shapiro.test(MPNN$STTCDD)
##
## Shapiro-Wilk normality test
##
## data: MPNN$STTCDD
## W = 0.94506, p-value = 2.159e-10
Vì p_value= 2.444e-09 < 5% nên bác bỏ giả thuyết HO chấp nhận H1, nghĩa là STTCĐĐ không
theo phân phối chuẩn
hist(MPNN$TSTT)
Kiểm định phân phối chuẩn
Gỉa thuyết:
H0: TSTT theo phân phối chuẩn
H1: TSTT không theo phân phối chuẩn
LNG<- as.data.frame(MPNN$TSTT)
shapiro.test(MPNN$TSTT)
##
## Shapiro-Wilk normality test
##
## data: MPNN$TSTT
## W = 0.95152, p-value = 1.377e-09
Vì p_value= 1.4113e-09 < 5% nên bác bỏ giả thuyết HO chấp nhận H1, nghĩa là TSTT không
theo phân phối chuẩn
hist(MPNN$TSHK)
Kiểm định phân phối chuẩn
Gỉa thuyết:
H0: TSHK theo phân phối chuẩn
H1: TSHK không theo phân phối chuẩn
LNG<- as.data.frame(MPNN$TSHK)
shapiro.test(MPNN$TSHK)
##
## Shapiro-Wilk normality test
##
## data: MPNN$TSHK
## W = 0.93352, p-value = 1.087e-11
Vì p_value= 1.703e-10 < 5% nên bác bỏ giả thuyết HO chấp nhận H1, nghĩa là TSHK không
theo phân phối chuẩn
hist(MPNN$TSTQ)
Kiểm định phân phối chuẩn
Gỉa thuyết:
H0: TSTQ theo phân phối chuẩn
H1: TSTQ không theo phân phối chuẩn
LNG<- as.data.frame(MPNN$TSTQ)
shapiro.test(MPNN$TSTQ)
##
## Shapiro-Wilk normality test
##
## data: MPNN$TSTQ
## W = 0.94902, p-value = 6.619e-10
Vì p_value= 6.888e-09 < 5% nên bác bỏ giả thuyết HO chấp nhận H1, nghĩa là TSTQ không
theo phân phối chuẩn
hist(MPNN$TV)
Kiểm định phân phối chuẩn
Gỉa thuyết:
H0: TV theo phân phối chuẩn
H1: TV không theo phân phối chuẩn
LNG<- as.data.frame(MPNN$TV)
shapiro.test(MPNN$TV)
##
## Shapiro-Wilk normality test
##
## data: MPNN$TV
## W = 0.96072, p-value = 2.558e-08
Vì p_value= 5.267e-09 < 5% nên bác bỏ giả thuyết HO chấp nhận H1, nghĩa là TV không
theo phân phối chuẩn
hist(MPNN$CF)
Kiểm định phân phối chuẩn
Gỉa thuyết:
H0: CF theo phân phối chuẩn
H1: CF không theo phân phối chuẩn
LNG<- as.data.frame(MPNN$CF)
shapiro.test(MPNN$CF)
##
## Shapiro-Wilk normality test
##
## data: MPNN$CF
## W = 0.95637, p-value = 6.15e-09
Vì p_value= 6.88e-11 < 5% nên bác bỏ giả thuyết HO chấp nhận H1, nghĩa là CF không
theo phân phối chuẩn
Doanh thu = Đơn giá*Số lượng
\[Doanhthu= ĐG*SL_{STTCDD} + ĐG*SL_{TSTT}+ĐG*SL_{TSHK} + ĐG*SL_{TSTQ} + ĐG*SL_{TV} +ĐG*SL_{CF}\]
Mô hình cụ thể như sau:
\[Doanhthu= 35.000*SL_{STTCDD} + 25.000*SL_{TSTT} + 30.000*SL_{TSHK} + 35.000*SL_{TSTQ} + 35.000*SL_{TV} +20.000*SL_{CF}\]
DT <- 35.000*(MPNN$STTCDD) + 25.000*(MPNN$TSTT) + 30.000*(MPNN$TSHK) + 35.000*(MPNN$TSTQ) + 35.000*(MPNN$TV) +20.000*(MPNN$CF)
summary(DT)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 590 1735 2065 2072 2445 3215
Biến doanh thu (DT) được tính trong ngày nằm khoảng [590;3215]
Dựa vào bảng thống kê mô tả, ước lượng doanh thu của quán như sau:
Doanh thu thấp sẽ dưới 2.065.000đ/ ngày
Doanh thu cao từ 2.065.000đ/ ngày
DTthap <- DT[DT <= 2065000]
DTcao <- DT[DT < 2065000]
table(cut(DT,breaks = 2))
##
## (587,1.9e+03] (1.9e+03,3.22e+03]
## 136 229
table(cut(DT,2, labels = c('thap','cao')))
##
## thap cao
## 136 229
Từ kết quả trên, Doanh thu của 365 ngày của quán Thái Phúc Tea gồm có 136 ngày doanh thu thấp và 229 ngày doanh thu cao.
library(ggpubr)
## Warning: package 'ggpubr' was built under R version 4.3.1
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.3.1
# Kiểm định phân phối chuẩn
hist(DT, col="orange")
Đặt giả thuyết:
H0: biến DT có phân phối chuẩn
H1: biến DT không có phân phối chuẩn
shapiro.test(DT)
##
## Shapiro-Wilk normality test
##
## data: DT
## W = 0.99451, p-value = 0.2157
Vì p_value = 0.2157 > 0.05 nên chưa đủ cơ sở bác bỏ H0, nghĩa là biến DT có phân phối chuẩn
Vì DT theo phân phối chuẩn, nên tiến hành mô phỏng doanh thu trong 365 ngày tới.
sd(DT)
## [1] 507.9133
set.seed(123)
DT1 <- rnorm(n= 10000, mean= 2072 ,sd= 507)
hist(DT1, main = "phân phối chuẩn biến doanh thu", xlab = "DT1", col = "darkblue")
ggqqplot(DT1,col="red")
summary(DT1)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 122.4 1733.3 2066.4 2070.8 2413.4 4022.8
Doanh thu trong 10000 tới dao động trong khoảng [122.4;4022.8]
DTthap1 <- DT1[DT1 <= 2070000]
DTcao1 <- DT1[DT1> 2070000]
table(cut(DT1,breaks = 2))
##
## (119,2.07e+03] (2.07e+03,4.03e+03]
## 5048 4952
table(cut(DT1,2, labels = c('thap','cao')))
##
## thap cao
## 5048 4952
Kết quả mô phỏng cho thấy 10000 ngày tới có 5048 ngày doanh thu thấp và 4952 ngày doanh thu cao. Kết quả này chủ quán kinh doanh phải xem xét để cân đối được doanh thu cao nhiều hơn để duy trì quán