BTVN MÔ PHỎNG ÍT NHẤT 5 BIẾN NGẪU NHIÊN (CÓ PHÂN PHỐI XÁC SUẤT KHÁC NHAU), MÔ PHỎNG, VẼ ĐỒ THỊ, TÍNH TOÁN CÁC ĐẶC TRƯNG ĐO LƯỜNG VÀ GIẢI THÍCH Ý NGHĨA
a <- rbinom (200, size = 50, prob = .25)
hist(rbinom(200, size = 50, prob = .25))
summary(a)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5.00 10.00 12.00 12.31 14.25 20.00
b <- rpois (200, lambda = 5)
hist(rpois(200, lambda = 5))
summary(b)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 3.00 5.00 4.91 6.00 12.00
c <- runif( n = 200, min = 15, max = 35)
hist(runif( n = 200, min = 15, max = 35))
summary(c)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 15.09 19.57 24.80 24.94 30.47 34.98
d <- rnorm( n = 115, mean = 100, sd = 15)
hist(rnorm( n = 115, mean = 100, sd = 15))
summary(d)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 61.45 89.27 99.70 99.30 110.06 143.73
e <- rbeta (n = 200, shape1 = 50, shape2 = 100)
hist(rbeta (n = 200, shape1 = 50, shape2 = 100))
summary(e)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.2477 0.3072 0.3316 0.3347 0.3638 0.4410
Đề Chọn và giải thích về đối tượng (vấn đề) cần mô phỏng( có ít nhất 6 biến ngẫu nhiên đầu vào).
Sau khi hoạt động vài năm trên thị trường cửa hàng đã bán rất tốt trong hoạt động kinh doanh và doanh thu. Do đó cửa hàng sẽ kiểm tra và thống kê lại doanh thu qua từng năm
Menu chính của cửa hàng: Mì xào giòn, cơm gà xối mỡ, cơm chiên cá mặm, cơm chiên dương châu;cơm bò xào,(trà đá, sữa đậu nành)
Tên chi tiết: Mì xào giòn 111- Vạn kiếp
Địa chỉ cụ thể: 111 Vạn Kiếp, Phường 3, Bình Thạnh, Thành phố Hồ Chí Minh, Việt Nam
Phân loại: món ăn nhỏ
website: https://www.foody.vn/ho-chi-minh/bot-chien-khoai-mon-van-kiep
Mì xào giòn:50.000
Cơm xào bò 50.000
Cơm chiên cá mặn 50.000
Cơm chiên dương châu 50.000
Trà đá 2.000
Sữa đậu nành 10.000
MXG: dữ liệu món mì xào giòn bán trong 1 ngày
CBX: dữ liệu món cơm bò xào bán trong 1 ngày
CCDC: dữ liệu món cơm chiên dương châu bán trong 1 ngày
CGXM: dữ liệu món cơm gà xối mỡ bán trong 1 ngày
MXHS: dữ liệu món mì xào hải sản bán trong 1 ngày
TĐ:dữ liệu trà đá bán trong 1 ngày
SĐN:dữ liệu sữa đậu nành bán trong 1 ngày
library(readxl)
mxg <- read_excel("D:/mxg.xlsx")
View(mxg)
mxg
## # A tibble: 365 × 9
## STT MXG CBX CCDC CCCM CGXM MXHS TĐ SĐN
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 35 23 28 30 10 18 105 66
## 2 2 40 22 35 25 27 24 121 62
## 3 3 38 20 26 28 24 15 139 52
## 4 4 34 25 23 28 11 15 105 67
## 5 5 36 29 23 28 25 20 118 59
## 6 6 33 26 33 26 28 23 108 63
## 7 7 30 27 20 25 20 28 141 63
## 8 8 32 24 29 26 10 27 148 67
## 9 9 31 28 30 30 20 15 107 51
## 10 10 30 26 20 30 15 17 134 51
## # ℹ 355 more rows
Doanh thu = số lượng * Đơn giá
ĐG1: 50.000 đồng/dĩa mì xào giòn
ĐG2: 50.000 đồng/dĩa cơm xào bò
ĐG3: 50.000 đồng/ dĩa Cơm chiên dươn châu
ĐG3: 50.000 đồng/ Cơm chiên cá mặn
ĐG4: 50.00 đồng/Cơm gà xối mỡ
ĐG5: 50.000 đồng/Mì xào hải sản
ĐG6: 2.000 đồng/ly trà đá
ĐG7: 10.000 đồng/ly sữa đậu nành
Tôm sú: 250.000/kg
Mực: 350.000/kg
cá viên 100.000/kg
thịt bò đùi: 215.000/kg
cà rốt: 20.000/kg
lạp xưởng: 160.000kg
đậu que: 20.000/kg
cá mặm: 75.000/kg
đùi gà: 90.000/kg
đậu nành: 50.00/kg
summary(mxg)
## STT MXG CBX CCDC CCCM
## Min. : 1 Min. :12.0 Min. :20.00 Min. :20.00 Min. :25.00
## 1st Qu.: 92 1st Qu.:31.0 1st Qu.:22.00 1st Qu.:23.00 1st Qu.:26.00
## Median :183 Median :34.0 Median :24.00 Median :26.00 Median :27.00
## Mean :183 Mean :33.7 Mean :24.43 Mean :26.64 Mean :27.42
## 3rd Qu.:274 3rd Qu.:36.0 3rd Qu.:27.00 3rd Qu.:30.00 3rd Qu.:29.00
## Max. :365 Max. :60.0 Max. :29.00 Max. :36.00 Max. :30.00
## CGXM MXHS TĐ SĐN
## Min. :10.00 Min. :15.00 Min. :100.0 Min. :50.00
## 1st Qu.:14.00 1st Qu.:19.00 1st Qu.:113.0 1st Qu.:55.00
## Median :20.00 Median :23.00 Median :128.0 Median :60.00
## Mean :19.77 Mean :22.95 Mean :126.4 Mean :59.92
## 3rd Qu.:25.00 3rd Qu.:27.00 3rd Qu.:140.0 3rd Qu.:65.00
## Max. :30.00 Max. :30.00 Max. :150.0 Max. :70.00
library(fBasics)
## Warning: package 'fBasics' was built under R version 4.3.1
basicStats(mxg$MXG)
## X..mxg.MXG
## nobs 365.000000
## NAs 0.000000
## Minimum 12.000000
## Maximum 60.000000
## 1. Quartile 31.000000
## 3. Quartile 36.000000
## Mean 33.704110
## Median 34.000000
## Sum 12302.000000
## SE Mean 0.261569
## LCL Mean 33.189734
## UCL Mean 34.218485
## Variance 24.972648
## Stdev 4.997264
## Skewness 0.015860
## Kurtosis 4.663792
Vẽ đồ thị histogram
hist(mxg$MXG)
Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test
Giả thuyết:
\(H_0\): MXG tuân theo phân phối chuẩn
\(H_1\): MGX không tuân theo phân phối chuẩn
shapiro.test(mxg$MXG)
##
## Shapiro-Wilk normality test
##
## data: mxg$MXG
## W = 0.89648, p-value = 4.857e-15
Nhìn vào p-value = 4.857e-15 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến MXG không tuân theo luật phân phối chuẩn.
Kiểm định phân phối loga chuẩn
Giả thuyết:
\(H_0\): MXG tuân theo phân phối loga chuẩn
\(H_1\): MXG không tuân theo phân phối Loga chuẩn
ks.test(mxg$MXG, "plnorm")
## Warning in ks.test.default(mxg$MXG, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$MXG
## D = 0.99589, p-value < 2.2e-16
## alternative hypothesis: two-sided
vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến MXG không có phân phối loga chuẩn
Kiểm định phân phối mũ
Giả thuyết:
\(H_0\): MXG tuân theo phân phối mũ
\(H_1\): MXG không tuân theo phân phối mũ
ks.test(mxg$MXG, y = "pexp")
## Warning in ks.test.default(mxg$MXG, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$MXG
## D = 0.99999, p-value < 2.2e-16
## alternative hypothesis: two-sided
Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số MXG không có phân phối mũ.
library(fBasics)
basicStats(mxg$CBX)
## X..mxg.CBX
## nobs 365.000000
## NAs 0.000000
## Minimum 20.000000
## Maximum 29.000000
## 1. Quartile 22.000000
## 3. Quartile 27.000000
## Mean 24.427397
## Median 24.000000
## Sum 8916.000000
## SE Mean 0.148891
## LCL Mean 24.134602
## UCL Mean 24.720193
## Variance 8.091555
## Stdev 2.844566
## Skewness 0.076302
## Kurtosis -1.171885
Vẽ đồ thị histogram
hist(mxg$CBX)
Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test
Giả thuyết:
\(H_0\): CBX tuân theo phân phối chuẩn
\(H_1\): CBX không tuân theo phân phối chuẩn
shapiro.test(mxg$CBX)
##
## Shapiro-Wilk normality test
##
## data: mxg$CBX
## W = 0.93778, p-value = 3.146e-11
Nhìn vào p-value = 3.146e-11 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CBX không tuân theo luật phân phối chuẩn.
Kiểm định phân phối loga chuẩn
Giả thuyết:
\(H_0\): CBX tuân theo phân phối loga chuẩn
\(H_1\): CBX không tuân theo phân phối Loga chuẩn
ks.test(mxg$CBX, "plnorm")
## Warning in ks.test.default(mxg$CBX, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$CBX
## D = 0.99863, p-value < 2.2e-16
## alternative hypothesis: two-sided
vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CBX không có phân phối loga chuẩn
Kiểm định phân phối mũ
Giả thuyết:
\(H_0\): CBX tuân theo phân phối mũ
\(H_1\): CBX không tuân theo phân phối mũ
ks.test(mxg$CBX, y = "pexp")
## Warning in ks.test.default(mxg$CBX, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$CBX
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số CBX không có phân phối mũ.
library(fBasics)
basicStats(mxg$CCDC)
## X..mxg.CCDC
## nobs 365.000000
## NAs 0.000000
## Minimum 20.000000
## Maximum 36.000000
## 1. Quartile 23.000000
## 3. Quartile 30.000000
## Mean 26.641096
## Median 26.000000
## Sum 9724.000000
## SE Mean 0.240396
## LCL Mean 26.168357
## UCL Mean 27.113834
## Variance 21.093361
## Stdev 4.592751
## Skewness 0.284697
## Kurtosis -1.112352
Vẽ đồ thị histogram
hist(mxg$CCDC)
Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test
Giả thuyết:
\(H_0\): CCDC tuân theo phân phối chuẩn
\(H_1\): CCDC không tuân theo phân phối chuẩn
shapiro.test(mxg$CCDC)
##
## Shapiro-Wilk normality test
##
## data: mxg$CCDC
## W = 0.94045, p-value = 6.259e-11
Nhìn vào p-value = 6.259e-11 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CCDC không tuân theo luật phân phối chuẩn.
Kiểm định phân phối loga chuẩn
Giả thuyết:
\(H_0\): CCDC tuân theo phân phối loga chuẩn
\(H_1\): CCDC không tuân theo phân phối Loga chuẩn
ks.test(mxg$CCDC, "plnorm")
## Warning in ks.test.default(mxg$CCDC, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$CCDC
## D = 0.99863, p-value < 2.2e-16
## alternative hypothesis: two-sided
vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CCDC không có phân phối loga chuẩn
Kiểm định phân phối mũ
Giả thuyết:
\(H_0\): CCDC tuân theo phân phối mũ
\(H_1\): CCDC không tuân theo phân phối mũ
ks.test(mxg$CCDC, y = "pexp")
## Warning in ks.test.default(mxg$CCDC, y = "pexp"): ties should not be present
## for the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$CCDC
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số CCDC không có phân phối mũ.
library(fBasics)
basicStats(mxg$CCCM)
## X..mxg.CCCM
## nobs 365.000000
## NAs 0.000000
## Minimum 25.000000
## Maximum 30.000000
## 1. Quartile 26.000000
## 3. Quartile 29.000000
## Mean 27.416438
## Median 27.000000
## Sum 10007.000000
## SE Mean 0.092252
## LCL Mean 27.235024
## UCL Mean 27.597853
## Variance 3.106322
## Stdev 1.762476
## Skewness 0.082589
## Kurtosis -1.331734
Vẽ đồ thị histogram
hist(mxg$CCCM)
Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test
Giả thuyết:
\(H_0\): CCCM tuân theo phân phối chuẩn
\(H_1\): CCCM không tuân theo phân phối chuẩn
shapiro.test(mxg$CCCM)
##
## Shapiro-Wilk normality test
##
## data: mxg$CCCM
## W = 0.89604, p-value = 4.486e-15
Nhìn vào p-value = 4.486e-15 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CCCM không tuân theo luật phân phối chuẩn.
Kiểm định phân phối loga chuẩn
Giả thuyết:
\(H_0\): CCCM tuân theo phân phối loga chuẩn
\(H_1\): CCCM không tuân theo phân phối Loga chuẩn
ks.test(mxg$CCCM, "plnorm")
## Warning in ks.test.default(mxg$CCCM, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$CCCM
## D = 0.99936, p-value < 2.2e-16
## alternative hypothesis: two-sided
vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CCCM không có phân phối loga chuẩn
Kiểm định phân phối mũ
Giả thuyết:
\(H_0\): CCCM tuân theo phân phối mũ
\(H_1\): CCCM không tuân theo phân phối mũ
ks.test(mxg$CCCM, y = "pexp")
## Warning in ks.test.default(mxg$CCCM, y = "pexp"): ties should not be present
## for the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$CCCM
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số CCCM không có phân phối mũ.
library(fBasics)
basicStats(mxg$CGXM)
## X..mxg.CGXM
## nobs 365.000000
## NAs 0.000000
## Minimum 10.000000
## Maximum 30.000000
## 1. Quartile 14.000000
## 3. Quartile 25.000000
## Mean 19.769863
## Median 20.000000
## Sum 7216.000000
## SE Mean 0.323693
## LCL Mean 19.133320
## UCL Mean 20.406406
## Variance 38.243595
## Stdev 6.184141
## Skewness 0.023116
## Kurtosis -1.262577
Vẽ đồ thị histogram
hist(mxg$CGXM)
Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test
Giả thuyết:
\(H_0\): CGXM tuân theo phân phối chuẩn
\(H_1\): CGXM không tuân theo phân phối chuẩn
shapiro.test(mxg$CGXM)
##
## Shapiro-Wilk normality test
##
## data: mxg$CGXM
## W = 0.94251, p-value = 1.08e-10
Nhìn vào p-value = 1.08e-10 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CGXM không tuân theo luật phân phối chuẩn.
Kiểm định phân phối loga chuẩn
Giả thuyết:
\(H_0\): CGXM tuân theo phân phối loga chuẩn
\(H_1\): CGXM không tuân theo phân phối Loga chuẩn
ks.test(mxg$CGXM, "plnorm")
## Warning in ks.test.default(mxg$CGXM, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$CGXM
## D = 0.98935, p-value < 2.2e-16
## alternative hypothesis: two-sided
vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CGXM không có phân phối loga chuẩn
Kiểm định phân phối mũ
Giả thuyết:
\(H_0\): CGXM tuân theo phân phối mũ
\(H_1\): CGXM không tuân theo phân phối mũ
ks.test(mxg$CGXM, y = "pexp")
## Warning in ks.test.default(mxg$CGXM, y = "pexp"): ties should not be present
## for the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$CGXM
## D = 0.99995, p-value < 2.2e-16
## alternative hypothesis: two-sided
Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số CCDC không có phân phối mũ.
library(fBasics)
basicStats(mxg$MXHS)
## X..mxg.MXHS
## nobs 365.000000
## NAs 0.000000
## Minimum 15.000000
## Maximum 30.000000
## 1. Quartile 19.000000
## 3. Quartile 27.000000
## Mean 22.947945
## Median 23.000000
## Sum 8376.000000
## SE Mean 0.236609
## LCL Mean 22.482653
## UCL Mean 23.413237
## Variance 20.434096
## Stdev 4.520409
## Skewness -0.119157
## Kurtosis -1.157235
Vẽ đồ thị histogram
hist(mxg$MXHS)
Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test
Giả thuyết:
\(H_0\): MXHS tuân theo phân phối chuẩn
\(H_1\): MXHS không tuân theo phân phối chuẩn
shapiro.test(mxg$MXHS)
##
## Shapiro-Wilk normality test
##
## data: mxg$MXHS
## W = 0.94937, p-value = 7.318e-10
Nhìn vào p-value = 7.318e-10 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến MXHS không tuân theo luật phân phối chuẩn.
Kiểm định phân phối loga chuẩn
Giả thuyết:
\(H_0\): MXHS tuân theo phân phối loga chuẩn
\(H_1\): MXHS không tuân theo phân phối Loga chuẩn
ks.test(mxg$MXHS, "plnorm")
## Warning in ks.test.default(mxg$MXHS, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$MXHS
## D = 0.99662, p-value < 2.2e-16
## alternative hypothesis: two-sided
vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến MXHS không có phân phối loga chuẩn
Kiểm định phân phối mũ
Giả thuyết:
\(H_0\): MXHS tuân theo phân phối mũ
\(H_1\): MXHS không tuân theo phân phối mũ
ks.test(mxg$MXHS, y = "pexp")
## Warning in ks.test.default(mxg$MXHS, y = "pexp"): ties should not be present
## for the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$MXHS
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số MXHS không có phân phối mũ.
library(fBasics)
basicStats(mxg$TĐ)
## X..mxg.TĐ
## nobs 365.000000
## NAs 0.000000
## Minimum 100.000000
## Maximum 150.000000
## 1. Quartile 113.000000
## 3. Quartile 140.000000
## Mean 126.443836
## Median 128.000000
## Sum 46152.000000
## SE Mean 0.796992
## LCL Mean 124.876549
## UCL Mean 128.011122
## Variance 231.846425
## Stdev 15.226504
## Skewness -0.143226
## Kurtosis -1.252421
Vẽ đồ thị histogram
hist(mxg$TĐ)
Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test
Giả thuyết:
\(H_0\): TĐ tuân theo phân phối chuẩn
\(H_1\): TĐ không tuân theo phân phối chuẩn
shapiro.test(mxg$TĐ)
##
## Shapiro-Wilk normality test
##
## data: mxg$TĐ
## W = 0.9428, p-value = 1.168e-10
Nhìn vào p-value = 1.168e-10 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến TĐ không tuân theo luật phân phối chuẩn.
Kiểm định phân phối loga chuẩn
Giả thuyết:
\(H_0\): TĐ tuân theo phân phối loga chuẩn
\(H_1\): TĐ không tuân theo phân phối Loga chuẩn
ks.test(mxg$TĐ, "plnorm")
## Warning in ks.test.default(mxg$TĐ, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$TĐ
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến TĐ không có phân phối loga chuẩn
Kiểm định phân phối mũ
Giả thuyết:
\(H_0\): TĐ tuân theo phân phối mũ
\(H_1\): TĐ không tuân theo phân phối mũ
ks.test(mxg$TĐ, y = "pexp")
## Warning in ks.test.default(mxg$TĐ, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$TĐ
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số TĐ không có phân phối mũ.
library(fBasics)
basicStats(mxg$SĐN)
## X..mxg.SĐN
## nobs 365.000000
## NAs 0.000000
## Minimum 50.000000
## Maximum 70.000000
## 1. Quartile 55.000000
## 3. Quartile 65.000000
## Mean 59.915068
## Median 60.000000
## Sum 21869.000000
## SE Mean 0.312617
## LCL Mean 59.300305
## UCL Mean 60.529832
## Variance 35.671338
## Stdev 5.972549
## Skewness -0.019655
## Kurtosis -1.212226
Vẽ đồ thị histogram
hist(mxg$SĐN)
Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test
Giả thuyết:
\(H_0\): SĐN tuân theo phân phối chuẩn
\(H_1\): SĐN không tuân theo phân phối chuẩn
shapiro.test(mxg$SĐN)
##
## Shapiro-Wilk normality test
##
## data: mxg$SĐN
## W = 0.95072, p-value = 1.085e-09
Nhìn vào p-value = 1.168e-10 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến TĐ không tuân theo luật phân phối chuẩn.
Kiểm định phân phối loga chuẩn
Giả thuyết:
\(H_0\): SĐN tuân theo phân phối loga chuẩn
\(H_1\): SĐN không tuân theo phân phối Loga chuẩn
ks.test(mxg$SĐN, "plnorm")
## Warning in ks.test.default(mxg$SĐN, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$SĐN
## D = 0.99995, p-value < 2.2e-16
## alternative hypothesis: two-sided
vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến SĐN không có phân phối loga chuẩn
Kiểm định phân phối mũ
Giả thuyết:
\(H_0\): SĐN tuân theo phân phối mũ
\(H_1\): SĐN không tuân theo phân phối mũ
ks.test(mxg$SĐN, y = "pexp")
## Warning in ks.test.default(mxg$SĐN, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: mxg$SĐN
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số SĐN không có phân phối mũ.
Đề: Xây dựng mô hình cho đối tượng cần mô phỏng và giải thích mô hình.
\(Doanh thu = ĐG.SL\)
library(readxl)
hn <- read_excel("D:/hn.xlsx")
View(hn)
Giải thích biến
các biến DTMXG DTCBX DTCCDC DTCCCM DTCGXC DTMXHS DTSĐN DTTĐ lần lượt là doanh thu hàng ngày của tiệm mì
library(readxl)
MXG1 <- read_excel("D:/MXG1.xlsx")
View(MXG1)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.1
library(scales)
## Warning: package 'scales' was built under R version 4.3.1
ggplot(data = MXG1, aes(x = DT)) +
geom_histogram ( fill = "lightblue", col = 'black') +
labs(x = "Doanh thu",
y = "",
title = "Biểu đồ Doanh thu của quán mxg") +
scale_x_continuous(labels = comma)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
hist(MXG1$DT, col = 'lightblue')
summary(MXG1$DT)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 7202000 8280000 8596000 8597381 8966000 10348000
library(fBasics)
basicStats(MXG1$DT)
## X..MXG1.DT
## nobs 3.650000e+02
## NAs 0.000000e+00
## Minimum 7.202000e+06
## Maximum 1.034800e+07
## 1. Quartile 8.280000e+06
## 3. Quartile 8.966000e+06
## Mean 8.597381e+06
## Median 8.596000e+06
## Sum 3.138044e+09
## SE Mean 2.744132e+04
## LCL Mean 8.543417e+06
## UCL Mean 8.651344e+06
## Variance 2.748545e+11
## Stdev 5.242657e+05
## Skewness -4.584000e-02
## Kurtosis 1.662400e-01
Vẽ đồ thị histogram
hist(MXG1$DT)
Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test
Giả thuyết:
\(H_0\): DT tuân theo phân phối chuẩn
\(H_1\): DT không tuân theo phân phối chuẩn
shapiro.test(MXG1$DT)
##
## Shapiro-Wilk normality test
##
## data: MXG1$DT
## W = 0.99346, p-value = 0.115
Nhìn vào p-value = 0.115 > 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến DT tuân theo luật phân phối chuẩn.
Kiểm định phân phối mũ
Giả thuyết:
\(H_0\): DT tuân theo phân phối mũ
\(H_1\): DT không tuân theo phân phối mũ
ks.test(MXG1$DT, y = "pexp")
## Warning in ks.test.default(MXG1$DT, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: MXG1$DT
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số DT không có phân phối mũ.
library("psych")
## Warning: package 'psych' was built under R version 4.3.1
##
## Attaching package: 'psych'
## The following objects are masked from 'package:scales':
##
## alpha, rescale
## The following objects are masked from 'package:ggplot2':
##
## %+%, alpha
## The following object is masked from 'package:fBasics':
##
## tr
library(readxl)
MXG1 <- read_excel("D:/MXG1.xlsx")
describe(MXG1)
## vars n mean sd median trimmed mad min max
## STT 1 365 183 105.51 183 183 134.92 1 365
## DT 2 365 8597381 524265.70 8596000 8608116 521875.20 7202000 10348000
## range skew kurtosis se
## STT 364 0.00 -1.21 5.52
## DT 3146000 -0.05 0.17 27441.32
MXG = mxg$MXG
CBX = mxg$CBX
CCDC = mxg$CCDC
CCCM = mxg$CCCM
CGXM = mxg$CGXM
MXHS = mxg$MXHS
TĐ = mxg$TĐ
SĐN = mxg$SĐN
Dthu <- 50000 * MXG + 50000 * CBX +50000 * CCDC + 50000 * CCCM + 50000 * CGXM + 50000 * MXHS + 2000 * TĐ + 10000 * SĐN
summary(Dthu)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 7202000 8280000 8596000 8597381 8966000 10348000
Biến doanh thu (DT) trong khoảng [8966000;10348000]
Doanh thu thấp sẽ dưới 7.500.000đ trên 1 ngày
Doanh thu vừa sẽ từ 7.500.000đ đến 9.500.000đ trên 1 ngày
Doanh thu cao sẽ từ 9.500.000 đồng trở lên trên 1 ngày
DTthap <- Dthu[Dthu < 7500000]
DTvua <- Dthu[Dthu > 7500000 & Dthu <= 9500000]
DTcao <- Dthu[Dthu > 9500000]
table(cut(Dthu,breaks = 3))
##
## (7.2e+06,8.25e+06] (8.25e+06,9.3e+06] (9.3e+06,1.04e+07]
## 88 248 29
table(cut(Dthu,3, labels = c('thap','vua','cao')))
##
## thap vua cao
## 88 248 29
library(pastecs)
## Warning: package 'pastecs' was built under R version 4.3.1
stat.desc(Dthu)
## nbr.val nbr.null nbr.na min max range
## 3.650000e+02 0.000000e+00 0.000000e+00 7.202000e+06 1.034800e+07 3.146000e+06
## sum median mean SE.mean CI.mean.0.95 var
## 3.138044e+09 8.596000e+06 8.597381e+06 2.744132e+04 5.396343e+04 2.748545e+11
## std.dev coef.var
## 5.242657e+05 6.097970e-02
có 365 giá trị doanh thu
doanh thu có giá trị biến thiên nhất là 3.146.000
Tổng doanh thu của quán mì xào giòn là 3.138044e+09
Trung bình cộng doanh thu quán là 8.596000e+06
Doanh thu nhỏ nhất trong quán là 7.202000e+06 doanh thu lớn nhất tại quán là 1.034800e+07
Trung bình cộng doanh thu của quán là 8.596000e+06 đồng, tức là nếu chia tổng doanh thu cho số lượng giá trị, thì sẽ được kết quả này.
Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test
Giả thuyết:
\(H_0\): Dthu tuân theo phân phối chuẩn
\(H_1\): Dthu không tuân theo phân phối chuẩn
shapiro.test(Dthu)
##
## Shapiro-Wilk normality test
##
## data: Dthu
## W = 0.99346, p-value = 0.115
Nhìn vào p-value = 0.115 > 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến DT tuân theo luật phân phối chuẩn.
Kiểm định phân phối mũ
Giả thuyết:
\(H_0\): Dthu tuân theo phân phối mũ
\(H_1\): Dthu không tuân theo phân phối mũ
ks.test(Dthu, y = "pexp")
## Warning in ks.test.default(Dthu, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: Dthu
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided
Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số DT không có phân phối mũ.
library(ggpubr)
## Warning: package 'ggpubr' was built under R version 4.3.1
L <- runif(n=365,min = 7202000,max = 10348000)
hist(L, main = "phân phối đều biến doanh thu", xlab = "L", col = "skyblue")
summary(L)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 7204542 7942627 8724385 8744334 9563044 10343313
PHÂN PHỐI CHUẨN
D <- rnorm( n = 365, mean = 8597381, sd = 524265.70)
hist(D, main = "phân phối đều biến doanh thu", xlab = "L", col = "skyblue")
summary(D)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 7012761 8237097 8592221 8610876 9007460 10426685
DTthap1 <- L[L < 7500000]
DTvua2 <- L[L > 7500000 & Dthu <= 9500000]
DTcao3 <- L[L > 9500000]
table(cut(L,breaks = 3))
##
## (7.2e+06,8.25e+06] (8.25e+06,9.3e+06] (9.3e+06,1.03e+07]
## 131 111 123
table(cut(L,3, labels = c('thap','vua','cao')))
##
## thap vua cao
## 131 111 123
Tử bảng ta thấy có 126 ngày có doanh thu thấp 122 ngày có doanh thu vừa và 117 ngày có doanh thu cao