1 Bài tập về nhà tuần 1

BTVN MÔ PHỎNG ÍT NHẤT 5 BIẾN NGẪU NHIÊN (CÓ PHÂN PHỐI XÁC SUẤT KHÁC NHAU), MÔ PHỎNG, VẼ ĐỒ THỊ, TÍNH TOÁN CÁC ĐẶC TRƯNG ĐO LƯỜNG VÀ GIẢI THÍCH Ý NGHĨA

1.1 PHÂN PHÔI NHỊ THỨC ÂM

a <- rbinom (200, size = 50, prob = .25)
hist(rbinom(200, size = 50, prob = .25))

summary(a)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5.00   10.00   12.00   12.31   14.25   20.00

1.2 PHÂN PHỐI POISSON

b <- rpois (200, lambda = 5)
hist(rpois(200, lambda = 5))

summary(b)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    3.00    5.00    4.91    6.00   12.00

1.3 PHÂN PHỐI ĐỀU LIÊN TỤC

c <- runif( n = 200, min = 15, max = 35)
hist(runif( n = 200, min = 15, max = 35))

summary(c)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   15.09   19.57   24.80   24.94   30.47   34.98

1.4 PHÂN PHỐI CHUẨN

d <- rnorm( n = 115, mean = 100, sd = 15)
hist(rnorm( n = 115, mean = 100, sd = 15))

summary(d)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   61.45   89.27   99.70   99.30  110.06  143.73

1.5 PHÂN PHỐI BETA

e <- rbeta (n = 200, shape1 = 50, shape2 = 100)
hist(rbeta (n = 200, shape1 = 50, shape2 = 100))

summary(e)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.2477  0.3072  0.3316  0.3347  0.3638  0.4410

2 Bài tập về nhà tuần 2

Đề Chọn và giải thích về đối tượng (vấn đề) cần mô phỏng( có ít nhất 6 biến ngẫu nhiên đầu vào).

2.1 Đặt vấn đề

Sau khi hoạt động vài năm trên thị trường cửa hàng đã bán rất tốt trong hoạt động kinh doanh và doanh thu. Do đó cửa hàng sẽ kiểm tra và thống kê lại doanh thu qua từng năm

Menu chính của cửa hàng: Mì xào giòn, cơm gà xối mỡ, cơm chiên cá mặm, cơm chiên dương châu;cơm bò xào,(trà đá, sữa đậu nành)

Tên chi tiết: Mì xào giòn 111- Vạn kiếp

Địa chỉ cụ thể: 111 Vạn Kiếp, Phường 3, Bình Thạnh, Thành phố Hồ Chí Minh, Việt Nam

Phân loại: món ăn nhỏ

website: https://www.foody.vn/ho-chi-minh/bot-chien-khoai-mon-van-kiep

2.2 Đơn giá

Mì xào giòn:50.000

Cơm xào bò 50.000

Cơm chiên cá mặn 50.000

Cơm chiên dương châu 50.000

Trà đá 2.000

Sữa đậu nành 10.000

2.3 Dữ liệu nghiên cứu

MXG: dữ liệu món mì xào giòn bán trong 1 ngày

CBX: dữ liệu món cơm bò xào bán trong 1 ngày

CCDC: dữ liệu món cơm chiên dương châu bán trong 1 ngày

CGXM: dữ liệu món cơm gà xối mỡ bán trong 1 ngày

MXHS: dữ liệu món mì xào hải sản bán trong 1 ngày

TĐ:dữ liệu trà đá bán trong 1 ngày

SĐN:dữ liệu sữa đậu nành bán trong 1 ngày

2.4 Bảng data dữ liệu

library(readxl)
mxg <- read_excel("D:/mxg.xlsx")
View(mxg)
mxg
## # A tibble: 365 × 9
##      STT   MXG   CBX  CCDC  CCCM  CGXM  MXHS    TĐ   SĐN
##    <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1     1    35    23    28    30    10    18   105    66
##  2     2    40    22    35    25    27    24   121    62
##  3     3    38    20    26    28    24    15   139    52
##  4     4    34    25    23    28    11    15   105    67
##  5     5    36    29    23    28    25    20   118    59
##  6     6    33    26    33    26    28    23   108    63
##  7     7    30    27    20    25    20    28   141    63
##  8     8    32    24    29    26    10    27   148    67
##  9     9    31    28    30    30    20    15   107    51
## 10    10    30    26    20    30    15    17   134    51
## # ℹ 355 more rows

2.5 Dự kiến doanh thu của tiệm mxg

2.5.1 Mô hình nghiên cứu

Doanh thu = số lượng * Đơn giá

2.5.2 Đơn giá

ĐG1: 50.000 đồng/dĩa mì xào giòn

ĐG2: 50.000 đồng/dĩa cơm xào bò

ĐG3: 50.000 đồng/ dĩa Cơm chiên dươn châu

ĐG3: 50.000 đồng/ Cơm chiên cá mặn

ĐG4: 50.00 đồng/Cơm gà xối mỡ

ĐG5: 50.000 đồng/Mì xào hải sản

ĐG6: 2.000 đồng/ly trà đá

ĐG7: 10.000 đồng/ly sữa đậu nành

2.6 Chi phí món ăn

Tôm sú: 250.000/kg

Mực: 350.000/kg

cá viên 100.000/kg

thịt bò đùi: 215.000/kg

cà rốt: 20.000/kg

lạp xưởng: 160.000kg

đậu que: 20.000/kg

cá mặm: 75.000/kg

đùi gà: 90.000/kg

đậu nành: 50.00/kg

2.7 Thống kê mô tả

summary(mxg)
##       STT           MXG            CBX             CCDC            CCCM      
##  Min.   :  1   Min.   :12.0   Min.   :20.00   Min.   :20.00   Min.   :25.00  
##  1st Qu.: 92   1st Qu.:31.0   1st Qu.:22.00   1st Qu.:23.00   1st Qu.:26.00  
##  Median :183   Median :34.0   Median :24.00   Median :26.00   Median :27.00  
##  Mean   :183   Mean   :33.7   Mean   :24.43   Mean   :26.64   Mean   :27.42  
##  3rd Qu.:274   3rd Qu.:36.0   3rd Qu.:27.00   3rd Qu.:30.00   3rd Qu.:29.00  
##  Max.   :365   Max.   :60.0   Max.   :29.00   Max.   :36.00   Max.   :30.00  
##       CGXM            MXHS             TĐ             SĐN       
##  Min.   :10.00   Min.   :15.00   Min.   :100.0   Min.   :50.00  
##  1st Qu.:14.00   1st Qu.:19.00   1st Qu.:113.0   1st Qu.:55.00  
##  Median :20.00   Median :23.00   Median :128.0   Median :60.00  
##  Mean   :19.77   Mean   :22.95   Mean   :126.4   Mean   :59.92  
##  3rd Qu.:25.00   3rd Qu.:27.00   3rd Qu.:140.0   3rd Qu.:65.00  
##  Max.   :30.00   Max.   :30.00   Max.   :150.0   Max.   :70.00

3 Bài tập về nhà tuần 3

3.1 Xác định phân phối của biến

3.1.1 Biến MXG

library(fBasics)
## Warning: package 'fBasics' was built under R version 4.3.1
basicStats(mxg$MXG)
##               X..mxg.MXG
## nobs          365.000000
## NAs             0.000000
## Minimum        12.000000
## Maximum        60.000000
## 1. Quartile    31.000000
## 3. Quartile    36.000000
## Mean           33.704110
## Median         34.000000
## Sum         12302.000000
## SE Mean         0.261569
## LCL Mean       33.189734
## UCL Mean       34.218485
## Variance       24.972648
## Stdev           4.997264
## Skewness        0.015860
## Kurtosis        4.663792

Vẽ đồ thị histogram

hist(mxg$MXG)

Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test

Giả thuyết:

\(H_0\): MXG tuân theo phân phối chuẩn

\(H_1\): MGX không tuân theo phân phối chuẩn

shapiro.test(mxg$MXG)
## 
##  Shapiro-Wilk normality test
## 
## data:  mxg$MXG
## W = 0.89648, p-value = 4.857e-15

Nhìn vào p-value = 4.857e-15 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến MXG không tuân theo luật phân phối chuẩn.

Kiểm định phân phối loga chuẩn

Giả thuyết:

\(H_0\): MXG tuân theo phân phối loga chuẩn

\(H_1\): MXG không tuân theo phân phối Loga chuẩn

ks.test(mxg$MXG, "plnorm")
## Warning in ks.test.default(mxg$MXG, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$MXG
## D = 0.99589, p-value < 2.2e-16
## alternative hypothesis: two-sided

vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến MXG không có phân phối loga chuẩn

Kiểm định phân phối mũ

Giả thuyết:

\(H_0\): MXG tuân theo phân phối mũ

\(H_1\): MXG không tuân theo phân phối mũ

ks.test(mxg$MXG, y = "pexp")
## Warning in ks.test.default(mxg$MXG, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$MXG
## D = 0.99999, p-value < 2.2e-16
## alternative hypothesis: two-sided

Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số MXG không có phân phối mũ.

3.1.2 Biến CBX

library(fBasics)
basicStats(mxg$CBX)
##              X..mxg.CBX
## nobs         365.000000
## NAs            0.000000
## Minimum       20.000000
## Maximum       29.000000
## 1. Quartile   22.000000
## 3. Quartile   27.000000
## Mean          24.427397
## Median        24.000000
## Sum         8916.000000
## SE Mean        0.148891
## LCL Mean      24.134602
## UCL Mean      24.720193
## Variance       8.091555
## Stdev          2.844566
## Skewness       0.076302
## Kurtosis      -1.171885

Vẽ đồ thị histogram

hist(mxg$CBX)

Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test

Giả thuyết:

\(H_0\): CBX tuân theo phân phối chuẩn

\(H_1\): CBX không tuân theo phân phối chuẩn

shapiro.test(mxg$CBX)
## 
##  Shapiro-Wilk normality test
## 
## data:  mxg$CBX
## W = 0.93778, p-value = 3.146e-11

Nhìn vào p-value = 3.146e-11 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CBX không tuân theo luật phân phối chuẩn.

Kiểm định phân phối loga chuẩn

Giả thuyết:

\(H_0\): CBX tuân theo phân phối loga chuẩn

\(H_1\): CBX không tuân theo phân phối Loga chuẩn

ks.test(mxg$CBX, "plnorm")
## Warning in ks.test.default(mxg$CBX, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$CBX
## D = 0.99863, p-value < 2.2e-16
## alternative hypothesis: two-sided

vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CBX không có phân phối loga chuẩn

Kiểm định phân phối mũ

Giả thuyết:

\(H_0\): CBX tuân theo phân phối mũ

\(H_1\): CBX không tuân theo phân phối mũ

ks.test(mxg$CBX, y = "pexp")
## Warning in ks.test.default(mxg$CBX, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$CBX
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided

Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số CBX không có phân phối mũ.

3.1.3 Biến CCDC

library(fBasics)
basicStats(mxg$CCDC)
##             X..mxg.CCDC
## nobs         365.000000
## NAs            0.000000
## Minimum       20.000000
## Maximum       36.000000
## 1. Quartile   23.000000
## 3. Quartile   30.000000
## Mean          26.641096
## Median        26.000000
## Sum         9724.000000
## SE Mean        0.240396
## LCL Mean      26.168357
## UCL Mean      27.113834
## Variance      21.093361
## Stdev          4.592751
## Skewness       0.284697
## Kurtosis      -1.112352

Vẽ đồ thị histogram

hist(mxg$CCDC)

Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test

Giả thuyết:

\(H_0\): CCDC tuân theo phân phối chuẩn

\(H_1\): CCDC không tuân theo phân phối chuẩn

shapiro.test(mxg$CCDC)
## 
##  Shapiro-Wilk normality test
## 
## data:  mxg$CCDC
## W = 0.94045, p-value = 6.259e-11

Nhìn vào p-value = 6.259e-11 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CCDC không tuân theo luật phân phối chuẩn.

Kiểm định phân phối loga chuẩn

Giả thuyết:

\(H_0\): CCDC tuân theo phân phối loga chuẩn

\(H_1\): CCDC không tuân theo phân phối Loga chuẩn

ks.test(mxg$CCDC, "plnorm")
## Warning in ks.test.default(mxg$CCDC, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$CCDC
## D = 0.99863, p-value < 2.2e-16
## alternative hypothesis: two-sided

vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CCDC không có phân phối loga chuẩn

Kiểm định phân phối mũ

Giả thuyết:

\(H_0\): CCDC tuân theo phân phối mũ

\(H_1\): CCDC không tuân theo phân phối mũ

ks.test(mxg$CCDC, y = "pexp")
## Warning in ks.test.default(mxg$CCDC, y = "pexp"): ties should not be present
## for the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$CCDC
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided

Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số CCDC không có phân phối mũ.

3.1.4 Biến CCCM

library(fBasics)
basicStats(mxg$CCCM)
##              X..mxg.CCCM
## nobs          365.000000
## NAs             0.000000
## Minimum        25.000000
## Maximum        30.000000
## 1. Quartile    26.000000
## 3. Quartile    29.000000
## Mean           27.416438
## Median         27.000000
## Sum         10007.000000
## SE Mean         0.092252
## LCL Mean       27.235024
## UCL Mean       27.597853
## Variance        3.106322
## Stdev           1.762476
## Skewness        0.082589
## Kurtosis       -1.331734

Vẽ đồ thị histogram

hist(mxg$CCCM)

Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test

Giả thuyết:

\(H_0\): CCCM tuân theo phân phối chuẩn

\(H_1\): CCCM không tuân theo phân phối chuẩn

shapiro.test(mxg$CCCM)
## 
##  Shapiro-Wilk normality test
## 
## data:  mxg$CCCM
## W = 0.89604, p-value = 4.486e-15

Nhìn vào p-value = 4.486e-15 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CCCM không tuân theo luật phân phối chuẩn.

Kiểm định phân phối loga chuẩn

Giả thuyết:

\(H_0\): CCCM tuân theo phân phối loga chuẩn

\(H_1\): CCCM không tuân theo phân phối Loga chuẩn

ks.test(mxg$CCCM, "plnorm")
## Warning in ks.test.default(mxg$CCCM, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$CCCM
## D = 0.99936, p-value < 2.2e-16
## alternative hypothesis: two-sided

vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CCCM không có phân phối loga chuẩn

Kiểm định phân phối mũ

Giả thuyết:

\(H_0\): CCCM tuân theo phân phối mũ

\(H_1\): CCCM không tuân theo phân phối mũ

ks.test(mxg$CCCM, y = "pexp")
## Warning in ks.test.default(mxg$CCCM, y = "pexp"): ties should not be present
## for the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$CCCM
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided

Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số CCCM không có phân phối mũ.

3.1.5 Biến CGXM

library(fBasics)
basicStats(mxg$CGXM)
##             X..mxg.CGXM
## nobs         365.000000
## NAs            0.000000
## Minimum       10.000000
## Maximum       30.000000
## 1. Quartile   14.000000
## 3. Quartile   25.000000
## Mean          19.769863
## Median        20.000000
## Sum         7216.000000
## SE Mean        0.323693
## LCL Mean      19.133320
## UCL Mean      20.406406
## Variance      38.243595
## Stdev          6.184141
## Skewness       0.023116
## Kurtosis      -1.262577

Vẽ đồ thị histogram

hist(mxg$CGXM)

Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test

Giả thuyết:

\(H_0\): CGXM tuân theo phân phối chuẩn

\(H_1\): CGXM không tuân theo phân phối chuẩn

shapiro.test(mxg$CGXM)
## 
##  Shapiro-Wilk normality test
## 
## data:  mxg$CGXM
## W = 0.94251, p-value = 1.08e-10

Nhìn vào p-value = 1.08e-10 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CGXM không tuân theo luật phân phối chuẩn.

Kiểm định phân phối loga chuẩn

Giả thuyết:

\(H_0\): CGXM tuân theo phân phối loga chuẩn

\(H_1\): CGXM không tuân theo phân phối Loga chuẩn

ks.test(mxg$CGXM, "plnorm")
## Warning in ks.test.default(mxg$CGXM, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$CGXM
## D = 0.98935, p-value < 2.2e-16
## alternative hypothesis: two-sided

vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến CGXM không có phân phối loga chuẩn

Kiểm định phân phối mũ

Giả thuyết:

\(H_0\): CGXM tuân theo phân phối mũ

\(H_1\): CGXM không tuân theo phân phối mũ

ks.test(mxg$CGXM, y = "pexp")
## Warning in ks.test.default(mxg$CGXM, y = "pexp"): ties should not be present
## for the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$CGXM
## D = 0.99995, p-value < 2.2e-16
## alternative hypothesis: two-sided

Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số CCDC không có phân phối mũ.

3.1.6 Biến CGXM

library(fBasics)
basicStats(mxg$MXHS)
##             X..mxg.MXHS
## nobs         365.000000
## NAs            0.000000
## Minimum       15.000000
## Maximum       30.000000
## 1. Quartile   19.000000
## 3. Quartile   27.000000
## Mean          22.947945
## Median        23.000000
## Sum         8376.000000
## SE Mean        0.236609
## LCL Mean      22.482653
## UCL Mean      23.413237
## Variance      20.434096
## Stdev          4.520409
## Skewness      -0.119157
## Kurtosis      -1.157235

Vẽ đồ thị histogram

hist(mxg$MXHS)

Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test

Giả thuyết:

\(H_0\): MXHS tuân theo phân phối chuẩn

\(H_1\): MXHS không tuân theo phân phối chuẩn

shapiro.test(mxg$MXHS)
## 
##  Shapiro-Wilk normality test
## 
## data:  mxg$MXHS
## W = 0.94937, p-value = 7.318e-10

Nhìn vào p-value = 7.318e-10 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến MXHS không tuân theo luật phân phối chuẩn.

Kiểm định phân phối loga chuẩn

Giả thuyết:

\(H_0\): MXHS tuân theo phân phối loga chuẩn

\(H_1\): MXHS không tuân theo phân phối Loga chuẩn

ks.test(mxg$MXHS, "plnorm")
## Warning in ks.test.default(mxg$MXHS, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$MXHS
## D = 0.99662, p-value < 2.2e-16
## alternative hypothesis: two-sided

vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến MXHS không có phân phối loga chuẩn

Kiểm định phân phối mũ

Giả thuyết:

\(H_0\): MXHS tuân theo phân phối mũ

\(H_1\): MXHS không tuân theo phân phối mũ

ks.test(mxg$MXHS, y = "pexp")
## Warning in ks.test.default(mxg$MXHS, y = "pexp"): ties should not be present
## for the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$MXHS
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided

Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số MXHS không có phân phối mũ.

3.1.7 Biến TĐ

library(fBasics)
basicStats(mxg$TĐ)
##                X..mxg.TĐ
## nobs          365.000000
## NAs             0.000000
## Minimum       100.000000
## Maximum       150.000000
## 1. Quartile   113.000000
## 3. Quartile   140.000000
## Mean          126.443836
## Median        128.000000
## Sum         46152.000000
## SE Mean         0.796992
## LCL Mean      124.876549
## UCL Mean      128.011122
## Variance      231.846425
## Stdev          15.226504
## Skewness       -0.143226
## Kurtosis       -1.252421

Vẽ đồ thị histogram

hist(mxg$TĐ)

Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test

Giả thuyết:

\(H_0\): TĐ tuân theo phân phối chuẩn

\(H_1\): TĐ không tuân theo phân phối chuẩn

shapiro.test(mxg$TĐ)
## 
##  Shapiro-Wilk normality test
## 
## data:  mxg$TĐ
## W = 0.9428, p-value = 1.168e-10

Nhìn vào p-value = 1.168e-10 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến TĐ không tuân theo luật phân phối chuẩn.

Kiểm định phân phối loga chuẩn

Giả thuyết:

\(H_0\): TĐ tuân theo phân phối loga chuẩn

\(H_1\): TĐ không tuân theo phân phối Loga chuẩn

ks.test(mxg$TĐ, "plnorm")
## Warning in ks.test.default(mxg$TĐ, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$TĐ
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided

vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến TĐ không có phân phối loga chuẩn

Kiểm định phân phối mũ

Giả thuyết:

\(H_0\): TĐ tuân theo phân phối mũ

\(H_1\): TĐ không tuân theo phân phối mũ

ks.test(mxg$TĐ, y = "pexp")
## Warning in ks.test.default(mxg$TĐ, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$TĐ
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided

Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số TĐ không có phân phối mũ.

3.1.8 Biến SĐN

library(fBasics)
basicStats(mxg$SĐN)
##               X..mxg.SĐN
## nobs          365.000000
## NAs             0.000000
## Minimum        50.000000
## Maximum        70.000000
## 1. Quartile    55.000000
## 3. Quartile    65.000000
## Mean           59.915068
## Median         60.000000
## Sum         21869.000000
## SE Mean         0.312617
## LCL Mean       59.300305
## UCL Mean       60.529832
## Variance       35.671338
## Stdev           5.972549
## Skewness       -0.019655
## Kurtosis       -1.212226

Vẽ đồ thị histogram

hist(mxg$SĐN)

Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test

Giả thuyết:

\(H_0\): SĐN tuân theo phân phối chuẩn

\(H_1\): SĐN không tuân theo phân phối chuẩn

shapiro.test(mxg$SĐN)
## 
##  Shapiro-Wilk normality test
## 
## data:  mxg$SĐN
## W = 0.95072, p-value = 1.085e-09

Nhìn vào p-value = 1.168e-10 < 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến TĐ không tuân theo luật phân phối chuẩn.

Kiểm định phân phối loga chuẩn

Giả thuyết:

\(H_0\): SĐN tuân theo phân phối loga chuẩn

\(H_1\): SĐN không tuân theo phân phối Loga chuẩn

ks.test(mxg$SĐN, "plnorm")
## Warning in ks.test.default(mxg$SĐN, "plnorm"): ties should not be present for
## the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$SĐN
## D = 0.99995, p-value < 2.2e-16
## alternative hypothesis: two-sided

vì 2.2e-16 < 0.1 nên Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến SĐN không có phân phối loga chuẩn

Kiểm định phân phối mũ

Giả thuyết:

\(H_0\): SĐN tuân theo phân phối mũ

\(H_1\): SĐN không tuân theo phân phối mũ

ks.test(mxg$SĐN, y = "pexp")
## Warning in ks.test.default(mxg$SĐN, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mxg$SĐN
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided

Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số SĐN không có phân phối mũ.

4 Bài tập về nhà tuần 4

Đề: Xây dựng mô hình cho đối tượng cần mô phỏng và giải thích mô hình.

4.1 Xác định mô hình doanh thu của quán mì xài giòn 111

\(Doanh thu = ĐG.SL\)

library(readxl)
hn <- read_excel("D:/hn.xlsx")
View(hn)

Giải thích biến

các biến DTMXG DTCBX DTCCDC DTCCCM DTCGXC DTMXHS DTSĐN DTTĐ lần lượt là doanh thu hàng ngày của tiệm mì

4.2 Mô phỏng doanh thu của quán mì xào giòn 111

library(readxl)
MXG1 <- read_excel("D:/MXG1.xlsx")
View(MXG1)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.1
library(scales)
## Warning: package 'scales' was built under R version 4.3.1
ggplot(data = MXG1, aes(x = DT)) + 
  geom_histogram ( fill = "lightblue", col = 'black') +
  labs(x = "Doanh thu",
       y = "", 
       title = "Biểu đồ Doanh thu của quán mxg") +
  scale_x_continuous(labels = comma)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

hist(MXG1$DT, col = 'lightblue')

summary(MXG1$DT)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
##  7202000  8280000  8596000  8597381  8966000 10348000

4.3 Kiểm định phân phối biến doanh thu

library(fBasics)
basicStats(MXG1$DT)
##                X..MXG1.DT
## nobs         3.650000e+02
## NAs          0.000000e+00
## Minimum      7.202000e+06
## Maximum      1.034800e+07
## 1. Quartile  8.280000e+06
## 3. Quartile  8.966000e+06
## Mean         8.597381e+06
## Median       8.596000e+06
## Sum          3.138044e+09
## SE Mean      2.744132e+04
## LCL Mean     8.543417e+06
## UCL Mean     8.651344e+06
## Variance     2.748545e+11
## Stdev        5.242657e+05
## Skewness    -4.584000e-02
## Kurtosis     1.662400e-01

Vẽ đồ thị histogram

hist(MXG1$DT)

Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test

Giả thuyết:

\(H_0\): DT tuân theo phân phối chuẩn

\(H_1\): DT không tuân theo phân phối chuẩn

shapiro.test(MXG1$DT)
## 
##  Shapiro-Wilk normality test
## 
## data:  MXG1$DT
## W = 0.99346, p-value = 0.115

Nhìn vào p-value = 0.115 > 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến DT tuân theo luật phân phối chuẩn.

Kiểm định phân phối mũ

Giả thuyết:

\(H_0\): DT tuân theo phân phối mũ

\(H_1\): DT không tuân theo phân phối mũ

ks.test(MXG1$DT, y = "pexp")
## Warning in ks.test.default(MXG1$DT, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  MXG1$DT
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided

Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số DT không có phân phối mũ.

5 Bài tập về nhà tuần 5,6

library("psych")
## Warning: package 'psych' was built under R version 4.3.1
## 
## Attaching package: 'psych'
## The following objects are masked from 'package:scales':
## 
##     alpha, rescale
## The following objects are masked from 'package:ggplot2':
## 
##     %+%, alpha
## The following object is masked from 'package:fBasics':
## 
##     tr
library(readxl)
MXG1 <- read_excel("D:/MXG1.xlsx")
describe(MXG1)
##     vars   n    mean        sd  median trimmed       mad     min      max
## STT    1 365     183    105.51     183     183    134.92       1      365
## DT     2 365 8597381 524265.70 8596000 8608116 521875.20 7202000 10348000
##       range  skew kurtosis       se
## STT     364  0.00    -1.21     5.52
## DT  3146000 -0.05     0.17 27441.32

5.1 Tính doanh thu quán mì xào giòn 111

MXG = mxg$MXG
CBX = mxg$CBX
CCDC = mxg$CCDC
CCCM = mxg$CCCM
CGXM = mxg$CGXM
MXHS = mxg$MXHS
TĐ = mxg$TĐ
SĐN = mxg$SĐN
Dthu <- 50000 * MXG + 50000 * CBX +50000 * CCDC + 50000 * CCCM + 50000 * CGXM + 50000 * MXHS + 2000 * TĐ + 10000 * SĐN 
summary(Dthu)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
##  7202000  8280000  8596000  8597381  8966000 10348000

Biến doanh thu (DT) trong khoảng [8966000;10348000]

Doanh thu thấp sẽ dưới 7.500.000đ trên 1 ngày

Doanh thu vừa sẽ từ 7.500.000đ đến 9.500.000đ trên 1 ngày

Doanh thu cao sẽ từ 9.500.000 đồng trở lên trên 1 ngày

DTthap <- Dthu[Dthu < 7500000]
DTvua <- Dthu[Dthu > 7500000 & Dthu <= 9500000]
DTcao <- Dthu[Dthu > 9500000]

table(cut(Dthu,breaks = 3))
## 
## (7.2e+06,8.25e+06] (8.25e+06,9.3e+06] (9.3e+06,1.04e+07] 
##                 88                248                 29
table(cut(Dthu,3, labels = c('thap','vua','cao')))
## 
## thap  vua  cao 
##   88  248   29
library(pastecs)
## Warning: package 'pastecs' was built under R version 4.3.1
stat.desc(Dthu)
##      nbr.val     nbr.null       nbr.na          min          max        range 
## 3.650000e+02 0.000000e+00 0.000000e+00 7.202000e+06 1.034800e+07 3.146000e+06 
##          sum       median         mean      SE.mean CI.mean.0.95          var 
## 3.138044e+09 8.596000e+06 8.597381e+06 2.744132e+04 5.396343e+04 2.748545e+11 
##      std.dev     coef.var 
## 5.242657e+05 6.097970e-02

có 365 giá trị doanh thu

doanh thu có giá trị biến thiên nhất là 3.146.000

Tổng doanh thu của quán mì xào giòn là 3.138044e+09

Trung bình cộng doanh thu quán là 8.596000e+06

Doanh thu nhỏ nhất trong quán là 7.202000e+06 doanh thu lớn nhất tại quán là 1.034800e+07

Trung bình cộng doanh thu của quán là 8.596000e+06 đồng, tức là nếu chia tổng doanh thu cho số lượng giá trị, thì sẽ được kết quả này.

5.2 Kiểm định phân phối biến doanh thu

Kiểm định phân phối chuẩn: Kiểm định SHapiro-Wilk Test

Giả thuyết:

\(H_0\): Dthu tuân theo phân phối chuẩn

\(H_1\): Dthu không tuân theo phân phối chuẩn

shapiro.test(Dthu)
## 
##  Shapiro-Wilk normality test
## 
## data:  Dthu
## W = 0.99346, p-value = 0.115

Nhìn vào p-value = 0.115 > 0.05.Nên ta đủ cơ sở bác bỏ giả thuyết \(H_0\) hay biến DT tuân theo luật phân phối chuẩn.

Kiểm định phân phối mũ

Giả thuyết:

\(H_0\): Dthu tuân theo phân phối mũ

\(H_1\): Dthu không tuân theo phân phối mũ

ks.test(Dthu, y = "pexp")
## Warning in ks.test.default(Dthu, y = "pexp"): ties should not be present for
## the Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  Dthu
## D = 1, p-value < 2.2e-16
## alternative hypothesis: two-sided

Vì p_value = 2.2e-16 < 0.1 nên ta bác bỏ giả thuyết \(H_0\).Vậy chỉ số DT không có phân phối mũ.

library(ggpubr)
## Warning: package 'ggpubr' was built under R version 4.3.1

5.3 Mô phỏng phân phối đều biến doanh thu trong 365 ngày

L <- runif(n=365,min = 7202000,max = 10348000)
hist(L, main = "phân phối đều biến doanh thu", xlab = "L", col = "skyblue")

summary(L)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
##  7204542  7942627  8724385  8744334  9563044 10343313

5.4 Mô phỏng phân phối chuẩn doanh thu trong 365 ngày

PHÂN PHỐI CHUẨN

D <- rnorm( n = 365, mean = 8597381, sd = 524265.70)
hist(D, main = "phân phối đều biến doanh thu", xlab = "L", col = "skyblue")

summary(D)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
##  7012761  8237097  8592221  8610876  9007460 10426685

5.5 Nhận xét

DTthap1 <- L[L < 7500000]
DTvua2 <- L[L > 7500000 & Dthu <= 9500000]
DTcao3 <- L[L > 9500000]
table(cut(L,breaks = 3))
## 
## (7.2e+06,8.25e+06] (8.25e+06,9.3e+06] (9.3e+06,1.03e+07] 
##                131                111                123
table(cut(L,3, labels = c('thap','vua','cao')))
## 
## thap  vua  cao 
##  131  111  123

Tử bảng ta thấy có 126 ngày có doanh thu thấp 122 ngày có doanh thu vừa và 117 ngày có doanh thu cao