BÀI TẬP TUẦN 6

Tùy vào cá nhân kinh doanh mà mỗi người sẽ có kỳ vọng lợi nhuận khác nhau. Tuy nhiên trong phạm vi bài nghiên cứu này em quy ước trong 1 tháng:

  • Nếu lợi nhuận của tiệm hủ tiệu đạt lớn hơn 9.000.000 đồng gọi là tháng siêu lời.

  • Nếu lợi nhuận ở mức lớn hơn hoặc bằng 4.500.000 đồng nhưng nhỏ hơn 9.000.000 đồng gọi là tháng lời.

  • Nếu lợi nhuận ở mức lớn hơn hoặc bằng 3.000.000 đồng nhưng nhỏ hơn 4.500.000 đồng gọi là tháng hòa vốn.

  • Nếu lợi nhuận ở mức lớn hơn hoặc bằng 2000000 đồng nhưng nhỏ hơn 3.000.000 đồng gọi là tháng lỗ.

  • Nếu lợi nhuận nhỏ hơn 2000000 đồng gọi là tháng siêu lỗ.

Tiến hành mô phỏng lợi nhuận của tiệm hủ tiếu trong 1000 tháng:

SLDT1 <- rnorm(n = 1000, mean =1123.30, sd = 33.75 )
SLDT2 <- rnorm(n = 1000, mean =954.56, sd = 27.07 )
SLDT3 <- rnorm(n = 1000, mean =194.36, sd = 18.41 )
SLDT4 <- rnorm(n = 1000, mean =299.88, sd = 18.14 )
SLCP1 <- rnorm(n = 1000, mean =227.08, sd = 10.34 )
SLCP2 <- rnorm(n = 1000, mean =120.72, sd = 3.28 )
SLCP3 <- rnorm(n = 1000, mean =165.36, sd = 9.68 )
SLCP4 <- rnorm(n = 1000, mean =37.10, sd = 2.48 )
SLCP5 <- rnorm(n = 1000, mean =34.88, sd = 3.01 )
SLCP6 <- rnorm(n = 1000, mean =2.76, sd = 0.96 )
SLCP7 <- rnorm(n = 1000, mean =6.04, sd = 1.21 )
SLCP8 <- rnorm(n = 1000, mean =3.04, sd = 1.11 )
SLCP9 <- rnorm(n = 1000, mean =43.52, sd = 9.62 )
SLCP10 <- rnorm(n = 1000, mean =171.56, sd = 17.39 )
SLCP11 <- rnorm(n = 1000, mean =30.14, sd = 2.76)
SLCP12 <- rnorm(n = 1000, mean =20.64, sd = 1.91 )
SLCP13 <- rnorm(n = 1000, mean =109.90, sd = 6.53)
SLCP14 <- rnorm(n = 1000, mean =11.96, sd = 1.93 )
SLCP15 <- rnorm(n = 1000, mean =1.92, sd = 0.90 )
LN = SLDT1*20000+SLDT2*30000+SLDT3*10000+SLDT4*15000-(9150000+SLCP1*60000+SLCP2*120000+SLCP3*20000+SLCP4*20000+SLCP5*20000+SLCP6*90000+SLCP7*40000+SLCP8*250000+SLCP9*12000+SLCP10*12000+SLCP11*15000+SLCP12*25000+SLCP13*30000+SLCP14*80000+SLCP15*300000)
LN <- data.frame(LN)

Dựa vào kết quả mô phỏng lợi nhuận. Khi đó ta tính được kết quả mô phỏng xác suất lợi nhuận của tiệm hủ tiếu trong 1000 tháng như sau:

counts  <- table(ifelse(LN > 9000000, "Thang sieu loi",
                    ifelse(LN >= 4500000, "Thang loi",
                    ifelse(LN >= 3000000, "Thang hoa von",
                    ifelse(LN >= 2000000, "Thang lo",
                    ifelse(any(LN < 2000000), "Thang sieu lo", "Thang sieu lo"))))))
Xacsuat <- counts / sum(counts) * 100

Ketqua <- data.frame(Phan_loai = names(counts), Xac_suat = paste(Xacsuat, "%"))
print(Ketqua)
##        Phan_loai Xac_suat
## 1  Thang hoa von   14.9 %
## 2       Thang lo    1.7 %
## 3      Thang loi   81.6 %
## 4  Thang sieu lo    0.2 %
## 5 Thang sieu loi    1.6 %

Như vậy, lợi nhuận của tiệm được mô phỏng với xác suất tháng hòa vốn là 16,4%; tháng lỗ là 2,4%; tháng lời là 79,3%; tháng siêu lỗ là 0,7% và tháng siêu lời là 1,2%.

BÀI TẬP TUẦN 5

1. Mô hình mô phỏng.

Mô hình mô phỏng lợi nhuận của tiệm hủ tiếu được xác định như sau:

\(LN = \sum_1^4 \mathrm{SLDT}_{\mathrm{i}} \cdot DGDT_{\textrm{i}}-\left(9.150 .000+\sum_1^{\mathrm{n}} \mathrm{SLCP}_{\mathrm{k}} \cdot DGCP_{\mathrm{k}}\right)\)

Tiến hành mô phỏng lợi nhuận của tiệm hủ tiếu trong 1000 tháng với giả định các biến độc lập có phân phối chuẩn.

2. Mô phỏng các biến độc lập.

Dựa vào dữ liệu thu thập, ta có thể tính được trung bình và độ lệch chuẩn của các biến độc lập từ 50 quan sát này như sau:

library(readxl)
library(psych)
dulieuthuthap <- read_excel("dulieuthuthap.xlsx")
describe(dulieuthuthap)
##        vars  n    mean    sd median trimmed   mad  min  max range  skew
## SLDT1     1 50 1123.30 33.75 1125.0 1124.35 37.06 1025 1182   157 -0.43
## SLDT2     2 50  954.56 27.07  952.5  954.58 32.62  895 1005   110  0.01
## SLDT3     3 50  194.36 18.41  197.5  194.80 18.53  155  232    77 -0.26
## SLDT4     4 50  299.88 18.14  299.5  299.08 18.53  267  345    78  0.35
## SLCP1     5 50  227.08 10.34  229.0  227.78  8.90  200  245    45 -0.57
## SLCP2     6 50  120.72  3.28  120.0  121.05  2.22  110  125    15 -0.83
## SLCP3     7 50  165.36  9.68  164.5  164.65 11.12  149  195    46  0.67
## SLCP4     8 50   37.10  2.48   37.0   37.05  2.97   32   45    13  0.44
## SLCP5     9 50   34.88  3.01   35.0   34.95  2.97   28   41    13 -0.11
## SLCP6    10 50    2.76  0.96    3.0    2.72  1.48    1    5     4  0.34
## SLCP7    11 50    6.04  1.21    6.0    6.00  1.48    4   10     6  0.53
## SLCP8    12 50    3.04  1.11    3.0    3.10  1.48    1    5     4 -0.25
## SLCP9    13 50   43.52  9.62   44.5   43.38  8.15   20   70    50  0.10
## SLCP10   14 50  171.56 17.39  170.0  170.98 14.83  130  215    85  0.25
## SLCP11   15 50   30.14  2.76   30.0   30.30  1.48   20   35    15 -0.93
## SLCP12   16 50   20.64  1.91   21.0   20.70  1.48   16   24     8 -0.26
## SLCP13   17 50  109.90  6.53  110.0  109.80  5.93   90  125    35 -0.10
## SLCP14   18 50   11.96  1.93   12.0   11.97  1.48    6   16    10 -0.28
## SLCP15   19 50    1.92  0.90    2.0    1.85  1.48    1    5     4  0.81
##        kurtosis   se
## SLDT1     -0.01 4.77
## SLDT2     -0.78 3.83
## SLDT3     -0.54 2.60
## SLDT4     -0.53 2.56
## SLCP1      0.12 1.46
## SLCP2      1.02 0.46
## SLCP3      0.46 1.37
## SLCP4      0.65 0.35
## SLCP5     -0.49 0.43
## SLCP6     -0.48 0.14
## SLCP7      0.82 0.17
## SLCP8     -0.88 0.16
## SLCP9      0.34 1.36
## SLCP10     0.14 2.46
## SLCP11     2.18 0.39
## SLCP12    -0.32 0.27
## SLCP13     0.75 0.92
## SLCP14     0.51 0.27
## SLCP15     0.66 0.13

Tiến hành mô phỏng các biến độc lập dựa theo trung bình và độ lệch chuẩn của các biến độc lập:

SLDT1 <- rnorm(n = 1000, mean =1123.30, sd = 33.75 )
SLDT2 <- rnorm(n = 1000, mean =954.56, sd = 27.07 )
SLDT3 <- rnorm(n = 1000, mean =194.36, sd = 18.41 )
SLDT4 <- rnorm(n = 1000, mean =299.88, sd = 18.14 )
SLCP1 <- rnorm(n = 1000, mean =227.08, sd = 10.34 )
SLCP2 <- rnorm(n = 1000, mean =120.72, sd = 3.28 )
SLCP3 <- rnorm(n = 1000, mean =165.36, sd = 9.68 )
SLCP4 <- rnorm(n = 1000, mean =37.10, sd = 2.48 )
SLCP5 <- rnorm(n = 1000, mean =34.88, sd = 3.01 )
SLCP6 <- rnorm(n = 1000, mean =2.76, sd = 0.96 )
SLCP7 <- rnorm(n = 1000, mean =6.04, sd = 1.21 )
SLCP8 <- rnorm(n = 1000, mean =3.04, sd = 1.11 )
SLCP9 <- rnorm(n = 1000, mean =43.52, sd = 9.62 )
SLCP10 <- rnorm(n = 1000, mean =171.56, sd = 17.39 )
SLCP11 <- rnorm(n = 1000, mean =30.14, sd = 2.76)
SLCP12 <- rnorm(n = 1000, mean =20.64, sd = 1.91 )
SLCP13 <- rnorm(n = 1000, mean =109.90, sd = 6.53)
SLCP14 <- rnorm(n = 1000, mean =11.96, sd = 1.93 )
SLCP15 <- rnorm(n = 1000, mean =1.92, sd = 0.90 )

3. Mô phỏng lợi nhuận.

LN = SLDT1*20000+SLDT2*30000+SLDT3*10000+SLDT4*15000-(9150000+SLCP1*60000+SLCP2*120000+SLCP3*20000+SLCP4*20000+SLCP5*20000+SLCP6*90000+SLCP7*40000+SLCP8*250000+SLCP9*12000+SLCP10*12000+SLCP11*15000+SLCP12*25000+SLCP13*30000+SLCP14*80000+SLCP15*300000)
LN <- data.frame(LN)

4. Thống kê mô tả

library(psych)
describe(LN)
##    vars    n    mean      sd  median trimmed     mad     min      max   range
## LN    1 1000 5916586 1401979 5937169 5913839 1395010 1470854 10566405 9095551
##     skew kurtosis       se
## LN -0.03     0.09 44334.48

Từ kết quả thống kê mô tả cho thấy:

Lợi nhuận trung bình của tiệm hủ tiếu là 5.810.118 đồng

Lợi nhuận nhỏ nhất của tiệm hủ tiếu là 957.799 đồng

Lợi nhuận lớn nhất của tiệm hủ tiếu là 11.279.664 đồng

Độ lệch chuẩn thể hiện mức độ biến động và phân tán của dữ liệu. Độ lệch chuẩn của LN là 1502541

Độ lệch (Skewness)và độ nhọn (Kurtosis) có giá trị gần bằng 0 cho thấy dữ liệu có phân phối gần chuẩn.

5. Mô phỏng biểu đồ lợi nhuận.

Trực quan hóa dữ liệu bằng biểu đồ histogram

library(ggplot2)
## 
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
## 
##     %+%, alpha
library(scales)
## 
## Attaching package: 'scales'
## The following objects are masked from 'package:psych':
## 
##     alpha, rescale
ggplot(data = LN, aes(x = LN)) + 
  geom_histogram ( fill = "blue", col = "white") +
  labs(x = "Số tiền lợi nhuận",
       y = "Số tháng", 
       title = "Biểu đồ lợi nhuận của tiệm hủ tiếu") +
  scale_x_continuous(labels = comma)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

BÀI TẬP TUẦN 4

Dựa vào kết quả câu 2, mô hình mô phỏng lợi nhuận của tiệm hủ tiếu được xác định là:

LN = \(\sum_1^4 \mathrm{SLDT}_{\mathrm{i}} \cdot DGDT_{\textrm{i}}-\left(9.150 .000+\sum_1^{\mathrm{n}} \mathrm{SLCP}_{\mathrm{k}} \cdot DGCP_{\mathrm{k}}\right)\)

BÀI TẬP TUẦN 3

Dựa vào kết quả tuần 2, ta biết để mô phỏng lợi nhuận cần mô phỏng số lượng chi phí biến đổi và doanh thu của tiệm hủ tiếu.

1. Dữ liệu thu thập

Tiến hành khảo sát doanh thu và chi phí thực tế của các tiệm hủ tiếu có quy mô tương tương tự (quy mô nhỏ, có lượng khách từ 70 đến 90 khách/ngày) tại Rạch Giá. Em thu được bảng số lượng gồm 50 tháng với 19 biến như sau:

library(readxl)
dulieuthuthap <- read_excel("dulieuthuthap.xlsx")
library(DT)
dulieuthuthap %>% DT::datatable(dulieuthuthap)

Thống kê mô tả dữ liệu thu thập

library(psych)
describe(dulieuthuthap)
##        vars  n    mean    sd median trimmed   mad  min  max range  skew
## SLDT1     1 50 1123.30 33.75 1125.0 1124.35 37.06 1025 1182   157 -0.43
## SLDT2     2 50  954.56 27.07  952.5  954.58 32.62  895 1005   110  0.01
## SLDT3     3 50  194.36 18.41  197.5  194.80 18.53  155  232    77 -0.26
## SLDT4     4 50  299.88 18.14  299.5  299.08 18.53  267  345    78  0.35
## SLCP1     5 50  227.08 10.34  229.0  227.78  8.90  200  245    45 -0.57
## SLCP2     6 50  120.72  3.28  120.0  121.05  2.22  110  125    15 -0.83
## SLCP3     7 50  165.36  9.68  164.5  164.65 11.12  149  195    46  0.67
## SLCP4     8 50   37.10  2.48   37.0   37.05  2.97   32   45    13  0.44
## SLCP5     9 50   34.88  3.01   35.0   34.95  2.97   28   41    13 -0.11
## SLCP6    10 50    2.76  0.96    3.0    2.72  1.48    1    5     4  0.34
## SLCP7    11 50    6.04  1.21    6.0    6.00  1.48    4   10     6  0.53
## SLCP8    12 50    3.04  1.11    3.0    3.10  1.48    1    5     4 -0.25
## SLCP9    13 50   43.52  9.62   44.5   43.38  8.15   20   70    50  0.10
## SLCP10   14 50  171.56 17.39  170.0  170.98 14.83  130  215    85  0.25
## SLCP11   15 50   30.14  2.76   30.0   30.30  1.48   20   35    15 -0.93
## SLCP12   16 50   20.64  1.91   21.0   20.70  1.48   16   24     8 -0.26
## SLCP13   17 50  109.90  6.53  110.0  109.80  5.93   90  125    35 -0.10
## SLCP14   18 50   11.96  1.93   12.0   11.97  1.48    6   16    10 -0.28
## SLCP15   19 50    1.92  0.90    2.0    1.85  1.48    1    5     4  0.81
##        kurtosis   se
## SLDT1     -0.01 4.77
## SLDT2     -0.78 3.83
## SLDT3     -0.54 2.60
## SLDT4     -0.53 2.56
## SLCP1      0.12 1.46
## SLCP2      1.02 0.46
## SLCP3      0.46 1.37
## SLCP4      0.65 0.35
## SLCP5     -0.49 0.43
## SLCP6     -0.48 0.14
## SLCP7      0.82 0.17
## SLCP8     -0.88 0.16
## SLCP9      0.34 1.36
## SLCP10     0.14 2.46
## SLCP11     2.18 0.39
## SLCP12    -0.32 0.27
## SLCP13     0.75 0.92
## SLCP14     0.51 0.27
## SLCP15     0.66 0.13

Từ kết quả thống kê mô tả cho thấy:

Biến SLDT1 có giá trị nhỏ nhất là 1025; giá trị lớn nhất là 1182; giá trị trung bình là 1123.30; độ lệch chuẩn là 33.75

Biến SLDT2 có giá trị nhỏ nhất là 895; giá trị lớn nhất là 1005; giá trị trung bình là 954.56; độ lệch chuẩn là 27.07

Biến SLDT3 có giá trị nhỏ nhất là 155; giá trị lớn nhất là 345; giá trị trung bình là 194.36; độ lệch chuẩn là 18.41

Biến SLDT4 có giá trị nhỏ nhất là 267; giá trị lớn nhất là 345; giá trị trung bình là 299.88; độ lệch chuẩn là 18.14

Biến SLCP1 có giá trị nhỏ nhất là 200; giá trị lớn nhất là 245; giá trị trung bình là 227.08; độ lệch chuẩn là 10.34

Biến SLCP2 có giá trị nhỏ nhất là 110; giá trị lớn nhất là 125; giá trị trung bình là 120.72; độ lệch chuẩn là 3.28

Biến SLCP3 có giá trị nhỏ nhất là 149; giá trị lớn nhất là 195; giá trị trung bình là 165.36; độ lệch chuẩn là 9.68

Biến SLCP4 có giá trị nhỏ nhất là 32; giá trị lớn nhất là 45; giá trị trung bình là 37.10; độ lệch chuẩn là 2.48

Biến SLCP5 có giá trị nhỏ nhất là 28; giá trị lớn nhất là 41; giá trị trung bình là 34.88; độ lệch chuẩn là 3.01

Biến SLCP6 có giá trị nhỏ nhất là 1; giá trị lớn nhất là 5; giá trị trung bình là 2.76; độ lệch chuẩn là 0.96

Biến SLCP7 có giá trị nhỏ nhất là 4; giá trị lớn nhất là 10; giá trị trung bình là 6.04; độ lệch chuẩn là 1.21

Biến SLCP8 có giá trị nhỏ nhất là 1; giá trị lớn nhất là 5; giá trị trung bình là 3.04; độ lệch chuẩn là 1.11

Biến SLCP9 có giá trị nhỏ nhất là 20; giá trị lớn nhất là 70; giá trị trung bình là 43.52; độ lệch chuẩn là 9.62

Biến SLCP10 có giá trị nhỏ nhất là 130; giá trị lớn nhất là 215; giá trị trung bình là 171.56; độ lệch chuẩn là 17.39

Biến SLCP11 có giá trị nhỏ nhất là 20; giá trị lớn nhất là 35; giá trị trung bình là 30.14; độ lệch chuẩn là 2.76

Biến SLCP12 có giá trị nhỏ nhất là 16; giá trị lớn nhất là 24; giá trị trung bình là 20.64; độ lệch chuẩn là 1.91

Biến SLCP13 có giá trị nhỏ nhất là 90; giá trị lớn nhất là 125; giá trị trung bình là 109.90; độ lệch chuẩn là 6.53

Biến SLCP14 có giá trị nhỏ nhất là 6; giá trị lớn nhất là 16; giá trị trung bình là 11.96; độ lệch chuẩn là 1.93

Biến SLCP15 có giá trị nhỏ nhất là 1; giá trị lớn nhất là 5; giá trị trung bình là 1.92; độ lệch chuẩn là 0.90

2. Kiểm định phân phối các biến

Sử dụng Kiểm định Shapiro-Wilk Test và biểu đồ QQ-plot để kiểm định dữ liệu có phân bố chuẩn hay không.

Giả thuyết thống kê của SHapiro-Wilk Test:

H0: Biến cần kiểm định tuân theo phân phối chuẩn.

H1: Biến cần kiểm định không tuân theo phân phối chuẩn

Giá trị của thống kê Shapiro-Wilk:

\[ W = (\sum_{i=1}^{n} \alpha_ix_i)^2/(\sum_{i=1}^{n} x_i-\overline{x})^2 \]

Với: \(x_i\): giá trị thứ i nhỏ nhất của x. \(\alpha_i\): Hằng số Shapiro - Wilk.

2.1. Biến SLDT1

shapiro.test(dulieuthuthap$SLDT1)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLDT1
## W = 0.97243, p-value = 0.2898
library(ggpubr)
ggqqplot(dulieuthuthap$SLDT1)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.2898 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLDT1 tuân theo luật phân phối chuẩn.

2.2. Biến SLDT2

shapiro.test(dulieuthuthap$SLDT2)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLDT2
## W = 0.9812, p-value = 0.6034
library(ggpubr)
ggqqplot(dulieuthuthap$SLDT2)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.6034 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLDT2 tuân theo luật phân phối chuẩn.

2.3. Biến SLDT3

shapiro.test(dulieuthuthap$SLDT3)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLDT3
## W = 0.97574, p-value = 0.3893
library(ggpubr)
ggqqplot(dulieuthuthap$SLDT3)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.3893 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLDT3 tuân theo luật phân phối chuẩn.

2.4. Biến SLDT4

shapiro.test(dulieuthuthap$SLDT4)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLDT4
## W = 0.97875, p-value = 0.5007
library(ggpubr)
ggqqplot(dulieuthuthap$SLDT4)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.5007 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLDT4 tuân theo luật phân phối chuẩn.

2.5. Biến SLCP1

shapiro.test(dulieuthuthap$SLCP1)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP1
## W = 0.95691, p-value = 0.06601
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP1)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.06601 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP1 tuân theo luật phân phối chuẩn.

2.6. Biến SLCP2

shapiro.test(dulieuthuthap$SLCP2)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP2
## W = 0.88155, p-value = 0.0001247
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP2)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.0001247 < 0.05 nên bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần không nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP2 không tuân theo luật phân phối chuẩn.

2.7. Biến SLCP3

shapiro.test(dulieuthuthap$SLCP3)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP3
## W = 0.96139, p-value = 0.1016
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP3)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.1016 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP3 tuân theo luật phân phối chuẩn.

2.8. Biến SLCP4

shapiro.test(dulieuthuthap$SLCP4)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP4
## W = 0.96679, p-value = 0.1709
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP4)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.96679 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP4 tuân theo luật phân phối chuẩn.

2.9. Biến SLCP5

shapiro.test(dulieuthuthap$SLCP5)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP5
## W = 0.97859, p-value = 0.4941
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP5)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.97859 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP5 tuân theo luật phân phối chuẩn.

2.10. Biến SLCP6

shapiro.test(dulieuthuthap$SLCP6)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP6
## W = 0.89322, p-value = 0.0002892
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP6)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.0002892 < 0.05 nên bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần không nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP6 không tuân theo luật phân phối chuẩn.

2.11. Biến SLCP7

shapiro.test(dulieuthuthap$SLCP7)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP7
## W = 0.9139, p-value = 0.001429
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP7)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.001429 < 0.05 nên bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần không nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP7 không tuân theo luật phân phối chuẩn.

2.12. Biến SLCP8

shapiro.test(dulieuthuthap$SLCP8)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP8
## W = 0.90232, p-value = 0.0005738
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP8)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.0005738 < 0.05 nên chấp nhận giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần không nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP8 không tuân theo luật phân phối chuẩn.

2.13. Biến SLCP9

shapiro.test(dulieuthuthap$SLCP9)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP9
## W = 0.97594, p-value = 0.3961
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP9)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.3961 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP9 tuân theo luật phân phối chuẩn.

2.14. Biến SLCP10

shapiro.test(dulieuthuthap$SLCP10)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP10
## W = 0.98285, p-value = 0.6768
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP10)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.6768 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP10 tuân theo luật phân phối chuẩn.

2.15. Biến SLCP11

shapiro.test(dulieuthuthap$SLCP11)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP11
## W = 0.91994, p-value = 0.002347
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP11)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.002347 < 0.05 nên chấp nhận giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần không nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP11 không tuân theo luật phân phối chuẩn.

2.16. Biến SLCP12

shapiro.test(dulieuthuthap$SLCP12)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP12
## W = 0.95712, p-value = 0.06734
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP12)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.06734 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP12 tuân theo luật phân phối chuẩn.

2.17. Biến SLCP13

shapiro.test(dulieuthuthap$SLCP13)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP13
## W = 0.97623, p-value = 0.406
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP13)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.406 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP13 tuân theo luật phân phối chuẩn.

2.18. Biến SLCP14

shapiro.test(dulieuthuthap$SLCP14)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP14
## W = 0.96355, p-value = 0.1252
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP14)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 0.1252 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP14 tuân theo luật phân phối chuẩn.

2.19. Biến SLCP15

shapiro.test(dulieuthuthap$SLCP15)
## 
##  Shapiro-Wilk normality test
## 
## data:  dulieuthuthap$SLCP15
## W = 0.81543, p-value = 2.026e-06
library(ggpubr)
ggqqplot(dulieuthuthap$SLCP15)

Dựa vào kiểm định Shapiro-Wilk Test cho kết quả p-value = 2.026e-06 < 0.05 nên bác bỏ giả thuyết H0

Ngoài ra, dựa vào biểu đồ biểu đồ QQ-plot ta thấy những giá trị đa phần không nằm trên đường thẳng kì vọng của phân phối chuẩn.

Vậy ta có thể kết luận biến SLCP15 không tuân theo luật phân phối chuẩn.

Như vậy, các biến SLDT1, SLDT2, SLDT3, SLDT4, SLCP1, SLCP3, SLCP4, SLCP5, SLCP8, SLCP9, SLCP10, SLCP11, SLCP12, SLCP13, SLCP14 tuân theo quy luật phân phối chuẩn. Còn các biến SLCP2, SLCP6,SLCP7, SLCP15 không tuân theo quy luận phân phối chuẩn.

BÀI TẬP TUẦN 2

Mô phỏng lợi nhuận của một tiệm hủ tiếu nhỏ ở Rạch Giá. Để tính được lợi nhuận thì cần phải dự kiến được doanh thu và chi phí khi hoạt động.

1. Dự kiến Doanh thu của tiệm (DT)

1.1. Số lượng (\(\mathrm{SLDT}_{\mathrm{i}}\))

  • SLDT1: Số lượng tô (hủ tiếu/ hủ tiếu mì/ hoành thánh) thịt

  • SLDT2: Số lượng tô (hủ tiếu/ hủ tiếu mì/ hoành thánh) thịt + xương hoặc giò

  • SLDT3: Thêm hủ tiếu/hủ tiếu mì/hoành thánh

  • SLDT4: Thêm thịt/ xương hoặc giò

1.2. Đơn giá (\(\mathrm{DGDT}_{\mathrm{i}}\))

  • ĐG1: 20.000 đồng/tô thịt

  • ĐG2: 30.000 đồng/tô thịt + xương hoặc giò

  • ĐG3: 10.000 đồng/ 1 phần thêm hủ tiếu/hủ tiếu mì/hoành thánh thêm

  • ĐG4: 15.000 đồng/ 1 phần thêm thịt/ xương hoặc giò thêm

Vậy tổng doanh thu dự kiến của tiệm: \(\mathrm{DT}=\sum_1^4 \mathrm{SLDT}_{\mathrm{i}}. \mathrm{DGDT}_{\mathrm{i}}\)

2. Dự kiến Chi phí của tiệm (CP)

2.1. Chi phí Cố định

  • Xe bán + bàn ghế + xoong nồi + tô chén đũa muỗng: 6.000.000/60= 100.000 đồng

  • Mặt bằng( đã bao gồm tiền nước): 2.000.000 đồng

  • Lương chủ: 5.000.000 đồng

  • Lương nhân viên phụ: 1.800.000 đồng

  • Đá: 150.000 đồng

  • Trà: 100.000 đồng

=> Tổng chi phí cố định = 9.150.000 đồng

2.2. Chi phí Biến đổi

2.2.1. Số lượng (\(\mathrm{SLCP}_{\mathrm{k}}\))

  • SLCP1: Giò xương (đơn vị: kg)

  • SLCP2: Thịt (đơn vị: kg)

  • SLCP3: Hủ tiếu (đơn vị: kg)

  • SLCP4: Mì (đơn vị: kg)

  • SLCP5: Hoành thánh (đơn vị: kg)

  • SLCP6: Nước mắm (đơn vị: chai)

  • SLCP7: Tương ớt + Tương đen (đơn vị: chai)

  • SLCP8: Gia vị gồm 5 kg đường + 5 kg muối + 5 kg bột ngọt

  • SLCP9: Hành hẹ (đơn vị: kg)

  • SLCP10: Giá (đơn vị: kg)

  • SLCP11: Chanh (đơn vị: kg)

  • SLCP12: Ớt (đơn vị: kg)

  • SLCP13: Rau (đơn vị: kg)

  • SLCP14: Hành phi (đơn vị: kg)

  • SLCP15: Bao bì + giấy ăn

2.2.2. Đơn giá (\(\mathrm{DGCP}_{\mathrm{k}}\))

\[ \begin{array}{|l|l|} \hline \text { - Giò xương (đơn vị: đồng/kg) } & 60.000 \\ \hline \text { - Thịt (đơn vi: đồng/kg) } & 120.000 \\ \hline \text { - Hủ tiếu (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Mì (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Hoành thánh (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Nước mắm (đơn vị: đồng/bầu) } & 90.000 \\ \hline \text { - Tương ớt + Tương đen (đơn vị: đồng/bầu) } & 40.000 \\ \hline \text { - Gia vị (đơn vị: đồng/lần) } & 250.000 \\ \hline \text { - Hành hẹ (đơn vị: đồng/kg) } & 12.000 \\ \hline \text { - Giá (đơn vị: đồng/kg) } & 12.000 \\ \hline \text { - Chanh (đơn vị: đồng/kg) } & 15.000 \\ \hline \text { - Ớt (đơn vị: đồng/kg) } & 25.000 \\ \hline \text { - Rau (đơn vị: đồng/kg) } & 30.000 \\ \hline \text { - Hành phi (đơn vị: đồng/kg) } & 80.000 \\ \hline \text { - Bao bì + giấy ăn (đơn vị: đồng/lần) } & 300.000 \\ \hline \end{array} \] => Tổng chi phí biến đổi = \(\sum_1^{\mathrm{n}} \mathrm{SLCP}_{\mathrm{k}} \cdot \mathrm{DGCP}_{\mathrm{k}}\)**

Vậy tổng chi phí dự kiến của tiệm:

CP = 9.150.000 + \(\sum_1^{\mathrm{n}} \mathrm{SLCP}_{\mathrm{k}} \cdot \mathrm{DGCP}_{\mathrm{k}}\)

Khi đó, lợi nhuận dự kiến của tiệm:

= Doanh thu - Chi phí

= \(\sum_1^4 \mathrm{SLDT}_{\mathrm{i}} \cdot DGDT_{\textrm{i}}-\left(9.150 .000+\sum_1^{\mathrm{n}} \mathrm{SLCP}_{\mathrm{k}} \cdot DGCP_{\mathrm{k}}\right)\)

Như vậy, để mô phỏng lợi nhuận cần mô phỏng số lượng doanh thu và số lượng chi phí biến đổi của tiệm hủ tiếu.

BÀI TẬP TUẦN 1

1. Phân phối Poisson

Phân phối Poisson là phân phối cho biết xác xuất của sự kiện rời rạc xảy ra nhiều lần tại thời điểm ngẫu nhiên, trong một khoảng thời gian quy định. Sự kiện rời rạc có nghĩa là các sự kiện không ảnh hưởng trực tiếp đến nhau

Công thức

\(P(X=k)=e^-λ.\frac{λ ^k}{k!}\) k=0,1,2…

Đặc trưng số :

Kỳ vọng E(x) = λ

Phương sai Var(x)= λ

Mô phỏng ngẫu nhiên số ly nước cam bán được trong ngày có phân phối Poisson với tham số λ = 30 trong 1000 ngày.

a <- rpois(1000,30)
summary(a)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   16.00   26.00   30.00   30.16   34.00   46.00

Trung bình số ly nước cam bán được là 30 ly mỗi ngày trong 1000 ngày khảo sát, trong đó nhiều nhất là 50 ly, ít nhất là 14 ly.

hist(a, main= "Phân phối possion", xlab = "Số ly nước cam bán được trong ngày")

2. Phân phối đều

Biến ngẫu nhiên x được gọi là có phân phối đều trên đoạn:\([a,b]\)(a<b), ký hiệu X ~ U[a,b] nếu X có hàm mật độ là :

\[ f(x)=\left\{\begin{array}{cc} \frac{1}{b-a} & x \in[a, b] \\ 0 & x \notin[a, b] \end{array}\right. \] Đặc trưng số

Kỳ vọng \[ \mathrm{E}(\mathrm{X})=\frac{\mathrm{a}+\mathrm{b}}{2} \] Phương sai \[ \operatorname{Var}(X)=\frac{(\mathrm{b}-\mathrm{a})^2}{12} \] Mod(X) la giá trị bất kỳ nào trên đoạn a,b

Mô phỏng ngẫu nhiên số bánh mì bán được trong 1 ngày có phân phối đều trong khoảng 50-80 cái, trong 500 ngày

b <- runif(500,50,80)
summary(b)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   50.03   56.51   64.56   64.51   72.50   79.93

Số bánh trung bình mà quán bán được trong 500 ngày là 66 cái, ngày bán nhiều nhất 80 cái, ít nhất 50 cái

hist(b, main= "Phân  phối đều", xlab = "Số bánh bán trong ngày")

3.Phân phối nhị thức Binomial

Phân phối nhị thức với tham số p và n là tổng của n phép thử Bernoulli với xác suất p độc lập với nhau. Biến ngẫu nhiên có phân phối nhị thức nhận giá trị từ 0 đến n và xác suất để chọn ra x phần tử mong muốn trong n phần tử là \(\left(\begin{array}{l}n \\ x\end{array}\right) p^x(1-p)^{n-x}\) với \(\mathrm{x}=0,1,2, \ldots \mathrm{n}\).

Hàm xác xuất \(f(x)=\left(\begin{array}{l}n \\ x\end{array}\right) p^x(1-p)^{n-x} ; x=0,1,2, \ldots, n\)

Trung bình \(\mu=n p\)

Phương sai \(\sigma^2=n p(1-p)=n p q\)

Hàm sinh moment \(m(t)=\left(p e^t+q\right)^n\)

Biết rằng trong một quần thể dân số có khoảng 20% người mắc bệnh cao huyết áp; nếu chúng ta tiến hành chọn mẫu 500 lần ,mỗi lần chọn 30 người trong quần thể đó một cách ngẫu nhiên, sự phân phối số bệnh nhân cao huyết áp sẽ như thế nào ? Để trả lời câu hỏi này, chúng ta có thể ứng dụng hàm rbinom (n, k, p) trong R với những thông số như sau

c <- rbinom(500,30,0.2)
table(c)
## c
##   1   2   3   4   5   6   7   8   9  10  11  12  13 
##   3  12  32  62  67 100  91  65  36  22   5   3   2

Dòng thứ nhất ( 0,1,2….13) là số bệnh nhân cao huyết áp trong 30 người ta chọn.Dòng thứ 2 cho ta biết số lần chọn mẫu trong 500 lần xảy ra, có 2 mẫu không có bệnh nhân cao huyết áp, có 5 mẫu chỉ có 1 bệnh nhân cao huyết áp.

hist(c, main= "Phân phối nhị thức Binomial", xlab = "Bệnh nhân cao huyết áp")

Phân phối số bệnh nhân cao huyết áp trong số 30 người được chọn ngẫu nhiên trong một quần thề gồm 20% bệnh nhân cao huyết áp, và chọn mẫu được lặp lại 500 lần

4. Phân phối chuẩn

Phân phối chuẩn, còn gọi là phân phối Gauss, là một phân phối xác suất cực kì quan trọng trong nhiều lĩnh vực. Nó là họ phân phối có dạng tổng quát giống nhau, chỉ khác tham số vị trí (giá trị trung bình \(\mu\) ) và tỉ lệ (phương sai \(\sigma^2\) ). BNN X có hàm mật độ xác xuất f phụ thuộc vào 2 tham số \(\mu\)\(\sigma\) ( \(\sigma\) >0 )

Hàm mật độ \(f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{(x-\mu)^2}{2 \sigma^2}} ; x \in R\)

Trung bình \(\mu\)

Phương sai \(\sigma^2\)

Hàm sinh moment \(m(t)=e^{\mu t+\frac{t^2 \sigma^2}{2}}\)

Khảo sát mức tiêu thụ điện của các hộ gia đình ở Cần Thơ trung bình là 150KWh,độ lệch chuẩn 30KW.Mô phỏng mức tiêu thụ điện trong 500 ngày tiếp theo

d <- rnorm(500,mean = 150, sd= 30)
summary(d)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   44.09  132.53  153.00  151.87  173.52  231.32

Mức tiêu thụ điện trung bình của người dân Cần Thơ là 149kwh,lượng tiêu thụ thấp nhất là 53kwh và cao nhất là 232kwh.

hist(d, main= "Phân phối chuẩn", xlab = "Mức tiêu thụ điện trung bình")

5. Phân phối mũ

Phân phối mũ (Exponential Distribution) hoặc phân phối mũ phủ định đại diện cho một phân phối xác suất giúp mô tả thời gian giữa hai sự kiện trong một quá trình Poisson. Trong quá trình Poisson, các sự kiện xảy ra liên tục và độc lập theo một tần suất trung bình không đổi. Phân phối mũ là một trường hợp đặc biệt của phân phối gamma.

Hàm mật độ xác suất của phân phối mũ được tính bởi công thức:

\[ \begin{cases}\lambda e^{-\lambda x}, & \text { if } x \geq 0 \\ 0, & \text { if } x<0\end{cases} \] Với

  • \(\lambda\) = biến số tần suất

  • \(x=\) biến ngẫu nhiên

Hàm phân phối tích lũy của phân phối mũ được tính bởi công thức:

\[ \begin{cases}1-e^{-\lambda x}, & \text { nếu } x \geq 0 \\ 0, & \text { nếu } x<0\end{cases} \]

với

  • \(\lambda\) = biến tỉ lệ

  • x = biến ngẫu nhiên

Mô phỏng số máy tính bảng bán ra tại một cửa hàng trong 500 ngày có phân phối mũ với xác xuất 20 %

e <- rexp(500,0.2)
summary(e)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
##  0.00783  1.43253  3.58324  4.97048  6.57481 39.17730

Trung bình trong 500 ngày, có ngày cửa hàng không bán được cái nào, ngày cao nhất bán được 31 cái, trung bình bán được 3 cái/ ngày.

hist(e, main= "Phân phối mũ", xlab = "Số lượng máy tính bảng ")