BÀI TẬP CÂU 4

1. Xác định mô hình cho đối tượng cần mô phỏng

Dựa vào kết quả câu 2, mô hình mô phỏng lợi nhuận của tiệm hủ tiếu được xác định là:

LN = \(\sum_1^4 \mathrm{SLDT}_{\mathrm{i}} \cdot DGDT_{\textrm{i}}-\left(9.150 .000+\sum_1^{\mathrm{n}} \mathrm{SLCP}_{\mathrm{k}} \cdot DGCP_{\mathrm{k}}\right)\)

2. Mô phỏng lợi nhuận của tiệm hủ tiếu theo mô hình

Dựa vào kết quả mô phỏng câu 3, tiến hành mô phỏng lợi nhuận theo mô hình đã xác định. Ta thu được bảng sau:

library(readxl)
loinhuanmophong <- read_excel("dulieumophongloinhuan.xlsx")
library(DT)
loinhuanmophong %>% DT::datatable(loinhuanmophong)

3. Mô phỏng biểu đồ lợi nhuận của tiệm hủ tiếu trong 10000 tháng

library(ggplot2)
library(scales)
ggplot(data = loinhuanmophong, aes(x = LN)) + 
  geom_histogram ( fill = "blue", col = "white") +
  labs(x = "Số tiền lợi nhuận",
       y = "Số tháng", 
       title = "Biểu đồ lợi nhuận của tiệm hủ tiếu") +
  scale_x_continuous(labels = comma)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

4. Thống kê mô tả

library(psych)
## 
## Attaching package: 'psych'
## The following objects are masked from 'package:scales':
## 
##     alpha, rescale
## The following objects are masked from 'package:ggplot2':
## 
##     %+%, alpha
describe(loinhuanmophong)
##    vars     n     mean        sd   median  trimmed       mad      min      max
## DT    1 10000 57560360 1113013.2 57555000 57563318 1119363.0 53275000 61295000
## CP    2 10000 51629580  937673.5 51629500 51631135  940709.7 48009000 54766000
## LN    3 10000  5910558 1456278.0  5937000  5922740 1467774.0  1005000  9936000
##      range  skew kurtosis       se
## DT 8020000 -0.03    -0.01 11130.13
## CP 6757000 -0.03    -0.03  9376.73
## LN 8931000 -0.12    -0.01 14562.78

Từ kết quả thống kê mô tả cho thấy:

Lợi nhuận trung bình của tiệm hủ tiếu là 5.1910.558 đồng

Lợi nhuận nhỏ nhất của tiệm hủ tiếu là 1.005.000 đồng

Lợi nhuận lớn nhất của tiệm hủ tiếu là 9.936.000 đồng

Độ lệch chuẩn thể hiện mức độ biến động và phân tán của dữ liệu. Độ lệch chuẩn của LN là 1456278.0

Độ lệch (Skewness)và độ nhọn (Kurtosis) có giá trị gần bằng 0 cho thấy dữ liệu có phân phối gần chuẩn.

BÀI TẬP CÂU 3

Dựa vào kết quả câu 2, ta biết để mô phỏng lợi nhuận cần mô phỏng số lượng chi phí biến đổi và doanh thu của tiệm hủ tiếu.

1. Khảo sát dữ liệu

Tiến hành khảo sát doanh thu và chi phí thực tế của các tiệm hủ tiếu có quy mô tương tương tự (quy mô nhỏ, có lượng khách từ 70 đến 90 khách/ngày) tại Rạch Giá. Em thu được bảng số lượng gồm 50 tháng với 19 biến như sau:

library(readxl)
dulieuthuthap <- read_excel("dulieuthuthap.xlsx")
library(DT)
dulieuthuthap %>% DT::datatable(dulieuthuthap)

Dựa vào dữ liệu thu thập được, ta có thể tính được trung bình và độ lệch chuẩn của các biến từ 50 quan sát này

library(psych)
describe(dulieuthuthap)
##        vars  n    mean    sd median trimmed   mad  min  max range  skew
## SLDT1     1 50 1123.30 33.75 1125.0 1124.35 37.06 1025 1182   157 -0.43
## SLDT2     2 50  954.56 27.07  952.5  954.58 32.62  895 1005   110  0.01
## SLDT3     3 50  194.36 18.41  197.5  194.80 18.53  155  232    77 -0.26
## SLDT4     4 50  299.88 18.14  299.5  299.08 18.53  267  345    78  0.35
## SLCP1     5 50  227.08 10.34  229.0  227.78  8.90  200  245    45 -0.57
## SLCP2     6 50  120.72  3.28  120.0  121.05  2.22  110  125    15 -0.83
## SLCP3     7 50  165.36  9.68  164.5  164.65 11.12  149  195    46  0.67
## SLCP4     8 50   37.10  2.48   37.0   37.05  2.97   32   45    13  0.44
## SLCP5     9 50   34.88  3.01   35.0   34.95  2.97   28   41    13 -0.11
## SLCP6    10 50    2.76  0.96    3.0    2.72  1.48    1    5     4  0.34
## SLCP7    11 50    6.04  1.21    6.0    6.00  1.48    4   10     6  0.53
## SLCP8    12 50    3.04  1.11    3.0    3.10  1.48    1    5     4 -0.25
## SLCP9    13 50   43.52  9.62   44.5   43.38  8.15   20   70    50  0.10
## SLCP10   14 50  171.56 17.39  170.0  170.98 14.83  130  215    85  0.25
## SLCP11   15 50   30.14  2.76   30.0   30.30  1.48   20   35    15 -0.93
## SLCP12   16 50   20.64  1.91   21.0   20.70  1.48   16   24     8 -0.26
## SLCP13   17 50  109.90  6.53  110.0  109.80  5.93   90  125    35 -0.10
## SLCP14   18 50   11.96  1.93   12.0   11.97  1.48    6   16    10 -0.28
## SLCP15   19 50    1.92  0.90    2.0    1.85  1.48    1    5     4  0.81
##        kurtosis   se
## SLDT1     -0.01 4.77
## SLDT2     -0.78 3.83
## SLDT3     -0.54 2.60
## SLDT4     -0.53 2.56
## SLCP1      0.12 1.46
## SLCP2      1.02 0.46
## SLCP3      0.46 1.37
## SLCP4      0.65 0.35
## SLCP5     -0.49 0.43
## SLCP6     -0.48 0.14
## SLCP7      0.82 0.17
## SLCP8     -0.88 0.16
## SLCP9      0.34 1.36
## SLCP10     0.14 2.46
## SLCP11     2.18 0.39
## SLCP12    -0.32 0.27
## SLCP13     0.75 0.92
## SLCP14     0.51 0.27
## SLCP15     0.66 0.13

2. Mô phỏng dữ liệu

Dựa vào định lý giới hạn trung tâm, phân phối trung bình mẫu sẽ là phân phối chuẩn. Tiến hành mô phỏng số lượng chi phí biến đổi và doanh thu của tiệm hủ tiếu hoạt động trong 10.000 tháng theo phân phối chuẩn với trung bình và độ lệch chuẩn thu được từ mẫu. Ta thu được bảng sau:

library(readxl)
dulieumophong <- read_excel("dulieumophong.xlsx")
library(DT)
dulieumophong %>% DT::datatable(dulieumophong)

3.Trực quan hóa dữ liệu mô phỏng

Tiến hành so sánh đồ thị dữ liệu thu thập và dữ liệu mô phỏng.Giả sử chỉ kiểm tra ngẫu nhiên 2 biến là SLDT1 và SLCP1

hist(dulieuthuthap$SLDT1)

hist(dulieumophong$SLDT1)

hist(dulieuthuthap$SLCP1)

hist(dulieumophong$SLCP1)

BÀI TẬP CÂU 2

Mô phỏng lợi nhuận của một tiệm hủ tiếu nhỏ ở Rạch Giá. Để tính được lợi nhuận thì cần phải dự kiến được doanh thu và chi phí khi hoạt động.

1. Dự kiến Doanh thu của tiệm (DT)

1.1. Số lượng (\(\mathrm{SLDT}_{\mathrm{i}}\))

  • SLDT1: Số lượng tô (hủ tiếu/ hủ tiếu mì/ hoành thánh) thịt

  • SLDT2: Số lượng tô (hủ tiếu/ hủ tiếu mì/ hoành thánh) thịt + xương hoặc giò

  • SLDT3: Thêm hủ tiếu/hủ tiếu mì/hoành thánh

  • SLDT4: Thêm thịt/ xương hoặc giò

1.2. Đơn giá (\(\mathrm{DGDT}_{\mathrm{i}}\))

  • ĐG1: 20.000 đồng/tô thịt

  • ĐG2: 30.000 đồng/tô thịt + xương hoặc giò

  • ĐG3: 10.000 đồng/ 1 phần thêm hủ tiếu/hủ tiếu mì/hoành thánh thêm

  • ĐG4: 15.000 đồng/ 1 phần thêm thịt/ xương hoặc giò thêm

Vậy tổng doanh thu dự kiến của tiệm: \(\mathrm{DT}=\sum_1^4 \mathrm{SLDT}_{\mathrm{i}}. \mathrm{DGDT}_{\mathrm{i}}\)

2. Dự kiến Chi phí của tiệm (CP)

2.1. Chi phí Cố định

  • Xe bán + bàn ghế + xoong nồi + tô chén đũa muỗng: 6.000.000/60= 100.000 đồng

  • Mặt bằng( đã bao gồm tiền nước): 2.000.000 đồng

  • Lương chủ: 5.000.000 đồng

  • Lương nhân viên phụ: 1.800.000 đồng

  • Đá: 150.000 đồng

  • Trà: 100.000 đồng

=> Tổng chi phí cố định = 9.150.000 đồng

2.2. Chi phí Biến đổi

2.2.1. Số lượng (\(\mathrm{SLCP}_{\mathrm{k}}\))

  • SLCP1: Giò xương (đơn vị: kg)

  • SLCP2: Thịt (đơn vị: kg)

  • SLCP3: Hủ tiếu (đơn vị: kg)

  • SLCP4: Mì (đơn vị: kg)

  • SLCP5: Hoành thánh (đơn vị: kg)

  • SLCP6: Nước mắm (đơn vị: chai)

  • SLCP7: Tương ớt + Tương đen (đơn vị: chai)

  • SLCP8: Gia vị gồm 5 kg đường + 5 kg muối + 5 kg bột ngọt

  • SLCP9: Hành hẹ (đơn vị: kg)

  • SLCP10: Giá (đơn vị: kg)

  • SLCP11: Chanh (đơn vị: kg)

  • SLCP12: Ớt (đơn vị: kg)

  • SLCP13: Rau (đơn vị: kg)

  • SLCP14: Hành phi (đơn vị: kg)

  • SLCP15: Bao bì + giấy ăn

2.2.2. Đơn giá (\(\mathrm{DGCP}_{\mathrm{k}}\))

\[ \begin{array}{|l|l|} \hline \text { - Giò xương (đơn vị: đồng/kg) } & 60.000 \\ \hline \text { - Thịt (đơn vi: đồng/kg) } & 120.000 \\ \hline \text { - Hủ tiếu (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Mì (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Hoành thánh (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Nước mắm (đơn vị: đồng/bầu) } & 90.000 \\ \hline \text { - Tương ớt + Tương đen (đơn vị: đồng/bầu) } & 40.000 \\ \hline \text { - Gia vị (đơn vị: đồng/lần) } & 250.000 \\ \hline \text { - Hành hẹ (đơn vị: đồng/kg) } & 12.000 \\ \hline \text { - Giá (đơn vị: đồng/kg) } & 12.000 \\ \hline \text { - Chanh (đơn vị: đồng/kg) } & 15.000 \\ \hline \text { - Ớt (đơn vị: đồng/kg) } & 25.000 \\ \hline \text { - Rau (đơn vị: đồng/kg) } & 30.000 \\ \hline \text { - Hành phi (đơn vị: đồng/kg) } & 80.000 \\ \hline \text { - Bao bì + giấy ăn (đơn vị: đồng/lần) } & 300.000 \\ \hline \end{array} \] => Tổng chi phí biến đổi = \(\sum_1^{\mathrm{n}} \mathrm{SLCP}_{\mathrm{k}} \cdot \mathrm{DGCP}_{\mathrm{k}}\)**

Vậy tổng chi phí dự kiến của tiệm:

CP = 9.150.000 + \(\sum_1^{\mathrm{n}} \mathrm{SLCP}_{\mathrm{k}} \cdot \mathrm{DGCP}_{\mathrm{k}}\)

Khi đó, lợi nhuận dự kiến của tiệm:

= Doanh thu - Chi phí

= \(\sum_1^4 \mathrm{SLDT}_{\mathrm{i}} \cdot DGDT_{\textrm{i}}-\left(9.150 .000+\sum_1^{\mathrm{n}} \mathrm{SLCP}_{\mathrm{k}} \cdot DGCP_{\mathrm{k}}\right)\)

Như vậy, để mô phỏng lợi nhuận cần mô phỏng số lượng doanh thu và số lượng chi phí biến đổi của tiệm hủ tiếu.

BÀI TẬP CÂU 1

1. Phân phối Poisson

Phân phối Poisson là phân phối cho biết xác xuất của sự kiện rời rạc xảy ra nhiều lần tại thời điểm ngẫu nhiên, trong một khoảng thời gian quy định. Sự kiện rời rạc có nghĩa là các sự kiện không ảnh hưởng trực tiếp đến nhau

Công thức

\(P(X=k)=e^-λ.\frac{λ ^k}{k!}\) k=0,1,2…

Đặc trưng số :

Kỳ vọng E(x) = λ

Phương sai Var(x)= λ

Mô phỏng ngẫu nhiên số ly nước cam bán được trong ngày có phân phối Poisson với tham số λ = 30 trong 1000 ngày.

a <- rpois(1000,30)
summary(a)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   14.00   26.00   30.00   29.88   34.00   48.00

Trung bình số ly nước cam bán được là 30 ly mỗi ngày trong 1000 ngày khảo sát, trong đó nhiều nhất là 50 ly, ít nhất là 14 ly.

hist(a, main= "Phân phối possion", xlab = "Số ly nước cam bán được trong ngày")

2. Phân phối đều

Biến ngẫu nhiên x được gọi là có phân phối đều trên đoạn:\([a,b]\)(a<b), ký hiệu X ~ U[a,b] nếu X có hàm mật độ là :

\[ f(x)=\left\{\begin{array}{cc} \frac{1}{b-a} & x \in[a, b] \\ 0 & x \notin[a, b] \end{array}\right. \] Đặc trưng số

Kỳ vọng \[ \mathrm{E}(\mathrm{X})=\frac{\mathrm{a}+\mathrm{b}}{2} \] Phương sai \[ \operatorname{Var}(X)=\frac{(\mathrm{b}-\mathrm{a})^2}{12} \] Mod(X) la giá trị bất kỳ nào trên đoạn a,b

Mô phỏng ngẫu nhiên số bánh mì bán được trong 1 ngày có phân phối đều trong khoảng 50-80 cái, trong 500 ngày

b <- runif(500,50,80)
summary(b)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   50.08   57.37   65.53   65.40   73.84   79.92

Số bánh trung bình mà quán bán được trong 500 ngày là 66 cái, ngày bán nhiều nhất 80 cái, ít nhất 50 cái

hist(b, main= "Phân  phối đều", xlab = "Số bánh bán trong ngày")

3.Phân phối nhị thức Binomial

Phân phối nhị thức với tham số p và n là tổng của n phép thử Bernoulli với xác suất p độc lập với nhau. Biến ngẫu nhiên có phân phối nhị thức nhận giá trị từ 0 đến n và xác suất để chọn ra x phần tử mong muốn trong n phần tử là \(\left(\begin{array}{l}n \\ x\end{array}\right) p^x(1-p)^{n-x}\) với \(\mathrm{x}=0,1,2, \ldots \mathrm{n}\).

Hàm xác xuất \(f(x)=\left(\begin{array}{l}n \\ x\end{array}\right) p^x(1-p)^{n-x} ; x=0,1,2, \ldots, n\)

Trung bình \(\mu=n p\)

Phương sai \(\sigma^2=n p(1-p)=n p q\)

Hàm sinh moment \(m(t)=\left(p e^t+q\right)^n\)

Biết rằng trong một quần thể dân số có khoảng 20% người mắc bệnh cao huyết áp; nếu chúng ta tiến hành chọn mẫu 500 lần ,mỗi lần chọn 30 người trong quần thể đó một cách ngẫu nhiên, sự phân phối số bệnh nhân cao huyết áp sẽ như thế nào ? Để trả lời câu hỏi này, chúng ta có thể ứng dụng hàm rbinom (n, k, p) trong R với những thông số như sau

c <- rbinom(500,30,0.2)
table(c)
## c
##  0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 
##  3  3 10 41 68 85 95 72 54 39 15 11  2  1  1

Dòng thứ nhất ( 0,1,2….13) là số bệnh nhân cao huyết áp trong 30 người ta chọn.Dòng thứ 2 cho ta biết số lần chọn mẫu trong 500 lần xảy ra, có 2 mẫu không có bệnh nhân cao huyết áp, có 5 mẫu chỉ có 1 bệnh nhân cao huyết áp.

hist(c, main= "Phân phối nhị thức Binomial", xlab = "Bệnh nhân cao huyết áp")

Phân phối số bệnh nhân cao huyết áp trong số 30 người được chọn ngẫu nhiên trong một quần thề gồm 20% bệnh nhân cao huyết áp, và chọn mẫu được lặp lại 500 lần

4. Phân phối chuẩn

Phân phối chuẩn, còn gọi là phân phối Gauss, là một phân phối xác suất cực kì quan trọng trong nhiều lĩnh vực. Nó là họ phân phối có dạng tổng quát giống nhau, chỉ khác tham số vị trí (giá trị trung bình \(\mu\) ) và tỉ lệ (phương sai \(\sigma^2\) ). BNN X có hàm mật độ xác xuất f phụ thuộc vào 2 tham số \(\mu\)\(\sigma\) ( \(\sigma\) >0 )

Hàm mật độ \(f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{(x-\mu)^2}{2 \sigma^2}} ; x \in R\)

Trung bình \(\mu\)

Phương sai \(\sigma^2\)

Hàm sinh moment \(m(t)=e^{\mu t+\frac{t^2 \sigma^2}{2}}\)

Khảo sát mức tiêu thụ điện của các hộ gia đình ở Cần Thơ trung bình là 150KWh,độ lệch chuẩn 30KW.Mô phỏng mức tiêu thụ điện trong 500 ngày tiếp theo

d <- rnorm(500,mean = 150, sd= 30)
summary(d)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    52.8   129.1   151.1   150.6   173.5   261.7

Mức tiêu thụ điện trung bình của người dân Cần Thơ là 149kwh,lượng tiêu thụ thấp nhất là 53kwh và cao nhất là 232kwh.

hist(d, main= "Phân phối chuẩn", xlab = "Mức tiêu thụ điện trung bình")

5. Phân phối mũ

Phân phối mũ (Exponential Distribution) hoặc phân phối mũ phủ định đại diện cho một phân phối xác suất giúp mô tả thời gian giữa hai sự kiện trong một quá trình Poisson. Trong quá trình Poisson, các sự kiện xảy ra liên tục và độc lập theo một tần suất trung bình không đổi. Phân phối mũ là một trường hợp đặc biệt của phân phối gamma.

Hàm mật độ xác suất của phân phối mũ được tính bởi công thức:

\[ \begin{cases}\lambda e^{-\lambda x}, & \text { if } x \geq 0 \\ 0, & \text { if } x<0\end{cases} \] Với

  • \(\lambda\) = biến số tần suất

  • \(x=\) biến ngẫu nhiên

Hàm phân phối tích lũy của phân phối mũ được tính bởi công thức:

\[ \begin{cases}1-e^{-\lambda x}, & \text { nếu } x \geq 0 \\ 0, & \text { nếu } x<0\end{cases} \]

với

  • \(\lambda\) = biến tỉ lệ

  • x = biến ngẫu nhiên

Mô phỏng số máy tính bảng bán ra tại một cửa hàng trong 500 ngày có phân phối mũ với xác xuất 20 %

e <- rexp(500,0.2)
summary(e)
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
##  0.001825  1.674618  3.663035  5.203685  7.531494 25.659794

Trung bình trong 500 ngày, có ngày cửa hàng không bán được cái nào, ngày cao nhất bán được 31 cái, trung bình bán được 3 cái/ ngày.

hist(e, main= "Phân phối mũ", xlab = "Số lượng máy tính bảng ")