BÀI TẬP TUẦN 3

Dựa vào định lý giới hạn trung tâm, giả sử các biến ngẫu nhiên đầu vào có phân phối chuẩn. Định lý giới hạn trung tâm cho rằng giá trị trung bình phân phối mẫu gần bằng với phân phối chuẩn khi kích thước mẫu càng lớn.

Dựa vào kết quả câu 2, ta biết để mô phỏng lợi nhuận cần mô phỏng số lượng chi phí biến đổi và doanh thu của tiệm hủ tiếu.

1. Khảo sát dữ liệu

Tiến hành khảo sát doanh thu và chi phí thực tế của các tiệm hủ tiếu có quy mô tương tương tự (quy mô nhỏ, có lượng khách từ 70 đến 90 khách/ngày) tại Rạch Giá. Em thu được bảng số lượng gồm 50 tháng với 19 biến như sau:

library(readxl)
dulieuthuthap <- read_excel("C:/Users/Heckler Koch/Documents/dulieuthuthap.xlsx")
library(DT)
dulieuthuthap %>% DT::datatable(dulieuthuthap)

Dựa vào dữ liệu thu thập được, ta có thể tính được trung bình và độ lệch chuẩn của các biến từ 50 quan sát này

library(psych)
describe(dulieuthuthap)
##      vars  n    mean    sd median trimmed   mad  min  max range  skew kurtosis
## DT1     1 50 1123.30 33.75 1125.0 1124.35 37.06 1025 1182   157 -0.43    -0.01
## DT2     2 50  954.56 27.07  952.5  954.58 32.62  895 1005   110  0.01    -0.78
## DT3     3 50  194.36 18.41  197.5  194.80 18.53  155  232    77 -0.26    -0.54
## DT4     4 50  299.88 18.14  299.5  299.08 18.53  267  345    78  0.35    -0.53
## CP1     5 50  227.08 10.34  229.0  227.78  8.90  200  245    45 -0.57     0.12
## CP2     6 50  120.72  3.28  120.0  121.05  2.22  110  125    15 -0.83     1.02
## CP3     7 50  165.36  9.68  164.5  164.65 11.12  149  195    46  0.67     0.46
## CP4     8 50   37.10  2.48   37.0   37.05  2.97   32   45    13  0.44     0.65
## CP5     9 50   34.88  3.01   35.0   34.95  2.97   28   41    13 -0.11    -0.49
## CP6    10 50    2.76  0.96    3.0    2.72  1.48    1    5     4  0.34    -0.48
## CP7    11 50    6.04  1.21    6.0    6.00  1.48    4   10     6  0.53     0.82
## CP8    12 50    3.04  1.11    3.0    3.10  1.48    1    5     4 -0.25    -0.88
## CP9    13 50   43.52  9.62   44.5   43.38  8.15   20   70    50  0.10     0.34
## CP10   14 50  171.56 17.39  170.0  170.98 14.83  130  215    85  0.25     0.14
## CP11   15 50   30.14  2.76   30.0   30.30  1.48   20   35    15 -0.93     2.18
## CP12   16 50   20.64  1.91   21.0   20.70  1.48   16   24     8 -0.26    -0.32
## CP13   17 50  109.90  6.53  110.0  109.80  5.93   90  125    35 -0.10     0.75
## CP14   18 50   11.96  1.93   12.0   11.97  1.48    6   16    10 -0.28     0.51
## CP15   19 50    1.92  0.90    2.0    1.85  1.48    1    5     4  0.81     0.66
##        se
## DT1  4.77
## DT2  3.83
## DT3  2.60
## DT4  2.56
## CP1  1.46
## CP2  0.46
## CP3  1.37
## CP4  0.35
## CP5  0.43
## CP6  0.14
## CP7  0.17
## CP8  0.16
## CP9  1.36
## CP10 2.46
## CP11 0.39
## CP12 0.27
## CP13 0.92
## CP14 0.27
## CP15 0.13

2. Mô phỏng dữ liệu

Tiến hành mô phỏng số lượng chi phí biến đổi và doanh thu của tiệm hủ tiếu hoạt động trong 10.000 tháng theo phân phối chuẩn với trung bình và độ lệch chuẩn thu được từ mẫu. Ta thu được bảng sau:

library(readxl)
dulieumophong <- read_excel("C:/Users/Heckler Koch/Documents/dulieumophong.xlsx")
library(DT)
dulieumophong %>% DT::datatable(dulieumophong)

3.Trực quan hóa dữ liệu mô phỏng

Tiến hành so sánh đồ thị dữ liệu thu thập và dữ liệu mô phỏng.Giả sử chỉ kiểm tra ngẫu nhiên 2 biến là DT1 và CP1

hist(dulieuthuthap$DT1)

hist(dulieumophong$DT1)

hist(dulieuthuthap$CP1)

hist(dulieumophong$CP1)

Dựa vào đồ thị có thể kết luận các biến ngẫu nhiên đầu vào có phân phối chuẩn.

BÀI TẬP TUẦN 2

Dữ liệu nghiên cứu : Mô phỏng lợi nhuận của một tiệm hủ tiếu nhỏ ở Rạch Giá. Để tính được lợi nhuận thì cần phải dự kiến được doanh thu và chi phí khi hoạt động.

1 Dự kiến Doanh thu của tiệm

1.1 Số lượng (\(\mathrm{SL}_{\mathrm{i}}\))

SL1: Tô (hủ tiếu/ hủ tiếu mì/ hoành thánh) thịt

SL2: Tô (hủ tiếu/ hủ tiếu mì/ hoành thánh) thịt + xương hoặc giò

SL3: Thêm hủ tiếu/hủ tiếu mì/hoành thánh

SL4: Thêm thịt/ xương hoặc giò

1.2 Đơn giá (\(\mathrm{DG}_{\mathrm{i}}\))

ĐG1: 20.000 đồng/ tô thường

ĐG2: 30.000 đồng/ tô đặc biệt

ĐG3: 10.000 đồng/ 1 phần hủ tiếu/hủ tiếu mì/hoành thánh thêm

ĐG4: 15.000 đồng/ 1 phần thịt/ xương hoặc giò thêm

Vậy \(\mathrm{DT}=\sum_1^4 \mathrm{SL}_{\mathrm{i}}. \mathrm{DG}_{\mathrm{i}}\)

2.Dự kiến Chi phí của tiệm

2.1 Chi phí Cố định

  • Xe bán + bàn ghế + xoong nồi + tô chén đũa muỗng: 6.000.000/60= 100.000 đồng

  • Mặt bằng( đã bao gồm tiền nước): 2 triệu

  • Lương nhân viên phụ: 1.800.000 đồng

  • Đá: 150.000 đồng

  • Trà: 100.000 đồng

Tổng chi phí cố định = 4.150.000

2.2 Chi phí Biến đổi

(B1) Số lượng (\(\mathrm{SL}_{\mathrm{k}}\))

  • Giò xương (đơn vị: kg)
  • Thịt (đơn vị: kg)
  • Hủ tiếu (đơn vị: kg)
  • Mì (đơn vị: kg)
  • Hoành thánh (đơn vị: kg)
  • Nước mắm (đơn vị: chai)
  • Tương ớt + Tương đen (đơn vị: chai)
  • Gia vị gồm 5 kg đường + 5 kg muối + 5 kg bột ngọt
  • Hành hẹ (đơn vị: kg)
  • Giá (đơn vị: kg)
  • Chanh (đơn vị: kg)
  • Ớt (đơn vị: kg)
  • Rau (đơn vị: kg)
  • Hành phi (đơn vị: kg)
  • Bao bì + giấy ăn

(B2) Đơn giá (\(\mathrm{DG}_{\mathrm{k}}\))

\[ \begin{array}{|l|l|} \hline \text { - Xương giò (đơn vị: đồng/kg) } & 60.000 \\ \hline \text { - Thịt (đơn vi: đồng/kg) } & 120.000 \\ \hline \text { - Hủ tiếu (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Mì (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Hoành thánh (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Nước mắm (đơn vị: đồng/chai) } & 90.000 \\ \hline \text { - Tương ớt + Tương đen (đơn vị: đồng/bầu) } & 40.000 \\ \hline \text { - Gia vị (đơn vị: đồng/lần) } & 250.000 \\ \hline \text { - Hành hẹ (đơn vị: đồng/kg) } & 12.000 \\ \hline \text { - Giá (đơn vị: đồng/kg) } & 12.000 \\ \hline \text { - Chanh (đơn vị: đồng/kg) } & 15.000 \\ \hline \text { - Ớt (đơn vị: đồng/kg) } & 25.000 \\ \hline \text { - Rau (đơn vị: đồng/kg) } & 30.000 \\ \hline \text { - Hành phi (đơn vị: đồng/kg) } & 80.000 \\ \hline \text { - Bao bì + giấy ăn (đơn vị: đồng/lần) } & 300.000 \\ \hline \end{array} \] Tổng chi phí biến đổi = \(\sum_1^{\mathrm{n}} \mathrm{SL}_{\mathrm{k}} \cdot \mathrm{DG}_{\mathrm{k}}\)

Vậy Chi phí = 4.150.000 + \(\sum_1^{\mathrm{n}} \mathrm{SL}_{\mathrm{k}} \cdot \mathrm{DG}_{\mathrm{k}}\)

Khi đó Lợi nhuận = Doanh thu - Chi phí = \(\sum_1^4 \mathrm{DT}_{\mathrm{i}} \cdot DG_{\textrm{i}}-\left(4.150 .000+\sum_1^{\mathrm{n}} \mathrm{SL}_{\mathrm{k}} \cdot D \mathrm{G}_{\mathrm{k}}\right)\)

Ngoài ra còn có các chi phí phát sinh không thường xuyên như phạt lấn chiếm vỉa hè nếu để xe hoặc lấn chiếm lề đường 2.5 triệu/ lần. Các hư hỏng vật chất cần thay thế sửa chữa….không tính vào.

Để mô phỏng lợi nhuận cần mô phỏng số lượng chi phí biến đổi và doanh thu của tiệm hủ tiếu

BÀI TẬP TUẦN 1

1. Phân phối Poisson

Phân phối Poisson là phân phối cho biết xác xuất của sự kiện rời rạc xảy ra nhiều lần tại thời điểm ngẫu nhiên, trong một khoảng thời gian quy định. Sự kiện rời rạc có nghĩa là các sự kiện không ảnh hưởng trực tiếp đến nhau

Công thức

\(P(X=k)=e^-λ.\frac{λ ^k}{k!}\) k=0,1,2…

Đặc trưng số :

Kỳ vọng E(x) = λ

Phương sai Var(x)= λ

Mô phỏng ngẫu nhiên số ly nước cam bán được trong ngày có phân phối Poisson với tham số λ = 30 trong 1000 ngày.

a <- rpois(1000,30)
summary(a)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   14.00   26.00   30.00   29.97   34.00   49.00

Trung bình số ly nước cam bán được là 30 ly mỗi ngày trong 1000 ngày khảo sát, trong đó nhiều nhất là 50 ly, ít nhất là 14 ly.

hist(a, main= "Phân phối possion", xlab = "Số ly nước cam bán được trong ngày")

2. Phân phối đều

Biến ngẫu nhiên x được gọi là có phân phối đều trên đoạn:\([a,b]\)(a<b), ký hiệu X ~ U[a,b] nếu X có hàm mật độ là :

\[ f(x)=\left\{\begin{array}{cc} \frac{1}{b-a} & x \in[a, b] \\ 0 & x \notin[a, b] \end{array}\right. \] Đặc trưng số

Kỳ vọng \[ \mathrm{E}(\mathrm{X})=\frac{\mathrm{a}+\mathrm{b}}{2} \] Phương sai \[ \operatorname{Var}(X)=\frac{(\mathrm{b}-\mathrm{a})^2}{12} \] Mod(X) la giá trị bất kỳ nào trên đoạn a,b

Mô phỏng ngẫu nhiên số bánh mì bán được trong 1 ngày có phân phối đều trong khoảng 50-80 cái, trong 500 ngày

b <- runif(500,50,80)
summary(b)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   50.00   57.96   64.63   64.79   72.18   79.92

Số bánh trung bình mà quán bán được trong 500 ngày là 66 cái, ngày bán nhiều nhất 80 cái, ít nhất 50 cái

hist(b, main= "Phân  phối đều", xlab = "Số bánh bán trong ngày")

3.Phân phối nhị thức Binomial

Phân phối nhị thức với tham số p và n là tổng của n phép thử Bernoulli với xác suất p độc lập với nhau. Biến ngẫu nhiên có phân phối nhị thức nhận giá trị từ 0 đến n và xác suất để chọn ra x phần tử mong muốn trong n phần tử là \(\left(\begin{array}{l}n \\ x\end{array}\right) p^x(1-p)^{n-x}\) với \(\mathrm{x}=0,1,2, \ldots \mathrm{n}\).

Hàm xác xuất \(f(x)=\left(\begin{array}{l}n \\ x\end{array}\right) p^x(1-p)^{n-x} ; x=0,1,2, \ldots, n\)

Trung bình \(\mu=n p\)

Phương sai \(\sigma^2=n p(1-p)=n p q\)

Hàm sinh moment \(m(t)=\left(p e^t+q\right)^n\)

Biết rằng trong một quần thể dân số có khoảng 20% người mắc bệnh cao huyết áp; nếu chúng ta tiến hành chọn mẫu 500 lần ,mỗi lần chọn 30 người trong quần thể đó một cách ngẫu nhiên, sự phân phối số bệnh nhân cao huyết áp sẽ như thế nào ? Để trả lời câu hỏi này, chúng ta có thể ứng dụng hàm rbinom (n, k, p) trong R với những thông số như sau

c <- rbinom(500,30,0.2)
table(c)
## c
##  0  1  2  3  4  5  6  7  8  9 10 11 12 13 
##  1  5 13 38 62 77 84 83 61 38 18 10  8  2

Dòng thứ nhất ( 0,1,2….13) là số bệnh nhân cao huyết áp trong 30 người ta chọn.Dòng thứ 2 cho ta biết số lần chọn mẫu trong 500 lần xảy ra, có 2 mẫu không có bệnh nhân cao huyết áp, có 5 mẫu chỉ có 1 bệnh nhân cao huyết áp.

hist(c, main= "Phân phối nhị thức Binomial", xlab = "Bệnh nhân cao huyết áp")

Phân phối số bệnh nhân cao huyết áp trong số 30 người được chọn ngẫu nhiên trong một quần thề gồm 20% bệnh nhân cao huyết áp, và chọn mẫu được lặp lại 500 lần

4. Phân phối chuẩn

Phân phối chuẩn, còn gọi là phân phối Gauss, là một phân phối xác suất cực kì quan trọng trong nhiều lĩnh vực. Nó là họ phân phối có dạng tổng quát giống nhau, chỉ khác tham số vị trí (giá trị trung bình \(\mu\) ) và tỉ lệ (phương sai \(\sigma^2\) ). BNN X có hàm mật độ xác xuất f phụ thuộc vào 2 tham số \(\mu\)\(\sigma\) ( \(\sigma\) >0 )

Hàm mật độ \(f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{(x-\mu)^2}{2 \sigma^2}} ; x \in R\)

Trung bình \(\mu\)

Phương sai \(\sigma^2\)

Hàm sinh moment \(m(t)=e^{\mu t+\frac{t^2 \sigma^2}{2}}\)

Khảo sát mức tiêu thụ điện của các hộ gia đình ở Cần Thơ trung bình là 150KWh,độ lệch chuẩn 30KW.Mô phỏng mức tiêu thụ điện trong 500 ngày tiếp theo

d <- rnorm(500,mean = 150, sd= 30)
summary(d)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   47.06  132.85  149.62  149.70  170.34  233.90

Mức tiêu thụ điện trung bình của người dân Cần Thơ là 149kwh,lượng tiêu thụ thấp nhất là 53kwh và cao nhất là 232kwh.

hist(d, main= "Phân phối chuẩn", xlab = "Mức tiêu thụ điện trung bình")

5. Phân phối mũ

Phân phối mũ (Exponential Distribution) hoặc phân phối mũ phủ định đại diện cho một phân phối xác suất giúp mô tả thời gian giữa hai sự kiện trong một quá trình Poisson. Trong quá trình Poisson, các sự kiện xảy ra liên tục và độc lập theo một tần suất trung bình không đổi. Phân phối mũ là một trường hợp đặc biệt của phân phối gamma.

Hàm mật độ xác suất của phân phối mũ được tính bởi công thức:

\[ \begin{cases}\lambda e^{-\lambda x}, & \text { if } x \geq 0 \\ 0, & \text { if } x<0\end{cases} \] Với

  • \(\lambda\) = biến số tần suất

  • \(x=\) biến ngẫu nhiên

Hàm phân phối tích lũy của phân phối mũ được tính bởi công thức:

\[ \begin{cases}1-e^{-\lambda x}, & \text { nếu } x \geq 0 \\ 0, & \text { nếu } x<0\end{cases} \]

với

  • \(\lambda\) = biến tỉ lệ

  • x = biến ngẫu nhiên

Mô phỏng số máy tính bảng bán ra tại một cửa hàng trong 500 ngày có phân phối mũ với xác xuất 20 %

e <- rexp(500,0.2)
summary(e)
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
##  0.004776  1.478221  3.610875  5.006973  7.031192 27.501388

Trung bình trong 500 ngày, có ngày cửa hàng không bán được cái nào, ngày cao nhất bán được 31 cái, trung bình bán được 3 cái/ ngày.

hist(e, main= "Phân phối mũ", xlab = "Số lượng máy tính bảng ")