Dựa vào định lý giới hạn trung tâm, giả sử các biến ngẫu nhiên đầu vào có phân phối chuẩn. Định lý giới hạn trung tâm cho rằng giá trị trung bình phân phối mẫu gần bằng với phân phối chuẩn khi kích thước mẫu càng lớn.
Dựa vào kết quả câu 2, ta biết để mô phỏng lợi nhuận cần mô phỏng số lượng chi phí biến đổi và doanh thu của tiệm hủ tiếu.
Tiến hành khảo sát doanh thu và chi phí thực tế của các tiệm hủ tiếu có quy mô tương tương tự (quy mô nhỏ, có lượng khách từ 70 đến 90 khách/ngày) tại Rạch Giá. Em thu được bảng số lượng gồm 50 tháng với 19 biến như sau:
library(readxl)
dulieuthuthap <- read_excel("C:/Users/Heckler Koch/Documents/dulieuthuthap.xlsx")
library(DT)
dulieuthuthap %>% DT::datatable(dulieuthuthap)
Dựa vào dữ liệu thu thập được, ta có thể tính được trung bình và độ lệch chuẩn của các biến từ 50 quan sát này
library(psych)
describe(dulieuthuthap)
## vars n mean sd median trimmed mad min max range skew kurtosis
## DT1 1 50 1123.30 33.75 1125.0 1124.35 37.06 1025 1182 157 -0.43 -0.01
## DT2 2 50 954.56 27.07 952.5 954.58 32.62 895 1005 110 0.01 -0.78
## DT3 3 50 194.36 18.41 197.5 194.80 18.53 155 232 77 -0.26 -0.54
## DT4 4 50 299.88 18.14 299.5 299.08 18.53 267 345 78 0.35 -0.53
## CP1 5 50 227.08 10.34 229.0 227.78 8.90 200 245 45 -0.57 0.12
## CP2 6 50 120.72 3.28 120.0 121.05 2.22 110 125 15 -0.83 1.02
## CP3 7 50 165.36 9.68 164.5 164.65 11.12 149 195 46 0.67 0.46
## CP4 8 50 37.10 2.48 37.0 37.05 2.97 32 45 13 0.44 0.65
## CP5 9 50 34.88 3.01 35.0 34.95 2.97 28 41 13 -0.11 -0.49
## CP6 10 50 2.76 0.96 3.0 2.72 1.48 1 5 4 0.34 -0.48
## CP7 11 50 6.04 1.21 6.0 6.00 1.48 4 10 6 0.53 0.82
## CP8 12 50 3.04 1.11 3.0 3.10 1.48 1 5 4 -0.25 -0.88
## CP9 13 50 43.52 9.62 44.5 43.38 8.15 20 70 50 0.10 0.34
## CP10 14 50 171.56 17.39 170.0 170.98 14.83 130 215 85 0.25 0.14
## CP11 15 50 30.14 2.76 30.0 30.30 1.48 20 35 15 -0.93 2.18
## CP12 16 50 20.64 1.91 21.0 20.70 1.48 16 24 8 -0.26 -0.32
## CP13 17 50 109.90 6.53 110.0 109.80 5.93 90 125 35 -0.10 0.75
## CP14 18 50 11.96 1.93 12.0 11.97 1.48 6 16 10 -0.28 0.51
## CP15 19 50 1.92 0.90 2.0 1.85 1.48 1 5 4 0.81 0.66
## se
## DT1 4.77
## DT2 3.83
## DT3 2.60
## DT4 2.56
## CP1 1.46
## CP2 0.46
## CP3 1.37
## CP4 0.35
## CP5 0.43
## CP6 0.14
## CP7 0.17
## CP8 0.16
## CP9 1.36
## CP10 2.46
## CP11 0.39
## CP12 0.27
## CP13 0.92
## CP14 0.27
## CP15 0.13
Tiến hành mô phỏng số lượng chi phí biến đổi và doanh thu của tiệm hủ tiếu hoạt động trong 10.000 tháng theo phân phối chuẩn với trung bình và độ lệch chuẩn thu được từ mẫu. Ta thu được bảng sau:
library(readxl)
dulieumophong <- read_excel("C:/Users/Heckler Koch/Documents/dulieumophong.xlsx")
library(DT)
dulieumophong %>% DT::datatable(dulieumophong)
Tiến hành so sánh đồ thị dữ liệu thu thập và dữ liệu mô phỏng.Giả sử chỉ kiểm tra ngẫu nhiên 2 biến là DT1 và CP1
hist(dulieuthuthap$DT1)
hist(dulieumophong$DT1)
hist(dulieuthuthap$CP1)
hist(dulieumophong$CP1)
Dựa vào đồ thị có thể kết luận các biến ngẫu nhiên đầu vào có phân phối chuẩn.
Dữ liệu nghiên cứu : Mô phỏng lợi nhuận của một tiệm hủ tiếu nhỏ ở Rạch Giá. Để tính được lợi nhuận thì cần phải dự kiến được doanh thu và chi phí khi hoạt động.
SL1: Tô (hủ tiếu/ hủ tiếu mì/ hoành thánh) thịt
SL2: Tô (hủ tiếu/ hủ tiếu mì/ hoành thánh) thịt + xương hoặc giò
SL3: Thêm hủ tiếu/hủ tiếu mì/hoành thánh
SL4: Thêm thịt/ xương hoặc giò
ĐG1: 20.000 đồng/ tô thường
ĐG2: 30.000 đồng/ tô đặc biệt
ĐG3: 10.000 đồng/ 1 phần hủ tiếu/hủ tiếu mì/hoành thánh thêm
ĐG4: 15.000 đồng/ 1 phần thịt/ xương hoặc giò thêm
Vậy \(\mathrm{DT}=\sum_1^4 \mathrm{SL}_{\mathrm{i}}. \mathrm{DG}_{\mathrm{i}}\)
Xe bán + bàn ghế + xoong nồi + tô chén đũa muỗng: 6.000.000/60= 100.000 đồng
Mặt bằng( đã bao gồm tiền nước): 2 triệu
Lương nhân viên phụ: 1.800.000 đồng
Đá: 150.000 đồng
Trà: 100.000 đồng
Tổng chi phí cố định = 4.150.000
(B1) Số lượng (\(\mathrm{SL}_{\mathrm{k}}\))
(B2) Đơn giá (\(\mathrm{DG}_{\mathrm{k}}\))
\[ \begin{array}{|l|l|} \hline \text { - Xương giò (đơn vị: đồng/kg) } & 60.000 \\ \hline \text { - Thịt (đơn vi: đồng/kg) } & 120.000 \\ \hline \text { - Hủ tiếu (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Mì (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Hoành thánh (đơn vị: đồng/kg) } & 20.000 \\ \hline \text { - Nước mắm (đơn vị: đồng/chai) } & 90.000 \\ \hline \text { - Tương ớt + Tương đen (đơn vị: đồng/bầu) } & 40.000 \\ \hline \text { - Gia vị (đơn vị: đồng/lần) } & 250.000 \\ \hline \text { - Hành hẹ (đơn vị: đồng/kg) } & 12.000 \\ \hline \text { - Giá (đơn vị: đồng/kg) } & 12.000 \\ \hline \text { - Chanh (đơn vị: đồng/kg) } & 15.000 \\ \hline \text { - Ớt (đơn vị: đồng/kg) } & 25.000 \\ \hline \text { - Rau (đơn vị: đồng/kg) } & 30.000 \\ \hline \text { - Hành phi (đơn vị: đồng/kg) } & 80.000 \\ \hline \text { - Bao bì + giấy ăn (đơn vị: đồng/lần) } & 300.000 \\ \hline \end{array} \] Tổng chi phí biến đổi = \(\sum_1^{\mathrm{n}} \mathrm{SL}_{\mathrm{k}} \cdot \mathrm{DG}_{\mathrm{k}}\)
Vậy Chi phí = 4.150.000 + \(\sum_1^{\mathrm{n}} \mathrm{SL}_{\mathrm{k}} \cdot \mathrm{DG}_{\mathrm{k}}\)
Khi đó Lợi nhuận = Doanh thu - Chi phí = \(\sum_1^4 \mathrm{DT}_{\mathrm{i}} \cdot DG_{\textrm{i}}-\left(4.150 .000+\sum_1^{\mathrm{n}} \mathrm{SL}_{\mathrm{k}} \cdot D \mathrm{G}_{\mathrm{k}}\right)\)
Ngoài ra còn có các chi phí phát sinh không thường xuyên như phạt lấn chiếm vỉa hè nếu để xe hoặc lấn chiếm lề đường 2.5 triệu/ lần. Các hư hỏng vật chất cần thay thế sửa chữa….không tính vào.
Để mô phỏng lợi nhuận cần mô phỏng số lượng chi phí biến đổi và doanh thu của tiệm hủ tiếu
Phân phối Poisson là phân phối cho biết xác xuất của sự kiện rời rạc xảy ra nhiều lần tại thời điểm ngẫu nhiên, trong một khoảng thời gian quy định. Sự kiện rời rạc có nghĩa là các sự kiện không ảnh hưởng trực tiếp đến nhau
Công thức
\(P(X=k)=e^-λ.\frac{λ ^k}{k!}\) k=0,1,2…
Đặc trưng số :
Kỳ vọng E(x) = λ
Phương sai Var(x)= λ
Mô phỏng ngẫu nhiên số ly nước cam bán được trong ngày có phân phối Poisson với tham số λ = 30 trong 1000 ngày.
a <- rpois(1000,30)
summary(a)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 14.00 26.00 30.00 29.97 34.00 49.00
Trung bình số ly nước cam bán được là 30 ly mỗi ngày trong 1000 ngày khảo sát, trong đó nhiều nhất là 50 ly, ít nhất là 14 ly.
hist(a, main= "Phân phối possion", xlab = "Số ly nước cam bán được trong ngày")
Biến ngẫu nhiên x được gọi là có phân phối đều trên đoạn:\([a,b]\)(a<b), ký hiệu X ~ U[a,b] nếu X có hàm mật độ là :
\[ f(x)=\left\{\begin{array}{cc} \frac{1}{b-a} & x \in[a, b] \\ 0 & x \notin[a, b] \end{array}\right. \] Đặc trưng số
Kỳ vọng \[ \mathrm{E}(\mathrm{X})=\frac{\mathrm{a}+\mathrm{b}}{2} \] Phương sai \[ \operatorname{Var}(X)=\frac{(\mathrm{b}-\mathrm{a})^2}{12} \] Mod(X) la giá trị bất kỳ nào trên đoạn a,b
Mô phỏng ngẫu nhiên số bánh mì bán được trong 1 ngày có phân phối đều trong khoảng 50-80 cái, trong 500 ngày
b <- runif(500,50,80)
summary(b)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 50.00 57.96 64.63 64.79 72.18 79.92
Số bánh trung bình mà quán bán được trong 500 ngày là 66 cái, ngày bán nhiều nhất 80 cái, ít nhất 50 cái
hist(b, main= "Phân phối đều", xlab = "Số bánh bán trong ngày")
Phân phối nhị thức với tham số p và n là tổng của n phép thử Bernoulli với xác suất p độc lập với nhau. Biến ngẫu nhiên có phân phối nhị thức nhận giá trị từ 0 đến n và xác suất để chọn ra x phần tử mong muốn trong n phần tử là \(\left(\begin{array}{l}n \\ x\end{array}\right) p^x(1-p)^{n-x}\) với \(\mathrm{x}=0,1,2, \ldots \mathrm{n}\).
Hàm xác xuất \(f(x)=\left(\begin{array}{l}n \\ x\end{array}\right) p^x(1-p)^{n-x} ; x=0,1,2, \ldots, n\)
Trung bình \(\mu=n p\)
Phương sai \(\sigma^2=n p(1-p)=n p q\)
Hàm sinh moment \(m(t)=\left(p e^t+q\right)^n\)
Biết rằng trong một quần thể dân số có khoảng 20% người mắc bệnh cao huyết áp; nếu chúng ta tiến hành chọn mẫu 500 lần ,mỗi lần chọn 30 người trong quần thể đó một cách ngẫu nhiên, sự phân phối số bệnh nhân cao huyết áp sẽ như thế nào ? Để trả lời câu hỏi này, chúng ta có thể ứng dụng hàm rbinom (n, k, p) trong R với những thông số như sau
c <- rbinom(500,30,0.2)
table(c)
## c
## 0 1 2 3 4 5 6 7 8 9 10 11 12 13
## 1 5 13 38 62 77 84 83 61 38 18 10 8 2
Dòng thứ nhất ( 0,1,2….13) là số bệnh nhân cao huyết áp trong 30 người ta chọn.Dòng thứ 2 cho ta biết số lần chọn mẫu trong 500 lần xảy ra, có 2 mẫu không có bệnh nhân cao huyết áp, có 5 mẫu chỉ có 1 bệnh nhân cao huyết áp.
hist(c, main= "Phân phối nhị thức Binomial", xlab = "Bệnh nhân cao huyết áp")
Phân phối số bệnh nhân cao huyết áp trong số 30 người được chọn ngẫu nhiên trong một quần thề gồm 20% bệnh nhân cao huyết áp, và chọn mẫu được lặp lại 500 lần
Phân phối chuẩn, còn gọi là phân phối Gauss, là một phân phối xác suất cực kì quan trọng trong nhiều lĩnh vực. Nó là họ phân phối có dạng tổng quát giống nhau, chỉ khác tham số vị trí (giá trị trung bình \(\mu\) ) và tỉ lệ (phương sai \(\sigma^2\) ). BNN X có hàm mật độ xác xuất f phụ thuộc vào 2 tham số \(\mu\) và \(\sigma\) ( \(\sigma\) >0 )
Hàm mật độ \(f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{(x-\mu)^2}{2 \sigma^2}} ; x \in R\)
Trung bình \(\mu\)
Phương sai \(\sigma^2\)
Hàm sinh moment \(m(t)=e^{\mu t+\frac{t^2 \sigma^2}{2}}\)
Khảo sát mức tiêu thụ điện của các hộ gia đình ở Cần Thơ trung bình là 150KWh,độ lệch chuẩn 30KW.Mô phỏng mức tiêu thụ điện trong 500 ngày tiếp theo
d <- rnorm(500,mean = 150, sd= 30)
summary(d)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 47.06 132.85 149.62 149.70 170.34 233.90
Mức tiêu thụ điện trung bình của người dân Cần Thơ là 149kwh,lượng tiêu thụ thấp nhất là 53kwh và cao nhất là 232kwh.
hist(d, main= "Phân phối chuẩn", xlab = "Mức tiêu thụ điện trung bình")
Phân phối mũ (Exponential Distribution) hoặc phân phối mũ phủ định đại diện cho một phân phối xác suất giúp mô tả thời gian giữa hai sự kiện trong một quá trình Poisson. Trong quá trình Poisson, các sự kiện xảy ra liên tục và độc lập theo một tần suất trung bình không đổi. Phân phối mũ là một trường hợp đặc biệt của phân phối gamma.
Hàm mật độ xác suất của phân phối mũ được tính bởi công thức:
\[ \begin{cases}\lambda e^{-\lambda x}, & \text { if } x \geq 0 \\ 0, & \text { if } x<0\end{cases} \] Với
\(\lambda\) = biến số tần suất
\(x=\) biến ngẫu nhiên
Hàm phân phối tích lũy của phân phối mũ được tính bởi công thức:
\[ \begin{cases}1-e^{-\lambda x}, & \text { nếu } x \geq 0 \\ 0, & \text { nếu } x<0\end{cases} \]
với
\(\lambda\) = biến tỉ lệ
x = biến ngẫu nhiên
Mô phỏng số máy tính bảng bán ra tại một cửa hàng trong 500 ngày có phân phối mũ với xác xuất 20 %
e <- rexp(500,0.2)
summary(e)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.004776 1.478221 3.610875 5.006973 7.031192 27.501388
Trung bình trong 500 ngày, có ngày cửa hàng không bán được cái nào, ngày cao nhất bán được 31 cái, trung bình bán được 3 cái/ ngày.
hist(e, main= "Phân phối mũ", xlab = "Số lượng máy tính bảng ")