Phân phối Poisson là phân phối cho biết xác xuất của sự kiện rời rạc xảy ra nhiều lần tại thời điểm ngẫu nhiên, trong một khoảng thời gian quy định. Sự kiện rời rạc có nghĩa là các sự kiện không ảnh hưởng trực tiếp đến nhau
Công thức
\(P(X=k)=e^-λ.\frac{λ ^k}{k!}\) k=0,1,2…
Đặc trưng số :
Kỳ vọng E(x) = λ
Phương sai Var(x)= λ
Mô phỏng ngẫu nhiên số ly nước cam bán được trong ngày có phân phối Poisson với tham số λ = 30 trong 1000 ngày.
a <- rpois(1000,30)
summary(a)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 14.00 26.00 30.00 30.08 33.00 48.00
Trung bình số ly nước cam bán được là 30 ly mỗi ngày trong 1000 ngày khảo sát, trong đó nhiều nhất là 49 ly, ít nhất là 13 ly.
hist(a, main= "Phân phối possion", xlab = "Số ly nước cam bán được trong ngày")
Biến ngẫu nhiên x được gọi là có phân phối đều trên đoạn:\([a,b]\)(a<b), ký hiệu X ~ U[a,b] nếu X có hàm mật độ là :
\[ f(x)=\left\{\begin{array}{cc} \frac{1}{b-a} & x \in[a, b] \\ 0 & x \notin[a, b] \end{array}\right. \] Đặc trưng số
Kỳ vọng \[ \mathrm{E}(\mathrm{X})=\frac{\mathrm{a}+\mathrm{b}}{2} \] Phương sai \[ \operatorname{Var}(X)=\frac{(\mathrm{b}-\mathrm{a})^2}{12} \] Mod(X) la giá trị bất kỳ nào trên đoạn a,b
Mô phỏng ngẫu nhiên số bánh mì bán được trong 1 ngày có phân phối đều trong khoảng 50-80 cái, trong 500 ngày
b <- runif(500,50,80)
summary(b)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 50.00 58.32 65.64 65.38 72.77 79.96
Số bánh trung bình mà quán bán được trong 500 ngày là 65 cái, ngày bán nhiều nhất 80 cái, ít nhất 50 cái
hist(b, main= "Phân phối đều", xlab = "Số bánh bán trong ngày")
Phân phối nhị thức với tham số p và n là tổng của n phép thử Bernoulli với xác suất p độc lập với nhau. Biến ngẫu nhiên có phân phối nhị thức nhận giá trị từ 0 đến n và xác suất để chọn ra x phần tử mong muốn trong n phần tử là \(\left(\begin{array}{l}n \\ x\end{array}\right) p^x(1-p)^{n-x}\) với \(\mathrm{x}=0,1,2, \ldots \mathrm{n}\).
Hàm xác xuất \(f(x)=\left(\begin{array}{l}n \\ x\end{array}\right) p^x(1-p)^{n-x} ; x=0,1,2, \ldots, n\)
Trung bình \(\mu=n p\)
Phương sai \(\sigma^2=n p(1-p)=n p q\)
Hàm sinh moment \(m(t)=\left(p e^t+q\right)^n\)
Biết rằng trong một quần thể dân số có khoảng 20% người mắc bệnh cao huyết áp; nếu chúng ta tiến hành chọn mẫu 500 lần ,mỗi lần chọn 30 người trong quần thể đó một cách ngẫu nhiên, sự phân phối số bệnh nhân cao huyết áp sẽ như thế nào ? Để trả lời câu hỏi này, chúng ta có thể ứng dụng hàm rbinom (n, k, p) trong R với những thông số như sau
c <- rbinom(500,30,0.2)
table(c)
## c
## 1 2 3 4 5 6 7 8 9 10 11 12 13
## 6 16 36 68 84 89 79 48 45 17 8 3 1
Dòng thứ nhất ( 0,1,2….13) là số bệnh nhân cao huyết áp trong 30 người ta chọn.Dòng thứ 2 cho ta biết số lần chọn mẫu trong 500 lần xảy ra, có 1 mẫu không có bệnh nhân cao huyết áp, có 6 mẫu chỉ có 1 bệnh nhân cao huyết áp.
hist(c, main= "Phân phối nhị thức Binomial", xlab = "Bệnh nhân cao huyết áp")
Phân phối số bệnh nhân cao huyết áp trong số 30 người được chọn ngẫu nhiên trong một quần thề gồm 20% bệnh nhân cao huyết áp, và chọn mẫu được lặp lại 500 lần
Phân phối chuẩn, còn gọi là phân phối Gauss, là một phân phối xác suất cực kì quan trọng trong nhiều lĩnh vực. Nó là họ phân phối có dạng tổng quát giống nhau, chỉ khác tham số vị trí (giá trị trung bình \(\mu\) ) và tỉ lệ (phương sai \(\sigma^2\) ). BNN X có hàm mật độ xác xuất f phụ thuộc vào 2 tham số \(\mu\) và \(\sigma\) ( \(\sigma\) >0 )
Hàm mật độ \(f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{(x-\mu)^2}{2 \sigma^2}} ; x \in R\)
Trung bình \(\mu\)
Phương sai \(\sigma^2\)
Hàm sinh moment \(m(t)=e^{\mu t+\frac{t^2 \sigma^2}{2}}\)
Khảo sát mức tiêu thụ điện của các hộ gia đình ở Cần Thơ trung bình là 150KWh,độ lệch chuẩn 30KW.Mô phỏng mức tiêu thụ điện trong 500 ngày tiếp theo
d <- rnorm(500,mean = 150, sd= 30)
summary(d)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 87.28 133.84 152.18 152.53 172.73 237.73
Mức tiêu thụ điện trung bình của người dân Cần Thơ là 149kwh,lượng tiêu thụ thấp nhất là 53kwh và cao nhất là 232kwh.
hist(d, main= "Phân phối chuẩn", xlab = "Mức tiêu thụ điện trung bình")
Phân phối mũ (Exponential Distribution) hoặc phân phối mũ phủ định đại diện cho một phân phối xác suất giúp mô tả thời gian giữa hai sự kiện trong một quá trình Poisson. Trong quá trình Poisson, các sự kiện xảy ra liên tục và độc lập theo một tần suất trung bình không đổi. Phân phối mũ là một trường hợp đặc biệt của phân phối gamma.
Hàm mật độ xác suất của phân phối mũ được tính bởi công thức:
\[ \begin{cases}\lambda e^{-\lambda x}, & \text { if } x \geq 0 \\ 0, & \text { if } x<0\end{cases} \] Với
\(\lambda\) = biến số tần suất
\(x=\) biến ngẫu nhiên
Hàm phân phối tích lũy của phân phối mũ được tính bởi công thức:
\[ \begin{cases}1-e^{-\lambda x}, & \text { nếu } x \geq 0 \\ 0, & \text { nếu } x<0\end{cases} \]
với
\(\lambda\) = biến tỉ lệ
x = biến ngẫu nhiên
Mô phỏng số máy tính bảng bán ra tại một cửa hàng trong 500 ngày có phân phối mũ với xác xuất 20 %
e <- rexp(500,0.2)
summary(e)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.01866 1.48584 3.72736 5.37476 7.00894 33.10561
Trung bình trong 500 ngày, có ngày cửa hàng không bán được cái nào, ngày cao nhất bán được 31 cái, trung bình bán được 3 cái/ ngày.
hist(e, main= "Phân phối mũ", xlab = "Số lượng máy tính bảng ")