連續型機率分配 − CONTINUOUS PROBABILITY DISTRIBUTIONS



連續型均勻分配 (Continuous Uniform Distribution : Rectangular)   \(U(x; A,B)\)

\[X \sim U(x; A,B), \ \ f(x) = \frac{1}{B-A} , \ A \leq x \leq B\] \[\mu=E(X)= \frac{B+A}{2}, \ \ \sigma^2 = Var(X) = \frac{(B-A)^2}{12} \]

Ex: 假設小民搭乘捷運文湖線的等待時間 \(X\) 服從 \(U(0, 10)\) (單位分鐘), 求 (1) \(P(X > 3)\) (2) \(P(4 < X < 8)\) (3) \(E(X)\)

sol.

# (1) P(X>3) = 1- P(X<=3)
1-punif(3,0,10)
## [1] 0.7
# (2) P(4 < X < 8) = P(X<=8) - P(X<=4) = F(8) - F(4)
punif(8,0,10)-punif(4,0,10)
## [1] 0.4
# (3) E(X)
(10+0)/2
## [1] 5


常態分配 (Normal (Gaussian) Distribution)   \(N(x; \mu, \sigma^2)\)\(N(x; \mu, \sigma)\)

\[X \sim N(x; \mu, \sigma^2), \ \ \displaystyle{f(x)= \frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{1}{2} \left( \frac{x-\mu}{\sigma} \right) ^2} , \ \ -\infty < x < \infty }\]

\(\star\) 標準常態分配(Standard Normal Distribution):若 \(X \sim N(\mu, \sigma^2)\)\(\displaystyle{Z = \frac{X-\mu}{\sigma} }\),則 \(Z \sim N(0,1)\),且稱 \(Z\) 為標準常態隨機變數。

\[Z = \frac{X-\mu}{\sigma}, \ Z \sim N(x; 0, 1^2), \ \ \displaystyle{f(z)= \frac{1}{\sqrt{2 \pi} } e^{-\frac{z^2}{2}} , \ \ -\infty < z < \infty }\]

Ex: 假設新埔國中之學生體重可用隨機變數 \(X \sim N(40,10^2)\) 描述, 試求 (1) \(P(X > 50)\) (2) \(P(35 < X < 55)\) (3) 若小明的體重位居 \(70\)百分位數, 則小明的體重約為幾公斤? (利用 \(P(X \leq P_{70}) = 0.70\))

sol.

# (1) P(X > 50) = 1- P(X <= 50)
1-pnorm(50,40,10)
## [1] 0.1586553
# (2) P(35 < X < 55) =  P(X <= 55) - P(X <= 35)
pnorm(55,40,10)-pnorm(35,40,10)
## [1] 0.6246553
# (3) P(X <= P_{70}) = 0.70
qnorm(0.7,40,10)
## [1] 45.24401

Ex: 致理科技大學某通識科目的期末成績可用隨機變數 \(X \sim N(80,12^2)\) 描述,若將分數由高而低分成A、B、C、D、E 五個等級 (分別占20%、25%、25%、25%、5%), 落入 E 等級的同學不及格, 則 (1) 及格分數約為幾分? (2) B 等級分數的大致範圍? (3) 某生考試成績 62 分, 則該生成績會歸入哪一個等級?

# (1)
qnorm(0.05,80,12)
## [1] 60.26176
# (2)
qnorm(0.55,80,12)
## [1] 81.50794
qnorm(0.80,80,12)
## [1] 90.09945
# (3) 0.05 < 0.0668072 < 0.3 --> grade "D"
pnorm(62,80,12)
## [1] 0.0668072

Ex: 小明目前每天早上7:30起床,8:20前必須到校以免遲到。 假設小明起床後梳洗所需時間 \(X\) 服從常態分配 \(X \sim N(20,12^2)\) 分鐘, 梳洗完畢搭公車到學校所需時間 \(Y\) 服從常態分配 \(Y \sim N(40,16^2)\) 分鐘, 試求

  1. 小明目前大致上會遲到的機率。
  2. 若希望透過早點起床以改善遲到的現象, 則小明大概需提早多少時間起床, 才能夠讓遲到的機率下降至 20\(\%\) 以下?

sol. 常態分配具可相加性,故 \(X+Y \sim N(20+40, 12^2+16^2)=N(60,20^2)\)

# (1) P(X+Y > 50) = 1- P(X+Y<=50)
1-pnorm(50,60,20)
## [1] 0.6914625
# (2) P(X+Y > 50+t) < 0.2
qnorm(0.8,60,20)
## [1] 76.83242
qnorm(0.8,60,20)-50
## [1] 26.83242
# check the answer
1-pnorm(76.83242,60,20)
## [1] 0.2000001


指數分配 (Exponential Distribution)   \(exp(\beta)\)\(exp(\frac{1}{\lambda})\)

\(X \sim \displaystyle{f(x) = \left\{ \begin{array}{ll} \frac{1}{\beta} e^{-\frac{x}{\beta}} & x \geq 0 , \\ 0 & \mbox{otherwise} \end{array} \right. }\)     (或 \(f(x)=\lambda e^{-\lambda t}\))   
\(\displaystyle{F(x)=\left\{ \begin{array}{ll} 1 - e^{-\frac{x}{\beta}} & x \geq 0 , \\ 0 & \mbox{otherwise} \end{array} \right. }\)



指數分配和波松分配之間的關聯

假設客服來電可用波松事件描述:某客服員一小時沒有接到任何電話 \(\cong\) 某客服員接到一通電話需要超過一小時的時間

\(\displaystyle{P(X<1)=P(X=0)=\frac{(\lambda t)^0 e^{-\lambda t}}{0!} = e^{-\lambda t} }\),    \(\displaystyle{P(T>1)=1-P(T \leq 1) = e^{-\frac{1}{\beta}} }\)

Ex: \(\lambda t = 10\) 通電話/每小時 \(\cong β = 0.1\) 小時/每通電話 \(\Rightarrow \lambda t = \frac{1}{\beta}\)

Ex: 平均每10分鐘, 會有1台999號公車經過致理科技大學校門口。 假設公車到來的數目服從波松分配, 試 計算: (1) 接下來的40分鐘內沒有任何999號公車經過學校門口的機率。 (2) 等待時間超過40分鐘才搭上999號公車的機率。 Sol:令 \(X\) 代表接下來的 \(40\) 分鐘經過學校門口的999號公車數, 則

# (1) X ~ poisson(4台/40分鐘)
ppois(0,4)
## [1] 0.01831564
# (2) 以分鐘或以小時為單位
1-pexp(40, 1/10)
## [1] 0.01831564
1-pexp(2/3, 6)
## [1] 0.01831564


珈瑪分配(Gamma Distribution)   \(Gamma(\alpha, \beta)\)\(\alpha>0, \beta>0\) )

\(X \sim \displaystyle{f(x)=\frac{x^{\alpha -1} e^{-\frac{x}{\beta}}}{\beta^{\alpha} \Gamma(\alpha)} }\),    \(\displaystyle{F(x) = \left\{ \begin{array}{ll} \displaystyle{\int_0^a \frac{x^{\alpha -1} e^{-\frac{x}{\beta}}}{\beta^{\alpha} \Gamma(\alpha)} \ dx } & \mbox{if} \ \ a \geq 0, \alpha > 0 \\ {} & {} \\ \displaystyle{1-\sum_{k=0}^{r-1} \frac{a^k e^{-\frac{a}{\beta}}}{\beta^k k!}} & \mbox{if} \ \ a \geq 0, \alpha \ \ \mbox{is an integer} \end{array} \right. }\)

其中 \(\Gamma(\alpha)=\int_0^{\infty} x^{\alpha -1} e^{-\alpha} \ dx\) 稱為珈瑪函數。

\(\star\) 平均數: \(\mu= E(X) = \alpha \beta\), 變異數: \(\sigma^2 =Var(X)=\alpha \beta^2\)

\(\star\) \(X\) 是直到第 \(\alpha\) 個波松事件發生所需要的時間。

\(\star\)\(\alpha = 1\) 時, \(X\) 服從指數分配。(指數分配可視為珈瑪分配在 \(\alpha = 1\) 時的特例)。

\(\star\) \(\Gamma(\alpha+1) = \alpha \ \Gamma(\alpha), \ \ \mbox{for} \ \ \alpha > 0\)

\(\star\) \(\displaystyle{\Gamma(\frac{1}{2}) = \sqrt{\pi}}\)

\(\star\)\(\alpha = n\) 為正整數, 則 \(\Gamma(n) = (n − 1)!\)

Ex: 平均每10分鐘, 會有1台999號公車經過致理科技大學校門口。 假設公車到來的數目服從波松分配, 試計算接下來的一小時內有超過8台999號公車經過學校門口的機率。

Sol.

# 一小時內超過8台 (9台或以上) ---> 直到第9個波松事件發生所需要的時間低於一小時,亦即
# X ~ Gamma(9,10) , P(x < 60) = ...以分鐘或小時為單位
pgamma(60, 9, 1/10)
## [1] 0.1527625
pgamma(1, 9, 6)
## [1] 0.1527625
# 也可以用1扣掉一小時內發生之波松事件 (來的公車) 小於等於8次的機率加總 
1-ppois(8,6)
## [1] 0.1527625