특정 구간 [a,b]에서 확률밀도함수가 일정한 분포
확률변수 X의 표본공간 : \(\Omega=\{x|0\le x\le b \}\)
확률 변수 X에 대한 \(\color{salmon}{\text{pdf}}\)
\(f(x;a,b)\)
\(X \sim U(a,b)\)라고 표현
plot(seq(-5,15,len=1000),dunif(seq(-5,15,len=1000),min=0,max=10),type='l',xlab='x',ylab='y',main='Uniform Distribution',sub='X~U(0,10)')
누적밀도함수
\(X\sim U(a,b)\)의 cdf
\(F(x;a,b)\)
plot(seq(-5,15,len=1000),punif(seq(-5,15,len=1000),min=0,max=10),type='l',xlab='x',ylab='y',main='Uniform Distribution',sub='X~U(0,10)')
cdf 증명
pf)
\(F(x)=P(X\le x)=\int^{x}_{a}f(t)dt=\int^{x}_{a}\frac{1}{b-a}dt=\frac{1}{b-a}[t]^x_a=\frac{x-a}{b-a}\)
적률생성함수
\(M_x(t)\)
pf)
\(M_x(t)=E(e^{tX})=\int^{\infty}_{0} e^{tx}f(x)dx=\frac{1}{b-a}\int^{b}_{a}e^{tx}dx \\ =\frac{1}{b-a}[\frac{1}{t}e^{tx}]^b_a=\frac{1}{t(b-a)}\times (e^{tb}-e^{ta})\)
\(\color{salmon}{\text{적률생성함수로 구하려 했으나 t=0이 될 수 없으므로 평균 분산은 일반적으로 증명}}\)
평균 증명
\(\mu=E(X)=\frac{a+b}{2}\)
\(E(X)=\int^b_a xf(x)dx=\frac{1}{b-a}\int^b_axdx=\frac{1}{b-a}(\frac{x^2}{2})^b=\frac{b^2-a^2}{2(b-a)}=\frac{(b-a)(b+a)}{2(b-a)}=\frac{b+a}{2}\)
분산 증명
\(Var(X)=\frac{(b-a)^2}{12}\)
\(Var(X)=E(X^2)-\mu^2\)
어떤 사람이 자기 집에서 회사까지 직접 운전을하여 출근하는데 걸리는 시간(단위 : 분) X는 (30,50)에서 균일분포를 따른다고 하자. 그의 회사 출근시간은 아침 8시까지이다. 그의 집에서 매일 아침 7시 15분에 출발한다면, 지각할 확률은 얼마인가?
\(\color{gray}{\text{solution)}}\)
\(X\sim U(30,50)\)
\(F(x;a,b)=\frac{x-30}{20}, 30<x<50\) \(P[X\gt 45]=-P[X\le 45]=1-F(45;30,50)=1-\frac{45-30}{20}=\frac{1}{4}\)
# x=seq(0,1, len=1000000)
# curve(dunif(x,30,50), type='l', xlim=c(20,55), ylab='f(x)')
plot(seq(20,60,len=1000),dunif(seq(20,60,len=1000),min=30,max=50),type='l',xlab='x',ylab='y',main='Uniform Distribution',sub='X~U(30,50)')
polygon(c(45,seq(45,50,len=1000),50),c(0,dunif(seq(45,50,len=1000),30,50),0),col=alpha('red',.5))
남녀가 오후 12시 30분에 어떤 장소에서 만나기로 악속했다. 남자와 여자의 도착시간은 서로 독립이며 남자의 도착시간은 12시 15분과 12시 45분 사이에서 균일분포를 따르고, 여자의 도착시간은 12시와 1시 사이에서 균일분포를 따른다.
먼저 도착한사람이 5분이상 기다리지 않을 확률은 얼마인가?
남자가 먼저 도착할 확률은 얼마인가?
\(\color{gray}{\text{solution)}}\)
\(x,y \in [0,60]\) X를 남자의 확률변수 Y를 여자의 확률변수라 하자 . \(X\sim U(15,45)\)이고 \(Y\sim U(0,60)\)
\(f_X(x;15,45)\)
\(f_Y(y;0,60)\)
\(P[|X-Y|\lt5]=\int^{45}_{15}\int^{x+5}_{x-5}\frac{1}{1800}dydx=\frac{1}{6}\)
\(P[X\lt Y]=\int^{45}_{15}\int^{60}_{x}\frac{1}{1800}dydx=\int^{45}_{15}\frac{1}{1800}(60-x)dydx=\frac{1}{2}\)
감마함수
\(\Gamma(k)=\int^\infty_0 x^{k-1}e^{-x}dx\)
감마함수의 성질
\(k\gt 1\)일 때 \(\Gamma(k)=(k-1)!=(k-1)\Gamma(k-1)\)
pf)
\(\Gamma(k+1)=\int^\infty_0 x^{k}e^{-x}dx=-x^ke^{-x}|^{\infty}_0+k\int^{\infty}_0x^{k-1}e^{-x}dx=k\Gamma(k)\)
\(\sqrt{\pi}, k=\frac{1}{2}\)
pf)
\(\int^{\infty}_0 x^{\frac{1}{2}-1}e^{-x}dx \\ x=t^2 으로 치환, dx=2tdt \\ =\int^{\infty}_0(t^{-1})e^{-t^2}2tdt=\int^{\infty}_0(2t)(t^{-1})e^{-t^2}dt=2\int^{\infty}_{0}e^{-x^2}dx=\int^{\infty}_{-\infty}e^{-x^2}dx=l \\l^2=(\int^{\infty}_{-\infty}e^{-x^2}dx)(\int^{\infty}_{-\infty}e^{-y^2}dy)=\int^{\infty}_{-\infty}\int^{\infty}_{-\infty} e^{-(x^2+y^2)}dxdy \\ 극좌표계 변환 \\ x=rcos\theta, y=rsin\theta dxdy=rdrd\theta \\ l^2=\int^{\infty}_{-\infty}\int^{\infty}_{-\infty}e^{-r^2}rdrd\theta \\ r^2=S 로 치환 \\ 2rdr=dS \\ l^2=\frac{1}{2}\int^{2\pi}_{0}\int^{\infty}_{0}e^{-S}dsd\theta=\frac{1}{2}\int^{2\pi}_{0}[-\frac{1}{e^{\infty}}+\frac{1}{e^0}]d\theta \\=\frac{1}{2}\int^{2\pi}_{0}1d\theta=\frac{1}{2}\times2\pi=\pi \\ l={\sqrt{\pi}}\)
확률변수 X : 포아송 과정에서 \(\alpha\) 개의 사건이 발생할 때 까지의 대기시간
확률변수 X의 표본공간 : \(S=\{x|x\gt0\}\)
확률 변수 X에 대한 pdf : \(f(x;\alpha,\beta)\)
적률생성함수
\(M_X(t)=(1-\beta t)^{-\alpha}, t \lt1/\beta\)
pf)
\(M_X(t)=E(e^tX)=\int^{\infty}_{0}e^{tx}f(x)dx=\frac{1}{\beta^\alpha}\int^\infty_0\frac{1}{\Gamma(\alpha)}x^{\alpha-1}e^{tx}e^{-x/\beta} dx=\frac{1}{\beta^\alpha \Gamma(\alpha)}\int^{\infty}_0x^{\alpha-1}e^{-x(1/\beta-t)}dx \\ M_X(t)=(1-\beta t)^\alpha (by \ thm \ 6.3.2)\)
평균 증명
\(M`_X(0) \\ \frac{d}{dt}(1-\beta t)^{-\alpha}=(-\alpha)(1-\beta t)^{-\alpha-1}(-\beta)=\alpha\beta(1-\beta t)^{-\alpha-1} \\ M`_X(0)=\alpha\beta\)
분산증명
\(M``_X(0)\\ \frac{d}{dt}[\frac{d}{dt}(1-\beta t)^{-\alpha}]=\frac{d}{dt}\alpha\beta(1-\beta t)^{-\alpha-1}=\alpha(-\alpha-1)\beta(-\beta)(1-\beta t)^{-\alpha-2}=\alpha(\alpha+1)\beta^2(1-\beta t)^{-\alpha-2} \\ \alpha(\alpha+1)\beta^2-\alpha^2\beta^2=\alpha\beta^2\)
\(\Gamma(\alpha)\beta^\alpha = \int^\infty_0x^{\alpha-1}e^{-x/\beta}dx\)
pf)
부분적분 사용
\(\int^{b}_{a}f(x)g`(x)dx=[f(x)g(x)]^b_a-\int^b_af`(x)g(x)dx\)
\(f(x)=x^{\alpha-1}\leftrightarrow \frac{d f(x)}{dx}=(\alpha-1)x^{\alpha-2}, \frac{d g(x)}{dx}=e^{-x/\beta} \leftrightarrow g(x)=-\beta e^{-x/\beta}\)
\(\int^\infty_0x^{\alpha-1}e^{-x/\beta}dx \\ \int^{b}_{a}f(x)g`(x)dx=[(x^{\alpha-1})(-\beta e^{-x/\beta})]^{\infty}_0-\int^{\infty}_0 ((\alpha-1)x^{\alpha-2})(-\beta e^{-x/\beta})dx \\ =(\alpha-1)(\beta)\int^{\infty}_0 x^{\alpha-2}e^{-x/\beta}dx \\ \therefore \int^\infty_0x^{\alpha-1}e^{-x/\beta}dx=(\alpha-1)!\beta^\alpha=\Gamma(\alpha)\beta^\alpha\)
n이 양의정수이고 \(X\sim Gam(n,\beta)\)이면 \(P[X\le x]=F(x;n,\beta)=P[Y\ge n]\)이다. 여기서 \(Y\sim Poi(x/\beta)\)이다.
\(\alpha\)가 양의 정수라 가정
cdf
\(F(x)=P(X\le x)=1-\sum^{\alpha-1}_{y=0} \frac{(x/\beta)^ye^{-x/\beta}}{y!}\)
간단한 증명은 못찾아서 첨부
Poisson distribution cdf \(F(x)=\sum_{k=0}^x f(x;\lambda)=\sum_{k=0}^x\frac{e^{-\lambda}\mu^x}{x!}\)
어떤 방사능에 노출된 쥐의 생존기간(단위 : 일) X는 Gam(3,5)라 하자. 쥐의 생존기간이 5일을 초과하지 못할 확률은 정리 6.3.3에 의해 \(P[X\le5]=P[Y\ge3]=1-P[Y\le2]1-0.9197=0.0803\)
x=seq(-.01,20,len=1000)
shape=3;scale=5
plot(x,pgamma(x,shape=shape,scale=scale),type='l',ylab='y',main=paste('gamma distribution X~Gam(',shape,',',scale,')'),ylim=c(0,1))
x=seq(0,20,1)
lines(x,1-ppois(x,1),type='l',lwd=3,col=alpha('skyblue',.7))
abline(v=3,lwd=3,lty=2,col=alpha('red',.5))
\(X_1\)과 \(X_2\)는 독립이며 각각 \(X_1\sim Gam(\alpha_1,\beta), X_2\sim Gam(\alpha_2,\beta)\)이면 \(Y=X_1+X_2 \sim Gam(\alpha_1+\alpha_2,\beta)\)이다.
\(\color{gray}{\text{solution)}}\)
\(M_Y(t)=M_{X_1}(t)M_{X_2}(t)=[\frac{1}{1-\beta t}]^{\alpha_1}[\frac{1}{1-\beta t}]^{\alpha_2}=[\frac{1}{1-\beta t}]^{\alpha_1+\alpha_2},(t<1/\beta) \\ \therefore Y=X_1+X_2 \sim Gam(\alpha_1+\alpha_2,\beta)\)
카이제곱분포와 지수분포는 감마분포의 Rare case
\(\alpha=n/2, \beta=2인 감마분포 \leftrightarrow 자유도가 n인 카이제곱분포\) \(\alpha=1인 감마분포 \leftrightarrow 지수분포\)
확률변수 X : 포아송 과정에서 한개 사건이 발생할 때까지 대기시간
X의 표본공간 : \(S=\{x|x\gt0\}\)
확률변수 X에 대한 pdf : \(f(x;\theta)\)
적률생성함수
\(\alpha=1\)인 감마분포와 같음.
\(M_X(t)=(1-\beta t)^{-1}, t \lt1/\beta\)
평균
\(\mu=\beta\)
분산
\(\sigma^2=\beta^2\)
cdf
\(F(x)=P(X\le x)=1-e^{-x/\beta},(x\ge0)\)
pf)
\(F(x)=P(X\le x)=\int^x_0f(t)dt=\frac{1}{\beta}\int^x_0e^{-t/\beta}dt=\frac{1}{\beta}[(-\beta)e^{-t/\beta}]^x_0=1-e^{-x/\beta},(x\ge0)\)
어떤 기계를 수리하는 데 걸리는 시간은 모수가 \(\theta=3\)인 지수분포를 따른다고 한다.
solution) (a) \(P[X\gt3]=1-F(3;3)=e^{-1}\)