確率変数(random variable)とは、その数値が確率的な試行の結果決まるような変数のことをいう。通常、確率変数を表すには、大文字の\(X, Y, Z, ...\)などが用いられる。なお、確率変数には、離散値をとる離散確率変数(discrete random variable)と、連続確率変数(continuous random variable)がある。今回の講義では、離散確率変数について説明する。
確率変数\(X\)が、離散値\(x_1, x_2, ..., x_n, ...\)を、確率\(p_1, p_2, ..., p_n, ...\)でとるとする。このとき、\(X\)の確率分布関数(probability distribution function: PDF)は、単純に\(X\)の実現値に対して確率を割り当てたものとなり、以下の表として表せる。
\(X\) | \(x_1\) | \(x_2\) | … | \(x_n\) | … |
---|---|---|---|---|---|
確率 | \(p_1\) | \(p_2\) | … | \(p_n\) | … |
なお、確率\(p_i\)は、足し合わせると1となる。すなわち、\(\sum_i p_i = 1\)。
累積分布関数(cumulative distribution function: CDF)は、 \[ F(x)=P(X≤x)=\sum_{i:x_i≤x} p_i \] と定義され、実現値が\(x\)以下になる確率の和を表す。
また、確率変数\(X\)の期待値(expectation)は、以下のように与えられる。 \[ E(X)=x_1 p_1+\cdots +x_i p_i+\cdots =\sum_i x_i p_i \] これは、\(X\)の全ての可能な実現値について、確率で重み付けして和をとったものである。
確率変数\(X\)の実数\(a\)を中心とする\(k\)次のモーメント(moment, 積率)は、 \[ E[(X-a)^k] \] と定義される(この定義は、離散、連続のどちらの確率変数にも当てはまる)。
離散確率変数\(X\)の原点を中心とする\(k\)次モーメントは \[ E(X^k)=\sum_i x_i^k p_i \] と定義され、単に\(k\)次モーメントとよばれる。
また、離散確率変数\(X\)の期待値E(X)を中心とするk次モーメントは、 \[ E[(X-E(X))^k]=\sum_i (x_i-E(X))^k p_i \] と定義され、\(k\)次中心モーメント(central moment)とよばれる。
1次モーメントは期待値であり、2次中心モーメントは分散である。 \[ Var(X)=\sum_i (x_i-E(X))^2 p_i \]
なお、分散は、2次モーメントと1次モーメントから計算することもできる。すなわち、 \[ Var(X) = E[(X-E(X))^2] = E[X^2 - 2XE(X) + E(X)^2] \\ = E(X^2) - 2 E(X)\cdot E(X) + E(X)^2 = E(X^2) - E(X)^2 \]
\(a, b\)を任意の実数、\(X\)を確率変数とする。このとき、 \[ Var(aX) = a^2Var(X) \\ Var(b) = 0 \\ Var(aX + b) = a^2Var(X) \] これらは、 \[ Var(aX) = E((aX)^2) - E[aX]^2 \\ = E(a^2X^2) - (aE(X))^2 = a^2E(X^2) - a^2 E(X)^2\\ = a^2 (E(X^2) - E(X)^2) = a^2 Var(X) \] \[ Var(b) = E(b^2) - E(b)^2 = b^2 - b^2 = 0 \] \[ Var(aX + b) = E((aX + b)^2) - E(aX + b)^2 \\ = E(a^2X^2 + 2abX+b^2) - (aE(X)+b)^2 \\ = a^2E(X^2) + 2abE(X) + b^2 - a^2 E(X)^2 - 2abE(X) - b^2\\ = a^2(E(X^2) - E(X)^2) = a^2 Var(X) \] と導ける。
離散確率変数Xの積率母関数(moment-generating function)は、 \[ m_X (t)=E(e^{tX})=\sum _i p_i e^{tx_i} \] と定義される。
この関数が、“moment-generating”(モーメント生成)とよばれる理由は、\(m_X (t)\)の\(t=0\)における\(k\)次の微分が、\(k\)次モーメントとなるためである。
具体的に確認してみよう。まず積率母関数を\(t\)で\(k\)回微分すると、 \[ m_X^{(k)} (t)=\sum_i p_i x_i^k e^{tx_i} \] が得られれる。
ここで、\(t=0\)とすると、 \[ m_X^{(k)} (0)=\sum_i p_i x_i^k =E(X^k) \] となり、\(k\)次モーメントとなっていることがわかる。
あるエダマメの品種は、1つのサヤに入る豆の数\(X\)が、以下の表ようになることが知られている。
\(X\) | 1 | 2 | 3 |
---|---|---|---|
確率 | 0.2 | 0.5 | 0.3 |
このとき、積率母関数は、 \[m_X (t)=0.2e^{t\cdot1}+0.5e^{t\cdot2}+0.3e^{t\cdot3}\] と表せる。
積率母関数を\(t\)で1回微分すると、 \[m_X'(t)=0.2e^t+1.0e^{2t}+0.9e^{3t}\] となる。したがって、期待値は、 \[E(X)=m_X' (0)=0.2+1.0+0.9=2.1\] と求められる。
次に、積率母関数を\(t\)で2回微分すると、 \[m_X''(t)=0.2e^t+2.0e^{2t}+2.7e^{3t}\] となる。したがって、2次モーメントは、 \[E(X^2)=m_X'' (0)=0.2+2.0+2.7=4.9\] と求められる。
分散は、 \[ E(X^2) - E(X)^2 = 4.9 - 2.1^2 = 0.49 \] と求められる。
上の計算結果を、別の計算法で確認してみる。
x <- 1:3
p <- c(0.2, 0.5, 0.3)
m <- sum(x * p) # 期待値
m
## [1] 2.1
v <- sum(x^2 * p) - m^2 # 分散
v
## [1] 0.49
確率変数\(X\)が、1から\(n\)までの値を同じ確率\(1/n\)でとる場合を、離散一様分布とよぶ。 離散一様分布の平均と分散は、 \[ \sum_{i=1}^n i=\frac{n(n+1)}{2} \] と \[ \sum_{i=1}^n i^2 =\frac{n(n+1)(2n+1)}{6} \] であることを利用して、 \[ E(X)=\frac{n+1}{2} \] \[ Var(X)=\frac{n^2-1}{12} \] と導くことができる。
\(N\)個の集団から\(n\)個の標本を抽出する場合、復元抽出(sampling with replacement)では、\(N^n\)の可能な標本の組合せが存在する。非復元抽出(sampling without replacement)では、\(\left(\begin{array}{cc} N\\n\end{array}\right)\)の可能な標本の組合せが存在する。復元抽出の場合は、\({1,2,…,N}\)は、いずれも\(1/N\)の確率で生じ、非復元抽出の場合は、\(n\)個の組合せに\({1,2,…,\left(\begin{array}{cc} N\\n\end{array}\right)}\)と索引番号を割り振ると、それぞれの組合せは、\(1/\left(\begin{array}{cc} N\\n\end{array}\right)\)の確率で生じる。
サイコロを1回ふったときのサイコロの目の期待値と分散を計算する。
期待値は上式より、
(6 + 1) / 2
## [1] 3.5
分散は、
(6^2 - 1) / 12
## [1] 2.916667
これをシミュレーションを行って確認してみる。
Rでは、sample関数を用いて無作為抽出を行うことができる。ここでは、10万回サイコロを振り、それをもとに期待値と分散を計算してみる。
n.sim <- 100000 # 10万回
x <- sample(1:6, n.sim, replace = T)
head(x, 10) # 最初の10回の試行だけ示す
## [1] 3 5 2 3 2 1 2 5 3 2
mean(x)
## [1] 3.49262
var(x)
## [1] 2.932555
sample関数で使われる乱数によって実行するごとに異なる値が計算されることにも注意する。
ベルヌーイ確率変数\(Y\)は、\(P(Y=1)=p\)かつ\(P(Y=0)=1-p \quad (0≤p≤1)\) となる2値変数である。
いま、\(n\)個の独立した試行(\(Y_1,Y_2,…,Y_n\))があり、それぞれの試行において2つの結果(例えば、成功(1)と失敗(0))が\(p\)と\(1-p\)の確率で生じる場合を考える。もし、\(X=x\)を、\(n\)回の試行のうちの成功(1)の数と定義すると、\(X=Y_1+Y_2+⋯+ Y_n\)となり、\(x\)回の成功と、\(n-x\)回の失敗について、全部で\(\left(\begin{array}{cc} n\\x\end{array}\right)\)の並び順が存在する。また、それぞれの並び順は\(p^x (1-p)^{n-x}\)の確率で生じる。このときのXの分布を二項分布とよぶ。二項分布のPDFは、 \[ p_X (x)=\left(\begin{array}{cc} n\\x\end{array}\right) p^x (1-p)^{n-x},\quad x=0,1,…,n \] と表される。ここで、\(\left(\begin{array}{cc} n\\x\end{array}\right)\)は、\(n\)個のものから\(x\)個を選ぶ組合せの総数\(_nC_r\)である。
積率母関数は\(m_X (t)=(pe^t+1-p)^n\)(付録1)であり、期待値と分散(付録1)は、 \[ E(X)=np \\ Var(X)=np(1-p) \] となる。
CDFは、簡単な形で表すことができず、その定義通りの表現となる。すなわち、 \[ F(x)=\sum_{i≤x}p_X (i) \]
ある実験を行うため、発芽率が0.4である種子を播種して、5個体以上の発芽実生を得たい。今、\(X\)を10粒の種子を播種して得られる発芽実生の数とする。以下の問に答えよ。
p <- 0.4
n <- 10
n * p # 期待値
## [1] 4
n * p * (1 - p) # 分散
## [1] 2.4
4個体である確率(a)
x <- 4
choose(n, x) * p^x * (1 - p)^(n - x) # choose(n, x)は、n個からx個を選ぶ組合せ数を計算する
## [1] 0.2508227
以下(b〜c)についても上と同様に公式を用いて計算できるが、RのもつPDFとCDFを計算する関数を用いるほうが容易である。
二項分布ではPDFはdbinom、CDFはpbinomで計算できる。
dbinom(4, n, p) # 4の値をとる確率(PDF) (a)
## [1] 0.2508227
pbinom(4, n, p) # 4までの確率(CDF)(b)
## [1] 0.6331033
pbinom(4, n, p) - pbinom(1, n, p) # 最大で4の確率から、最大で1の確率を引く (c)
## [1] 0.5867459
1 - pbinom(4, n, p) # 5以上(4以下でない)(d)
## [1] 0.3668967
二項分布の乱数を使って10万回のシミュレーションを行って確認してみる。
n.sim <- 100000 # 10万回
x <- rbinom(n.sim, n, p)
sum(x == 4) / n.sim # 4の値をとる確率
## [1] 0.24897
sum(x <= 4) / n.sim # 4までの確率(累積確率)
## [1] 0.63096
sum(x >= 2 & x <= 4) / n.sim # 2〜4
## [1] 0.58466
sum(x >= 5) / n.sim # 5以上(4以下でない)
## [1] 0.36904
\(n\)の値を動かしなら、5個体以上になる確率を計算してみる。
n <- 1:20
p04 <- 1 - pbinom(4, n, p)
p04
## [1] 0.0000000 0.0000000 0.0000000 0.0000000 0.0102400 0.0409600 0.0962560
## [8] 0.1736704 0.2665677 0.3668967 0.4672258 0.5618218 0.6469582 0.7207430
## [15] 0.7827223 0.8334326 0.8740009 0.9058314 0.9303863 0.9490480
このうち、確率が0.7より大きくなるのは、
n[p04 > 0.7]
## [1] 14 15 16 17 18 19 20
\(n\)が14以上の場合に5個体以上得られる確率が0.7より大きくなる。
箱の中に\(m\)個の玉が入っており、\(k\)個は白、\(m-k\)個は黒だとする。非復元抽出で\(n\)個の玉を取り出した場合、抽出後には、箱に\(m-n\)個の球が残る。\(X\)を\(n\)個の玉のうち白玉の数とすると、\(X = x\)となる確率は、 \[ p_X (x)=\frac{\left(\begin{array}{cc} k\\x\end{array}\right)\left(\begin{array}{cc} m-k\\n-x\end{array}\right)}{\left(\begin{array}{cc} m\\n\end{array}\right)},\quad x∈\{0,1,…,\min\{n,k\}\} \] となる。このとき、確率変数\(X\)の従う分布を超幾何分布とよぶ。
超幾何分布の期待値と分散は、 \[ E(X)=\frac{nk}{m} \] \[ Var(X)=\frac{nk}{m}\cdot\frac{m-k}{m}\cdot\frac{m-n}{m-1} \] である(積率母関数は簡単な形で表すことができない)。
ある地域に\(m\)個体の動物が生息している地域がある。ここで、生態学者が\(k\)個体を捕獲して標識をつけてか解放したとする。しばらくたち、標識された個体が非標識の個体とよく混合したと考えられたときに\(n\)個体を再捕獲したとする。なお、どの個体も同じ確率で捕獲されると仮定する。今、\(m = 100, k = 20, n = 30\)として以下の問に答えよ。
これは、\(m\)個の玉のうちの\(k\)個が白玉のときに、非復元抽出で\(n\)個を取り出したときの白玉の数と考えられる。したがって、
m <- 100
k <- 20
n <- 30
n * k / m # 期待値
## [1] 6
(n * k / m) * ((m - k) / m) * ((m - n) / (m - 1)) # 分散
## [1] 3.393939
1 - phyper(6, k, m - k, n) # 超幾何分布で,6個体までの累積確率を計算して1から引く。
## [1] 0.3849201
ポアソン分布の確率分布関数は \[ p_X (x)=\frac{\lambda^x}{x!} e^{-\lambda}, \quad x=0,1,2,…, \] である。また、積率母関数(付録2)は \[ m_X (t)=e^{\lambda(e^t - 1)} \] である。期待値と分散(付録2)は、 \[ E(X)=\lambda \] \[ Var(X)=\lambda \] となり、両者は同じ値をとる。
二項分布の試行回数\(n\)が非常に大きく、成功する確率\(p\)が非常に小さいとき、二項分布は\(\lambda = np\)のポアソン分布で近似される(付録3)。
アブラムシ(アリマキ)は畑に飛来した昆虫個体が畑の中の任意の植物体に寄生することが知られており、植物体あたりの昆虫個体数の頻度分布がポアソン分布に適合することが知られている。ある畑に飛来したアブラムシが、植物体1個体あたり平均2頭寄生したとする。このとき、以下の問いに答えよ。
lmbd <- 2
dpois(1, lmbd)
## [1] 0.2706706
1 - ppois(0, lmbd)
## [1] 0.8646647
4頭以上(3頭までしか数えなくてもよい)のアブラムシが寄生する植物体の割合
1 - ppois(3, lmbd)
## [1] 0.1428765
4頭以上は3頭とする場合のアブラムシの頭数の期待値を求める。
x <- 0:3
p <- dpois(x, lmbd)
m <- x %*% p + 3 * (1 - ppois(3, lmbd))
m
## [,1]
## [1,] 1.781982
例えば、1000個体の調査をすると数えなければならない頭数の期待値は、
m * 1000
## [,1]
## [1,] 1781.982
3頭までで打ち切らなかった場合は、
lmbd * 1000
## [1] 2000
ポワソン分布にしたがう乱数を発生してシミュレーションを行ってみる。
n.sim <- 1000 # 植物1000個体
x <- rpois(n.sim, lmbd) # 乱数を1000個発生
plot(table(x)) # 昆虫の頭数の頻度棒グラフ
sum(x) # まともに数えた場合
## [1] 1992
x[x > 3] <- 3# 4以上は3にする
sum(x) # 打ち切った場合
## [1] 1772
二項分布は、\(n\)個の独立した試行における2つの補足的な事象\(A\)とその補集合\(A^c\)の回数を数えるための分布である。ここでは、試行の結果が、\(k > 2\)の互いに排他的な(互いに重なりが無い)事象\(A_1,…,A_k\)であるとする。ここで、\(X_i\)を事象\(A_i\)が生じた回数とすると、確率変数のベクトル\((X_1,…,X_k)\)を定義することができる。こうして定義される確率変数\((X_1,…,X_k)\)は、多項分布とよばれる分布に従う。 多項分布の確率分布関数は、 \[ p_{X_1,\dots,X_k} (x_1,\dots,x_k )=\frac{n!}{x_1 !\dots x_k !} p_1^{x_1}\dots p_k^{x_k} \] である。ここで、 \[ p_1+\cdots +p_k=1 \\ x_1+\cdots +x_k=n \] なお、\(p_k=1-p_1-\dots-p_{k-1}\)という制約のために、自由に変化させられるパラメータ数は\(k-1\)となる。
\(X_i\)の期待値と分散は、二項分布のときと同様に得られる。すなわち、\(X_i\)の周辺分布は、事象\(A_1,\dots ,A_k\)を、\(i\)番目の事象\(A_i\)とそれ以外\(A_i^c\)の2つのグループに分けた場合を考えればよく、それぞれの事象の起こる確率は\(p_i\)と\(1-p_i\)なので、 \[ E(X_i)=np_i \] \[ Var(X_i)=np_i (1-p_i) \] となる。
ある二倍体の生物集団では、2つの対立遺伝子がAとaがそれぞれ\(p\)、\(1-p\)(\(0\le p\le 1\))で存在する。 この遺伝子はHardy-Weinberg平衡にあり、遺伝子型の頻度は以下のようになる。
\(X\) | AA | Aa | aa |
---|---|---|---|
確率 | \(p^2\) | \(2p(1-p)\) | \((1-p)^2\) |
この集団から10個体をサンプリングしたときに、以下の確率を答えよ。なお、\(p = 0.7\)とする。
p <- 0.7
freq <- c(p^2, 2 * p * (1-p), (1-p)^2)
dmultinom(c(5, 4, 1), prob = freq) # 多項分布の密度関数
## [1] 0.099676
dbinom(5, 10, freq[1]) # これは二項分布
## [1] 0.245602
dmultinom(c(5, 4, 1), prob = freq) / dbinom(5, 10, freq[1]) # 条件付き確率
## [1] 0.4058437
シミュレーションで確認してみる。
n.sim <- 100000
x <- rmultinom(n.sim, 10, freq) # 多項分布からの乱数を発生
x[,1] # 1セット目
## [1] 5 5 0
sum(apply(apply(x, 2, "==", c(5, 4, 1)), 2, all)) / n.sim
## [1] 0.09877
# ちょっと複雑ですが、c(5, 4, 1)に一致する行の数を求めている
sum(x[1,] == 4) / n.sim # 1列目はA型の頻度
## [1] 0.21162
sum(apply(apply(x, 2, "==", c(5, 4, 1)), 2, all)) / sum(x[1,] == 5)
## [1] 0.4040169
# AAが5のサンプルのうち、c(5, 4, 1)に一致するものの割合
ある決められた数\(r\quad (r\ge 1)\)の成功が生じるまでに、繰り返される失敗の数\(X\)の分布を考える。ここで、\(p\)を1回の試行における成功確率とする。この\(X\)が従う分布を負の二項分布とよぶ。 \(X=x\)の場合、\(x+r\)の試行を行い、\(x\)回の失敗と、\(r\)回の成功をすることになる。\(x+r\)の試行において、\(x\)回の失敗する場合の並び順は、全部で\(\left(\begin{array}{cc} x+r\\x\end{array}\right)\)通りあるが、最後の試行では必ず成功しなければならないため、実際は、可能な並び順は\(\left(\begin{array}{cc} x+r-1\\x\end{array}\right)\)通りとなる。なお、いずれの並び順も、確率\(p^r (1-p)^x\)で生じるため、その確率分布関数は、 \[ p_X (x)=\left(\begin{array}{cc} r + x - 1\\x\end{array}\right) p^r(1-p)^x,\quad x=0,1,\dots,n \] と表される。なお、積率母関数は \[ m_X (t)=\left(\frac{p}{1-(1-p)e^t}\right)^r \] で、期待値と分散は、 \[ E(X)=\frac{r(1-p)}{p} \] \[ Var(X)=\frac{r(1-p)}{p^2} \] と表される。
なお、\(r = 1\)のときの負の二項分布は、幾何分布(geometric distribution)とよばれる(なお、成功するまでの試行回数\(X+1\)を幾何分布とする場合もある)。幾何分布の平均と分散は上の式で\(r = 1\)とすればよい。
訪問販売を行っているセールスマンがいる。同セールスマンの商品は1軒あたり最大1個売れ、販売成功率(1軒を訪問し、商品を販売できる確率)が0.08とする。このとき、以下の問に答えよ。
p <- 0.08
dgeom(9, p) # 幾何分布, 9は失敗の数
## [1] 0.03777291
r <- 1
dnbinom(9, r, p) # 負の二項分布, 9は失敗の数
## [1] 0.03777291
1 - pgeom(8, p) # 9軒までの累積を1から引く, 8は失敗の数
## [1] 0.4721614
この値に0.08を乗じたのが1で求めた確率になっていることに注意する。
なお、この確率は9軒すべて失敗する確率なので、
(1-p)^9
## [1] 0.4721614
としても計算できる。
r <- 2
n <- 20
dnbinom(n - r, r, p) # 負の二項分布, n - rは失敗の数
## [1] 0.02710906
1 - pnbinom(n - r, r, p) # 負の二項分布, 20回目までに2回の成功をする累積確率を1から引く
## [1] 0.5168556
この確率は、20軒目までに0または1個販売できる確率と考えて、二項分布の累積関数を使って計算できる。
pbinom(r - 1, n, p)
## [1] 0.5168556
負の二項分布に従う乱数を発生し、確認してみる。
n.sim <- 100000
x <- rnbinom(n.sim, r, p) # 乱数発生
hist(x) # 棒グラフで表したいが、細かすぎる(Xの値が多数になる)のでヒストグラムで表す
sum(x == n - r) / n.sim # ちょうど失敗が(n-r)回になった割合
## [1] 0.02651
sum(x > n - r) / n.sim # 失敗が、(n-r)回以上になった割合
## [1] 0.51744
二項分布の積率母関数 \[ m_X(t) = \sum _i e^{tx_i} \left(\begin{array}{cc} n\\x_i\end{array}\right) p^{x_i} (1-p)^{n-x_i} \\ = \sum _i {_nC_{x_i}} (e^t p)^{x_i} (1-p)^{n-x_i} = (e^t p + 1 - p)^n \] 1次モーメント(期待値) \[ m_X'(t) = n(e^tp + 1 - p)^{n-1} p e^t\\ \therefore E(X) = m_X'(0) = n(p + 1 - p)^{n-1} p = np \]
2次モーメント \[ m_X''(t) = (np(e^tp + 1 - p)^{n-1} e^t)' \\ = n(n-1)p(e^tp + 1 - p)^{n-2} p e^t + np(e^tp + 1 - p)^{n-1} e^t\\ \therefore E(X^2) = m_X''(0) = n(n-1) p^2 + np \] 分散 \[ V(X) = E(X^2) - E(X)^2 = np(1-p) \]
ポアソン分布の積率母関数 \[ m_X(t) = \sum _x e^{tx} \frac{\lambda^{x} e^{-\lambda}}{x!} = e^{-\lambda}\sum _x \frac{(\lambda e^t)^{x}}{x!} \quad x=0,1,2,…, \]
なお、指数関数はマクローリン展開を用いて、 \[ e^k = \sum_{x = 0}^\infty \frac{k^x}{x!} \] と表せる。ここで、\(k = \lambda e^t\)で置換すると、 \[ e^{\lambda e^t} = \sum_{x = 0}^\infty \frac{(\lambda e^t)^x}{x!} \] したがって、 \[ m_X(t) = \sum _x e^{tx} \frac{\lambda^{x} e^{-\lambda}}{x!} = e^{-\lambda}\sum _x \frac{(\lambda e^t)^{x}}{x!} = e^{-\lambda}e^{\lambda e^t}=e^{\lambda(e^t - 1)} \]
1次モーメント(期待値) \[ m_X'(t) = (e^{\lambda(e^t - 1)})' \\ = \lambda(e^t - 1)' e^{\lambda(e^t - 1)} \\ =\lambda e^{t+\lambda(e^t - 1)} \\ \therefore E(X) = m_X'(0) = \lambda \]
2次モーメント \[ m_X''(t) = (\lambda e^{t+\lambda(e^t - 1)})' \\ = \lambda(t + \lambda(e^t - 1))' e^{t + \lambda(e^t - 1)} \\ = \lambda(1 + \lambda e^t) e^{t + \lambda(e^t - 1)} \\ \therefore E(X^2) = m_X''(0) = \lambda + \lambda^2 \] 分散 \[ V(X) = E(X^2) - E(X)^2 = \lambda + \lambda^2 - \lambda^2 = \lambda \]
今、ある期間における平均成功回数(成功率)\(\lambda\)が分かっているとし、\(\lambda = np\)と表される(与えられた期間にあうように試行回数\(n\)を決める)とする。このとき、二項分布の成功確率\(p\)は\(p = \lambda / n\)と表され、PDFは \[ p_X (x)=\left(\begin{array}{cc} n\\x\end{array}\right) p^x (1-p)^{n-x} = \left(\begin{array}{cc} n\\x\end{array}\right) \left(\frac{\lambda}{n}\right)^x \left(1-\frac{\lambda}{n}\right)^{n-x} \] と表される。ここで、\(n\)を無限大になったときの極限 \[ \lim_{n\to \infty} p_X (x) = \lim_{n\to \infty} \frac{n!}{x!(n-x)!} \left(\frac{\lambda}{n}\right)^x \left(1-\frac{\lambda}{n}\right)^{n-x} \] を考える。ここで、定数となる\(\lambda^x\)と\(\frac{1}{x!}\)を\(\lim\)の外に出して、 \[ \left(\frac{\lambda^x}{x!}\right)\lim_{n\to \infty} \frac{n!}{(n-x)!} \left(\frac{1}{n^x}\right) \left(1-\frac{\lambda}{n}\right)^n \left(1-\frac{\lambda}{n}\right)^{-x} \] ここで、まず \[ \lim_{n\to \infty} \frac{n!}{(n-x)!} \left(\frac{1}{n^x}\right) \] の極限を求める。これは、1つ目の分数の分母分子で相殺される項を考慮すると次のように表される。 \[ \lim_{n\to \infty} \frac{n(n-1)(n-2)\cdots(n - x + 1)}{n^x} \] これは、 \[ \lim_{n\to \infty} \left(\frac{n}{n}\right) \left(\frac{n-1}{n}\right)\cdots \left(\frac{n - x + 1}{n}\right) \] と表され、\(n\to \infty\)では、1に近づくことがわかる。
次に、 \[ \lim_{n\to \infty} \left(1-\frac{\lambda}{n}\right)^n \] の極限を考える。\(x = - \frac{n}{\lambda}\)とおくと \[ \lim_{n\to \infty} \left(1-\frac{\lambda}{n}\right)^n = \lim_{n\to \infty} \left(1+\frac{1}{x}\right)^{x(-\lambda)} \] と表される。なお、\(e\)の定義が \[ \lim_{n\to \infty} \left(1+\frac{1}{x}\right)^{x} \] であるので、上式は \[ \lim_{n\to \infty} \left(1-\frac{\lambda}{n}\right)^n = \lim_{n\to \infty} \left(1+\frac{1}{x}\right)^{x(-\lambda)} = e^{-\lambda} \] と表すことができる。
最後に、 \[ \lim_{n\to \infty} \left(1-\frac{\lambda}{n}\right)^{-x} \] の極限を考えるが、これは、\(n\to \infty\)のとき\(1^{-x}\)となり、1である。
以上を考え合わせると、 \[ \left(\frac{\lambda^x}{x!}\right)\lim_{n\to \infty} \frac{n!}{(n-x)!} \left(\frac{1}{n^x}\right) \left(1-\frac{\lambda}{n}\right)^n \left(1-\frac{\lambda}{n}\right)^{-x} = \left(\frac{\lambda^x}{x!}\right)\cdot 1\cdot e^{-\lambda}\cdot1 \] となり、整理すると \[ \frac{\lambda^x}{x!} e^{-\lambda} \] これは、ポアソン分布のPDFである。