参考

ギリシャ文字表

 文字 名称  文字 名称
\(\alpha\) アルファ \(\nu\) ニュー
\(\beta\) ベータ \(\xi\) クシー
\(\gamma\) ガンマ \(\omicron\)  オミクロン
\(\delta\) デルタ \(\pi\) パイ
\(\epsilon\) イプシロン \(\rho\) ロー
\(\zeta\) ゼータ \(\sigma\) シグマ
\(\eta\) エータ(イータ) \(\tau\) タウ
\(\theta\) テータ(シータ) \(\upsilon\) ユプシロン
\(\iota\) イオタ \(\phi\) フィー
\(\kappa\) カッパ \(\chi\) キー
\(\lambda\) ラムダ \(\psi\) プシー
\(\mu\) ミュー \(\omega\) オメガ

確率質量関数と確率密度関数

  • 離散型確率の場合、確率質量関数(Probability Mass Function: PMF)は確率を与える。 \[\begin{eqnarray*}P(x)=f(x)\tag{1}\end{eqnarray*}\]
  • 確率質量関数は以下の特徴をもつ、 \[\begin{eqnarray*}f(x)\geq 0\tag{1-1}\end{eqnarray*}\] \[\begin{eqnarray*}\sum_{x}^{}f(x)=1\tag{1-2}\end{eqnarray*}\]
  • 連続型確率の場合、確率密度関数(Probability Density Function: PDF)は次の式で確率を計算する。

\[\begin{eqnarray*}P(a\leq x \leq b)=\int_{a}^{b}f(x)dx\tag{2}\end{eqnarray*}\] - 確率密度関数は以下の特徴をもつ、 \[\begin{eqnarray*}f(x)\geq 0\tag{2-1}\end{eqnarray*}\] \[\begin{eqnarray*}\int_{-\infty}^{\infty}f(x)dx=1\tag{2-2}\end{eqnarray*}\]

確率分布: 一様分布

離散型一様分布

  • n個の可能性(output)が均等な確率をもつ確率分布の確率質量関数は

\[ f(x) = \frac{1}{n} \] ## 連続型一様分布 - aからbの連続な可能性が均等な確率をもつ確率分布の確率密度関数は \[ f(x) = \frac{1}{b-a}\] - 厳密に書くと

\[f(x)=\begin{cases}\dfrac{1}{b-a}&(a\leq x\leq b)\\0&(\mathrm{Otherwise})\end{cases}\]

  • 離散型_連続型一様分布の確率シミュレーション
a <- 1  # 範囲の下限
b <- 6  # 範囲の上限
Sample_Number <- 5  # ランダムに取り出すサンプル数

## 離散型一様分布
Result_1 <- sample(a:b, Sample_Number, replace = TRUE)
print(Result_1)
[1] 5 6 2 1 3
### 参考1 もし、replaceがなければ?
Result_2 <- sample(a:b, Sample_Number, replace = FALSE)
print(Result_2)
[1] 5 3 6 1 2
### 参考2 サイコロは?
Dice_1 <- sample(1:6, Sample_Number, replace = TRUE)
print(Dice_1)
[1] 4 6 1 6 5
## 連続型一様分布
Result_3 <- runif(Sample_Number, min = a, max = b)
print(Result_3)
[1] 4.046297 2.330145 3.660800 4.315760 2.745499

確率分布: ベルヌーイ試行

  • [表・裏]、[当たり・はずれ]などの、二つの可能性しかない場合の1回の試行で成功するか、どうか
  • 確率をpとすると \[ f(x)=p(1-p) \]
  • ベルヌーイ試行の確率シミュレーション
# 確率 0.3の二項分布を使う
Prob <- 0.3
Trial <- 1
Success <- 1

Result_4 <- rbinom(Success, Trial, Prob)
print(Result_4)
[1] 1
# 確率 0.3の二項分布を使う 複数回行う ⇒ 二項分布
Prob <- 0.3
Trial <- 10
Success <- 1

Result_5 <- rbinom(Success, Trial, Prob)
print(Result_5)
[1] 1

確率分布:二項分布

  • n > 1 で成功する確率Pが大きく、試行回数が大きくない場合。
  • C (組み合わせ)
  • x回成功する

\[ f(x) = _n \mathrm{C} _x p^x(1-p)^{n-x} = {n \choose x} p^x(1-p)^{n-x}\] \[ _n \mathrm{C} _x = \binom{n}{x} = \frac{n!}{x!(n-x)!} \] - n回の試行でコインの表が出る確率シミュレーションを複数回おこなう

Prob <- 0.8
Trial <- 10  # n
Simulation_Number <- 5  # 

Result_5 <- rbinom(Simulation_Number, Trial, Prob)
print(Result_5)  # それぞれのシミュレーションで表の出た確率
[1]  7  8  7 10  7

- x回で、n回成功する確率

Prob <- 0.5
Trial <- 6  # n
Success <- 2  # x

Result_6 <- dbinom(Success, Trial, Prob)
print(Result_6)
[1] 0.234375

確率分布:二項分布(2)

# 確率を設定する : 「表の出る確率」
Prob <- 0.5

# 試行回数を設定
Tries <- 10

# 成功する回数
Success <- 5

## 累積密度
dbinom(Success, Tries, Prob)
[1] 0.2460938
#  1万回のシミュレーション
Simulation_Number <- 10000

Result <- rbinom(Simulation_Number, Tries, Prob)
hist(Result)

mean(Result == Success)
[1] 0.2508
# Calculate the probability that at least five coins are heads
1 - pbinom(4, 10, 0.3)
[1] 0.1502683
# Confirm your answer with a simulation of 10,000 trials
mean(rbinom(10000, 10, 0.3) > 4)
[1] 0.1525
# Here is how you computed the answer in the last problem
mean(rbinom(10000, 10, 0.3) >= 5)
[1] 0.1499
# Try now with 100, 1000, 10,000, and 100,000 trials
mean(rbinom(100, 10, 0.3) >= 5)
[1] 0.18
var(rbinom(100, 10, 0.3) >= 5)
[1] 0.1066667
mean(rbinom(1000, 10, 0.3) >= 5)
[1] 0.148
var(rbinom(1000, 10, 0.3) >= 5)
[1] 0.1226737
mean(rbinom(10000, 10, 0.3) >= 5)
[1] 0.1511
var(rbinom(10000, 10, 0.3) >= 5)
[1] 0.1289785
mean(rbinom(1e+05, 10, 0.3) >= 5)
[1] 0.14922
var(rbinom(1e+05, 10, 0.3) >= 5)
[1] 0.1272562