太郎丸 博
2025-05-13
| x | y | z | |
|---|---|---|---|
| A | 20 | 30 | 50 |
| B | 40 | 60 | 100 |
\[ \begin{align} n_{12} &= \frac{n_{1\cdot} n_{\cdot 2}}{N} \\ 30 &= \frac{100 \times 90}{300} \\ \end{align} \]
x | ジャズが好き | 嫌い |
|---|---|---|
ロックが好き | 10 | 50 |
〃 嫌い | 20 | 30 |
\[ 相関係数 = \frac{10 \times 30 - 50 \times 20}{\sqrt{60 \times 50 \times 30 \times 80}} = -0.26 \]
x | Yes | No |
|---|---|---|
A大学 | 60 | 40 |
B大学 | 2 | 8 |
オッズ比を \(\alpha\) と表記すると \[ \alpha = \frac{n_{11} n_{22}}{n_{12} n_{21}} \] 上の \(2\times 2\) 表の例では、オッズ比は \[ \alpha=\frac{60 \times 8}{40 \times 2}= 6 \]
| \(\alpha\) | \(\beta\) | \(\log(\alpha)\) | \(\log(\beta)\) |
|---|---|---|---|
| 1.5 | 0.667 | 0.405 | -0.405 |
| 2.0 | 0.500 | 0.693 | -0.693 |
| 3.0 | 0.333 | 1.099 | -1.099 |
| 5.0 | 0.200 | 1.609 | -1.609 |
| 10.0 | 0.100 | 2.303 | -2.303 |
| 20.0 | 0.050 | 2.996 | -2.996 |
\[ Q = \frac{n_{11} n_{22} - n_{12} n_{21}}{n_{11} n_{22} + n_{12} n_{21}} \] 上の \(2\times 2\) 表の例では、 \[ Q = \frac{60\times 8 - 40 \times 2}{60\times 8 + 40 \times 2} = 400/560 = 0.71 \]
| Yes | No | |
|---|---|---|
| A | 9 | 0 |
| B | 0 | 7 |
以下は相関係数が \(-1\) になる \(2\times 2\) 表の例
| Yes | No | |
|---|---|---|
| A | 0 | 13 |
| B | 11 | 0 |
x | 子ノンマニュアル | 子マニュアル | Sum |
|---|---|---|---|
母ノンマニュアル | 20 | 0 | 20 |
母マニュアル | 30 | 50 | 80 |
Sum | 50 | 50 | 100 |
B学会 | ||
|---|---|---|
x | 参加 | 不参加 |
A 学会参加 | 20 | 30 |
〃 不参加 | 40 | 10 |
A 学会 または B 学会のどちらかに参加している人のうち、両方の学会に所属している人の比率 (Jaccard 1902)
前のページの例では、\(20 / (20 + 30 + 40) = 0.22\)
1行目と1列目に有徴(参加している、単語が出現している、など注目しているほうのカテゴリ)のカテゴリを配置した場合、ジャッカードの類似性指数は一般に \[ \frac{n_{11}}{n_{11} + n_{12} + n_{21}} \] と定義される。
この指数は \(n_{22}\) (上の例では、どちらの学会にも所属していない人)の数を無視している。無視したほうがいい場合に推奨される。無視しないほうがいいなら相関係数やユールのQ を使うべき
以下の場合、甲県と乙県のどちらが、マジョリティとマイノリティの格差が大きいだろうか?
x | 低所得 | 高所得 |
|---|---|---|
マイノリティ | 99 | 1 |
マジョリティ | 96 | 4 |
x | 低所得 | 高所得 |
|---|---|---|
マイノリティ | 60 | 40 |
マジョリティ | 50 | 50 |