第14回 母集団と標本(9.1–9.2.1)
- 標本から母集団分布について推測することを統計的推測という.
- 復元抽出した無作為標本の各個体の属性値を確率変数で表すと,それらは独立かつ同一に(iid)母集団分布にしたがう.
- 母集団分布の特性を表す定数を母数,標本の関数を統計量という.
- 確率的な標本抽出にともなう統計量の分布を標本分布という.
- 統計量の標本分布から母数について推測するのが統計的推測.
1 記述統計学と推測統計学(p. 175)
定義 1 ある全体について知るための方法論の体系を統計学という.
注釈. 元来は国(state)の状態(state)について知るのが目的であった.
定義 2 データ整理の手法の体系を記述統計学という.
注釈. 大量観察による法則の発見を目的とする.
定義 3 一部の観察から全体について推測することを統計的推測という.
注釈. 一部を見て全体を語るには注意が必要.
定義 4 統計的推測の理論体系を推測統計学という.
2 母集団と標本
2.1 母集団と標本(p. 176)
定義 5 考察の対象全体を母集団という.
例 1 日本国民の有権者全体,日本のテレビ所有世帯全体.
定義 6 母集団のうち実際に観察される部分を標本という.
注釈. 「標本から母集団について推測」するのが統計的推測.
2.2 母集団分布(p. 178)
定義 7 母集団における各個体の属性値の分布を母集団分布という.
注釈. 度数分布や確率分布で表される.
注釈. 「標本から母集団分布について推測」するのが統計的推測.
定義 8 有限個の個体から成る母集団を有限母集団という.
注釈. 母集団分布は度数分布で表される.
定義 9 無限個の個体から成る仮説的な母集団を無限(仮説)母集団という.
注釈. 適当な確率分布を母集団分布として仮定する.
2.3 標本抽出(p. 176)
定義 10 母集団から標本を取り出すことを標本抽出という.
定義 11 標本に含まれる個体の数を標本の大きさという.
注釈. n 個の個体を含む標本は,大きさ n の 1 つの標本であり,n 個の標本ではない.
定義 12 取り出した個体を母集団に戻しながら繰り返す抽出を復元抽出という.
注釈. 同じ個体を 2 回以上取り出すことがある.ただし無限母集団ではその確率は 0.
定義 13 取り出した個体を母集団に戻さずに繰り返す抽出を非復元抽出という.
注釈. 標本をまとめて一度に取り出すのは非復元抽出.
注釈. 無限母集団では復元抽出と非復元抽出に実質的な違いはない.
定義 14 どの個体の組合せも等確率で取り出される抽出を(単純)無作為抽出という.
注釈. 無作為抽出した個体を確率変数で表すと,その確率分布は母集団分布と等しい.
定義 15 無作為抽出した標本を無作為標本という.
注釈. 復元抽出した無作為標本の各個体を確率変数で表すと, それらは独立かつ同一に(independent and identically distributed, iid) 母集団分布にしたがう.
注釈. 「統計学入門」では復元抽出した無作為標本を想定する.
例 2 母集団を (x_1,\dots,x_5) とする. ただし \begin{align*} & x_1:=175, \quad x_2:=170, \quad x_3:=169, \\ & x_4:=165, \quad x_5:=164 \end{align*} 母集団分布の pmf は p(x):=\begin{cases} 1/5 & \text{for $x=164,165,169,170,175$} \\ 0 & \text{for $x \ne 164,165,169,170,175$} \\ \end{cases} 母集団から無作為抽出した個体を X とすると, X=\begin{cases} 164 & \text{with pr.\ $1/5$} \\ 165 & \text{with pr.\ $1/5$} \\ 169 & \text{with pr.\ $1/5$} \\ 170 & \text{with pr.\ $1/5$} \\ 175 & \text{with pr.\ $1/5$} \\ \end{cases} X の pmf は p(.).
3 母数と統計量
3.1 母数(p. 179)
定義 16 確率分布の特性を表す定数を母数(パラメーター)という.
注釈. 「標本から母数について推測」するのが統計的推測.
例 3 平均,分散.
定義 17 母集団分布の平均を母平均という.
定義 18 母集団分布の分散を母分散という.
定義 19 有限個の母数で表せる分布をパラメトリックな分布という.
注釈. 母数を知れば母集団分布が完全に分かる.
例 4 \mathrm{Bin}(n,p),\mathrm{Poi}(\lambda),\mathrm{N}\left(\mu,\sigma^2\right).
定義 20 有限個の母数で表せない分布をノンパラメトリックな分布という.
注釈. 母集団分布が完全に分からなくても, 代表的な母数(母平均・母分散)を知ることは重要.
3.2 統計量(p. 182)
定義 21 標本の関数を統計量という.
注釈. 母集団分布や母数の推測に用いる.
例 5 標本の平均・分散.
3.3 標本分布(p. 183)
定義 22 確率的な標本抽出にともなう統計量の分布を標本分布という.
注釈. 「統計量の標本分布から母数について推測」するのが統計的推測.
3.4 標本平均(p. 183)
(X_1,\dots,X_n) を標本とする.
定義 23 (X_1,\dots,X_n) の標本平均は \bar{X}:=\frac{X_1+\dots+X_n}{n}
注釈. 母平均とは異なる.
定理 1 (X_1,\dots,X_n) が平均 \mu,分散 \sigma^2 の母集団分布からの無作為標本なら \begin{align*} \operatorname{E}\left(\bar{X}\right) & =\mu \\ \operatorname{var}\left(\bar{X}\right) & =\frac{\sigma^2}{n} \end{align*}
証明. 復習テスト.
注釈. 母平均,母分散との関係に注意.
定理 2 (X_1,\dots,X_n) が \mathrm{N}\left(\mu,\sigma^2\right) からの無作為標本なら \bar{X} \sim \mathrm{N}\left(\mu,\frac{\sigma^2}{n}\right)
証明. 復習テスト.
注釈. この結果を利用して \mu について推測する.
定理 3 (X_1,\dots,X_n) が平均 \mu,分散 \sigma^2 の母集団分布からの無作為標本なら \bar{X} \stackrel{a}{\sim}\mathrm{N}\left(\mu,\frac{\sigma^2}{n}\right)
証明. 中心極限定理.
注釈. この結果を利用して \mu について近似的に推測する.
まとめ
統計学, 記述統計学, 推測統計学, 統計的推測, 母集団, 標本, 母集団分布, 有限母集団, 無限(仮説)母集団, 標本抽出, 標本の大きさ, 復元抽出, 非復元抽出, (単純)無作為抽出, 無作為標本, iid, 母数(パラメーター), 母平均, 母分散, パラメトリックな分布, ノンパラメトリックな分布, 統計量, 標本分布, 標本平均