本試験を解くにあたり、下記のことを厳守すること。厳守していないことが判明した場合、カンニングと同等の扱いとする。カンニングと判断された場合、本学期に取得する予定の全ての単位が破棄される。
□ 1ページ目の上部に、名前、学籍番号が読める形で明記されていること。名前・学籍番号の記載がない解答は採点不可能とする (カンニングの可能性が高いとみなす)。
□ 手書きの場合、容易に読める字で書くこと。難読な字で書いてある場合は、採点不可能とする。
□ 画像ファイルで提出する場合、輝度・明度に留意すること。難読なファイルは採点対象外とする。
□ 提出するファイルは問題順に並んでいること。少なくとも名前・学籍番号の記載が1ページ目にない場合は採点対象外とする。
□ 参考文献、参考URLを明記すること (本講義の資料を参照した場合も、明記することとする)。これらを明記せず、複数人から同様の解答が見られた場合、採点対象外とする。
□ カンニングは禁止。
web検索、過去の講義資料の参照、教科書の参照 (必ず参考文献、参考URLを明記すること)。
解析計算がどうしてもしんどい場合、何かしらのプログラミング言語を利用して解いても構わない (数値計算ベースで理解している場合もOKということ)。
フォーマット自由。ただし、1ページ目の上部に、名前、学籍番号が読める形で明記されていること、手書きならば容易に読める字で書かれていることは遵守しない限りは採点対象外とする。加えて、多数の解答用紙を多忙の折に採点する教員のことを明らかに配慮していないフォーマットである場合、採点しないこともある (レポートの体裁は整えてくださいということ)。
二項分布 \[\begin{equation} p(k; N, p) = _NC_k p^k(1-p)^{N-k} \end{equation}\] のモーメント母関数を計算せよ (p \(\in\) [0, 1])。そしてモーメント母関数を利用して、二項分布の平均、分散を計算せよ。
ノイズのない、とあるデータ \(x\) は本来、平均 \(\mu_0\) 、分散 \(\sigma_0^2\) のガウス分布に従うことが知られている。 加えて、そのデータ \(x\) を計測することで得られる観測値 \(y\) は、\(x\) に加えて平均 \(0\) 、分散 \(\sigma_1^2\)のガウス分布に従うノイズが加わることが知られている。\(p(x)\)、\(p(y|x)\)の式を書き下し、ノイズが加わった観測値 \(y\) が計測された元での、ノイズのない真のデータ \(x\) が従う確率分布 \(p(x|y)\) を計算せよ。
平均0、分散1に従うガウス分布から生成したデータは、本来、母集団平均 \(\mu\) に関する帰無仮説 \(\mathrm{H_0}: \mu = 0\) は棄却されないべきである。下記のように データ数を\(N = 10\)としてシードを変えて100回シミュレーションをしてみる。
p_seq = matrix(0, 1, 100) #p-valueの系列 [初期化]
for(i in 1:100){
set.seed(i)
res = t.test(rnorm(10, 0, 1))
p_seq[i] = res$p.value
}
sort(p_seq)
## [1] 0.01883196 0.02351125 0.03516307 0.05308474 0.05383581 0.06009584
## [7] 0.06818858 0.07009090 0.07349989 0.09978268 0.12133331 0.12213948
## [13] 0.12340462 0.12880795 0.14674234 0.14901133 0.15033743 0.15983228
## [19] 0.16156160 0.16162992 0.16259939 0.17392359 0.18422301 0.21880862
## [25] 0.24425515 0.24940751 0.28683092 0.28903309 0.29426296 0.30114406
## [31] 0.32844918 0.33079588 0.33464433 0.36470957 0.37964428 0.38001339
## [37] 0.38241157 0.38286580 0.39251746 0.40526541 0.41218320 0.41291852
## [43] 0.41603697 0.41876678 0.47265759 0.47688109 0.48108076 0.48877467
## [49] 0.49109568 0.49439667 0.49690007 0.50134222 0.51488521 0.51506621
## [55] 0.52630092 0.52989129 0.53632569 0.55132436 0.56250557 0.56846265
## [61] 0.57192015 0.57275638 0.58104731 0.59828303 0.60098678 0.60350134
## [67] 0.60523268 0.60931409 0.62253147 0.62777136 0.63614778 0.63826527
## [73] 0.64148682 0.64155326 0.64925542 0.65203763 0.68559877 0.69867991
## [79] 0.72518091 0.74425810 0.75645705 0.76381278 0.78981150 0.79806726
## [85] 0.79934497 0.80102843 0.81177964 0.81573583 0.82827699 0.82977999
## [91] 0.85844954 0.86581538 0.87392142 0.92160992 0.92310289 0.94959484
## [97] 0.95454586 0.96680714 0.96944493 0.98630541
すると、100回中3回、5%有意水準にて帰無仮説 \(H_0: \mu = 0\) が棄却された。すなわち、今回は真の母集団平均が0とわかっているため、この統計的検定の結果は間違っているといえよう。
このような間違った統計的検定の結果を防ぐためには、どのように対処すればよいか?考えうる対処法を2つ挙げよ。
上記の厳守すべき事項を全て厳守していることを確認してください。特に、氏名、学籍番号忘れはカンニングの可能性が高いとみなし、採点対象外とします。