禁止事項

  本試験を解くにあたり、下記のことを厳守すること。厳守していないことが判明した場合、カンニングと同等の扱いとする。カンニングと判断された場合、本学期に取得する予定の全ての単位が破棄される。

厳守すべき事項 (これらに従わない場合は採点対象外とする、下記チェックボックスと各自でチェックすること)

□ 1ページ目の上部に、名前、学籍番号が読める形で明記されていること。名前・学籍番号の記載がない解答は採点不可能とする (カンニングの可能性が高いとみなす)。
□ 手書きの場合、容易に読める字で書くこと。難読な字で書いてある場合は、採点不可能とする。
□ 画像ファイルで提出する場合、輝度・明度に留意すること。難読なファイルは採点対象外とする。
□ 提出するファイルは問題順に並んでいること。少なくとも名前・学籍番号の記載が1ページ目にない場合は採点対象外とする。
□ 参考文献、参考URLを明記すること (本講義の資料を参照した場合も、明記することとする)。これらを明記せず、複数人から同様の解答が見られた場合、採点対象外とする。
□ カンニングは禁止。

禁止していない事項

以下、試験問題

問題1

  確率変数 \(x \in (-\infty, \infty)\)は平均\(\mu\)、分散\(\sigma^2\)のガウス分布\(p(x; \mu, \sigma^2)\)に従い生成されると想定する。加えて、ガウス分布による任意の関数\(f(x)\)の期待値を \[\begin{equation} E[f(x)] = \int_{D_x} f(x)p(x; \mu, \sigma^2)dx \end{equation}\] と表記する。ただし\(D_x\)\(x\)の定義域である。\(k\)を実数とするとき、 \[\begin{equation} E[(x - k)^3] \end{equation}\] を求めよ。

問題2

  とあるデータ \(x\) は本来、平均 \(\mu_0\) 、分散 \(\sigma_0^2\) のガウス分布に従い生成されると想定する。 加えて、そのデータ \(x\) を計測することで得られる観測値 \(y\) は、\(x\) に加えて平均 \(0\) 、分散 \(\sigma_1^2\)のガウス分布に従うノイズが加わることが知られている。\(p(x)\)\(p(y|x)\)の式を書き下し、ノイズが加わった観測値 \(y\) が計測された元での、ノイズのない真のデータ \(x\) が従う確率分布 \(p(x|y)\) を計算せよ。

問題3

  平均0、分散1に従うガウス分布から生成したデータは、本来、母集団平均 \(\mu\) に関する帰無仮説 \(\mathrm{H_0}: \mu = 0\) は棄却されないべきである。下記のように データ数を\(N = 10\)としてシードを変えて100回シミュレーションをしてみる。

p_seq = matrix(0, 1, 100) #p-valueの系列 [初期化]
for(i in 1:100){
  set.seed(i)
  res = t.test(rnorm(10, 0, 1))
  
  p_seq[i] = res$p.value
}
sort(p_seq)
##   [1] 0.01883196 0.02351125 0.03516307 0.05308474 0.05383581 0.06009584
##   [7] 0.06818858 0.07009090 0.07349989 0.09978268 0.12133331 0.12213948
##  [13] 0.12340462 0.12880795 0.14674234 0.14901133 0.15033743 0.15983228
##  [19] 0.16156160 0.16162992 0.16259939 0.17392359 0.18422301 0.21880862
##  [25] 0.24425515 0.24940751 0.28683092 0.28903309 0.29426296 0.30114406
##  [31] 0.32844918 0.33079588 0.33464433 0.36470957 0.37964428 0.38001339
##  [37] 0.38241157 0.38286580 0.39251746 0.40526541 0.41218320 0.41291852
##  [43] 0.41603697 0.41876678 0.47265759 0.47688109 0.48108076 0.48877467
##  [49] 0.49109568 0.49439667 0.49690007 0.50134222 0.51488521 0.51506621
##  [55] 0.52630092 0.52989129 0.53632569 0.55132436 0.56250557 0.56846265
##  [61] 0.57192015 0.57275638 0.58104731 0.59828303 0.60098678 0.60350134
##  [67] 0.60523268 0.60931409 0.62253147 0.62777136 0.63614778 0.63826527
##  [73] 0.64148682 0.64155326 0.64925542 0.65203763 0.68559877 0.69867991
##  [79] 0.72518091 0.74425810 0.75645705 0.76381278 0.78981150 0.79806726
##  [85] 0.79934497 0.80102843 0.81177964 0.81573583 0.82827699 0.82977999
##  [91] 0.85844954 0.86581538 0.87392142 0.92160992 0.92310289 0.94959484
##  [97] 0.95454586 0.96680714 0.96944493 0.98630541

すると、100回中3回、5%有意水準にて帰無仮説 \(H_0: \mu = 0\) が棄却された。すなわち、今回は真の母集団平均が0とわかっているため、この統計的検定の結果は間違っているといえよう。

  このような間違った統計的検定の結果を防ぐためには、どのように対処すればよいか?考えうる対処法を2つ挙げよ。

問題提出前に

上記の厳守すべき事項を全て厳守していることを確認してください。特に、氏名、学籍番号忘れはカンニングの可能性が高いとみなし、採点対象外とします。