禁止事項

  本試験を解くにあたり、下記のことを厳守すること。厳守していないことが判明した場合、カンニングと同等の扱いとする。カンニングと判断された場合、本学期に取得する予定の全ての単位が破棄される。

厳守すべき事項 (これらに従わない場合は採点対象外とする、下記チェックボックスを各自でチェックすること)

□ 1ページ目の上部に、名前、学籍番号が読める形で明記されていること。名前・学籍番号の記載がない解答は採点不可能とする (カンニングの可能性が高いとみなす)。
□ 手書きの場合、容易に読める字で書くこと。難読な字で書いてある場合は、採点不可能とする。
□ 画像ファイルで提出する場合、輝度・明度に留意すること。難読なファイルは採点対象外とする。
□ 提出するファイルは問題順に並んでいること。少なくとも名前・学籍番号の記載が1ページ目にない場合は採点対象外とする。
□ 参考文献、参考URLを明記すること (本講義の資料を参照した場合も、明記することとする)。これらを明記せず、複数人から同様の解答が見られた場合、採点対象外とする。
□ カンニングは禁止。
□ 計算過程の概要も明記すること。

禁止していない事項

以下、試験問題

問題1

  質量\(m\)のボールを100回投げ、\(i\)回目の試行において、ボールが手を離れた高さを\(p_i\), ボールが手を離れた際の速度を\(v_i\), ボールが手を離れた際に水平な地面から計測した射出角を\(\theta_i\)とする(図1参照)。加えて、このとき得られたボールの最高到達点を\(h_i\)とする(\(i = 1, ..., 100\))。以下の3つの文章において、相関係数の使い方として妥当であるか否かを答えよ。同時に、なぜ妥当であるか、もしくはなぜ妥当でないかも述べよ。加えて、相関係数の使い方として妥当でないと答えた各関係性について、適切に相関係数を利用する方法を答えよ。ただし、\(h\), \(p\), \(v\), \(\theta\), \(m\)の関係性は既知のものとする。

[1] \(h\)\(v\)の関係性を検証したい。\(h\)\(v\)について相関係数\(r = \frac{\frac{1}{N}\sum_{i = 1}^{100}(h_i - \bar{h})(v_i - \bar{v}))}{\sigma_h\sigma_v}\)を計算する。ただし、\(\bar{h} = \frac{1}{N}\sum_{i = 1}^{100}h_i\), \(\bar{v} = \frac{1}{N}\sum_{i = 1}^{100}v_i\), \(\sigma_h = \sqrt{\frac{1}{N}\sum_{i}^{100}(h_i - \bar{h})^2}\), \(\sigma_v = \sqrt{\frac{1}{N}\sum_{i}^{100}(v_i - \bar{v})^2}\)である。

[2] \(h\)\(p\)の関係性を検証したい。\(h\)\(p\)について相関係数\(r = \frac{\frac{1}{N}\sum_{i = 1}^{100}(h_i - \bar{h})(p_i - \bar{p}))}{\sigma_h\sigma_p}\)を計算する。ただし、\(\bar{p} = \frac{1}{N}\sum_{i = 1}^{100}p_i\), \(\sigma_p = \sqrt{\frac{1}{N}\sum_{i}^{100}(p_i - \bar{p})^2}\)である。

[3] \(h\)\(\theta\)の関係性を検証したい。\(h\)\(\theta\)について相関係数\(r = \frac{\frac{1}{N}\sum_{i = 1}^{100}(h_i - \bar{h})(\theta_i - \bar{\theta}))}{\sigma_h\sigma_{\theta}}\)を計算する。ただし、\(\bar{\theta} = \frac{1}{N}\sum_{i = 1}^{100}\theta_i\), \(\sigma_{\theta} = \sqrt{\frac{1}{N}\sum_{i}^{100}(\theta_i - \bar{\theta})^2}\)である。

問題2

  平均\(\mu\)、分散\(\sigma^2\)をもつ母集団から\(N\)個のデータ(\(x_1, x_2, ..., x_N\), \(x_i \in \mathbb{R}\))を計測する。計測の不具合によりランダムサンプリングができていないことが判明し、\(x_i\)\(x_j\)の共分散は\(c\sigma^2\) (\(c \in \mathbb{R}\)かつ\(0 \le c\)かつ\(c \ll 1\)) であることがわかった(\(i \neq j\))。このとき、母集団分散\(\sigma^2\)の不偏推定量を求めよ。

問題3

  平均0、分散1に従うガウス分布から生成したデータは、本来、母集団平均 \(\mu\) に関する帰無仮説 \(\mathrm{H_0}: \mu = 0\) は棄却されないべきである。下記のように データ数を\(N = 10\)としてシードを変えて100回シミュレーションをしてみる。加えて、各シミュレーションにおける数値に対してt検定を行い、得られたp値を下記に示す。

p_seq = matrix(0, 1, 100) #p-valueの系列 [初期化]
for(i in 1:100){
  set.seed(i)
  res = t.test(rnorm(10, 0, 1))
  
  p_seq[i] = res$p.value
}
sort(p_seq)
##   [1] 0.01883196 0.02351125 0.03516307 0.05308474 0.05383581 0.06009584
##   [7] 0.06818858 0.07009090 0.07349989 0.09978268 0.12133331 0.12213948
##  [13] 0.12340462 0.12880795 0.14674234 0.14901133 0.15033743 0.15983228
##  [19] 0.16156160 0.16162992 0.16259939 0.17392359 0.18422301 0.21880862
##  [25] 0.24425515 0.24940751 0.28683092 0.28903309 0.29426296 0.30114406
##  [31] 0.32844918 0.33079588 0.33464433 0.36470957 0.37964428 0.38001339
##  [37] 0.38241157 0.38286580 0.39251746 0.40526541 0.41218320 0.41291852
##  [43] 0.41603697 0.41876678 0.47265759 0.47688109 0.48108076 0.48877467
##  [49] 0.49109568 0.49439667 0.49690007 0.50134222 0.51488521 0.51506621
##  [55] 0.52630092 0.52989129 0.53632569 0.55132436 0.56250557 0.56846265
##  [61] 0.57192015 0.57275638 0.58104731 0.59828303 0.60098678 0.60350134
##  [67] 0.60523268 0.60931409 0.62253147 0.62777136 0.63614778 0.63826527
##  [73] 0.64148682 0.64155326 0.64925542 0.65203763 0.68559877 0.69867991
##  [79] 0.72518091 0.74425810 0.75645705 0.76381278 0.78981150 0.79806726
##  [85] 0.79934497 0.80102843 0.81177964 0.81573583 0.82827699 0.82977999
##  [91] 0.85844954 0.86581538 0.87392142 0.92160992 0.92310289 0.94959484
##  [97] 0.95454586 0.96680714 0.96944493 0.98630541

t検定により、100回中3回、p値が0.05より小さかったため、5%有意水準にて帰無仮説 \(H_0: \mu = 0\) が棄却された。すなわち、今回は真の母集団平均が0とわかっているため、この統計的検定の結果は間違っているといえよう。

  上記のように、同じ性質を持っているデータを繰り返し計測し、その都度統計的検定を行うことにより、誤った結論が得られる可能性が高くなる。それはなぜか理由を答えよ。

問題提出前に

上記の厳守すべき事項を全て厳守していることを確認してください。特に、氏名、学籍番号忘れはカンニングの可能性が高いとみなし、採点対象外とします。