例題データ

DT::datatable(data)

事前テストの度数分布と四分位

par(mfcol=c(2,1))
hist(data$pre, breaks = seq(0, 30, 1), ylim = c(0, 20))
boxplot(data$pre, horizontal=T, ylim=c(0,30))

summary(data$pre)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5.00    9.75   16.00   16.10   22.25   30.00
table(data$pre)
## 
##  5  6  7  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 
## 11 10  2  2  1  3  7  5  3  2  5  7  5  2  2  3  5  2  2  5  4  3  7  1  1

事後テストの度数分布と四分位

par(mfcol=c(2,1))
hist(data$post, breaks = seq(0, 30, 1), ylim = c(0, 20))
boxplot(data$post, horizontal=T, ylim=c(0,30))

summary(data$post)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    6.00   12.75   18.00   18.40   25.25   30.00
table(data$post)
## 
##  6  7  8  9 10 12 13 14 15 16 17 18 20 21 22 23 24 25 26 27 28 29 30 
##  4  5  4  5  5  2  5  4  6  2  4  9  5  2  4  3  5  1  2  4  6  5  8

どうするか

学校ごとの事前テストの四分位を使う

  • 一つの考えとして,学校ごとの事前テストの四分位をそのまま事後テストに当てはめる。
  • この場合,以下のようになる。
pre.q1 <- subset(data, pre < 9.75)
table(pre.q1$pre, pre.q1$post)
##    
##     6 7 8 9 10 12
##   5 4 3 2 2  0  0
##   6 0 2 1 3  4  0
##   7 0 0 1 0  1  0
##   9 0 0 0 0  0  2
  • 行方向が事前,列方向が事後テストであり,この表から,事前テストの第1四分位である9.75を事後テストで超えたのは7人ということになる。

東京都全体の四分位を使う

  • この場合だと,本日の資料の案15ページのようなことは可能。
    • D層が30%,A層が20%ということも起こりうる。

結論