例題データ
DT::datatable(data)
事前テストの度数分布と四分位
par(mfcol=c(2,1))
hist(data$pre, breaks = seq(0, 30, 1), ylim = c(0, 20))
boxplot(data$pre, horizontal=T, ylim=c(0,30))

summary(data$pre)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5.00 9.75 16.00 16.10 22.25 30.00
table(data$pre)
##
## 5 6 7 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
## 11 10 2 2 1 3 7 5 3 2 5 7 5 2 2 3 5 2 2 5 4 3 7 1 1
- このように,最小値から第1四分位まで,第1四分位から中央値,中央値から第3四分位,第3四分位から最大値まで,それぞれ25%ずつが入る。
- したがって,A層,B層,C層,D層は全て25%となる。
事後テストの度数分布と四分位
par(mfcol=c(2,1))
hist(data$post, breaks = seq(0, 30, 1), ylim = c(0, 20))
boxplot(data$post, horizontal=T, ylim=c(0,30))

summary(data$post)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 6.00 12.75 18.00 18.40 25.25 30.00
table(data$post)
##
## 6 7 8 9 10 12 13 14 15 16 17 18 20 21 22 23 24 25 26 27 28 29 30
## 4 5 4 5 5 2 5 4 6 2 4 9 5 2 4 3 5 1 2 4 6 5 8
- 事後テストでも,それ自体で四分位を求めれば,A層,B層,C層,D層は全て25%となる。
- 最小値から第1四分位まで,第1四分位から中央値,中央値から第3四分位,第3四分位から最大値まで,それぞれの得点範囲は事前テストとは同じにはならない。
どうするか
学校ごとの事前テストの四分位を使う
- 一つの考えとして,学校ごとの事前テストの四分位をそのまま事後テストに当てはめる。
- この場合,以下のようになる。
pre.q1 <- subset(data, pre < 9.75)
table(pre.q1$pre, pre.q1$post)
##
## 6 7 8 9 10 12
## 5 4 3 2 2 0 0
## 6 0 2 1 3 4 0
## 7 0 0 1 0 1 0
## 9 0 0 0 0 0 2
- 行方向が事前,列方向が事後テストであり,この表から,事前テストの第1四分位である9.75を事後テストで超えたのは7人ということになる。
東京都全体の四分位を使う
- この場合だと,本日の資料の案15ページのようなことは可能。
- D層が30%,A層が20%ということも起こりうる。
結論
- 仮に四分位の活用を求めるなら,「四分位を活用する」の部分を,何に対する四分位なのかを明確にする。
- ただし,半年も経過すると,個人の学力は基本的に正の方向に変化する点には注意して,目標設定を行う必要がある。