자료 출처


통계 분석


1. 평균과 중앙값

1-1. 학년 전체 진단평가 성적 평균
## [1] 92.0708


1-2. 반별 진단평가 성적 평균
## # A tibble: 9 x 2
##   class mean_score
##   <dbl>      <dbl>
## 1     1       92.1
## 2     2       93.8
## 3     3       96  
## 4     4       95.5
## 5     5       86.8
## 6     6       86.8
## 7     7       89.7
## 8     8       93.2
## 9     9       93.9

  • class = 반, mean_score = 진단평가 점수 평균
  • 가장 진단평가 평균 점수가 높은 반은 3반이고, 가장 진단평가 평균 점수가 낮은 반은 5, 6반이다.


2. 진단평가 성적 - 중앙값

2-1. 학년 전체 진단평가 성적 중앙값
## [1] 96


2-2. 반별 진단평가 성적 중앙값
## # A tibble: 9 x 2
##   class median_score
##   <dbl>        <dbl>
## 1     1           96
## 2     2           96
## 3     3           96
## 4     4          100
## 5     5           96
## 6     6           92
## 7     7           96
## 8     8           96
## 9     9           96

  • class = 반, median_score = 진단평가 점수 중앙값
  • 가장 진단평가 점수가 높은 반은 3반이고, 가장 진단평가 점수가 낮은 반은 6반이다.
  • 평균으로 계산했을 때와 중앙값으로 계산했을 때의 반의 점수가 다르다.


3. 줄기-잎 그림

6학년 전체 학생의 영어 진단평가 성적 줄기-잎 그림
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##    0 | 0
##    1 | 2
##    2 | 
##    3 | 2
##    4 | 0448
##    5 | 6
##    6 | 0444488
##    7 | 2266
##    8 | 0000004444444444888888888888
##    9 | 22222222222222222222222222222222226666666666666666666666666666666666+9
##   10 | 00000000000000000000000000000000000000000000000000000000000000000000+10
  • 6학년 전체 성적을 대상으로 한 줄기와 잎 그림을 살펴본 결과 90점 이상인 학생들이 많다는 것을 알 수 있다.


4. 히스토그램과 밀도그림

4-1. 6학년 영어 진단평가 성적 히스토그램
## Warning: Duplicated aesthetics after name standardisation: size

  • 히스토그램을 확인하니 왼쪽으로 편향된 그래프라는 것을 알 수 있다.
  • 이 학교 학생들의 영어 성적은 좋은 편이다.
  • 6학년 전체 진단평가 성적 평균: 92점
  • 6학년 전체 진단평가 성적 중앙값: 96점
  • 왼쪽으로 편향된 그래프는 평균값이 중앙값보다 대부분 낮다.


4-2. 6학년 남녀 영어 진단평가 성적 히스토그램

  • 여학생의 영어 진단평가 성적이 남학생의 영어 진단평가 성적이 산포가 작다.


4-3. 6학년 남녀 영어 진단평가 성적 밀도그림

  • 히스토그램의 모양과 밀도그림이 서로 비슷하다는 것을 알 수 있다.


5. 상자그림

5-1. (남학생)진단평가 평균 및 중앙값
## [1] 89.36937
## [1] 96


5-2. (여학생)진단평가 평균 및 중앙값
## [1] 94.67826
## [1] 96


5-3. 남녀 진단평가 성적 상자그림

  • 상자그림에서는 최대값, 최솟값, 사분위수, 중앙값 등을 알 수 있다.
  • 상자그림의 가운데 선은 중앙값이다.
  • 성별 성적을 비교해본 결과 중앙값은 비슷하지만 이상치가 남학생이 많고, 점수분포가 약간 아래쪽으로 치우쳐있음을 알 수 있다.
  • 여학생들의 성적이 중앙값에 더 모여있다.


6. 반별 영어 진단평가 성적 분산 비교

6-1. 6학년 반별 남녀 영어 진단평가 성적 회귀분석표
## 
## Call:
## lm(formula = class ~ score + gender, data = test)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5016 -2.0037  0.0378  2.1859  4.2274 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  5.99949    1.23999   4.838 2.44e-06 ***
## score       -0.01037    0.01284  -0.808    0.420    
## gendermale  -0.18958    0.35812  -0.529    0.597    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.642 on 223 degrees of freedom
## Multiple R-squared:  0.003572,   Adjusted R-squared:  -0.005364 
## F-statistic: 0.3997 on 2 and 223 DF,  p-value: 0.671
  • 반에 따른 남녀 성적 변수 회귀분석표
  • 반이 범주형 자료이므로 회귀분석에 적절하지 않아보인다. 반별 남녀 진단평가 성적에 따른 국소회귀추세선을 그려보니 5,6반의 남녀 성적 차이가 크다는 것을 알 수 있었다.


6-2. 6학년 남녀 영어 진단평가 성적 산포도

  • 붉은색 동그라미는 여학생의 영어 진단평가 점수, 파란색 세모는 남학생의 영어 진단평가 점수이다.
  • x값은 반으로 범주형 자료(질적자료)이고, y값은 성적으로 이산형 자료(양적자료)이다.
  • geom_smooth로 국소회귀분석 추세선을 추가해보았는데, x값이 범주형 자료여서 이 추세선을 쓰는 것은 옳지 않아 보인다.


7. 정규분포표

7-1. 6학년 남녀 영어 진단평가 문항별 정답률

  • 학생들이 가장 많이 맞힌 문제는 1번이다.
  • 3번 듣기 문제의 정답률이 가장 낮다는 것을 알 수 있다.


8. 영어 진단평가 듣기 점수와 읽기 점수 상관분석

선형회귀분석과 표준오차

  • 영어 듣기문제는 14문제, 영어 읽기 문제는 11문제이다.
  • 영어점수와 읽기점수가 낮을 수록 표준오차의 범위가 크다.
  • 영어 듣기 문제 점수가 높은 학생은 영어 읽기 문제 점수도 높다는 것을 알 수 있다.


9. 6학년 영어 부진학생(점수 40점 이하) 현황

9-1. 반별 부진학생 평균 수
## [1] 0.8888889
  • 반별 부진학생 평균 수는 약 1명이다.


9-2. 6학년 영어 진단평가 반별 부진학생 수

  • 2, 3, 4, 8반에는 부진학생이 없다.
  • 부진학생이 가장 많은 반은 5반이다.
  • 6-2. 6학년 반별 진단평가 영어 성적 산포도를 보았을 때도 5, 6반이 제일 점수 격차가 컸는데, 부진학생도 5,6반이 많았기 때문이었다.


10. 6학년 영어 진단평가 성적 기술적 통계분석 요약표

##             X..test.score
## nobs           226.000000
## NAs              0.000000
## Minimum          0.000000
## Maximum        100.000000
## 1. Quartile     92.000000
## 3. Quartile    100.000000
## Mean            92.070796
## Median          96.000000
## Sum          20808.000000
## SE Mean          0.929859
## LCL Mean        90.238450
## UCL Mean        93.903143
## Variance       195.408299
## Stdev           13.978852
## Skewness        -3.480639
## Kurtosis        14.926007
  • Minimum(최솟값): 0
  • Maximum(최댓값): 100
  • 1.Quartile(1사분위수): 92
  • 3.Quartile(3사분위수): 100
  • Mean(평균): 92.070796
  • Median(중앙값): 96
  • Se Mean(표준오차): 0.929859
  • Variance(분산): 195.408299
  • Stdev(표준편차): 13.978852 <- 표준편차는 자료가 평균을 중심으로 얼마나 퍼져 있는지
  • Skewness(편포도): -3.480639 <- 편포도값이 음수이면 왼쪽으로 편향된 그래프, 양수이면 오른쪽으로 편향된 그래프. 6학년 전체 영어 진단평가 성적 편포도는 음수이므로 왼쪽으로 편향되어 있다.
  • Kurtosis(첨도): 14.926007 <- 첨도 값이 음수이면 산포가 정규분포일 때보다 크고(퍼짐), 양수이면 산포가 정규분포일 때보다 작다.(뾰족). 6학년 전체 영어 진단평가 성적 첨도는 양수이므로 산포가 정규분포일 때보다 크다.