如課程所提“敘述統計”是將資料彙整且表達成方便讀取資訊的統計方法,課程中所提及到的平均數、中位數、全距、變異數以及標準差等等才利用在表達資料型態,以下就已簡單的R語言來介紹。
score.student <- c(10,20,50,50,60,65,65,70,70,70,70,70,80,90,100)
#某班級15位同學的某次數學小考成績
mean(score.student) #平均成績
## [1] 62.66667
median(score.student) #中位數
## [1] 70
range(score.student) #成績中的最小值與最大值
## [1] 10 100
var(score.student) #變異數
## [1] 545.9524
sd(score.student) #標準差
## [1] 23.36562
其中的全距可藉由range()可得到其成績最小值與最大值,將其相減即可得其全距,若以此數學成績為例子: 100-10=90,90及為此資料全距。
運用母體(population)與樣本(sample)的觀念,以選舉為例若對所有母體做調查,既費時又費力且高成本,但利用取出來的樣本來推論母體,且運用信賴水準(confidence level)與顯著水準(significance level)建立可信程度的測量。