- 運用開放軟體R管理與分析大型教育資料庫的檔案
- 嵌入intsvy 套件並結合maptools等相關套件將分析結果呈現在地圖上以利比較
- 範例:分析十五個國家,十五歲學生數學成就表現與多個影響該表現的相關因素
2021/12/20
針對TIMSS、PIRLS、PISA與PIAAC四個大型教育資料庫所開發的套件
以PISA為例,介紹intsvy 套件的各種函數:
一、數據的選擇與合併
pisa.select.merge 從PISA提供的數據檔中直接選取與合併所需的檔案與變項
二、次數表的計算與繪製
pisa.table 針對類別變項產生包括百分比與標準誤的次數表
plot 將次數表進行圖形化
三、變項平均數的計算與繪製
pisa.mean 計算觀察變項(不包括似真值)的平均數與標準誤。
pisa.mean.pv 可使用五個似真值計算平均成績與標準誤。
plot 將平均數進行圖形化
四、迴歸分析的計算與繪製
pisa.reg.pv 執行有似真值與重複抽樣加權值的線性迴歸分析(OLS)
plot 迴歸分析結果進行圖形化
plot 目前僅限使用在PISA與PIAAC這兩個資料庫所提供的數據檔
分析PISA2012年臺灣與其他14個國家(澳洲、加拿大、德國、西班牙、芬蘭、法國、英國、印尼、義大利、日本、墨西哥、馬來西亞、紐西蘭、美國)的15歲學生數學成就表現以及影響該表現相關因素(學生性別、家中藏書量、母親教育程、家中擁有物)
if (!require(devtools)) {
install.packages("devtools")
require(devtools)}
install_github("eldafani/intsvy")
更改變項型態:
as.factor():將國家(CNT)從字串轉換成因子 as.numeric():將學生性別(ST04Q01)、家中藏書量(ST28Q01)、母親教育程度(ST13Q01)、家中擁有物(ST26Q01-ST26Q14)從因子轉換成數值
更改變項名稱:
CNT改成Country_ID ST04Q01改成Gender ST28Q01改成Book ST13Q01改成Mother ST26Q01-ST26Q14改成Possessions
更改變項選項
「性別」改成女生是0;男生是1,再設定女生 F、男生是M 「家中藏書量」設定0-10本書是1;11-25本書是2;26-100 本書是3;101-200本書是4;201-500本書是5;500本書以上是6 「母親教育程度」改成高中畢業是5、高職畢業或五專是4、國中畢業是3、國小畢業是 2、國小肄業是1 「家中擁有物」設定選項Yes是1、No是0,並將家中擁有物的選項加總
德國(DEU)不論是男、女學生,有500本書(6)以上的人數皆多於其它十四個國家
墨西哥(MEX)不論男、女學生,只有0-10本書(1)的人數明顯多於其它十四個國家
臺灣(TAP)在每個家中藏書量的選項上,平均數學成績幾乎都高於其它十四個國家,除了在選項1時低於日本
印尼(IDN)在每個家中藏書量的選項上,平均數學成績都低於其它十四個國家
.
.
.
.
.
.
.
家中藏書量:法國(FRA)最高;印尼(IDN)最低
在學生性別:只有馬來西亞(MYS)是負向,其它十四個國家皆是正向
母親教育程度:法國(FRA)最高;臺灣(TAP)最低
家中擁有物,臺灣(TAP)最高;芬蘭(FIN)最低
R-squared:家中藏書量、學生性別、母親教育程度與家中擁有物對數學成績的解釋力以法國(FRA)最高;印尼(IDN)最低。
載入plyr套件
library(plyr)
資料框轉為矩陣
.
合併估計值並新增重新命名的國家變項
.
.
as.factor():將國家從字串轉換成因子 as.numeric():將學生性別、家中藏書量、母親教育程度、家中擁有物從因子轉換成數值
.
計算學生性別估計值25%與75%的數值,分別是10.310與 20.575
.
在新資料框中新增Genderlevel變項,輸入學生性別估計值的最低數值、25%數值、75%數值、最高數值作為分類基準,命名各數值區間的名稱,分別為後面 25%、中間 50%、前面 25%
.
載入maptools與RColorBrewer套件
library("maptools")
library("RColorBrewer")
讀取world.shp
.
合併world.shp與新資料框
.
設定顏色漸層
.
.
前面25%國家分別是德國(DEU)、紐西蘭(NZL)、義大利(ITA)、日本(JPN)
後面 25%國家分別是馬來西亞(MYS)、印尼(IDN)、芬蘭(FIN)、美國(USA)
.
法國(FRA)的顏色最深,表示該國的家中藏書量估計值最高;印尼(IDN)的顏色最淺,表示該國的家中藏書量估計值最低
相較於大部分的歐美與紐澳國家,亞洲國家的顏色幾乎呈現淺色
.
法國(FRA)的顏色最深,表示該國的母親教育程度估計值最高;臺灣(TAP)的顏色最淺,表示該國的母親教育程度估計值最低
相較於其它地區的國家,歐洲國家的顏色多呈現深色
.
臺灣(TAP)的顏色最深,表示該國的家中擁有物估計值最高;芬蘭(FIN)顏色最淺,表示該國的家中擁有物估計值最低
相較於其它地區的國家,臺灣與日本的顏色多呈現深色