ผลการวิเคราะห์สหสัมพันธ์และการวิเคราะห์ความถดถอยของผลสัมฤทธิทางการเรียน

ตารางข้อมูลประกอบด้วยค่าสังเกตของตัวแปรทั้งหมด 5 ตัวแปร ได้แก่ ผลสัมฤทธิ์ทางการเรียนคณิตศาสตร์ (matach) ทัศนคติต่อการเรียนคณิตศาสตร์ (matt) เศรษฐานะของครอบครัวนักเรียนที่วัดจากรายได้ของหัวหน้าครอบครัว หน่วยเป็น 1000 บาท (ses_kb) จำนวนพี่น้องในครอบครัว(sibl) และตัวแปร dummy ของเพศชาย (male)

id matach matt ses_kb sibl male
1 67 4 15.00 2 1
2 89 3 33.00 1 1
3 92 5 32.00 2 1
4 56 2 20.00 3 0
5 73 4 30.00 3 1
6 56 2 12.00 2 1
7 86 3 30.00 5 0
8 79 3 20.00 3 0
9 42 2 15.00 5 0
10 67 2 20.00 2 1
11 84 3 17.00 3 1
12 75 3 23.00 5 0
13 79 4 12.00 2 0
14 80 2 32.00 1 0
15 57 3 17.00 2 0
16 42 1 25.00 1 0
17 75 2 30.00 3 1
18 72 3 15.50 4 1
19 97 5 35.00 2 1
20 89 3 25.00 3 1
21 74 3 18.00 2 1
22 56 1 24.00 1 0
23 50 2 14.00 2 0
24 48 2 15.00 5 0
25 75 4 23.00 3 0
26 90 4 32.00 4 1
27 72 3 21.00 3 1
28 86 3 22.00 2 1
29 55 3 17.00 2 0
30 63 4 22.00 3 0
31 74 2 12.35 1 1
32 60 3 23.20 5 0
33 79 4 30.00 6 1
34 56 1 12.00 2 1
35 89 2 34.50 4 0
36 82 3 28.00 2 1
37 74 4 17.80 3 1
38 49 2 14.50 4 0
39 64 3 22.30 2 0
40 63 3 18.00 1 0

ความสัมพันธ์ของตัวแปรแต่ละตัว

พบว่าผลสัมฤทธิ์ทางการเรียนคณิตศาสตร์ (matach) น่ามีความสัมพันธ์กันเชิงเส้นกันรายได้ของครอบครัวและตัวแปรอิสระที่เหลือไม่มีความสัมพันธ์กันแบบเชิงเส้น

##                 id       matach       matt      ses_kb         sibl
## id      1.00000000 -0.113938152 -0.0851281 -0.09213937  0.068444513
## matach -0.11393815  1.000000000  0.5936552  0.62736593  0.003426468
## matt   -0.08512810  0.593655189  1.0000000  0.31202720  0.153066628
## ses_kb -0.09213937  0.627365926  0.3120272  1.00000000  0.087497775
## sibl    0.06844451  0.003426468  0.1530666  0.08749777  1.000000000
## male   -0.10828702  0.484559620  0.2807621  0.13099118 -0.133266868
##              male
## id     -0.1082870
## matach  0.4845596
## matt    0.2807621
## ses_kb  0.1309912
## sibl   -0.1332669
## male    1.0000000

สมการถดถอยและความเหมาะสมของสมการถดถอยทีสร้างขึ้น

การวิเคราะห์ข้างต้นสมการถดถอยนี้มีค่า R2= 0.6673 แสดงว่าสมการถดถอยที่สร้างขึ้นสามารถอธิบายความผันแปรในผลสัมฤทธิ์ทางการเรียนคณิตศาสตร์ (Matach) ได้มากถึงร้อยละ 66.73 อย่างมีนัยสำคัญทางสถิติ บ่งชี้ว่าสมการที่สร้างขึ้นสามารถใช้เพื่ออธิบายและทำนายแนวโน้มผลสัมฤทธิ์ทางการเรียนคณิตศาสตร์ (Matach) ของนักเรียนได้ดี

จะได้สมการถดถอยสำหรับข้อมูลชุดนี้คือ

y ̂= 30.052 + 5.384matt + 0.999ses_kb - 0.578sibl + 9.031male

เมื่อพิจารณาค่าสัมประสิทธิการถดถอยในโมเดล ได้แก่ b0 = 30.052 , b1 = 5.384 , b2 = 0.999 ,              b3 = - 0.578 และ b4 = 9.031 พบว่ามีความสมเหตุสมผล
## 
## Call:
## lm(formula = dat[, 2] ~ dat1[, 2] + dat1[, 3] + dat1[, 4] + dat1[, 
##     5])
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -1.223e-14 -5.132e-15 -1.267e-15  1.777e-15  7.182e-14 
## 
## Coefficients:
##               Estimate Std. Error    t value Pr(>|t|)    
## (Intercept) -5.393e-14  1.135e-14 -4.750e+00  3.4e-05 ***
## dat1[, 2]    1.000e+00  2.243e-16  4.458e+15  < 2e-16 ***
## dat1[, 3]   -1.654e-15  2.730e-15 -6.060e-01    0.549    
## dat1[, 4]    4.820e-16  3.957e-16  1.218e+00    0.231    
## dat1[, 5]   -2.129e-15  1.641e-15 -1.298e+00    0.203    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.327e-14 on 35 degrees of freedom
## Multiple R-squared:      1,  Adjusted R-squared:      1 
## F-statistic: 1.185e+31 on 4 and 35 DF,  p-value: < 2.2e-16

ผลการวิเคราะห์สมการถดถอย

ใช้สถิติวิเคราะห์ด้วยสถิติทดสอบ Shapiro-Wilk normality test พบว่าค่า P-value เท่ากับ 0.0565 มีค่ามากกว่าระดับนัยสําคัญ จึงทําการยอมรับสมมติฐานหลัก แสดงว่า ข้อมูลนั้นมีการแจกแจงแบบปกติที่ระดับนัยสําคัญ 0.05

## 
##  Shapiro-Wilk normality test
## 
## data:  resid
## W = 0.48699, p-value = 1.199e-10

Answer 4

จากการตรวจสอบข้อตกลงเบื้องต้นให้กับค่าคลาดเคลื่อนพบว่าด้าน Independence ความคลาดเคลื่อนสุ่มในโมเดลต้องเป็นอิสระซึ่งกันและกัน ด้าน Normality ความคลาดเคลื่อนสุ่มในโมเดลต้องมีการแจกแจงแบบปกติและด้าน Homoscedasticity กล่าวคือความแปรปรวนของความคลาดเคลื่อนสุ่มในโมเดลต้องมีความเป็นเอกพันธ์กันในแต่ละระดับของตัวแปรอิสระ ความสัมพันธ์ระหว่าง Fitted Value (y ̂) กับค่า residual มีการกระจายตัวอยู่รอบๆ ศูนย์ อย่างไม่มีรูปแบบ ดังนั้นสามารถสรุปได้ว่าค่าความคลาดเคลื่อนมีความแปรปรวนคงที่