ตารางข้อมูลประกอบด้วยค่าสังเกตของตัวแปรทั้งหมด 5 ตัวแปร ได้แก่ ผลสัมฤทธิ์ทางการเรียนคณิตศาสตร์ (matach) ทัศนคติต่อการเรียนคณิตศาสตร์ (matt) เศรษฐานะของครอบครัวนักเรียนที่วัดจากรายได้ของหัวหน้าครอบครัว หน่วยเป็น 1000 บาท (ses_kb) จำนวนพี่น้องในครอบครัว(sibl) และตัวแปร dummy ของเพศชาย (male)
| id | matach | matt | ses_kb | sibl | male |
|---|---|---|---|---|---|
| 1 | 67 | 4 | 15.00 | 2 | 1 |
| 2 | 89 | 3 | 33.00 | 1 | 1 |
| 3 | 92 | 5 | 32.00 | 2 | 1 |
| 4 | 56 | 2 | 20.00 | 3 | 0 |
| 5 | 73 | 4 | 30.00 | 3 | 1 |
| 6 | 56 | 2 | 12.00 | 2 | 1 |
| 7 | 86 | 3 | 30.00 | 5 | 0 |
| 8 | 79 | 3 | 20.00 | 3 | 0 |
| 9 | 42 | 2 | 15.00 | 5 | 0 |
| 10 | 67 | 2 | 20.00 | 2 | 1 |
| 11 | 84 | 3 | 17.00 | 3 | 1 |
| 12 | 75 | 3 | 23.00 | 5 | 0 |
| 13 | 79 | 4 | 12.00 | 2 | 0 |
| 14 | 80 | 2 | 32.00 | 1 | 0 |
| 15 | 57 | 3 | 17.00 | 2 | 0 |
| 16 | 42 | 1 | 25.00 | 1 | 0 |
| 17 | 75 | 2 | 30.00 | 3 | 1 |
| 18 | 72 | 3 | 15.50 | 4 | 1 |
| 19 | 97 | 5 | 35.00 | 2 | 1 |
| 20 | 89 | 3 | 25.00 | 3 | 1 |
| 21 | 74 | 3 | 18.00 | 2 | 1 |
| 22 | 56 | 1 | 24.00 | 1 | 0 |
| 23 | 50 | 2 | 14.00 | 2 | 0 |
| 24 | 48 | 2 | 15.00 | 5 | 0 |
| 25 | 75 | 4 | 23.00 | 3 | 0 |
| 26 | 90 | 4 | 32.00 | 4 | 1 |
| 27 | 72 | 3 | 21.00 | 3 | 1 |
| 28 | 86 | 3 | 22.00 | 2 | 1 |
| 29 | 55 | 3 | 17.00 | 2 | 0 |
| 30 | 63 | 4 | 22.00 | 3 | 0 |
| 31 | 74 | 2 | 12.35 | 1 | 1 |
| 32 | 60 | 3 | 23.20 | 5 | 0 |
| 33 | 79 | 4 | 30.00 | 6 | 1 |
| 34 | 56 | 1 | 12.00 | 2 | 1 |
| 35 | 89 | 2 | 34.50 | 4 | 0 |
| 36 | 82 | 3 | 28.00 | 2 | 1 |
| 37 | 74 | 4 | 17.80 | 3 | 1 |
| 38 | 49 | 2 | 14.50 | 4 | 0 |
| 39 | 64 | 3 | 22.30 | 2 | 0 |
| 40 | 63 | 3 | 18.00 | 1 | 0 |
พบว่าผลสัมฤทธิ์ทางการเรียนคณิตศาสตร์ (matach) น่ามีความสัมพันธ์กันเชิงเส้นกันรายได้ของครอบครัวและตัวแปรอิสระที่เหลือไม่มีความสัมพันธ์กันแบบเชิงเส้น
## id matach matt ses_kb sibl
## id 1.00000000 -0.113938152 -0.0851281 -0.09213937 0.068444513
## matach -0.11393815 1.000000000 0.5936552 0.62736593 0.003426468
## matt -0.08512810 0.593655189 1.0000000 0.31202720 0.153066628
## ses_kb -0.09213937 0.627365926 0.3120272 1.00000000 0.087497775
## sibl 0.06844451 0.003426468 0.1530666 0.08749777 1.000000000
## male -0.10828702 0.484559620 0.2807621 0.13099118 -0.133266868
## male
## id -0.1082870
## matach 0.4845596
## matt 0.2807621
## ses_kb 0.1309912
## sibl -0.1332669
## male 1.0000000
การวิเคราะห์ข้างต้นสมการถดถอยนี้มีค่า R2= 0.6673 แสดงว่าสมการถดถอยที่สร้างขึ้นสามารถอธิบายความผันแปรในผลสัมฤทธิ์ทางการเรียนคณิตศาสตร์ (Matach) ได้มากถึงร้อยละ 66.73 อย่างมีนัยสำคัญทางสถิติ บ่งชี้ว่าสมการที่สร้างขึ้นสามารถใช้เพื่ออธิบายและทำนายแนวโน้มผลสัมฤทธิ์ทางการเรียนคณิตศาสตร์ (Matach) ของนักเรียนได้ดี
จะได้สมการถดถอยสำหรับข้อมูลชุดนี้คือ
y ̂= 30.052 + 5.384matt + 0.999ses_kb - 0.578sibl + 9.031male
เมื่อพิจารณาค่าสัมประสิทธิการถดถอยในโมเดล ได้แก่ b0 = 30.052 , b1 = 5.384 , b2 = 0.999 , b3 = - 0.578 และ b4 = 9.031 พบว่ามีความสมเหตุสมผล
##
## Call:
## lm(formula = dat[, 2] ~ dat1[, 2] + dat1[, 3] + dat1[, 4] + dat1[,
## 5])
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.223e-14 -5.132e-15 -1.267e-15 1.777e-15 7.182e-14
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -5.393e-14 1.135e-14 -4.750e+00 3.4e-05 ***
## dat1[, 2] 1.000e+00 2.243e-16 4.458e+15 < 2e-16 ***
## dat1[, 3] -1.654e-15 2.730e-15 -6.060e-01 0.549
## dat1[, 4] 4.820e-16 3.957e-16 1.218e+00 0.231
## dat1[, 5] -2.129e-15 1.641e-15 -1.298e+00 0.203
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.327e-14 on 35 degrees of freedom
## Multiple R-squared: 1, Adjusted R-squared: 1
## F-statistic: 1.185e+31 on 4 and 35 DF, p-value: < 2.2e-16
ใช้สถิติวิเคราะห์ด้วยสถิติทดสอบ Shapiro-Wilk normality test พบว่าค่า P-value เท่ากับ 0.0565 มีค่ามากกว่าระดับนัยสําคัญ จึงทําการยอมรับสมมติฐานหลัก แสดงว่า ข้อมูลนั้นมีการแจกแจงแบบปกติที่ระดับนัยสําคัญ 0.05
##
## Shapiro-Wilk normality test
##
## data: resid
## W = 0.48699, p-value = 1.199e-10
จากการตรวจสอบข้อตกลงเบื้องต้นให้กับค่าคลาดเคลื่อนพบว่าด้าน Independence ความคลาดเคลื่อนสุ่มในโมเดลต้องเป็นอิสระซึ่งกันและกัน ด้าน Normality ความคลาดเคลื่อนสุ่มในโมเดลต้องมีการแจกแจงแบบปกติและด้าน Homoscedasticity กล่าวคือความแปรปรวนของความคลาดเคลื่อนสุ่มในโมเดลต้องมีความเป็นเอกพันธ์กันในแต่ละระดับของตัวแปรอิสระ ความสัมพันธ์ระหว่าง Fitted Value (y ̂) กับค่า residual มีการกระจายตัวอยู่รอบๆ ศูนย์ อย่างไม่มีรูปแบบ ดังนั้นสามารถสรุปได้ว่าค่าความคลาดเคลื่อนมีความแปรปรวนคงที่