讀取檔案

dta <- read.csv("https://stats.idre.ucla.edu/stat/data/binary.csv")
dta <- dta[, c("gpa", "gre")] 

檔案數據

從https://stats.idre.ucla.edu/stat/data/binary.csv截取出之學生GPA與GRE之資料

dta
##      gpa gre
## 1   3.61 380
## 2   3.67 660
## 3   4.00 800
## 4   3.19 640
## 5   2.93 520
## 6   3.00 760
## 7   2.98 560
## 8   3.08 400
## 9   3.39 540
## 10  3.92 700
## 11  4.00 800
## 12  3.22 440
## 13  4.00 760
## 14  3.08 700
## 15  4.00 700
## 16  3.44 480
## 17  3.87 780
## 18  2.56 360
## 19  3.75 800
## 20  3.81 540
## 21  3.17 500
## 22  3.63 660
## 23  2.82 600
## 24  3.19 680
## 25  3.35 760
## 26  3.66 800
## 27  3.61 620
## 28  3.74 520
## 29  3.22 780
## 30  3.29 520
## 31  3.78 540
## 32  3.35 760
## 33  3.40 600
## 34  4.00 800
## 35  3.14 360
## 36  3.05 400
## 37  3.25 580
## 38  2.90 520
## 39  3.13 500
## 40  2.68 520
## 41  2.42 560
## 42  3.32 580
## 43  3.15 600
## 44  3.31 500
## 45  2.94 700
## 46  3.45 460
## 47  3.46 580
## 48  2.97 500
## 49  2.48 440
## 50  3.35 400
## 51  3.86 640
## 52  3.13 440
## 53  3.37 740
## 54  3.27 680
## 55  3.34 660
## 56  4.00 740
## 57  3.19 560
## 58  2.94 380
## 59  3.65 400
## 60  2.82 600
## 61  3.18 620
## 62  3.32 560
## 63  3.67 640
## 64  3.85 680
## 65  4.00 580
## 66  3.59 600
## 67  3.62 740
## 68  3.30 620
## 69  3.69 580
## 70  3.73 800
## 71  4.00 640
## 72  2.92 300
## 73  3.39 480
## 74  4.00 580
## 75  3.45 720
## 76  4.00 720
## 77  3.36 560
## 78  4.00 800
## 79  3.12 540
## 80  4.00 620
## 81  2.90 700
## 82  3.07 620
## 83  2.71 500
## 84  2.91 380
## 85  3.60 500
## 86  2.98 520
## 87  3.32 600
## 88  3.48 600
## 89  3.28 700
## 90  4.00 660
## 91  3.83 700
## 92  3.64 720
## 93  3.90 800
## 94  2.93 580
## 95  3.44 660
## 96  3.33 660
## 97  3.52 640
## 98  3.57 480
## 99  2.88 700
## 100 3.31 400
## 101 3.15 340
## 102 3.57 580
## 103 3.33 380
## 104 3.94 540
## 105 3.95 660
## 106 2.97 740
## 107 3.56 700
## 108 3.13 480
## 109 2.93 400
## 110 3.45 480
## 111 3.08 680
## 112 3.41 420
## 113 3.00 360
## 114 3.22 600
## 115 3.84 720
## 116 3.99 620
## 117 3.45 440
## 118 3.72 700
## 119 3.70 800
## 120 2.92 340
## 121 3.74 520
## 122 2.67 480
## 123 2.85 520
## 124 2.98 500
## 125 3.88 720
## 126 3.38 540
## 127 3.54 600
## 128 3.74 740
## 129 3.19 540
## 130 3.15 460
## 131 3.17 620
## 132 2.79 640
## 133 3.40 580
## 134 3.08 500
## 135 2.95 560
## 136 3.57 500
## 137 3.33 560
## 138 4.00 700
## 139 3.40 620
## 140 3.58 600
## 141 3.93 640
## 142 3.52 700
## 143 3.94 620
## 144 3.40 580
## 145 3.40 580
## 146 3.43 380
## 147 3.40 480
## 148 2.71 560
## 149 2.91 480
## 150 3.31 740
## 151 3.74 800
## 152 3.38 400
## 153 3.94 640
## 154 3.46 580
## 155 3.69 620
## 156 2.86 580
## 157 2.52 560
## 158 3.58 480
## 159 3.49 660
## 160 3.82 700
## 161 3.13 600
## 162 3.50 640
## 163 3.56 700
## 164 2.73 520
## 165 3.30 580
## 166 4.00 700
## 167 3.24 440
## 168 3.77 720
## 169 4.00 500
## 170 3.62 600
## 171 3.51 400
## 172 2.81 540
## 173 3.48 680
## 174 3.43 800
## 175 3.53 500
## 176 3.37 620
## 177 2.62 520
## 178 3.23 620
## 179 3.33 620
## 180 3.01 300
## 181 3.78 620
## 182 3.88 500
## 183 4.00 700
## 184 3.84 540
## 185 2.79 500
## 186 3.60 800
## 187 3.61 560
## 188 2.88 580
## 189 3.07 560
## 190 3.35 500
## 191 2.94 640
## 192 3.54 800
## 193 3.76 640
## 194 3.59 380
## 195 3.47 600
## 196 3.59 560
## 197 3.07 660
## 198 3.23 400
## 199 3.63 600
## 200 3.77 580
## 201 3.31 800
## 202 3.20 580
## 203 4.00 700
## 204 3.92 420
## 205 3.89 600
## 206 3.80 780
## 207 3.54 740
## 208 3.63 640
## 209 3.16 540
## 210 3.50 580
## 211 3.34 740
## 212 3.02 580
## 213 2.87 460
## 214 3.38 640
## 215 3.56 600
## 216 2.91 660
## 217 2.90 340
## 218 3.64 460
## 219 2.98 460
## 220 3.59 560
## 221 3.28 540
## 222 3.99 680
## 223 3.02 480
## 224 3.47 800
## 225 2.90 800
## 226 3.50 720
## 227 3.58 620
## 228 3.02 540
## 229 3.43 480
## 230 3.42 720
## 231 3.29 580
## 232 3.28 600
## 233 3.38 380
## 234 2.67 420
## 235 3.53 800
## 236 3.05 620
## 237 3.49 660
## 238 4.00 480
## 239 2.86 500
## 240 3.45 700
## 241 2.76 440
## 242 3.81 520
## 243 2.96 680
## 244 3.22 620
## 245 3.04 540
## 246 3.91 800
## 247 3.34 680
## 248 3.17 440
## 249 3.64 680
## 250 3.73 640
## 251 3.31 660
## 252 3.21 620
## 253 4.00 520
## 254 3.55 540
## 255 3.52 740
## 256 3.35 640
## 257 3.30 520
## 258 3.95 620
## 259 3.51 520
## 260 3.81 640
## 261 3.11 680
## 262 3.15 440
## 263 3.19 520
## 264 3.95 620
## 265 3.90 520
## 266 3.34 380
## 267 3.24 560
## 268 3.64 600
## 269 3.46 680
## 270 2.81 500
## 271 3.95 640
## 272 3.33 540
## 273 3.67 680
## 274 3.32 660
## 275 3.12 520
## 276 2.98 600
## 277 3.77 460
## 278 3.58 580
## 279 3.00 680
## 280 3.14 660
## 281 3.94 660
## 282 3.27 360
## 283 3.45 660
## 284 3.10 520
## 285 3.39 440
## 286 3.31 600
## 287 3.22 800
## 288 3.70 660
## 289 3.15 800
## 290 2.26 420
## 291 3.45 620
## 292 2.78 800
## 293 3.70 680
## 294 3.97 800
## 295 2.55 480
## 296 3.25 520
## 297 3.16 560
## 298 3.07 460
## 299 3.50 540
## 300 3.40 720
## 301 3.30 640
## 302 3.60 660
## 303 3.15 400
## 304 3.98 680
## 305 2.83 220
## 306 3.46 580
## 307 3.17 540
## 308 3.51 580
## 309 3.13 540
## 310 2.98 440
## 311 4.00 560
## 312 3.67 660
## 313 3.77 660
## 314 3.65 520
## 315 3.46 540
## 316 2.84 300
## 317 3.00 340
## 318 3.63 780
## 319 3.71 480
## 320 3.28 540
## 321 3.14 460
## 322 3.58 460
## 323 3.01 500
## 324 2.69 420
## 325 2.70 520
## 326 3.90 680
## 327 3.31 680
## 328 3.48 560
## 329 3.34 580
## 330 2.93 500
## 331 4.00 740
## 332 3.59 660
## 333 2.96 420
## 334 3.43 560
## 335 3.64 460
## 336 3.71 620
## 337 3.15 520
## 338 3.09 620
## 339 3.20 540
## 340 3.47 660
## 341 3.23 500
## 342 2.65 560
## 343 3.95 500
## 344 3.06 580
## 345 3.35 520
## 346 3.03 500
## 347 3.35 600
## 348 3.80 580
## 349 3.36 400
## 350 2.85 620
## 351 4.00 780
## 352 3.43 620
## 353 3.12 580
## 354 3.52 700
## 355 3.78 540
## 356 2.81 760
## 357 3.27 700
## 358 3.31 720
## 359 3.69 560
## 360 3.94 720
## 361 4.00 520
## 362 3.49 540
## 363 3.14 680
## 364 3.44 460
## 365 3.36 560
## 366 2.78 480
## 367 2.93 460
## 368 3.63 620
## 369 4.00 580
## 370 3.89 800
## 371 3.77 540
## 372 3.76 680
## 373 2.42 680
## 374 3.37 620
## 375 3.78 560
## 376 3.49 560
## 377 3.63 620
## 378 4.00 800
## 379 3.12 640
## 380 2.70 540
## 381 3.65 700
## 382 3.49 540
## 383 3.51 540
## 384 4.00 660
## 385 2.62 480
## 386 3.02 420
## 387 3.86 740
## 388 3.36 580
## 389 3.17 640
## 390 3.51 640
## 391 3.05 800
## 392 3.88 660
## 393 3.38 600
## 394 3.75 620
## 395 3.99 460
## 396 4.00 620
## 397 3.04 560
## 398 2.63 460
## 399 3.65 700
## 400 3.89 600

基本統計圖形

以下透過R程式碼畫出dta數據之散佈圖

plot(dta, type = 'b', xlab = "gpa", ylab = "gre")
grid()

## 線性模型分析 \[y_i = \beta_0 + \beta_1 x_i + \epsilon_i ,~~ \epsilon_i \sim N(0, \sigma^2) \] GE = 截距參數 + 斜率參數 x GPA + 殘差(常態分佈) ## 分析概要報表

小數點4位,去掉星星

options(digits = 4, show.signif.stars = FALSE)
summary(m0 <- lm(gre ~ gpa, data = dta))
## 
## Call:
## lm(formula = gre ~ gpa, data = dta)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -302.39  -62.79   -2.21   68.51  283.44 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)
## (Intercept)    192.3       47.9    4.01  7.2e-05
## gpa            116.6       14.0    8.30  1.6e-15
## 
## Residual standard error: 107 on 398 degrees of freedom
## Multiple R-squared:  0.148,  Adjusted R-squared:  0.146 
## F-statistic: 68.9 on 1 and 398 DF,  p-value: 1.6e-15

方差分析表

anova(m0)
## Analysis of Variance Table
## 
## Response: gre
##            Df  Sum Sq Mean Sq F value  Pr(>F)
## gpa         1  786185  786185      69 1.6e-15
## Residuals 398 4538099   11402

模型擬合圖

plot(dta, xlab = "gpa", ylab = "gre")
abline(m0, lty = 2)
grid()

殘差圖

plot(resid(m0) ~ fitted(m0), xlab = "Fitted values", 
     ylab = "Residuals", ylim = c(-3.5, 3.5))
grid()
abline(h = 0, lty = 2)

### 驗證殘差常態分佈

qqnorm(resid(m0))
qqline(resid(m0))
grid()

結束

顯示演練單元信息

sessionInfo()
## R version 3.4.1 (2017-06-30)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 7 x64 (build 7601) Service Pack 1
## 
## Matrix products: default
## 
## locale:
## [1] LC_COLLATE=Chinese (Traditional)_Taiwan.950 
## [2] LC_CTYPE=Chinese (Traditional)_Taiwan.950   
## [3] LC_MONETARY=Chinese (Traditional)_Taiwan.950
## [4] LC_NUMERIC=C                                
## [5] LC_TIME=Chinese (Traditional)_Taiwan.950    
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets  methods   base     
## 
## other attached packages:
## [1] mosaic_1.1.1      Matrix_1.2-10     mosaicData_0.16.0 ggformula_0.6.2  
## [5] ggplot2_2.2.1     lattice_0.20-35   dplyr_0.7.4      
## 
## loaded via a namespace (and not attached):
##  [1] Rcpp_0.12.13     pillar_1.0.1     compiler_3.4.1   plyr_1.8.4      
##  [5] bindr_0.1        tools_3.4.1      digest_0.6.12    nlme_3.1-131    
##  [9] evaluate_0.10.1  tibble_1.4.1     gtable_0.2.0     pkgconfig_2.0.1 
## [13] rlang_0.2.0      psych_1.7.8      parallel_3.4.1   yaml_2.1.17     
## [17] ggdendro_0.1-20  bindrcpp_0.2     gridExtra_2.3    stringr_1.2.0   
## [21] knitr_1.20       rprojroot_1.3-2  grid_3.4.1       mosaicCore_0.4.2
## [25] glue_1.2.0       R6_2.2.2         foreign_0.8-69   rmarkdown_1.9   
## [29] reshape2_1.4.3   tidyr_0.8.0      purrr_0.2.4      magrittr_1.5    
## [33] backports_1.1.2  scales_0.5.0     htmltools_0.3.6  MASS_7.3-47     
## [37] splines_3.4.1    mnormt_1.5-5     assertthat_0.2.0 colorspace_1.3-2
## [41] stringi_1.1.6    lazyeval_0.2.1   munsell_0.4.3    broom_0.4.3