Số thứ tự: 08
# Load thư viện Mass chứa tập dữ liệu Boston
library(MASS)
# lm(medv~lstat + age ,data=Boston) là hàm dùng để fit một mô hình hồi quy bội với medv là giá trị đầu ra cần được dự đoán và lstat với age là giá trị đầu vào trong tập dữ liệu Boston
lm.fit = lm(medv~lstat + age ,data=Boston)
# Hàm summary(lm.fit) sẽ cho chúng ta biết thông tin về p-values, thống kê t(t-statistic), độ lệch chuẩn cho những hệ số của 2 biến lstat và age, cũng như là thống kê R^2, sai số chuẩn (standard errors) và thống kê F (F-statistic) cho mô hình
summary(lm.fit)
Call:
lm(formula = medv ~ lstat + age, data = Boston)
Residuals:
Min 1Q Median 3Q Max
-15.981 -3.978 -1.283 1.968 23.158
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 33.22276 0.73085 45.458 < 2e-16 ***
lstat -1.03207 0.04819 -21.416 < 2e-16 ***
age 0.03454 0.01223 2.826 0.00491 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 6.173 on 503 degrees of freedom
Multiple R-squared: 0.5513, Adjusted R-squared: 0.5495
F-statistic: 309 on 2 and 503 DF, p-value: < 2.2e-16
# Sử dụng dấu chấm . để sử dụng tất cả 13 biến trong dữ liệu Boston làm đầu vào để có được đầu ra là medv sau khi hoàn tất quá trình fit mô hình hồi quy bội
lm.fit=lm(medv~.,data=Boston)
# Phân tích thông tin chi tiết khi sử dụng tất cả các biến của dữ liệu Boston làm giá trị đầu vào, phân tích thông tin về p-values, thống kê t(t-statistic), độ lệch chuẩn cho những hệ số của tất cả 13 biến của dữ liệu Boston, cũng như là thống kê R^2, sai số chuẩn (standard errors) và thống kê F (F-statistic) cho mô hình
summary(lm.fit)
Call:
lm(formula = medv ~ ., data = Boston)
Residuals:
Min 1Q Median 3Q Max
-15.595 -2.730 -0.518 1.777 26.199
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.646e+01 5.103e+00 7.144 3.28e-12 ***
crim -1.080e-01 3.286e-02 -3.287 0.001087 **
zn 4.642e-02 1.373e-02 3.382 0.000778 ***
indus 2.056e-02 6.150e-02 0.334 0.738288
chas 2.687e+00 8.616e-01 3.118 0.001925 **
nox -1.777e+01 3.820e+00 -4.651 4.25e-06 ***
rm 3.810e+00 4.179e-01 9.116 < 2e-16 ***
age 6.922e-04 1.321e-02 0.052 0.958229
dis -1.476e+00 1.995e-01 -7.398 6.01e-13 ***
rad 3.060e-01 6.635e-02 4.613 5.07e-06 ***
tax -1.233e-02 3.760e-03 -3.280 0.001112 **
ptratio -9.527e-01 1.308e-01 -7.283 1.31e-12 ***
black 9.312e-03 2.686e-03 3.467 0.000573 ***
lstat -5.248e-01 5.072e-02 -10.347 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 4.745 on 492 degrees of freedom
Multiple R-squared: 0.7406, Adjusted R-squared: 0.7338
F-statistic: 108.1 on 13 and 492 DF, p-value: < 2.2e-16
# Tìm hiểu rõ hơn hàm summary dùng cho hồi quy tuyến tính, cũng như là ý nghĩa của những yếu tố trong câu lệnh này
?summary.lm
# Xuất qua R^2 của mô hình hồi quy bội khi sử dụng tất cả 13 biến của dữ liệu Boston là giá trị đầu vào
summary(lm.fit)$r.sq
[1] 0.7406427
# Xuất ra sai số chuẩn dư thừa (Residual standard error) của hàm hội quy bội ở trên
summary(lm.fit)$sigma
[1] 4.745298
# Fit mô hình hồi quy bội khi lấy tất cả các biến trừ biến age của dữ liệu Boston làm đầu vào
lm.fit1 = lm(medv~.-age,data= Boston)
# Phân tích thông tin mô hình hồi quy bội được tạo ở trên khi lấy tất cả biến trừ biến age
summary(lm.fit1)
Call:
lm(formula = medv ~ . - age, data = Boston)
Residuals:
Min 1Q Median 3Q Max
-15.6054 -2.7313 -0.5188 1.7601 26.2243
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 36.436927 5.080119 7.172 2.72e-12 ***
crim -0.108006 0.032832 -3.290 0.001075 **
zn 0.046334 0.013613 3.404 0.000719 ***
indus 0.020562 0.061433 0.335 0.737989
chas 2.689026 0.859598 3.128 0.001863 **
nox -17.713540 3.679308 -4.814 1.97e-06 ***
rm 3.814394 0.408480 9.338 < 2e-16 ***
dis -1.478612 0.190611 -7.757 5.03e-14 ***
rad 0.305786 0.066089 4.627 4.75e-06 ***
tax -0.012329 0.003755 -3.283 0.001099 **
ptratio -0.952211 0.130294 -7.308 1.10e-12 ***
black 0.009321 0.002678 3.481 0.000544 ***
lstat -0.523852 0.047625 -10.999 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 4.74 on 493 degrees of freedom
Multiple R-squared: 0.7406, Adjusted R-squared: 0.7343
F-statistic: 117.3 on 12 and 493 DF, p-value: < 2.2e-16
# Có thể sử dụng hàm update để cập nhập mô hình hồi quy bội
lm.fit1=update(lm.fit, ~.-age)
LS0tDQp0aXRsZTogIk3DtCBow6xuaCBo4buTaSBxdXkgYuG7mWkiDQpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sNCi0tLQ0KDQojIyMgVMOqbjogTWFpIEh1eQ0KIyMjIE1TU1Y6IDQzLjAxLjEwNC4wNjUNCiMjIyBT4buRIHRo4bupIHThu7E6IDA4DQoNCmBgYHtyfQ0KIyBMb2FkIHRoxrAgdmnhu4duIE1hc3MgY2jhu6lhIHThuq1wIGThu68gbGnhu4d1IEJvc3Rvbg0KbGlicmFyeShNQVNTKQ0KIyBsbShtZWR2fmxzdGF0ICsgYWdlICxkYXRhPUJvc3RvbikgbMOgIGjDoG0gZMO5bmcgxJHhu4MgZml0IG3hu5l0IG3DtCBow6xuaCBo4buTaSBxdXkgYuG7mWkgduG7m2kgbWVkdiBsw6AgZ2nDoSB0cuG7iyDEkeG6p3UgcmEgY+G6p24gxJHGsOG7o2MgZOG7sSDEkW/DoW4gIHbDoCBsc3RhdCB24bubaSBhZ2UgbMOgIGdpw6EgdHLhu4sgxJHhuqd1IHbDoG8gdHJvbmcgdOG6rXAgZOG7ryBsaeG7h3UgQm9zdG9uDQpsbS5maXQgPSBsbShtZWR2fmxzdGF0ICsgYWdlICxkYXRhPUJvc3RvbikNCmBgYA0KDQoNCmBgYHtyfQ0KIyBIw6BtIHN1bW1hcnkobG0uZml0KSBz4bq9IGNobyBjaMO6bmcgdGEgYmnhur90IHRow7RuZyB0aW4gduG7gSBwLXZhbHVlcywgdGjhu5FuZyBrw6ogdCh0LXN0YXRpc3RpYyksIMSR4buZIGzhu4djaCBjaHXhuqluIGNobyBuaOG7r25nIGjhu4cgc+G7kSBj4bunYSAyIGJp4bq/biBsc3RhdCB2w6AgYWdlLCBjxaluZyBuaMawIGzDoCB0aOG7kW5nIGvDqiBSXjIsIHNhaSBz4buRIGNodeG6qW4gKHN0YW5kYXJkIGVycm9ycykgdsOgIHRo4buRbmcga8OqIEYgKEYtc3RhdGlzdGljKSBjaG8gbcO0IGjDrG5oDQpzdW1tYXJ5KGxtLmZpdCkNCmBgYA0KDQpgYGB7cn0NCiMgU+G7rSBk4bulbmcgZOG6pXUgY2jhuqVtIC4gxJHhu4Mgc+G7rSBk4bulbmcgdOG6pXQgY+G6oyAxMyBiaeG6v24gdHJvbmcgZOG7ryBsaeG7h3UgQm9zdG9uIGzDoG0gxJHhuqd1IHbDoG8gxJHhu4MgY8OzIMSRxrDhu6NjIMSR4bqndSByYSBsw6AgbWVkdiBzYXUga2hpIGhvw6BuIHThuqV0IHF1w6EgdHLDrG5oIGZpdCBtw7QgaMOsbmggaOG7k2kgcXV5IGLhu5lpIA0KbG0uZml0PWxtKG1lZHZ+LixkYXRhPUJvc3RvbikNCmBgYA0KDQoNCmBgYHtyfQ0KIyBQaMOibiB0w61jaCB0aMO0bmcgdGluIGNoaSB0aeG6v3Qga2hpIHPhu60gZOG7pW5nIHThuqV0IGPhuqMgY8OhYyBiaeG6v24gY+G7p2EgZOG7ryBsaeG7h3UgQm9zdG9uIGzDoG0gZ2nDoSB0cuG7iyDEkeG6p3UgdsOgbywgcGjDom4gdMOtY2ggdGjDtG5nIHRpbiB24buBIHAtdmFsdWVzLCB0aOG7kW5nIGvDqiB0KHQtc3RhdGlzdGljKSwgxJHhu5kgbOG7h2NoIGNodeG6qW4gY2hvIG5o4buvbmcgaOG7hyBz4buRIGPhu6dhIHThuqV0IGPhuqMgMTMgYmnhur9uIGPhu6dhIGThu68gbGnhu4d1IEJvc3RvbiwgY8WpbmcgbmjGsCBsw6AgdGjhu5FuZyBrw6ogUl4yLCBzYWkgc+G7kSBjaHXhuqluIChzdGFuZGFyZCBlcnJvcnMpIHbDoCB0aOG7kW5nIGvDqiBGIChGLXN0YXRpc3RpYykgY2hvIG3DtCBow6xuaA0Kc3VtbWFyeShsbS5maXQpDQpgYGANCg0KYGBge3J9DQojIFTDrG0gaGnhu4N1IHLDtSBoxqFuIGjDoG0gc3VtbWFyeSBkw7luZyBjaG8gaOG7k2kgcXV5IHR1eeG6v24gdMOtbmgsIGPFqW5nIG5oxrAgbMOgIMO9IG5naMSpYSBj4bunYSBuaOG7r25nIHnhur91IHThu5EgdHJvbmcgY8OidSBs4buHbmggbsOgeQ0KP3N1bW1hcnkubG0NCmBgYA0KDQpgYGB7cn0NCiMgWHXhuqV0IHF1YSBSXjIgY+G7p2EgbcO0IGjDrG5oIGjhu5NpIHF1eSBi4buZaSBraGkgc+G7rSBk4bulbmcgdOG6pXQgY+G6oyAxMyBiaeG6v24gY+G7p2EgZOG7ryBsaeG7h3UgQm9zdG9uIGzDoCBnacOhIHRy4buLIMSR4bqndSB2w6BvDQpzdW1tYXJ5KGxtLmZpdCkkci5zcQ0KYGBgDQoNCmBgYHtyfQ0KIyBYdeG6pXQgcmEgc2FpIHPhu5EgY2h14bqpbiBkxrAgdGjhu6thIChSZXNpZHVhbCBzdGFuZGFyZCBlcnJvcikgY+G7p2EgaMOgbSBo4buZaSBxdXkgYuG7mWkg4bufIHRyw6puDQpzdW1tYXJ5KGxtLmZpdCkkc2lnbWENCmBgYA0KDQoNCmBgYHtyfQ0KIyBGaXQgbcO0IGjDrG5oIGjhu5NpIHF1eSBi4buZaSBraGkgbOG6pXkgdOG6pXQgY+G6oyBjw6FjIGJp4bq/biB0cuG7qyBiaeG6v24gYWdlIGPhu6dhIGThu68gbGnhu4d1IEJvc3RvbiBsw6BtIMSR4bqndSB2w6BvDQpsbS5maXQxID0gbG0obWVkdn4uLWFnZSxkYXRhPSBCb3N0b24pDQojIFBow6JuIHTDrWNoIHRow7RuZyB0aW4gbcO0IGjDrG5oIGjhu5NpIHF1eSBi4buZaSDEkcaw4bujYyB04bqhbyDhu58gdHLDqm4ga2hpIGzhuqV5IHThuqV0IGPhuqMgYmnhur9uIHRy4burIGJp4bq/biBhZ2UNCnN1bW1hcnkobG0uZml0MSkNCmBgYA0KDQpgYGB7cn0NCiMgQ8OzIHRo4buDIHPhu60gZOG7pW5nIGjDoG0gdXBkYXRlIMSR4buDIGPhuq1wIG5o4bqtcCBtw7QgaMOsbmggaOG7k2kgcXV5IGLhu5lpDQpsbS5maXQxPXVwZGF0ZShsbS5maXQsIH4uLWFnZSkNCmBgYA0KDQo=