Tên: Mai Huy

MSSV: 43.01.104.065

Số thứ tự: 08

# Load thư viện Mass chứa tập dữ liệu Boston
library(MASS)
# lm(medv~lstat + age ,data=Boston) là hàm dùng để fit một mô hình hồi quy bội với medv là giá trị đầu ra cần được dự đoán  và lstat với age là giá trị đầu vào trong tập dữ liệu Boston
lm.fit = lm(medv~lstat + age ,data=Boston)
# Hàm summary(lm.fit) sẽ cho chúng ta biết thông tin về p-values, thống kê t(t-statistic), độ lệch chuẩn cho những hệ số của 2 biến lstat và age, cũng như là thống kê R^2, sai số chuẩn (standard errors) và thống kê F (F-statistic) cho mô hình
summary(lm.fit)

Call:
lm(formula = medv ~ lstat + age, data = Boston)

Residuals:
    Min      1Q  Median      3Q     Max 
-15.981  -3.978  -1.283   1.968  23.158 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 33.22276    0.73085  45.458  < 2e-16 ***
lstat       -1.03207    0.04819 -21.416  < 2e-16 ***
age          0.03454    0.01223   2.826  0.00491 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 6.173 on 503 degrees of freedom
Multiple R-squared:  0.5513,    Adjusted R-squared:  0.5495 
F-statistic:   309 on 2 and 503 DF,  p-value: < 2.2e-16
# Sử dụng dấu chấm . để sử dụng tất cả 13 biến trong dữ liệu Boston làm đầu vào để có được đầu ra là medv sau khi hoàn tất quá trình fit mô hình hồi quy bội 
lm.fit=lm(medv~.,data=Boston)
# Phân tích thông tin chi tiết khi sử dụng tất cả các biến của dữ liệu Boston làm giá trị đầu vào, phân tích thông tin về p-values, thống kê t(t-statistic), độ lệch chuẩn cho những hệ số của tất cả 13 biến của dữ liệu Boston, cũng như là thống kê R^2, sai số chuẩn (standard errors) và thống kê F (F-statistic) cho mô hình
summary(lm.fit)

Call:
lm(formula = medv ~ ., data = Boston)

Residuals:
    Min      1Q  Median      3Q     Max 
-15.595  -2.730  -0.518   1.777  26.199 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  3.646e+01  5.103e+00   7.144 3.28e-12 ***
crim        -1.080e-01  3.286e-02  -3.287 0.001087 ** 
zn           4.642e-02  1.373e-02   3.382 0.000778 ***
indus        2.056e-02  6.150e-02   0.334 0.738288    
chas         2.687e+00  8.616e-01   3.118 0.001925 ** 
nox         -1.777e+01  3.820e+00  -4.651 4.25e-06 ***
rm           3.810e+00  4.179e-01   9.116  < 2e-16 ***
age          6.922e-04  1.321e-02   0.052 0.958229    
dis         -1.476e+00  1.995e-01  -7.398 6.01e-13 ***
rad          3.060e-01  6.635e-02   4.613 5.07e-06 ***
tax         -1.233e-02  3.760e-03  -3.280 0.001112 ** 
ptratio     -9.527e-01  1.308e-01  -7.283 1.31e-12 ***
black        9.312e-03  2.686e-03   3.467 0.000573 ***
lstat       -5.248e-01  5.072e-02 -10.347  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 4.745 on 492 degrees of freedom
Multiple R-squared:  0.7406,    Adjusted R-squared:  0.7338 
F-statistic: 108.1 on 13 and 492 DF,  p-value: < 2.2e-16
# Tìm hiểu rõ hơn hàm summary dùng cho hồi quy tuyến tính, cũng như là ý nghĩa của những yếu tố trong câu lệnh này
?summary.lm
# Xuất qua R^2 của mô hình hồi quy bội khi sử dụng tất cả 13 biến của dữ liệu Boston là giá trị đầu vào
summary(lm.fit)$r.sq
[1] 0.7406427
# Xuất ra sai số chuẩn dư thừa (Residual standard error) của hàm hội quy bội ở trên
summary(lm.fit)$sigma
[1] 4.745298
# Fit mô hình hồi quy bội khi lấy tất cả các biến trừ biến age của dữ liệu Boston làm đầu vào
lm.fit1 = lm(medv~.-age,data= Boston)
# Phân tích thông tin mô hình hồi quy bội được tạo ở trên khi lấy tất cả biến trừ biến age
summary(lm.fit1)

Call:
lm(formula = medv ~ . - age, data = Boston)

Residuals:
     Min       1Q   Median       3Q      Max 
-15.6054  -2.7313  -0.5188   1.7601  26.2243 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  36.436927   5.080119   7.172 2.72e-12 ***
crim         -0.108006   0.032832  -3.290 0.001075 ** 
zn            0.046334   0.013613   3.404 0.000719 ***
indus         0.020562   0.061433   0.335 0.737989    
chas          2.689026   0.859598   3.128 0.001863 ** 
nox         -17.713540   3.679308  -4.814 1.97e-06 ***
rm            3.814394   0.408480   9.338  < 2e-16 ***
dis          -1.478612   0.190611  -7.757 5.03e-14 ***
rad           0.305786   0.066089   4.627 4.75e-06 ***
tax          -0.012329   0.003755  -3.283 0.001099 ** 
ptratio      -0.952211   0.130294  -7.308 1.10e-12 ***
black         0.009321   0.002678   3.481 0.000544 ***
lstat        -0.523852   0.047625 -10.999  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 4.74 on 493 degrees of freedom
Multiple R-squared:  0.7406,    Adjusted R-squared:  0.7343 
F-statistic: 117.3 on 12 and 493 DF,  p-value: < 2.2e-16
# Có thể sử dụng hàm update để cập nhập mô hình hồi quy bội
lm.fit1=update(lm.fit, ~.-age)
LS0tDQp0aXRsZTogIk3DtCBow6xuaCBo4buTaSBxdXkgYuG7mWkiDQpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sNCi0tLQ0KDQojIyMgVMOqbjogTWFpIEh1eQ0KIyMjIE1TU1Y6IDQzLjAxLjEwNC4wNjUNCiMjIyBT4buRIHRo4bupIHThu7E6IDA4DQoNCmBgYHtyfQ0KIyBMb2FkIHRoxrAgdmnhu4duIE1hc3MgY2jhu6lhIHThuq1wIGThu68gbGnhu4d1IEJvc3Rvbg0KbGlicmFyeShNQVNTKQ0KIyBsbShtZWR2fmxzdGF0ICsgYWdlICxkYXRhPUJvc3RvbikgbMOgIGjDoG0gZMO5bmcgxJHhu4MgZml0IG3hu5l0IG3DtCBow6xuaCBo4buTaSBxdXkgYuG7mWkgduG7m2kgbWVkdiBsw6AgZ2nDoSB0cuG7iyDEkeG6p3UgcmEgY+G6p24gxJHGsOG7o2MgZOG7sSDEkW/DoW4gIHbDoCBsc3RhdCB24bubaSBhZ2UgbMOgIGdpw6EgdHLhu4sgxJHhuqd1IHbDoG8gdHJvbmcgdOG6rXAgZOG7ryBsaeG7h3UgQm9zdG9uDQpsbS5maXQgPSBsbShtZWR2fmxzdGF0ICsgYWdlICxkYXRhPUJvc3RvbikNCmBgYA0KDQoNCmBgYHtyfQ0KIyBIw6BtIHN1bW1hcnkobG0uZml0KSBz4bq9IGNobyBjaMO6bmcgdGEgYmnhur90IHRow7RuZyB0aW4gduG7gSBwLXZhbHVlcywgdGjhu5FuZyBrw6ogdCh0LXN0YXRpc3RpYyksIMSR4buZIGzhu4djaCBjaHXhuqluIGNobyBuaOG7r25nIGjhu4cgc+G7kSBj4bunYSAyIGJp4bq/biBsc3RhdCB2w6AgYWdlLCBjxaluZyBuaMawIGzDoCB0aOG7kW5nIGvDqiBSXjIsIHNhaSBz4buRIGNodeG6qW4gKHN0YW5kYXJkIGVycm9ycykgdsOgIHRo4buRbmcga8OqIEYgKEYtc3RhdGlzdGljKSBjaG8gbcO0IGjDrG5oDQpzdW1tYXJ5KGxtLmZpdCkNCmBgYA0KDQpgYGB7cn0NCiMgU+G7rSBk4bulbmcgZOG6pXUgY2jhuqVtIC4gxJHhu4Mgc+G7rSBk4bulbmcgdOG6pXQgY+G6oyAxMyBiaeG6v24gdHJvbmcgZOG7ryBsaeG7h3UgQm9zdG9uIGzDoG0gxJHhuqd1IHbDoG8gxJHhu4MgY8OzIMSRxrDhu6NjIMSR4bqndSByYSBsw6AgbWVkdiBzYXUga2hpIGhvw6BuIHThuqV0IHF1w6EgdHLDrG5oIGZpdCBtw7QgaMOsbmggaOG7k2kgcXV5IGLhu5lpIA0KbG0uZml0PWxtKG1lZHZ+LixkYXRhPUJvc3RvbikNCmBgYA0KDQoNCmBgYHtyfQ0KIyBQaMOibiB0w61jaCB0aMO0bmcgdGluIGNoaSB0aeG6v3Qga2hpIHPhu60gZOG7pW5nIHThuqV0IGPhuqMgY8OhYyBiaeG6v24gY+G7p2EgZOG7ryBsaeG7h3UgQm9zdG9uIGzDoG0gZ2nDoSB0cuG7iyDEkeG6p3UgdsOgbywgcGjDom4gdMOtY2ggdGjDtG5nIHRpbiB24buBIHAtdmFsdWVzLCB0aOG7kW5nIGvDqiB0KHQtc3RhdGlzdGljKSwgxJHhu5kgbOG7h2NoIGNodeG6qW4gY2hvIG5o4buvbmcgaOG7hyBz4buRIGPhu6dhIHThuqV0IGPhuqMgMTMgYmnhur9uIGPhu6dhIGThu68gbGnhu4d1IEJvc3RvbiwgY8WpbmcgbmjGsCBsw6AgdGjhu5FuZyBrw6ogUl4yLCBzYWkgc+G7kSBjaHXhuqluIChzdGFuZGFyZCBlcnJvcnMpIHbDoCB0aOG7kW5nIGvDqiBGIChGLXN0YXRpc3RpYykgY2hvIG3DtCBow6xuaA0Kc3VtbWFyeShsbS5maXQpDQpgYGANCg0KYGBge3J9DQojIFTDrG0gaGnhu4N1IHLDtSBoxqFuIGjDoG0gc3VtbWFyeSBkw7luZyBjaG8gaOG7k2kgcXV5IHR1eeG6v24gdMOtbmgsIGPFqW5nIG5oxrAgbMOgIMO9IG5naMSpYSBj4bunYSBuaOG7r25nIHnhur91IHThu5EgdHJvbmcgY8OidSBs4buHbmggbsOgeQ0KP3N1bW1hcnkubG0NCmBgYA0KDQpgYGB7cn0NCiMgWHXhuqV0IHF1YSBSXjIgY+G7p2EgbcO0IGjDrG5oIGjhu5NpIHF1eSBi4buZaSBraGkgc+G7rSBk4bulbmcgdOG6pXQgY+G6oyAxMyBiaeG6v24gY+G7p2EgZOG7ryBsaeG7h3UgQm9zdG9uIGzDoCBnacOhIHRy4buLIMSR4bqndSB2w6BvDQpzdW1tYXJ5KGxtLmZpdCkkci5zcQ0KYGBgDQoNCmBgYHtyfQ0KIyBYdeG6pXQgcmEgc2FpIHPhu5EgY2h14bqpbiBkxrAgdGjhu6thIChSZXNpZHVhbCBzdGFuZGFyZCBlcnJvcikgY+G7p2EgaMOgbSBo4buZaSBxdXkgYuG7mWkg4bufIHRyw6puDQpzdW1tYXJ5KGxtLmZpdCkkc2lnbWENCmBgYA0KDQoNCmBgYHtyfQ0KIyBGaXQgbcO0IGjDrG5oIGjhu5NpIHF1eSBi4buZaSBraGkgbOG6pXkgdOG6pXQgY+G6oyBjw6FjIGJp4bq/biB0cuG7qyBiaeG6v24gYWdlIGPhu6dhIGThu68gbGnhu4d1IEJvc3RvbiBsw6BtIMSR4bqndSB2w6BvDQpsbS5maXQxID0gbG0obWVkdn4uLWFnZSxkYXRhPSBCb3N0b24pDQojIFBow6JuIHTDrWNoIHRow7RuZyB0aW4gbcO0IGjDrG5oIGjhu5NpIHF1eSBi4buZaSDEkcaw4bujYyB04bqhbyDhu58gdHLDqm4ga2hpIGzhuqV5IHThuqV0IGPhuqMgYmnhur9uIHRy4burIGJp4bq/biBhZ2UNCnN1bW1hcnkobG0uZml0MSkNCmBgYA0KDQpgYGB7cn0NCiMgQ8OzIHRo4buDIHPhu60gZOG7pW5nIGjDoG0gdXBkYXRlIMSR4buDIGPhuq1wIG5o4bqtcCBtw7QgaMOsbmggaOG7k2kgcXV5IGLhu5lpDQpsbS5maXQxPXVwZGF0ZShsbS5maXQsIH4uLWFnZSkNCmBgYA0KDQo=