Tên: Mai Huy

MSSV: 43.01.104.065

Số thứ tự: 08

Câu a)

# Load thư viện  ISLR chứa tập dữ liệu Carseats
library(ISLR)
# lm(Sales ~ Price + Urban + US, data = Carseats) là hàm dùng để fit một mô hình hồi quy bội với Sales là giá trị đầu ra cần được dự đoán và Price, Urban, US là giá trị đầu vào trong tập dữ liệu Carseats
model1 <- lm(Sales ~ Price + Urban + US, data = Carseats)

Câu b)

# Hàm summary(model1) sẽ cho chúng ta biết thông tin p-values, thống kê t(t-statistic), độ lệch chuẩn cho những hệ số của 3 biến Price, Urban và US, cũng như là thống kê R^2, sai số chuẩn (standard errors) và thống kê F (F-statistic) cho mô hình 
summary(model1)

Call:
lm(formula = Sales ~ Price + Urban + US, data = Carseats)

Residuals:
    Min      1Q  Median      3Q     Max 
-6.9206 -1.6220 -0.0564  1.5786  7.0581 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 13.043469   0.651012  20.036  < 2e-16 ***
Price       -0.054459   0.005242 -10.389  < 2e-16 ***
UrbanYes    -0.021916   0.271650  -0.081    0.936    
USYes        1.200573   0.259042   4.635 4.86e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.472 on 396 degrees of freedom
Multiple R-squared:  0.2393,    Adjusted R-squared:  0.2335 
F-statistic: 41.52 on 3 and 396 DF,  p-value: < 2.2e-16

Biến Urban và US có 2 label nên tạo 1 biến giả là UrbanYes và USYes. Hệ số của biến Price có thể được diễn giải bằng cách nói rằng nếu giá trị Price tăng lên 1 dollar thì biến đầu ra sales(theo đơn vị hang ngàn) sẽ giảm đi 54.459 đơn vị khi mà các biến đầu vào khác giữ nguyên.

Biến Price có p-value nhỏ nên có bằng chứng thông kê rằng có mối quan hệ giữa Price với biến đầu ra Sales

Biến UrbanYes có p-value khá lớn nên không có bằng chứng thông kê chỉ ra sự khác biệt về Sales giữa thành thị và nông thôn

Biến USYes có p-value nhỏ nên có bằng chứng thông kê chỉ ra sự khác biệt về Sales giữa US và không là US

Câu c)

Phương trình của mô hình được viết dưới dạng:

Sales = 13.043469 + (−0.054459) × Price + (−0.021916) × Urban + (1.200573) × US + ε

Với Urban=1 nếu ở trong vị trí thành thị và 0 nếu ở nông thôn, và US = 1 nếu ở USA và 0 nếu không ở USA.

Câu d)

Những biến đầu vào có thể bác bỏ giả thuyết H0: Bj=0 là Price và USYes do giá trị p-value nhỏ, nên có bằng chứng thống kê rằng có mối quan hệ giữa những biến này với biến đầu ra Sales.

Câu e)

Mô hình dưới đây chỉ sử dụng những biến đầu vào có đủ bằng chứng thống kê có mối quan hệ với biến Sales là Price và US

# lm(Sales ~ Price + US, data = Carseats) là hàm dùng để fit một mô hình hồi quy bội với Sales là giá trị đầu ra cần được dự đoán và Price, US là giá trị đầu vào trong tập dữ liệu Carseats
model2 <- lm(Sales ~ Price + US, data = Carseats)

Câu f)

# Phân tích mô hình khi có biến Urban ở câu a)
summary(model1)

Call:
lm(formula = Sales ~ Price + Urban + US, data = Carseats)

Residuals:
    Min      1Q  Median      3Q     Max 
-6.9206 -1.6220 -0.0564  1.5786  7.0581 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 13.043469   0.651012  20.036  < 2e-16 ***
Price       -0.054459   0.005242 -10.389  < 2e-16 ***
UrbanYes    -0.021916   0.271650  -0.081    0.936    
USYes        1.200573   0.259042   4.635 4.86e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.472 on 396 degrees of freedom
Multiple R-squared:  0.2393,    Adjusted R-squared:  0.2335 
F-statistic: 41.52 on 3 and 396 DF,  p-value: < 2.2e-16
# Phân tích mô hình khi không có biến Urban ở câu e)
summary(model2)

Call:
lm(formula = Sales ~ Price + US, data = Carseats)

Residuals:
    Min      1Q  Median      3Q     Max 
-6.9269 -1.6286 -0.0574  1.5766  7.0515 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 13.03079    0.63098  20.652  < 2e-16 ***
Price       -0.05448    0.00523 -10.416  < 2e-16 ***
USYes        1.19964    0.25846   4.641 4.71e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.469 on 397 degrees of freedom
Multiple R-squared:  0.2393,    Adjusted R-squared:  0.2354 
F-statistic: 62.43 on 2 and 397 DF,  p-value: < 2.2e-16

DỰa trên RSE = 2.469 và R^2 = 0.2354 của mô hình 2 , ta thấy rằng mô hình 2 khi không sử dụng biến đầu vào Urban thì sẽ cho ra được kết quả so với mô hình 1

Câu g)

# Tính toán khoảng tin cậy cho mô hình 2 với mức độ 95 % khoảng tin cậy khi level mặc định =0.95
confint(model2)
                  2.5 %      97.5 %
(Intercept) 11.79032020 14.27126531
Price       -0.06475984 -0.04419543
USYes        0.69151957  1.70776632

Câu h)

#Biểu đồ phân tán của các biến  dữ liệu với các dữ liệu cột được chia thành cửa sổ 2x2 bằng cách sử dụng hàm mfrow=c(2,2)
par(mfrow = c(2, 2))
# Biểu đồ mô hình 2
plot(model2)

Ở biểu đồ 4(Residuals vs Leverage), chúng ta sự hiện diện của 1 vài ngoại lệ ( lớn hơn 2 hoặc nhỏ hơn -2 ) và một số điểm đòn bẩy (leverage) vượt mức (p+1)/n(0.01).

LS0tDQp0aXRsZTogIkLDoGkgdOG6rXAgMSBfVHXhuqduIDQiDQpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sNCi0tLQ0KDQojIyMgVMOqbjogTWFpIEh1eQ0KIyMjIE1TU1Y6IDQzLjAxLjEwNC4wNjUNCiMjIyBT4buRIHRo4bupIHThu7E6IDA4DQoNCiMgQ8OidSBhKQ0KDQoNCmBgYHtyfQ0KIyBMb2FkIHRoxrAgdmnhu4duICBJU0xSIGNo4bupYSB04bqtcCBk4buvIGxp4buHdSBDYXJzZWF0cw0KbGlicmFyeShJU0xSKQ0KIyBsbShTYWxlcyB+IFByaWNlICsgVXJiYW4gKyBVUywgZGF0YSA9IENhcnNlYXRzKSBsw6AgaMOgbSBkw7luZyDEkeG7gyBmaXQgbeG7mXQgbcO0IGjDrG5oIGjhu5NpIHF1eSBi4buZaSB24bubaSBTYWxlcyBsw6AgZ2nDoSB0cuG7iyDEkeG6p3UgcmEgY+G6p24gxJHGsOG7o2MgZOG7sSDEkW/DoW4gdsOgIFByaWNlLCBVcmJhbiwgVVMgbMOgIGdpw6EgdHLhu4sgxJHhuqd1IHbDoG8gdHJvbmcgdOG6rXAgZOG7ryBsaeG7h3UgQ2Fyc2VhdHMNCm1vZGVsMSA8LSBsbShTYWxlcyB+IFByaWNlICsgVXJiYW4gKyBVUywgZGF0YSA9IENhcnNlYXRzKQ0KYGBgDQoNCiMgQ8OidSBiKQ0KDQpgYGB7cn0NCiMgSMOgbSBzdW1tYXJ5KG1vZGVsMSkgc+G6vSBjaG8gY2jDum5nIHRhIGJp4bq/dCB0aMO0bmcgdGluIHAtdmFsdWVzLCB0aOG7kW5nIGvDqiB0KHQtc3RhdGlzdGljKSwgxJHhu5kgbOG7h2NoIGNodeG6qW4gY2hvIG5o4buvbmcgaOG7hyBz4buRIGPhu6dhIDMgYmnhur9uIFByaWNlLCBVcmJhbiB2w6AgVVMsIGPFqW5nIG5oxrAgbMOgIHRo4buRbmcga8OqIFJeMiwgc2FpIHPhu5EgY2h14bqpbiAoc3RhbmRhcmQgZXJyb3JzKSB2w6AgdGjhu5FuZyBrw6ogRiAoRi1zdGF0aXN0aWMpIGNobyBtw7QgaMOsbmggDQpzdW1tYXJ5KG1vZGVsMSkNCmBgYA0KDQpCaeG6v24gVXJiYW4gdsOgIFVTIGPDsyAyIGxhYmVsIG7Dqm4gdOG6oW8gMSBiaeG6v24gZ2nhuqMgbMOgIFVyYmFuWWVzIHbDoCBVU1llcy4gSOG7hyBz4buRIGPhu6dhIGJp4bq/biBQcmljZSBjw7MgdGjhu4MgxJHGsOG7o2MgZGnhu4VuIGdp4bqjaSBi4bqxbmcgY8OhY2ggbsOzaSBy4bqxbmcgbuG6v3UgZ2nDoSB0cuG7iyBQcmljZSB0xINuZyBsw6puIDEgZG9sbGFyIHRow6wgYmnhur9uIMSR4bqndSByYSBzYWxlcyh0aGVvIMSRxqFuIHbhu4sgaGFuZyBuZ8Ogbikgc+G6vSBnaeG6o20gxJFpIDU0LjQ1OSDEkcahbiB24buLIGtoaSBtw6AgY8OhYyBiaeG6v24gxJHhuqd1IHbDoG8ga2jDoWMgZ2nhu68gbmd1ecOqbi4gDQoNCkJp4bq/biBQcmljZSBjw7MgcC12YWx1ZSBuaOG7jyBuw6puIGPDsyBi4bqxbmcgY2jhu6luZyB0aMO0bmcga8OqIHLhurFuZyBjw7MgbeG7kWkgcXVhbiBo4buHIGdp4buvYSBQcmljZSB24bubaSBiaeG6v24gxJHhuqd1IHJhIFNhbGVzDQoNCkJp4bq/biBVcmJhblllcyBjw7MgcC12YWx1ZSBraMOhIGzhu5tuIG7Dqm4ga2jDtG5nIGPDsyBi4bqxbmcgY2jhu6luZyB0aMO0bmcga8OqIGNo4buJIHJhIHPhu7Ega2jDoWMgYmnhu4d0IHbhu4EgU2FsZXMgZ2nhu69hIHRow6BuaCB0aOG7iyB2w6AgbsO0bmcgdGjDtG4NCg0KQmnhur9uIFVTWWVzIGPDsyBwLXZhbHVlIG5o4buPIG7Dqm4gY8OzIGLhurFuZyBjaOG7qW5nIHRow7RuZyBrw6ogY2jhu4kgcmEgc+G7sSBraMOhYyBiaeG7h3QgduG7gSBTYWxlcyBnaeG7r2EgVVMgdsOgIGtow7RuZyBsw6AgVVMgDQoNCiMgQ8OidSBjKQ0KDQpQaMawxqFuZyB0csOsbmggY+G7p2EgbcO0IGjDrG5oIMSRxrDhu6NjIHZp4bq/dCBkxrDhu5tpIGThuqFuZzoNCg0KU2FsZXMgPSAxMy4wNDM0NjkgKyAo4oiSMC4wNTQ0NTkpIMOXIFByaWNlICsgKOKIkjAuMDIxOTE2KSDDlyBVcmJhbiArICgxLjIwMDU3Mykgw5cgVVMgKyDOtQ0KDQpW4bubaSBVcmJhbj0xIG7hur91IOG7nyB0cm9uZyB24buLIHRyw60gdGjDoG5oIHRo4buLIHbDoCAwIG7hur91IOG7nyBuw7RuZyB0aMO0biwgdsOgIFVTID0gMSBu4bq/dSDhu58gVVNBIHbDoCAwIG7hur91IGtow7RuZyDhu58gVVNBLg0KDQojIEPDonUgZCkNCg0KTmjhu69uZyBiaeG6v24gxJHhuqd1IHbDoG8gY8OzIHRo4buDIGLDoWMgYuG7jyBnaeG6oyB0aHV54bq/dCBIMDogQmo9MCBsw6AgUHJpY2UgdsOgIFVTWWVzIGRvIGdpw6EgdHLhu4sgcC12YWx1ZSBuaOG7jywgbsOqbiBjw7MgYuG6sW5nIGNo4bupbmcgdGjhu5FuZyBrw6ogcuG6sW5nIGPDsyBt4buRaSBxdWFuIGjhu4cgZ2nhu69hIG5o4buvbmcgYmnhur9uIG7DoHkgduG7m2kgYmnhur9uIMSR4bqndSByYSBTYWxlcy4NCg0KIyBDw6J1IGUpIA0KDQpNw7QgaMOsbmggZMaw4bubaSDEkcOieSBjaOG7iSBz4butIGThu6VuZyBuaOG7r25nIGJp4bq/biDEkeG6p3UgdsOgbyBjw7MgxJHhu6cgYuG6sW5nIGNo4bupbmcgdGjhu5FuZyBrw6ogY8OzIG3hu5FpIHF1YW4gaOG7hyB24bubaSBiaeG6v24gU2FsZXMgbMOgIFByaWNlIHbDoCBVUw0KDQpgYGB7cn0NCiMgbG0oU2FsZXMgfiBQcmljZSArIFVTLCBkYXRhID0gQ2Fyc2VhdHMpIGzDoCBow6BtIGTDuW5nIMSR4buDIGZpdCBt4buZdCBtw7QgaMOsbmggaOG7k2kgcXV5IGLhu5lpIHbhu5tpIFNhbGVzIGzDoCBnacOhIHRy4buLIMSR4bqndSByYSBj4bqnbiDEkcaw4bujYyBk4buxIMSRb8OhbiB2w6AgUHJpY2UsIFVTIGzDoCBnacOhIHRy4buLIMSR4bqndSB2w6BvIHRyb25nIHThuq1wIGThu68gbGnhu4d1IENhcnNlYXRzDQptb2RlbDIgPC0gbG0oU2FsZXMgfiBQcmljZSArIFVTLCBkYXRhID0gQ2Fyc2VhdHMpDQpgYGANCg0KIyBDw6J1IGYpDQoNCmBgYHtyfQ0KIyBQaMOibiB0w61jaCBtw7QgaMOsbmgga2hpIGPDsyBiaeG6v24gVXJiYW4g4bufIGPDonUgYSkNCnN1bW1hcnkobW9kZWwxKQ0KIyBQaMOibiB0w61jaCBtw7QgaMOsbmgga2hpIGtow7RuZyBjw7MgYmnhur9uIFVyYmFuIOG7nyBjw6J1IGUpDQpzdW1tYXJ5KG1vZGVsMikNCmBgYA0KDQpE4buwYSB0csOqbiBSU0UgPSAyLjQ2OSB2w6AgUl4yID0gMC4yMzU0IGPhu6dhIG3DtCBow6xuaCAyICwgdGEgdGjhuqV5IHLhurFuZyBtw7QgaMOsbmggMiBraGkga2jDtG5nIHPhu60gZOG7pW5nIGJp4bq/biDEkeG6p3UgdsOgbyBVcmJhbiB0aMOsIHPhur0gY2hvIHJhIMSRxrDhu6NjIGvhur90IHF14bqjIHNvIHbhu5tpIG3DtCBow6xuaCAxIA0KDQojIEPDonUgZykNCg0KYGBge3J9DQojIFTDrW5oIHRvw6FuIGtob+G6o25nIHRpbiBj4bqteSBjaG8gY8OhYyBo4buHIHPhu5EgY+G7p2EgbcO0IGjDrG5oIDIgduG7m2kgbeG7qWMgxJHhu5kgOTUgJSBraG/huqNuZyB0aW4gY+G6rXkga2hpIGxldmVsIG3hurdjIMSR4buLbmggPTAuOTUNCmNvbmZpbnQobW9kZWwyKQ0KYGBgDQoNCiMgQ8OidSBoKQ0KDQpgYGB7cn0NCiNCaeG7g3UgxJHhu5MgcGjDom4gdMOhbiBj4bunYSBjw6FjIGJp4bq/biAgZOG7ryBsaeG7h3UgduG7m2kgY8OhYyBk4buvIGxp4buHdSBj4buZdCDEkcaw4bujYyBjaGlhIHRow6BuaCBj4butYSBz4buVIDJ4MiBi4bqxbmcgY8OhY2ggc+G7rSBk4bulbmcgaMOgbSBtZnJvdz1jKDIsMikNCnBhcihtZnJvdyA9IGMoMiwgMikpDQojIEJp4buDdSDEkeG7kyBtw7QgaMOsbmggMg0KcGxvdChtb2RlbDIpDQpgYGANCg0KLSBCaeG7g3UgxJHhu5MgMSAoUmVzaWR1YWxzIHZzIEZpdHRlZCkgZ2nDunAgcXVhbiBzw6F0IG5o4buvbmcgxJFp4buDbSBnacOhIHRy4buLIMSRxrDhu6NjIGThu7EgxJFvw6FuKGZpdCkgdsOgIGdpw6EgdHLhu4sgc2FpIGzhu4djaCBkxrAgdGjhu6thIGPhu6dhIG5o4buvbmcgxJFp4buDbSBk4buxIMSRb8OhbiBuw6B5IHNvIHbhu5tpIG5o4buvbmcgxJFp4buDbSB0aOG6rXQNCg0KLSBCaeG7g3UgxJHhu5MgMiAoTm9ybWFsIFEtUSkgZ2nDunAgc28gc8OhbmggMiBwaMOibiBwaOG7kWkgeMOhYyBzdeG6pXQgYuG6sW5nIGPDoWNoIHbhur0gY8OhYyBsxrDhu6NuZyB04butIGPhu6dhIGNow7puZyB24bubaSBuaGF1DQoNCi0gQmnhu4N1IMSR4buTIDMgKFNjYWxlLSBMb2NhdGlvbikgdMawxqFuZyB04buxIG5oxrAgYmnhu4N1IMSR4buTIDEgbmjGsG5nIGtow6FjIGzDoCBs4bqleSBjxINuIGLhuq1jIDIgZ2nDoSB0cuG7iyBkxrAgdGjhu6thIGNodeG6qW4gaG/DoQ0KDQotIEJp4buDdSDEkeG7kyA0IChSZXNpZHVhbHMgdnMgTGV2ZXJhZ2UpIGdpw7pwIHBow6F0IGhp4buHbiBuaOG7r25nIG5nb+G6oWkgbOG7hyB0cm9uZyBtw7QgaMOsbmggaOG7k2kgcXV5IMSRxqFuIGdp4bqjbiwgY2hvIHBow6lwIHF1YW4gc8OhdCBz4buxIGxhbiBy4buZbmcgY+G7p2Egbmjhu69uZyBraG/huqNuZyBkxrAgdGjhu6thIHRoYXkgxJHhu5VpIHRoZW8gZ2nDoSB0cuG7iyBsZXZlcmFnZSggc+G7sSBuaOG6oXkgY+G6o20gY+G7p2EgZ2nDoSB0cuG7iyBk4buxIGRvw6FuIMSR4buRaSB24bubaSBz4buxIHRoYXkgxJHhu5VpIGPhu6dhIG5o4buvbmcgZ2nDoSB0cuG7iyB0aOG6rXQpDQoNCuG7niBiaeG7g3UgxJHhu5MgNChSZXNpZHVhbHMgdnMgTGV2ZXJhZ2UpLCBjaMO6bmcgdGEgc+G7sSBoaeG7h24gZGnhu4duIGPhu6dhIDEgdsOgaSBuZ2/huqFpIGzhu4cgKCBs4bubbiBoxqFuIDIgaG/hurdjIG5o4buPIGjGoW4gLTIgKSB2w6AgbeG7mXQgc+G7kSDEkWnhu4NtIMSRw7JuIGLhuql5IChsZXZlcmFnZSkgdsaw4bujdCBt4bupYyAocCsxKS9uKDAuMDEpLg0KDQo=