Tên: Mai Huy
MSSV: 43.01.104.065
Số thứ tự: 08
Câu a)
# Load thư viện ISLR chứa tập dữ liệu Carseats
library(ISLR)
# lm(Sales ~ Price + Urban + US, data = Carseats) là hàm dùng để fit một mô hình hồi quy bội với Sales là giá trị đầu ra cần được dự đoán và Price, Urban, US là giá trị đầu vào trong tập dữ liệu Carseats
model1 <- lm(Sales ~ Price + Urban + US, data = Carseats)
Câu b)
# Hàm summary(model1) sẽ cho chúng ta biết thông tin p-values, thống kê t(t-statistic), độ lệch chuẩn cho những hệ số của 3 biến Price, Urban và US, cũng như là thống kê R^2, sai số chuẩn (standard errors) và thống kê F (F-statistic) cho mô hình
summary(model1)
Call:
lm(formula = Sales ~ Price + Urban + US, data = Carseats)
Residuals:
Min 1Q Median 3Q Max
-6.9206 -1.6220 -0.0564 1.5786 7.0581
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 13.043469 0.651012 20.036 < 2e-16 ***
Price -0.054459 0.005242 -10.389 < 2e-16 ***
UrbanYes -0.021916 0.271650 -0.081 0.936
USYes 1.200573 0.259042 4.635 4.86e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.472 on 396 degrees of freedom
Multiple R-squared: 0.2393, Adjusted R-squared: 0.2335
F-statistic: 41.52 on 3 and 396 DF, p-value: < 2.2e-16
Biến Urban và US có 2 label nên tạo 1 biến giả là UrbanYes và USYes. Hệ số của biến Price có thể được diễn giải bằng cách nói rằng nếu giá trị Price tăng lên 1 dollar thì biến đầu ra sales(theo đơn vị hang ngàn) sẽ giảm đi 54.459 đơn vị khi mà các biến đầu vào khác giữ nguyên.
Biến Price có p-value nhỏ nên có bằng chứng thông kê rằng có mối quan hệ giữa Price với biến đầu ra Sales
Biến UrbanYes có p-value khá lớn nên không có bằng chứng thông kê chỉ ra sự khác biệt về Sales giữa thành thị và nông thôn
Biến USYes có p-value nhỏ nên có bằng chứng thông kê chỉ ra sự khác biệt về Sales giữa US và không là US
Câu c)
Phương trình của mô hình được viết dưới dạng:
Sales = 13.043469 + (−0.054459) × Price + (−0.021916) × Urban + (1.200573) × US + ε
Với Urban=1 nếu ở trong vị trí thành thị và 0 nếu ở nông thôn, và US = 1 nếu ở USA và 0 nếu không ở USA.
Câu d)
Những biến đầu vào có thể bác bỏ giả thuyết H0: Bj=0 là Price và USYes do giá trị p-value nhỏ, nên có bằng chứng thống kê rằng có mối quan hệ giữa những biến này với biến đầu ra Sales.
Câu e)
Mô hình dưới đây chỉ sử dụng những biến đầu vào có đủ bằng chứng thống kê có mối quan hệ với biến Sales là Price và US
# lm(Sales ~ Price + US, data = Carseats) là hàm dùng để fit một mô hình hồi quy bội với Sales là giá trị đầu ra cần được dự đoán và Price, US là giá trị đầu vào trong tập dữ liệu Carseats
model2 <- lm(Sales ~ Price + US, data = Carseats)
Câu f)
# Phân tích mô hình khi có biến Urban ở câu a)
summary(model1)
Call:
lm(formula = Sales ~ Price + Urban + US, data = Carseats)
Residuals:
Min 1Q Median 3Q Max
-6.9206 -1.6220 -0.0564 1.5786 7.0581
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 13.043469 0.651012 20.036 < 2e-16 ***
Price -0.054459 0.005242 -10.389 < 2e-16 ***
UrbanYes -0.021916 0.271650 -0.081 0.936
USYes 1.200573 0.259042 4.635 4.86e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.472 on 396 degrees of freedom
Multiple R-squared: 0.2393, Adjusted R-squared: 0.2335
F-statistic: 41.52 on 3 and 396 DF, p-value: < 2.2e-16
# Phân tích mô hình khi không có biến Urban ở câu e)
summary(model2)
Call:
lm(formula = Sales ~ Price + US, data = Carseats)
Residuals:
Min 1Q Median 3Q Max
-6.9269 -1.6286 -0.0574 1.5766 7.0515
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 13.03079 0.63098 20.652 < 2e-16 ***
Price -0.05448 0.00523 -10.416 < 2e-16 ***
USYes 1.19964 0.25846 4.641 4.71e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.469 on 397 degrees of freedom
Multiple R-squared: 0.2393, Adjusted R-squared: 0.2354
F-statistic: 62.43 on 2 and 397 DF, p-value: < 2.2e-16
DỰa trên RSE = 2.469 và R^2 = 0.2354 của mô hình 2 , ta thấy rằng mô hình 2 khi không sử dụng biến đầu vào Urban thì sẽ cho ra được kết quả so với mô hình 1
Câu g)
# Tính toán khoảng tin cậy cho mô hình 2 với mức độ 95 % khoảng tin cậy khi level mặc định =0.95
confint(model2)
2.5 % 97.5 %
(Intercept) 11.79032020 14.27126531
Price -0.06475984 -0.04419543
USYes 0.69151957 1.70776632
Câu h)
#Biểu đồ phân tán của các biến dữ liệu với các dữ liệu cột được chia thành cửa sổ 2x2 bằng cách sử dụng hàm mfrow=c(2,2)
par(mfrow = c(2, 2))
# Biểu đồ mô hình 2
plot(model2)

Biểu đồ 1 (Residuals vs Fitted) giúp quan sát những điểm giá trị được dự đoán(fit) và giá trị sai lệch dư thừa của những điểm dự đoán này so với những điểm thật
Biểu đồ 2 (Normal Q-Q) giúp so sánh 2 phân phối xác suất bằng cách vẽ các lượng tử của chúng với nhau
Biểu đồ 3 (Scale- Location) tương tự như biểu đồ 1 nhưng khác là lấy căn bậc 2 giá trị dư thừa chuẩn hoá
Biểu đồ 4 (Residuals vs Leverage) giúp phát hiện những ngoại lệ trong mô hình hồi quy đơn giản, cho phép quan sát sự lan rộng của những khoảng dư thừa thay đổi theo giá trị leverage( sự nhạy cảm của giá trị dự doán đối với sự thay đổi của những giá trị thật)
Ở biểu đồ 4(Residuals vs Leverage), chúng ta sự hiện diện của 1 vài ngoại lệ ( lớn hơn 2 hoặc nhỏ hơn -2 ) và một số điểm đòn bẩy (leverage) vượt mức (p+1)/n(0.01).
LS0tDQp0aXRsZTogIkLDoGkgdOG6rXAgMSBfVHXhuqduIDQiDQpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sNCi0tLQ0KDQojIyMgVMOqbjogTWFpIEh1eQ0KIyMjIE1TU1Y6IDQzLjAxLjEwNC4wNjUNCiMjIyBT4buRIHRo4bupIHThu7E6IDA4DQoNCiMgQ8OidSBhKQ0KDQoNCmBgYHtyfQ0KIyBMb2FkIHRoxrAgdmnhu4duICBJU0xSIGNo4bupYSB04bqtcCBk4buvIGxp4buHdSBDYXJzZWF0cw0KbGlicmFyeShJU0xSKQ0KIyBsbShTYWxlcyB+IFByaWNlICsgVXJiYW4gKyBVUywgZGF0YSA9IENhcnNlYXRzKSBsw6AgaMOgbSBkw7luZyDEkeG7gyBmaXQgbeG7mXQgbcO0IGjDrG5oIGjhu5NpIHF1eSBi4buZaSB24bubaSBTYWxlcyBsw6AgZ2nDoSB0cuG7iyDEkeG6p3UgcmEgY+G6p24gxJHGsOG7o2MgZOG7sSDEkW/DoW4gdsOgIFByaWNlLCBVcmJhbiwgVVMgbMOgIGdpw6EgdHLhu4sgxJHhuqd1IHbDoG8gdHJvbmcgdOG6rXAgZOG7ryBsaeG7h3UgQ2Fyc2VhdHMNCm1vZGVsMSA8LSBsbShTYWxlcyB+IFByaWNlICsgVXJiYW4gKyBVUywgZGF0YSA9IENhcnNlYXRzKQ0KYGBgDQoNCiMgQ8OidSBiKQ0KDQpgYGB7cn0NCiMgSMOgbSBzdW1tYXJ5KG1vZGVsMSkgc+G6vSBjaG8gY2jDum5nIHRhIGJp4bq/dCB0aMO0bmcgdGluIHAtdmFsdWVzLCB0aOG7kW5nIGvDqiB0KHQtc3RhdGlzdGljKSwgxJHhu5kgbOG7h2NoIGNodeG6qW4gY2hvIG5o4buvbmcgaOG7hyBz4buRIGPhu6dhIDMgYmnhur9uIFByaWNlLCBVcmJhbiB2w6AgVVMsIGPFqW5nIG5oxrAgbMOgIHRo4buRbmcga8OqIFJeMiwgc2FpIHPhu5EgY2h14bqpbiAoc3RhbmRhcmQgZXJyb3JzKSB2w6AgdGjhu5FuZyBrw6ogRiAoRi1zdGF0aXN0aWMpIGNobyBtw7QgaMOsbmggDQpzdW1tYXJ5KG1vZGVsMSkNCmBgYA0KDQpCaeG6v24gVXJiYW4gdsOgIFVTIGPDsyAyIGxhYmVsIG7Dqm4gdOG6oW8gMSBiaeG6v24gZ2nhuqMgbMOgIFVyYmFuWWVzIHbDoCBVU1llcy4gSOG7hyBz4buRIGPhu6dhIGJp4bq/biBQcmljZSBjw7MgdGjhu4MgxJHGsOG7o2MgZGnhu4VuIGdp4bqjaSBi4bqxbmcgY8OhY2ggbsOzaSBy4bqxbmcgbuG6v3UgZ2nDoSB0cuG7iyBQcmljZSB0xINuZyBsw6puIDEgZG9sbGFyIHRow6wgYmnhur9uIMSR4bqndSByYSBzYWxlcyh0aGVvIMSRxqFuIHbhu4sgaGFuZyBuZ8Ogbikgc+G6vSBnaeG6o20gxJFpIDU0LjQ1OSDEkcahbiB24buLIGtoaSBtw6AgY8OhYyBiaeG6v24gxJHhuqd1IHbDoG8ga2jDoWMgZ2nhu68gbmd1ecOqbi4gDQoNCkJp4bq/biBQcmljZSBjw7MgcC12YWx1ZSBuaOG7jyBuw6puIGPDsyBi4bqxbmcgY2jhu6luZyB0aMO0bmcga8OqIHLhurFuZyBjw7MgbeG7kWkgcXVhbiBo4buHIGdp4buvYSBQcmljZSB24bubaSBiaeG6v24gxJHhuqd1IHJhIFNhbGVzDQoNCkJp4bq/biBVcmJhblllcyBjw7MgcC12YWx1ZSBraMOhIGzhu5tuIG7Dqm4ga2jDtG5nIGPDsyBi4bqxbmcgY2jhu6luZyB0aMO0bmcga8OqIGNo4buJIHJhIHPhu7Ega2jDoWMgYmnhu4d0IHbhu4EgU2FsZXMgZ2nhu69hIHRow6BuaCB0aOG7iyB2w6AgbsO0bmcgdGjDtG4NCg0KQmnhur9uIFVTWWVzIGPDsyBwLXZhbHVlIG5o4buPIG7Dqm4gY8OzIGLhurFuZyBjaOG7qW5nIHRow7RuZyBrw6ogY2jhu4kgcmEgc+G7sSBraMOhYyBiaeG7h3QgduG7gSBTYWxlcyBnaeG7r2EgVVMgdsOgIGtow7RuZyBsw6AgVVMgDQoNCiMgQ8OidSBjKQ0KDQpQaMawxqFuZyB0csOsbmggY+G7p2EgbcO0IGjDrG5oIMSRxrDhu6NjIHZp4bq/dCBkxrDhu5tpIGThuqFuZzoNCg0KU2FsZXMgPSAxMy4wNDM0NjkgKyAo4oiSMC4wNTQ0NTkpIMOXIFByaWNlICsgKOKIkjAuMDIxOTE2KSDDlyBVcmJhbiArICgxLjIwMDU3Mykgw5cgVVMgKyDOtQ0KDQpW4bubaSBVcmJhbj0xIG7hur91IOG7nyB0cm9uZyB24buLIHRyw60gdGjDoG5oIHRo4buLIHbDoCAwIG7hur91IOG7nyBuw7RuZyB0aMO0biwgdsOgIFVTID0gMSBu4bq/dSDhu58gVVNBIHbDoCAwIG7hur91IGtow7RuZyDhu58gVVNBLg0KDQojIEPDonUgZCkNCg0KTmjhu69uZyBiaeG6v24gxJHhuqd1IHbDoG8gY8OzIHRo4buDIGLDoWMgYuG7jyBnaeG6oyB0aHV54bq/dCBIMDogQmo9MCBsw6AgUHJpY2UgdsOgIFVTWWVzIGRvIGdpw6EgdHLhu4sgcC12YWx1ZSBuaOG7jywgbsOqbiBjw7MgYuG6sW5nIGNo4bupbmcgdGjhu5FuZyBrw6ogcuG6sW5nIGPDsyBt4buRaSBxdWFuIGjhu4cgZ2nhu69hIG5o4buvbmcgYmnhur9uIG7DoHkgduG7m2kgYmnhur9uIMSR4bqndSByYSBTYWxlcy4NCg0KIyBDw6J1IGUpIA0KDQpNw7QgaMOsbmggZMaw4bubaSDEkcOieSBjaOG7iSBz4butIGThu6VuZyBuaOG7r25nIGJp4bq/biDEkeG6p3UgdsOgbyBjw7MgxJHhu6cgYuG6sW5nIGNo4bupbmcgdGjhu5FuZyBrw6ogY8OzIG3hu5FpIHF1YW4gaOG7hyB24bubaSBiaeG6v24gU2FsZXMgbMOgIFByaWNlIHbDoCBVUw0KDQpgYGB7cn0NCiMgbG0oU2FsZXMgfiBQcmljZSArIFVTLCBkYXRhID0gQ2Fyc2VhdHMpIGzDoCBow6BtIGTDuW5nIMSR4buDIGZpdCBt4buZdCBtw7QgaMOsbmggaOG7k2kgcXV5IGLhu5lpIHbhu5tpIFNhbGVzIGzDoCBnacOhIHRy4buLIMSR4bqndSByYSBj4bqnbiDEkcaw4bujYyBk4buxIMSRb8OhbiB2w6AgUHJpY2UsIFVTIGzDoCBnacOhIHRy4buLIMSR4bqndSB2w6BvIHRyb25nIHThuq1wIGThu68gbGnhu4d1IENhcnNlYXRzDQptb2RlbDIgPC0gbG0oU2FsZXMgfiBQcmljZSArIFVTLCBkYXRhID0gQ2Fyc2VhdHMpDQpgYGANCg0KIyBDw6J1IGYpDQoNCmBgYHtyfQ0KIyBQaMOibiB0w61jaCBtw7QgaMOsbmgga2hpIGPDsyBiaeG6v24gVXJiYW4g4bufIGPDonUgYSkNCnN1bW1hcnkobW9kZWwxKQ0KIyBQaMOibiB0w61jaCBtw7QgaMOsbmgga2hpIGtow7RuZyBjw7MgYmnhur9uIFVyYmFuIOG7nyBjw6J1IGUpDQpzdW1tYXJ5KG1vZGVsMikNCmBgYA0KDQpE4buwYSB0csOqbiBSU0UgPSAyLjQ2OSB2w6AgUl4yID0gMC4yMzU0IGPhu6dhIG3DtCBow6xuaCAyICwgdGEgdGjhuqV5IHLhurFuZyBtw7QgaMOsbmggMiBraGkga2jDtG5nIHPhu60gZOG7pW5nIGJp4bq/biDEkeG6p3UgdsOgbyBVcmJhbiB0aMOsIHPhur0gY2hvIHJhIMSRxrDhu6NjIGvhur90IHF14bqjIHNvIHbhu5tpIG3DtCBow6xuaCAxIA0KDQojIEPDonUgZykNCg0KYGBge3J9DQojIFTDrW5oIHRvw6FuIGtob+G6o25nIHRpbiBj4bqteSBjaG8gY8OhYyBo4buHIHPhu5EgY+G7p2EgbcO0IGjDrG5oIDIgduG7m2kgbeG7qWMgxJHhu5kgOTUgJSBraG/huqNuZyB0aW4gY+G6rXkga2hpIGxldmVsIG3hurdjIMSR4buLbmggPTAuOTUNCmNvbmZpbnQobW9kZWwyKQ0KYGBgDQoNCiMgQ8OidSBoKQ0KDQpgYGB7cn0NCiNCaeG7g3UgxJHhu5MgcGjDom4gdMOhbiBj4bunYSBjw6FjIGJp4bq/biAgZOG7ryBsaeG7h3UgduG7m2kgY8OhYyBk4buvIGxp4buHdSBj4buZdCDEkcaw4bujYyBjaGlhIHRow6BuaCBj4butYSBz4buVIDJ4MiBi4bqxbmcgY8OhY2ggc+G7rSBk4bulbmcgaMOgbSBtZnJvdz1jKDIsMikNCnBhcihtZnJvdyA9IGMoMiwgMikpDQojIEJp4buDdSDEkeG7kyBtw7QgaMOsbmggMg0KcGxvdChtb2RlbDIpDQpgYGANCg0KLSBCaeG7g3UgxJHhu5MgMSAoUmVzaWR1YWxzIHZzIEZpdHRlZCkgZ2nDunAgcXVhbiBzw6F0IG5o4buvbmcgxJFp4buDbSBnacOhIHRy4buLIMSRxrDhu6NjIGThu7EgxJFvw6FuKGZpdCkgdsOgIGdpw6EgdHLhu4sgc2FpIGzhu4djaCBkxrAgdGjhu6thIGPhu6dhIG5o4buvbmcgxJFp4buDbSBk4buxIMSRb8OhbiBuw6B5IHNvIHbhu5tpIG5o4buvbmcgxJFp4buDbSB0aOG6rXQNCg0KLSBCaeG7g3UgxJHhu5MgMiAoTm9ybWFsIFEtUSkgZ2nDunAgc28gc8OhbmggMiBwaMOibiBwaOG7kWkgeMOhYyBzdeG6pXQgYuG6sW5nIGPDoWNoIHbhur0gY8OhYyBsxrDhu6NuZyB04butIGPhu6dhIGNow7puZyB24bubaSBuaGF1DQoNCi0gQmnhu4N1IMSR4buTIDMgKFNjYWxlLSBMb2NhdGlvbikgdMawxqFuZyB04buxIG5oxrAgYmnhu4N1IMSR4buTIDEgbmjGsG5nIGtow6FjIGzDoCBs4bqleSBjxINuIGLhuq1jIDIgZ2nDoSB0cuG7iyBkxrAgdGjhu6thIGNodeG6qW4gaG/DoQ0KDQotIEJp4buDdSDEkeG7kyA0IChSZXNpZHVhbHMgdnMgTGV2ZXJhZ2UpIGdpw7pwIHBow6F0IGhp4buHbiBuaOG7r25nIG5nb+G6oWkgbOG7hyB0cm9uZyBtw7QgaMOsbmggaOG7k2kgcXV5IMSRxqFuIGdp4bqjbiwgY2hvIHBow6lwIHF1YW4gc8OhdCBz4buxIGxhbiBy4buZbmcgY+G7p2Egbmjhu69uZyBraG/huqNuZyBkxrAgdGjhu6thIHRoYXkgxJHhu5VpIHRoZW8gZ2nDoSB0cuG7iyBsZXZlcmFnZSggc+G7sSBuaOG6oXkgY+G6o20gY+G7p2EgZ2nDoSB0cuG7iyBk4buxIGRvw6FuIMSR4buRaSB24bubaSBz4buxIHRoYXkgxJHhu5VpIGPhu6dhIG5o4buvbmcgZ2nDoSB0cuG7iyB0aOG6rXQpDQoNCuG7niBiaeG7g3UgxJHhu5MgNChSZXNpZHVhbHMgdnMgTGV2ZXJhZ2UpLCBjaMO6bmcgdGEgc+G7sSBoaeG7h24gZGnhu4duIGPhu6dhIDEgdsOgaSBuZ2/huqFpIGzhu4cgKCBs4bubbiBoxqFuIDIgaG/hurdjIG5o4buPIGjGoW4gLTIgKSB2w6AgbeG7mXQgc+G7kSDEkWnhu4NtIMSRw7JuIGLhuql5IChsZXZlcmFnZSkgdsaw4bujdCBt4bupYyAocCsxKS9uKDAuMDEpLg0KDQo=