Tên: Mai Huy
MSSV: 43.01.104.065
Số thứ tự: 08
Câu a)
# Load thư viện và bộ dữ liệu
library(ISLR)
data(Auto)
# lm(mpg ~ horsepower, data = Auto) là hàm dùng để fit một mô hình hồi quy tuyến tính đơn giản với mpg là giá trị đầu ra cần được dự đoán và horsepower là giá trị đầu vào duy nhất trong tập dữ liệu Auto
fit <- lm(mpg ~ horsepower, data = Auto)
# Phân tích dữ liệu của mô hình hồi quy ở trên
summary(fit)
Call:
lm(formula = mpg ~ horsepower, data = Auto)
Residuals:
Min 1Q Median 3Q Max
-13.5710 -3.2592 -0.3435 2.7630 16.9240
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 39.935861 0.717499 55.66 <2e-16 ***
horsepower -0.157845 0.006446 -24.49 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 4.906 on 390 degrees of freedom
Multiple R-squared: 0.6059, Adjusted R-squared: 0.6049
F-statistic: 599.7 on 1 and 390 DF, p-value: < 2.2e-16
I) Có một mối quan hệ nào giữa giá trị đầu vào và đầu ra hay không ?
Do hệ số B1 = -0.15 khác 0, giá trị p-values = 2e-16 của hệ số khá nhỏ,và p-value của F-statistic gần bằng 0. Điều này cho thấy có một mối quan hệ giữa giá trị đầu vào (horsepower) và đầu ra(mpg)
II) Mối quan hệ giữa giá trị đầu vào và đầu ra chặt chẽ như thế nào ?
Giá trị R^2 cho thấy khoảng 61% sự biến thiên trong giá trị của biến đầu ra (mpg) là phụ thuộc vào sự biến thay đổi của biến đầu vào (horsepower)
III) Mối quan hệ giữa giá trị đầu vào và đầu ra là âm hay dương ?
Khi hệ số B1= -0.15 của horsepower là âm, mối quan hệ này cũng là âm
IV) Giá trị đầu ra mpg khi biến đầu vào (horsepower) = 98 là bao nhiêu ? Cho biết khoảng tin cậy và khoảng dự đoán ?
# Khoảng tin cậy của mô hình hồi quy khi giá trị đầu vào horsepower =98, đồng thời xuất ra giá trị dự đoán đầu ra
predict(fit, data.frame(horsepower = 98), interval = "confidence")
fit lwr upr
1 24.46708 23.97308 24.96108
# Khoảng dự đoán của mô hình hồi quy khi giá trị đầu vào horsepower =98, đồng thời xuất ra giá trị dự đoán đầu ra
predict(fit, data.frame(horsepower = 98), interval = "prediction")
fit lwr upr
1 24.46708 14.8094 34.12476
Câu b)
# attach dùng để khiến cho những biến feature trong dữ liệu có sẵn trong Rstudio theo tên
attach(Auto)
The following objects are masked from Auto (pos = 3):
acceleration, cylinders, displacement, horsepower, mpg, name, origin, weight, year
# Mô hình phân tán mpg và horsepower
plot(horsepower,mpg, main = "Mô hình phân tán mpg và horsepower",xlab = "horsepower", ylab = "mpg", col = "blue")
# Thêm một đường thẳng màu đỏ hồi quy bình phương nhỏ nhất fit các điểm dữ liệu
abline(fit, col = "red")

Câu c)
#Biểu đồ phân tán của các biến dữ liệu với các dữ liệu cột được chia thành cửa sổ 2x2 bằng cách sử dụng hàm mfrow=c(2,2)
par(mfrow=c(2,2))
# Plot 4 biểu đồ chẩn đoán
plot(fit)

Biểu đồ 1 (Residuals vs Fitted) giúp quan sát những điểm giá trị được dự đoán(fit) và giá trị sai lệch dư thừa của những điểm dự đoán này so với những điểm thật
Biểu đồ 2 (Normal Q-Q) giúp so sánh 2 phân phối xác suất bằng cách vẽ các lượng tử của chúng với nhau
Biểu đồ 3 (Scale- Location) tương tự như biểu đồ 1 nhưng khác là lấy căn bậc 2 giá trị dư thừa chuẩn hoá
Biểu đồ 4 (Residuals vs Leverage) giúp phát hiện những ngoại lệ trong mô hình hồi quy đơn giản, cho phép quan sát sự lan rộng của những khoảng dư thừa thay đổi theo giá trị leverage( sự nhạy cảm của giá trị dự doán đối với sự thay đổi của những giá trị thật)
LS0tDQp0aXRsZTogIkLDoGkgdOG6rXAgMV9UdeG6p24gMyINCm91dHB1dDogaHRtbF9ub3RlYm9vaw0KLS0tDQoNCg0KIyMjIFTDqm46IE1haSBIdXkNCiMjIyBNU1NWOiA0My4wMS4xMDQuMDY1DQojIyMgU+G7kSB0aOG7qSB04buxOiAwOA0KDQojIEPDonUgYSkNCg0KYGBge3J9DQojIExvYWQgdGjGsCB2aeG7h24gdsOgIGLhu5kgZOG7ryBsaeG7h3UNCmxpYnJhcnkoSVNMUikNCmRhdGEoQXV0bykNCiMgbG0obXBnIH4gaG9yc2Vwb3dlciwgZGF0YSA9IEF1dG8pIGzDoCBow6BtIGTDuW5nIMSR4buDIGZpdCBt4buZdCBtw7QgaMOsbmggaOG7k2kgcXV5IHR1eeG6v24gdMOtbmggxJHGoW4gZ2nhuqNuIHbhu5tpIG1wZyBsw6AgZ2nDoSB0cuG7iyDEkeG6p3UgcmEgY+G6p24gxJHGsOG7o2MgZOG7sSDEkW/DoW4gIHbDoCBob3JzZXBvd2VyIGzDoCBnacOhIHRy4buLIMSR4bqndSB2w6BvIGR1eSBuaOG6pXQgdHJvbmcgdOG6rXAgZOG7ryBsaeG7h3UgQXV0bw0KZml0IDwtIGxtKG1wZyB+IGhvcnNlcG93ZXIsIGRhdGEgPSBBdXRvKQ0KIyBQaMOibiB0w61jaCBk4buvIGxp4buHdSBj4bunYSBtw7QgaMOsbmggaOG7k2kgcXV5IOG7nyB0csOqbg0Kc3VtbWFyeShmaXQpDQpgYGANCg0KIyMjIEkpIEPDsyBt4buZdCBt4buRaSBxdWFuIGjhu4cgbsOgbyBnaeG7r2EgZ2nDoSB0cuG7iyDEkeG6p3UgdsOgbyB2w6AgxJHhuqd1IHJhIGhheSBraMO0bmcgPw0KDQpEbyBo4buHIHPhu5EgQjEgPSAtMC4xNSBraMOhYyAwLCBnacOhIHRy4buLIHAtdmFsdWVzID0gMmUtMTYgY+G7p2EgaOG7hyBz4buRIGtow6Egbmjhu48sdsOgIHAtdmFsdWUgY+G7p2EgRi1zdGF0aXN0aWMgZ+G6p24gYuG6sW5nIDAuIMSQaeG7gXUgbsOgeSBjaG8gdGjhuqV5IGPDsyBt4buZdCBt4buRaSBxdWFuIGjhu4cgZ2nhu69hIGdpw6EgdHLhu4sgxJHhuqd1IHbDoG8gKGhvcnNlcG93ZXIpIHbDoCDEkeG6p3UgcmEobXBnKQ0KDQojIyMgSUkpIE3hu5FpIHF1YW4gaOG7hyBnaeG7r2EgZ2nDoSB0cuG7iyDEkeG6p3UgdsOgbyB2w6AgxJHhuqd1IHJhIGNo4bq3dCBjaOG6vSBuaMawIHRo4bq/IG7DoG8gPw0KDQpHacOhIHRy4buLIFJeMiBjaG8gdGjhuqV5IGtob+G6o25nIDYxJSBz4buxIGJp4bq/biB0aGnDqm4gdHJvbmcgZ2nDoSB0cuG7iyBj4bunYSBiaeG6v24gxJHhuqd1IHJhIChtcGcpIGzDoCBwaOG7pSB0aHXhu5ljIHbDoG8gc+G7sSBiaeG6v24gdGhheSDEkeG7lWkgY+G7p2EgYmnhur9uIMSR4bqndSB2w6BvIChob3JzZXBvd2VyKQ0KDQojIyMgSUlJKSBN4buRaSBxdWFuIGjhu4cgZ2nhu69hIGdpw6EgdHLhu4sgxJHhuqd1IHbDoG8gdsOgIMSR4bqndSByYSBsw6Agw6JtIGhheSBkxrDGoW5nID8NCg0KS2hpIGjhu4cgc+G7kSBCMT0gLTAuMTUgY+G7p2EgaG9yc2Vwb3dlciBsw6Agw6JtLCBt4buRaSBxdWFuIGjhu4cgbsOgeSBjxaluZyBsw6Agw6JtDQoNCiMjIyBJVikgR2nDoSB0cuG7iyDEkeG6p3UgcmEgbXBnIGtoaSBiaeG6v24gxJHhuqd1IHbDoG8gKGhvcnNlcG93ZXIpID0gOTggbMOgIGJhbyBuaGnDqnUgPyBDaG8gYmnhur90IGtob+G6o25nIHRpbiBj4bqteSB2w6Aga2hv4bqjbmcgZOG7sSDEkW/DoW4gPw0KDQpgYGB7cn0NCiMgS2hv4bqjbmcgdGluIGPhuq15IGPhu6dhIG3DtCBow6xuaCBo4buTaSBxdXkga2hpIGdpw6EgdHLhu4sgxJHhuqd1IHbDoG8gaG9yc2Vwb3dlciA9OTgsIMSR4buTbmcgdGjhu51pIHh14bqldCByYSBnacOhIHRy4buLIGThu7EgxJFvw6FuIMSR4bqndSByYQ0KcHJlZGljdChmaXQsIGRhdGEuZnJhbWUoaG9yc2Vwb3dlciA9IDk4KSwgaW50ZXJ2YWwgPSAiY29uZmlkZW5jZSIpDQpgYGANCg0KDQpgYGB7cn0NCiMgS2hv4bqjbmcgZOG7sSDEkW/DoW4gY+G7p2EgbcO0IGjDrG5oIGjhu5NpIHF1eSBraGkgZ2nDoSB0cuG7iyDEkeG6p3UgdsOgbyBob3JzZXBvd2VyID05OCwgxJHhu5NuZyB0aOG7nWkgeHXhuqV0IHJhIGdpw6EgdHLhu4sgZOG7sSDEkW/DoW4gxJHhuqd1IHJhDQpwcmVkaWN0KGZpdCwgZGF0YS5mcmFtZShob3JzZXBvd2VyID0gOTgpLCBpbnRlcnZhbCA9ICJwcmVkaWN0aW9uIikNCmBgYA0KDQojIEPDonUgYikNCg0KYGBge3J9DQojIGF0dGFjaCBkw7luZyDEkeG7gyBraGnhur9uIGNobyBuaOG7r25nIGJp4bq/biBmZWF0dXJlIHRyb25nIGThu68gbGnhu4d1IGPDsyBz4bq1biB0cm9uZyBSc3R1ZGlvIHRoZW8gdMOqbg0KYXR0YWNoKEF1dG8pDQojIE3DtCBow6xuaCBwaMOibiB0w6FuIG1wZyB2w6AgaG9yc2Vwb3dlciANCnBsb3QoaG9yc2Vwb3dlcixtcGcsIG1haW4gPSAiTcO0IGjDrG5oIHBow6JuIHTDoW4gbXBnIHbDoCBob3JzZXBvd2VyIix4bGFiID0gImhvcnNlcG93ZXIiLCB5bGFiID0gIm1wZyIsIGNvbCA9ICJibHVlIikNCiMgVGjDqm0gbeG7mXQgxJHGsOG7nW5nIHRo4bqzbmcgbcOgdSDEkeG7jyBo4buTaSBxdXkgYsOsbmggcGjGsMahbmcgbmjhu48gbmjhuqV0IGZpdCBjw6FjIMSRaeG7g20gZOG7ryBsaeG7h3UgDQphYmxpbmUoZml0LCBjb2wgPSAicmVkIikNCmBgYA0KDQojIEPDonUgYykNCg0KYGBge3J9DQojQmnhu4N1IMSR4buTIHBow6JuIHTDoW4gY+G7p2EgY8OhYyBiaeG6v24gIGThu68gbGnhu4d1IHbhu5tpIGPDoWMgZOG7ryBsaeG7h3UgY+G7mXQgxJHGsOG7o2MgY2hpYSB0aMOgbmggY+G7rWEgc+G7lSAyeDIgYuG6sW5nIGPDoWNoIHPhu60gZOG7pW5nIGjDoG0gbWZyb3c9YygyLDIpDQpwYXIobWZyb3c9YygyLDIpKQ0KIyBQbG90IDQgYmnhu4N1IMSR4buTIGNo4bqpbiDEkW/DoW4gDQpwbG90KGZpdCkNCmBgYA0KDQotIEJp4buDdSDEkeG7kyAxIChSZXNpZHVhbHMgdnMgRml0dGVkKSBnacO6cCBxdWFuIHPDoXQgbmjhu69uZyDEkWnhu4NtIGdpw6EgdHLhu4sgxJHGsOG7o2MgZOG7sSDEkW/DoW4oZml0KSB2w6AgZ2nDoSB0cuG7iyBzYWkgbOG7h2NoIGTGsCB0aOG7q2EgY+G7p2Egbmjhu69uZyDEkWnhu4NtIGThu7EgxJFvw6FuIG7DoHkgc28gduG7m2kgbmjhu69uZyDEkWnhu4NtIHRo4bqtdA0KDQotIEJp4buDdSDEkeG7kyAyIChOb3JtYWwgUS1RKSBnacO6cCBzbyBzw6FuaCAyIHBow6JuIHBo4buRaSB4w6FjIHN14bqldCBi4bqxbmcgY8OhY2ggduG6vSBjw6FjIGzGsOG7o25nIHThu60gY+G7p2EgY2jDum5nIHbhu5tpIG5oYXUgDQoNCi0gQmnhu4N1IMSR4buTIDMgKFNjYWxlLSBMb2NhdGlvbikgdMawxqFuZyB04buxIG5oxrAgYmnhu4N1IMSR4buTIDEgbmjGsG5nIGtow6FjIGzDoCBs4bqleSBjxINuIGLhuq1jIDIgZ2nDoSB0cuG7iyBkxrAgdGjhu6thIGNodeG6qW4gaG/DoQ0KDQotIEJp4buDdSDEkeG7kyA0IChSZXNpZHVhbHMgdnMgTGV2ZXJhZ2UpIGdpw7pwIHBow6F0IGhp4buHbiBuaOG7r25nIG5nb+G6oWkgbOG7hyB0cm9uZyBtw7QgaMOsbmggaOG7k2kgcXV5IMSRxqFuIGdp4bqjbiwgY2hvIHBow6lwIHF1YW4gc8OhdCBz4buxIGxhbiBy4buZbmcgY+G7p2Egbmjhu69uZyBraG/huqNuZyBkxrAgdGjhu6thIHRoYXkgxJHhu5VpIHRoZW8gZ2nDoSB0cuG7iyBsZXZlcmFnZSggc+G7sSBuaOG6oXkgY+G6o20gY+G7p2EgZ2nDoSB0cuG7iyBk4buxIGRvw6FuIMSR4buRaSB24bubaSBz4buxIHRoYXkgxJHhu5VpIGPhu6dhIG5o4buvbmcgZ2nDoSB0cuG7iyB0aOG6rXQp