Hồi quy là phương pháp ước lượng số liệu theo mô hình toán học, phương pháp cổ điển ước lượng theo mô hình OLS Cực tiểu bình phương nhỏ nhất. Có các phương pháp hồi quy mới như hồi quy phân vị chưa đề cập ở đây. - Hồi quy tuyến tính một biến - Hồi quy tuyến tính đa biến - Hồi quy biến phân loại phương pháp Logistic
library(ggplot2)
par(mfrow=c(1,1))
cor(dn2013$kqkd1, dn2013$kqkd9)
## [1] 0.8135735
hoiquy1 <- lm(data= dn2013,kqkd9~kqkd1)
summary(hoiquy1)
##
## Call:
## lm(formula = kqkd9 ~ kqkd1, data = dn2013)
##
## Residuals:
## Min 1Q Median 3Q Max
## -605204 -260 -169 -28 264736
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.161e+02 1.429e+02 1.512 0.131
## kqkd1 3.164e-01 2.732e-03 115.812 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 11750 on 6851 degrees of freedom
## Multiple R-squared: 0.6619, Adjusted R-squared: 0.6619
## F-statistic: 1.341e+04 on 1 and 6851 DF, p-value: < 2.2e-16
confint(hoiquy1)
## 2.5 % 97.5 %
## (Intercept) -64.0075271 496.1291132
## kqkd1 0.3110201 0.3217305
plot(kqkd9~kqkd1,data=dn2013)
abline(hoiquy1,col="red")
Mô hình hồi quy đơn giản này Biến giải thích là kqkd1 và biến phụ thuộc là kqkd9
kqkd1: Doanh thu, kqkd9 : Lợi nhuận do bán hàng hóa dịch vụ ,Đây là hai biến chắc chắn có tương quan với nhau vì nhiều doanh nghiệp đều đặt công thức từ doanh thu ra lợi nhuậ.Tuy nhiên R= 0.81357 3và R2 = 0.6619 tức là biến giải thích chỉ giải thích được 67%
Phương trình hồi quy là: kqkd9 = 2.161e+02 + 3.164e-01*kqkd1
#library(ggplot2)
par(mfrow=c(1,1))
hoiquy2 <- lm(data= dn2013,kqkd9~kqkd1+tsld+ts11)
summary(hoiquy2)
##
## Call:
## lm(formula = kqkd9 ~ kqkd1 + tsld + ts11, data = dn2013)
##
## Residuals:
## Min 1Q Median 3Q Max
## -467588 222 596 765 333649
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -9.273e+02 1.392e+02 -6.660 2.96e-11 ***
## kqkd1 2.338e-01 3.716e-03 62.910 < 2e-16 ***
## tsld 9.820e+01 3.319e+00 29.589 < 2e-16 ***
## ts11 -3.146e-04 3.157e-04 -0.996 0.319
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 11020 on 6849 degrees of freedom
## Multiple R-squared: 0.7028, Adjusted R-squared: 0.7027
## F-statistic: 5400 on 3 and 6849 DF, p-value: < 2.2e-16
confint(hoiquy2)
## 2.5 % 97.5 %
## (Intercept) -1.200282e+03 -6.543628e+02
## kqkd1 2.265112e-01 2.410818e-01
## tsld 9.169226e+01 1.047038e+02
## ts11 -9.334974e-04 3.042950e-04
vcov(hoiquy2)
## (Intercept) kqkd1 tsld ts11
## (Intercept) 1.938860e+04 6.044168e-02 -1.257600e+02 2.775694e-03
## kqkd1 6.044168e-02 1.381158e-05 -8.459149e-03 -2.038024e-08
## tsld -1.257600e+02 -8.459149e-03 1.101402e+01 -3.139125e-04
## ts11 2.775694e-03 -2.038024e-08 -3.139125e-04 9.967493e-08
plot(kqkd9~kqkd1+tsld+ts11,data=dn2013)
abline(hoiquy2,col="red")
## Warning in abline(hoiquy2, col = "red"): only using the first two of 4
## regression coefficients
Mô hình hồi quy đa biến đơn giản này có biến giải thích là 3 biến kqkd1, tsld,ts11 và biến phụ thuộc là kqkd9
kqkd1: Doanh thu, tsld: Tổng lao động, ts11: Tổng Tài sản đầu kỳ. kqkd9 : Lợi nhuận do bán hàng hóa dịch vụ R2 = 0.7028 tức là biến giải thích giải thích được 70%
Phương trình hồi quy là: kqkd9 =-9.273e+02 + 2.265112e-01kqkd1 + 9.820e+01tsld - 3.146e-04*ts11 - Biến ts11(Tổng tài sản đầu kỳ) có P-value = 0.319 khá cao mức độ giải thích thấp có thể loại bỏ khỏi mô hình - Kiểm định F: p-value < 2.2e-16 nghĩa là Hệ số góc của đường hồi quy <> 0 bác bỏ giả thiết 0 - Hàm vcov(hoiquy2) kiểm tra tương quan của các biến giải thích với nhau để xem mức độ tự tương quan(Nếu tự tương quan mô hình sẽ sai lầm) ở phía ngước lại giữa hai biến phụ thuộc và biến giải thích sự tương quan càng cao càng tốt.Xem bảng tương quan không có tương quan lớn có thể yên tâm bởi các biến giải thích trong mô hình (Thực ra do mình cố ý chọn các biến có ý nghĩa và độc lập với nhau ngay từ đầu ở các nghiên cứu khi người ta không rõ về biến người ta có thể vơ bèo vơ tép tất cả các biến và loại bỏ dần đây là mô hình EPA có kiểm định riêng để phân tích)