Yêu cầu để nắm vững Hồi quy đơn trong Kinh tế lượng

1. Hiểu mô hình hồi quy đơn và ý nghĩa kinh tế

  • Mô hình: \(Y = \beta_0 + \beta_1 X + u\).
  • Giải thích thành phần:
    • \(Y\): Biến phụ thuộc (ví dụ: tiêu dùng).
    • \(X\): Biến độc lập (ví dụ: thu nhập).
    • \(\beta_0\): Hệ số chặn.
    • \(\beta_1\): Hệ số dốc (phản ánh tác động của \(X\) lên \(Y\)).
    • \(u\): Sai số ngẫu nhiên.
  • Ví dụ: Trong mô hình tiêu dùng, \(\beta_1 = 0.8\) nghĩa là “thu nhập tăng 1 đơn vị, tiêu dùng tăng 0.8 đơn vị”.

2. Phương pháp ước lượng OLS

  • Công thức ước lượng:
    \[ \hat{\beta}_1 = \frac{\text{Cov}(X, Y)}{\text{Var}(X)}, \quad \hat{\beta}_0 = \bar{Y} - \hat{\beta}_1 \bar{X} \]
  • Mục tiêu: Tối thiểu hóa tổng bình phương sai số (RSS):
    \[ \min_{\beta_0, \beta_1} \sum_{i=1}^n (Y_i - \hat{\beta}_0 - \hat{\beta}_1 X_i)^2 \]

3. Diễn giải hệ số hồi quy

  • Quy tắc: “Khi \(X\) tăng 1 đơn vị, \(Y\) thay đổi trung bình \(\hat{\beta}_1\) đơn vị, các yếu tố khác không đổi”.
  • Ví dụ: \(\hat{\beta}_1 = -5\) trong mô hình giá nhà và khoảng cách đến trung tâm → “Nhà xa trung tâm 1 km, giá giảm 5 tỷ”.

4. Giả định của OLS

  1. Tuyến tính: \(Y\)\(X\) có quan hệ tuyến tính.
  2. Mẫu ngẫu nhiên: Dữ liệu được chọn ngẫu nhiên.
  3. Không đa cộng tuyến hoàn hảo: \(X\) có phương sai khác 0.
  4. Kỳ vọng sai số bằng 0: \(E(u|X) = 0\).
  5. Homoscedasticity: Phương sai sai số không đổi.

5. Độ phù hợp mô hình (\(R^2\))

  • Công thức:
    \[ R^2 = \frac{\text{ESS}}{\text{TSS}} = 1 - \frac{\text{RSS}}{\text{TSS}} \]
  • Giải thích: \(R^2 = 0.6\) nghĩa là 60% biến động của \(Y\) được giải thích bởi \(X\).

6. Kiểm định giả thuyết

  • Kiểm định \(t\)-test:
    • \(H_0: \beta_1 = 0\), \(H_1: \beta_1 \ne 0\).
    • Công thức:
      \[ t = \frac{\hat{\beta}_1}{\text{SE}(\hat{\beta}_1)} \]
    • Kết luận: Nếu \(|t| > t_{\alpha/2}\) hoặc \(p\)-value < \(\alpha\), bác bỏ \(H_0\).

7. Sử dụng phần mềm

  • Code mẫu (Python):

    import statsmodels.api as sm
    X = sm.add_constant(X)  # Thêm hệ số chặn
    model = sm.OLS(y, X).fit()
    print(model.summary())

Áp dụng thực tế

Bước thực hiện:

  1. Chọn bộ dữ liệu (ví dụ: GDP và đầu tư).
  2. Chạy hồi quy và phân tích kết quả.
  3. Viết báo cáo: Giải thích ý nghĩa kinh tế, hạn chế mô hình.

9. Hạn chế của hồi quy đơn

Thiên lệch do bỏ sót biến: Ví dụ, mô hình tiền lương bỏ sót biến kinh nghiệm →

10. Phân tích phần dư

Đồ thị phần dư: Dự kiến.

  • Phần dư phân tán ngẫu nhiên.
  • Vi phạm: Hình phễu (phương sai thay đổi), hình parabol (quan hệ phi tuyến).

Bài tập tổng hợp

Yêu cầu: Phân tích mối quan hệ giữa lạm phát \(Y\) và lãi suất \(X\) bằng hồi quy đơn.

Câu hỏi phản biện:

  1. Mô hình có ý nghĩa gì?
  2. Giả định nào bị vi phạm?
  3. Cải thiện mô hình thế nào?

100 Câu hỏi tự học Hồi quy đơn với EViews

1. Hiểu mô hình hồi quy đơn và ý nghĩa kinh tế

  1. Định nghĩa hồi quy đơn là gì?
  2. Viết phương trình tổng quát của mô hình hồi quy đơn.
  3. Giải thích ý nghĩa của từng hệ số \(\beta_0\)\(\beta_1\).
  4. Lấy ví dụ một mô hình hồi quy đơn trong kinh tế và giải thích biến phụ thuộc/độc lập.
  5. Tại sao mô hình hồi quy lại có sai số ngẫu nhiên \(u\)?
  6. Phân biệt mối quan hệ tương quannhân quả trong hồi quy.
  7. Nếu \(\beta_1 = 0\), điều gì xảy ra với mối quan hệ giữa \(Y\)\(X\)?
  8. Trong mô hình tiêu dùng \(Y = 500 + 0.7X\), nếu \(X = 1000\), dự đoán \(Y\).
  9. Giải thích cụm từ “giả định các yếu tố khác không đổi” (ceteris paribus) trong diễn giải hệ số.
  10. Tại sao không thể dùng hồi quy đơn để chứng minh quan hệ nhân quả?

2. Phương pháp ước lượng OLS

  1. OLS là viết tắt của gì? Mục tiêu của phương pháp này là gì?
  2. Viết công thức tính RSS (Tổng bình phương sai số).
  3. Chứng minh công thức ước lượng \(\hat{\beta}_1 = \frac{\text{Cov}(X,Y)}{\text{Var}(X)}\).
  4. Tại sao phải lấy đạo hàm riêng của RSS theo \(\beta_0\)\(\beta_1\)?
  5. Nếu dữ liệu có \(\bar{X} = 10\), \(\bar{Y} = 20\), và \(\hat{\beta}_1 = 2\), tính \(\hat{\beta}_0\).
  6. Cho bộ dữ liệu nhỏ (ví dụ: 5 quan sát), tính thủ công \(\hat{\beta}_0\)\(\hat{\beta}_1\).
  7. Giải thích tại sao OLS ước lượng được gọi là “tuyến tính”.
  8. So sánh OLS với phương pháp ước lượng khác (ví dụ: Maximum Likelihood).
  9. Nếu \(\text{Cov}(X,Y) = 0\), hệ số \(\hat{\beta}_1\) bằng bao nhiêu?
  10. Tại sao phương sai của \(X\) phải khác 0 trong OLS?

3. Diễn giải hệ số hồi quy

  1. Trong mô hình \(Y = 10 + 3X\), giải thích ý nghĩa của \(\beta_1 = 3\).
  2. Lấy ví dụ về hệ số hồi quy âm và giải thích ý nghĩa kinh tế.
  3. Nếu \(\beta_1\) trong mô hình GDP và đầu tư là 0.5, điều này có nghĩa gì?
  4. Tại sao không thể nói “X tăng 1% thì Y tăng \(\beta_1 \%\)” trong mô hình hồi quy tuyến tính?
  5. Khi nào hệ số \(\beta_0\) có ý nghĩa kinh tế? Cho ví dụ.
  6. Giải thích sự khác biệt giữa “tác động biên” và “tác động trung bình”.
  7. Nếu \(\beta_1\) không có ý nghĩa thống kê, có nên bỏ biến \(X\) không?
  8. Một nghiên cứu cho thấy hệ số giữa số năm đi học và lương là 5. Giải thích.
  9. Tại sao cần chuẩn hóa đơn vị của \(X\)\(Y\) khi so sánh hệ số giữa các mô hình?
  10. Trong mô hình giá nhà và diện tích, nếu \(\beta_1 = 200\), diễn giải bằng USD/m².

4. Giả định của OLS

  1. Liệt kê 5 giả định cơ bản của OLS.
  2. Giải thích giả định “Mối quan hệ tuyến tính” bằng đồ thị.
  3. Nếu \(E(u|X) \neq 0\), điều gì xảy ra với ước lượng OLS?
  4. Ví dụ về vi phạm giả định “Mẫu ngẫu nhiên”.
  5. Đa cộng tuyến là gì? Tại sao nó không xảy ra trong hồi quy đơn?
  6. Homoscedasticity nghĩa là gì? Làm thế nào để phát hiện vi phạm?
  7. Giả định “Không có tương quan giữa sai số và biến độc lập” quan trọng thế nào?
  8. Nếu phương sai sai số thay đổi (Heteroscedasticity), hệ số OLS có còn BLUE không?
  9. Khi nào giả định “Phân phối chuẩn của sai số” cần thiết?
  10. Làm thế nào để kiểm tra tính hợp lý của các giả định OLS?

5. Độ phù hợp mô hình (\(R^2\))

  1. \(R^2\) là gì? Công thức tính?
  2. Giải thích ý nghĩa của \(R^2 = 0.75\).
  3. Tại sao \(R^2\) không thể âm?
  4. So sánh \(R^2\)\(R^2\) hiệu chỉnh.
  5. Nếu \(R^2 = 0\), điều này nói lên gì về mô hình?
  6. Tại sao \(R^2\) cao không đồng nghĩa với mô hình tốt?
  7. Ví dụ về mô hình có \(R^2\) cao nhưng vô nghĩa trong thực tế.
  8. Làm thế nào để cải thiện \(R^2\) của mô hình?
  9. Tính \(R^2\) thủ công từ RSS và TSS.
  10. Nếu thêm biến vào mô hình, \(R^2\) thay đổi thế nào?

6. Kiểm định giả thuyết

  1. Kiểm định giả thuyết là gì? Mục đích của nó trong hồi quy?
  2. Viết giả thuyết không (\(H_0\)) và giả thuyết đối (\(H_1\)) cho hệ số \(\beta_1\).
  3. Công thức tính giá trị \(t\)-statistic.
  4. Nếu \(t\)-statistic = 2.5 và mức ý nghĩa \(\alpha = 5\%\), kết luận gì?
  5. Phân biệt \(p\)-value và mức ý nghĩa \(\alpha\).
  6. Khi nào sử dụng kiểm định một phía (one-tailed test)?
  7. Tính khoảng tin cậy 95% cho \(\beta_1\).
  8. Nếu khoảng tin cậy của \(\beta_1\) chứa 0, điều này có nghĩa gì?
  9. Ví dụ về một nghiên cứu sử dụng kiểm định \(t\)-test để kết luận.
  10. Tại sao cần kiểm định cả \(\beta_0\)\(\beta_1\)?

7. Thực hành trên EViews

  1. Cách tạo workfile mới trong EViews cho dữ liệu chéo và chuỗi thời gian?
  2. Làm thế nào để nhập dữ liệu từ Excel vào EViews?
  3. Lệnh nào để vẽ scatter plot giữa hai biến trong EViews?
  4. Cú pháp chạy hồi quy đơn trong EViews là gì? (Ví dụ: ls y c x).
  5. Giải thích các thông số trong bảng kết quả: Coefficient, Std. Error, t-Statistic, Prob.
  6. Cách lưu giá trị dự báo (fitted values) và phần dư (residuals) vào workfile?
  7. Làm thế nào để kiểm định White test cho phương sai sai số thay đổi?
  8. Cách tính khoảng tin cậy 95% cho hệ số hồi quy trong EViews?
  9. Xử lý lỗi “Near singular matrix” khi chạy hồi quy như thế nào?
  10. Xuất kết quả hồi quy từ EViews sang Word/Excel bằng cách nào?

8. Áp dụng thực tế

  1. Tìm bộ dữ liệu về GDP và đầu tư trên World Bank, nhập vào EViews.
  2. Chạy hồi quy đơn giữa giá nhà và diện tích trên EViews, giải thích kết quả.
  3. Viết báo cáo ngắn từ kết quả hồi quy trong EViews.
  4. Đề xuất chính sách kinh tế dựa trên hệ số ước lượng từ EViews.
  5. Phân tích hạn chế của mô hình hồi quy đơn khi áp dụng vào dữ liệu thực.
  6. Thu thập dữ liệu lương và trình độ học vấn, chạy hồi quy trên EViews.
  7. Tại sao mô hình đơn không đủ để phân tích tác động của lạm phát lên GDP?
  8. So sánh kết quả hồi quy trên các nhóm dữ liệu khác nhau (ví dụ: theo giới tính).
  9. Dự đoán giá trị \(Y\) khi biết \(X\) từ kết quả EViews.
  10. Đánh giá độ chính xác của dự báo từ mô hình.

9. Hạn chế của hồi quy đơn

  1. Định nghĩa “thiên lệch do bỏ sót biến” (Omitted Variable Bias).
  2. Ví dụ về Omitted Variable Bias trong phân tích tiền lương và trình độ học vấn.
  3. Tại sao hồi quy đơn không thể xử lý đa cộng tuyến?
  4. Nếu mối quan hệ giữa \(X\)\(Y\) là phi tuyến, hồi quy đơn có phù hợp không?
  5. Làm thế nào để phát hiện thiên lệch do bỏ sót biến?
  6. Giải thích hiện tượng “Endogeneity” và cách khắc phục.
  7. Tại sao không thể dùng hồi quy đơn để phân tích tác động của chính sách?
  8. Ví dụ về biến nhiễu (confounding variable) trong mô hình.
  9. Đề xuất cách mở rộng mô hình hồi quy đơn để giảm thiểu hạn chế.
  10. Khi nào nên chuyển sang mô hình hồi quy đa biến?

10. Phân tích phần dư

  1. Phần dư (residual) là gì? Công thức tính.
  2. Cách vẽ residual plot trong EViews để kiểm tra phương sai sai số.
  3. Nhận diện phương sai thay đổi (Heteroscedasticity) từ residual plot.
  4. Nếu residual plot có hình parabol, điều này chỉ ra vấn đề gì?
  5. Kiểm tra phân phối chuẩn của phần dư bằng Q-Q plot trong EViews.
  6. Làm thế nào để khắc phục Heteroscedasticity bằng EViews?
  7. Ví dụ về mô hình có phần dư không phân phối chuẩn.
  8. Tính toán các thống kê từ phần dư (mean, variance) trong EViews.
  9. Tại sao phân tích phần dư quan trọng trong kiểm định mô hình?
  10. Tổng hợp phân tích phần dư vào báo cáo cuối cùng.