Đạo hàm (hàm một biến, nhiều biến), ý ghĩa của đạo hàm.
Cực trị (hàm nhiều biến).
Ma trận.
Kinh tế vi mô, Kinh tế vĩ mô.
Xác suất thống kê:
Các phân phối xác suất thông dụng.
Ước lượng.
Kiểm định.
Mục tiêu môn học
khái niệm: Kinh tế lượng là một ngành khoa học sử dụng các phương pháp thống kê và toán học để kiểm tra các lý thuyết kinh tế và dự đoán các biến kinh tế.
Lý thuyết tiêu dùng: Thu nhập sẽ ảnh hưởng tới tiêu dùng.
Lý thuyết đầu tư: Lãi xuất sẽ ảnh hưởng đến mức đầu tư của doanh nghiệp/chính phủ.
Lý thuyết tăng trưởng kinh tế: Tốc độ tăng trưởng của GDP bị ảnh hưởng bởi FDI.
Một số nguồn dữ liệu
library(WDI)# Lấy dữ liệu về giá trị xuất khẩu hàng hóa của Việt Namexport_data <-WDI(country ="VN", indicator ="TX.VAL.MRCH.XD.WD")# Lấy dữ liệu về xuất khẩu của Việt Namexp <-WDI(country ="VN", indicator ="NE.EXP.GNFS.CD")# Lấy dữ liệu về tỷ giá USD của Việt Namexc <-WDI(country ="VN", indicator ="PA.NUS.FCRF")# Lấy dữ liệu về FDI của Việt Namfdi_data <-WDI(country ="VN", indicator ="BX.KLT.DINV.CD.WD")# Lấy dữ liệu GDP của Việt Namgdp_data <-WDI(country ="VN", indicator ="NY.GDP.PCAP.CD")
Mục tiêu môn học (tt)
Kiểm định các lý thuyết kinh tế.
Đánh giá sự tác động của các biến độc lập lên biến phụ thuộc.
Dự báo cho các biến kinh tế.
Mô hình
Mô hình là một đối tượng dùng để mô tả cho một đối tượng khác.
Mô hình trực quan: Mô hình đồ chơi, mô hình phục vụ cho giáo dục, đào tạo,…
Mô hình trừu tượng: Mô hình toán học.
Ví dụ:
Gọi \(X, Y\) lần lượt là thu nhập của hộ gia đình.
Một cách cảm tính thì chúng ta cảm thấy rằng thu nhập và chi tiêu có liên hệ với nhau, mối liên hệ này có thể biễu diễn một cách hình thức như sau: \[Y = f(X)\] Hàm số này được gọi là mô hình (toán học) được dùng để mô tả cho mối liên hệ giữa thu nhập và chi tiêu.
Ví dụ khác: Hàm Cung, hàm Cầu.
Hồi quy
Giả sử chúng ta có bộ số liệu: \[
\begin{array}{|c|c|c|c|c|} \hline
\text{X} & x_1 & x_2 & \dots & x_n \\ \hline
\text{Y} & y_1 & y_2 & \dots & y_n \\ \hline
\end{array}
\]
Bằng cách nào đó từ bộ số liệu này chúng ta tìm được hàm \(Y=f(X)\), động tác này gọi là hồi quy (regression).
Hàm số mà chúng ta tìm được gọi là hàm hồi quy (regression function).
Để thuận tiện chúng ta sẽ chọn hàm hồi quy có dạng: \[Y = f(X) = \beta_0 + \beta_1X\]
Quan hệ Hàn số và Quan hệ Thống kê
Chúng ta có hàm số: \(Y = 3 + 2X\), từ hàm số này ta có: \[
\begin{array}{|c|c|c|c|c|} \hline
\text{X} & 1 & 3 & -2 & -4 \\ \hline
\text{Y} & 5 & 9 & -1 & -5 \\ \hline
\end{array}
\]
Chúng phải chuyển dữ liệu trong bảng số 2 thành mối quan hệ hàm số.
Bằng cách nào?
Một số khái niệm trong thống kê
Định nghĩa về thống kê
Thống kê (theo nghĩa hẹp): Đếm!
Thống kê (theo nghĩa rộng): Là một hệ thống các phương pháp được dùng để: Thu thập, tóm tắt, trình bày, phân tích dữ liệu và dự báo dự báo.
Phân loại thống kê
Thống kê mô tả
Thống kê suy diễn
Tổng thể (population): Là đối tượng (gồm nhiều phần tử) mà chúng ta cần nghiên cứu.
Một số khái niệm trong thống kê(tt)
Mẫu (sample): Là một tập hợp con bất kỳ của tổng thể.
Quan sát (observation): Là một phần tử của mẫu.
Biến thống kê (variable): Là một đặc điểm hay 1 tính chất của một phần tử trong tổng thể.
Dữ liệu (data) Là những thông tin được ghi nhận lại.
Dữ liệu định tính Là những thông tin được ghi nhận lại dưới dạng ký hiệu. Ví dụ: Màu mắt: Xanh, Nâu; Loại xe: Số sàn, số Tự động; Nghề nghiệp: Công nhân, Giáo viên…
Dữ liệu định lượng Là những thông tin được ghi nhận lại bằng những con số. Ví dụ: Chiều cao; Chi tiêu, Tốc độ,…
Chúng ta có bộ số liệu: \[
\begin{array}{|c|c|c|c|c|} \hline
\text{X} & x_1 & x_2 & \dots & x_n \\ \hline
\text{Y} & y_1 & y_2 & \dots & y_n \\ \hline
\end{array}
\] Giả sử mối quan hệ giữa \(X\) và \(Y\) được mô tả bởi mô hình. \[Y = f(X) = \beta_0 + \beta_1X \tag{1}\] Chúng ta cần tìm (ước lượng) cho mô hình này (\(\beta_0\) và \(\beta_1\)).
Gọi ước lượng của 1 là: \[\hat{Y} = f(X) = \hat{\beta}_0 + \hat{\beta}_1X \tag{2}\]
Sai lệch giữa thực tế và mô hình: \[y_i - \hat{y}_i\]
Tổng sai số giữa thực tế và mô hình: \[\sum_{i=1}^n(y_i - \hat{y}_i) \to min\]
Tổng Bình phương sai số giữa thực tế và mô hình: \[\sum_{i=1}^n(y_i - \hat{y}_i)^2 = \sum_{i=1}^n(y_i - \hat{\beta}_0 - \hat{\beta}_1x_i)^2 \to min \tag{3}\]
Phương pháp Bình Phương Cực Tiểu
Biểu thức số 3 là hàm số với 2 biến số \(\hat{\beta}_0, \hat{\beta}_1\) (chính là 2 tham số trong mô hình mà chúng ta cần ước lượng). Chúng ta sẽ tìm cực tiểu cho hàm số này.
Phương pháp Bình Phương Cực Tiểu
Kết quả của việc tìm cực trị của hàm số này chúng ta thu được: \[
\left\{
\begin{array}{cr}
n&\hat{\beta}_0&+&\left(\sum_{i = 1}^{n}x_i\right)\hat{\beta}_1 &= \sum_{i = 1}^{n} y_i\\
\left(\sum_{i = 1}^{n}x_i\right)&\hat{\beta}_0 &+ &\left(\sum_{i = 1}^{n}x_i^2\right)\hat{\beta}_1 &= \sum_{i = 1}^{n} x_i y_i
\end{array}
\right.
\]
Với bộ số liệu về thu nhập và chi tiêu bên trên chúng ta có: \[
\left\{
\begin{array}{l}
21\hat{\beta}_0 & + & 266.5\hat{\beta}_1 &= 212.4\\
266.5\hat{\beta}_0 & + & 3649.25\hat{\beta}_1 &= 2905.9
\end{array}
\right.
\]
Giải hệ trên được: \(\hat{\beta}_0=\) 0.1209, \(\hat{\beta}_1=\) 0.7875
Phương pháp Bình Phương Cực Tiểu
Vậy mối liên hệ giữa Chi tiêu Y và Thu nhập X được mô tả bởi mô hình hồi quy: \[Y = 0.1209 + 0.7875X \]
Ý nghĩa của hệ số hồi quy:
\(\hat{\beta}_0=\) 0.1209: Khi thu nhập bằng 0 \((X=0)\), thì chi tiêu trung bình tối thiểu sẽ là 0.12089 đơn vị.
\(\hat{\beta}_1=\) 0.7875: Khi thu nhập tăng 1 đơn vị thì chi tiêu tăng trung bình 0.7875 đơn vị.
Nói lại cho rõ
Mối quan hệ giữa \(X\) và \(Y\) là quan hệ thống kê nên: \[E(Y|X) = \beta_0+\beta_1X+e\] Nhưng để cho ngắn gọn chúng vẫn viết: \[Y = \beta_0+\beta_1X\]
Hàm hồi quy tổng thể/quy mẫu
Hàm hồi quy tổng thể (Population Regression Function - PRF): Là hàm hồi quy được ước lượng từ dữ liệu của tổng thể. \[Y = \beta_0+\beta_1X\]
Hàm hồi quy mẫu (Sample Regression Function - SRF): Là hàm hồi quy được ước lượng từ dữ liệu của tổng thể. \[\hat{Y} = \hat{\beta}_0+\hat{\beta}_1X\]
Các giả thuyết của mô hình
Kỳ vọng của sai số bằng không (\(E(e_i) = 0\)).
Phương sai của các sai số không đổi (\(Var(e_i) = \sigma^2\)).
Không có sự tương quan giữa các sai số với nhau (\(Cov(e_i,e_j) = 0\) khi \(i\ne j\)).
Các sai số có phân phối chuẩn (\(e_i \sim N(0,\sigma^2)\)).
Không có đan cộng tuyến giữa các biến độc lập.
Đánh giá mô hình
Tổng sai số của mô hình: \[\sum_{i=1}^ne_i=\sum_{i=1}^n(y_i-\hat{y}_i) =1.7764\times 10^{-15}\]
Tổng bình phương sai số: \[\sum_{i=1}^ne_i^2=\sum_{i=1}^n(y_i-\hat{y}_i)^2 =39.3476\]
Độ lệch chuẩn (có hiệu chỉnh) của sai số: \[\hat{\sigma}^2 = \frac{\sum_{i=1}^n(y_i-\hat{y}_i)^2}{n-2} = 1.4391\]
Hệ số xác định mô hình
Total Sum of Squares:\[TTS = \sum_{i=1}^n(y_i-\bar{y})^2 = 205.0657\]
Error Sum of Squares: \[ESS=\sum_{i=1}^n(\hat{y}_i-\bar{y})^2 = 165.7181\]
Rsidual Sum of Squares: \[RSS = \sum_{i=1}^n(y_i-\hat{y}_i)^2 = 39.3476\]
\(TSS = RSS +ESS\)
Hệ số xác định mô hình
Hệ số xác định mô hình: \[R^2 = \frac{ESS}{TSS}=1- \frac{RSS}{TSS} = r_{XY}^2 = 0.8081\]
Giá trị của Hệ số xác định mô hình: \(0\le R^2 \le 1\), \(R^2\) càng gần 1 bao nhiêu thì mô hình các càng phù hợp.
Bài toán ước lượng
Ước lượng hệ số hồi quy cho hàm hồi quy tổng thể\[\hat{\beta}_j - t_{n-2,\alpha/2}\times se(\hat{\beta}_j)\le \beta_j\le \hat{\beta}_j + t_{n-2,\alpha/2}\times se(\hat{\beta}_j)\] Với \[var(\hat{\beta}_0) = \left[\frac{1}{n}+\frac{\bar{X^2}}{n\times var(X)} \right]\sigma^2; var(\hat{\beta}_1) = \frac{\sigma^2}{n\times var(X)}\]
Nếu chưa biết \(\sigma^2\) chúng ta sẽ thay bằng ước lượng của nó là \(\hat{\sigma}^2\)
Với \(\gamma = 95\%, n=21\) thì \(t_{19,\alpha/2} = 2.093\)
Vậy khoảng ước lượng của hệ số hồi quy (của hàm hồi quy tổng thể) là: \[-2.308 \le \beta_0 \le 2.5497\]\[0.6032 \le \beta_1 \le 0.9717\]
Bài toán ước lượng
Ước lượng cho phương sai sai số của mô hình\[\frac{(n-2)\hat{\sigma}^2}{\chi^2_{n-2,\alpha/2}}\le \sigma^2 \le \frac{(n-2)\hat{\sigma}^2}{\chi^2_{n-2,1-\alpha/2}}\]
Giá trị kiểm định: \(F = \frac{(n-2)R^2}{1-R^2}=\) 260.793
Tính P - Value (Fisher): P - Value = 2.5704^{-13}
Kết luận: Do P - Value < 0.05 nên bác bỏ \(H_0\)
Bài toán dự báo
Dự báo cá biệt: Là giá trị dự báo của biến phụ thuộc (cho một cá thể) khi biến độc lập nhận một giá trị cụ thể là \(X_0\). \[\hat{Y}_0-se(Y_{cb})t_{n-2,\alpha/2} < Y_{cb} < \hat{Y}_0+se(Y_{cb})t_{n-2,\alpha/2}\] với \(se(Y_{cb})=\hat{\sigma}\sqrt{1+\frac{1}{n}+\frac{(X_0-\bar{X})^2}{\sum x_i^2}}\)
Dự báo trung bình: Là giá trị dự báo trung bình của biến phụ thuộc khi biến độc lập nhận một giá trị cụ thể là \(X_0\). \[\hat{Y}_0-se(Y_{tb})t_{n-2,\alpha/2} < Y_{tb} < \hat{Y}_0+se(Y_{tb})t_{n-2,\alpha/2}\] Với: \[se(Y_{tb})=\hat{\sigma}\sqrt{\frac{1}{n}+\frac{(X_0-\bar{X})^2}{\sum x_i^2}}\]
Bài toán dự báo (cá biệt)
Ví dụ: Với số liệu về thu nhập và chi tiêu ở trên chúng ta sẽ dự báo giá trị cá biệt như sau:
Với giá trị của \(X\) lần lượt là: 13.5tr, 17tr và 22tr mỗi tháng thì mức chi tiêu là bao nhiêu?
Hàm hồi quy: \(Y = 0.7875 + 0.7875X\)
Dự báo điểm: 10.7518, 13.5079, 17.4453
Dự báo khoảng:
fit
lwr
upr
10.75
10.08
11.43
13.51
12.48
14.54
17.45
15.61
19.28
Bài toán dự báo (trung bình)
Ví dụ: Với số liệu về thu nhập và chi tiêu ở trên chúng ta sẽ dự báo giá trị cá biệt như sau:
Với giá trị của \(X\) lần lượt là: 13.5tr, 17tr và 22tr mỗi tháng thì mức chi tiêu là bao nhiêu?
Hàm hồi quy: \(Y =\) 0.7875 + 0.7875\(X\)
Dự báo điểm: 10.7518, 13.5079, 17.4453
Dự báo khoảng:
fit
lwr
upr
10.75
7.665
13.84
13.51
10.324
16.69
17.45
13.917
20.97
Lựa chọn mô hình
Việc lựa chọn mô hình dựa trên các tiêu chí sau:
Dựa trên những nghiên cứu trước đây.
Dựa trên đồ thị.
Thử.
Ví dụ:
một số mô hình thường gặp
\(Y = \beta_0+\beta_1X\)
\(Ln(Y) = \beta_0+\beta_1X\)
\(Y = \beta_0+\beta_1ln(X)\)
\(ln(Y) = \beta_0 + \beta_1ln(X)\)
\(Y = \beta_0+\beta_1X+\beta_2X^2\)
Hiện tượng phương sai thay đổi
Một trong những giả thuyết của mô hình là \(Var(e_i) = \sigma^2\). Nếu giả thuyết này bị vi phạm sẽ gây ra những điều sau:
OLS không còn là phương pháp ước lượng hiệu quả (phương sai nhỏ nhất).
Bài toán ước lượng không còn chính xác.
Các bài toán kiểm định không chính xác.
Bài toán dự báo không chính xác.
Phát hiện phương sai thay đổi
Kiểm tra đồ thị
Phát hiện phương sai thay đổi(tt)
Kiểm định Breusch-Pagan
Hồi quy mô hình gốc và tính phần dư \(e_i\).
Tính phần dư bình phương \(e_i^2\).
Hồi quy phần dư bình phương \(e_i^2\) với biến độc lập \(X\).
Kiểm định sự phù hợp của mô hình.
\(H_0\):Mô hình không bị hiện tượng phương sai sai số thay đổi
Thực hiện trên Eviews: Trong cửa sổ hồi quy \(\to\) View \(\to\) Residual Diagnostics \(\to\) Heteroskedasticity tests…