Khi nghiên cứu thống kê - kinh tế lượng thông thường chúng ta cần biết một số thống kê của các phân phối chuẩn, thống kê student , thống kê fisher, thống kê khi bình phương. Trong R cho phép chúng ta tìm các thống kê này mà không cần tra bảng - việc thường gây nhầm lẫn và nhàm chán.

Phân phối chuẩn N.

Giả sử chúng ta cần tính P(x ≤ 1500) với một phân phối chuẩn có trung bình 1000 và sai số chuẩn là 100.

pnorm(1500, 1000, 100)
## [1] 0.9999997
pnorm(1500, 1000, 100, lower.tail = TRUE)
## [1] 0.9999997

Từ đây ta cũng suy ra tìm P(x ≥ 1500) trong R như sau:

1 - pnorm(1500, 1000, 100)
## [1] 2.866516e-07
pnorm(1500, 1000, 100, lower.tail = FALSE)
## [1] 2.866516e-07

Đối với phân phối chuẩn hóa thì không có gì khác biệt.

Ví dụ tính P(x ≤ 0.75)

pnorm(0.75, 0, 1)
## [1] 0.7733726

Ngược lại với bài toán tìm xác suất ở trên chúng ta có bài toán tìm giá trị ZA.

Ví dụ, nếu một phân phối chuẩn có trung bình là 1000, sai số chuẩn 100, A = 0.1586 thì chúng ta có thể tính ZA (P(x ≥ ZA) = 0.1586 ) trong R như sau:

qnorm(1 - 0.1586, 1000, 100)
## [1] 1100.023
qnorm(1 - 0.1586)
## [1] 1.000228

Phân phối student:

Bậc tự do v càng lớn thì phân phối t càng tiến về phân phối chuẩn. Trong thực hành thì v ≥ 200 có thể coi phân phối t là phân phối chuẩn. Với phân phối t chúng ta thường phải tìm tA,v sao cho P(t>tA,v) = A, chúng ta có thể tìm các giá trị này trong R theo cú pháp qt(1-A,df=v) mà không cần tra bảng:

qt(1 - 0.9, df = 3)
## [1] -1.637744
qt(0.9, df = 3)
## [1] 1.637744

Phân phối F

qf(0.95, df1 = 2, df2 = 4)
## [1] 6.944272
qf(0.95, df1 = 9, df2 = 3)
## [1] 8.8123

Phân phối khi bình phương

qchisq(0.025, df = 3)
## [1] 0.2157953
qchisq(0.99, df = 2)
## [1] 9.21034
Nguyễn Chí Dũng