Ví Dụ
Có | Không | |
---|---|---|
Tốt nghiệp đại học | ||
Có | a | b |
Không | c | d |
Bước 1: Xây dựng giả thiết H₀ (khác biệt hoặc không khác biệt)
Bước 2: Chọn phép kiểm định phù hợp
Bước 3: Tính toán chỉ số thống kê tương ứng với kiểm định
Bước 4: Tính giá trị p (p-value)
Bước 5: Kết luận dựa vào giá trị p và kết luận giả thuyết H₀
Biến phụ thuộc | Định lượng | Nhị phân | Thứ tự | Định danh |
---|---|---|---|---|
Định lượng | Pearson; Hồi quy tuyến tính | T-test, Wilcoxon Ranksum | Pearson; Hồi quy tuyến tính | ANOVA; Kruskal wallis |
Nhị phân | Hồi quy logistic | Chi-square; Fisher exact | Chi-square, Fisher exact | Chi-square; Fisher exact |
Thứ tự | Hồi quy logistic | Chi-square, Wilcoxon | Chi-square; Kruskal Wallis | Chi-square; Kruskal Wallis |
Định danh | Hồi quy logistic | Chi-square; Fisher exact | Chi-square; Fisher exact | Chi-square; Fisher exact |
Mục đích - Dùng để đánh giá mối liên hệ giữa hai biến định tính.
Giả thuyết
H₀: Không có mối liên hệ giữa hai biến
H₁: Có mối liên hệ giữa hai biến
Quy tắc quyết định
p-value > 0.05 → Không bác bỏ giả thiết H₀
p-value ≤ 0.05 → Từ chối giả thiết H₀, chấp nhận giả thiết H₁
Cú pháp
tab bien_doclap bien_phuthuoc, chi2
Đề bài: Đánh giá mối liên hệ giữa việc sống trong trung tâm thành phố và tốt nghiệp đại học (Chi-square Test)
Cú pháp STATA:
tab tung_tot_nghiep_dai_hoc song_trong_ttam, chi2
Kết quả từ STATA:
| song_trong_ttam
tot_nghiep_DH | Có Không | Total
--------------+---------------------+----------
Có | 1,243 471 | 1,714
Không | 348 184 | 200
--------------+---------------------+----------
Total | 1,591 655 | 2,246
Pearson chi2(1) = 9.9261 Pr = 0.002
Diễn giải kết quả: - Pearson chi2(1) = 9.9261
Pr = 0.002 (p-value < 0.05)
Quyết định: Bác bỏ H₀ (vì p-value < 0.05)
Kết luận: Hai biến sống trong trung tâm thành phố và tốt nghiệp đại học có mối liên hệ với nhau (p < 0.05)
Chi-square Test giữa biến nhị phân và biến định danh
Đề bài: Đánh giá mối liên hệ giữa việc sống trong trung tâm thành phố và nghề nghiệp
Cú pháp STATA:
tab nghe_nghiep_new song_trong_ttam, chi2
Kết quả từ STATA:
| song_trong_ttam
nghe_nghiep | Có Không | Total
--------------------+---------------------+----------
Kỹ thuật & Công nghệ| 438 174 | 612
Quản lý & Kinh Doanh| 694 296 | 990
Dịch vụ chuyên môn| 285 116 | 401
Dịch vụ & Vận chuyển| 35 12 | 47
Khác| 134 53 | 187
--------------------+---------------------+----------
Total | 1,586 651 | 2,237
Pearson chi2(4) = 0.7867 Pr = 0.940
Diễn giải kết quả: - Pearson chi2(1) = 0.7867
Pr = 0.940 (p-value > 0.05)
Quyết định: Không bác bỏ H₀ (vì p-value > 0.05)
Kết luận: Không có mối liên hệ giữa hai biến sống trong trung tâm thành phố và nghề nghiệp
Khi nào sử dụng
Cỡ mẫu nhỏ hơn 20
Bảng 2x2 có 1 ô chứa nhỏ hơn 5 quan sát
Quy tắc quyết định
p-value > 0.05 → Không bác bỏ giả thiết H₀
p-value ≤ 0.05 → Từ chối giả thiết H₀, chấp nhận giả thiết H₁
Cú pháp
tab bien_doclap bien_phuthuoc, exact
Đề bài: Đánh giá mối liên hệ giữa việc sống trong trung tâm thành phố và tốt nghiệp đại học (Fisher Exact Test)
Cú pháp STATA:
tab tot_nghiep_dai_hoc song_trong_ttam, exact
Kết quả từ STATA:
| song_trong_ttam
tot_nghiep_DH | Có Không | Total
--------------+---------------------+----------
Có | 8 2 | 10
Không | 1 4 | 5
--------------+---------------------+----------
Total | 9 6 | 15
Fisher's exact = 0.070
1-sided Fisher's exact = 0.070
Diễn giải kết quả: - Fisher’s exact = 0.070
1-sided Fisher’s exact = 0.070
Quyết định: Không bác bỏ H₀ (vì p-value = 0.070 > 0.05)
Kết luận: Không có mối liên hệ giữa 2 biến sống trong trung tâm thành phố và tốt nghiệp đại học(p = 0.070)
Bài | Biến.phụ.thuộc | Biến.độc.lập |
---|---|---|
1 | song_trong_ttam | tinh_trang_hon_nhan |
2 | tinh_trang_hon_nhan | nghe_nghiep |
Hồi Quy Logistic
Mục đích Kiểm định mối liên hệ giữa biến phụ thuộc nhị phân và biến độc lập định lượng
Diễn giải kết quả
Odds Ratio (OR)
: Tỷ số chênh lệch
P-value
: Mức ý nghĩa thống kê
Cú pháp STATA
logistic bienphuthuoc_nhiphan biendoclap_dinhluong
Đánh giá mối liên hệ giữa biến phụ thuộc là “sống trong trung tâm thành phố” và biến độc lập là “lương theo giờ” (đô la)
Cú pháp
logistic song_trong_ttam luong
Logistic regression Number of obs = 2,246
LR chi2(1) = 4.43
Prob > chi2 = 0.0353
Pseudo R2 = 0.0016
---------------------------------------------------------------------------------
song_trong_ttam | Odds ratio Std. Err. z P>|z| [95% Conf. interval]
----------------+----------------------------------------------------------------
luong | 1.016558 .0078328 2.13 0.033 1.001321 1.032026
_cons | .3617651 .0278548 -13.21 0.000 .3110905 .4206942
---------------------------------------------------------------------------------
Bài | Biến.phụ.thuộc | Biến.độc.lập |
---|---|---|
1 | song_trong_ttam | gio_lam_viec_2tuan |
2 | tinh_trang_hon_nhan | nam_kinh_nghiem |
Biến độc lập là Biến định tính: Có/không mối
liên hệ giữa 2 biến
Biến độc lập là Biến định lượng: Mỗi giá trị tăng lên của biến định lượng, khả năng xảy ra …(theo biến phụ thuộc) tăng/giảm bao nhiêu %/lần, và có ý nghĩa thống kê hay không
Bài 1: Import file dữ liệu data_nlsw.dta
Bài 2: Thực hành và phiên giải kết quả kiểm định mối liên quan
giữa biến phụ thuộc là biến sống trong trung tâm
song_trong_ttam
:
tung_tot_nghiep_dai_hoc
chung_toc
Bài 3: Thực hành kiểm định mối liên quan giữa biến phụ thuộc là sống ở phía Nam (song_o_phia_nam) và biến độc lập là nghề nghiệp (nghe_nghiep_new) và phiên giải kết quả
Bài 4: Thực hành kiểm định mối liên quan giữa biến phụ thuộc là từng tốt nghiệp đại học (tung_tot_nghiep_dai_hoc) và biến độc lập là lương theo giờ (luong) và phiên giải kết quả
Đặt tên Do-file “Dofile - Tên học viên - BTVN số 5” và gửi tại đây. Bấm vào đây.