Bài 5: Các phương pháp kiểm định cơ bản

I. Mục Tiêu Buổi Học

  1. Nắm vững thống kê mô tả biến định tính, bảng chéo
  2. Kiểm định biến phụ thuộc là biến nhị phân
  3. Thực hành phân tích nhóm và kết quả

II. Định Nghĩa Cơ Bản

Biến Độc Lập và Biến Phụ Thuộc

  • Biến độc lập: Biến có thể thay đổi để xem nó có tác động đến yếu tố khác hay không
  • Biến phụ thuộc: Biến được đánh giá xem thay đổi như thế nào khi ta thay đổi biến độc lập

Ví Dụ

  • Biến độc lập: Tốt nghiệp đại học
  • Biến phụ thuộc: Sống trong trung tâm thành phố

Bảng Chéo 2x2

Bảng 2x2: Tốt nghiệp đại học vs Sống trong trung tâm thành phố
Sống trong trung tâm thành phố
Không
Tốt nghiệp đại học
a b
Không c d

III. Quy Trình Kiểm Định Biến Định Tính

5 Bước Kiểm Định

  1. Bước 1: Xây dựng giả thiết H₀ (khác biệt hoặc không khác biệt)

    • Ví dụ: Tốt nghiệp đại học không liên quan đến việc sống trong trung tâm thành phố
  2. Bước 2: Chọn phép kiểm định phù hợp

  3. Bước 3: Tính toán chỉ số thống kê tương ứng với kiểm định

  4. Bước 4: Tính giá trị p (p-value)

    • Xác xuất có được dữ liệu quan sát nếu giả thuyết H₀ là đúng
  5. Bước 5: Kết luận dựa vào giá trị p và kết luận giả thuyết H₀

    • Ví dụ: p-value ≤ 0.05 → Bác bỏ giả thuyết H₀
    • → Tốt nghiệp đại học có liên quan đến việc sống trong trung tâm thành phố

Lựa chọn Kiểm Định

Biến độc lập
Biến phụ thuộc Định lượng Nhị phân Thứ tự Định danh
Định lượng Pearson; Hồi quy tuyến tính T-test, Wilcoxon Ranksum Pearson; Hồi quy tuyến tính ANOVA; Kruskal wallis
Nhị phân Hồi quy logistic Chi-square; Fisher exact Chi-square, Fisher exact Chi-square; Fisher exact
Thứ tự Hồi quy logistic Chi-square, Wilcoxon Chi-square; Kruskal Wallis Chi-square; Kruskal Wallis
Định danh Hồi quy logistic Chi-square; Fisher exact Chi-square; Fisher exact Chi-square; Fisher exact

Kiểm Định Biến Nhị Phân

Chisquare - fisher

1) Kiểm Định Chi-square

Lý thuyết

Mục đích - Dùng để đánh giá mối liên hệ giữa hai biến định tính.

Giả thuyết

  • H₀: Không có mối liên hệ giữa hai biến

  • H₁: Có mối liên hệ giữa hai biến

Quy tắc quyết định

  • p-value > 0.05 → Không bác bỏ giả thiết H₀

  • p-value ≤ 0.05 → Từ chối giả thiết H₀, chấp nhận giả thiết H₁

Cú pháp

tab bien_doclap bien_phuthuoc, chi2

Ví dụ 1

Đề bài: Đánh giá mối liên hệ giữa việc sống trong trung tâm thành phố và tốt nghiệp đại học (Chi-square Test)

Cú pháp STATA:

tab tung_tot_nghiep_dai_hoc song_trong_ttam, chi2

Kết quả từ STATA:

              | song_trong_ttam
tot_nghiep_DH |        Có     Không |     Total
--------------+---------------------+----------
           Có |       1,243     471 |     1,714
        Không |         348     184 |       200
--------------+---------------------+----------
        Total |       1,591     655 |     2,246

         Pearson chi2(1) =  9.9261   Pr = 0.002

Diễn giải kết quả: - Pearson chi2(1) = 9.9261

  • Pr = 0.002 (p-value < 0.05)

  • Quyết định: Bác bỏ H₀ (vì p-value < 0.05)

  • Kết luận: Hai biến sống trong trung tâm thành phố và tốt nghiệp đại học có mối liên hệ với nhau (p < 0.05)

Ví dụ 2

Chi-square Test giữa biến nhị phân và biến định danh

Đề bài: Đánh giá mối liên hệ giữa việc sống trong trung tâm thành phố và nghề nghiệp

Cú pháp STATA:

tab nghe_nghiep_new song_trong_ttam, chi2

Kết quả từ STATA:

                    |   song_trong_ttam
        nghe_nghiep |        Có     Không |     Total
--------------------+---------------------+----------
Kỹ thuật & Công nghệ|       438       174 |       612
Quản lý & Kinh Doanh|       694       296 |       990
  Dịch vụ chuyên môn|       285       116 |       401
Dịch vụ & Vận chuyển|        35        12 |        47
                Khác|       134        53 |       187
--------------------+---------------------+----------
              Total |     1,586       651 |     2,237

      Pearson chi2(4) =  0.7867   Pr = 0.940

Diễn giải kết quả: - Pearson chi2(1) = 0.7867

  • Pr = 0.940 (p-value > 0.05)

  • Quyết định: Không bác bỏ H₀ (vì p-value > 0.05)

  • Kết luận: Không có mối liên hệ giữa hai biến sống trong trung tâm thành phố và nghề nghiệp

2) Kiểm Định Fisher Exact

Lý thuyết

Khi nào sử dụng

  • Cỡ mẫu nhỏ hơn 20

  • Bảng 2x2 có 1 ô chứa nhỏ hơn 5 quan sát

Quy tắc quyết định

  • p-value > 0.05 → Không bác bỏ giả thiết H₀

  • p-value ≤ 0.05 → Từ chối giả thiết H₀, chấp nhận giả thiết H₁

Cú pháp

tab bien_doclap bien_phuthuoc, exact

Ví Dụ 3

Đề bài: Đánh giá mối liên hệ giữa việc sống trong trung tâm thành phố và tốt nghiệp đại học (Fisher Exact Test)

Cú pháp STATA:

tab tot_nghiep_dai_hoc song_trong_ttam, exact

Kết quả từ STATA:

              | song_trong_ttam
tot_nghiep_DH |        Có     Không |     Total
--------------+---------------------+----------
           Có |         8         2 |        10
        Không |         1         4 |         5
--------------+---------------------+----------
        Total |         9         6 |        15

Fisher's exact =                 0.070
1-sided Fisher's exact =         0.070

Diễn giải kết quả: - Fisher’s exact = 0.070

  • 1-sided Fisher’s exact = 0.070

  • Quyết định: Không bác bỏ H₀ (vì p-value = 0.070 > 0.05)

  • Kết luận: Không có mối liên hệ giữa 2 biến sống trong trung tâm thành phố và tốt nghiệp đại học(p = 0.070)

3) Bài tập 1

Thực hành kiểm định với biến phụ thuộc là nhị phân và biến độc lập là định tính
Bài Biến.phụ.thuộc Biến.độc.lập
1 song_trong_ttam tinh_trang_hon_nhan
2 tinh_trang_hon_nhan nghe_nghiep

Kiểm định giữa biến định tính và biến định lượng

Lý thuyết Hồi Quy Logistic

Mục đích Kiểm định mối liên hệ giữa biến phụ thuộc nhị phân và biến độc lập định lượng

Diễn giải kết quả

  • Odds Ratio (OR): Tỷ số chênh lệch

  • P-value: Mức ý nghĩa thống kê

Cú pháp STATA

logistic bienphuthuoc_nhiphan biendoclap_dinhluong

Ví dụ cụ thể

  • Đánh giá mối liên hệ giữa biến phụ thuộc là “sống trong trung tâm thành phố” và biến độc lập là “lương theo giờ” (đô la)

  • Cú pháp

logistic song_trong_ttam luong
  • Kết quả mẫu từ STATA
Logistic regression                               Number of obs   =      2,246
                                                  LR chi2(1)      =       4.43
                                                  Prob > chi2     =     0.0353
                                                  Pseudo R2       =     0.0016

---------------------------------------------------------------------------------
song_trong_ttam | Odds ratio   Std. Err.      z    P>|z|     [95% Conf. interval]
----------------+----------------------------------------------------------------
        luong   |   1.016558   .0078328     2.13   0.033     1.001321    1.032026
        _cons   |   .3617651   .0278548   -13.21   0.000     .3110905    .4206942
---------------------------------------------------------------------------------
  • Diễn giải kết quả
    • Odds ratio = 1.016558 ~ Tăng 1.7%
    • p-value: 0.033 < 0.05
  • Kết luận: Mỗi 1 đô la tiền lương theo giờ tăng lên, khả năng sống trong trung tâm thành phố tăng thêm 1.7%

Bài tập 3

Kiểm định với biến phụ thuộc là biến nhị phân và biến độc lập là biến định lượng
Bài Biến.phụ.thuộc Biến.độc.lập
1 song_trong_ttam gio_lam_viec_2tuan
2 tinh_trang_hon_nhan nam_kinh_nghiem

IV. Phiên giải kết quả

  • Gợi ý phiên giải khi biến nhị phân là biến phụ thuộc:
    • Biến độc lập là Biến định tính: Có/không mối liên hệ giữa 2 biến

    • Biến độc lập là Biến định lượng: Mỗi giá trị tăng lên của biến định lượng, khả năng xảy ra …(theo biến phụ thuộc) tăng/giảm bao nhiêu %/lần, và có ý nghĩa thống kê hay không

V. Bài tập về nhà buổi 5

  • Bài 1: Import file dữ liệu data_nlsw.dta

  • Bài 2: Thực hành và phiên giải kết quả kiểm định mối liên quan giữa biến phụ thuộc là biến sống trong trung tâm song_trong_ttam:

    • Với biến từng tốt nghiệp đại học tung_tot_nghiep_dai_hoc
    • Với biến chủng tộc chung_toc
  • Bài 3: Thực hành kiểm định mối liên quan giữa biến phụ thuộc là sống ở phía Nam (song_o_phia_nam) và biến độc lập là nghề nghiệp (nghe_nghiep_new) và phiên giải kết quả

  • Bài 4: Thực hành kiểm định mối liên quan giữa biến phụ thuộc là từng tốt nghiệp đại học (tung_tot_nghiep_dai_hoc) và biến độc lập là lương theo giờ (luong) và phiên giải kết quả

Đặt tên Do-file “Dofile - Tên học viên - BTVN số 5” và gửi tại đây. Bấm vào đây.