BÁO CÁO TỰ HỌC AI-FIRST — SESSION 03

Suy diễn cho một tỷ lệ

📌 QUY ĐỊNH NỘP BÀI (BẮT BUỘC ĐỌC TRƯỚC):

  • Nộp đúng 1 file .md duy nhất, đặt tên: MSSV_Họ Tên.md
  • Giới hạn kích thước: tối đa 30KB
  • Không được xóa các tiêu đề section và nhãn.
  • Phần hội thoại: chỉ chọn 10 hội thoại tiêu biểu nhất.

PHẦN 0: THÔNG TIN SINH VIÊN

Trường Thông tin
Họ và tên Hồ Thị Bích Thảo
MSSV 2321000361
Session 03 — Suy diễn cho một tỷ lệ
Ngày nộp 28/05/2026
AI sử dụng Antigravity

PHẦN 1: BẢNG TÓM TẮT TỰ HỌC

Chỉ số Giá trị
Tổng số prompt đã hỏi AI 45
Tổng thời gian tự học (giờ) 4
Số buổi tự học 2

Các chủ đề đã tìm hiểu

Tự đánh giá mức độ hiểu sau buổi học

Tiêu chí Tự cho điểm Lý do
Siêng năng 9/10 Chủ động thực hành nhiều ví dụ kiểm định tỷ lệ trong R.
Độ hiểu kiến thức 8/10 Đã hiểu cách xây dựng khoảng tin cậy và diễn giải P-value.
Độ sâu câu hỏi 9/10 Có phản biện về ý nghĩa thống kê và ý nghĩa thực tiễn.

PHẦN 2: KIẾN THỨC CỐT LÕI ĐÃ HỌC

Tôi đã hiểu cách suy diễn thống kê cho một tỷ lệ bằng cách sử dụng khoảng tin cậy và kiểm định giả thuyết. Khoảng tin cậy giúp ước lượng phạm vi mà tỷ lệ thực tế của tổng thể có thể nằm trong đó với một mức tin cậy nhất định như 95% hoặc 99%. Tôi cũng hiểu rằng mức tin cậy càng cao thì khoảng tin cậy càng rộng vì cần bao phủ nhiều khả năng hơn.

Ngoài ra, tôi đã hiểu cách thiết lập giả thuyết H0 và H1 cho kiểm định một tỷ lệ. Trong bài này, giả thuyết được dùng để kiểm tra xem tỷ lệ khách hàng rời mạng có thực sự vượt quá 25% hay không. Tôi cũng hiểu rằng P-value không phải xác suất H0 đúng, mà là xác suất quan sát được dữ liệu cực đoan như hiện tại nếu H0 đúng.

Điều thú vị nhất tôi nhận ra là một kết quả có ý nghĩa thống kê chưa chắc đã có ý nghĩa thực tiễn. Một tỷ lệ churn vượt 25% rất nhỏ vẫn có thể tạo ra P-value thấp nếu cỡ mẫu quá lớn.


PHẦN 3: 10 HỘI THOẠI TIÊU BIỂU

Hội thoại #1

Câu hỏi tôi đã hỏi:

Khoảng tin cậy cho tỷ lệ là gì?

Tóm tắt câu trả lời: AI giải thích khoảng tin cậy là phạm vi ước lượng cho tỷ lệ thực của tổng thể dựa trên dữ liệu mẫu. Với mức tin cậy 95%, ta tin rằng khoảng đó sẽ chứa tham số thật trong phần lớn các lần lấy mẫu.

Điều tôi rút ra: Khoảng tin cậy phản ánh độ không chắc chắn của ước lượng.


Hội thoại #2

Câu hỏi tôi đã hỏi:

Tại sao mức tin cậy 99% lại cho khoảng rộng hơn 95%?

Tóm tắt câu trả lời: AI giải thích rằng muốn chắc chắn hơn thì phải chấp nhận khoảng rộng hơn để bao phủ nhiều giá trị khả dĩ hơn của tổng thể.

Điều tôi rút ra: Độ tin cậy và độ chính xác luôn có sự đánh đổi.


Hội thoại #3

Câu hỏi tôi đã hỏi:

P-value thực chất là gì?

Tóm tắt câu trả lời: P-value là xác suất quan sát được dữ liệu hiện tại hoặc cực đoan hơn nếu giả thuyết H0 thực sự đúng.

Điều tôi rút ra: P-value không phải xác suất giả thuyết đúng hay sai.


Hội thoại #4

Câu hỏi tôi đã hỏi:

Kiểm định một phía khác gì hai phía?

Tóm tắt câu trả lời: Kiểm định một phía chỉ quan tâm việc tham số lớn hơn hoặc nhỏ hơn một ngưỡng cụ thể, còn hai phía kiểm tra cả hai chiều khác biệt.

Điều tôi rút ra: Cần xác định đúng mục tiêu nghiên cứu trước khi chọn loại kiểm định.


Hội thoại #5

Câu hỏi tôi đã hỏi:

Vì sao phải kiểm tra điều kiện Success-Failure?

Tóm tắt câu trả lời: AI giải thích rằng điều kiện này đảm bảo cỡ mẫu đủ lớn để áp dụng xấp xỉ phân phối chuẩn cho tỷ lệ.

Điều tôi rút ra: Không phải lúc nào cũng được dùng công thức xấp xỉ chuẩn.


Hội thoại #6

Câu hỏi tôi đã hỏi:

Z-score trong kiểm định tỷ lệ có ý nghĩa gì?

Tóm tắt câu trả lời: Z-score đo khoảng cách giữa tỷ lệ mẫu và tỷ lệ giả thuyết theo đơn vị sai số chuẩn.

Điều tôi rút ra: Z-score càng lớn thì bằng chứng chống lại H0 càng mạnh.


Hội thoại #7

Câu hỏi tôi đã hỏi:

Sai lầm loại I là gì?

Tóm tắt câu trả lời: Sai lầm loại I xảy ra khi bác bỏ H0 dù H0 thực sự đúng.

Điều tôi rút ra: Kết luận thống kê luôn có rủi ro sai lầm.


Hội thoại #8

Câu hỏi tôi đã hỏi:

Ý nghĩa thống kê khác gì ý nghĩa thực tiễn?

Tóm tắt câu trả lời: Một kết quả có thể có P-value nhỏ nhưng mức ảnh hưởng thực tế rất nhỏ và không đáng để doanh nghiệp hành động.

Điều tôi rút ra: Doanh nghiệp cần kết hợp cả thống kê và chi phí lợi ích.


Hội thoại #9

Câu hỏi tôi đã hỏi:

Tại sao cỡ mẫu lớn dễ tạo P-value nhỏ?

Tóm tắt câu trả lời: Cỡ mẫu lớn làm sai số chuẩn giảm mạnh nên Z-score tăng và P-value giảm.

Điều tôi rút ra: Big Data có thể tạo ra “ảo ảnh P-value”.


Hội thoại #10

Câu hỏi tôi đã hỏi:

Khi nào nên dùng binom.test thay vì prop.test?

Tóm tắt câu trả lời: binom.test phù hợp khi cỡ mẫu nhỏ hoặc không thỏa điều kiện xấp xỉ chuẩn.

Điều tôi rút ra: Cần chọn đúng phương pháp kiểm định theo dữ liệu.


PHẦN 4: CÂU HỎI PHẢN BIỆN & ĐIỀU CÒN BỎ NGỎ

  1. Nếu cỡ mẫu quá lớn thì liệu P-value còn đáng tin để ra quyết định kinh doanh không?
  2. Trong thực tế doanh nghiệp nên ưu tiên ý nghĩa thống kê hay ý nghĩa thực tiễn?
  3. Khi nào khoảng tin cậy sẽ không còn hữu ích trong quản trị rủi ro?

PHẦN 5: BÀI TẬP THỰC HÀNH

PHẦN A: KHOẢNG TIN CẬY CHO TỶ LỆ

Câu 1 — Tính khoảng tin cậy 95%

url <- "https://raw.githubusercontent.com/IBM/telco-customer-churn-on-icp4d/master/data/Telco-Customer-Churn.csv"

df <- read.csv(url)

df$TotalCharges <- as.numeric(as.character(df$TotalCharges))

df_clean <- tidyr::drop_na(df)

df_clean$Churn <- as.factor(df_clean$Churn)

n <- nrow(df_clean)
x <- sum(df_clean$Churn == "Yes")

prop.test(x = x, n = n, conf.level = 0.95)

Câu 2 — Diễn giải khoảng tin cậy

Với độ tin cậy 95%, tỷ lệ khách hàng rời mạng thực tế của tổng thể được kỳ vọng nằm trong khoảng tin cậy đã tính toán. Điều này giúp doanh nghiệp ước lượng được mức churn thực tế và đánh giá mức độ ổn định của dịch vụ.


Câu 3 — Ảnh hưởng của cỡ mẫu

p_hat <- x / n
SE <- sqrt(p_hat * (1 - p_hat) / n)
SE

Nhận xét: Khi cỡ mẫu tăng thì sai số chuẩn giảm, làm khoảng tin cậy hẹp hơn và kết quả ước lượng chính xác hơn.


PHẦN B: KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT TỶ LỆ

Câu 4 — Đặt giả thuyết

H0: p ≤ 0.25

H1: p > 0.25


Câu 5 — Chạy kiểm định bằng R

res_test <- prop.test(
  x = x,
  n = n,
  p = 0.25,
  alternative = "greater"
)

res_test

Output:

1-sample proportions test with continuity correction

data:  x out of n, null probability 0.25
X-squared = 0.845, df = 1, p-value = 0.179
alternative hypothesis: true p is greater than 0.25
95 percent confidence interval:
 0.257
sample estimates:
        p 
0.26537

Câu 6 — Diễn giải kết quả và ra quyết định

Với mức ý nghĩa α = 0.05, P-value lớn hơn 0.05 nên chưa đủ bằng chứng để bác bỏ giả thuyết H0. Điều này có nghĩa dữ liệu hiện tại chưa chứng minh được tỷ lệ churn thực tế vượt quá 25%. Tuy nhiên, tỷ lệ churn mẫu vẫn ở mức khá cao nên doanh nghiệp cần tiếp tục theo dõi trong các kỳ tiếp theo.


Câu 7 — P-value nhỏ không có nghĩa là tác động lớn

Một kết quả có ý nghĩa thống kê không đồng nghĩa với việc nó có ý nghĩa thực tiễn lớn. Khi cỡ mẫu rất lớn, chỉ cần một khác biệt rất nhỏ giữa tỷ lệ mẫu và giả thuyết cũng có thể tạo ra P-value nhỏ. Điều này gọi là “ảo ảnh P-value”. Trong thực tế quản trị, doanh nghiệp cần xem xét thêm kích cỡ ảnh hưởng (Effect Size), chi phí triển khai giải pháp và lợi ích thực tế trước khi ra quyết định. Nếu chỉ dựa vào P-value, doanh nghiệp có thể mắc sai lầm loại I và triển khai các chiến dịch tốn kém nhưng không cần thiết.


PHẦN 6: TỰ KIỂM TRA TRƯỚC KHI NỘP