Kiểm định giả thuyết về tỷ lệ một tổng thể là một bài toán nền tảng trong thống kê suy luận, cho phép xác định xem liệu tỷ lệ quan sát được từ một mẫu có khác biệt một cách có ý nghĩa thống kê so với một tỷ lệ giả định hay không.
Trong nhiều nghiên cứu, dữ liệu thu thập được mang bản chất nhị phân (ví dụ: thành công/thất bại, có/không). Với loại dữ liệu này, Kiểm định Nhị thức (Binomial Test) là một giải pháp thay thế chính xác và mạnh mẽ, đặc biệt hữu ích khi kích thước mẫu nhỏ hoặc tỷ lệ giả định gần các giá trị 0 và 1.
Mục tiêu của nghiên cứu này là minh họa quy trình ứng dụng Kiểm định Nhị thức trong R/RStudio để giải quyết các bài toán thực tiễn về xu hướng sử dụng mạng xã hội ở học sinh, sinh viên.
Kiểm định tỷ lệ một tổng thể là một phương pháp thống kê suy luận dùng để quyết định xem một tỷ lệ quan sát được từ mẫu có cung cấp đủ bằng chứng để bác bỏ một giả định về tỷ lệ của toàn bộ tổng thể hay không.
Ví dụ: Một công ty tuyên bố rằng chỉ có 5% sản phẩm của họ bị lỗi. Ta lấy một mẫu ngẫu nhiên 200 sản phẩm và thấy có 18 sản phẩm bị lỗi (tức 9%). Kiểm định tỷ lệ sẽ giúp ta xác định xem con số 9% này có đủ mạnh để kết luận rằng tuyên bố 5% của công ty là sai hay không?
Giả thuyết không (H₀): Là giả định mặc định, luôn
chứa dấu bằng.
Ví dụ: H₀: \(p = p_0\).
Giả thuyết đối (H₁): Là điều chúng ta muốn chứng
minh, phản ánh sự khác biệt.
Có thể là:
Ngưỡng kiểm soát rủi ro, là xác suất loại bỏ H₀ trong khi nó
thực sự đúng.
Thường lấy \(\alpha = 0.05\) (5%).
Là xác suất quan sát được một kết quả mẫu ít nhất cũng khác biệt như kết quả đã thu được, giả sử H₀ là đúng.
Quy tắc ra quyết định:
- Nếu \(P\text{-value} \leq \alpha\),
bác bỏ H₀.
- Nếu \(P\text{-value} > \alpha\),
không đủ bằng chứng để bác bỏ H₀.
Là một kiểm định chính xác (exact test), dùng để xác định xem số lần xuất hiện sự kiện quan sát được trong một mẫu có phù hợp với một tỷ lệ (xác suất) thành công giả định hay không. Nó tính toán xác suất trực tiếp từ phân phối Nhị thức, đảm bảo tính hợp lệ ngay cả với các trường hợp có kích thước mẫu nhỏ.
Giả sử xác suất thành công trong mỗi lần thử là \(p_0\).
\[ P(X = k) = \binom{n}{k} \, (p_0)^k \, (1-p_0)^{\,n-k} \]
Trong đó, tổ hợp \(\binom{n}{k}\) được tính bằng:
\[ \binom{n}{k} = \frac{n!}{k! \, (n-k)!} \]
Kiểm định phía phải (\(\mathbf{H}_1: \mathbf{p} > \mathbf{p}_0\))
P-value là tổng xác suất có được \(k\) lần thành công hoặc nhiều hơn:
\[ \text{p-value} = P(X \ge k) = \sum_{i=k}^{n} \binom{n}{i} (p_0)^i (1-p_0)^{n-i} \]
Hay:
\[ \text{p-value} = P(X=k) + P(X=k+1) + \cdots + P(X=n) \]
Kiểm định phía trái (\(\mathbf{H}_1: \mathbf{p} < \mathbf{p}_0\))
P-value là tổng xác suất có được \(k\) lần thành công hoặc ít hơn:
\[ \text{p-value} = P(X \le k) = \sum_{i=0}^{k} \binom{n}{i} (p_0)^i (1-p_0)^{\,n-i} \]
Hay:
\[ \text{p-value} = P(X=0) + P(X=1) + \cdots + P(X=k) \]
Kiểm định hai phía (\(\mathbf{H}_1: \mathbf{p} \neq \mathbf{p}_0\))
P-value là xác suất của các kết quả “khác biệt” ở cả hai phía (đuôi) của phân phối. Cách tính phổ biến là nhân đôi xác suất của phía đuôi nhỏ hơn:
\[ \text{p-value} = 2 \times \min \left( P(X \le k),\; P(X \ge k) \right) \]
Một đội ngũ marketing muốn cải thiện tỷ lệ chuyển đổi (conversion rate) trên trang web của họ. Lịch sử cho thấy, với thiết kế cũ, cứ 100 người vào trang thì có 20 người đăng ký tài khoản (tỷ lệ chuyển đổi là 20%). Họ tạo ra một thiết kế trang web mới và muốn thử nghiệm trên một nhóm nhỏ để xem nó có hiệu quả hơn không. Họ cho 8 người dùng mới xem thiết kế mới và kết quả là có 5 người đã đăng ký.
Liệu kết quả này có đủ bằng chứng để kết luận rằng thiết kế mới thực sự hiệu quả hơn thiết kế cũ không?
Giải
Đặt giả thuyết:
- Thiết kế mới không hiệu quả hơn. Tỷ lệ chuyển đổi vẫn chỉ là
20%.
\[
H_0: p = 0.2
\]
- Thiết kế mới hiệu quả hơn. Tỷ lệ chuyển đổi lớn hơn 20%.
\[
H_1: p > 0.2
\]
Chọn mức ý nghĩa: \(\alpha
= 0.05\)
Kích thước mẫu: \(n =
8\) người dùng
Số lần thành công (số người đăng ký): \(k = 5\)
Tỷ lệ thành công giả định (tỷ lệ cũ): \(p_0 = 0.20\)
Bước 1: Xác định xác suất nhị thức
Vì giả thuyết đối là \(p > 0.2\),
chúng ta cần tính xác suất của kết quả quan sát được (\(k=5\)) và tất cả các kết quả “khác biệt”
hơn nữa theo cùng hướng (6, 7, 8 người).
Công thức nhị thức:
\[ P(X=k) = \binom{n}{k} (p_0)^k (1-p_0)^{\,n-k} \]
Bước 2: Tính từng xác suất
P(X = 5):
\[
\binom{8}{5} = \frac{8!}{5!(8-5)!} = \frac{8 \times 7 \times 6}{3 \times
2 \times 1} = 56
\]
\[
P(X=5) = 56 \times (0.20)^5 \times (0.80)^3 \approx 0.009175
\]
P(X = 6):
\[
\binom{8}{6} = \frac{8!}{6!2!} = 28
\]
\[
P(X=6) = 28 \times (0.20)^6 \times (0.80)^2 \approx 0.001147
\]
P(X = 7):
\[
\binom{8}{7} = \frac{8!}{7!1!} = 8
\]
\[
P(X=7) = 8 \times (0.20)^7 \times (0.80)^1 \approx 0.000082
\]
P(X = 8):
\[
\binom{8}{8} = 1
\]
\[
P(X=8) = 1 \times (0.20)^8 \times (0.80)^0 \approx 0.00000256
\]
Bước 3: Tính P-value
\[
\text{p-value} = P(X=5) + P(X=6) + P(X=7) + P(X=8)
\]
\[
\text{p-value} \approx 0.009175 + 0.001147 + 0.000082 + 0.00000256
\approx 0.0104
\]
Bước 4: Quyết định
So sánh:
\[
0.0104\ (\text{p-value}) < 0.05\ (\alpha)
\]
→ Bác bỏ giả thuyết \(H_0\).
Kết luận
Kết quả có ý nghĩa thống kê. Nếu thiết kế mới không hiệu quả hơn (tỷ lệ
chuyển đổi thực sự vẫn chỉ 20%), thì khả năng quan sát được 5/8 người
hoặc nhiều hơn đăng ký chỉ là khoảng 1%.
Do đó, đội ngũ marketing có bằng chứng mạnh mẽ để kết luận rằng
thiết kế trang web mới thực sự hiệu quả hơn trong việc thu hút
người dùng đăng ký.
Ngay sau đây, ta sẽ đi vào một bài toán thực tế, thực hiện kiểm định tỷ lệ một tổng thể bằng phương pháp kiểm định Nhị thức.
Ta có bộ dữ liệu thu thập từ một khảo sát trực tuyến quý 1
năm 2025 về thói quen sử dụng mạng xã hội và
các tác động liên quan trong đời sống của học sinh, sinh viên.
Người tham gia đến từ nhiều quốc gia khác nhau, được mời qua
email của trường đại học và nền tảng mạng xã
hội.
Các câu hỏi được xây dựng dựa trên các thang đo đã được kiểm
chứng (ví dụ: Thang đo nghiện mạng xã hội
Bergen).
Thang đo nghiện mạng xã hội Bergen (Bergen Social Media Addiction Scale - BSMAS) là một công cụ sàng lọc tâm lý ngắn gọn được phát triển để đánh giá nguy cơ nghiện mạng xã hội ở người trưởng thành và thanh thiếu niên. Được tạo ra bởi Tiến sĩ Cecilie Schou Andreassen và các đồng nghiệp tại Đại học Bergen, Na Uy. Đây là một trong những thang đo được sử dụng rộng rãi và uy tín nhất trong các nghiên cứu về hành vi sử dụng mạng xã hội.
Thang đo được xây dựng dựa trên sáu thành phần cốt lõi của lý thuyết nghiện hành vi, bao gồm:
Bộ dữ liệu bao gồm các thuộc tính sau:
Kiểm tra xem tỷ lệ học sinh, sinh viên tự nhận thấy rằng mạng xã hội ảnh hưởng tiêu cực đến kết quả học tập có trên 50% không?
Kiểm tra xem tỷ lệ học sinh, sinh viên nghiện mạng xã hội có khác biệt đáng kể với 18.4% hay không?
Đọc dữ liệu và tính toán các biến đầu vào
library(readr)
# Đọc dữ liệu
df <- read_csv("Students Social Media Addiction.csv")
## Rows: 705 Columns: 14
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Gender, Academic_Level, Country, Most_Used_Platform, Affects_Academ...
## dbl (7): Student_ID, Age, Avg_Daily_Usage_Hours, Sleep_Hours_Per_Night, Ment...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# Biến đếm
tong_mau <- length(df$Affects_Academic_Performance)
so_luong_yes <- sum(df$Affects_Academic_Performance == "Yes")
Thực hiện kiểm định
Bước 1: Thiết lập giả thuyết thống kê
Bước 2: Thực hiện code
ti_le_gia_dinh <- 0.5
ket_qua_kiem_dinh <- binom.test(x = so_luong_yes,
n = tong_mau,
p = ti_le_gia_dinh,
alternative = "greater")
print(ket_qua_kiem_dinh)
##
## Exact binomial test
##
## data: so_luong_yes and tong_mau
## number of successes = 453, number of trials = 705, p-value = 1.681e-14
## alternative hypothesis: true probability of success is greater than 0.5
## 95 percent confidence interval:
## 0.61175 1.00000
## sample estimates:
## probability of success
## 0.6425532
Bước 3: Diễn giải
Với p - value = 0.00000000000001680959 < \(\alpha\), ta bác bỏ giả thuyết \(H_0\).
Kết luận: Có bằng chứng thống kê mạnh mẽ để khẳng định rằng tỷ lệ học sinh, sinh viên nhận thấy mạng xã hội ảnh hưởng tiêu cực đến kết quả học tập cao hơn 50%. Với tỷ lệ quan sát được là 64.26%, nằm trong khoảng tin cậy 95% từ 61.18% đến 100%, kết quả này phản ánh thực tế rằng phần lớn sinh viên trong mẫu khảo sát cảm nhận được tác động đáng kể của việc sử dụng mạng xã hội đối với thành tích học tập của mình.
Đọc dữ liệu và tính toán các biến đầu vào
library(readr)
df <- read_csv("Students Social Media Addiction.csv")
## Rows: 705 Columns: 14
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Gender, Academic_Level, Country, Most_Used_Platform, Affects_Academ...
## dbl (7): Student_ID, Age, Avg_Daily_Usage_Hours, Sleep_Hours_Per_Night, Ment...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# Lọc dữ liệu chỉ cho Academic_Level == "Undergraduate"
df_undergrad <- df[df$Academic_Level == "Undergraduate", ]
column_name <- "Addicted_or_not?"
tong_mau <- nrow(df_undergrad)
so_luong_yes <- sum(df_undergrad[[column_name]] == "Yes")
Thực hiện kiểm định
Bước 1: Thiết lập giả thuyết thống kê
Bước 2: Thực hiện code
ti_le_gia_dinh <- 0.184
ket_qua_kiem_dinh <- binom.test(x = so_luong_yes,
n = tong_mau,
p = ti_le_gia_dinh,
alternative = "two.sided")
print(ket_qua_kiem_dinh)
##
## Exact binomial test
##
## data: so_luong_yes and tong_mau
## number of successes = 106, number of trials = 353, p-value = 1.344e-07
## alternative hypothesis: true probability of success is not equal to 0.184
## 95 percent confidence interval:
## 0.2529016 0.3510525
## sample estimates:
## probability of success
## 0.3002833
Bước 3: Diễn giải
Với p - value = 0.0000001343524 < \(\alpha\), ta bác bỏ giả thuyết \(H_0\).
Kết luận: Từ tập dữ liệu 353 sinh viên Undergraduate hợp lệ, có 106 sinh viên trả lời “Yes” cho câu hỏi về nghiện mạng xã hội, tương ứng với tỉ lệ 30.03% trong mẫu. Khi thực hiện kiểm định nhị thức chính xác so với tỉ lệ trung bình toàn cầu 18,4% được công bố trong bài báo của Salari et al. (2023), kết quả cho p-value = 1.34×10⁻⁷, nhỏ hơn mức ý nghĩa 0.05, chứng tỏ sự khác biệt có ý nghĩa thống kê.
Như vậy, dữ liệu cho thấy tỉ lệ nghiện mạng xã hội trong nhóm sinh viên Undergraduate được khảo sát cao hơn đáng kể so với mức trung bình toàn cầu 18,4. Kết quả này nhấn mạnh nghiện mạng xã hội là vấn đề sức khỏe cộng đồng đáng lưu tâm trong bối cảnh sinh viên được khảo sát, đồng thời cung cấp cơ sở thực tiễn để các nhà quản lý giáo dục và sức khỏe cộng đồng cân nhắc các biện pháp can thiệp phù hợp.