Kiểm định giả thuyết về tỷ lệ một tổng thể là một bài toán nền tảng trong thống kê suy luận, cho phép xác định xem liệu tỷ lệ quan sát được từ một mẫu có khác biệt một cách có ý nghĩa thống kê so với một tỷ lệ giả định hay không.

Trong nhiều nghiên cứu, dữ liệu thu thập được mang bản chất nhị phân (ví dụ: thành công/thất bại, có/không). Với loại dữ liệu này, Kiểm định Nhị thức (Binomial Test) là một giải pháp thay thế chính xác và mạnh mẽ, đặc biệt hữu ích khi kích thước mẫu nhỏ hoặc tỷ lệ giả định gần các giá trị 0 và 1.

Mục tiêu của nghiên cứu này là minh họa quy trình ứng dụng Kiểm định Nhị thức trong R/RStudio để giải quyết các bài toán thực tiễn về xu hướng sử dụng mạng xã hội ở học sinh, sinh viên.

1. CƠ SỞ LÝ THUYẾT

1.1 Kiểm định tỷ lệ một tổng thể

1.1.1 Khái niệm

Kiểm định tỷ lệ một tổng thể là một phương pháp thống kê suy luận dùng để quyết định xem một tỷ lệ quan sát được từ mẫu có cung cấp đủ bằng chứng để bác bỏ một giả định về tỷ lệ của toàn bộ tổng thể hay không.

Ví dụ: Một công ty tuyên bố rằng chỉ có 5% sản phẩm của họ bị lỗi. Ta lấy một mẫu ngẫu nhiên 200 sản phẩm và thấy có 18 sản phẩm bị lỗi (tức 9%). Kiểm định tỷ lệ sẽ giúp ta xác định xem con số 9% này có đủ mạnh để kết luận rằng tuyên bố 5% của công ty là sai hay không?

1.1.2 Các thành phần chính

1.1.2.1 Giả thuyết

Giả thuyết không (H₀): Là giả định mặc định, luôn chứa dấu bằng.
Ví dụ: H₀: \(p = p_0\).

Giả thuyết đối (H₁): Là điều chúng ta muốn chứng minh, phản ánh sự khác biệt.
Có thể là:

  • Kiểm định hai phía: \(p \neq p_0\)
  • Kiểm định phía phải: \(p > p_0\)
  • Kiểm định phía trái: \(p < p_0\)

1.1.2.2 Mức ý nghĩa

Ngưỡng kiểm soát rủi ro, là xác suất loại bỏ H₀ trong khi nó thực sự đúng.
Thường lấy \(\alpha = 0.05\) (5%).

1.1.2.3 P - giá trị

Là xác suất quan sát được một kết quả mẫu ít nhất cũng khác biệt như kết quả đã thu được, giả sử H₀ là đúng.

Quy tắc ra quyết định:
- Nếu \(P\text{-value} \leq \alpha\), bác bỏ H₀.
- Nếu \(P\text{-value} > \alpha\), không đủ bằng chứng để bác bỏ H₀.

1.2 Kiểm định Nhị thức (Binomial Test)

1.2.1 Khái niệm

Là một kiểm định chính xác (exact test), dùng để xác định xem số lần xuất hiện sự kiện quan sát được trong một mẫu có phù hợp với một tỷ lệ (xác suất) thành công giả định hay không. Nó tính toán xác suất trực tiếp từ phân phối Nhị thức, đảm bảo tính hợp lệ ngay cả với các trường hợp có kích thước mẫu nhỏ.

1.2.2 Giả định

  • Cỡ mẫu phải được xác định trước (n xác định).
  • Dữ liệu nhị phân (thành công/thất bại, có/không).
  • Các phép thử độc lập.
  • Xác suất thành công không đổi (\(p_0\) không đổi).

1.2.3 Công thức

Giả sử xác suất thành công trong mỗi lần thử là \(p_0\).

\[ P(X = k) = \binom{n}{k} \, (p_0)^k \, (1-p_0)^{\,n-k} \]

Trong đó, tổ hợp \(\binom{n}{k}\) được tính bằng:

\[ \binom{n}{k} = \frac{n!}{k! \, (n-k)!} \]

Kiểm định phía phải (\(\mathbf{H}_1: \mathbf{p} > \mathbf{p}_0\))

P-value là tổng xác suất có được \(k\) lần thành công hoặc nhiều hơn:

\[ \text{p-value} = P(X \ge k) = \sum_{i=k}^{n} \binom{n}{i} (p_0)^i (1-p_0)^{n-i} \]

Hay:

\[ \text{p-value} = P(X=k) + P(X=k+1) + \cdots + P(X=n) \]


Kiểm định phía trái (\(\mathbf{H}_1: \mathbf{p} < \mathbf{p}_0\))

P-value là tổng xác suất có được \(k\) lần thành công hoặc ít hơn:

\[ \text{p-value} = P(X \le k) = \sum_{i=0}^{k} \binom{n}{i} (p_0)^i (1-p_0)^{\,n-i} \]

Hay:

\[ \text{p-value} = P(X=0) + P(X=1) + \cdots + P(X=k) \]


Kiểm định hai phía (\(\mathbf{H}_1: \mathbf{p} \neq \mathbf{p}_0\))

P-value là xác suất của các kết quả “khác biệt” ở cả hai phía (đuôi) của phân phối. Cách tính phổ biến là nhân đôi xác suất của phía đuôi nhỏ hơn:

\[ \text{p-value} = 2 \times \min \left( P(X \le k),\; P(X \ge k) \right) \]

1.2.3 Minh họa các bước tính toán thủ công

Một đội ngũ marketing muốn cải thiện tỷ lệ chuyển đổi (conversion rate) trên trang web của họ. Lịch sử cho thấy, với thiết kế cũ, cứ 100 người vào trang thì có 20 người đăng ký tài khoản (tỷ lệ chuyển đổi là 20%). Họ tạo ra một thiết kế trang web mới và muốn thử nghiệm trên một nhóm nhỏ để xem nó có hiệu quả hơn không. Họ cho 8 người dùng mới xem thiết kế mới và kết quả là có 5 người đã đăng ký.

Liệu kết quả này có đủ bằng chứng để kết luận rằng thiết kế mới thực sự hiệu quả hơn thiết kế cũ không?

Giải

Đặt giả thuyết:
- Thiết kế mới không hiệu quả hơn. Tỷ lệ chuyển đổi vẫn chỉ là 20%.
\[ H_0: p = 0.2 \]
- Thiết kế mới hiệu quả hơn. Tỷ lệ chuyển đổi lớn hơn 20%.
\[ H_1: p > 0.2 \]

Chọn mức ý nghĩa: \(\alpha = 0.05\)
Kích thước mẫu: \(n = 8\) người dùng
Số lần thành công (số người đăng ký): \(k = 5\)
Tỷ lệ thành công giả định (tỷ lệ cũ): \(p_0 = 0.20\)


Bước 1: Xác định xác suất nhị thức
Vì giả thuyết đối là \(p > 0.2\), chúng ta cần tính xác suất của kết quả quan sát được (\(k=5\)) và tất cả các kết quả “khác biệt” hơn nữa theo cùng hướng (6, 7, 8 người).

Công thức nhị thức:

\[ P(X=k) = \binom{n}{k} (p_0)^k (1-p_0)^{\,n-k} \]


Bước 2: Tính từng xác suất

  • P(X = 5):
    \[ \binom{8}{5} = \frac{8!}{5!(8-5)!} = \frac{8 \times 7 \times 6}{3 \times 2 \times 1} = 56 \]
    \[ P(X=5) = 56 \times (0.20)^5 \times (0.80)^3 \approx 0.009175 \]

  • P(X = 6):
    \[ \binom{8}{6} = \frac{8!}{6!2!} = 28 \]
    \[ P(X=6) = 28 \times (0.20)^6 \times (0.80)^2 \approx 0.001147 \]

  • P(X = 7):
    \[ \binom{8}{7} = \frac{8!}{7!1!} = 8 \]
    \[ P(X=7) = 8 \times (0.20)^7 \times (0.80)^1 \approx 0.000082 \]

  • P(X = 8):
    \[ \binom{8}{8} = 1 \]
    \[ P(X=8) = 1 \times (0.20)^8 \times (0.80)^0 \approx 0.00000256 \]


Bước 3: Tính P-value
\[ \text{p-value} = P(X=5) + P(X=6) + P(X=7) + P(X=8) \]
\[ \text{p-value} \approx 0.009175 + 0.001147 + 0.000082 + 0.00000256 \approx 0.0104 \]


Bước 4: Quyết định
So sánh:
\[ 0.0104\ (\text{p-value}) < 0.05\ (\alpha) \]
Bác bỏ giả thuyết \(H_0\).


Kết luận
Kết quả có ý nghĩa thống kê. Nếu thiết kế mới không hiệu quả hơn (tỷ lệ chuyển đổi thực sự vẫn chỉ 20%), thì khả năng quan sát được 5/8 người hoặc nhiều hơn đăng ký chỉ là khoảng 1%.
Do đó, đội ngũ marketing có bằng chứng mạnh mẽ để kết luận rằng thiết kế trang web mới thực sự hiệu quả hơn trong việc thu hút người dùng đăng ký.

2. VẬN DỤNG VỚI BỘ DỮ LIỆU THỰC TẾ

2.1 Giới thiệu bài toán

Ngay sau đây, ta sẽ đi vào một bài toán thực tế, thực hiện kiểm định tỷ lệ một tổng thể bằng phương pháp kiểm định Nhị thức.

2.1.1 Tổng quan bộ dữ liệu

Ta có bộ dữ liệu thu thập từ một khảo sát trực tuyến quý 1 năm 2025 về thói quen sử dụng mạng xã hội và các tác động liên quan trong đời sống của học sinh, sinh viên.
Người tham gia đến từ nhiều quốc gia khác nhau, được mời qua email của trường đại họcnền tảng mạng xã hội.
Các câu hỏi được xây dựng dựa trên các thang đo đã được kiểm chứng (ví dụ: Thang đo nghiện mạng xã hội Bergen).


Thang đo nghiện mạng xã hội Bergen (Bergen Social Media Addiction Scale - BSMAS) là một công cụ sàng lọc tâm lý ngắn gọn được phát triển để đánh giá nguy cơ nghiện mạng xã hội ở người trưởng thành và thanh thiếu niên. Được tạo ra bởi Tiến sĩ Cecilie Schou Andreassen và các đồng nghiệp tại Đại học Bergen, Na Uy. Đây là một trong những thang đo được sử dụng rộng rãi và uy tín nhất trong các nghiên cứu về hành vi sử dụng mạng xã hội.

Thang đo được xây dựng dựa trên sáu thành phần cốt lõi của lý thuyết nghiện hành vi, bao gồm:

  • Salience (Sự ám ảnh): Mạng xã hội chiếm vị trí trung tâm trong suy nghĩ và cảm xúc của một người.
  • Mood Modification (Sự thay đổi tâm trạng): Sử dụng mạng xã hội để cải thiện tâm trạng hoặc thoát khỏi cảm xúc tiêu cực.
  • Tolerance (Sự dung nạp): Cần phải tăng dần thời gian sử dụng mạng xã hội để đạt được cảm giác thỏa mãn như trước.
  • Withdrawal (Hội chứng cai): Cảm thấy khó chịu, cáu kỉnh hoặc lo lắng khi không thể sử dụng mạng xã hội.
  • Conflict (Sự xung đột): Việc sử dụng mạng xã hội gây ra mâu thuẫn với các khía cạnh quan trọng khác trong cuộc sống (công việc, học tập, các mối quan hệ).
  • Relapse (Sự tái nghiện): Nỗ lực cắt giảm việc sử dụng mạng xã hội nhưng không thành công và quay lại thói quen cũ.

Bộ dữ liệu bao gồm các thuộc tính sau:

  • Student_ID (Integer): Mã số định danh duy nhất cho mỗi sinh viên tham gia khảo sát.
  • Age (Integer): Tuổi (tính theo năm) của sinh viên tại thời điểm khảo sát.
  • Gender (Categorical): Giới tính tự khai báo của sinh viên (“Male”, “Female”).
  • Academic_Level (Categorical): Bậc học hiện tại: “High School”, “Undergraduate”, “Graduate”.
  • Country (Categorical): Quốc gia nơi sinh viên sinh sống và tham gia khảo sát.
  • Avg_Daily_Usage_Hours (Float): Thời gian trung bình (giờ/ngày) sinh viên sử dụng mạng xã hội.
  • Most_Used_Platform (Categorical): Nền tảng mạng xã hội được dùng nhiều nhất (Instagram, Facebook, TikTok, …).
  • Affects_Academic_Performance (Boolean): Sinh viên có cho rằng mạng xã hội ảnh hưởng tiêu cực đến học tập hay không (“Yes/No”).
  • Sleep_Hours_Per_Night (Float): Thời gian ngủ trung bình mỗi đêm (giờ).
  • Mental_Health_Score (Integer): Điểm sức khỏe tinh thần (từ 1 = kém đến 10 = rất tốt).
  • Relationship_Status (Categorical): Tình trạng quan hệ: “Single”, “In Relationship”, “Complicated”.
  • Conflicts_Over_Social_Media (Integer): Số lần mâu thuẫn/xung đột với người khác do mạng xã hội.
  • Addicted_Score (Integer): Điểm đo mức độ nghiện mạng xã hội (1 = thấp, 10 = cao).
  • Addicted_or_not (Boolean/Categorical): Xác định sinh viên có nghiện mạng xã hội hay không. Các mức Addicted_Score > 7 được coi là nghiện.

2.1.2 Yêu cầu bài toán

  1. Kiểm tra xem tỷ lệ học sinh, sinh viên tự nhận thấy rằng mạng xã hội ảnh hưởng tiêu cực đến kết quả học tập có trên 50% không?

  2. Kiểm tra xem tỷ lệ học sinh, sinh viên nghiện mạng xã hội có khác biệt đáng kể với 18.4% hay không?

2.1.2.1 Kiểm tra xem tỷ lệ học sinh, sinh viên tự nhận thấy rằng mạng xã hội ảnh hưởng tiêu cực đến kết quả học tập có trên 50% không?

Đọc dữ liệu và tính toán các biến đầu vào

library(readr)

# Đọc dữ liệu
df <- read_csv("Students Social Media Addiction.csv")
## Rows: 705 Columns: 14
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Gender, Academic_Level, Country, Most_Used_Platform, Affects_Academ...
## dbl (7): Student_ID, Age, Avg_Daily_Usage_Hours, Sleep_Hours_Per_Night, Ment...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# Biến đếm
tong_mau <- length(df$Affects_Academic_Performance)
so_luong_yes <- sum(df$Affects_Academic_Performance == "Yes")

Thực hiện kiểm định

Bước 1: Thiết lập giả thuyết thống kê

  • Giả thuyết không (\(H_0\)): Tỷ lệ thực tế bằng 50% (\(p = 0.5\))
  • Giả thuyết đối (\(H_1\)): Tỷ lệ thực tế lớn hơn 50% (\(p > 0.5\))

Bước 2: Thực hiện code

ti_le_gia_dinh <- 0.5
ket_qua_kiem_dinh <- binom.test(x = so_luong_yes,
                                n = tong_mau,
                                p = ti_le_gia_dinh,
                                alternative = "greater")
print(ket_qua_kiem_dinh)
## 
##  Exact binomial test
## 
## data:  so_luong_yes and tong_mau
## number of successes = 453, number of trials = 705, p-value = 1.681e-14
## alternative hypothesis: true probability of success is greater than 0.5
## 95 percent confidence interval:
##  0.61175 1.00000
## sample estimates:
## probability of success 
##              0.6425532

Bước 3: Diễn giải

Với p - value = 0.00000000000001680959 < \(\alpha\), ta bác bỏ giả thuyết \(H_0\).

Kết luận: Có bằng chứng thống kê mạnh mẽ để khẳng định rằng tỷ lệ học sinh, sinh viên nhận thấy mạng xã hội ảnh hưởng tiêu cực đến kết quả học tập cao hơn 50%. Với tỷ lệ quan sát được là 64.26%, nằm trong khoảng tin cậy 95% từ 61.18% đến 100%, kết quả này phản ánh thực tế rằng phần lớn sinh viên trong mẫu khảo sát cảm nhận được tác động đáng kể của việc sử dụng mạng xã hội đối với thành tích học tập của mình.

2.1.2.2 Kiểm tra xem tỷ lệ học sinh, sinh viên nghiện mạng xã hội có khác biệt đáng kể với 18.4% hay không?

Đọc dữ liệu và tính toán các biến đầu vào

library(readr)
df <- read_csv("Students Social Media Addiction.csv")
## Rows: 705 Columns: 14
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Gender, Academic_Level, Country, Most_Used_Platform, Affects_Academ...
## dbl (7): Student_ID, Age, Avg_Daily_Usage_Hours, Sleep_Hours_Per_Night, Ment...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# Lọc dữ liệu chỉ cho Academic_Level == "Undergraduate"
df_undergrad <- df[df$Academic_Level == "Undergraduate", ]

column_name <- "Addicted_or_not?"
tong_mau <- nrow(df_undergrad)
so_luong_yes <- sum(df_undergrad[[column_name]] == "Yes")

Thực hiện kiểm định

Bước 1: Thiết lập giả thuyết thống kê

  • Giả thuyết không (\(H_0\)): Tỷ lệ thực tế bằng 18.4% (\(p = 0.184\))
  • Giả thuyết đối (\(H_1\)): Tỷ lệ thực tế khác 18.4% (\(p\neq 0.184\))

Bước 2: Thực hiện code

ti_le_gia_dinh <- 0.184
ket_qua_kiem_dinh <- binom.test(x = so_luong_yes,
                                n = tong_mau,
                                p = ti_le_gia_dinh,
                                alternative = "two.sided")
print(ket_qua_kiem_dinh)
## 
##  Exact binomial test
## 
## data:  so_luong_yes and tong_mau
## number of successes = 106, number of trials = 353, p-value = 1.344e-07
## alternative hypothesis: true probability of success is not equal to 0.184
## 95 percent confidence interval:
##  0.2529016 0.3510525
## sample estimates:
## probability of success 
##              0.3002833

Bước 3: Diễn giải

Với p - value = 0.0000001343524 < \(\alpha\), ta bác bỏ giả thuyết \(H_0\).

Kết luận: Từ tập dữ liệu 353 sinh viên Undergraduate hợp lệ, có 106 sinh viên trả lời “Yes” cho câu hỏi về nghiện mạng xã hội, tương ứng với tỉ lệ 30.03% trong mẫu. Khi thực hiện kiểm định nhị thức chính xác so với tỉ lệ trung bình toàn cầu 18,4% được công bố trong bài báo của Salari et al. (2023), kết quả cho p-value = 1.34×10⁻⁷, nhỏ hơn mức ý nghĩa 0.05, chứng tỏ sự khác biệt có ý nghĩa thống kê.

Như vậy, dữ liệu cho thấy tỉ lệ nghiện mạng xã hội trong nhóm sinh viên Undergraduate được khảo sát cao hơn đáng kể so với mức trung bình toàn cầu 18,4. Kết quả này nhấn mạnh nghiện mạng xã hội là vấn đề sức khỏe cộng đồng đáng lưu tâm trong bối cảnh sinh viên được khảo sát, đồng thời cung cấp cơ sở thực tiễn để các nhà quản lý giáo dục và sức khỏe cộng đồng cân nhắc các biện pháp can thiệp phù hợp.