2025-06-09
Bộ dữ liệu được sử dụng trong phân tích này bao gồm 12.000 quan sát về hành vi và đặc điểm của khách du lịch tại Việt Nam. Dữ liệu bao gồm 6 biến định tính và 3 biến định lượng.
## [1] 12000 9
## tibble [12,000 × 9] (S3: tbl_df/tbl/data.frame)
## $ Giới tính : chr [1:12000] "Nam" "Nữ" "Nam" "Nam" ...
## $ Nhóm tuổi : chr [1:12000] "<18" "<18" "26-35" "51+" ...
## $ Mức thu nhập : chr [1:12000] "Dưới 10 triệu" "Dưới 10 triệu" "Trên 10 triệu" "Trên 10 triệu" ...
## $ Địa điểm tham quan: chr [1:12000] "Phú Quốc" "Sa Pa" "Phú Quốc" "Sa Pa" ...
## $ Số ngày đi : num [1:12000] 13 8 7 8 8 14 10 14 3 2 ...
## $ Chi tiêu (VND) : num [1:12000] 8877000 10329000 7035000 9469000 9934000 ...
## $ Điểm hài lòng : num [1:12000] 3 1 7 7 2 8 3 3 5 2 ...
## $ Quay lại : chr [1:12000] "Có" "Có" "Có" "Có" ...
## $ Du lịch tự túc : chr [1:12000] "Có" "Có" "Có" "Có" ...
## Giới tính Nhóm tuổi Mức thu nhập Địa điểm tham quan
## 0 0 0 0
## Số ngày đi Chi tiêu (VND) Điểm hài lòng Quay lại
## 0 0 0 0
## Du lịch tự túc
## 0
## Tổng số dữ liệu bị thiếu là 0
bdt <- c("Giới tính", "Nhóm tuổi", "Mức thu nhập", "Địa điểm tham quan", "Du lịch tự túc", "Quay lại")
data[bdt] <- lapply(data[bdt], as.factor)
# In tên biến, số lượng nhãn và tên các nhãn
for (var in bdt) {
cat("\nBiến:", var, "\n")
cat("Số nhãn:", length(levels(data[[var]])), "\n")
cat("Danh sách nhãn:", paste(levels(data[[var]]), collapse = ", "), "\n")
}##
## Biến: Giới tính
## Số nhãn: 2
## Danh sách nhãn: Nam, Nữ
##
## Biến: Nhóm tuổi
## Số nhãn: 5
## Danh sách nhãn: <18, 18-25, 26-35, 36-50, 51+
##
## Biến: Mức thu nhập
## Số nhãn: 2
## Danh sách nhãn: Dưới 10 triệu, Trên 10 triệu
##
## Biến: Địa điểm tham quan
## Số nhãn: 5
## Danh sách nhãn: Đà Nẵng, Hạ Long, Nha Trang, Phú Quốc, Sa Pa
##
## Biến: Du lịch tự túc
## Số nhãn: 2
## Danh sách nhãn: Có, Không
##
## Biến: Quay lại
## Số nhãn: 2
## Danh sách nhãn: Có, Không
## tibble [12,000 × 9] (S3: tbl_df/tbl/data.frame)
## $ Giới tính : Factor w/ 2 levels "Nam","Nữ": 1 2 1 1 1 2 1 1 1 2 ...
## $ Nhóm tuổi : Factor w/ 5 levels "<18","18-25",..: 1 1 3 5 5 3 4 1 1 3 ...
## $ Mức thu nhập : Factor w/ 2 levels "Dưới 10 triệu",..: 1 1 2 2 2 2 1 1 2 1 ...
## $ Địa điểm tham quan: Factor w/ 5 levels "Đà Nẵng","Hạ Long",..: 4 5 4 5 3 3 4 3 4 2 ...
## $ Số ngày đi : num [1:12000] 13 8 7 8 8 14 10 14 3 2 ...
## $ Chi tiêu (VND) : num [1:12000] 8877000 10329000 7035000 9469000 9934000 ...
## $ Điểm hài lòng : num [1:12000] 3 1 7 7 2 8 3 3 5 2 ...
## $ Quay lại : Factor w/ 2 levels "Có","Không": 1 1 1 1 1 2 2 1 1 1 ...
## $ Du lịch tự túc : Factor w/ 2 levels "Có","Không": 1 1 1 1 2 1 2 2 1 2 ...
Giới tính) Biến (Giới tính) thể hiện số lượng khách du lịch được
phân loại dựa trên giới tính, nhằm đánh giá nhu cầu du lịch giữa nam và
nữ.
table_gt <- table(data$"Giới tính")
kable(
as.data.frame(table_gt),
col.names = c("Giới tính", "Số lượng"),
caption = "<center>**Bảng: Số lượng khách du lịch theo giới tính**</center>"
)| Giới tính | Số lượng |
|---|---|
| Nam | 6008 |
| Nữ | 5992 |
gt <- round(table(data$"Giới tính")/sum(nrow(data))*100 ,1)
label <- paste(gt, "%")
pie(gt, main ="BIỂU ĐỒ PHÂN BỔ KHÁCH DU LỊCH THEO GIỚI TÍNH", col = brewer.pal(2, "Set3")
, radius =1, border = NA)## Warning in brewer.pal(2, "Set3"): minimal value for n is 3, returning requested palette with 3 different levels
## Warning in brewer.pal(2, "Set3"): minimal value for n is 3, returning requested palette with 3 different levels
Nhận xét
Tỷ lệ khách du lịch đến tham quan không có sự chênh lệch lớn giữa Nam và Nữ. Nam chiếm 50.1% và Nữ chiếm 49.9%.
Nhóm tuổi) Biến (Nhóm tuổi) phân loại các nhóm tuổi khác nhau
của du khách, nhằm đánh giá nhu cầu đi lại tham quan giữa các nhóm người
có xu hướng sống khác nhau.
table_nt <- table(data$"Nhóm tuổi")
kable(
as.data.frame(table_nt),
col.names = c("Nhóm tuổi", "Số lượng"),
caption = "<center>**Bảng: Số lượng khách du lịch theo nhóm tuổi**</center>"
)| Nhóm tuổi | Số lượng |
|---|---|
| <18 | 2449 |
| 18-25 | 2446 |
| 26-35 | 2313 |
| 36-50 | 2380 |
| 51+ | 2412 |
nt <- round(table(data$"Nhóm tuổi")/sum(nrow(data))*100 ,1)
labels <- paste0(nt, "%")
pie(nt,labels = labels, main ="BIỂU ĐỒ PHÂN BỔ KHÁCH DU LỊCH THEO NHÓM TUỔI", col = brewer.pal(5, "Set3")
, radius =1, border = NA)
legend("topright",legend = names(nt), fill = brewer.pal(5, "Set3"), title = "Nhóm tuổi", cex = 0.8)Nhận xét
Nhìn vào biểu đồ tròn có thể thấy sự chênh lệch ở các nhóm tuổi của khách du lịch tương đối đồng đều, phản ánh nhu cầu về tham quan, du lịch trải dài ở mỗi độ tuổi khác nhau.
Mức thu nhập)table_tn <- table(data$"Mức thu nhập")
kable(
as.data.frame(table_tn),
col.names = c("Mức thu nhập", "Số lượng"),
caption = "<center>**Bảng: Số lượng khách du lịch theo nhóm tuổi**</center>"
)| Mức thu nhập | Số lượng |
|---|---|
| Dưới 10 triệu | 8010 |
| Trên 10 triệu | 3990 |
tn <- round(table(data$"Mức thu nhập")/sum(nrow(data))*100 ,1)
labels <- paste0(tn, "%")
pie(tn,labels = labels, main ="BIỂU ĐỒ PHÂN BỔ KHÁCH DU LỊCH THEO MỨC THU NHẬP", col = brewer.pal(2, "Set2")
, radius =1, border = NA)## Warning in brewer.pal(2, "Set2"): minimal value for n is 3, returning requested palette with 3 different levels
legend("topright",legend = names(tn), fill = brewer.pal(2, "Set2"), title = "Mức thu nhập", cex = 0.8)## Warning in brewer.pal(2, "Set2"): minimal value for n is 3, returning requested palette with 3 different levels
Nhận xét
Mức thu nhập trong khoảng dưới 10 triệu của khách du lịch được thống kê chiếm đến 66.8%, còn lại với thu nhập dưới 10 triệu chiếm 33.2%. Mặc dù khác nhau về mức thu nhập, song chi phí về du lịch tại Việt Nam cũng tùy thuộc vào nhiều yếu tố, nên nhóm người có thu nhập thâp hơn cũng sẵn lòng chi trả cho nhu cầu này.
Địa điểm tham quan)table_d <- table(data$"Địa điểm tham quan")
kable(
as.data.frame(table_d),
col.names = c("Địa điểm tham quan", "Số lượng"),
caption = "<center>**Bảng: Số lượng khách du lịch theo địa điểm tham quan**</center>"
)| Địa điểm tham quan | Số lượng |
|---|---|
| Đà Nẵng | 2428 |
| Hạ Long | 2353 |
| Nha Trang | 2387 |
| Phú Quốc | 2386 |
| Sa Pa | 2446 |
d <- round(table(data$"Địa điểm tham quan")/sum(nrow(data))*100 ,1)
labels <- paste0(d, "%")
pie(d,labels = labels, main ="BIỂU ĐỒ PHÂN BỔ KHÁCH DU LỊCH THEO ĐỊA ĐIỂM THAM QUAN", col = brewer.pal(5, "Set1")
, radius =1, border = NA)
legend("topright",legend = names(d), fill = brewer.pal(5, "Set1"), title = "Địa điểm", cex = 0.8)Nhận xét
Trên đều là những thành phố nổi tiếng tại Việt Nam, nhìn vào biểu đồ cũng có thể thấy sự phân bổ khách du lịch lựa chọn địa điểm tham quan cũng không quá chênh lệch mà lại tương đối đồng đều theo các khu vực.
Quay lại)table_hl <- table(data$"Quay lại")
kable(
as.data.frame(table_hl),
col.names = c("Quay lại", "Số lượng"),
caption = "<center>**Bảng: Số lượng khách du lịch đánh giá sẽ quay lại**</center>"
)| Quay lại | Số lượng |
|---|---|
| Có | 5961 |
| Không | 6039 |
hl <- round(table(data$"Quay lại")/sum(nrow(data))*100 ,1)
labels <- paste0(hl, "%")
pie(hl,labels = labels, main ="BIỂU ĐỒ PHÂN BỔ KHÁCH DU LỊCH THEO Ý MUỐN QUAY LẠI", col = brewer.pal(2, "Set2")
, radius =1, border = NA)## Warning in brewer.pal(2, "Set2"): minimal value for n is 3, returning requested palette with 3 different levels
## Warning in brewer.pal(2, "Set2"): minimal value for n is 3, returning requested palette with 3 different levels
Nhận xét
Ý muốn quay lại một noi du lịch phụ thuộc vào nhiều yếu tố khác nhau, tuy nhiên trong bộ số liệu này, qua năm địa điểm tham quan, tỷ lệ mong muốn quay lại cũng không cách biệt so với tỷ lệ không muốn quay lại của du khách.
Du lịch tự túc)table_tt <- table(data$"Du lịch tự túc")
kable(
as.data.frame(table_tt),
col.names = c("Du lịch tự túc", "Số lượng"),
caption = "<center>**Bảng: Số lượng khách du lịch tự túc**</center>"
)| Du lịch tự túc | Số lượng |
|---|---|
| Có | 6046 |
| Không | 5954 |
tt <- round(table(data$"Du lịch tự túc")/sum(nrow(data))*100 ,1)
labels <- paste0(tt, "%")
pie(tt,labels = labels, main ="BIỂU ĐỒ PHÂN BỔ KHÁCH DU LỊCH TỰ TÚC", col = brewer.pal(2, "Accent")
, radius =1, border = NA)## Warning in brewer.pal(2, "Accent"): minimal value for n is 3, returning requested palette with 3 different levels
legend("topright",legend = names(tt), fill = brewer.pal(2, "Accent"), title = "Mức thu nhập", cex = 0.8)## Warning in brewer.pal(2, "Accent"): minimal value for n is 3, returning requested palette with 3 different levels
Nhận xét
Trong hầu hết các chuyến du lịch, để thoải mái và bớt chi phí, du khách thường chọn đi tự túc, tỷ lệ khách du lịch đi tự túc cũng chiếm đến 50.4%.
Địa điểm tham quan) với hạng mục
(Phú Quốc)n <- nrow(data)
n_pq <- sum(data$"Địa điểm tham quan" == "Phú Quốc")
x_pq <- n_pq / n
z <- qnorm(0.975)
se_pq <- sqrt(x_pq * (1 - x_pq) / n)
lower_pq <- x_pq - z * se_pq
upper_pq <- x_pq + z * se_pq
cat("Khoảng tin cậy 95% cho tỷ lệ địa điểm tham quan được chọn ở Phú Quốc là:", round(lower_pq, 4), "-", round(upper_pq, 4), "\n")## Khoảng tin cậy 95% cho tỷ lệ địa điểm tham quan được chọn ở Phú Quốc là: 0.1917 - 0.206
Nhận xét
Với mức tin cậy 95%, ước lượng rằng tỷ lệ khách du lịch chọn Phú Quốc là từ 19.17% đến 20.6% trong toàn bộ tổng thể khách du lịch tại Việt Nam.
Nếu lặp lại quá trình lấy mẫu và tính khoảng tin cậy nhiều lần, thì khoảng 95% các khoảng tin cậy 0.19 đến 0.21 sẽ chứa đúng tỷ lệ thực tế của tỷ lệ khách du lịch chọn địa điểm tham quan ở Phú Quốc.
Thực hiện kiểm định giả thuyết cho rằng tỷ lệ Phú Quốc được chọn làm địa điểm du lịch là 40%, ta có:
Bài toán kiểm định:
\(H_0\): Địa điểm du lịch được chọn là \(Phú Quốc = 0.4\)
\(H_1\): Địa điểm du lịch được chọn là \(Phú Quốc \ne 0.4\)
##
## 1-sample proportions test with continuity correction
##
## data: n_pq out of n, null probability 0.4
## X-squared = 2022.6, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.4
## 95 percent confidence interval:
## 0.1917480 0.2061125
## sample estimates:
## p
## 0.1988333
Kết quả cho thấy:
Giá trị P- value = 0
Với độ tin cậy 95%, p-value = 0 < 0.05. Bác bỏ giả thuyết \(H_0\), tức có thể nói rằng tỷ lệ Phú Quốc được chọn làm địa điểm tham quan có thể là 40%.
Điểm hài lòng) với hạng mục
(7 điểm)n <- nrow(data)
n_7 <- sum(data$"Địa điểm tham quan" == "Phú Quốc")
x_7 <- n_7 / n
z <- qnorm(0.975)
se_7 <- sqrt(x_pq * (1 - x_7) / n)
lower_7 <- x_7 - z * se_7
upper_7 <- x_7 + z * se_7
cat("Khoảng tin cậy 95% cho tỷ lệ 7 điểm hài lòng của khách du lịch tại Việt Nam là:", round(lower_7, 4), "-", round(upper_7, 4), "\n")## Khoảng tin cậy 95% cho tỷ lệ 7 điểm hài lòng của khách du lịch tại Việt Nam là: 0.1917 - 0.206
Nhận xét
Với mức tin cậy 95%, ước lượng rằng tỷ lệ 7 điểm hài lòng của khách du lịch tại Việt Nam là từ 19.17% đến 20.6% trong toàn bộ tổng thể khách du lịch tại Việt Nam.
Nếu lặp lại quá trình lấy mẫu và tính khoảng tin cậy nhiều lần, thì khoảng 95% các khoảng tin cậy 0.19 đến 0.21 sẽ chứa đúng tỷ lệ thực tế của tỷ lệ 7 điểm hài lòng của khách du lịch tại Việt Nam.
Thực hiện kiểm định giả thuyết cho rằng tỷ lệ 7 điểm hài lòng của khách du lịch là có thể hơn 80%, ta có:
Bài toán kiểm định:
\(H_0\): Tỷ lệ 7 điểm hài lòng của khách du lịch \(\geq 0.8\)
\(H_1\): Tỷ lệ 7 điểm hài lòng của khách du lịch < 0.8
##
## 1-sample proportions test with continuity correction
##
## data: n_7 out of n, null probability 0.8
## X-squared = 27101, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is less than 0.8
## 95 percent confidence interval:
## 0.000000 0.204936
## sample estimates:
## p
## 0.1988333
Kết quả cho thấy:
Giá trị P- value = 0.1988333
Với độ tin cậy 95%, p-value = 0.1988333 > 0.05. Không có cơ sở bác bỏ giả thuyết \(H_0\), tức có không thể nói rằng tỷ lệ khách du lịch hài lòng khi du lịch tại Việt Nam có thể là thấp hơn 80%.
Nhóm tuổi) với hạng mục
(tuổi 18 - 25)n <- nrow(data)
n_nt <- sum(data$"Nhóm tuổi" == "18-25")
x_nt <- n_nt / n
z <- qnorm(0.975)
se_nt <- sqrt(x_nt * (1 - x_nt) / n)
lower_nt <- x_nt - z * se_nt
upper_nt <- x_nt + z * se_nt
cat("Khoảng tin cậy 95% cho tỷ lệ nhóm tuổi của khách du lịch tại Việt Nam trong khoảng tuổi 18 đến 25 là:", round(lower_nt, 4), "-", round(upper_nt, 4), "\n")## Khoảng tin cậy 95% cho tỷ lệ nhóm tuổi của khách du lịch tại Việt Nam trong khoảng tuổi 18 đến 25 là: 0.1966 - 0.211
Nhận xét
Với mức tin cậy 95%, ước lượng rằng tỷ lệ nhóm tuổi của khách du lịch tại Việt Nam trong khoảng tuổi 18 đến 25 là từ 19.66% đến 21.1% trong toàn bộ tổng thể khách du lịch tại Việt Nam.
Nếu lặp lại quá trình lấy mẫu và tính khoảng tin cậy nhiều lần, thì khoảng 95% các khoảng tin cậy 0.2 đến 0.21 sẽ chứa đúng tỷ lệ thực tế của nhóm tuổi của khách du lịch tại Việt Nam trong khoảng tuổi 18 đến 25.
Thực hiện kiểm định giả thuyết cho rằng tỷ lệ thực tế của nhóm tuổi của khách du lịch tại Việt Nam trong khoảng tuổi 18 đến 25 là 55%, ta có:
Bài toán kiểm định:
\(H_0\): Tỷ lệ nhóm tuổi của khách du lịch tại Việt Nam trong khoảng tuổi 18 đến 25 \(= 0.55\)
\(H_1\): Tỷ lệ nhóm tuổi của khách du lịch tại Việt Nam trong khoảng tuổi 18 đến 25 \(\ne 0.55\)
##
## 1-sample proportions test with continuity correction
##
## data: n_nt out of n, null probability 0.55
## X-squared = 5808.6, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.55
## 95 percent confidence interval:
## 0.1966798 0.2111775
## sample estimates:
## p
## 0.2038333
Kết quả cho thấy:
Giá trị P- value = 0.2038
Với độ tin cậy 95%, p-value = 0.2038 > 0.05. Chưa có cơ sở bác bỏ giả thuyết \(H_0\), tức có cơ sở để nói rằng tỷ lệ nhóm tuổi của khách du lịch tại Việt Nam trong khoảng tuổi 18 đến 25 có thể là 55%.
Mức thu nhập) với hạng mục
(Trên 10 triệu)n <- nrow(data)
n_mtt <- sum(data$"Mức thu nhập" == "Trên 10 triệu")
x_mtt <- n_mtt / n
z <- qnorm(0.975)
se_mtt <- sqrt(x_mtt * (1 - x_mtt) / n)
lower_mtt <- x_mtt - z * se_mtt
upper_mtt <- x_mtt + z * se_mtt
cat("Khoảng tin cậy 95% cho tỷ lệ khách du lịch có mức thu nhập trên 10 triệu là:", round(lower_mtt, 4), "-", round(upper_mtt, 4), "\n")## Khoảng tin cậy 95% cho tỷ lệ khách du lịch có mức thu nhập trên 10 triệu là: 0.3241 - 0.3409
Nhận xét
Với mức tin cậy 95%, ước lượng rằng tỷ lệ khách du lịch có mức thu nhập trên 10 triệu là từ 32.41% đến 34.09% trong toàn bộ tổng thể khách du lịch tại Việt Nam.
Nếu lặp lại quá trình lấy mẫu và tính khoảng tin cậy nhiều lần, thì khoảng 95% các khoảng tin cậy 0.32 đến 0.34 sẽ chứa đúng tỷ lệ thực tế của khách du lịch có mức thu nhập trên 10 triệu.
Thực hiện kiểm định giả thuyết cho rằng tỷ lệ khách du lịch có mức thu nhập trên 10 triệu là thấp hơn 30%, ta có:
Bài toán kiểm định:
\(H_0\): Tỷ lệ khách du lịch có mức thu nhập trên 10 triệu \(< 0.3\)
\(H_1\): Tỷ lệ khách du lịch có mức thu nhập trên 10 triệu \(\geq 0.3\)
##
## 1-sample proportions test with continuity correction
##
## data: n_mtt out of n, null probability 0.3
## X-squared = 60.202, df = 1, p-value = 4.279e-15
## alternative hypothesis: true p is greater than 0.3
## 95 percent confidence interval:
## 0.3254231 1.0000000
## sample estimates:
## p
## 0.3325
Kết quả cho thấy:
Giá trị P- value = 0.3325
Với độ tin cậy 95%, p-value = 0.3325 > 0.05. Chưa có cơ sở bác bỏ giả thuyết \(H_0\), tức có thể nói rằng tỷ lệ khách du lịch có mức thu nhập trên 10 triệu có thể thấp hơn 30%.
Giới tính) và
(Mức thu nhập)data$"Mức thu nhập" <- factor(data$"Mức thu nhập", levels = c("Trên 10 triệu", "Dưới 10 triệu"))
bnn <- table(data$"Giới tính", data$"Mức thu nhập")
ppb <- addmargins(bnn)
kable(ppb,
caption = "<center>**Bảng Tần suất chéo: (`Giới tính`) và (`Mức thu nhập`)**</center>",
align = "c")Giới tính) và
(Mức thu nhập)
| Trên 10 triệu | Dưới 10 triệu | Sum | |
|---|---|---|---|
| Nam | 1968 | 4040 | 6008 |
| Nữ | 2022 | 3970 | 5992 |
| Sum | 3990 | 8010 | 12000 |
## Tỷ lệ mức thu nhập trên 10 triệu ở Nam là 32.8 %
## Tỷ lệ mức thu nhập dưới 10 triệu ở Nữ là 33.7 %
## Risk Difference -0.009
Nhận xét:
Tỷ lệ có thu nhập trên 10 triệu ở Nam là 32.8%
Tỷ lệ có thu nhập trên 10 triệu ở Nữ là 33.7%
Kết quả RD = -0.009 cho biết rằng khả năng có mức thu nhập cao ở nam giới thấp hơn nữ giới khoảng 0.9 %. Nói cách khác, sự chênh lệch về xác suất giữa hai nhóm là âm, nên nữ có xu hướng chiếm ưu thế nhẹ trong việc có mức thu nhập cao.
## Relative Risk: 0.971
Nhận xét:
Kết quả RR = 0.971 cho biết rằng mức thu nhập trên 10 triệu ở Nam có khả năng thấp hơn 0.971 lần so với Nữ.
## Odds Nam có mức thu nhập trên 10 triệu là 0.5
## Odds Nữ có mức thu nhập trên 10 triệu là 0.5
## Odds Ratio: 0.9564298
Nhận xét:
Tỷ lệ thu nhập trên 10 triệu/thu nhập dưới 10 triệu ở Nam đạt 0.5. Tức, trong nhóm Nam, xác suất có mức thu nhập cao là thấp hơn xác suất có mức thu nhập thấp là 0.5 lần.
Tỷ lệ thu nhập trên 10 triệu/thu nhập dưới 10 triệu ở Nữ đạt 0.5. Tức, trong nhóm Nữ, xác suất có mức thu nhập cao là thấp hơn xác suất có mức thu nhập thấp là 0.5 lần.
ktc <- OddsRatio(bnn,conf.level = .95)
kable(ktc,
caption = "<center>**Bảng ước lượng KTC Odds Ratio**</center>",
align = "c")| x | |
|---|---|
| odds ratio | 0.9564298 |
| lwr.ci | 0.8864680 |
| upr.ci | 1.0319130 |
## Khoảng tin cậy 95% cho Odds Ratio là: 0.886468 - 1.031913
Nhận xét:
Kết quả với OR = 0.959, (CL 95%: 0.886 - 1.031) cho thấy khả năng ở Nam có mức thu nhập trên 10 triệu thấp hơn 0.959 lần khả năng ở Nữ. Tuy nhiên, vì khoảng tin cậy chưa 1 nên mối liên hệ này không có ý nghĩa thống kê, có thể là do ngẫu nhiên.