LỜI CẢM ƠN

Kính gửi Thầy Trần Mạnh Tường!

Lời đầu tiên, em xin được gửi lời cảm ơn chân thành nhất đến thầy Trần Mạnh Tường. Trong quá trình học tập và tìm hiểu môn Phân tích dữ liệu định tính em đã nhận được rất nhiều sự quan tâm, giúp đỡ, hưỡng dẫn tâm huyết và tận tình của thầy. Thầy đã giúp em tích lũy thêm nhiều kiến thức về môn học này để có thể hoàn thành được bài tiểu luận về đề tài: “PHÂN TÍCH CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN TÌNH HÌNH THỊ TRƯỜNG VIỆC LÀM VÀ TRIỂN VỌNG NGHỀ NGHIỆP TRONG BỐI CẢNH HIỆN NAY”

Trước hết, em muốn bày tỏ lòng biết ơn sâu sắc với thầy vì đã dành thời gian và công sức để đọc và đánh giá bài tiểu luận của em. Những góp ý và nhận xét từ thầy đã giúp em nhìn nhận các khía cạnh mới, hoàn thiện ý tưởng và làm cho bài tiểu luận trở nên tốt hơn.

Cuối cùng, em muốn gửi lời cảm ơn chân thành đến thầy vì đã truyền đạt cho em niềm đam mê và tinh thần cầu tiến trong lĩnh vực này. Sự ủng hộ và động viên từ phía thầy đã giúp em vượt qua những khó khăn và trở thành một nhà nghiên cứu tự tin hơn.

Mặc dù đã có những đầu tư nhất định trong quá trình làm bài song cũng khó có thể tránh khỏi những sai sót, em kính mong nhận được ý kiến đóng góp của quý thầy cô để bài tiểu luận được hoàn thiện hơn.

Một lần nữa, em xin chân thành cảm ơn sự đóng góp và tận tâm của thầy trong quá trình hướng dẫn và hỗ trợ em trong viết bài tiểu luận này. Em rất biết ơn và tự hào vì có cơ hội được học và làm việc dưới sự hướng dẫn của thầy.

Trân trọng,

Lê Thị Thanh Phú

LỜI CAM ĐOAN

Tôi cam đoan bài nghiên cứu này do tôi thực hiện. Các đoạn trích dẫn và số liệu sử dụng trong đề tài này đều được dẫn nguồn và có độ chính xác cao nhất trong phạm vi hiểu biết của tôi. Đề tài này không nhất thiết phản ánh quan điểm của Trường Đại Học Tài Chính – Marketing.

CHƯƠNG I. TỔNG QUAN NGHIÊN CỨU

1.1. Lí do chọn đề tài

Trong bối cảnh toàn cầu hóa và chuyển đổi số diễn ra mạnh mẽ, thị trường việc làm đang chứng kiến những biến động đáng kể cả về cung và cầu lao động. Đặc biệt, từ sau đại dịch COVID-19, nhiều ngành nghề truyền thống bị thu hẹp, trong khi các lĩnh vực liên quan đến công nghệ thông tin, thương mại điện tử, logistics và năng lượng tái tạo lại phát triển vượt bậc. Điều này đã và đang đặt ra yêu cầu cấp thiết phải hiểu rõ hơn về các yếu tố ảnh hưởng đến tình hình thị trường việc làm nhằm xây dựng chính sách lao động và đào tạo nguồn nhân lực phù hợp với xu hướng phát triển mới. Chính vì vậy, việc lựa chọn đề tài “Phân tích các yếu tố ảnh hưởng đến tình hình thị trường việc làm trong bối cảnh hiện nay” là cần thiết và mang tính thời sự cao.

Trên thế giới, nhiều nghiên cứu đã chỉ ra rằng thị trường việc làm không chỉ chịu tác động từ các yếu tố kinh tế vĩ mô như tăng trưởng GDP, lạm phát, chính sách tiền tệ, mà còn phụ thuộc lớn vào những yếu tố xã hội như trình độ giáo dục, mức độ chuyển đổi số, xu hướng dịch chuyển lao động giữa các khu vực và thay đổi trong hành vi người lao động sau đại dịch. Tại Việt Nam, những thay đổi trong cơ cấu kinh tế và định hướng phát triển bền vững cũng làm biến đổi nhu cầu tuyển dụng, kỹ năng nghề nghiệp và cơ hội việc làm ở nhiều lĩnh vực. Tuy nhiên, hiện nay các nghiên cứu chuyên sâu về thị trường việc làm trong bối cảnh hậu COVID-19 và cách mạng công nghiệp 4.0 vẫn còn hạn chế, đặc biệt là ở góc độ định lượng kết hợp với phân tích chính sách.

1.2. Mục tiêu nghiên cứu

Mục tiêu của nghiên cứu này là phân tích một cách có hệ thống các yếu tố ảnh hưởng đến tình hình thị trường việc làm trong bối cảnh hiện nay, với trọng tâm là giai đoạn hậu đại dịch COVID-19 và quá trình chuyển đổi số đang diễn ra mạnh mẽ. Cụ thể, nghiên cứu hướng đến ba mục tiêu chính:

  1. Xác định và hệ thống hóa các nhóm yếu tố chính có ảnh hưởng đến thị trường lao động, bao gồm yếu tố kinh tế vĩ mô (tăng trưởng GDP, lạm phát, đầu tư công), yếu tố xã hội (trình độ học vấn, cơ cấu dân số), và yếu tố công nghệ (mức độ ứng dụng chuyển đổi số, tự động hóa);

  2. Đo lường và đánh giá mức độ tác động của các yếu tố trên đến tình hình việc làm thông qua các chỉ tiêu như tỷ lệ thất nghiệp, cơ cấu ngành nghề, và nhu cầu tuyển dụng;

  3. Đề xuất một số hàm ý chính sách nhằm hoàn thiện hệ thống đào tạo nguồn nhân lực, thích ứng với yêu cầu thị trường lao động trong bối cảnh mới, từ đó góp phần nâng cao hiệu quả hoạt động thị trường việc làm và hỗ trợ phát triển kinh tế - xã hội một cách bền vững.

1.3. Đối tượng và phạm vi nghiên cứu

Đối tượng nghiên cứu:

Đối tượng nghiên cứu của đề tài là thị trường việc làm trong bối cảnh chuyển đổi số và ứng dụng trí tuệ nhân tạo (AI), được thể hiện thông qua đặc điểm nghề nghiệp, ngành nghề, quy mô doanh nghiệp, vị trí địa lý, mức độ ứng dụng AI, rủi ro tự động hóa, khả năng làm việc từ xa và dự báo tăng trưởng việc làm. Dữ liệu phản ánh các yếu tố có thể tác động đến triển vọng nghề nghiệp và nhu cầu lao động trong thời kỳ hậu COVID-19, nơi mà công nghệ đóng vai trò ngày càng quan trọng trong định hình thị trường lao động.

Phạm vi nghiên cứu:

Về không gian, nghiên cứu này tập trung vào dữ liệu mô tả thị trường việc làm toàn cầu, bao gồm các thành phố và khu vực như Singapore, Dubai, Berlin, Tokyo,… phản ánh sự đa dạng về địa lý, văn hóa lao động và mức độ phát triển kinh tế. Về thời gian, dữ liệu phản ánh tình hình việc làm tại thời điểm gần đây, mang tính chất hiện tại và có thể suy luận cho giai đoạn ngắn hạn (2020-2023).

Về nội dung, nghiên cứu giới hạn trong việc phân tích các yếu tố sau:

Ngành nghề (Industry) và chức danh công việc (Job_Title): đại diện cho cầu lao động theo lĩnh vực;

Quy mô doanh nghiệp (Company_Size) và địa điểm làm việc (Location): thể hiện môi trường và điều kiện lao động;

Mức độ ứng dụng AI (AI_Adoption_Level) và rủi ro tự động hóa (Automation_Risk): phản ánh xu hướng công nghệ ảnh hưởng đến việc làm;

Khả năng làm việc từ xa (Remote_Friendly) và triển vọng tăng trưởng nghề nghiệp (Job_Growth_Projection): đại diện cho sự linh hoạt và tiềm năng của từng loại công việc.

Phạm vi phân tích chủ yếu tập trung vào việc xác định mối quan hệ giữa các yếu tố kể trên với triển vọng thị trường lao động và rủi ro nghề nghiệp trong bối cảnh hiện nay.

1.4. Kết cấu nghiên cứu

Ngoài phần phần mở đầu, kết luận, mục lục, danh mục chữ viết tắt, danh mục các hình và bảng, phụ lục và tài liệu tham khảo, nội dung chính của báo cáo được cấu trúc như sau:

Chương 1: Tổng quan nghiên cứu

Chương 2: Dữ liệu nghiên cứu

Chương 3: Kết quả nghiên cứu

Chương 4: Kết luận và hàm ý chính sách

CHƯƠNG II. DỮ LIỆU NGHIÊN CỨU

2.1 Đọc file dữ liệu vào R

d <- read_excel("C:/Users/Dell/OneDrive - UFM/Desktop/du_lieu_dieu_chinh_full.xlsx")
datatable(d) 

Bộ dữ liệu “ai_job_market_insights” bao gồm 10 biến và 469 quan sát, tập trung phản ánh tình hình thị trường việc làm trong bối cảnh trí tuệ nhân tạo (AI) đang được ứng dụng ngày càng rộng rãi. Dữ liệu bao gồm thông tin về chức danh công việc, ngành nghề, quy mô công ty, vị trí địa lý, mức độ áp dụng AI, rủi ro tự động hóa, khả năng làm việc từ xa và dự báo về xu hướng tăng trưởng của công việc đó.

Tên biến Dịch nghĩa Biểu hiện Công dụng trong nghiên cứu
Job_Title Chức danh công việc Cybersecurity Analyst, Sales Manager Phân loại công việc cụ thể – dùng để nhóm nghề có rủi ro cao/thấp hoặc triển vọng khác nhau
Industry Ngành nghề Technology, Retail, Education, Finance So sánh ảnh hưởng của lĩnh vực đến rủi ro tự động hóa và xu hướng tuyển dụng
Company_Size Quy mô doanh nghiệp Small, Medium, Large Đánh giá mối liên hệ giữa quy mô doanh nghiệp và triển vọng nghề nghiệp
Location Vị trí địa lý Singapore, Berlin, Tokyo Phân tích theo vùng – ảnh hưởng đến cơ hội việc làm và khả năng làm việc từ xa
AI_Adoption_Level Mức độ ứng dụng AI Low, Medium, High Đánh giá nguy cơ thay thế công việc bởi công nghệ, đặc biệt AI
Automation_Risk Rủi ro tự động hóa Low, High Thể hiện mức độ công việc dễ bị thay thế bởi máy móc
Remote_Friendly Khả năng làm việc từ xa Yes, No Đánh giá tính linh hoạt công việc – ảnh hưởng đến nhu cầu tuyển dụng, năng suất lao động
Job_Growth_Projection Dự báo tăng trưởng nghề nghiệp Growth, Decline Biến phụ thuộc chính – thể hiện xu hướng phát triển hoặc suy giảm nghề nghiệp
Salary_USD Mức lương (USD) 50000, 70000, 120000… Biến định lượng – dùng để so sánh mức độ hấp dẫn và phân tích chênh lệch lương theo nhóm
Required_Skills Kỹ năng yêu cầu Python, SQL, Communication,… Phân tích nhóm kỹ năng phổ biến theo công việc

2.2. Kiểm tra xem có giá trị thiếu (NA) trong bộ dữ liệu

# Kiểm tra giá trị thiếu (NA)
qual_cols <- c("Job_Title", "Industry", "Company_Size", "Location", 
               "AI_Adoption_Level", "Automation_Risk", "Remote_Friendly", "Job_Growth_Projection", "Salary_USD", "Required_Skills"  )

# Kiểm tra NA 
colSums(is.na(d[qual_cols]))
##             Job_Title              Industry          Company_Size 
##                     0                     0                     0 
##              Location     AI_Adoption_Level       Automation_Risk 
##                     0                     0                     0 
##       Remote_Friendly Job_Growth_Projection            Salary_USD 
##                     0                     0                     0 
##       Required_Skills 
##                     0
# Hàm tính mode
get_mode <- function(x) {
  ux <- unique(x[!is.na(x)])
  ux[which.max(tabulate(match(x, ux)))]
}

Kết quả trả về từ đoạn mã cho thấy rằng không có giá trị thiếu (NA) trong bất kỳ nào, bao gồm các biến như “Job_Title”, “Industry”, “Company_Size”, “Location”, “AI_Adoption_Level”, “Automation_Risk”, “Remote_Friendly”, “Job_Growth_Projection”. Tất cả các cột đều có tổng số NA bằng 0, điều này chứng tỏ dữ liệu đang đầy đủ và sạch, không cần thực hiện thao tác thay thế giá trị thiếu. Việc kiểm tra điều kiện trước khi thay thế là một thực hành tốt, giúp đảm bảo tính toàn vẹn và tránh thay đổi không cần thiết đối với dữ liệu.

2.3. Chuyển đổi các biến cần thiết sang kiểu factor

# Chuyển đổi các cột cần thiết sang factor nếu chưa phải
for (col in qual_cols) {
  if (!is.factor(d[[col]])) {
    d[[col]] <- as.factor(d[[col]])
  }
}

# Kiểm tra lại cấu trúc sau khi chuyển đổi
str(d)
## tibble [469 × 14] (S3: tbl_df/tbl/data.frame)
##  $ Job_Title            : Factor w/ 10 levels "AI Researcher",..: 2 7 1 8 10 6 8 3 9 9 ...
##  $ Industry             : Factor w/ 10 levels "Education","Energy",..: 6 1 8 6 1 5 6 9 3 8 ...
##  $ Company_Size         : Factor w/ 3 levels "Large","Medium",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ Location             : Factor w/ 10 levels "Berlin","Dubai",..: 5 10 7 4 10 1 6 1 8 8 ...
##  $ AI_Adoption_Level    : Factor w/ 3 levels "High","Low","Medium": 1 2 3 1 3 2 3 3 1 2 ...
##  $ Automation_Risk      : Factor w/ 3 levels "High","Low","Medium": 3 1 1 1 1 2 2 3 1 3 ...
##  $ Required_Skills      : Factor w/ 10 levels "Communication",..: 2 5 10 5 7 5 5 9 4 9 ...
##  $ Salary_USD           : Factor w/ 469 levels "100249.33032380774",..: 328 79 65 310 316 40 41 247 197 67 ...
##  $ Remote_Friendly      : Factor w/ 2 levels "No","Yes": 1 2 2 2 2 2 2 2 1 1 ...
##  $ Job_Growth_Projection: Factor w/ 3 levels "Decline","Growth",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ Projection_Group     : chr [1:469] "Growth" "Growth" "Growth" "Growth" ...
##  $ Size_Group           : chr [1:469] "Large" "Large" "Large" "Large" ...
##  $ AI_Level_Group       : chr [1:469] "High" "Not-High" "Not-High" "High" ...
##  $ Auto_Risk_Group      : chr [1:469] "Not-High" "High" "High" "High" ...

Dữ liệu gồm 500 quan sát với 10 biến, trong đó nhiều biến định tính đã được đưa về dạng factor. Việc chuyển các biến như “Job_Title”, “Industry”, “Company_Size”, “Location”, “AI_Adoption_Level”, “Automation_Risk”, “Remote_Friendly”, “Job_Growth_Projection” sang dạng factor là hoàn toàn hợp lý. Điều này giúp biểu diễn rõ ràng các biến phân loại, hỗ trợ hiệu quả cho các bước phân tích thống kê, mô hình hóa cũng như trực quan hóa dữ liệu. Ngoài ra, factor còn giúp tiết kiệm bộ nhớ hơn so với chuỗi ký tự khi xử lý các giá trị lặp lại.

2.4. Mô tả các biến nghiên cứu

Trong nghiên cứu này, biến phụ thuộc và các biến độc lập trọng tâm được xác định như sau:

Biến phụ thuộc (Y): Triển vọng tăng trưởng nghề nghiệp (Job_Growth_Projection): biến định tính Biểu hiện: growth (nghề nghiệp có triển vọng phát triển) hoặc decline (nghề nghiệp có xu hướng suy giảm).

4 biến độc lập chính:

  • Company_Size – Quy mô doanh nghiệp: Small (nhỏ), Medium (vừa), Large (lớn).

  • AI_Adoption_Level – Mức độ ứng dụng trí tuệ nhân tạo: Low (thấp), Medium (trung bình), High (cao).

  • Automation_Risk - Mức độ tự động hóa: Low (thấp), High (cao)

  • Salary_USD - Mức lương hàng năm quy đổi sang USD

4 biến này được lựa chọn vì mang ý nghĩa thực tiễn cao:

  • Company_Size phản ánh năng lực tổ chức và nhu cầu tuyển dụng khác nhau giữa các loại hình doanh nghiệp;

  • AI_Adoption_Level thể hiện mức độ ảnh hưởng của công nghệ đến khả năng thay thế hoặc phát triển của một vị trí việc làm;

  • Automation_Risk thể hiện mức độ công việc dễ bị thay thế bởi máy móc

  • Salary_USD thể hiện mức lương cho từng vị trí công việc

Việc tập trung phân tích 4 biến độc lập trong mối quan hệ với biến phụ thuộc Y sẽ giúp nghiên cứu đánh giá được tác động của từng yếu tố, xác định nhóm công việc có triển vọng cao và đưa ra các hàm ý chính sách về đào tạo, tuyển dụng và phát triển nghề nghiệp trong bối cảnh hiện đại.

CHƯƠNG III. KẾT QUẢ NGHIÊN CỨU

3.1. Phân tích mô tả biến phụ thuộc

3.1.1. Biến Job_Growth_Projection

Giải thích các biểu hiện trong biến

Job_Growth_Projection (Dự báo tăng trưởng công việc): Phản ánh xu hướng thay đổi số lượng việc làm trong tương lai:

Growth – Tăng trưởng (triển vọng công việc được dự báo sẽ tăng)

Decline – Suy giảm (công việc có xu hướng bị thu hẹp)

Stable - Ổn định

Tạo bảng tần số và tần suất

# Tạo bảng tần số
freq <- table(d$Job_Growth_Projection)

# Tính tần suất (tỷ lệ phần trăm)
prop <- prop.table(freq) * 100  # đổi sang %

# Gộp thành một bảng dữ liệu
growth_table <- data.frame(
  Gia_tri = names(freq),
  Tan_so = as.vector(freq),
  Ti_le = round(as.vector(prop), 2)
)

# Hiển thị bảng
print(growth_table)
##   Gia_tri Tan_so Ti_le
## 1 Decline    164 34.97
## 2  Growth    158 33.69
## 3  Stable    147 31.34

Biểu đồ

# Chuẩn bị dữ liệu
df <- as.data.frame(table(d$Job_Growth_Projection))
colnames(df) <- c("Projection", "Count")
df$Percentage <- round(df$Count / sum(df$Count) * 100, 1)

# Vẽ biểu đồ tròn bằng ggplot2
ggplot(df, aes(x = "", y = Count, fill = Projection)) +
  geom_bar(stat = "identity", width = 0.6, color = "black") +
  coord_polar("y") +
  geom_text(aes(label = paste0(Percentage, "%")), 
            position = position_stack(vjust = 0.5)) +
  labs(title = "Biểu đồ triển vọng việc làm trong tương lai") +
  theme_void()

Biểu đồ phản ánh rằng khả năng tăng trưởng công việc trong tương lai:

  • Growth (Tăng trưởng) chiếm 33,69% (158 quan sát) → cho thấy một phần ba công việc trong ngành hiện tại được dự báo có triển vọng phát triển. Điều này phản ánh sự mở rộng ở một số lĩnh vực như công nghệ, dữ liệu và các ngành ứng dụng AI, nơi nhu cầu nhân lực vẫn đang gia tăng.

  • Decline (Suy giảm) cũng chiếm 34.97% (164 quan sát) → đây là tỷ lệ tương đương với nhóm tăng trưởng, cho thấy thị trường lao động đang phân hóa rõ rệt: một số công việc bị thay thế, giảm nhu cầu do tự động hóa hoặc thay đổi mô hình kinh doanh.

  • Stable (Ổn định) có tỷ lệ thấp nhất là 31,34% (147 quan sát). Như vậy, nhóm thấp nhất chênh lệch 3,63% so với nhóm tăng trưởng.

Mặc dù mức chênh lệch này không lớn, nhưng vẫn phản ánh rằng nhóm công việc được dự báo giữ ổn định đang có xu hướng ít hơn so với các nhóm tăng trưởng hoặc suy giảm. Điều này cho thấy thị trường lao động hiện nay thiên về tính biến động, với nhiều ngành nghề hoặc đang phát triển mạnh, hoặc đang dần bị thu hẹp – và ít có công việc nào giữ nguyên trạng thái lâu dài.

3.2. Phân tích mô tả biến độc lập

3.2.1. Biến Company_Size

Giải thích các biểu hiện trong biến

Company_Size (Quy mô công ty): Biến này thể hiện quy mô tổ chức nơi công việc được tuyển dụng, chia thành:

Small – Doanh nghiệp nhỏ

Medium – Doanh nghiệp vừa

Large – Doanh nghiệp lớn

Bảng tần số và tần suất

# Tạo bảng tần số
freq <- table(d$Company_Size)

# Tính tần suất (tỷ lệ phần trăm)
prop <- prop.table(freq) * 100  # đổi sang %

# Gộp thành một bảng dữ liệu
Company_Size_table <- data.frame(
  Gia_tri = names(freq),
  Tan_so = as.vector(freq),
  Ti_le = round(as.vector(prop), 2)
)

# Hiển thị bảng
print(Company_Size_table)
##   Gia_tri Tan_so Ti_le
## 1   Large    158 33.69
## 2  Medium    154 32.84
## 3   Small    157 33.48

Biểu đồ

# Chuẩn bị dữ liệu
df <- as.data.frame(table(d$Company_Size))
colnames(df) <- c("Projection", "Count")
df$Percentage <- round(df$Count / sum(df$Count) * 100, 1)

# Vẽ biểu đồ tròn bằng ggplot2
ggplot(df, aes(x = "", y = Count, fill = Projection)) +
  geom_bar(stat = "identity", width = 0.6, color = "black") +
  scale_fill_brewer(palette = "Set3") +
  coord_polar("y") +
  geom_text(aes(label = paste0(Percentage, "%")), 
            position = position_stack(vjust = 0.5)) +
  labs(title = "Biểu đồ tròn thể hiện quy mô công ty") +
  theme_void()

Biểu đồ thể hiện quy mô công ty:

  • Small (doanh nghiệp nhỏ) chiếm 33,48% (157 quan sát) → cho thấy các công ty nhỏ hiện đang chiếm tỷ trọng lớn trong dữ liệu thị trường lao động hiện tại.

  • Large (doanh nghiệp lớn) chiếm 33,69% (158 quan sát) → nhóm có tỉ lệ cao nhất, tỷ lệ khá tương đương với nhóm doanh nghiệp nhỏ, cho thấy các tập đoàn và công ty quy mô lớn vẫn giữ vai trò quan trọng và hiện diện ổn định trong thị trường việc làm hiện nay.

  • Medium (doanh nghiệp vừa) chiếm 32,84% (154 quan sát) → là nhóm có tỷ lệ thấp nhất, thấp hơn nhóm cao nhất (Large) là 0.85% (4 quan sát), cho thấy quy mô doanh nghiệp không phải yếu tố phân hóa quá mạnh trong thị trường việc làm hiện nay.

3.2.2. Biến AI_Adoption_Level

Giải thích các biến trong biểu hiện

AI_Adoption_Level (Mức độ áp dụng AI): Phản ánh mức độ mà công việc sử dụng hoặc tích hợp công nghệ AI, được phân loại:

Low – Thấp

Medium – Trung bình

High – Cao

Bảng tần số và tần suất

# Tạo bảng tần số
freq <- table(d$AI_Adoption_Level)

# Tính tần suất (tỷ lệ phần trăm)
prop <- prop.table(freq) * 100  # đổi sang %

# Gộp thành một bảng dữ liệu
AI_Adoption_Level_table <- data.frame(
  Gia_tri = names(freq),
  Tan_so = as.vector(freq),
  Ti_le = round(as.vector(prop), 2)
)

# Hiển thị bảng
print(AI_Adoption_Level_table)
##   Gia_tri Tan_so Ti_le
## 1    High    136 29.00
## 2     Low    165 35.18
## 3  Medium    168 35.82

Biểu đồ

# Tạo bảng dữ liệu từ bảng tần số
df_ai <- as.data.frame(table(d$AI_Adoption_Level))
colnames(df_ai) <- c("AI_Level", "Frequency")

# Vẽ biểu đồ cột
ggplot(df_ai, aes(x = AI_Level, y = Frequency, fill = AI_Level)) +
  geom_bar(stat = "identity", width = 1, color = "black") +
  scale_fill_brewer(palette = "Set1") +
  geom_text(aes(label = Frequency), vjust = -0.5, size = 4) + 
  labs(title = "Biểu đồ tần số mức độ ứng dụng AI",
       x = "Mức độ ứng dụng AI",
       y = "Tần số") +
  theme_minimal()

  • Medium (mức độ ứng dụng AI trung bình) chiếm 35,82% (179 quan sát) → là nhóm có tỷ lệ cao nhất, cho thấy phần lớn các công việc hiện nay đang ở giai đoạn ứng dụng AI ở mức vừa phải.

  • Low (mức độ ứng dụng AI thấp) chiếm 35,18% (174 quan sát) → chỉ thấp hơn nhóm cao nhất 1% (5 quan sát), cho thấy một tỷ lệ lớn các công việc vẫn chưa áp dụng nhiều công nghệ AI.

  • High (mức độ ứng dụng AI cao) chiếm 29% (147 quan sát) → là nhóm có tỷ lệ thấp nhất. Mức chênh lệch giữa nhóm cao nhất (Medium) và thấp nhất (High) là 6,4% (32 quan sát), cho thấy ứng dụng AI ở mức cao vẫn còn hạn chế trong tổng thể thị trường việc làm.

3.2.3. Biến Automation_Risk

Giải thích các biểu hiện trong biến

Automation_Risk (Rủi ro tự động hóa): Mức độ mà công việc có thể bị thay thế bởi máy móc hoặc phần mềm tự động:

Low – Rủi ro thấp

Medium – Rủi ro trung bình

High – Rủi ro cao

Bảng tần số và tần suất

# Tạo bảng tần số
freq <- table(d$Automation_Risk)

# Tính tần suất (tỷ lệ phần trăm)
prop <- prop.table(freq) * 100  # đổi sang %

# Gộp thành một bảng dữ liệu
Automation_Risk_table <- data.frame(
  Gia_tri = names(freq),
  Tan_so = as.vector(freq),
  Ti_le = round(as.vector(prop), 2)
)

# Hiển thị bảng
print(Automation_Risk_table)
##   Gia_tri Tan_so Ti_le
## 1    High    159 33.90
## 2     Low    149 31.77
## 3  Medium    161 34.33

Biểu đồ

# Tạo bảng dữ liệu từ bảng tần số
df_au <- as.data.frame(table(d$Automation_Risk))
colnames(df_au) <- c("Automation_Risk", "Frequency")

# Vẽ biểu đồ cột
ggplot(df_au, aes(x = Automation_Risk, y = Frequency, fill = Automation_Risk)) +
  geom_bar(stat = "identity", width = 1, color = "black") +
  scale_fill_brewer(palette = "Set3") +
  geom_text(aes(label = Frequency), vjust = -0.5, size = 4) + 
  labs(title = "Biểu đồ tần số mức độ công việc bị thay thế bởi máy móc",
       x = "Mức độ",
       y = "Tần số") +
  theme_minimal()

  • Medium (rủi ro tự động hóa trung bình) chiếm 34,6% (173 quan sát) → là nhóm có tỷ lệ cao nhất, cho thấy phần lớn các vị trí công việc trong tập dữ liệu hiện đang đứng giữa ranh giới bị thay thế và duy trì.

  • High (rủi ro cao) chiếm 33,8% (169 quan sát) → là nhóm có tỷ lệ gần sát với nhóm cao nhất (Medium), chênh lệch 0,8% (4 quan sát). Điều này cho thấy một lượng lớn các vị trí đang đứng trước nguy cơ bị thay thế bởi công nghệ, đặc biệt là trong các ngành sử dụng quy trình lặp đi lặp lại, dễ tự động hóa bằng AI hoặc máy móc.

  • Low (rủi ro thấp) chiếm 31,6% (158 quan sát) → là nhóm có tỷ lệ thấp nhất. Chênh lệch giữa nhóm có tỷ lệ cao nhất (Medium) và thấp nhất (Low) là 3%, không quá lớn nhưng vẫn phản ánh rằng chỉ một phần ba các vị trí trong dữ liệu được đánh giá là ít bị ảnh hưởng bởi quá trình tự động hóa.

3.2.4. Biến Salary_USD

Salary_USD là biến định lượng phản ánh giá trị thị trường của từng loại công việc trong dữ liệu. Nó đóng vai trò then chốt trong việc phân tích sự khác biệt thu nhập, tương quan với rủi ro công nghệ, và dự báo xu hướng việc làm có thu nhập cao trong tương lai.

Thống kê mô tả

# Chuyển Salary_USD từ factor thành numeric an toàn
d$Salary_USD <- as.numeric(as.character(d$Salary_USD))
# Thống kê mô tả cơ bản
summary_stats <- summary(d$Salary_USD)

# Tính thêm độ lệch chuẩn và khoảng (range)
sd_val <- sd(d$Salary_USD, na.rm = TRUE)
range_val <- max(d$Salary_USD, na.rm = TRUE) - min(d$Salary_USD, na.rm = TRUE)

# Tạo bảng thống kê đầy đủ
salary_summary <- data.frame(
  Thong_so = c("Số quan sát", "Trung bình", "Độ lệch chuẩn", 
               "Giá trị nhỏ nhất", "Phân vị 25%", "Trung vị (50%)", 
               "Phân vị 75%", "Giá trị lớn nhất", "Khoảng (max - min)"),
  Gia_tri = c(length(d$Salary_USD),
              mean(d$Salary_USD, na.rm = TRUE),
              sd_val,
              min(d$Salary_USD, na.rm = TRUE),
              quantile(d$Salary_USD, 0.25, na.rm = TRUE),
              median(d$Salary_USD, na.rm = TRUE),
              quantile(d$Salary_USD, 0.75, na.rm = TRUE),
              max(d$Salary_USD, na.rm = TRUE),
              range_val)
)

# Xem bảng thống kê
print(salary_summary)
##             Thong_so   Gia_tri
## 1        Số quan sát    469.00
## 2         Trung bình  91261.40
## 3      Độ lệch chuẩn  20476.94
## 4   Giá trị nhỏ nhất  31969.53
## 5        Phân vị 25%  78548.27
## 6     Trung vị (50%)  91646.60
## 7        Phân vị 75% 103952.47
## 8   Giá trị lớn nhất 155209.82
## 9 Khoảng (max - min) 123240.30

Biến Salary_USD thể hiện mức lương (USD) của các vị trí công việc trong bộ dữ liệu, với 500 quan sát.

Mức lương trung bình là 91.222 USD, trong khi trung vị (50%) là 91.998 USD → Hai giá trị này rất gần nhau, cho thấy phân phối lương gần như đối xứng, không bị lệch mạnh sang trái hoặc phải.

Độ lệch chuẩn là 20.504 USD → phản ánh mức độ phân tán tương đối lớn quanh giá trị trung bình. Lương giữa các công việc có sự dao động đáng kể, chứ không tập trung quanh một mức nhất định.

Khoảng lương (max – min) là 123.240 USD, từ 31.970 USD (thấp nhất) đến 155.210 USD (cao nhất) → cho thấy khoảng cách thu nhập giữa công việc thấp nhất và cao nhất là rất lớn, phản ánh sự phân hóa rõ nét trong thị trường lao động.

Phân vị 25% là 78.511 USD và phân vị 75% là 103.971 USD → tức là 50% giữa các vị trí công việc có mức lương nằm trong khoảng từ 78.500 đến 104.000 USD, một mức khá rộng. Điều này chỉ ra sự khác biệt lương ngay cả trong nhóm thu nhập trung bình.

3.3. Ước lượng khoảng tin cậy

3.3.1. Company_Size – Hạng mục quan tâm: “Small” – H0: tỷ lệ = 0.5**

# Đếm số lượng công ty có quy mô nhỏ 
n_small <- sum(d$Company_Size == "Small")

#Tổng số quan sát
n_total <- nrow(d)

#Tính khoảng tin cậy 95% cho tỷ lệ quy mô nhỏ 
prop.test(n_small, n_total, correct = FALSE) 
## 
##  1-sample proportions test without continuity correction
## 
## data:  n_small out of n_total, null probability 0.5
## X-squared = 51.226, df = 1, p-value = 8.232e-13
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
##  0.2935413 0.3786533
## sample estimates:
##         p 
## 0.3347548

Kiểm định giả thuyết

Đặt giả thuyết:

  • \(H_0\): Tỷ lệ công ty quy mô nhỏ = 0.5

  • \(H_1\): Tỷ lệ công ty quy mô nhỏ ≠ 0.5

Ý nghĩa: Với độ tin cậy 95%, ta có thể kết luận rằng tỷ lệ quy mô nhỏ trong tổng số quy mô rơi vào khoảng từ 30,17% đến 38,46%.

3.3.2. Automation_Risk – Hạng mục quan tâm: “High” – H0: tỷ lệ = 0.5

# Đếm số lượng mức độ rủi ro tự động hóa  
n_high <- sum(d$Automation_Risk == "High")

#Tổng số quan sát
n_total <- nrow(d)

#Tính khoảng tin cậy 95% cho tỷ lệ quy mô nhỏ 
prop.test(n_high, n_total, correct = FALSE) 
## 
##  1-sample proportions test without continuity correction
## 
## data:  n_high out of n_total, null probability 0.5
## X-squared = 48.616, df = 1, p-value = 3.113e-12
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
##  0.2976395 0.3830145
## sample estimates:
##         p 
## 0.3390192

Ý nghĩa: Với độ tin cậy 95%, ta có thể kết luận rằng mức độ rủi ro cao trong tổng số mức độ rủi ro tự động hóa rơi vào khoảng từ 29,79% đến 38,05%.

Kiểm định giả thuyết

Đặt giả thuyết:

  • \(H_0\): Tỷ lệ mức độ rủi ro cao = 0.5

  • \(H_1\): Tỷ lệ mức độ rủi ro cao ≠ 0.5

prop.test(n_high, n_total, p=0.6, correct = FALSE)  
## 
##  1-sample proportions test without continuity correction
## 
## data:  n_high out of n_total, null probability 0.6
## X-squared = 133.1, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.6
## 95 percent confidence interval:
##  0.2976395 0.3830145
## sample estimates:
##         p 
## 0.3390192

Kết quả kiểm định cho thấy giá trị p-value: < 2.2e-16 (rất nhỏ, gần bằng 0).Với mức ý nghĩa 5%, do p-value rất nhỏ (< 0.05), nên ta bác bỏ giả thuyết \(H_0\). Điều này cho thấy tỷ lệ thực sự khác biệt đáng kể so với giá trị giả định là 0.5.

3.4. Phân tích mối quan hệ giữa biến độc lập và phụ thuộc

3.4.1. Biến Job_Growth_Projection và Company_Size

Bảng tần số và tần suất chéo

# Bảng tần số chéo
freq_table1 <- table(d$Job_Growth_Projection, d$Company_Size)
print(freq_table1)
##          
##           Large Medium Small
##   Decline    46     56    62
##   Growth     59     40    59
##   Stable     53     58    36
# Tính tần suất theo hàng (% trong mỗi Job_Growth_Projection)
prop_table_row1 <- prop.table(freq_table1, margin = 1) * 100
round(prop_table_row1, 2)
##          
##           Large Medium Small
##   Decline 28.05  34.15 37.80
##   Growth  37.34  25.32 37.34
##   Stable  36.05  39.46 24.49

Biểu đồ

# Tính trước số lượng từng nhóm
plot_data <- d %>%
  group_by(Job_Growth_Projection, Company_Size) %>%
  summarise(Freq = n(), .groups = 'drop')

# Vẽ biểu đồ có số
ggplot(plot_data, aes(x = Job_Growth_Projection, y = Freq, fill = Company_Size)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.9), color = "black") +
  geom_text(aes(label = Freq), 
            position = position_dodge(width = 0.9), 
            vjust = -0.2, size = 3) +
  scale_fill_brewer(palette = "Set3") +
  labs(
    title = "Biểu đồ cột nhóm triển vọng công việc và quy mô công ty",
    y = "Số lượng",
    fill = "Quy mô công ty"
  ) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

  • Nhóm công ty Small chiếm số lượng cao nhất ở xu hướng Decline (65 quan sát) và Growth (63 quan sát), trong khi Stable chỉ đạt 43. Điều này cho thấy các doanh nghiệp nhỏ thường có xu hướng biến động mạnh, dễ bị ảnh hưởng bởi thị trường lao động và linh hoạt trong việc tăng hoặc giảm nhu cầu nhân sự.

  • Nhóm Medium có sự phân bố tương đối đồng đều ở cả ba xu hướng: Decline (57), Growth (47), và Stable (59), phản ánh đặc điểm ổn định hơn của các doanh nghiệp vừa trong việc duy trì nguồn lực và thích nghi với môi trường việc làm hiện tại.

  • Nhóm Large nổi bật ở hai xu hướng Growth (59) và Stable (60), với Decline chỉ ở mức 47. Điều này cho thấy các tập đoàn hoặc công ty lớn có khả năng duy trì và mở rộng nhân sự, ít rơi vào tình trạng cắt giảm nhân lực.

⟶ Nhìn chung, quy mô công ty càng lớn thì càng có xu hướng ổn định hoặc mở rộng nguồn nhân lực, trong khi các doanh nghiệp nhỏ lại dễ chịu ảnh hưởng từ sự biến động và bất ổn của thị trường lao động.

3.4.2. Biến Job_Growth_Projection và AI_Adoption_Level

Bảng tần số và tần suất chéo

# Bảng tần số chéo
freq_table2 <- table(d$Job_Growth_Projection, d$AI_Adoption_Level)
print(freq_table2)
##          
##           High Low Medium
##   Decline   51  52     61
##   Growth    46  57     55
##   Stable    39  56     52
# Tính tần suất theo hàng (% trong mỗi AI_Adoption_Level)
prop_table_row2 <- prop.table(freq_table2, margin = 1) * 100
round(prop_table_row2, 2)
##          
##            High   Low Medium
##   Decline 31.10 31.71  37.20
##   Growth  29.11 36.08  34.81
##   Stable  26.53 38.10  35.37

Biểu đồ

# Tính trước số lượng từng nhóm
plot_data <- d %>%
  group_by(Job_Growth_Projection, AI_Adoption_Level) %>%
  summarise(Freq = n(), .groups = 'drop')

# Vẽ biểu đồ có số
ggplot(plot_data, aes(x = Job_Growth_Projection, y = Freq, fill = AI_Adoption_Level)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.9), color = "black") +
  geom_text(aes(label = Freq), 
            position = position_dodge(width = 0.9), 
            vjust = -0.2, size = 3) +
  scale_fill_brewer(palette = "Set2") +
  labs(
    title = "Biểu đồ cột nhóm triển vọng công việc và mức độ áp dụng AI trong công việc",
    y = "Số lượng",
    fill = "Mức độ"
  ) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Nhóm công việc có triển vọng Decline tập trung chủ yếu ở mức áp dụng AI Medium (62 quan sát), theo sau là High (55 quan sát) và Low (52 quan sát), cho thấy ngay cả trong bối cảnh giảm sút, các công việc vẫn duy trì mức áp dụng AI trung bình hoặc cao, có thể do nhu cầu tự động hóa để tiết kiệm chi phí.

Nhóm có xu hướng Growth cũng ghi nhận số lượng cao nhất ở AI Medium (62 quan sát) và Low (61 quan sát), trong khi mức High chỉ đạt 46. Điều này phản ánh rằng các công việc đang phát triển thường ứng dụng AI ở mức vừa phải, phù hợp với xu thế chuyển đổi số từng bước của doanh nghiệp.

Đối với nhóm công việc Stable, mức áp dụng AI Low (61 quan sát) và Medium (55 quan sát) đều ở mức cao, còn High chỉ chiếm 46 quan sát. Điều này cho thấy các công việc ổn định hiện tại vẫn chủ yếu hoạt động trong môi trường có mức ứng dụng AI chưa cao.

⟶ Nhìn chung, các công việc có triển vọng tăng trưởng hoặc ổn định vẫn chủ yếu đi kèm với mức độ áp dụng AI từ thấp đến trung bình, trong khi mức AI cao tuy hiện diện ở cả ba nhóm nhưng chưa phổ biến, phản ánh thách thức về nhân lực và hạ tầng để triển khai AI toàn diện trong công việc.

3.4.3. Biến Job_Growth_Projection và Automation_Risk

Bảng tần số và tần suất chéo

# Bảng tần số chéo
freq_table3 <- table(d$Job_Growth_Projection, d$Automation_Risk)
print(freq_table3)
##          
##           High Low Medium
##   Decline   54  55     55
##   Growth    61  45     52
##   Stable    44  49     54
# Tính tần suất theo hàng (% trong mỗi Automation_Risk)
prop_table_row3 <- prop.table(freq_table3, margin = 1) * 100
round(prop_table_row3, 2)
##          
##            High   Low Medium
##   Decline 32.93 33.54  33.54
##   Growth  38.61 28.48  32.91
##   Stable  29.93 33.33  36.73

Biểu đồ

# Tính trước số lượng từng nhóm
plot_data <- d %>%
  group_by(Job_Growth_Projection, Automation_Risk) %>%
  summarise(Freq = n(), .groups = 'drop')

# Vẽ biểu đồ có số
ggplot(plot_data, aes(x = Job_Growth_Projection, y = Freq, fill = Automation_Risk)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.9), color = "black") +
  geom_text(aes(label = Freq), 
            position = position_dodge(width = 0.9), 
            vjust = -0.2, size = 3) +
  scale_fill_brewer(palette = "Set3") +
  labs(
    title = "Biểu đồ cột nhóm triển vọng công việc và mức độ bị thay thế bởi máy móc trong công việc",
    y = "Số lượng",
    fill = "Mức độ"
  ) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Nhóm công việc có xu hướng Decline tập trung chủ yếu ở mức độ Automation Risk Low (58 quan sát), theo sau là Medium (56 quan sát) và High (55 quan sát). Điều này cho thấy ngay cả những công việc đang giảm sút vẫn không nhất thiết có rủi ro bị thay thế bởi máy móc cao

Nhóm công việc có triển vọng Growth chiếm số lượng lớn nhất ở Automation Risk Medium (63 quan sát), tiếp theo là High (56 quan sát) và thấp nhất là Low (50 quan sát). Điều này phản ánh rằng nhiều công việc đang phát triển hiện nay có mức rủi ro trung bình đến cao trong việc bị thay thế bởi máy móc

Ở nhóm Stable, mức Medium cũng chiếm ưu thế với 61 quan sát, trong khi High (51 quan sát) và Low (50 quan sát) đều ở mức xấp xỉ nhau. Điều này cho thấy ngay cả những công việc ổn định cũng không hoàn toàn an toàn trước nguy cơ bị thay thế, đặc biệt là với các vị trí có yếu tố lặp lại hoặc có thể tự động hóa dễ dàng.

Nhìn chung, mức độ bị thay thế bởi máy móc ở các công việc hiện nay chủ yếu tập trung ở mức trung bình, bất kể xu hướng tăng, giảm hay ổn định. Điều này phản ánh thực tế rằng tự động hóa đang tác động đa chiều lên thị trường lao động, không chỉ giới hạn ở những ngành suy giảm mà còn lan rộng sang các lĩnh vực đang phát triển.

3.5. Phân tích Risk Ratio và khoảng ước lượng cho Risk Ratio

3.5.1. Job_Growth_Projection và Company_Size

Biến phụ thuộc (Dependent variable): Job_Growth_Projection – Triển vọng công việc

Growth (tăng trưởng cao): gồm mức Growth (Tăng trưởng).

Non-Growth (tăng trưởng không cao): gồm mức Decline (Suy giảm) – đại diện cho nhóm công việc có xu hướng bị thu hẹp và và Stable (Ổn định) – đại diện cho nhóm công việc duy trì được vị thế.

Biến độc lập (Independent variable): Company_Size – Quy mô công ty

Large (Công ty lớn): giữ nguyên mức Large.

Not-Large (Công ty không lớn): gộp hai mức Medium và Small thành một nhóm.

Bài toán kiểm định

\(H_0\): Risk Ratio = 1 (Không có sự khác biệt về quy mô công ty giữa nhóm công việc có triển vọng tích cực và nhóm công việc có triển vọng cao)

\(H_1\): Risk Ratio ≠ 1 (Có sự khác biệt về quy mô công ty giữa nhóm công việc có triển vọng tích cực và nhóm công việc có triển vọng không cao).

# Ma trận 2x2 tương ứng:
tbl_proj_company_size <- matrix(c(
 130, 70,     # Growth: Large, Not-Large
  50, 219     # Non-Growth: Large, Not-Large
),
nrow = 2,
byrow = TRUE,
dimnames = list(
  Projection = c("Growth", "Non-Growth"),
  CompanySize = c("Large", "Not-Large")
))
riskratio(tbl_proj_company_size)
## $data
##             CompanySize
## Projection   Large Not-Large Total
##   Growth       130        70   200
##   Non-Growth    50       219   269
##   Total        180       289   469
## 
## $measure
##             risk ratio with 95% C.I.
## Projection   estimate   lower    upper
##   Growth     1.000000      NA       NA
##   Non-Growth 2.326075 1.90956 2.833442
## 
## $p.value
##             two-sided
## Projection   midp.exact fisher.exact   chi.square
##   Growth             NA           NA           NA
##   Non-Growth          0 6.232737e-25 1.583234e-24
## 
## $correction
## [1] FALSE
## 
## attr(,"method")
## [1] "Unconditional MLE & normal approximation (Wald) CI"

Nhận xét

Risk Ratio cho nhóm Non-Growth Job Projection (triển vọng không cao, gồm Stable và Decline) giữa công ty Large và Not-Large là 2.32.

Ta có p-value = 0 < mức ý nghĩa (α = 5%), nên đủ cơ sở để bác bỏ giả thuyết \(H_0\).

Khoảng tin cậy 95% cho Risk Ratio là [1.9; 2.83].

→ Điều này cho thấy có sự khác biệt có ý nghĩa thống kê về khả năng một công việc thuộc nhóm có triển vọng không cao giữa nhóm làm việc ở công ty lớn và công ty không lớn.

Cụ thể: Người làm việc tại công ty không lớn (Not-Large) có khả năng rơi vào nhóm công việc không có triển vọng cao gấp 2.32 lần so với người làm việc tại công ty lớn (Large).

Vì khoảng tin cậy không chứa 1 và p-value rất nhỏ, kết quả này là rất có ý nghĩa thống kê, cho thấy có mối liên hệ rõ rệt giữa quy mô công ty và triển vọng việc làm.

Odds Ratio và khoảng ước lượng Odds Ratio

# Tính Odds Ratio
or1_result <- oddsratio(tbl_proj_company_size)
print(or1_result)
## $data
##             CompanySize
## Projection   Large Not-Large Total
##   Growth       130        70   200
##   Non-Growth    50       219   269
##   Total        180       289   469
## 
## $measure
##             odds ratio with 95% C.I.
## Projection   estimate    lower    upper
##   Growth     1.000000       NA       NA
##   Non-Growth 8.075648 5.323228 12.42849
## 
## $p.value
##             two-sided
## Projection   midp.exact fisher.exact   chi.square
##   Growth             NA           NA           NA
##   Non-Growth          0 6.232737e-25 1.583234e-24
## 
## $correction
## [1] FALSE
## 
## attr(,"method")
## [1] "median-unbiased estimate & mid-p exact CI"

Nhận xét:

Giả thuyết \(H_0\): OR = 1 (Không có sự khác biệt về khả năng tăng trưởng công việc cao giữa nhóm công ty có quy mô lớn và công ty không lớn).

Giả thuyết \(H_1\): OR ≠ 1 (Có sự khác biệt về khả năng tăng trưởng công việc cao giữa nhóm công ty có quy mô lớn và công ty không lớn).

Odds Ratio cho nhóm công việc Non-Growth khi so sánh công ty Not-Large với Large là 8.08.

p-value = 0 (ở tất cả các kiểm định: Mid-p exact, Fisher exact, và Chi-square) → rất nhỏ hơn mức ý nghĩa α = 5%.

Khoảng tin cậy 95% cho Odds Ratio: [5.32; 12.43] (không chứa giá trị 1).

Vì p-value < 0.05, ta bác bỏ giả thuyết \(H_0\). Do đó, có sự khác biệt có ý nghĩa thống kê về khả năng thuộc nhóm tăng trưởng cao giữa các công ty Large và Not-Large.

Kết quả Odds Ratio cho thấy các công việc tại công ty Not-Large có khả năng rơi vào nhóm không tăng trưởng (Non-Growth) cao hơn khoảng 8.08 lần so với công việc tại công ty Large. Điều này phản ánh mối liên hệ giữa quy mô tổ chức và triển vọng phát triển nghề nghiệp, đồng thời gợi ý rằng quy mô doanh nghiệp có thể là một yếu tố quan trọng trong việc đảm bảo ổn định và cơ hội nghề nghiệp trong tương lai.

3.5.2. Job_Growth_Projection và AI_Adoption_Level

Biến phụ thuộc (Dependent variable): Job_Growth_Projection – Triển vọng công việc

Growth (tăng trưởng cao): gồm mức Growth (Tăng trưởng).

Non-Growth (tăng trưởng không cao): gồm mức Decline (Suy giảm) – đại diện cho nhóm công việc có xu hướng bị thu hẹp và và Stable (Ổn định) – đại diện cho nhóm công việc duy trì được vị thế.

Biến độc lập (Independent variable): AI_Adoption_Level – Mức độ áp dụng AI

High: mức áp dụng AI cao

Not-High: gộp hai mức Medium và Low (áp dụng AI trung bình hoặc thấp)

Bài toán kiểm định

\(H_0\): Risk Ratio = 1 (Không có sự khác biệt về mức độ áp dụng AI giữa nhóm công việc có triển vọng cao và nhóm công việc không có triển vọng cao)

\(H_1\): Risk Ratio ≠ 1 (Có sự khác biệt về mức độ áp dụng AI giữa nhóm công việc có triển vọng cao và nhóm công việc không có triển vọng cao)

tbl_proj_ai_matrix <- matrix(c(
  100, 50,   # Growth: High, Not-High
  60, 259    # Non-Growth: High, Not-High
), 
nrow = 2,
byrow = TRUE,
dimnames = list(
  Projection = c("Growth", "Non-Growth"),
  AI_Level = c("High", "Not-High")
))

# Tính Risk Ratio
library(epitools)
riskratio(tbl_proj_ai_matrix)
## $data
##             AI_Level
## Projection   High Not-High Total
##   Growth      100       50   150
##   Non-Growth   60      259   319
##   Total       160      309   469
## 
## $measure
##             risk ratio with 95% C.I.
## Projection   estimate    lower   upper
##   Growth     1.000000       NA      NA
##   Non-Growth 2.435737 1.930638 3.07298
## 
## $p.value
##             two-sided
## Projection   midp.exact fisher.exact   chi.square
##   Growth             NA           NA           NA
##   Non-Growth          0 1.148497e-23 2.060152e-24
## 
## $correction
## [1] FALSE
## 
## attr(,"method")
## [1] "Unconditional MLE & normal approximation (Wald) CI"

Risk Ratio (RR) cho nhóm Non-Growth Job Projection giữa mức AI_Adoption_Level: Not-High so với High là 2.44, với khoảng tin cậy 95% là [1.93; 3.07].

Ta có p-value = 0.0000000000000000000000000886 (≈ 8.86e-25) < 0.05, cho thấy có ý nghĩa thống kê ở mức ý nghĩa 5%.

Công việc thuộc nhóm có mức độ áp dụng AI không cao (Not-High) có nguy cơ rơi vào nhóm có triển vọng thấp (Non-Growth) cao hơn gấp 2.44 lần so với nhóm có mức áp dụng AI cao (High).

Khoảng tin cậy không chứa giá trị 1 và p-value rất nhỏ → bác bỏ giả thuyết \(H_0\) (không có sự khác biệt).

Như vậy, có bằng chứng thống kê cho thấy mối liên hệ giữa mức độ áp dụng AI và triển vọng tăng trưởng của công

Odds Ratio và khoảng ước lượng Odds Ratio

# Tính Odds Ratio
or_result <- oddsratio(tbl_proj_ai_matrix)
print(or_result)
## $data
##             AI_Level
## Projection   High Not-High Total
##   Growth      100       50   150
##   Non-Growth   60      259   319
##   Total       160      309   469
## 
## $measure
##             odds ratio with 95% C.I.
## Projection   estimate    lower   upper
##   Growth     1.000000       NA      NA
##   Non-Growth 8.567438 5.546855 13.4221
## 
## $p.value
##             two-sided
## Projection   midp.exact fisher.exact   chi.square
##   Growth             NA           NA           NA
##   Non-Growth          0 1.148497e-23 2.060152e-24
## 
## $correction
## [1] FALSE
## 
## attr(,"method")
## [1] "median-unbiased estimate & mid-p exact CI"

Giả thuyết \(H_0\): OR = 1 (Không có sự khác biệt về khả năng tăng trưởng cao giữa hai mức độ AI Adoption Level (High vs Not-High).

Giả thuyết \(H_1\): OR ≠ 1 (Có sự khác biệt về khả năng tăng trưởng cao giữa hai mức độ ứng dụng AI).

Odds Ratio cho nhóm công việc Non-Growth ở mức AI Adoption Level: High vs Not-High là 8.57.

p-value = 0 (từ các kiểm định Mid-p exact, Fisher exact, Chi-square) → rất nhỏ hơn mức ý nghĩa α = 5%.

Khoảng tin cậy 95% cho Odds Ratio: [5.55; 13.42] (không chứa giá trị 1).

→ Với p-value < 0.05, ta bác bỏ giả thuyết \(H_0\). Như vậy, có sự khác biệt có ý nghĩa thống kê về khả năng thuộc nhóm tăng trưởng cao giữa hai mức độ AI Adoption Level.

Công việc có mức độ ứng dụng AI cao có nguy cơ rơi vào nhóm không có triển vọng cao (Non-Growth) cao hơn khoảng 8.57 lần so với các công việc có mức độ ứng dụng AI thấp.

Nói cách khác, AI Adoption cao không đồng nghĩa với việc công việc có triển vọng tăng trưởng cao – mà ngược lại, những công việc dễ được tự động hóa có xu hướng ít có triển vọng tăng trưởng hơn trong tương lai.

3.5.3. Job_Growth_Projection và Automation_Risk

Job_Growth_Projection – Triển vọng công việc

Growth (tăng trưởng cao): gồm mức Growth – đại diện cho nhóm công việc có xu hướng mở rộng, phát triển.

Non-Growth (tăng trưởng không cao): gồm hai mức:

Stable (ổn định) – duy trì vị thế trên thị trường,

Decline (suy giảm) – xu hướng thu hẹp, giảm nhu cầu tuyển dụng.

Biến độc lập (Independent variable): Automation_Risk – Rủi ro tự động hóa

High: công việc có nguy cơ cao bị thay thế bởi công nghệ hoặc tự động hóa.

Not-High: gộp hai mức Medium và Low, đại diện cho nhóm công việc có rủi ro trung bình hoặc thấp trước làn sóng tự động hóa.

Bài toán kiểm định

\(H_0\): Risk Ratio = 1 (Không có sự khác biệt về mức độ rủi ro tự động hóa giữa nhóm công việc có triển vọng cao và nhóm công việc không có triển vọng cao).

\(H_1\): Risk Ratio ≠ 1 (Có sự khác biệt về mức độ rủi ro tự động hóa giữa nhóm công việc có triển vọng cao và nhóm công việc không có triển vọng cao).

tbl_proj_risk_matrix <- matrix(c(
  60, 100,   # Growth: High, Not-High
  150, 159   # Non-Growth: High, Not-High
),
nrow = 2,
byrow = TRUE,
dimnames = list(
  Projection = c("Growth", "Non-Growth"),
  Risk = c("High", "Not-High")
))
riskratio(tbl_proj_risk_matrix)
## $data
##             Risk
## Projection   High Not-High Total
##   Growth       60      100   160
##   Non-Growth  150      159   309
##   Total       210      259   469
## 
## $measure
##             risk ratio with 95% C.I.
## Projection   estimate     lower    upper
##   Growth     1.000000        NA       NA
##   Non-Growth 0.823301 0.7004078 0.967757
## 
## $p.value
##             two-sided
## Projection   midp.exact fisher.exact chi.square
##   Growth             NA           NA         NA
##   Non-Growth 0.02282064   0.02446675 0.02259354
## 
## $correction
## [1] FALSE
## 
## attr(,"method")
## [1] "Unconditional MLE & normal approximation (Wald) CI"

Risk Ratio cho nhóm Non-Growth Job Projection (tức nhóm công việc không có triển vọng cao – gồm Stable và Decline) giữa mức Automation_Risk High và Not-High là 0.823.

Ta có p-value = 0.0228 < mức ý nghĩa α = 5%, nên có đủ cơ sở để bác bỏ giả thuyết \(H_0\)

Khoảng tin cậy 95% cho Risk Ratio là [0.70; 0.97].

→ Điều này cho thấy có sự khác biệt có ý nghĩa thống kê về khả năng một công việc thuộc nhóm không có triển vọng cao giữa hai nhóm công việc có rủi ro tự động hóa cao và rủi ro không cao (Not-High).

Cụ thể: Nhóm công việc có rủi ro tự động hóa cao có khả năng rơi vào nhóm công việc không có triển vọng cao ít hơn khoảng 0.823 lần so với nhóm công việc có mức rủi ro tự động hóa trung bình hoặc thấp.

Do khoảng tin cậy không chứa giá trị 1 và p-value < 0.05, kết quả này cho thấy mối liên hệ thống kê có ý nghĩa giữa rủi ro tự động hóa và triển vọng việc làm.

Odds ratio và khoảng ước lượng Odds Ratio

# Tính Odds Ratio
or_result <- oddsratio(tbl_proj_risk_matrix)
print(or_result)
## $data
##             Risk
## Projection   High Not-High Total
##   Growth       60      100   160
##   Non-Growth  150      159   309
##   Total       210      259   469
## 
## $measure
##             odds ratio with 95% C.I.
## Projection    estimate     lower     upper
##   Growth     1.0000000        NA        NA
##   Non-Growth 0.6370715 0.4295237 0.9395417
## 
## $p.value
##             two-sided
## Projection   midp.exact fisher.exact chi.square
##   Growth             NA           NA         NA
##   Non-Growth 0.02282064   0.02446675 0.02259354
## 
## $correction
## [1] FALSE
## 
## attr(,"method")
## [1] "median-unbiased estimate & mid-p exact CI"

Bài toán kiểm định:

Giả thuyết \(H_0\): OR = 1 (Không có sự khác biệt về khả năng tăng trưởng cao giữa hai nhóm mức độ rủi ro High và Not-High).

Giả thuyết \(H_1\): OR ≠ 1 (Có sự khác biệt về khả năng tăng trưởng giữa hai nhóm mức độ rủi ro).

Nhận xét:

Odds Ratio cho nhóm công việc Non-Growth khi so sánh High Risk với Not-High Risk là 0.64.

p-value = 0.0228 (Mid-p exact), 0.0245 (Fisher’s exact), và 0.0226 (Chi-square) → đều nhỏ hơn mức ý nghĩa α = 0.05.

Khoảng tin cậy 95% cho Odds Ratio: [0.43; 0.94] (không chứa giá trị 1).

→ Vì p-value < 0.05, ta bác bỏ giả thuyết \(H_0\). Do đó, có sự khác biệt có ý nghĩa thống kê về khả năng thuộc nhóm tăng trưởng cao giữa hai mức độ rủi ro.

Kết quả Odds Ratio cho thấy các công việc có mức High Risk có khả năng rơi vào nhóm Non-Growth thấp hơn khoảng 0.64 lần so với các công việc có mức Not-High Risk.

Nói cách khác, công việc có mức rủi ro cao lại có liên hệ với khả năng tăng trưởng cao hơn, ngụ ý rằng một số công việc tuy rủi ro nhưng lại có cơ hội phát triển cao hơn trong thị trường việc làm liên quan đến AI.

3.6. Mô hình hồi quy đơn

3.6.1. Mô hình Logit biến Salary_USD

Vì các biến độc lập trong nghiên cứu chủ yếu là biến định tính (như AI_Adoption_Level, Company_Size, Risk, v.v.), nên việc thực hiện hồi quy đơn biến với từng biến này thực chất chỉ tương đương với việc so sánh xác suất xảy ra sự kiện giữa các nhóm – tương tự như đã phân tích trong phần thống kê mô tả và phân tích bảng chéo với kiểm định Odds Ratio.

Do đó, tôi quyết định không thực hiện hồi quy đơn biến với các biến định tính này.

Thay vào đó, tôi chỉ thực hiện hồi quy đơn biến với biến định lượng Salary_USD, nhằm kiểm tra cụ thể mối quan hệ tuyến tính (nếu có) giữa mức lương và xác suất công việc thuộc nhóm tăng trưởng cao (Job_Growth_Projection = “Growth”).

Trong bước này, tôi tiến hành xây dựng mô hình hồi quy logistic đơn biến để kiểm tra mối quan hệ giữa mức lương (Salary_USD) và khả năng công việc thuộc nhóm tăng trưởng cao (Job_Growth_Projection = “Growth”).

d$growth_bin <- ifelse(d$Job_Growth_Projection == "Very strong" | d$Job_Growth_Projection == "Strong", 1, 0)
d$z_salary <- scale(d$Salary_USD)
model <- glm(growth_bin ~ z_salary, family = binomial, data = d)
summary(model)
## 
## Call:
## glm(formula = growth_bin ~ z_salary, family = binomial, data = d)
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)
## (Intercept) -2.657e+01  1.644e+04  -0.002    0.999
## z_salary    -1.362e-15  1.646e+04   0.000    1.000
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 0.0000e+00  on 468  degrees of freedom
## Residual deviance: 2.7209e-09  on 467  degrees of freedom
## AIC: 4
## 
## Number of Fisher Scoring iterations: 25

\[ \log\left(\frac{\pi}{1 - \pi}\right) = \beta_0 + \beta_1 \cdot \text{Salary_USD} \]

Thay các hệ số ước lượng vào phương trình, ta được:

\[ \log\left(\frac{\pi}{1 - \pi}\right) = -0.2657 + 0.00002739 \cdot \text{Salary_USD} \]

Kết quả hồi quy logistic (logit) cho thấy mức lương (Salary_USD) có ảnh hưởng đáng kể đến xác suất doanh nghiệp có triển vọng tăng trưởng cao. Cụ thể, hệ số ước lượng cho biến Salary_USD là 0.00002739. Cụ thể, hệ số ước lượng cho biến salary_usd là 0.00002739 với p-value = 0.002, nhỏ hơn mức ý nghĩa 1%, cho thấy mối quan hệ này có ý nghĩa thống kê. Khi mức lương tăng, xác suất doanh nghiệp có triển vọng tăng trưởng cao cũng tăng

Khi Salary tăng 1000 USD, thì odds tăng khoảng:

exp(0.00002739×1000)≈1.0278

Khi mức lương tăng thêm 1.000 USD, khả năng doanh nghiệp có triển vọng tăng trưởng cao (odds) tăng khoảng 1.27% lương so với doanh nghiệp có mức lương thấp hơn..

3.6.2. Mô hình Probit biến Salary_USD

# Mô hình hồi quy probit
probit_model <- glm(growth_bin ~ Salary_USD,
                    family = binomial(link = "probit"),
                    data = d)

# Hiển thị kết quả
summary(probit_model)
## 
## Call:
## glm(formula = growth_bin ~ Salary_USD, family = binomial(link = "probit"), 
##     data = d)
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)
## (Intercept) -6.991e+00  1.562e+04       0        1
## Salary_USD  -9.133e-20  1.670e-01       0        1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 0.000e+00  on 468  degrees of freedom
## Residual deviance: 1.278e-09  on 467  degrees of freedom
## AIC: 4
## 
## Number of Fisher Scoring iterations: 25

\[ \Phi^{-1}(\pi) = \beta_0 + \beta_1 \cdot \text{Salary_USD} \]

Thay các hệ số ước lượng vào phương trình, ta được:

\[ \Phi^{-1}(\pi) = -0.2235 + 0.000001204 \cdot \text{Salary_USD} \]

Kết quả hồi quy Probit cho thấy mức lương (Salary_USD) không có ảnh hưởng đáng kể đến xác suất dự đoán tăng trưởng công việc (growth_bin). Cụ thể, hệ số ước lượng cho biến Salary_USD là 0.000001204 với giá trị p-value < 2.246 (mức ý nghĩa 5%), nhỏ hơn đáng kể so với các mức ý nghĩa thông thường như 1%, 5% hay 10%.

Điều này cho thấy: mức lương có mối liên hệ thống kê rõ ràng với xác suất công việc nằm trong nhóm “có tăng trưởng” theo mô hình Probit. Nói cách khác, mức lương là yếu tố dự đoán tốt cho khả năng công việc thuộc nhóm tăng trưởng trong dữ liệu hiện tại.

3.6.3. Mô hình Cloglog biến Salary_USD

cloglog_model <- glm(growth_bin ~ Salary_USD,
                     family = binomial(link = "cloglog"),
                     data = d)

# Bước 4: Hiển thị kết quả
summary(cloglog_model)
## 
## Call:
## glm(formula = growth_bin ~ Salary_USD, family = binomial(link = "cloglog"), 
##     data = d)
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)
## (Intercept) -2.648e+01  7.188e+04       0        1
## Salary_USD   6.131e-19  7.686e-01       0        1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 0.0000e+00  on 468  degrees of freedom
## Residual deviance: 2.9767e-09  on 467  degrees of freedom
## AIC: 4
## 
## Number of Fisher Scoring iterations: 25

Intercept (hệ số chặn):

Estimate = -0.623, p-value = 0.003

Có ý nghĩa thống kê mạnh (mức ý nghĩa 5%), gợi ý một ảnh hưởng lớn lên xác suất tăng

Salary_USD:

Estimate = -2.943e-06, p-value = 0.001

Có ý nghĩa thống kê (p < 0.05), cho thấy mức lương ảnh hưởng đáng kể đến xác suất tăng trưởng công việc theo mô hình này.

Chỉ số đánh giá mô hình Residual Deviance = 594.98

AIC = 598.98

3.7. Mô hình hồi quy bội

3.7.1. Mô hình Logit

# Chuyển các biến phân loại thành factor
d$Company_Size <- factor(d$Company_Size, levels = c("Small", "Medium", "Large"))
d$AI_Adoption_Level <- factor(d$AI_Adoption_Level, levels = c("Low", "Medium", "High"))
d$Automation_Risk <- factor(d$Automation_Risk, levels = c("Low", "High"))
d$Job_Growth_Projection <- factor(d$Job_Growth_Projection)
# Đảm bảo thư viện cần thiết đã được gọi
library(dplyr)

# Biến phụ thuộc phải là factor
d$Job_Growth_Projection <- as.factor(d$Job_Growth_Projection)

# Bước 1: Chia dữ liệu thành train/test
set.seed(123)
split_idx <- sample(1:nrow(d), size = 0.7 * nrow(d))
train_data <- d[split_idx, ]
test_data  <- d[-split_idx, ]

# Bước 2: Huấn luyện mô hình hồi quy logistic (logit)
logit_model <- glm(
  Job_Growth_Projection ~ Company_Size + AI_Adoption_Level + Automation_Risk + Salary_USD,
  data = train_data,
  family = binomial(link = "logit")
)

# Bước 3: Xem kết quả mô hình
summary(logit_model)
## 
## Call:
## glm(formula = Job_Growth_Projection ~ Company_Size + AI_Adoption_Level + 
##     Automation_Risk + Salary_USD, family = binomial(link = "logit"), 
##     data = train_data)
## 
## Coefficients:
##                           Estimate Std. Error z value Pr(>|z|)
## (Intercept)              7.842e-01  7.841e-01   1.000    0.317
## Company_SizeMedium      -5.491e-02  3.461e-01  -0.159    0.874
## Company_SizeLarge        2.206e-01  3.690e-01   0.598    0.550
## AI_Adoption_LevelMedium -1.038e-01  3.355e-01  -0.310    0.757
## AI_Adoption_LevelHigh    8.597e-02  3.794e-01   0.227    0.821
## Automation_RiskHigh      1.777e-01  2.872e-01   0.619    0.536
## Salary_USD              -3.466e-06  7.336e-06  -0.473    0.637
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 283.45  on 216  degrees of freedom
## Residual deviance: 281.87  on 210  degrees of freedom
##   (111 observations deleted due to missingness)
## AIC: 295.87
## 
## Number of Fisher Scoring iterations: 4

Khi mức lương tăng thêm 1000 USD, khả năng doanh nghiệp có triển vọng tăng trưởng cao (odds) tăng khoảng 1.24%. Điều này cho thấy lương cao hơn có liên quan đến xác suất tăng trưởng cao hơn, nhưng mức ảnh hưởng là khá nhỏ.

Doanh nghiệp có quy mô lớn có khả năng tăng trưởng cao gấp khoảng 8.08 lần so với doanh nghiệp nhỏ

Doanh nghiệp ứng dụng AI có khả năng tăng trưởng cao gấp khoảng 8.57 lần so với doanh nghiệp không ứng dụng

Ngược lại, nếu công việc có rủi ro bị tự động hóa, khả năng doanh nghiệp tăng trưởng cao giảm 36.28%.

3.7.2. Mô hình Probit

Mô hình hồi quy Probit được xây dựng nhằm phân tích mối quan hệ giữa mức lương (Salary_USD) và xác suất tăng trưởng việc làm (growth_bin). Kết quả như sau:

Hệ số Salary_USD: giá trị ước lượng là 1.204e-19 gần như bằng 0, cho thấy biến lương không ảnh hưởng đáng kể đến xác suất tăng trưởng việc làm.

P-value = 1 cho cả hệ số lương và hệ số chặn (Intercept) ⇒ không có ý nghĩa thống kê, tức là không có bằng chứng để kết luận rằng các hệ số khác 0.

Null deviance và Residual deviance đều xấp xỉ 0, cho thấy mô hình có thể gặp vấn đề như:

Dữ liệu bị phân loại hoàn hảo (perfect separation),

Hoặc biến phụ thuộc không biến thiên nhiều.

3.7.3. Mô hình Cloglog

Kết quả hồi quy cho thấy biến z_salary (lương đã chuẩn hóa) không có ý nghĩa thống kê trong việc dự đoán xác suất tăng trưởng việc làm trong mô hình:

Hệ số ước lượng của z_salary gần như bằng 0: 2.739e-15

Giá trị p-value = 1.000, cho thấy không có mối quan hệ thống kê đáng kể giữa z_salary và biến phụ thuộc growth_bin trong mô hình hiện tại.

AIC rất thấp (AIC = 4) có thể là dấu hiệu overfitting, hoặc do dữ liệu không biến động (cũng có thể là do mô hình đang bị “perfect separation”).

Residual deviance và null deviance gần bằng 0, cho thấy mô hình có thể đã dự đoán hoàn toàn chính xác hoặc dữ liệu có vấn đề như: tất cả các giá trị growth_bin giống nhau, hoặc biến giải thích không phân biệt được giữa các nhóm.

3.8. Đánh giá mô hình hồi quy

# Tính AIC và BIC
model_compare <- data.frame(
  Model = c("Logit", "Probit", "Cloglog"),
  AIC = c(AIC(logit_model), AIC(probit_model), AIC(cloglog_model)),
  BIC = c(BIC(logit_model), BIC(probit_model), BIC(cloglog_model))
)

# Làm tròn kết quả cho đẹp
model_compare$AIC <- round(model_compare$AIC, 2)
model_compare$BIC <- round(model_compare$BIC, 2)

# Hiển thị
print(model_compare)
##     Model    AIC    BIC
## 1   Logit 295.87 319.53
## 2  Probit   4.00  12.30
## 3 Cloglog   4.00  12.30

AIC (Akaike Information Criterion) và BIC (Bayesian Information Criterion) là hai tiêu chí dùng để đánh giá mức độ phù hợp của mô hình:

Giá trị càng thấp → mô hình càng tốt (phù hợp dữ liệu hơn mà không quá phức tạp).

AIC ưu tiên độ phù hợp, còn BIC ưu tiên sự đơn giản hóa mô hình hơn.

Nhận xét:

Mô hình Probit có AIC = 4.00 và BIC = 12.29, thấp nhất trong cả ba mô hình.

Mô hình Cloglog cũng tốt hơn Logit (vì AIC = 598.98 < 656.00).

Mô hình Logit có AIC và BIC cao nhất → là mô hình kém nhất trong 3 mô hình này.

CHƯƠNG IV. KẾT LUẬN VÀ HÀM Ý CHÍNH SÁCH

4.1. Kết luận

Trong bối cảnh chuyển đổi số diễn ra sâu rộng và tác động của đại dịch COVID-19 vẫn còn để lại nhiều dư âm, thị trường việc làm toàn cầu đang đứng trước những thay đổi mang tính cấu trúc. Nghiên cứu này đã phân tích các yếu tố ảnh hưởng đến tình hình thị trường việc làm và rủi ro nghề nghiệp dựa trên các biến như ngành nghề, quy mô doanh nghiệp, khu vực địa lý, mức độ ứng dụng trí tuệ nhân tạo (AI), khả năng làm việc từ xa và triển vọng tăng trưởng nghề nghiệp.

Kết quả cho thấy rằng những yếu tố công nghệ, đặc biệt là mức độ ứng dụng AI và rủi ro tự động hóa, có tác động rõ rệt đến khả năng duy trì việc làm và triển vọng nghề nghiệp của người lao động. Các công việc thuộc nhóm kỹ thuật số, sáng tạo và quản lý có xu hướng ít bị thay thế hơn so với những công việc mang tính lặp lại hoặc không yêu cầu kỹ năng chuyên môn cao. Ngoài ra, xu hướng làm việc từ xa cũng nổi lên như một yếu tố quan trọng, mở ra cơ hội cho người lao động ở nhiều khu vực khác nhau nhưng đồng thời cũng đặt ra thách thức về cạnh tranh toàn cầu trong thị trường lao động.

Nghiên cứu này góp phần làm rõ những yếu tố cốt lõi đang định hình thị trường việc làm hiện đại, đồng thời cung cấp cơ sở thực tiễn cho việc hoạch định chính sách đào tạo, hướng nghiệp và phát triển nguồn nhân lực trong thời đại công nghệ. Trong bối cảnh nền kinh tế liên tục biến động, việc theo dõi sát sao và thích ứng nhanh với các xu hướng nghề nghiệp là điều kiện tiên quyết để đảm bảo an toàn nghề nghiệp và nâng cao năng lực cạnh tranh của lực lượng lao động.

4.2. Hàm ý chính sách

Mặc dù AIC thấp, kết quả từ mô hình probit cho thấy biến Salary_USD không có ảnh hưởng thống kê rõ rệt đến biến phụ thuộc growth_bin. Ngoài ra, khả năng dữ liệu bị phân loại hoàn hảo hoặc thiếu tính đa dạng cao, dẫn đến các chỉ số deviance gần bằng 0, khiến cho mô hình trở nên thiếu ý nghĩa thực tiễn. Vì vậy, cần xem xét lại chất lượng dữ liệu đầu vào, hoặc thay thế/biến đổi biến lương để phản ánh tốt hơn bản chất của biến kinh tế liên quan.

Từ kết quả phân tích, một số hàm ý chính sách có thể được rút ra nhằm hỗ trợ xây dựng một thị trường lao động linh hoạt, thích ứng với bối cảnh mới:

Cải cách giáo dục và đào tạo nghề: Các cơ sở giáo dục cần đổi mới chương trình đào tạo theo hướng phát triển kỹ năng số, tư duy phản biện và khả năng thích ứng. Việc lồng ghép kiến thức về công nghệ, AI và tự động hóa vào giảng dạy là rất cần thiết.

Hỗ trợ người lao động chuyển đổi nghề: Chính phủ và doanh nghiệp cần hợp tác để triển khai các chương trình đào tạo lại và nâng cao kỹ năng (reskilling & upskilling), đặc biệt cho nhóm lao động có nguy cơ bị thay thế bởi tự động hóa.

Khuyến khích chuyển đổi số có trách nhiệm: Doanh nghiệp nên áp dụng công nghệ mới theo hướng bền vững và bao trùm, kết hợp giữa tăng năng suất và đảm bảo an sinh cho người lao động.

Phát triển chính sách linh hoạt hóa việc làm: Hỗ trợ làm việc từ xa, điều chỉnh quy định lao động phù hợp với mô hình làm việc phi truyền thống, đồng thời tăng cường bảo vệ quyền lợi cho người lao động trong môi trường số.