library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.2 ✔ readr 2.1.4
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ ggplot2 3.4.2 ✔ tibble 3.2.1
## ✔ lubridate 1.9.2 ✔ tidyr 1.3.0
## ✔ purrr 1.0.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library (readxl)
library (ggplot2)
library (DescTools)
library(epitools)
library(caret)
## Warning: package 'caret' was built under R version 4.3.1
## Loading required package: lattice
##
## Attaching package: 'caret'
##
## The following objects are masked from 'package:DescTools':
##
## MAE, RMSE
##
## The following object is masked from 'package:purrr':
##
## lift
library(DT)
## Warning: package 'DT' was built under R version 4.3.1
Trong quá trình học tập và tiếp thu môn Phân tích dữ liệu định tính cũng như trong quá trình hoàn thiện bài tiểu luận Trầm cảm và các yếu tố liên quan đến trầm cảm ở sinh viên, tôi xin chân thành cảm ơn đến thầy Trần Mạnh Tường giảng viên bộ môn Phân tích dữ liệu định tính đã dạy dỗ, truyền đạt những kiến thức quý báu cho chúng tôi trong suốt thời gian học tập vừa qua, đồng thời thầy cũng đã gợi ý, hỗ trợ và hướng dẫn chúng tôi trong quá trình làm bài để có được một bài tiểu luận tốt nhất. Do vốn kiến thức còn nhiều hạn chế nên trong bài tiểu luận chắc chắn sẽ không tránh khỏi những thiếu sót. Rất mong nhận được sự nhận xét, ý kiến đóng góp, phê bình từ phía thầy để bài tiểu luận được hoàn thiện hơn.
Xã hội ngày càng phát triển kéo theo nhiều sự thay đổi trong đời sống con người, cùng với đó là phát sinh ra nhiều mối nguy hiểm tiềm tàng cho sức khỏe tâm trí. Đó là một loạt các trạng thái khác nhau, từ những rối nhiễu tâm trí như lo âu, trầm cảm, ám ảnh hay các rối loạn tâm thần khác như chứng hoang tưởng, tâm thần phân liệt, động kinh… Trong đó, trầm cảm đang là một hiện tượng bệnh lý xuất hiện ngày càng phổ biến trong cuộc sống hiện nay. Trầm cảm ảnh hưởng sâu sắc đến chất lượng cuộc sống của tất cả mọi người, từ nam giới đến phụ nữ, từ trẻ em đến người trưởng thành, người cao tuổi và đặc biệt là học sinh, sinh viên thì khả năng xuất hiện trầm cảm là tương đối cao vì đây là giai đoạn này đối diện với nhiều khó khăn và bỡ ngỡ, khi phải thích nghi với môi trường mới và bắt đầu cuộc sống tự lập.
Theo Tổ chức Y tế Thế giới (WHO), trầm cảm là căn bệnh phổ biến nhất trên toàn thế giới và đứng thứ hai trong gánh nặng bệnh lý toàn cầu, chỉ sau bệnh lý mạch vành. Ước tính trên thế giới có khoảng 335 triệu người bị ảnh hưởng bởi trầm cảm. Theo thống kê năm 2022, tại Việt Nam, tỉ lệ mắc 10 rối loạn tâm thần thường gặp là 14,9% dân số - tương đương gần 15 triệu người. Một điều đáng chú ý là đa số người dân cho rằng rối loạn tâm thần chỉ liên quan đến tâm thần phân liệt, nhưng thực tế là các rối loạn lo âu và trầm cảm chiếm tỉ lệ cao, lên đến 5,4% dân số, còn lại là các rối loạn tâm thần khác như chậm phát triển tâm thần, rối loạn hành vi ở thanh thiếu niên, lạm dụng rượu, chất kích thích,…Hậu quả nghiêm trọng nhất của trầm cảm là hành vi tự tử. Thống kê tại Việt Nam cho thấy số người tự tử hàng năm lên tới 36.000 – 40.000 người, cao gấp 3 – 4 lần số ca tử vong do tai nạn giao thông. Trầm cảm chịu trách nhiệm cho 75% các vụ tự tử kể trên, còn lại là 22% là do nghiện rượu, ma tuý, cờ bạc và chỉ có 3% do tâm thần phân liệt, động kinh.
Trầm cảm ảnh hưởng sâu sắc đến chất lượng cuộc sống của mọi người. Tuy nhiên, không phải ai cũng có sự nhận thức đúng đắn về vấn đề này. Sự hiểu biết không đầy đủ hoặc nhận thức sai lầm về vấn đề này có thể dẫn đến tình trạng xuất hiện những dấu hiệu trầm cảm hoặc nguy cơ tăng nặng đối với những cá nhân đã có dấu hiệu hoặc nguy cơ trầm cảm từ trước. Nếu như trước kia, trầm cảm thường được biết đến ở đối tượng phụ nữ sau sinh và người cao tuổi thì hiện nay trầm cảm có thể xảy ra với bất kỳ ai. Đặc biệt là tình trạng trầm cảm ở đối tượng thanh thiếu niên từ 14 – 29 tuổi đang ở mức đáng báo động. “Theo số liệu công bố trong nước, Việt Nam có ít nhất ba triệu thanh thiếu niên bị rối loạn tâm thần, chỉ 20% trong số đó được chẩn đoán và điều trị thích hợp. Số đông tìm đến rượu bia, ma túy, và các chất kích thích như những giải pháp tạm thời.” (theo bài viết Báo động bệnh trầm cảm ở Việt Nam trên báo điện tử Vietnamnet.vn). Các giải pháp tạm thời mà người trẻ sử dụng để xoa dịu những dấu hiệu khó chịu từ các rối loạn tâm thần khiến cho tình trạng bệnh ngày một nặng hơn và có thể trở thành mối nguy hiểm của xã hội. Việc sinh viên có dấu hiệu trầm cảm nhưng không biết cách can thiệp hoặc e ngại tìm sự hỗ trợ, cố tự mình giải quyết, hoặc lảng tránh vấn đề cũng có thể dẫn đến hậu quả nghiêm trọng. Chính vì những lí do trên đã quyết định tìm hiểu đề tài “Trầm cảm và các yếu tố liên quan đến trầm cảm ở sinh viên”. Tôi hy vọng nghiên cứu này sẽ giúp phát hiện thực trạng mức độ nhận thức của sinh viên về rối loạn trầm cảm và đồng thời đưa ra những kiến nghị nhằm nâng cao nhận thức của sinh viên về vấn đề quan trọng này.
Mục tiêu chính của đề tài là đánh giá mức độ ảnh hưởng của các yếu tố liên quan đến bệnh trầm cảm ở sinh viên., từ đó đề xuất các biện pháp giáo dục và can thiệp thích hợp nhằm giảm thiểu tình trạng trầm cảm và tăng cường sức khỏe tâm lý cho cộng đồng sinh viên.
Đối tượng nghiên cứu: sinh viên ở các cấp học khác nhau như trung học phổ thông, đại học và thạc sĩ.
Phạm vi nghiên cứu: 352 sinh viên Hoa Kỳ.
Phương pháp nghiên cứu tài liệu: Phương pháp này sẽ bao gồm việc tìm hiểu, thu thập và phân tích các tài liệu liên quan đến trầm cảm từ các nguồn đáng tin cậy. Các tài liệu nghiên cứu, sách, báo cáo, và bài viết chuyên ngành về trầm cảm sẽ được xem xét để định rõ các yếu tố gây ra bệnh lý này, triệu chứng, cách xử lý, và các biện pháp can thiệp hiệu quả. Sử dụng tài liệu từ các tổ chức y tế uy tín như Tổ chức Y tế Thế giới (WHO) và các nghiên cứu khoa học đã được đăng ký sẽ giúp xây dựng cơ sở lý luận vững chắc cho đề tài.
Phương pháp xử lý số liệu bằng thống kê toán học: Để nắm vững thông tin từ các tài liệu nghiên cứu và số liệu liên quan đến trầm cảm, tôi sẽ tiến hành một quá trình phân tích số liệu bằng phương pháp thống kê toán học. Các thông số liên quan đến tần suất, phân bố, độ tương quan và độ tương tác giữa các biến sẽ được tính toán. Phần mềm R - một công cụ mạnh mẽ và phổ biến trong lĩnh vực thống kê và xử lý dữ liệu - sẽ hỗ trợ quá trình này. Việc sử dụng phần mềm R sẽ đảm bảo tính chính xác và đáng tin cậy trong việc phân tích số liệu.
Tổng hợp hai phương pháp nghiên cứu trên sẽ giúp tạo nên một cơ sở nghiên cứu vững chắc và mang tính khoa học cao về trầm cảm và các yếu tố liên quan. Kết quả của đề tài sẽ đưa ra những thông tin cần thiết để hiểu rõ hơn về tình trạng nhận thức của sinh viên về trầm cảm, những khó khăn và rào cản mà họ gặp phải, cũng như đề xuất những giải pháp và biện pháp can thiệp hiệu quả để cải thiện tình hình tâm lý và sức khỏe tâm trí cho cộng đồng sinh viên.
Đề tài này sẽ giúp làm rõ các yếu tố gây ra trầm cảm, những khó khăn và rào cản mà sinh viên phải đối mặt khi tìm kiếm sự hỗ trợ và can thiệp. Kết quả của nghiên cứu sẽ cung cấp những kiến thức hữu ích để tăng cường nhận thức về trầm cảm và giúp định hướng các biện pháp can thiệp, hỗ trợ và giáo dục hiệu quả nhằm giảm thiểu tình trạng trầm cảm trong cộng đồng sinh viên. Điều này sẽ đóng góp tích cực vào việc nâng cao sức khỏe tâm lý và chất lượng cuộc sống của các bạn trẻ, đồng thời giảm thiểu tác động xã hội của vấn đề này.
Chương 1. Tổng quan lý thuyết và các nghiên cứu thực nhiệm trước đây
Chương 2. Phương pháp nghiên cứu
Chương 3. Kết quả nghiên cứu
Chương 4. Kết luận và khuyến nghị
Theo Tiến Sĩ, bác sĩ Hoàng Cẩm Tú: “Trầm cảm là một trạng thái rối loạn cảm xúc biểu hiện sự buồn rầu chán nản, thất vọng quá mức bình thường làm ức chế toàn bộ các quá trình hoạt động tâm thần. Rối loạn đặc trưng bởi khí sắc trầm, giảm hoặc mất mọi quan tâm thích thú, mất năng lượng, dễ mệt mỏi, hoạt động giảm, khó tập trung chú ý, tư duy chậm, kèm theo mặc cảm tội lỗi, giảm giá trị hoặc hoang tưởng bị tội lỗi, chán đời…và đi kèm theo các triệu chứng cơ thể khác như rối loạn giấc ngủ, ăn…”.
Theo Bảng phân loại bệnh quốc tế (ICD - 10) và Bảng phân loại tâm thần lần thứ 4 của hiệp hội tâm thần học Mỹ (DSM - IV) thì: “Trầm cảm là trạng thái rối loạn cảm xúc, biểu hiện bằng giảm khí sắc, mất mọi quan tâm thích thú, giảm năng lượng dẫn đến tăng sự mệt mỏi và giảm hoạt động, phổ biến là tăng sự mệt mỏi sau một số cố gắng nhỏ, tồn tại trong một khoảng thời gian kéo dài, ít nhất là hai tuần”.
Tóm lại, Trầm cảm là một trạng thái rối loạn cảm xúc được biểu hiện một cách rõ rệt bởi khí sắc, hành vi, ứng xử thể hiện sự buổn rầu, kèm theo cảm giác chán chường, bi quan thậm chí có ý nghĩ tự sát, ức chế gần như toàn bộ các mặt hoạt động thể chất và tâm lý.
Khí sắc trầm cảm: là là một trạng thái tâm lý khiến nét mặt trở nên u sầu và đơn điệu, các nếp nhăn giảm nhiều hoặc hoàn toàn biến mất. Tình trạng khí sắc giảm thường kéo dài và bền vững do bệnh nhân buồn, bi quan và mất hi vọng vào tương lai. Trong một số trường hợp giai đoạn đầu buồn có thể bị phủ nhận, nhưng khi bệnh tiến triển, các dấu hiệu như giảm sự tập trung và cảm thấy than phiền xuất hiện.
Mất hứng thú hoặc sở thích ở hầu hết các hoạt động: Các bệnh nhân cho rằng họ đã mất đi niềm vui và hứng thú với hầu hết các hoạt động (tôi không còn thấy thú vị trong bất kỳ điều gì nữa). Điều này ảnh hưởng mạnh mẽ đến tất cả các sở thích trước đây của bệnh nhân.
Mất cảm giác ngon miệng, ăn ít hoặc sút cân: Sự ngon miệng thường bị giảm sút, nhiều bệnh nhân họ có cảm giác bị ép phải ăn. Họ ăn rất ít, thậm trí trong các trường hợp bệnh nặng bệnh nhân có thể nhịn ăn hoàn toàn dẫn đến việc bệnh nhân thường sút cân nhanh chóng.
Mất ngủ hoặc ngủ quá nhiều: Rối loạn giấc ngủ hay gặp nhất trong giai đoạn trầm cảm chủ yếu là mất ngủ. Các bệnh nhân thường mất ngủ giữa giấc, nghĩa là tỉnh ngủ vào lúc ban đêm và khó có thể ngủ tiếp. Mất ngủ đầu giấc, nghĩa là khó bắt đầu giấc ngủ.
Rối loạn hoạt động tâm thần vận động: Thay đổi tâm thần vận động bao gồm kích động (nghĩa là bệnh nhân luôn đi đi lại lại, không thể ngồi yên), vận động chậm chạp (như nói chậm, vận động cơ thể chậm), trì hoãn trả lời, giọng nói nhỏ, ít và nội dung nghèo nàn, trong một số trường hợp nặng họ có thể không nói một từ nào.
Giảm sút năng lượng: Năng lượng giảm sút, kiệt sức và mệt mỏi là rất hay gặp. Một người có thể than phiền mệt mỏi mà không có một nguyên nhân cụ thể nào. Thậm chí trong những công việc nhẹ nhàng, họ cũng cảm thấy cần phải cố gắng rất nhiều và hiệu suất công việc giảm đi đáng kể.
Cảm giác vô dụng hoặc tội lỗi: Là một trạng thái rất hay gặp trong giai đoạn trầm cảm chủ yếu. Bệnh nhân cảm thấy như mình không có giá trị, không đóng góp được gì trong cuộc sống. Họ luôn tự xem mình như kẻ làm hỏng mọi việc, là gánh nặng cho gia đình, cơ quan và xã hội. Thậm chí cả những sai lầm nhỏ trong quá khứ cũng khiến họ cảm thấy tự trách mình và mang cảm giác tội lỗi. Bệnh nhân tự trách mình và không thể thành công, không đáp ứng yêu cầu nghề nghiệp hoặc quan hệ với mọi người, không hoàn thành nghĩa vụ với gia đình.
Khó suy nghĩ tập trung hoặc ra quyết định: Nhiều bệnh nhân than phiền về khả năng suy nghĩ kém, không thể tập trung vào một việc cụ thể. Họ gặp khó khăn khi phải đưa ra quyết định và cần mất nhiều thời gian suy nghĩ về những việc thông thường. Triệu chứng này gây ra sự phiền toái và hạn chế trong cuộc sống hàng ngày của bệnh nhân.
Ý nghĩ muốn chết hoặc hành vi tự sát: Hầu hết bệnh nhân trầm cảm đều có ý nghĩ về cái chết, nặng hơn là họ có ý định tự sát hoặc hành vi tự sát. Ban đầu, họ có thể tưởng rằng nếu như những triệu chứng như mất ngủ, chán ăn, sụt cân và mệt mỏi kéo dài như vậy, thì tự chết có thể là cách thoát ra khỏi cảm giác đau khổ. Dần dần, bệnh nhân có niềm tin rằng việc chết sẽ làm cho người thân, cơ quan hoặc xã hội của họ cảm thấy tốt hơn. Từ ý nghĩ tự sát bệnh nhân sẽ có hành vi tự sát. Tuy nhiên, việc xác định chính xác liệu bệnh nhân trầm cảm có ý định tự sát hay không và khi nào tự sát là một vấn đề rất khó khăn.
Yếu tố di truyền
Những nghiên cứu về di truyền đã chỉ ra rằng có mối liên hệ di truyền trong việc xuất hiện trầm cảm. Nếu một người có người thân trong gia đình mắc bệnh trầm cảm, khả năng bản thân họ cũng bị trầm cảm cao hơn so với người không có tiền sử bệnh lý gia truyền.
Cơ chế sinh học
Cả chất norepinephrine và serotonin đều được coi là nguyên nhân gây nên trầm cảm. Ban đầu, người ta đã nghĩ rằng sự giảm nồng độ của một trong 2 chất dẫn truyền thần kinh này có ảnh hưởng đến khí sắc. uy nhiên, hiện nay, quan điểm này đã bị bác bỏ bởi các dữ liệu mới. Có dấu hiệu cho thấy khí sắc là kết quả của sự tương tác giữa serotonin và norepinephrine. Thậm chí nó có thể là kết quả của sự tương tác giữa hai chất này với các cơ quan khác của não. Rampello và cộng sự (2000) đã giải thích rằng khí sắc là kết quả của sự không cân bằng giữa một số chất dẫn truyền thần kinh, bao gồm serotonin và norepinephrine, dopamine và acetylcholine. Có thể là serotonin đóng vai trò quá lớn trong việc kiểm soát các cơ quan khác nhau của não, và sự giảm sự giảm nồng độ serotonin đã phá vỡ hoạt động của các cơ quan này, dẫn đến trạng thái trầm cảm. Khu vực não có liên quan chủ yếu đến trầm cảm là hệ viền. Theo mô hình tâm sinh học (psychobiological), các quá trình này xảy ra do tác động của cả các yếu tố tâm lý – xã hội lẫn yếu tố di truyền; do đó, nó đòi hỏi mức độ quan tâm thích đáng của mỗi lĩnh vực, trước khi một giai đoạn trầm cảm diễn ra.
Yếu tố tâm lí – xã hội
Những sang chấn tâm lí – xã hội góp phần làm tăng nguy cơ trầm cảm. Tỉ lệ trầm cảm thường thấy tương đối cao ở người nghèo, dân tộc thiểu số và những người có nguồn trợ cấp xã hội ít ỏi (Jenkins et al. 1998). Những cá nhân túng thiếu về mặt kinh tế có xu hướng trải qua nhiều sự kiện tiêu cực trong cuộc sống hơn là những người có điều kiện kinh tế được cải thiện, và có lẽ nguồn tài chính xã hội dùng để giải quyết những khó khăn của họ cũng ít hơn (House et at. 1991). Nhiều cá nhân thuộc các dân tộc ít người gặp phải tình trạng kinh tế bất lợi. Thêm nữa, họ phải đấu tranh với định kiến và sự hòa nhập với dân tộc chiếm số đông, điều này có thể gây nên stress (Clarke 2000). Những stress cuộc sống mạnh, như ly hôn hay ly thân, có thể gây ra các đợt trầm cảm. Ngược lại, một hệ thống nâng đỡ xã hội tốt có thể bảo vệ cá nhân khỏi căn bệnh này.
Giới tính cũng có ảnh hưởng đến tỷ lệ trầm cảm. Phụ nữ thường mắc trầm cảm nhiều hơn nam giới. Sự khác biệt này có thể giải thích từ hai khía cạnh. Khía cạnh xã hội cho rằng phụ nữ hiện nay đối mặt với nhiều trách nhiệm nhưng lại có chất lượng cuộc sống thấp hơn nam giới. Các công việc nơi công sở và gia đình gây áp lực lớn và quá tải cho phụ nữ (Bird và Rieker, 1999). Họ thường phải làm việc tại công sở, sau đó quay về nhà đảm nhận vai trò nội trợ, tạo ra sự căng thẳng. Phụ nữ cũng dễ gặp áp lực văn hóa hơn, chẳng hạn như áp lực phải tuân theo các tiêu chuẩn phương Tây về sự quyến rũ, điều này có thể gây stress. Trong khi đó, khía cạnh tâm lý học cho rằng phụ nữ dễ tự buộc tội và tự đánh giá thấp bản thân hơn nam giới. Theo Holen – Hoeksema (1990) phụ nữ có xu hướng để tâm đến hậu quả và nguyên nhân, suy nghĩ này thúc đẩy sự xuất hiện của những ý nghĩ bi quan tiềm tàng trong đầu óc họ.
Trầm cảm nặng đã trở thành nguyên nhân quan trọng dẫn đến gánh nặng ngân sách chỉ sau tự tử và bệnh tim mạch.
Năm 1990, Tổ chức Ngân sách bệnh tật toàn cầu (Global Burden of Diseasee) đã xếp các rối loạn trầm cảm lên hạng thứ 4 trong số các nguyên nhân dẫn đến mất ngày công lao động sau các bệnh nhiễm trùng hô hấp, tiêu chảy và các bệnh của thai nhi và trẻ sơ sinh.
Năm 2010, theo kết quả nghiên cứu của Tổ chức Ngân sách bệnh tật toàn cầu các rối loạn trầm cảm đã leo lên hạng 2 trong số các nguyên nhân gây ra gánh nặng ngân sách. Nghiên cứu đánh giá dựa trên tỷ lệ tử vong và ngày công lao động bị mất có nguyên nhân từ các rối loạn trầm cảm.
Tuổi sinh viên là thời kỳ đạt được sự trưởng thành về mặt thể chất. Thông thường đây là giai đoạn hoàn tất quá trình thay da đổi thịt của tuổi thiếu niên đạt tới sự chín muồi về mặt sinh lý. Có thể nói đây là thời kỳ phát triển rực rỡ nhất về các chỉ số của cơ thể. Sự phát triển của hệ thống thần kinh, cấu trúc các tế bào của đại não cũng có đặc điểm như cấu trúc tế bào não của người lớn. Số lượng dây thần kinh liên hợp tăng lên, liên kết các phần khác nhau của vỏ não hoàn thiện. Đó chính là tiền đề cần thiết cho sự phức tạp hóa quá trình nhận thức. Sự tự ý thức của sinh viên cũng ở mức độ cao giúp người sinh viên có thể điều chỉnh hành vi và hoàn thiện nhân cách của mình. Sự tự ý thức của sinh viên xuất phát từ sự đánh giá và khả năng đánh giá về các mặt của đời sống xã hội.
Quá trình học tập ở trường là giai đoạn quan trọng trong quá trình xã hội hóa và phát triển nhân cách. Giai đoạn học đại học là giai đoạn sinh viên có cuộc sống lao động trí óc căng thẳng để tiếp nhận tri thức và phát triển các chức năng tâm lý như tư duy, chú ý, trí nhớ… Đây cũng là giai đoạn sinh viên tham gia nhiều hoạt động và các mối quan hệ xã hội. Do vậy, học tập, nghiên cứu khoa học, giao tiếp và tham gia các hoạt động xã hội là những hoạt động chính của sinh viên.
Tuy nhiên, sinh viên lại là đối tượng có nguy cơ trầm cảm cao hơn khi gặp khó khăn trong việc tìm bạn mới, khi mâu thuẫn với bạn cùng phòng, tham gia các hoạt động xã hội, hay khi gặp rắc rối trong gia đình.
Áp lực học tập và những thói quen sinh hoạt không hợp lý khiến cơ thể lâm vào trạng thái thường xuyên mệt mỏi, buồn chán và cáu gắt. Những sinh viên có vấn đề về sức khỏe cũng có nguy cơ bị trầm cảm hơn so với những sinh viên có sức khỏe tốt. Vì khi không đảm bảo sức khỏe, sinh viên mất sự tập trung trong việc học, không thể đạt được mục tiêu học tập đã đặt ra, sợ thua kém bạn bè khiến sinh viên có cảm giác buồn chán, thất bại và bất lực. Từ đó có khả năng dẫn đến trầm cảm.
Nguy cơ trầm cảm cũng cao hơn đối với những sinh viên mất đi người thân. Do sự mất mát tình cảm quá lớn, thiếu đi sự quan tâm chia sẻ khiến sinh viên rơi vào trạng thái tuyệt vọng, tự cô lập mình với thế giới xung quanh.
Sinh viên được đặt nhiều kì vọng của gia đình và chính bản thân thì áp lực học tập tăng, thời gian biểu không hợp lý, giờ học kéo dài không có thời gian nghỉ ngơi giải trí, luôn trong trạng thái căng thẳng, lo lắng dẫn đến suy giảm trí nhớ, tâm thần bất an.
Ngoài ra, đa số sinh viên khi học đại học là bắt đầu cuộc sống xa nhà, có những sinh viên một năm chỉ về thăm gia đình được hai lần. Điều này có thể gây ra sự gắn bó giữa cá nhân sinh viên với gia đình không còn như xưa và việc hỗ trợ từ phía gia đình nếu sinh viên có những cảm xúc tiêu cực cũng sẽ không kịp thời.
Bahrami và cộng sự (2011) đã nghiên cứu mối quan hệ giữa thói quen học tập, hạnh phúc và trầm cảm của sinh viên. Các công cụ thu thập dữ liệu bao gồm Đánh giá trầm cảm Beck (BDI), Đánh giá hạnh phúc Oxford và một bảng câu hỏi do nhà nghiên cứu tạo ra để xác định lượng thời gian học tập của sinh viên.Phân tích kết quả nghiên cứu được thực hiện thông qua thống kê mô tả và suy luận. Kết quả nghiên cứu cho thấy có mối quan hệ đáng kể và tiêu cực giữa thời gian học tập và triệu chứng trầm cảm, cũng như giữa mức hạnh phúc và triệu chứng trầm cảm.
Kawsar và cộng sự (2019) đã phân tích mối quan hệ giữa rối loạn lo âu, Trầm cảm và Thành tích học tập trong số sinh viên đại học tại Đại học Khoa học và Công nghệ Shahjalal, Sylhet, Bangladesh. sử dụng các bảng đánh giá lo lắng về Thống kê (STARS) và câu hỏi PHQ-9 (đo lường triệu chứng trầm cảm). Rối loạn lo âu đã được phát hiện ảnh hưởng đáng kể đến hiệu suất học tập và mức độ trầm cảm của sinh viên. Sinh viên đang chịu đựng mức độ rối loạn lo âu cao được xác định đang phải đối mặt với mức độ trầm cảm cao và đạt điểm kém trong các kỳ thi học tập. Rối loạn lo âu đã được tìm thấy ảnh hưởng đến hiệu suất học tập của sinh viên và làm tăng mức độ trầm cảm cho họ.
Sidana và cộng sự (2018) khám phá tỷ lệ trầm cảm ở sinh viên y khoa và các yếu tố khác nhau góp phần gây ra trầm cảm. Sử dụng phương pháp lấy mẫu ngẫu nhiên phân tầng, 237 sinh viên được chọn theo năm học. Bảng câu hỏi về sức khỏe bệnh nhân (PHQ-9), dựa trên PRIME-MD Today, được sử dụng để chẩn đoán tạm thời bệnh trầm cảm. Năm học và kết quả học tập của sinh viên có mối liên hệ có ý nghĩa thống kê với trầm cảm. Các yếu tố khác, bao gồm giới tính, tiền sử trầm cảm tự báo cáo, tiền sử gia đình bị rối loạn tâm thần, loại hỗ trợ xã hội, cấu trúc gia đình, số anh chị em và trình độ học vấn của cha mẹ không có bất kỳ mối liên hệ đáng kể nào với tỷ lệ trầm cảm trong nghiên cứu.
Iorga và cộng sự (2018) xác định mức độ căng thẳng và trầm cảm của sinh viên y khoa. Nghiên cứu cắt ngang thu thập dữ liệu liên quan đến các đặc điểm nhân khẩu học xã hội, trầm cảm, các triệu chứng tâm lý và thể chất tự xác định trong giai đoạn căng thẳng và căng thẳng nhận thấy giữa các sinh viên y khoa tại một trường đại học ở Romania. Kết quả nghiên cứu cho thấy sinh viên năm nhất là những người chán nản nhất và sinh viên tốt nghiệp là sinh viên y khoa căng thẳng nhất. Phụ nữ dễ bị các triệu chứng trầm cảm hơn. Những sinh viên theo học năm thứ ba ít bị trầm cảm và ít căng thẳng nhất. Hơn một nửa số học sinh cảm thấy lo lắng và tiêu thụ nhiều rượu, cà phê, đồ ngọt hoặc thuốc lá trong thời gian học tập căng thẳng.
Khodadadi và cộng sự (2018) đã điều tra chứng trầm cảm, lo lắng và căng thẳng ở sinh viên Đại học Khoa học Y khoa Lorestan năm 2017. Trong nghiên cứu này, một bảng câu hỏi tiêu chuẩn có tên là Thang đo trầm cảm, lo âu, căng thẳng 21 (DASS-21) đã được sử dụng để thu thập dữ liệu. Kết quả: Kết quả nghiên cứu cho thấy, tỷ lệ trầm cảm, lo âu, căng thẳng ở các mức độ khác nhau của sinh viên lần lượt là 17,4%, 21,2%, 11,9%, đồng thời tỷ lệ trầm cảm, căng thẳng ở nữ cao hơn nam.
Lee và cộng sự (2021) đã mô tả các triệu chứng căng thẳng, lo lắng và trầm cảm của sinh viên tại một trường đại học nghiên cứu công lập ở Kentucky trong giai đoạn đầu của COVID-19 và việc họ sử dụng các dịch vụ sức khỏe tâm thần. Kết quả cho thấy khoảng 88% học sinh bị căng thẳng từ trung bình đến nặng, 44% học sinh có biểu hiện lo lắng từ trung bình đến nặng và 36% học sinh bị trầm cảm từ trung bình đến nặng. Đặc biệt, học sinh nữ, nông thôn, thu nhập thấp và học lực kém dễ bị tổn thương hơn trước các vấn đề sức khỏe tâm thần này. Tuy nhiên, phần lớn học sinh có các triệu chứng sức khỏe tâm thần vừa hoặc nặng chưa bao giờ sử dụng các dịch vụ sức khỏe tâm thần.
Ceyhan và cộng sự (2009) điều tra mức độ trầm cảm của sinh viên đại học theo giới tính, sự hài lòng về hình ảnh cơ thể, loại địa điểm cư trú và thành tích học tập. Dữ liệu được thu thập thông qua Kiểm kê trầm cảm Beck, Thang đo mức độ hài lòng của các cơ quan trong cơ thể và Thang đo cá nhân. Người ta thấy rằng những sinh viên đại học không hài lòng với hình ảnh cơ thể của họ dễ bị trầm cảm hơn những người hài lòng với hình ảnh cơ thể của họ. Hơn nữa, những sinh viên đại học có thành tích học tập thấp hơn biểu hiện các triệu chứng trầm cảm nhiều hơn đáng kể so với những sinh viên có thành tích học tập cao. Người ta chỉ ra rằng mức độ trầm cảm của sinh viên đại học không khác biệt đáng kể theo giới tính và loại vị trí cư trú.
Syed và cộng sự (2018) điều tra mối quan hệ của nhận thức về năng lực bản thân trong xã hội (PSSE) với chứng trầm cảm ở sinh viên. Biểu mẫu thông tin cá nhân, thang điểm PSSE và thang điểm trầm cảm Siddiqui-Shah được quản lý cho học sinh vị thành niên để kiểm tra giả thuyết sau; sẽ có một mối tương quan tiêu cực giữa PSSE và trầm cảm ở thanh thiếu niên. Kết quả của nghiên cứu cho thấy mối tương quan tiêu cực đáng kể (r = −0,149, p < 0,05) giữa các biến PSSE và trầm cảm.
Hamasha và cộng sự (2019) điều tra tỷ lệ phổ biến và các chỉ số rủi ro của bệnh trầm cảm ở sinh viên đại học thuộc các chuyên ngành liên quan đến sức khỏe. Công cụ đánh giá là một bảng câu hỏi tự báo cáo dựa trên Bản kiểm kê chứng trầm cảm của Becks (BDI). Phân tích dữ liệu bao gồm thống kê mô tả, phân tích hai biến và hồi quy logistic từng bước. Khoảng 45% học sinh cho biết bị trầm cảm từ nhẹ đến nặng. Mô hình hồi quy cho thấy các yếu tố sau vẫn có liên quan đáng kể đến trầm cảm: sự hiện diện của bệnh tâm lý, lối sống xã hội, sự mất mát gần đây của thành viên gia đình và sự hài lòng với đội ngũ giảng viên.
Cẩm và cộng sự (2021) đã mô tả cảm nhận của sinh viên y đa khoa về tình trạng trầm cảm và các yếu tố liên quan đến trầm cảm ở sinh viên y đa khoa chính quy Trường Đại học Y khoa Phạm Ngọc Thạch năm 2019, với sự tham gia của 4 sinh viên. Kết quả nghiên cứu cho thấy rằng sinh viên y khoa nhận thức được tỷ lệ trầm cảm của sinh viên y khoa đang ngày một tăng, các yếu tố liên quan bao gồm: Tuổi, giới tính, thói quen ăn uống, thói quen ngủ, mối quan hệ với gia đình, mối quan hệ với bạn bè, gặp trở ngại khi tham gia các hoạt động xã hội, học lực, áp lực từ việc học, chương trình học.
Hiền và cộng sự (2021) đã sử dụng nghiên cứu cắt ngang nhằm mục tiêu mô tả thực trạng trầm cảm của 862 sinh viên chính quy năm cuối thuộc các chuyên ngành tại trường Đại học Y – dược Thái Nguyên năm học 2020 - 2021 và một số yếu tố liên quan. Kết quả nghiên cứu cho thấy trong tổng số 862 sinh viên tham gia nghiên cứu, tỷ lệ trầm cảm ở sinh viên năm cuối là 42,0%, trong đó mức độ nhẹ chiếm tỷ lệ cao nhất (15,4%), tiếp đến là mức độ vừa chiếm tỷ lệ 14,6%, mức độ nặng có tỷ lệ là 5,8% và mức độ rất nặng (6,1%). Phân tích hồi quy đa biến cho thấy có 4 yếu tố liên quan đến trầm cảm ở sinh viên bao gồm chia sẻ các vấn đề với bạn bè, bố mẹ, tình trạng lo âu và tình trạng stress của sinh viên. Tỷ lệ trầm cảm trong sinh viên năm cuối vẫn còn cao đặc biệt có cả mức độ rất nặng.
Thông qua việc tìm hiểu các mô hình nghiên cứu liên quan đến vấn đề trầm cảm ở sinh viên, không chỉ ở Việt Nam mà còn cả nước ngoài, ta có thể thấy rằng đề tài này không còn là một đề tài mới. Đã có rất nhiều nghiên cứu về đề tài này được thực hiện, tiếp cận vấn đề trên nhiều hướng khác nhau, đồng thời phương pháp nghiên cứu và các mô hình được sử dụng cũng rất đa dạng. Tuy nhiên chưa có nghiên cứu nào tập trung đặc biệt vào ảnh hưởng của các yếu tố đến vấn đề trầm cảm ở học sinh và sinh viên ở lứa tuổi từ 17 tuổi đén 28 tuổi. Trong khi đây là một chủ đề nghiên cứu quan trọng và được quan tâm rộng rãi, vì tỷ lệ sinh viên trong độ tuổi này mắc bệnh trầm cảm hoặc các bệnh về tâm lý khác đang ngày càng gia tăng. Do đó, việc thực hiện thêm các nghiên cứu trong độ tuổi này là vô cùng cần thiết để cung cấp những đánh giá cụ thể và chính xác hơn về các yếu tố ảnh hưởng đến vấn đề trầm cảm ở sinh viên. Nhờ đó, chúng ta có thể đưa ra những khuyến nghị tốt nhất để cải thiện tình hình và hỗ trợ tốt hơn cho sinh viên đang đối mặt với những khó khăn về tâm lý.
Với biến đáp ứng nhị phân Y, chúng ta sử dụng thuật ngữ chung “thành công” cho một đáp ứng và “thất bại” đối với đáp ứng còn lại. Đối với các đối tượng trong hàng i, ký hiệu \(\pi_i\) là xác suất “thành công” thì \(1 − \pi_i\) là xác suất của “thất bại”. Cặp xác suất \((\pi_i, 1 − \pi_i)\) là phân phối xác suất có điều kiện của Y trong hàng i. Từ bảng tần xuất, chúng ta tính \(\frac{\pi_1}{\pi_2}\), phân số này gọi là Rủi ro tương đối (Relative risk) giữa 2 biểu hiện khác nhau của biến phụ thuộc.
Nếu gọi xác suất “thành công” của biểu hiện thứ i của biến độc lập là \(\pi_i\) thì chúng ta kí hiệu Tỷ lệ cược (odd) của biểu hiện này là \({\rm odd}_i\) và được định nghĩa như sau:
\({\rm odd}_i=\frac{\pi_i}{1-\pi_i}\)
Nghĩa là chúng ta tính tỷ lệ thành công theo từng hàng trong bảng ngẫu nhiên.
Tỷ lệ chênh của biểu hiện thứ i và biểu hiện thứ j được kí hiệu là θ và được định nghĩa: \(\theta=\frac{{\rm odd}_i}{{\rm odd}_j}\)
Mô hình logit (Logistic Regression) là một trong những phương pháp phân loại phổ biến trong thống kê. Dựa vào đặc trưng của các mẫu, mô hình logit được sử dụng để dự đoán xác suất xảy ra một sự kiện hoặc thuộc tính (biến phụ thuộc) nhị phân (có hai lớp, thường được ký hiệu là 0 và 1).
Trong mô hình logit, chúng ta sử dụng hàm logistic để biểu diễn xác suất. Hàm logistic chuyển đổi giá trị liên tục thành giá trị xác suất nằm trong khoảng từ 0 đến 1.
Mô hình logit rất hữu ích trong các bài toán phân loại nhị phân, ví dụ như phân loại email là spam hay không spam, dự đoán khách hàng có mua sản phẩm hay không, xác định bệnh nhân mắc bệnh hay không mắc bệnh dựa trên các biến đo lường y tế,…
Mô hình Probit cũng là một phương pháp phân loại trong thống kê tương tự như mô hình logit. Mô hình Probit dùng để dự đoán xác suất xảy ra một sự kiện hoặc thuộc tính nhị phân (có hai lớp, thường được ký hiệu là 0 và 1), dựa vào đặc trưng (biến độc lập) của các mẫu.
Trong mô hình Probit, chúng ta sử dụng hàm Phân phối chuẩn để biểu diễn xác suất. Hàm Phân phối chuẩn dùng để tính xác suất của biến ngẫu nhiên thuộc về một khoảng cụ thể trong phân phối chuẩn.
Mô hình Probit cũng được sử dụng rộng rãi trong các bài toán phân loại nhị phân, tương tự như mô hình logit. Cả hai mô hình này thường được sử dụng trong các lĩnh vực như kinh tế, y học, marketing, và nhiều lĩnh vực khác để dự đoán và phân loại các sự kiện hoặc thuộc tính nhị phân.
Mô hình Complementary Log-Log (cloglog) là một phương pháp phân loại khác trong thống kê. Mô hình cloglog dùng để dự đoán xác suất xảy ra một sự kiện hoặc thuộc tính nhị phân (có hai lớp, thường được ký hiệu là 0 và 1), dựa vào đặc trưng (biến độc lập) của các mẫu.
Trong mô hình cloglog, chúng ta sử dụng hàm Cloglog để biểu diễn xác suất. Hàm Cloglog là một hàm chuẩn bậc cao (complementary log-log link function) thường được sử dụng trong mô hình phân loại nhị phân để đảm bảo xác suất dự đoán luôn nằm trong khoảng từ 0 đến 1.
Mô hình cloglog cũng được sử dụng trong các bài toán phân loại nhị phân, tương tự như mô hình logit và mô hình Probit. Nó được áp dụng trong nhiều lĩnh vực như kinh tế, y học, xử lý ngôn ngữ tự nhiên, và nhiều lĩnh vực khác để dự đoán và phân loại các sự kiện hoặc thuộc tính nhị phân.
Ta biết rằng, trong các mô hình hồi quy theo phương pháp OLS (phương pháp bình phương bé nhất thông thường), hệ số xác định \(R_2\) cho thấy tỷ lệ những biến thiên của biến đáp ứng được giải thích bởi các biến dự báo và thường được dùng để đánh giá mức độ phủ hợp của mô hình. Tuy nhiên, đối với mô hình logistic nói riêng và các mô hình sử dụng phương pháp ML nói chung, việc khảo sát hệ số xác định R2 để đánh giá mức độ phù hợp của mô hình là không còn có ý nghĩa. Trong trường hợp này, thay cho vai trò của hệ số xác định \(R_2\), người ta dựa vào một chỉ số gọi là “giả \(R^2\)” (Pseudo – \(R^2\))
Chỉ số này được đề xuất bởi McFadden nên còn có tên là hay McFadden’s R-squared. Khi chạy hồi quy, các phần mềm ứng dụng đều cung cấp chỉ số này.
Có thể dùng Pseudo – \(R^2\) để đánh giá mức độ phủ hợp của mô hình logistic đối với dữ liệu thực tế: Pseudo – R càng lớn, mô hình càng phù hợp. Pseudo – \(R^2\) càng bé, mô hình càng ít phù hợp. Tuy nhiên với mô hình Logistic, chi tiêu Pseudo – \(R^2\) do MacFadden đưa ra rất khó sử dụng để diễn giải mức độ giải thích của mô hình logistic nói riêng và các mô hình phân tích định tính nói chung, do vậy người ta cần phải kết hợp với các chỉ số khác.
Chỉ số Brier, còn được gọi là Brier Score, là một chỉ tiêu được sử dụng để đánh giá hiệu quả của mô hình dự đoán trong các bài toán phân loại. Chỉ số này được đặt tên theo Glenn W. Brier, người đã giới thiệu nó vào năm 1950.
Chỉ số Brier đo lường mức độ khác biệt giữa các dự đoán của mô hình và các giá trị thực tế. Nó được tính bằng cách lấy tổng bình phương của sai số (hay lỗi) giữa dự đoán của mô hình và các giá trị thực tế, sau đó chia cho số lượng mẫu.
Giá trị của chỉ số Brier nằm trong khoảng từ 0 đến 1. Khi chỉ số Brier càng gần 0, tức là mô hình có dự đoán chính xác và gần giống với kết quả thực tế. Ngược lại, khi chỉ số Brier càng gần 1, tức là mô hình có dự đoán không chính xác và khác biệt lớn so với kết quả thực tế.
Chỉ số Brier được sử dụng phổ biến trong các bài toán dự đoán xác suất như dự đoán xác suất mắc bệnh, xác suất dự đoán sự kiện, hoặc xác suất dự đoán xảy ra một sự kiện quan trọng. Nó cho phép đánh giá độ tin cậy của mô hình dự đoán và so sánh hiệu quả giữa các mô hình khác nhau.
Chỉ số AIC (Akaike’s Information Criterion) là một chỉ tiêu được sử dụng trong việc đánh giá và so sánh hiệu quả giữa các mô hình thống kê, đặc biệt là trong bối cảnh mô hình tuyến tính và mô hình tuyến tính tổng quát (GLM - Generalized Linear Models). Chỉ số AIC được phát triển bởi nhà thống kê Akaike Hirotugu.
Ý tưởng của chỉ số AIC là cân nhắc giữa độ phù hợp của mô hình với dữ liệu và độ phức tạp của mô hình. Mô hình có giá trị AIC thấp hơn được coi là mô hình tốt hơn. Khi so sánh nhiều mô hình, mô hình có AIC nhỏ nhất thường được ưa chuộng hơn.
Ma trận nhầm lẫn (Confusion Matrix) là một công cụ quan trọng trong bài toán phân loại để đánh giá hiệu suất của mô hình dự đoán. Nó giúp xác định số lượng các dự đoán đúng và sai lệch của mô hình dự đoán so với kết quả thực tế.
Các thành phần trong ma trận nhầm lẫn có ý nghĩa như sau:
• True Positive (TP): Số lượng các trường hợp được dự đoán đúng là positive (dự đoán đúng một mẫu positive).
• True Negative (TN): Số lượng các trường hợp được dự đoán đúng là negative (dự đoán đúng một mẫu negative).
• False Positive (FP): Số lượng các trường hợp được dự đoán là positive nhưng thực tế là negative (dự đoán sai một mẫu negative).
• False Negative (FN): Số lượng các trường hợp được dự đoán là negative nhưng thực tế là positive (dự đoán sai một mẫu positive).
Dữ liệu sử dụng trong bài nghiên cứu được lấy từ tác giả Kane Rudolph trên trang web kaggle.com.
Dữ liệu được thu thập bằng cách khảo sát sinh viên Hoa Kỳ đang theo học ở các cấp học khác nhau như trung học, đại học và thạc sĩ. Tổng cộng có 352 sinh viên được đưa vào nghiên cứu. Dữ liệu được thu thập từ các sinh viên bằng phương pháp câu hỏi với sự đồng ý có hiểu biết.
Data <- read_excel("Data.xlsx")
str (Data)
## tibble [352 × 14] (S3: tbl_df/tbl/data.frame)
## $ Gender : chr [1:352] "Male" "Male" "Female" "Female" ...
## $ Age : num [1:352] 22 17 26 19 17 20 27 20 19 17 ...
## $ Accommodation : chr [1:352] "University hall of residence" "Home (with parents)" "Private rented accommodation" "Home (with parents)" ...
## $ Education : chr [1:352] "College - Bachelor's" "High School" "College - Bachelor's" "College - Bachelor's" ...
## $ Selfstudy : chr [1:352] "1 - 2 hours" "1 - 2 hours" "2 - 4 hours" "1 - 2 hours" ...
## $ Job : chr [1:352] "Yes" "No" "Yes" "Yes" ...
## $ Media : chr [1:352] "1 - 2 Hours" "More than 4 Hours" "1 - 2 Hours" "2 - 4 Hours" ...
## $ Pleasureinthings : num [1:352] 3 1 2 2 3 1 3 1 2 2 ...
## $ Littleenergy : num [1:352] 4 1 2 3 3 4 3 3 3 2 ...
## $ Feelingbadyourself: num [1:352] 3 1 1 1 1 1 1 3 2 3 ...
## $ Feelingdown : num [1:352] 2 1 2 1 2 2 2 3 1 4 ...
## $ Hurtingyourself : num [1:352] 2 1 1 2 1 1 1 3 1 2 ...
## $ GPA : num [1:352] 2.3 2.7 2.97 2.74 3.37 3.33 2.75 3.25 3.97 2.75 ...
## $ Depression : chr [1:352] "yes" "no" "no" "no" ...
Bộ dữ liệu gồm có 14 biến. Trong đó có 7q biến định tính và 7 biến định lượng:
Biến Gender - Giới tính của sinh viên, gồm 2 giá trị Male (Nam) hoặc Female (Nữ).
Biến Age - Tuổi của sinh viên.
Accommodation - Nơi ở hiện tại của sinh viên, gồm 3 giá trị: Home with parents (Tại nhà với gia đình), Private rented accommodation (Phòng trọ tư nhân) và University hall of residence (Kí túc xá của trường).
Biến EducationL Trình độ học vấn hiện tại, gồm 3 giá trị - High School (Trung học phổ thông), College - Bachelor’s (Đại học) và Master (Thạc sĩ).
Biến Selfstudy - Số giờ tự học mỗi ngày, gồm 3 giá trị: 1 - 2 hours (từ 1 đến 2 tiếng), 2 - 4 hours (từ 2 đến 4 tiếng) và More than 4 hours (hơn 4 tiếng).
Biến Job - hiện tại có đi làm hay không, gồm 2 giá trị: Yes hoặc No
Biến Media - số giờ dành cho phương tiện truyền thông mỗi ngày, gồm 3 giá trị: 1 - 2 hours (từ 1 đến 2 tiếng), 2 - 4 hours (từ 2 đến 4 tiếng) và More than 4 hours (hơn 4 tiếng).
Biến Pleasureinthings - Ít hứng thú hoặc niềm vui trong công việc, gồm 4 mức độ: 1 (Chưa bao giờ), 2(Thi thoảng), 3 (Thường xuyên), 4 (Luôn luôn).
Biến Littleenergy - Cảm thấy mệt mỏi hoặc có ít năng lượng, gồm 4 mức độ tương tự như biến Pleasureinthings.
Biến Feelingbadyourself - Cảm thấy tồi tệ về bản thân hoặc rằng bạn là một kẻ thất bại hoặc đã không làm bản thân hoặc gia đình thất vọng, gồm 4 mức độ tương tự như biến Pleasureinthings.
Biến Feelingdown - Cảm thấy thất vọng, chán nản, hoặc vô vọng, gồm 4 mức độ tương tự như biến Pleasureinthings.
Biến Hurtingyourself - Suy nghĩ rằng bạn nên chết đi hoặc làm tổn thương chính mình theo một cách nào đó, gồm 4 mức độ tương tự như biến Pleasureinthings.
Biến GPA - Điểm số tích luỹ hiện tại tính theo thang điểm 4.
Biến Depression - Sinh viên có biểu hiện trầm cảm hay không, gồm 2 giá trị: Yes hoặc No.
dnt <- Data[,c("Gender","Accommodation","Education","Selfstudy","Job","Media","Depression")]
Gender - Giới tính
prop.table(table(Data$Gender))
##
## Female Male
## 0.8892045 0.1107955
Trong tổng số 532 học sinh sinh viên tham gia khảo sát thì có đến 88.92% (474 sinh viên) là nữ và 11,08% (58 sinh viên) là nam.
dnt |> ggplot(aes(Gender)) + geom_bar() + ylab ("Số học sinh sinh viên") + xlab ("Giới tính")
Accommodation - Nơi ở hiện tại
prop.table(table(Data$Accommodation))
##
## Home (with parents) Private rented accommodation
## 0.440340909 0.553977273
## University hall of residence
## 0.005681818
Học sinh sinh viên sống ở phòng trọ tư nhân chiếm 55.40% tức là có 295 học sinh sinh viên lựa chọn lựa chọn cách sống này, Học sinh sinh viên sống chung với gia đình chiếm 44.03% và chỉ có 3 học sinh sinh viên (0.57%) lựa chọn sống ở kí túc xá của trường. Các con số này cho thấy học sinh sinh viên có xu hướng ưa thích sống ở phòng trọ tư nhân hoặc sống chung với gia đình hơn là sống ở kí túc xá của trường.
dnt |> ggplot(aes(Accommodation)) + geom_bar() + ylab ("Số học sinh sinh viên") + xlab ("Nơi ở hiện tại")
Education - Trình độ học vấn
prop.table(table(Data$Education))
##
## College - Bachelor's High School Master
## 0.57954545 0.35227273 0.06818182
Trong số các học sinh sinh viên được khảo sát từ độ tuổi 17 đến 28 tuổi thì có đến 57.95% là đang theo học đại học (tương đương 308 sinh viên) , 35.23% học sinh đang học trung học phổ thông (tương đương 187 học sinh) và có 6.82% là đang theo học thạc sĩ (tương đương 37 sinh viên). Điều này cho thấy học sinh sinh viên trong độ tuổi từ 17 đến 28 tuổi chủ yếu đang tập trung vào việc theo học đại học và trung học phổ thông, trong khi số học sinh đang theo học thạc sĩ là rất ít.
dnt |> ggplot(aes(Education)) + geom_bar() + ylab ("Số học sinh sinh viên") + xlab ("Trình độ học vấn")
Selfstudy - Thời gian tự học mỗi ngày
prop.table(table(Data$Selfstudy))
##
## 1 - 2 hours 2 - 4 hours More than 4 hours
## 0.5965909 0.2869318 0.1164773
Đa số học sinh sinh viên ( khoảng 59.66%) dành từ 1 đến 2 tiếng để học trong một ngày. Điều này có nghĩa là có 317 sinh viên trong số những người được khảo sát chọn lựa cách học này. 28.69% học sinh dành từ 2 đến 4 tiếng học mỗi ngày, tương ứng với 152 học sinh. Chỉ có 11.65% học sinh (khoảng 62 học sinh) dành nhiều hơn 4 tiếng học trong một ngày.
dnt |> ggplot(aes(Selfstudy)) + geom_bar() + ylab ("Số học sinh sinh viên") + xlab ("Thời gian tự học mỗi ngày")
Job - Công việc hiện tại
prop.table(table(Data$Job))
##
## No Yes
## 0.2840909 0.7159091
Trong tổng số những người được khảo sát, có đến 71.59% trong số họ có việc làm, bao gồm cả công việc Full-time và Part-time (tương đương 380 sinh viên) và có khoảng 28.41% (tương đương với 152 sinh viên) là không đi làm.
dnt |> ggplot(aes(Job)) + geom_bar() + ylab ("Số học sinh sinh viên") + xlab ("Hiện tại có công việc làm hay không?")
Media - Thời gian dành cho phương tiện truyền thông
prop.table(table(Data$Media))
##
## 1 - 2 Hours 2 - 4 Hours More than 4 Hours Not Applicable
## 0.10795455 0.31818182 0.55965909 0.01420455
Có koảng 10.8% trong số các sinh viên được khảo sát dành từ 1 đến 2 tiếng để sử dụng phương tiện truyền thông trong một ngày, tương đương với khoảng 57 sinh viên. Xấp xỉ 31.82% dành từ 2 đến 4 tiếng để sử dụng phương tiện truyền thông hàng ngày, tương đương với khoảng 169 sinh viên và có đến 55.97% dành hơn 4 tiếng mỗi ngày để sử dụng phương tiện truyền thông (đại diện cho khoảng 296 người trong tổng số người được khảo sát).
dnt |> ggplot(aes(Media)) + geom_bar() + ylab ("Số học sinh sinh viên") + xlab ("Thời gian dành cho phương tiện truyền thông")
Depression - Trầm cảm
prop.table(table(Data$Depression))
##
## no yes
## 0.8096591 0.1903409
Trong cuộc khảo sát với sinh viên, đã có một bức tranh tổng quan về tình trạng tâm lý của họ. Dữ liệu cho thấy một sự thực khá bất ngờ và đáng báo động - có hơn một nửa số sinh viên tham gia khảo sát (cụ thể là 61.08% tổng số sinh viên, tương đương 325 sinh viên) báo cáo rằng họ có biểu hiện mắc bệnh trầm cảm. Đây là một tỷ lệ cao, và nó gợi lên một câu hỏi đáng quan ngại về tình hình tâm lý của sinh viên trong ngày nay. Có thể rằng những áp lực học tập, cuộc sống xã hội, và các vấn đề cá nhân đã góp phần tạo nên tình trạng tâm lý này. Sự lo âu, căng thẳng và áp lực có thể đã ảnh hưởng đến tinh thần và sự cân nhắc trong công việc học tập và cuộc sống hàng ngày của sinh viên. Và 38.92% (khoảng 207 sinh viên) không có biểu hiện trầm cảm hoặc trầm cảm nhẹ.
dnt |> ggplot(aes(Depression)) + geom_bar() + ylab ("Số học sinh sinh viên") + xlab ("Trầm cảm hay không?")
dnl <- Data[,c("Age","Pleasureinthings","Littleenergy","Feelingbadyourself","Feelingdown","Hurtingyourself","GPA")]
Age - Tuổi
prop.table(table(Data$Age))
##
## 17 18 19 20 21 22 23
## 0.04829545 0.05965909 0.16193182 0.07386364 0.05681818 0.04829545 0.08238636
## 24 25 26 27 28
## 0.08522727 0.13920455 0.08522727 0.09659091 0.06250000
Độ tuổi 19 có tỷ lệ xác suất bị trầm cảm cao nhất trong số các độ tuổi với xác suất khoảng 16%. Độ tuổi 20 và 25 cũng có tỷ lệ xác suất bị trầm cảm khá cao với xác suất khoảng 7.4% và 13.9% tương ứng. Trong khi đó, các độ tuổi còn lại có tỷ lệ xác suất bị trầm cảm thấp hơn, dao động từ khoảng 4.8% đến 9.6%.
dnl |> ggplot(aes(Age)) + geom_bar() + ylab ("Số học sinh sinh viên") + xlab ("Độ tuổi")
Pleasureinthings - Mức độ cảm thấy ít hứng thú với việc mình làm
prop.table(table(Data$Pleasureinthings))
##
## 1 2 3 4
## 0.1392045 0.4289773 0.3125000 0.1193182
Chưa từng cảm thấy ít hứng thú với việc mình làm chiếm 26.42%. Lâu lâu cảm thấy ít hứng thú với việc mình làm chiếm 26.14%. Thường xuyên cảm thấy ít hứng thú với việc mình làm chiếm 25.28%. Luôn cảm thấy ít hứng thú với việc mình làm chiếm 22.16%.
dnl |> ggplot(aes(Pleasureinthings)) + geom_bar() + ylab ("Số học sinh sinh viên") + xlab ("Mức độ cảm thấy ít hứng thú với việc mình làm")
Littleenergy - Mức độ cảm thấy mệt mỏi hoặc có ít năng lượng
prop.table(table(Data$Littleenergy))
##
## 1 2 3 4
## 0.1022727 0.2812500 0.2784091 0.3380682
Chưa từng cảm thấy mệt mỏi hoặc có ít năng lượng chiếm 26.42%. Lâu lâu cảm thấy mệt mỏi hoặc có ít năng lượng chiếm 26.14%. Thường xuyên cảm thấy mệt mỏi hoặc có ít năng lượng chiếm 25.28%. Luôn cảm thấy mệt mỏi hoặc có ít năng lượng chiếm 22.16%.
dnl |> ggplot(aes(Littleenergy)) + geom_bar() + ylab ("Số học sinh sinh viên") + xlab ("Mức độ cảm thấy mệt mỏi hoặc có ít năng lượng")
Feelingbadyourself - Mức độ cảm thấy tồi tệ về bản thân
prop.table(table(Data$Feelingbadyourself))
##
## 1 2 3 4
## 0.2642045 0.2613636 0.2528409 0.2215909
Chưa từng nghĩ bản thầm mình tồi tệ chiếm 26.42%. Lâu lâu nghi bản thân mình tồi tệ chiếm 26.14%. Thường xuyên suy nghĩ bản thân mình là tồi tệ chiếm 25.28%. Luôn có suy nghĩ bản thân mình tồi tệ chiếm 22.16%.
dnl |> ggplot(aes(Feelingbadyourself)) + geom_bar() + ylab ("Số học sinh sinh viên") + xlab ("Mức độ cảm thấy tồi tệ về bản thân")
Feelingdown - Mức độ cảm thấy chán nản, thất vọng
prop.table(table(Data$Feelingdown))
##
## 1 2 3 4
## 0.2840909 0.3409091 0.2301136 0.1448864
Chưa từng cảm thấy chán nản, thất vọng chiếm 28.41%. Lâu lâu cảm thấy chán nản, thất vọng chiếm 30.09%. Thường xuyên cảm thấy chán nản, thất vọng chiếm 23.01%. Luôn cảm thấy chán nản, thất vọng chiếm 14.49%.
dnl |> ggplot(aes(Feelingdown)) + geom_bar() + ylab ("Số học sinh sinh viên") + xlab ("Mức độ cảm thấy chán nản, thất vọng")
Hurtingyourself - Mức độ suy nghĩ đến cái chết hoặc tự làm tổn thương mình
prop.table(table(Data$Hurtingyourself))
##
## 1 2 3 4
## 0.65625000 0.18465909 0.08522727 0.07386364
Chưa từng suy nghĩ đến cái chết hoặc tự làm tổn thương mình chiếm 28.41%. Lâu lâu suy nghĩ đến cái chết hoặc tự làm tổn thương mình chiếm 30.09%. Thường xuyên suy nghĩ đến cái chết hoặc tự làm tổn thương mình chiếm 23.01%. Luôn suy nghĩ đến cái chết hoặc tự làm tổn thương mình chiếm 14.49%.
dnl |> ggplot(aes(Hurtingyourself)) + geom_bar() + ylab ("Số học sinh sinh viên") + xlab ("Mức độ suy nghĩ đến cái chết hoặc tự làm tổn thương mình")
risk1 <- table(Data$Depression, Data$Gender)
addmargins(risk1)
##
## Female Male Sum
## no 250 35 285
## yes 63 4 67
## Sum 313 39 352
RelRisk(risk1)
## [1] 0.9328878
Tỷ lệ sinh viên là nữ mà không có biểu hiện trầm cảm bằng 93.29% tỷ lệ sinh viên là nữ mà có biểu hiện trầm cảm. Điều này có nghĩa là tỷ lệ xác suất xảy ra sự kiện “sinh viên nữ bị trầm cảm” nhiều hơn so với xác xuất xảy ra sự kiện “sinh viên nữ không bị trầm cảm”.
risk2 <- table(Data$Depression, Data$Job)
addmargins(risk2)
##
## No Yes Sum
## no 77 208 285
## yes 23 44 67
## Sum 100 252 352
RelRisk(risk2)
## [1] 0.7870328
Tỷ lệ sinh viên không đi làm và không có biểu hiện trầm cảm bằng 78.7% tỷ lệ sinh viên không đi làm và có biểu hiện trầm cảm. Điều này có nghĩa là tỷ lệ xác suất xảy ra sự kiện “sinh viên không đi làm bị trầm cảm” nhiều hơn so với xác xuất xảy ra sự kiện “sinh viên không đi làm và không bị trầm cảm”.
odd1 <- table(Data$Depression, Data$Gender)
odd1
##
## Female Male
## no 250 35
## yes 63 4
OddsRatio(odd1)
## [1] 0.4535147
Tỷ lệ sinh viên là nữ và không bị trầm cảm bằng 45.35% Tỷ lệ sinh viên là nữ và bị trầm cảm. Điều này có nghĩa là xác xuất xảy ra sự kiện “Sinh viên nữ bị trầm cảm” nhiều hơn xác xuất xảy ra sự kiện “Sinh viên nữ khong bị trầm cảm”.
odd2 <- table(Data$Depression, Data$Job)
odd2
##
## No Yes
## no 77 208
## yes 23 44
OddsRatio(odd2)
## [1] 0.708194
Tỷ lệ sinh viên không đi làm và không bị trầm cảm chiếm 70.82% so với Tỷ lệ sinh viên không đi làm và bị trầm cảm. Điều này có nghĩa là xác xuất xảy ra sự kiện “Sinh viên không đi làm bị trầm cảm” nhiều hơn xác xuất xảy ra sự kiện “Sinh viên không đi làm và không bị trầm cảm”.
Giả thuyết:
\(H_0\): Trầm cảm và giới tính độc lập với nhau
\(H_1\): Trầm cảm và giới tính không độc lập với nhau
chisq.test(table (Data$Depression, Data$Gender))
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: table(Data$Depression, Data$Gender)
## X-squared = 1.599, df = 1, p-value = 0.206
Vì p_value = 0.0277 < 0.05 nên ta thừa nhận giả thuyết \(H_0\), thừa nhận giả thuyết \(H_1\). Nghĩa là trầm cảm và giới tính độc lập với nhau.
Giả thuyết:
\(H_0\): Trầm cảm và nơi ở hiện tại độc lập với nhau
\(H_1\): Trầm cảm và nơi ở hiện tại không độc lập với nhau
chisq.test(table (Data$Depression, Data$Accommodation))
## Warning in chisq.test(table(Data$Depression, Data$Accommodation)): Chi-squared
## approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: table(Data$Depression, Data$Accommodation)
## X-squared = 4.1666, df = 2, p-value = 0.1245
Vì p_value = 0.7874 > 0.05 nên chưa có cơ sở bác bỏ giả thuyết \(H_0\). Nghĩa là chưa thể chứng minh rằng trầm cảm và nơi ở hiện tại độc lập với nhau.
Giả thuyết:
\(H_0\): Trầm cảm và trình độ học vấn độc lập với nhau
\(H_1\): Trầm cảm và trình độ học vấn không độc lập với nhau
chisq.test(table (Data$Depression, Data$Education))
## Warning in chisq.test(table(Data$Depression, Data$Education)): Chi-squared
## approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: table(Data$Depression, Data$Education)
## X-squared = 3.9427, df = 2, p-value = 0.1393
Vì p_value = 0.3138 > 0.05 nên chưa có cơ sở bác bỏ giả thuyết \(H_0\). Nghĩa là chưa thể chứng minh được trầm cảm và trình độ học vấn độc lập với nhau.
Giả thuyết:
\(H_0\): Trầm cảm và thời gian tự học mỗi ngày độc lập với nhau
\(H_1\): Trầm cảm và thời gian tự học mỗi ngày không độc lập với nhau
chisq.test(table (Data$Depression, Data$Selfstudy))
##
## Pearson's Chi-squared test
##
## data: table(Data$Depression, Data$Selfstudy)
## X-squared = 0.13821, df = 2, p-value = 0.9332
Vì p_value = 0.7124 > 0.05 nên chưa đủ cơ sở bác bỏ giả thuyết \(H_0\). Nghĩa là chưa thể chứng minh trầm cảm và thời gian tự học mỗi ngày độc lập với nhau.
Giả thuyết:
\(H_0\): Trầm cảm và công việc hiện tại độc lập với nhau
\(H_1\): Trầm cảm và công việc hiện tại không độc lập với nhau
chisq.test(table (Data$Depression, Data$Job))
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: table(Data$Depression, Data$Job)
## X-squared = 1.0888, df = 1, p-value = 0.2967
Vì p_value = 0.7306 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết \(H_0\). Nghĩa là chưa thể chứng minh rằng trầm cảm và công việc hiện tại độc lập với nhau.
Giả thuyết:
\(H_0\): Trầm cảm và thời gian dành cho phương tiện truyền thông độc lập với nhau
\(H_1\): Trầm cảm và thời gian dành cho phương tiện truyền thông không độc lập với nhau
chisq.test(table (Data$Depression, Data$Media))
## Warning in chisq.test(table(Data$Depression, Data$Media)): Chi-squared
## approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: table(Data$Depression, Data$Media)
## X-squared = 3.3356, df = 3, p-value = 0.3427
Vì p_value = 0.1081 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết \(H_0\). Nghĩa là chưa thể chứng minh rằng trầm cảm và thời gian dành cho phương tiện truyền thông độc lập với nhau.
Giả thuyết:
\(H_0\): Trầm cảm và suy nghĩ tiêu cực độc lập với nhau
\(H_1\): Trầm cảm và suy nghĩ tiêu cực không độc lập với nhau
chisq.test(table (Data$Depression, Data$Hurtingyourself))
## Warning in chisq.test(table(Data$Depression, Data$Hurtingyourself)):
## Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: table(Data$Depression, Data$Hurtingyourself)
## X-squared = 124.87, df = 3, p-value < 2.2e-16
Vì p_value = 0.06668 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết \(H_0\). Nghĩa là chưa thể chứng minh rằng trầm cảm và suy nghĩ tiêu cực độc lập với nhau.
Ước lượng tỷ lệ bị trầm cảm và đồng thời kiểm định xem tỷ lệ sinh viên bị trầm cảm có phải là 40% hay không. Ta kiểm định giả thuyết:
\(H_0\): Tỷ lệ sinh viên bị trầm cảm là 40%
\(H_1\): Tỷ lệ sinh viên bị trầm cảm không phải là 40%
Dep <- Data[Data$Depression == "Yes",]
prop.test(length(Dep$Depression), length(Data$Depression), p = 0.4)
##
## 1-sample proportions test with continuity correction
##
## data: length(Dep$Depression) out of length(Data$Depression), null probability 0.4
## X-squared = 233, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.4
## 95 percent confidence interval:
## 0.00000000 0.01345735
## sample estimates:
## p
## 0
Vì p_value = 1.525e-15 < 0.05 nên ta bác bỏ giả thuyết \(H_0\). Nghĩa là tỷ lệ sinh viên bị trầm cảm không phải là 40%.
Với độ tin cậy 95%, ước lượng tỷ lệ sinh viên bị trầm cảm nằm trong khoảng từ 55.75% đến 66.16%.
Giả thuyết:
\(H_0\): không có sự khác biệt đáng kể trong tỷ lệ sinh viên bị trầm cảm và không bị trầm cảm về số lượng sinh viên có độ tuổi trên tuổi.
\(H_1\): có sự khác biệt đáng kể trong tỷ lệ sinh viên bị trầm cảm và không bị trầm cảm về số lượng sinh viên có độ tuổi trên 18 tuổi.
depy <- Data[Data$Depression == "yes",]
depn <- Data[Data$Depression == "no",]
depy1 <- depy[depy$Age > 18,]
depn1 <- depn[depn$Age > 18,]
a <- c(nrow(depy), nrow(depn))
b <- c(nrow(depy1), nrow(depn1))
prop.test(b,a)
##
## 2-sample test for equality of proportions with continuity correction
##
## data: b out of a
## X-squared = 4.288, df = 1, p-value = 0.03838
## alternative hypothesis: two.sided
## 95 percent confidence interval:
## 0.03114154 0.16178854
## sample estimates:
## prop 1 prop 2
## 0.9701493 0.8736842
Vì p_value = 0.03838 < 0.05 nên ta bác bỏ giả thuyết \(H_0\), thừa nhận giả thuyết \(H_1\). Nghĩa là có sự khác biệt đáng kể trong tỷ lệ giữa sinh viên bị trầm cảm và không bị trầm cảm về số lượng sinh viên lớn hơn 18 tuổi.
Giả thuyết:
\(H_0\): không có sự khác biệt đáng kể trong tỷ lệ sinh viên bị trầm cảm và không bị trầm cảm về số lượng sinh viên có mức độ cảm thấy tồi tệ về bản thân lớn hơn 2.
\(H_1\): có sự khác biệt đáng kể trong tỷ lệ sinh viên bị trầm cảm và không bị trầm cảm về số lượng sinh viên có mức độ cảm thấy tồi tệ về bản thân lớn hơn 2.
depy2 <- depy[depy$Feelingbadyourself > 2,]
depn2 <- depn[depn$Feelingbadyourself > 2,]
c <- c(nrow(depy), nrow(depn))
d <- c(nrow(depy2), nrow(depn2))
prop.test(d,c)
##
## 2-sample test for equality of proportions with continuity correction
##
## data: d out of c
## X-squared = 84.027, df = 1, p-value < 2.2e-16
## alternative hypothesis: two.sided
## 95 percent confidence interval:
## 0.5588068 0.7025706
## sample estimates:
## prop 1 prop 2
## 0.9850746 0.3543860
Vì p_value = 0.1203 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết \(H_0\). Nghĩa là không có sự khác biệt đáng kể trong tỷ lệ giữa sinh viên bị trầm cảm và không bị trầm cảm về số lượng sinh viên có mức độ cảm thấy tồi tệ về bản thân lớn hơn 2.
Giả thuyết:
\(H_0\): không có sự khác biệt đáng kể trong tỷ lệ sinh viên bị trầm cảm và không bị trầm cảm về số lượng sinh viên có mức độ cảm thấy chán nản, thất vọng lớn hơn 2.
\(H_1\): có sự khác biệt đáng kể trong tỷ lệ sinh viên bị trầm cảm và không bị trầm cảm về số lượng sinh viên có mức độ cảm thấy chán nản, thất vọng lớn hơn 2.
depy3 <- depy[depy$Feelingdown > 2,]
depn3 <- depn[depn$Feelingdown > 2,]
e <- c(nrow(depy), nrow(depn))
f <- c(nrow(depy3), nrow(depn3))
prop.test(f,e)
##
## 2-sample test for equality of proportions with continuity correction
##
## data: f out of e
## X-squared = 98.425, df = 1, p-value < 2.2e-16
## alternative hypothesis: two.sided
## 95 percent confidence interval:
## 0.5672784 0.7553715
## sample estimates:
## prop 1 prop 2
## 0.9104478 0.2491228
Vì p_value = 0.0738 > 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết \(H_0\). Nghĩa là không có sự khác biệt đáng kể trong tỷ lệ giữa sinh viên bị trầm cảm và không bị trầm cảm về số lượng sinh viên có mức độ cảm thấy chán nản, thất vọng lớn hơn 2.
Giả thuyết:
\(H_0\): không có sự khác biệt đáng kể trong tỷ lệ sinh viên bị trầm cảm và không bị trầm cảm về số lượng sinh viên có GPA lớn hơn 2.5.
\(H_1\): có sự khác biệt đáng kể trong tỷ lệ sinh viên bị trầm cảm và không bị trầm cảm về số lượng sinh viên có GPA lớn hơn 2.5.
depy4 <- depy[depy$GPA > 2.5,]
depn4 <- depn[depn$GPA > 2.5,]
g <- c(nrow(depy), nrow(depn))
h <- c(nrow(depy4), nrow(depn4))
prop.test(h,g)
##
## 2-sample test for equality of proportions with continuity correction
##
## data: h out of g
## X-squared = 5.0391, df = 1, p-value = 0.02478
## alternative hypothesis: two.sided
## 95 percent confidence interval:
## -0.29536721 -0.01424263
## sample estimates:
## prop 1 prop 2
## 0.5223881 0.6771930
Vì p_value = 0.02478 < 0.05 nên ta bác bỏ giả thuyết \(H_0\). Nghĩa là có sự khác biệt đáng kể trong tỷ lệ giữa sinh viên bị trầm cảm và không bị trầm cảm về số lượng sinh viên có GPA lớn hơn 2.5.
Từ kết quả kiểm định chi bình phương về tính độc lập của các cặp biến, ta thấy việc sinh viên có biểu hiện trầm cảm hay không có phụ thuộc vào nơi ở hiện tại, trình độ học vấn, thời gian tự học mỗi ngày, công việc, thời gian dành cho phương tiện truyền thông và suy nghĩ tiêu cực độ tuổi. Vì vậy tôi sẽ tiến hành hồi quy các biến phụ thuộc Depression với các biến độc lập tương ứng gồm
logit <- glm(factor(Depression) ~ Age + Accommodation + Education + Selfstudy + Job + Media + Pleasureinthings + Littleenergy + Feelingbadyourself + Feelingdown + Hurtingyourself + GPA, family = binomial(link = "logit"), data = Data)
summary(logit)
##
## Call:
## glm(formula = factor(Depression) ~ Age + Accommodation + Education +
## Selfstudy + Job + Media + Pleasureinthings + Littleenergy +
## Feelingbadyourself + Feelingdown + Hurtingyourself + GPA,
## family = binomial(link = "logit"), data = Data)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -40.2324 7.6700 -5.245 1.56e-07
## Age 0.1960 0.1349 1.454 0.146073
## AccommodationPrivate rented accommodation 0.4922 0.8832 0.557 0.577353
## AccommodationUniversity hall of residence 8.2988 28.3102 0.293 0.769417
## EducationHigh School -0.4012 0.8177 -0.491 0.623700
## EducationMaster -1.1330 3.1320 -0.362 0.717540
## Selfstudy2 - 4 hours 0.8745 0.8213 1.065 0.286993
## SelfstudyMore than 4 hours 0.8840 1.2399 0.713 0.475891
## JobYes -1.1385 0.8059 -1.413 0.157733
## Media2 - 4 Hours -1.3032 1.4109 -0.924 0.355674
## MediaMore than 4 Hours -1.0862 1.3014 -0.835 0.403939
## MediaNot Applicable -9.3366 1381.9083 -0.007 0.994609
## Pleasureinthings 1.7489 0.5133 3.407 0.000657
## Littleenergy 4.1948 0.9449 4.439 9.02e-06
## Feelingbadyourself 1.5323 0.4940 3.102 0.001923
## Feelingdown 1.7724 0.5477 3.236 0.001211
## Hurtingyourself 2.3757 0.5329 4.458 8.27e-06
## GPA 0.5263 0.4822 1.091 0.275130
##
## (Intercept) ***
## Age
## AccommodationPrivate rented accommodation
## AccommodationUniversity hall of residence
## EducationHigh School
## EducationMaster
## Selfstudy2 - 4 hours
## SelfstudyMore than 4 hours
## JobYes
## Media2 - 4 Hours
## MediaMore than 4 Hours
## MediaNot Applicable
## Pleasureinthings ***
## Littleenergy ***
## Feelingbadyourself **
## Feelingdown **
## Hurtingyourself ***
## GPA
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 342.649 on 351 degrees of freedom
## Residual deviance: 67.525 on 334 degrees of freedom
## AIC: 103.53
##
## Number of Fisher Scoring iterations: 16
# Giá trị BrierScore
BrierScore(logit)
## [1] 0.02834899
# Ma trận nhầm lẫn
a <- predict(logit, type = "response")
b <- ifelse(a > 0.5, "1", "0")
c <-factor(b, levels = c("0","1"))
d <- factor(Data$Depression, labels = c("0","1"))
confusionMatrix(table(c, d))
## Confusion Matrix and Statistics
##
## d
## c 0 1
## 0 281 7
## 1 4 60
##
## Accuracy : 0.9688
## 95% CI : (0.9448, 0.9843)
## No Information Rate : 0.8097
## P-Value [Acc > NIR] : <2e-16
##
## Kappa : 0.8968
##
## Mcnemar's Test P-Value : 0.5465
##
## Sensitivity : 0.9860
## Specificity : 0.8955
## Pos Pred Value : 0.9757
## Neg Pred Value : 0.9375
## Prevalence : 0.8097
## Detection Rate : 0.7983
## Detection Prevalence : 0.8182
## Balanced Accuracy : 0.9407
##
## 'Positive' Class : 0
##
probit <- glm(factor(Depression) ~ Age + Accommodation + Education + Selfstudy + Job + Media + Pleasureinthings + Littleenergy + Feelingbadyourself + Feelingdown + Hurtingyourself + GPA, family = binomial(link = "probit"), data = Data)
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
summary(probit)
##
## Call:
## glm(formula = factor(Depression) ~ Age + Accommodation + Education +
## Selfstudy + Job + Media + Pleasureinthings + Littleenergy +
## Feelingbadyourself + Feelingdown + Hurtingyourself + GPA,
## family = binomial(link = "probit"), data = Data)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -22.17396 3.82511 -5.797 6.75e-09
## Age 0.11301 0.07176 1.575 0.115302
## AccommodationPrivate rented accommodation 0.21942 0.46457 0.472 0.636710
## AccommodationUniversity hall of residence 4.34194 35.22767 0.123 0.901906
## EducationHigh School -0.24837 0.43202 -0.575 0.565346
## EducationMaster -0.59331 1.40413 -0.423 0.672627
## Selfstudy2 - 4 hours 0.49737 0.44686 1.113 0.265697
## SelfstudyMore than 4 hours 0.44439 0.65346 0.680 0.496474
## JobYes -0.54716 0.43147 -1.268 0.204757
## Media2 - 4 Hours -0.89481 0.73085 -1.224 0.220820
## MediaMore than 4 Hours -0.73159 0.67944 -1.077 0.281589
## MediaNot Applicable -1.65570 319.39902 -0.005 0.995864
## Pleasureinthings 0.94097 0.26887 3.500 0.000466
## Littleenergy 2.35000 0.48218 4.874 1.10e-06
## Feelingbadyourself 0.82807 0.25793 3.210 0.001325
## Feelingdown 0.96590 0.28763 3.358 0.000785
## Hurtingyourself 1.37164 0.28234 4.858 1.19e-06
## GPA 0.26057 0.25891 1.006 0.314218
##
## (Intercept) ***
## Age
## AccommodationPrivate rented accommodation
## AccommodationUniversity hall of residence
## EducationHigh School
## EducationMaster
## Selfstudy2 - 4 hours
## SelfstudyMore than 4 hours
## JobYes
## Media2 - 4 Hours
## MediaMore than 4 Hours
## MediaNot Applicable
## Pleasureinthings ***
## Littleenergy ***
## Feelingbadyourself **
## Feelingdown ***
## Hurtingyourself ***
## GPA
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 342.649 on 351 degrees of freedom
## Residual deviance: 67.263 on 334 degrees of freedom
## AIC: 103.26
##
## Number of Fisher Scoring iterations: 16
# Giá trị BrierScore
BrierScore(probit)
## [1] 0.02927245
# Ma trận nhầm lẫn
a <- predict(probit, type = "response")
b <- ifelse(a > 0.5, "1", "0")
c <-factor(b, levels = c("0","1"))
d <- factor(Data$Depression, labels = c("0","1"))
confusionMatrix(table(c, d))
## Confusion Matrix and Statistics
##
## d
## c 0 1
## 0 280 7
## 1 5 60
##
## Accuracy : 0.9659
## 95% CI : (0.9412, 0.9823)
## No Information Rate : 0.8097
## P-Value [Acc > NIR] : <2e-16
##
## Kappa : 0.8881
##
## Mcnemar's Test P-Value : 0.7728
##
## Sensitivity : 0.9825
## Specificity : 0.8955
## Pos Pred Value : 0.9756
## Neg Pred Value : 0.9231
## Prevalence : 0.8097
## Detection Rate : 0.7955
## Detection Prevalence : 0.8153
## Balanced Accuracy : 0.9390
##
## 'Positive' Class : 0
##
cloglog <- glm(factor(Depression) ~ Age + Accommodation + Education + Selfstudy + Job + Media + Pleasureinthings + Littleenergy + Feelingbadyourself + Feelingdown + Hurtingyourself + GPA, family = binomial(link = "cloglog"), data = Data)
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
summary(cloglog)
##
## Call:
## glm(formula = factor(Depression) ~ Age + Accommodation + Education +
## Selfstudy + Job + Media + Pleasureinthings + Littleenergy +
## Feelingbadyourself + Feelingdown + Hurtingyourself + GPA,
## family = binomial(link = "cloglog"), data = Data)
##
## Coefficients:
## Estimate Std. Error z value
## (Intercept) -32.05114 5.95505 -5.382
## Age 0.12904 0.09791 1.318
## AccommodationPrivate rented accommodation 0.33426 0.62927 0.531
## AccommodationUniversity hall of residence 3.91989 36.10039 0.109
## EducationHigh School -0.14362 0.58262 -0.247
## EducationMaster -1.36118 1.83851 -0.740
## Selfstudy2 - 4 hours 0.53033 0.52971 1.001
## SelfstudyMore than 4 hours 0.15878 1.08036 0.147
## JobYes -0.76930 0.57257 -1.344
## Media2 - 4 Hours -0.71620 1.19562 -0.599
## MediaMore than 4 Hours -0.61359 1.12455 -0.546
## MediaNot Applicable -11.19030 2307.27853 -0.005
## Pleasureinthings 1.39495 0.36017 3.873
## Littleenergy 3.35290 0.71213 4.708
## Feelingbadyourself 1.22262 0.38296 3.193
## Feelingdown 1.37264 0.38145 3.598
## Hurtingyourself 1.74214 0.38047 4.579
## GPA 0.46707 0.35210 1.327
## Pr(>|z|)
## (Intercept) 7.36e-08 ***
## Age 0.187508
## AccommodationPrivate rented accommodation 0.595284
## AccommodationUniversity hall of residence 0.913533
## EducationHigh School 0.805288
## EducationMaster 0.459075
## Selfstudy2 - 4 hours 0.316743
## SelfstudyMore than 4 hours 0.883154
## JobYes 0.179077
## Media2 - 4 Hours 0.549160
## MediaMore than 4 Hours 0.585320
## MediaNot Applicable 0.996130
## Pleasureinthings 0.000107 ***
## Littleenergy 2.50e-06 ***
## Feelingbadyourself 0.001410 **
## Feelingdown 0.000320 ***
## Hurtingyourself 4.67e-06 ***
## GPA 0.184662
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 342.649 on 351 degrees of freedom
## Residual deviance: 65.729 on 334 degrees of freedom
## AIC: 101.73
##
## Number of Fisher Scoring iterations: 17
# Giá trị BrierScore
BrierScore(cloglog)
## [1] 0.02765064
# Ma trận nhầm lẫn
a <- predict(cloglog, type = "response")
b <- ifelse(a > 0.5, "1", "0")
c <-factor(b, levels = c("0","1"))
d <- factor(Data$Depression, labels = c("0","1"))
confusionMatrix(table(c, d))
## Confusion Matrix and Statistics
##
## d
## c 0 1
## 0 281 8
## 1 4 59
##
## Accuracy : 0.9659
## 95% CI : (0.9412, 0.9823)
## No Information Rate : 0.8097
## P-Value [Acc > NIR] : <2e-16
##
## Kappa : 0.8868
##
## Mcnemar's Test P-Value : 0.3865
##
## Sensitivity : 0.9860
## Specificity : 0.8806
## Pos Pred Value : 0.9723
## Neg Pred Value : 0.9365
## Prevalence : 0.8097
## Detection Rate : 0.7983
## Detection Prevalence : 0.8210
## Balanced Accuracy : 0.9333
##
## 'Positive' Class : 0
##
| Mô hình | Chỉ số AIC | Deviance | Brier Score | Confusion matrix |
|---|---|---|---|---|
| logit | 103.53 | 67.525 | 0.02834899 | 0.9688 |
| probit | 103.26 | 67.263 | 0.02927245 | 0.9659 |
| cloglog | 101.73 | 65.729 | 0.02765064 | 0.9659 |
| Lựa chọn | cloglog | cloglog | cloglog | logit |
Dựa vào bảng kết quả của 3 mô hình, các chỉ số AIC, Deviance và Brier Score đều chỉ ra mô hình probit là tốt nhất. Ma trận nhầm lẫn thì cho kết quả là mô hình logit là tốt nhất. Do mô hình cloglog là đạt nhiều tiêu chí nhất nên ta có thể kết luận rằng mô hình cloglog là phù hợp nhất trong 3 mô hình để mô tả sự ảnh hưởng của các yếu tố đến trầm cảm ở sinh viên.
Trong bài nghiên cứu này, chúng ta đã tìm hiểu về rối loạn trầm cảm và những tác động của nó đến sinh viên trong giai đoạn học đại học. Rối loạn trầm cảm là một vấn đề tâm lý nghiêm trọng có thể ảnh hưởng đến sức khỏe tinh thần và cuộc sống hàng ngày của sinh viên.
Nhận thức về rối loạn trầm cảm là một yếu tố quan trọng trong việc giảm nguy cơ mắc phải và tăng cơ hội phòng ngừa và điều trị kịp thời. Nhà trường, giảng viên và sinh viên đều cần chung tay nâng cao nhận thức về vấn đề này. Các chương trình, hoạt động ngoại khóa, tập huấn, hội thảo cần được tổ chức để cung cấp cho sinh viên kiến thức và thông tin chính xác về rối loạn trầm cảm.
Nhà trường cần tổ chức các chương trình, hoạt động ngoại khóa, tập huấn, hội thảo về vấn đề rối loạn trầm cảm để nâng cao nhận thức của sinh viên về vấn đề này. Việc này giúp giáo dục và tạo cơ hội cho sinh viên hiểu rõ hơn về trầm cảm, cách nhận biết triệu chứng, và tìm kiếm giúp đỡ kịp thời khi cần.
Có thể tổ chức các trung tâm tư vấn học đường tại các nhà trường, nhằm hỗ trợ kịp thời cho những đối tượng sinh viên có nhu cầu chia sẻ, giải tỏa những cảm xúc tiêu cực. Đồng thời Các chuyên viên tư vấn trong phòng tham vấn học đường sẽ đóng vai trò là những nguồn thông tin chính thống, cung cấp kiến thức đầy đủ và chính xác về rối loạn trầm cảm, từ đó giúp sinh viên hiểu rõ hơn về vấn đề này và cách giải quyết.
Ngoài ra, nhà trường cần sắp xếp lịch học, chương trình học hợp lý, thiết kế các sân chơi lành mạnh cho sinh viên để giảm bớt sự căng thẳng, áp lực học tập cho sinh viên.
Việc nâng cao kiến thức cho sinh viên về rối loạn trầm cảm, không ai làm tốt việc này hơn chính bản thân sinh viên. Sinh viên cần phải đánh giá đúng đắn tầm quan trọng của việc chăm sóc sức khỏe tinh thần của bản thân. Từ đó xây dựng chế độ sinh hoạt hợp lý và có những biện pháp phòng ngừa các rối nhiễu tâm lý nói chung và rối loạn trầm cảm nói riêng. Để làm được điều này, sinh viên cần chủ động tìm hiểu các kiến thức về rối loạn trầm cảm, cần phải biết lựa chọn kênh thông tin tin cậy để có những hiểu biết chính xác và khoa học về vấn đề này.
Trong cuộc sống hàng ngày, nếu sinh viên cảm thấy xuất hiện những cảm xúc tiêu cực, họ nên tự tìm hiểu nguyên nhân và tìm đến sự trợ giúp từ những người xung quanh. Đây là cách giúp sinh viên tự quản lý tình hình tâm lý và duy trì sức khỏe tinh thần tốt hơn.
Phạm vi nghiên cứu hạn chế: Đề tài có thể tập trung vào một số đối tượng hoặc nhóm sinh viên cụ thể, giới hạn trong một khu vực địa lý hoặc một trường đại học cụ thể. Điều này có thể làm giảm tính đại diện và khả năng tổng quát hóa kết quả cho toàn bộ sinh viên.
Thiếu dữ liệu chi tiết: Việc thiếu thông tin chi tiết về các yếu tố cá nhân, văn hóa, và xã hội của sinh viên có thể ảnh hưởng đến độ tin cậy và khả năng phân tích sâu hơn về các nguyên nhân và hậu quả của rối loạn trầm cảm.
Bên cạnh đó, cả ba mô hình được đề xuất trong nghiên cứu chưa thực sự giải thích hết được các yếu tố tác động đến việc trầm cảm ở sinh viên. Như vậy vẫn còn những yếu tố khác tác động nhưng chưa được nghiên cứu bao quát hết trong mô hình đề ra.
Để đảm bảo tính đại diện, nghiên cứu có thể mở rộng phạm vi để nghiên cứu đa trường hợp ở nhiều trường đại học, từ đó thu thập dữ liệu đa dạng về sinh viên và nhận thức về rối loạn trầm cảm.
[1] Cẩm, B. H., Hoàng, T. T., & Linh, T. H. (2021). Trầm cảm của sinh viên y khoa: Góc nhìn của sinh viên y khoa qua một nghiên cứu định tính. Tạp chí Nghiên cứu Y học, 143(7), 209-215.
[2] Hiền, T. T., Quang, N. V., & Mai, N. T. T. (2021). Thực trạng trầm cảm của sinh viên chính quy năm cuối thuộc các chuyên ngành tại trường Đại học Y Dược Thái Nguyên và một số yếu tố liên quan năm học 2020-2021. Tạp chí Y học Dự phòng, 31(9 Phụ bản), 81-87.
[3] Bahrami, S., Rajaeepour, S., Rizi, H. A., Zahmatkesh, M., & Nematolahi, Z. (2011). The relationship between students’ study habits, happiness and depression. Iranian journal of nursing and midwifery research, 16(3), 217.
[4] Ceyhan, A. A., Ceyhan, E., & Kurtyılmaz, Y. (2009). Investigation of University Students’ Depression. Eurasian Journal of Educational Research (EJER), (36).
[5] Iorga, M., Dondas, C., & Zugun-Eloae, C. (2018). Depressed as freshmen, stressed as seniors: The relationship between depression, perceived stress and academic results among medical students. Behavioral Sciences, 8(8), 70.
[6] Jayanthi, P., Thirunavukarasu, M., & Rajkumar, R. (2015). Academic stress and depression among adolescents: A cross-sectional study. Indian pediatrics, 52, 217-219.
[7] Hamasha, A. A. H., Kareem, Y. M., Alghamdi, M. S., Algarni, M. S., Alahedib, K. S., & Alharbi, F. A. (2019). Risk indicators of depression among medical, dental, nursing, pharmacology, and other medical science students in Saudi Arabia. International Review of Psychiatry, 31(7-8), 646-652.
[8] Lee, J., Jeong, H. J., & Kim, S. (2021). Stress, anxiety, and depression among undergraduate students during the COVID-19 pandemic and their use of mental health services. Innovative higher education, 46, 519-538.
[9] Kawsar, L. A., Zahan, F. N., & Islam, M. A. (2019). Relationships among statistics anxiety, depression and academic performance. Data Science and SDGs: Challenges, Opportunities and Realities.
[10] Khodadadi, B., Anbari, K. H., & Farahani, S. M. (2018). Evaluation of anxiety, stress and depression among students of Lorestan University of Medical Sciences, 2016. Journal of Research in Medical and Dental Science, 6(1), 258-294.
[11] Sidana, S., Kishore, J., Ghosh, V., Gulati, D., Jiloha, R. C., & Anand, T. (2012). Prevalence of depression in students of a medical college in New Delhi: a cross-sectional study. The Australasian medical journal, 5(5), 247.
[12] Syed, A., Ali, S. S., & Khan, M. (2018). Frequency of depression, anxiety and stress among the undergraduate physiotherapy students. Pakistan journal of medical sciences, 34(2), 468.