library(dplyr)
## Warning: package 'dplyr' was built under R version 4.2.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.3
library(DT)
## Warning: package 'DT' was built under R version 4.2.3
library(stats)
library(epitools)
library(DescTools)
## Warning: package 'DescTools' was built under R version 4.2.3
library(caret)
## Warning: package 'caret' was built under R version 4.2.3
## Loading required package: lattice
##
## Attaching package: 'caret'
## The following objects are masked from 'package:DescTools':
##
## MAE, RMSE
Sức khỏe tinh thần của sinh viên hiện nay đang là một vấn đề đáng quan tâm. Theo một nghiên cứu của Tổ chức Y tế Thế giới (WHO), tỷ lệ sinh viên mắc các vấn đề về sức khỏe tâm thần, bao gồm lo lắng, trầm cảm và rối loạn ăn uống, đã tăng lên đáng kể trong những năm gần đây.
Có nhiều nguyên nhân dẫn đến tình trạng này, bao gồm:
Áp lực học tập: Sinh viên phải đối mặt với nhiều áp lực học tập, từ việc phải học tập với khối lượng kiến thức lớn đến việc phải cạnh tranh với các bạn bè khác để đạt được thành tích cao.
Mâu thuẫn gia đình: Mâu thuẫn gia đình có thể là một trong những nguyên nhân gây căng thẳng và ảnh hưởng đến sức khỏe tinh thần của sinh viên.
Tự ti về bản thân: Nhiều sinh viên có cảm giác tự ti về bản thân, về ngoại hình, về khả năng học tập hoặc về tương lai của mình.
Trải qua các sự kiện đau buồn: Sinh viên có thể trải qua các sự kiện đau buồn như mất mát người thân, chia tay bạn bè hoặc bị áp lực về tài chính.
Sức khỏe tinh thần của sinh viên có ảnh hưởng rất lớn đến cuộc sống của họ. Khi bị các vấn đề về sức khỏe tâm thần, sinh viên có thể gặp khó khăn trong việc học tập, trong các mối quan hệ và trong cuộc sống hàng ngày. Họ cũng có nguy cơ cao mắc các bệnh lý về thể chất, như tim mạch, tiểu đường và béo phì.
Chính vì thế, tôi thực hiện nghiên cứu về các yếu tố tác động đến sức khỏe tinh thần của sinh viên đại học từ 18-24 tuổi dựa trên bảng khảo sát thông tin về tâm lý sinh viên ở Mỹ. Thông tin thu được từ phân tích tâm lý có thể được sử dụng để phát triển các chương trình giảng dạy và phương pháp giảng dạy phù hợp với nhu cầu của sinh viên. Điều này có thể giúp cải thiện kết quả học tập của sinh viên. Phân tích tâm lý có thể được sử dụng để phát hiện các yếu tố nguy cơ dẫn đến bỏ học, chẳng hạn như trầm cảm, lo lắng và các vấn đề về sức khỏe tâm thần khác. Thông tin này có thể được sử dụng để cung cấp các dịch vụ hỗ trợ cho sinh viên, giúp họ giảm thiểu nguy cơ bỏ học. Phân tích tâm lý có thể được sử dụng để xác định các yếu tố thúc đẩy sự tham gia của sinh viên, chẳng hạn như cảm giác được kết nối với cộng đồng, cảm giác có mục đích và cảm giác được tôn trọng. Giúp sinh viên hiểu rõ hơn về điểm mạnh và điểm yếu của họ, cũng như mục tiêu và giá trị của họ.
Từ các thông tin có được từ việc phân tích các yếu tố tác động đến sức khỏe tinh thần của sinh viên đại học, tôi có thể hiểu được nguyên nhân chủ yếu dẫn đến sự suy giảm về mặt tinh thần của các sinh viên đại học, từ đó nghiên cứu các giải pháp cải thiện tâm lý để sinh viên có thể làm việc và học tập hiệu quả hơn.
Bài viết phân tích các yếu tố tác động đến sức khỏe của sinh viên một trường đại học tại Mỹ trong độ tuổi 18-24 thông qua một cuộc khảo sát trên google form từ 08/07/2020 đến 13/07/2020.
Mô hình hồi quy tuyến tính tổng quát (GLM) là một mô hình thống kê được sử dụng để mô tả mối quan hệ giữa một biến phụ thuộc và một hoặc nhiều biến độc lập. GLM là một mô hình phân phối xác suất cho biến phụ thuộc, trong đó tham số phân phối phụ thuộc vào biến độc lập.
GLM là một mô hình linh hoạt có thể được sử dụng để mô tả nhiều loại dữ liệu, bao gồm dữ liệu định lượng, dữ liệu định tính và dữ liệu thời gian. GLM cũng có thể được sử dụng để mô tả các mối quan hệ tuyến tính và phi tuyến giữa biến phụ thuộc và biến độc lập.
Một số GLM phổ biến bao gồm: Mô hình hồi quy tuyến tính, Mô hình hồi quy logistic, Mô hình hồi quy Poisson, Mô hình hồi quy sinh, Mô hình hồi quy Weibull
GLM là một công cụ mạnh mẽ có thể được sử dụng để mô tả nhiều loại dữ liệu và mối quan hệ giữa các biến. GLM được sử dụng trong nhiều lĩnh vực khác nhau, bao gồm khoa học, y tế, kinh doanh và xã hội học.
Theo WHO (2001), sức khỏe tâm thần (SKTT) bao gồm (i) sự vắng mặt của rối loạn tâm thần (RLTT) và (ii) sự hiện diện của sự an lạc (well-being) (Bratman và cs., 2019). RLTT liên quan đến việc xuất hiện các rối loạn về nhận thức, ảnh hưởng và hành vi, thường được xác định thông qua Cẩm nang Chẩn đoán và Thống kê Rối loạn Tâm thần (DSM) hoặc Phân loại Quốc tế về Bệnh tật (ICD). Chúng bao gồm các tình trạng phổ biến như trầm cảm, lo lắng, mất trí nhớ và rối loạn sử dụng chất kích thích, cũng như các bệnh ít phổ biến hơn nhưng thường nghiêm trọng như tâm thần phân liệt và rối loạn lưỡng cực (Bratman và cs., 2019). Sự an lạc chứa đựng nhiều thành phần tình cảm và nhận thức, gồm có (1) hạnh phúc: thường xuyên trải nghiệm những cảm xúc tích cực, như là niềm vui, sự phấn khích và sự hài lòng, kếp hợp với việc cảm thấy cuộc sống mình có ý nghĩa, có mục đích, viên mãn; (2) tự thực hiện (self-actualization): thành tựu, sự minh mẫn và lạc quan; (3) sự phục hồi tâm lý, kiên cường, bản lĩnh (resilience): có khả năng ứng phó với khó khăn; điều tiết cảm xúc; không có những cách giải quyết vấn đề kém thích nghi và (4) các mối quan hệ lành mạnh (Bratman và cs., 2019).
Ngày càng nhiều thống kê cho thấy RLTT ở thiếu niên và thanh niên (TN) đang gia tăng về số lượng cũng như mức độ nghiêm trọng (WHO, 2017). Đối với TN đang theo học đại học, dù những năm tháng trên giảng đường là có thể là thời khắc đẹp đẽ của thanh xuân nhưng những thách thức về xã hội, cảm xúc và trí tuệ mà họ phải đối mặt lại nhiều hơn hầu hết các giai đoạn khác của giáo dục (Rodgers và Tennison, 2009). Kết quả là họ trở nên dễ nhạy cảm và dễ bị tổn thương hơn với những RLTT (Eisenberg và cs., 2007). Các nghiên cứu về tính phổ biến của các vấn đề về SKTT phát hiện rằng trên toàn thế giới có một số lượng đáng kể sinh viên (SV) đang trải qua các RLTT (Nordin và cs., 2009; Pham và cs., 2019) và rằng RLTT ở SV đang gia tăng về số lượng cũng như mức độ nghiêm trọng (Hunt và Eisenberg, 2010; Ibrahim và cs., 2013).
Theo nghiên cứu của Pham và cộng sự (2019), tỷ lệ SV mắc trầm cảm và/ hoặc có các triệu chứng lo âu sử dụng các dịch vụ chăm sóc SKTT là 12,5%, theo nghiên cứu của Cadigan và cộng sự (2019), tỷ lệ này thấp hơn ở Mỹ (28%). Theo nghiên cứu của Coles (2016), tỷ lệ SV Việt Nam phát hiện các vấn đề về SKTT thấp hơn ở các nước phát triển. Ngoài ra, đa số người Việt Nam có ít kiến thức về việc nhận các dịch vụ hỗ trợ SKTT (Nguyen và Nguyen, 2018). Các vấn đề về SKTT có thể ảnh hưởng đến thành tích học tập và chất lượng cuộc sống (Pillay và cs., 2016) và có thể dẫn đến nghiện rượu, hút thuốc lá, ít đồng cảm, gian lận trong thi cử và tự tử (Ip và cs., 2016).
Các nguyên nhân gây ra các vấn đề về SKTT ở SV như lần đầu tiên sống tự lập xa nhà, thích nghi với lối sống và phong cách học tập, sinh hoạt mới ở bậc đại học, các vấn đề về tài chính, động lực, tự ra quyết định (Coley và cs., 2014; McLafferty và cs., 2017). Nếu trước kia người mắc trầm cảm đa phần nằm trong độ tuổi từ 60 - 65 tuổi, thì hiện nay trầm cảm đang có xu hướng trẻ hóa với độ tuổi từ 15 - 27 tuổi.
Theo nghiên cứu của Pham và cộng sự (2019), tỷ lệ SV mắc trầm cảm và/ hoặc có các triệu chứng lo âu sử dụng các dịch vụ chăm sóc SKTT là 12,5%, theo nghiên cứu của Cadigan và cộng sự (2019), tỷ lệ này thấp hơn ở Mỹ (28%). Theo nghiên cứu của Coles (2016), tỷ lệ SV Việt Nam phát hiện các vấn đề về SKTT thấp hơn ở các nước phát triển. Ngoài ra, đa số người Việt Nam có ít kiến thức về việc nhận các dịch vụ hỗ trợ SKTT (Nguyen và Nguyen, 2018). Các vấn đề về SKTT có thể ảnh hưởng đến thành tích học tập và chất lượng cuộc sống (Pillay và cs., 2016) và có thể dẫn đến nghiện rượu, hút thuốc lá, ít đồng cảm, gian lận trong thi cử và tự tử (Ip và cs., 2016).
Trầm cảm là một bệnh thuộc tâm thần học đặc trưng bởi sự rối loạn khí sắc. Bệnh do hoạt động của não bộ bị rối loạn gây nên do một yếu tố tâm lý nào nào tạo thành những biến đổi bất thường trong suy nghĩ hành vi tác phong.
Tỉ lệ mắc bệnh trầm cảm ngày một gia tăng, theo tổ chức Y tế Thế giới ước tính mỗi năm có khoảng 850000 chết do hành vi tự sát do bệnh trầm cảm, là một bệnh phổ biến ở trên toàn cầu. Tuy nhiên trong số đó những người được chẩn đoán và điều trị kịp thời còn rất thấp chiếm khoảng 25%. Trầm cảm là nguyên nhân của hơn 50% trường hợp tự sát, trầm cảm do nguyên nhân khác nhau nhưng gặp tỉ lệ cao ở các đối tượng thất nghiệp, phá sản, ly hôn,…
Trầm cảm ở thanh thiếu niên là một vấn đề sức khỏe tâm thần nghiêm trọng gây ra cảm giác buồn bã và mất hứng thú với các hoạt động trong cuộc sống. Nó ảnh hưởng đến cách những đứa trẻ ở tuổi thanh thiếu niên nghĩ, cảm nhận và hành xử, nó cũng có thể gây ra các vấn đề về cảm xúc, chức năng và thể chất. Mặc dù trầm cảm có thể xảy ra bất cứ lúc nào trong cuộc đời, các triệu chứng ở thanh thiếu niên có thể khác nhau giữa người trưởng thành.
Các vấn đề như áp lực cuộc sống, thành tích học tập và sự thay đổi cơ thể có thể mang lại nhiều cảm xúc buồn lo ở thanh thiếu niên. Nhưng đối với một số thanh thiếu niên, những tâm trạng buồn rầu này không chỉ là cảm giác tạm thời – chúng là triệu chứng của trầm cảm.
Các nhà khoa học chưa biết nguyên nhân chính xác của trầm cảm, có thể là do sự kết hợp phức tạp của các yếu tố bao gồm:
Hóa học não: Một số bộ phận thần kinh phản ứng tự nhiên xuất hiện hóa chất não mang tín hiệu đến các phần khác của não và cơ thể. Khi các hóa chất này bất thường hay bị suy giảm, chức năng của các dây thần kinh và hệ thần kinh thay đổi, dẫn đến trầm cảm.
Hormone: Thay đổi trong số lượng hormone của cơ thể có thể gây ra sự trầm cảm. Yếu tố di truyền: Trầm cảm phổ biến hơn ở những người có người thân như cha mẹ hay ông bà mắc trầm cảm.
-Tổn thương thời thơ ấu: Các tổn thương trong thời thơ ấu, như lạm dụng thể chất hay cảm xúc, hay mất đi cha mẹ, có thể gây ra những thay đổi trong não làm cho người ta dễ bị trầm cảm hơn.
Trầm cảm không được chữa trị kịp thời có thể dẫn đến các vấn đề cảm xúc, hành vi và sức khỏe và mọi phương diện trong cuộc sống của thanh thiếu niên. Các triệu chứng trầm cảm có lẽ sẽ không khá lên, thậm chí có thể trầm trọng hơn hoặc dẫn đến nhiều vấn đề khác nếu không được chữa trị. Đứa trẻ ở tuổi thanh thiếu niên bị trầm cảm có thể có nguy cơ tự sát, cho dù các dấu hiệu và triệu chứng không có vẻ nghiêm trọng.
Rối loạn lo âu là một rối loạn cảm xúc đặc trưng bởi cảm giác lo sợ lan tỏa, khó chịu mơ hồ kèm theo các triệu chứng thần kinh tự chủ như đau đầu, vã mồ hôi, hồi hộp, siết chặt ở ngực, khô miệng, khó chịu ở thượng vị, bứt rứt không thể ngồi yên hay đứng yên một chỗ.
Rối loạn lo âu rất đa dạng, đó có thể là rối loạn lo âu tổng quát, rối loạn lo âu xã hội (ám ảnh xã hội), là nỗi ám ảnh cụ thể của mỗi cá nhân hay các rối loạn lo âu tách biệt. Dưới đây là liệt kê một số loại rối loạn lo âu thường gặp:
Rối loạn lo âu lan tỏa: hay còn gọi là rối loạn lo âu toàn thể là sự lo âu, lo lắng quá mức nhiều sự kiện, hoạt động. Sự lo âu là khó kiểm soát, kết hợp các triệu chứng cơ thể như căng thẳng cơ, bực tức, khó ngủ, bứt rứt, gây khó chịu cho người bệnh và ảnh hưởng đến nhiều lĩnh vực quan trọng trong đời sống của họ.
Rối loạn ám ảnh cưỡng chế (OCD): người mắc rối loạn thường có những suy nghĩ ám ảnh và hành vi lặp đi lặp lại không thể kiểm soát. Điển hình như hành vi rửa tay liên tục, lau dọn, sắp xếp đồ đạc liên tục vì sợ vi khuẩn, vi trùng…. Các ám ảnh, cưỡng chế chiếm nhiều thời gian và ảnh hưởng rõ rệt đến sinh hoạt, hoạt động xã hội và nghề nghiệp cũng như các mối quan hệ của người bệnh. Các ám ảnh hay gặp là ý nghĩ lặp đi lặp lại về việc bị lây bệnh, nghi ngờ điều gì đó, nhu cầu sắp xếp đồ đạc theo thứ tự….Cưỡng chế là các hành vi lặp đi lặp lại (rửa tay, sắp xếp, kiểm tra…). Trong hầu hết trường hợp, người bệnh cảm thấy bó buộc thực hiện hành vi cưỡng chế để giảm sự đau khổ đi kèm ám ảnh. Ví dụ, người ám ảnh bị lây bệnh rửa tay liên tục để giảm đi ám ảnh đó. Do cả ám ảnh và hành vi cưỡng chế gây mất tập trung, nên rối loạn làm giảm hiệu quả công việc của người bệnh, hoặc họ tránh né các hoạt động, sự kiện dễ làm họ cảm thấy lo âu, ám ảnh. Sự tránh né này làm hạn chế các hoạt động đời sống, mối quan hệ của họ.
Rối loạn hoảng loạn: Biểu hiện chính là những cơn hoảng sợ, tâm lý người bệnh bị cảm giác sợ hãi cực độ chi phối. Cơn hoảng sợ thường ngắn và đột ngột, gây ra các phản ứng dữ dội ở cơ thể như đau tim, khó thở, đau ngực…Người bệnh có xu hướng tránh xa những nơi có cơn hoảng sợ xảy ra. Trong một số trường hợp, nỗi sợ lấn át người bệnh, khiến họ cố thủ trong nhà, hạn chế giao tiếp. Bệnh này đặc trưng bởi cơn lo âu dữ dội (hoảng loạn) tái diễn nhưng không giới hạn vào bất kỳ tình huống hoặc hoàn cảnh đặc biệt nào. Các triệu chứng thay đổi tùy theo từng người bệnh, nhưng thường khởi đầu với tim đập nhanh, đau ngực, nghẹt thở, choáng váng… Ngoài ra, người bệnh còn có biểu hiện khác như sợ chết, sợ phát điên… Các cơn hoảng loạn thường kéo dài trong vài phút hoặc lâu hơn.
Nỗi ám ảnh xã hội (hay Rối loạn lo âu xã hội): Là một rối loạn lo âu đặc trưng bởi sự lo lắng quá mức trong các tình huống xã hội hàng ngày. Lo sợ và lo âu ở những người có ám ảnh sợ xã hội thường tập trung vào việc bị xấu hổ hoặc bị bẽ mặt nếu họ không đáp ứng được mong đợi. Ví dụ như sợ nói trước đám đông, sợ ánh đèn sân khấu, sợ gặp gỡ người lạ, …
Nguyên nhân của các rối loạn lo âu chưa được biết đầy đủ, nhưng cả hai yếu tố tâm thần và yếu tố y học chung đều có liên quan. Nhiều người phát triển rối loạn lo âu mà không có bất kỳ triệu chứng báo trước nào. Lo âu có thể là một phản ứng đối với những căng thẳng về môi trường, ví dụ như sự kết thúc của một mối quan hệ quan trọng hoặc tiếp xúc với một thảm hoạ đe dọa mạng sống. Lo âu có thể phát sinh đột ngột, như trong hoảng sợ, hoặc dần dần trong nhiều phút, nhiều giờ, hoặc thậm chí cả ngày. Lo âu có thể kéo dài từ vài giây đến nhiều năm; thời gian dài hơn là đặc trưng của rối loạn lo âu. Sự lo âu bao gồm từ những cảm giác không rõ ràng đến sự hoảng loạn thực sự. Khả năng chịu đựng một mức độ lo âu nhất định khác nhau giữa người này với người khác.
Phân phối Poisson là một phân phối xác suất cho số lần xảy ra của một sự kiện trong một khoảng thời gian cố định, khi mỗi sự kiện xảy ra độc lập với các sự kiện khác và xác suất xảy ra của sự kiện là như nhau trong mỗi khoảng thời gian.
Phân phối Poisson được mô tả bởi hai tham số:
\(λ:\) là trung bình số lần xảy ra của sự kiện trong mỗi khoảng thời gian.
\(k:\) là số lần xảy ra của sự kiện trong khoảng thời gian.
Biến ngẫu nhiên X có phân phối Poisson là biến ngẫu nhiên dùng để mô tả cho số lần xảy ra của một sự việc/biến cố (event) mà chúng ta quan tâm xảy ra trong một khoảng thời gian hoặc không gian cho trước.
Xác suất để biến ngẫu nhiên này nhận một giá trị cụ thể được tính bằng công thức:
\(P(X=k)=(e^(-λ)λ^k)/k!\)
Phân phối nhị thức là một phân phối xác suất cho số lần xảy ra của một sự kiện thành công trong một số lần thử cố định, khi mỗi lần thử là độc lập và xác suất thành công là như nhau trong mỗi lần thử.
Phân phối nhị thức được mô tả bởi ba tham số:
n: là số lần thử cố định.
p: là xác suất thành công trong mỗi lần thử.
k: là số lần thành công.
Một bảng tần số (hay còn gọi là bảng tần suất) là một cách để hiển thị dữ liệu bằng cách chia nó thành các nhóm và tính số lần mỗi nhóm xuất hiện. Bảng tần số thường được sử dụng để mô tả dữ liệu định lượng, nhưng cũng có thể được sử dụng để mô tả dữ liệu định tính.
Bảng tần số có thể được tạo theo nhiều cách khác nhau, nhưng cách phổ biến nhất là sử dụng một bảng có hai cột: một cột cho các nhóm và một cột cho tần số. Tần số là số lần mỗi nhóm xuất hiện.
Bảng tần số có thể được sử dụng để mô tả dữ liệu theo nhiều cách khác nhau. Ví dụ, chúng ta có thể sử dụng bảng tần số để: Tìm giá trị trung bình, trung vị và độ lệch chuẩn của dữ liệu. So sánh dữ liệu của hai hoặc nhiều nhóm. Tìm mối quan hệ giữa hai hoặc nhiều biến.
Độ nhạy và độ đặc hiệu là hai chỉ số được sử dụng để đánh giá hiệu suất của một xét nghiệm y tế. Độ nhạy là khả năng của xét nghiệm phát hiện những người thực sự mắc bệnh, trong khi độ đặc hiệu là khả năng của xét nghiệm loại trừ những người không mắc bệnh.
Độ nhạy (sensitivity) của một thí nghiệm: Là tỷ lệ (%) của số ca bị bệnh thực sự khi xét nghiệm và cho kết quả dương tính với tổng số ca bị bệnh. Công thức để tính độ nhạy:
Độ nhạy = số dương tính thật/(số đương tính thật + số âm tính giả)
Độ đặc hiệu (specificity) của một thí nghiệm: Là tỷ lệ (%) của số ca không bị bệnh và kết quả xét nghiệm không bị bệnh với tổng số người không bị bệnh. Công thức tính độ đặc hiệu:
Độ đặc hiệu = Số trường hợp âm tính thật/ (số trường hợp âm tính thật + số trường hợp dương tính giả)
Độ nhạy và độ đặc hiệu thường được biểu thị dưới dạng phần trăm. Ví dụ, một xét nghiệm có độ nhạy 90% có nghĩa là xét nghiệm sẽ phát hiện đúng 90% những người thực sự mắc bệnh. Một xét nghiệm có độ đặc hiệu 95% có nghĩa là xét nghiệm sẽ loại trừ đúng 95% những người không mắc bệnh.
Độ nhạy và độ đặc hiệu là hai chỉ số quan trọng để đánh giá hiệu suất của một xét nghiệm y tế. Tuy nhiên, cần lưu ý rằng độ nhạy và độ đặc hiệu có thể thay đổi tùy thuộc vào từng xét nghiệm. Ngoài ra, độ nhạy và độ đặc hiệu không phải lúc nào cũng là những chỉ số quan trọng nhất để đánh giá hiệu suất của một xét nghiệm. Trong một số trường hợp, các yếu tố khác, chẳng hạn như giá trị tiên đoán âm tính (NPV) và giá trị tiên đoán dương tính (PPV), có thể quan trọng hơn.
Rủi ro tương đối (RR) là một chỉ số được sử dụng để đánh giá mối quan hệ giữa một yếu tố nguy cơ và một kết quả. RR được tính bằng cách chia tỷ lệ mắc bệnh ở những người có yếu tố nguy cơ cho tỷ lệ mắc bệnh ở những người không có yếu tố nguy cơ.
RR được biểu thị dưới dạng số. Nếu RR lớn hơn 1, điều đó có nghĩa là yếu tố nguy cơ làm tăng nguy cơ mắc bệnh. Nếu RR bằng 1, điều đó có nghĩa là yếu tố nguy cơ không có tác động đến nguy cơ mắc bệnh. Nếu RR nhỏ hơn 1, điều đó có nghĩa là yếu tố nguy cơ làm giảm nguy cơ mắc bệnh.
Ví dụ, giả sử chúng ta có một nghiên cứu về mối quan hệ giữa hút thuốc và ung thư phổi. Nghiên cứu cho thấy rằng những người hút thuốc có nguy cơ mắc ung thư phổi cao hơn 20 lần so với những người không hút thuốc. Điều này có nghĩa là RR cho hút thuốc và ung thư phổi là 20. Điều đó có nghĩa là những người hút thuốc có nguy cơ mắc ung thư phổi cao gấp 20 lần so với những người không hút thuốc.
RR là một chỉ số quan trọng để đánh giá mối quan hệ giữa một yếu tố nguy cơ và một kết quả. Tuy nhiên, cần lưu ý rằng RR không phải lúc nào cũng là chỉ số duy nhất cần xem xét. Trong một số trường hợp, các chỉ số khác, chẳng hạn như nguy cơ tuyệt đối (AR), có thể quan trọng hơn.
Tỷ lệ chênh (OR) là một chỉ số được sử dụng để đo cường độ của mối quan hệ giữa hai biến phân loại. OR được tính bằng cách chia tỷ lệ chênh dương cho tỷ lệ chênh âm.
OR thường được sử dụng trong các nghiên cứu quan sát, trong đó các nhà nghiên cứu quan sát các biến số mà không cố gắng kiểm soát chúng. OR không phải là một ước lượng chính xác của nguy cơ tuyệt đối, nhưng nó có thể được sử dụng để đánh giá nguy cơ tương đối của các kết quả khác nhau.
OR được biểu thị dưới dạng số. Nếu OR lớn hơn 1, điều đó có nghĩa là biến phân loại đầu tiên có liên quan đến kết quả. Nếu OR bằng 1, điều đó có nghĩa là biến phân loại đầu tiên không liên quan đến kết quả. Nếu OR nhỏ hơn 1, điều đó có nghĩa là biến phân loại đầu tiên không liên quan đến kết quả.
Ví dụ, giả sử chúng ta có một nghiên cứu về mối quan hệ giữa giới tính và bệnh tim. Nghiên cứu cho thấy rằng OR cho bệnh tim ở nam giới là 2. Điều này có nghĩa là nam giới có nguy cơ mắc bệnh tim cao gấp đôi so với phụ nữ.
OR là một chỉ số quan trọng để đánh giá mối quan hệ giữa hai biến phân loại. Tuy nhiên, cần lưu ý rằng OR không phải lúc nào cũng là chỉ số duy nhất cần xem xét. Trong một số trường hợp, các chỉ số khác, chẳng hạn như nguy cơ tuyệt đối, có thể quan trọng hơn.
Thống kê mô tả là một nhánh của thống kê tập trung vào việc mô tả dữ liệu. Thống kê mô tả sử dụng các kỹ thuật để tóm tắt dữ liệu, khám phá các mẫu trong dữ liệu và mô tả dữ liệu bằng các số.
Thống kê suy diễn là một nhánh của thống kê tập trung vào việc đưa ra kết luận về một quần thể dựa trên dữ liệu từ một mẫu. Thống kê suy diễn sử dụng các kỹ thuật để ước tính các tham số của một quần thể, kiểm tra các giả thuyết và đưa ra quyết định dựa trên dữ liệu.
Cả thống kê mô tả và thống kê suy diễn đều quan trọng trong việc phân tích dữ liệu. Thống kê mô tả được sử dụng để hiểu dữ liệu và thống kê suy diễn được sử dụng để đưa ra kết luận về một quần thể dựa trên dữ liệu từ một mẫu.
Để đánh giá các mô hình hồi cổ điển chúng ta thường dựa vào hệ số xác định mô hình (\(R^2\)), nhưng đối với mô các mô hình hồi quy tuyến tính tổng quát chúng ta sử dụng các tiêu chí sau:
Akaike Information Criterion (AIC) là một tiêu chí thông tin được sử dụng để đánh giá các mô hình thống kê. AIC được đặt theo tên của Hirotugu Akaike, người đã phát triển nó vào năm 1974. AIC là một thước đo của mức độ phù hợp của một mô hình với dữ liệu. Nó được tính bằng cách thêm số lượng tham số trong mô hình (k) đến ln(L), giá trị logarit tự nhiên của likelihood của mô hình.
AIC càng nhỏ thì mô hình càng phù hợp với dữ liệu. Tuy nhiên, cần lưu ý rằng AIC không phải là một thước đo tuyệt đối của sự phù hợp. Nó chỉ so sánh các mô hình với nhau.
AIC thường được sử dụng để chọn giữa các mô hình cạnh tranh. Mô hình có AIC thấp hơn được coi là phù hợp hơn với dữ liệu. AIC cũng có thể được sử dụng để so sánh các mô hình với các số liệu thống kê khác, chẳng hạn như R-squared.
Deviance trong thống kê là một thước đo sự khác biệt giữa một phân phối xác suất và một tập dữ liệu. Nó thường được sử dụng để đánh giá sự phù hợp của một mô hình thống kê với dữ liệu. Deviance càng nhỏ thì mô hình càng phù hợp với dữ liệu.
Deviance được tính bằng cách lấy logarit tự nhiên của likelihood của một mô hình và trừ đi logarit tự nhiên của likelihood của một phân phối xác suất tham chiếu. Phân phối xác suất tham chiếu thường là một phân phối xác suất chuẩn.
Deviance có thể được sử dụng để so sánh các mô hình thống kê khác nhau. Mô hình có deviance thấp hơn được coi là phù hợp hơn với dữ liệu.
Deviance cũng có thể được sử dụng để kiểm tra các giả thuyết thống kê. Ví dụ, nếu chúng ta giả định rằng dữ liệu được phân phối theo một phân phối xác suất cụ thể, chúng ta có thể sử dụng deviance để kiểm tra xem dữ liệu có phù hợp với phân phối xác suất đó không. Deviance là một công cụ quan trọng được sử dụng trong nhiều lĩnh vực khác nhau, bao gồm thống kê, kinh tế, y học và khoa học.
Brier score là một thước đo sai số trung bình bình phương của một mô hình dự đoán. Nó được tính bằng cách tính trung bình bình phương sai số giữa giá trị dự báo và giá trị thực tế. Brier score càng nhỏ thì mô hình càng chính xác. Tuy nhiên, cần lưu ý rằng Brier score không phải là một thước đo tuyệt đối của độ chính xác. Nó chỉ so sánh các mô hình với nhau.
Brier score thường được sử dụng để so sánh các mô hình dự đoán khác nhau. Mô hình có Brier score thấp hơn được coi là chính xác hơn. Brier score cũng có thể được sử dụng để đánh giá hiệu quả của một mô hình dự đoán.
Dữ liệu nghiên cứu được thu thập từ một cuộc khảo sát do Google Forms thực hiện đối với sinh viên Đại học nhằm kiểm tra tình hình học tập và sức khỏe tâm thần hiện tại của họ.
library(readxl)
TL2 <- read_excel("C:/RRR/mental1.xlsx")
TL2
## # A tibble: 101 × 10
## Timestamp gender Age course `year of Study` CGPA `Marital status`
## <chr> <chr> <dbl> <chr> <chr> <chr> <chr>
## 1 44050.501388888886 Female 18 Engin… year 1 3.00… No
## 2 44050.50277777778 Male 21 Islam… year 2 3.00… No
## 3 44050.503472222219 Male 19 BIT year 1 3.00… No
## 4 44050.504166666666 Female 22 Laws year 3 3.00… Yes
## 5 44050.509027777778 Male 23 Mathe… year 4 3.00… No
## 6 44050.521527777775 Male 19 Engin… year 2 3.50… No
## 7 44050.522222222222 Female 23 Pendi… year 2 3.50… Yes
## 8 44050.522916666669 Female 18 BCS year 1 3.50… No
## 9 44050.524305555555 Female 19 Human… year 2 2.50… No
## 10 44050.527083333334 Male 18 Irkhs year 1 3.50… No
## # ℹ 91 more rows
## # ℹ 3 more variables: Depression <chr>, Anxiety <chr>, `a treatment` <chr>
TL2 %>% DT::datatable(TL2)
Bộ dữ liệu gồm 102 quan sát, có 10 biến trong đó có 8 biến định tính và 2 biến định lượng.
Timestamp: là ngày và thời gian mà các sinh viên thực hiện khảo sát. Khảo sát này được thực hiện từ ngày 8/7/2020 đến 13/7/2020.
gender: là giới tính sinh viên
Age: là tuổi của sinh viên, các sinh viên tham gia khảo sát có độ tuổi từ 18 - 24.
course: là chuyên ngành mà sinh viên đang theo học.
year of Study: là số năm sinh viên đang học đại học
CGPA: CGPA là viết tắt của Cumulative Grade Point Average, là điểm trung bình tích lũy của một sinh viên trong suốt quá trình học đại học. CGPA được tính bằng cách cộng tổng số điểm của tất cả các môn học đã học và chia cho tổng số tín chỉ đã tích lũy. CGPA là một trong những yếu tố quan trọng được các nhà tuyển dụng xem xét khi tuyển dụng sinh viên mới ra trường. Một CGPA cao sẽ giúp sinh viên có nhiều cơ hội việc làm hơn và có thể được tuyển dụng vào các công ty tốt hơn.
Marital status: là tình trạng hôn nhân của sinh viên.
Depression: là chứng trầm cảm, khảo sát xem sinh viên có đang mắc chứng trầm cảm hay không.
Anxiety: là chứng rối loạn lo âu, khảo sát xem sinh viên có đang mắc chứng rối loạn lo âu hay không.
a treatment: là một thuật ngữ chung chỉ các phương pháp điều trị y tế. Nó có thể bao gồm dùng thuốc, phẫu thuật, liệu pháp hoặc bất kỳ phương pháp nào khác được sử dụng để điều trị bệnh hoặc các vấn đề về tâm lý.
Với mục đích phân tích các yếu tố tác động đến sức khỏe tinh thần của sinh viên đại học để tìm ra các nguyên nhân chủ yếu ảnh hưởng đến tâm lý của sinh viên, tôi chọn phân tích các biến định lượng và định tính như sau
Tôi chọn các biến gender, course, year of study, Marital status để phân tích xem đâu là nguyên nhân gây ra các biểu hiện tâm lý bất ổn ở sinh viên như Depression, Anxiety, Panic attack và biểu hiện tâm lý nào được các sinh viên chủ động tiếp nhận điều trị y tế.
Tương tự với mục đích trên, tôi chọn Age làm biến định tính để nghiên cứu xem liệu những biểu hiện bất ổn về tâm lý của sinh viên ở độ tuổi nào là nhiều nhất.
summary(TL2)
## Timestamp gender Age course
## Length:101 Length:101 Min. :18.00 Length:101
## Class :character Class :character 1st Qu.:18.00 Class :character
## Mode :character Mode :character Median :19.00 Mode :character
## Mean :20.53
## 3rd Qu.:23.00
## Max. :24.00
## NA's :1
## year of Study CGPA Marital status Depression
## Length:101 Length:101 Length:101 Length:101
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## Anxiety a treatment
## Length:101 Length:101
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
table(TL2$gender)
##
## Female Male
## 75 26
Kết quả cho thấy có 75 nữ sinh và 26 nam sinh tham gia cuộc khảo sát
table(TL2$gender)/sum(table(TL2$gender))
##
## Female Male
## 0.7425743 0.2574257
Kết quả cho thấy có 74.26% số nữ sinh tham gia khảo sát; có 25.74% số nam sinh tham gia khảo sát.
TL2 |> ggplot( aes( x = gender, y= after_stat(count))) + geom_bar(color='red', fill='lightpink') + geom_text(aes(label= scales :: percent(after_stat(count/sum(count)),accuracy=.01)), stat = 'count', color= 'black', vjust= -.5) + theme_classic() + xlab('giới tính') + ylab('Tỷ lệ')
table(TL2$Age)
##
## 18 19 20 21 22 23 24
## 32 21 6 3 2 13 23
Kết quả cho thấy có 32 sinh viên thuộc lứa tuổi 18 tham gia cuộc khảo sát, 21 sinh viên 19 tuổi, 6 sinh viên 20 tuổi, 3 sinh viên 21 tuổi, 2 sinh viên 22 tuooit, 13 sinh viên 23 tuổi và 23 sinh viên 24 tuổi.
table(TL2$Age)/sum(table(TL2$Age))
##
## 18 19 20 21 22 23 24
## 0.32 0.21 0.06 0.03 0.02 0.13 0.23
Kết quả cho thấy, có 32% số sinh viên 18 tuổi tham gia khảo sát, chiếm tỷ lệ cao nhất trong 5 mốc tuổi từ 18 - 24.
TL2 |> ggplot( aes( x = Age, y= after_stat(count))) + geom_bar(color='orange', fill='beige') + geom_text(aes(label= scales :: percent(after_stat(count/sum(count)),accuracy=.01)), stat = 'count', color= 'black', vjust= -.5) + theme_classic() + xlab('Độ tuổi') + ylab('Tỷ lệ')
## Warning: Removed 1 rows containing non-finite values (`stat_count()`).
## Removed 1 rows containing non-finite values (`stat_count()`).
table(TL2$course)
##
## Accounting ALA Banking Studies
## 1 1 1
## BCS Benl BENL
## 18 1 2
## Biomedical science Biotechnology BIT
## 4 1 10
## Business Administration Communication CTS
## 1 1 1
## Diploma Nursing DIPLOMA TESL Econs
## 1 1 1
## engin Engine Engineering
## 1 2 17
## ENM Fiqh Fiqh fatwa
## 1 1 1
## Human Resources Human Sciences Irkhs
## 1 1 1
## Islamic education Islamic Education IT
## 1 1 1
## KENMS Kirkhs KIRKHS
## 1 1 1
## koe Koe KOE
## 1 1 4
## Kop Law Laws
## 1 1 2
## Malcom Marine science Mathemathics
## 1 1 1
## MHSC Nursing Pendidikan islam
## 1 1 1
## Pendidikan Islam psychology Psychology
## 2 2 1
## Radiography TAASL Usuluddin
## 1 1 1
table(TL2$course)/sum(table(TL2$course))
##
## Accounting ALA Banking Studies
## 0.00990099 0.00990099 0.00990099
## BCS Benl BENL
## 0.17821782 0.00990099 0.01980198
## Biomedical science Biotechnology BIT
## 0.03960396 0.00990099 0.09900990
## Business Administration Communication CTS
## 0.00990099 0.00990099 0.00990099
## Diploma Nursing DIPLOMA TESL Econs
## 0.00990099 0.00990099 0.00990099
## engin Engine Engineering
## 0.00990099 0.01980198 0.16831683
## ENM Fiqh Fiqh fatwa
## 0.00990099 0.00990099 0.00990099
## Human Resources Human Sciences Irkhs
## 0.00990099 0.00990099 0.00990099
## Islamic education Islamic Education IT
## 0.00990099 0.00990099 0.00990099
## KENMS Kirkhs KIRKHS
## 0.00990099 0.00990099 0.00990099
## koe Koe KOE
## 0.00990099 0.00990099 0.03960396
## Kop Law Laws
## 0.00990099 0.00990099 0.01980198
## Malcom Marine science Mathemathics
## 0.00990099 0.00990099 0.00990099
## MHSC Nursing Pendidikan islam
## 0.00990099 0.00990099 0.00990099
## Pendidikan Islam psychology Psychology
## 0.01980198 0.01980198 0.00990099
## Radiography TAASL Usuluddin
## 0.00990099 0.00990099 0.00990099
Kết quả cho thấy ngành BCS là ngành học có nhiều sinh viên tham gia khảo sát nhất.
table(TL2$`year of Study`)
##
## year 1 year 2 year 3 year 4
## 43 26 24 8
Kết quả cho thấy có 43 sinh viên năm 1 tham gia khảo sát, 26 sinh viên năm 2, 24 sinh viên năm 3, 8 sinh viên năm 4.
table(TL2$`year of Study`)/sum(table(TL2$`year of Study`))
##
## year 1 year 2 year 3 year 4
## 0.42574257 0.25742574 0.23762376 0.07920792
TL2 |> ggplot( aes( x = `year of Study`, y= after_stat(count))) + geom_bar(color='darkblue', fill='skyblue') + geom_text(aes(label= scales :: percent(after_stat(count/sum(count)),accuracy=.01)), stat = 'count', color= 'black', vjust= -.5) + theme_classic() + xlab('Năm học') + ylab('Tỷ lệ')
table(TL2$CGPA)
##
## 0 - 1.99 2.00 - 2.49 2.50 - 2.99 3.00 - 3.49 3.50 - 4.00
## 4 2 4 43 48
Kết quả cho thấy có đến 48 sinh viên thuộc phổ điểm 3.50-4.00 tham gia khảo sát, có số lượng đông nhất so với các phố điểm còn lại
table(TL2$CGPA)/sum(table(TL2$CGPA))
##
## 0 - 1.99 2.00 - 2.49 2.50 - 2.99 3.00 - 3.49 3.50 - 4.00
## 0.03960396 0.01980198 0.03960396 0.42574257 0.47524752
TL2 |> ggplot( aes( x = CGPA, y= after_stat(count))) + geom_bar(color='purple', fill='lavender') + geom_text(aes(label= scales :: percent(after_stat(count/sum(count)),accuracy=.01)), stat = 'count', color= 'darkblue', vjust= -.5) + theme_classic() + xlab('Năm học') + ylab('Tỷ lệ')
table(TL2$`Marital status`)
##
## No Yes
## 85 16
Kết quả cho thấy có 16 sinh viên đã lập gia đình,85 sinh viên còn lại chưa lập gia đình.
table(TL2$`Marital status`)/sum(table(TL2$`Marital status`))
##
## No Yes
## 0.8415842 0.1584158
gt <- TL2 %>% group_by(`Marital status`) %>% summarise( n=n()) %>% mutate( percent =n/sum(n))
gt |> ggplot(aes(x='', y=percent, fill= `Marital status`)) + geom_bar(stat='identity', width = 1) + geom_text(aes(label = paste0(round(percent*100), "%")), position = position_stack(vjust = 0.5))+
coord_polar("y", start = 0) +
scale_fill_manual(values = c("lightpink", "lavender"), name = "Marital status") +
labs(title = "Marital status") +
theme_minimal()
table(TL2$Depression)
##
## No Yes
## 66 35
Kết quả cho thấy 66 sinh viên không mắc chứng trầm cảm, 35 sinh viên mắc chứng trầm cảm.
table(TL2$Depression)/sum(table(TL2$Depression))
##
## No Yes
## 0.6534653 0.3465347
gt1 <- TL2 %>% group_by(Depression) %>% summarise( n=n()) %>% mutate( percent =n/sum(n))
gt1 |> ggplot(aes(x='', y=percent, fill= Depression)) + geom_bar(stat='identity', width = 1) + geom_text(aes(label = paste0(round(percent*100), "%")), position = position_stack(vjust = 0.5))+
coord_polar("y", start = 0) +
scale_fill_manual(values = c("pink", "beige"), name = "Depression") +
labs(title = "Depression") +
theme_minimal()
table(TL2$Anxiety)
##
## No Yes
## 67 34
Kết quả cho thấy có 67 sinh viên không mắc chứng rối loạn lo âu, 34 sinh viên có chứng rối loạn lo âu
table(TL2$Anxiety)/sum(table(TL2$Anxiety))
##
## No Yes
## 0.6633663 0.3366337
gt2 <- TL2 %>% group_by(Anxiety) %>% summarise( n=n()) %>% mutate( percent =n/sum(n))
gt2 |> ggplot(aes(x='', y=percent, fill= Anxiety)) + geom_bar(stat='identity', width = 1) + geom_text(aes(label = paste0(round(percent*100), "%")), position = position_stack(vjust = 0.5))+
coord_polar("y", start = 0) +
scale_fill_manual(values = c("skyblue", "beige"), name = "Anxiety") +
labs(title = "Anxiety") +
theme_minimal()
d1 <- table(TL2$gender, TL2$Depression)
d1
##
## No Yes
## Female 46 29
## Male 20 6
da1 <- prop.table(d1)
addmargins(da1)
##
## No Yes Sum
## Female 0.45544554 0.28712871 0.74257426
## Male 0.19801980 0.05940594 0.25742574
## Sum 0.65346535 0.34653465 1.00000000
Kết quả cho thấy có 29/75 nữ sinh mắc chứng trầm cảm, chiếm 28.71%. Có 6/26 nam sinh mắc chứng trầm cảm, chiếm 5.94%.
Số sinh viên mắc chứng trầm cảm theo giới tính chiếm 34.65%, vậy có thể kết luận giới tính là một trong những nguyên nhân ảnh hưởng đến tâm lý sinh viên.
ggplot(TL2, aes(Depression, fill = gender)) + geom_bar(position = 'dodge')
d2 <- table(TL2$Age, TL2$Depression)
d2
##
## No Yes
## 18 21 11
## 19 12 9
## 20 3 3
## 21 3 0
## 22 1 1
## 23 8 5
## 24 17 6
da2 <- prop.table(d2)
addmargins(da2)
##
## No Yes Sum
## 18 0.21 0.11 0.32
## 19 0.12 0.09 0.21
## 20 0.03 0.03 0.06
## 21 0.03 0.00 0.03
## 22 0.01 0.01 0.02
## 23 0.08 0.05 0.13
## 24 0.17 0.06 0.23
## Sum 0.65 0.35 1.00
Kết quả cho thấy có 11/43 sinh viên trong độ tuổi 18 mắc chứng trầm cảm, chiếm 11%. 9/21 sinh viên trong độ tuổi 19 mắc chứng trầm cảm, chiếm 9%. Có 3/6 sinh viên trong độ tuổi 20 mắc chứng trầm cảm, chiếm 3%. Không có sinh viên nào trong số 3 sinh viên ở độ tuổi 21 mắc chứng trầm cảm. Có 1/2 sinh viên trong độ tuổi 22 mắc chứng trầm cảm, chiếm 1%. 5/13 sinh viên trong độ tuổi 23 mắc chứng trầm cảm, chiếm 6%. 6/23 sinh viên mắc chứng trầm cảm, chiếm 6%.
Số sinh viên mắc chứng trầm cảm theo độ tuổi chiếm 35%, vậy có thể kết luận tuổi tác là một trong những nguyên nhân ảnh hưởng đến tâm lý sinh viên.
ggplot(TL2, aes(Age, fill = Depression)) + geom_bar(position = 'dodge')
## Warning: Removed 1 rows containing non-finite values (`stat_count()`).
d3 <- table(TL2$course, TL2$Depression)
d3
##
## No Yes
## Accounting 1 0
## ALA 0 1
## Banking Studies 1 0
## BCS 13 5
## Benl 1 0
## BENL 0 2
## Biomedical science 4 0
## Biotechnology 1 0
## BIT 5 5
## Business Administration 1 0
## Communication 0 1
## CTS 1 0
## Diploma Nursing 1 0
## DIPLOMA TESL 1 0
## Econs 0 1
## engin 1 0
## Engine 2 0
## Engineering 10 7
## ENM 0 1
## Fiqh 1 0
## Fiqh fatwa 1 0
## Human Resources 1 0
## Human Sciences 1 0
## Irkhs 1 0
## Islamic education 1 0
## Islamic Education 1 0
## IT 1 0
## KENMS 1 0
## Kirkhs 1 0
## KIRKHS 1 0
## koe 0 1
## Koe 1 0
## KOE 3 1
## Kop 1 0
## Law 0 1
## Laws 1 1
## Malcom 0 1
## Marine science 0 1
## Mathemathics 1 0
## MHSC 0 1
## Nursing 0 1
## Pendidikan islam 0 1
## Pendidikan Islam 2 0
## psychology 0 2
## Psychology 1 0
## Radiography 1 0
## TAASL 1 0
## Usuluddin 0 1
da3 <- prop.table(d3)
addmargins(da3)
##
## No Yes Sum
## Accounting 0.00990099 0.00000000 0.00990099
## ALA 0.00000000 0.00990099 0.00990099
## Banking Studies 0.00990099 0.00000000 0.00990099
## BCS 0.12871287 0.04950495 0.17821782
## Benl 0.00990099 0.00000000 0.00990099
## BENL 0.00000000 0.01980198 0.01980198
## Biomedical science 0.03960396 0.00000000 0.03960396
## Biotechnology 0.00990099 0.00000000 0.00990099
## BIT 0.04950495 0.04950495 0.09900990
## Business Administration 0.00990099 0.00000000 0.00990099
## Communication 0.00000000 0.00990099 0.00990099
## CTS 0.00990099 0.00000000 0.00990099
## Diploma Nursing 0.00990099 0.00000000 0.00990099
## DIPLOMA TESL 0.00990099 0.00000000 0.00990099
## Econs 0.00000000 0.00990099 0.00990099
## engin 0.00990099 0.00000000 0.00990099
## Engine 0.01980198 0.00000000 0.01980198
## Engineering 0.09900990 0.06930693 0.16831683
## ENM 0.00000000 0.00990099 0.00990099
## Fiqh 0.00990099 0.00000000 0.00990099
## Fiqh fatwa 0.00990099 0.00000000 0.00990099
## Human Resources 0.00990099 0.00000000 0.00990099
## Human Sciences 0.00990099 0.00000000 0.00990099
## Irkhs 0.00990099 0.00000000 0.00990099
## Islamic education 0.00990099 0.00000000 0.00990099
## Islamic Education 0.00990099 0.00000000 0.00990099
## IT 0.00990099 0.00000000 0.00990099
## KENMS 0.00990099 0.00000000 0.00990099
## Kirkhs 0.00990099 0.00000000 0.00990099
## KIRKHS 0.00990099 0.00000000 0.00990099
## koe 0.00000000 0.00990099 0.00990099
## Koe 0.00990099 0.00000000 0.00990099
## KOE 0.02970297 0.00990099 0.03960396
## Kop 0.00990099 0.00000000 0.00990099
## Law 0.00000000 0.00990099 0.00990099
## Laws 0.00990099 0.00990099 0.01980198
## Malcom 0.00000000 0.00990099 0.00990099
## Marine science 0.00000000 0.00990099 0.00990099
## Mathemathics 0.00990099 0.00000000 0.00990099
## MHSC 0.00000000 0.00990099 0.00990099
## Nursing 0.00000000 0.00990099 0.00990099
## Pendidikan islam 0.00000000 0.00990099 0.00990099
## Pendidikan Islam 0.01980198 0.00000000 0.01980198
## psychology 0.00000000 0.01980198 0.01980198
## Psychology 0.00990099 0.00000000 0.00990099
## Radiography 0.00990099 0.00000000 0.00990099
## TAASL 0.00990099 0.00000000 0.00990099
## Usuluddin 0.00000000 0.00990099 0.00990099
## Sum 0.65346535 0.34653465 1.00000000
Kết quả cho thấy tỷ lệ phần trăm sinh viên mắc chứng trầm cảm không có liên quan nhiều đến ngành học.
d4 <- table(TL2$Depression, TL2$`year of Study`)
d4
##
## year 1 year 2 year 3 year 4
## No 29 16 14 7
## Yes 14 10 10 1
da4 <- prop.table(d4)
addmargins(da4)
##
## year 1 year 2 year 3 year 4 Sum
## No 0.28712871 0.15841584 0.13861386 0.06930693 0.65346535
## Yes 0.13861386 0.09900990 0.09900990 0.00990099 0.34653465
## Sum 0.42574257 0.25742574 0.23762376 0.07920792 1.00000000
ggplot(TL2, aes(Depression, fill = `year of Study`)) + geom_bar(position = 'dodge')
d5 <- table(TL2$CGPA, TL2$Depression)
d5
##
## No Yes
## 0 - 1.99 4 0
## 2.00 - 2.49 2 0
## 2.50 - 2.99 1 3
## 3.00 - 3.49 24 19
## 3.50 - 4.00 35 13
da5 <- prop.table(d5)
addmargins(da5)
##
## No Yes Sum
## 0 - 1.99 0.03960396 0.00000000 0.03960396
## 2.00 - 2.49 0.01980198 0.00000000 0.01980198
## 2.50 - 2.99 0.00990099 0.02970297 0.03960396
## 3.00 - 3.49 0.23762376 0.18811881 0.42574257
## 3.50 - 4.00 0.34653465 0.12871287 0.47524752
## Sum 0.65346535 0.34653465 1.00000000
Kết quả cho thấy số sinh viên có phổ điểm từ 3.50-4.00 có tỷ lệ mắc chứng trầm cảm cao nhất. - Biểu đồ tần suất
ggplot(TL2, aes(Depression, fill = CGPA)) + geom_bar(position = 'dodge')
d6 <- table(TL2$`Marital status`, TL2$Depression)
d6
##
## No Yes
## No 66 19
## Yes 0 16
da6 <- prop.table(d6)
addmargins(da6)
##
## No Yes Sum
## No 0.6534653 0.1881188 0.8415842
## Yes 0.0000000 0.1584158 0.1584158
## Sum 0.6534653 0.3465347 1.0000000
Kết quả cho thấy có 19 sinh viên chưa lập gia đình mắc chứng trầm cảm, 16 sinh viên đã lập gia đình mắc chứng trầm cảm.
ggplot(TL2, aes(Depression, fill = `Marital status`)) + geom_bar(position = 'dodge')
a1 <- table(TL2$gender, TL2$Anxiety)
a1
##
## No Yes
## Female 51 24
## Male 16 10
ax1 <- prop.table(a1)
addmargins(ax1)
##
## No Yes Sum
## Female 0.5049505 0.2376238 0.7425743
## Male 0.1584158 0.0990099 0.2574257
## Sum 0.6633663 0.3366337 1.0000000
Kết quả cho thấy có 24/75 nữ sinh mắc chứng rối loạn lo âu, chiếm 23.76%. 10/26 nam sinh mắc chứng rồi loạn lo âu, chiếm 9.9%
ggplot(TL2, aes(Anxiety, fill = gender)) + geom_bar(position = 'dodge')
a2 <- table(TL2$Age, TL2$Anxiety)
a2
##
## No Yes
## 18 18 14
## 19 16 5
## 20 3 3
## 21 1 2
## 22 2 0
## 23 11 2
## 24 15 8
ax2 <- prop.table(a2)
addmargins(ax2)
##
## No Yes Sum
## 18 0.18 0.14 0.32
## 19 0.16 0.05 0.21
## 20 0.03 0.03 0.06
## 21 0.01 0.02 0.03
## 22 0.02 0.00 0.02
## 23 0.11 0.02 0.13
## 24 0.15 0.08 0.23
## Sum 0.66 0.34 1.00
Kết quả cho thấy có 14 sinh viên trong độ tuổi 18, 5 sinh viên tuổi 19, 3 sinh viên tuổi 20, 2 sinh viên tuổi 21, 2 sinh viên tuổi 23 và 8 sinh viên tuổi 24 mắc chứng rồi loạn lo âu.
ggplot(TL2, aes(Age, fill = Anxiety)) + geom_bar(position = 'dodge')
## Warning: Removed 1 rows containing non-finite values (`stat_count()`).
a3 <- table(TL2$Anxiety, TL2$`year of Study`)
a3
##
## year 1 year 2 year 3 year 4
## No 29 16 16 6
## Yes 14 10 8 2
ax3 <- prop.table(a3)
addmargins(ax3)
##
## year 1 year 2 year 3 year 4 Sum
## No 0.28712871 0.15841584 0.15841584 0.05940594 0.66336634
## Yes 0.13861386 0.09900990 0.07920792 0.01980198 0.33663366
## Sum 0.42574257 0.25742574 0.23762376 0.07920792 1.00000000
Kết quả cho thấy có 14 sinh viên năm 1, 10 sinh viên năm 2, 8 sinh viên năm 3, 2 sinh viên năm 4 mắc chứng rối loạn lo âu.
ggplot(TL2, aes(Anxiety, fill = `year of Study`)) + geom_bar(position = 'dodge')
a4 <- table(TL2$Anxiety, TL2$CGPA)
a4
##
## 0 - 1.99 2.00 - 2.49 2.50 - 2.99 3.00 - 3.49 3.50 - 4.00
## No 4 2 3 28 30
## Yes 0 0 1 15 18
ax4 <- prop.table(a4)
addmargins(ax4)
##
## 0 - 1.99 2.00 - 2.49 2.50 - 2.99 3.00 - 3.49 3.50 - 4.00 Sum
## No 0.03960396 0.01980198 0.02970297 0.27722772 0.29702970 0.66336634
## Yes 0.00000000 0.00000000 0.00990099 0.14851485 0.17821782 0.33663366
## Sum 0.03960396 0.01980198 0.03960396 0.42574257 0.47524752 1.00000000
Kết quả cho thấy số sinh viên có phổ điểm từ 3.50-4.00 có tỷ lệ mắc chứng rối loạn lo âu cao nhất.
ggplot(TL2, aes(Anxiety, fill = CGPA)) + geom_bar(position = 'dodge')
a5 <- table(TL2$Anxiety, TL2$`Marital status`)
a5
##
## No Yes
## No 58 9
## Yes 27 7
ax5 <- prop.table(a5)
addmargins(ax5)
##
## No Yes Sum
## No 0.57425743 0.08910891 0.66336634
## Yes 0.26732673 0.06930693 0.33663366
## Sum 0.84158416 0.15841584 1.00000000
Kết quả cho thấy có 9 sinh viên chưa lập gia đình mắc chứng rồi loạn lo âu, có 7 sinh viên đã lập gia đình mắc chứng rồi loạn lo âu
ggplot(TL2, aes(Anxiety, fill = `Marital status`)) + geom_bar(position = 'dodge')
a6 <- table(TL2$Anxiety, TL2$course)
a6
##
## Accounting ALA Banking Studies BCS Benl BENL Biomedical science
## No 1 1 1 12 1 1 4
## Yes 0 0 0 6 0 1 0
##
## Biotechnology BIT Business Administration Communication CTS
## No 1 2 1 0 1
## Yes 0 8 0 1 0
##
## Diploma Nursing DIPLOMA TESL Econs engin Engine Engineering ENM Fiqh
## No 1 1 0 1 2 13 0 1
## Yes 0 0 1 0 0 4 1 0
##
## Fiqh fatwa Human Resources Human Sciences Irkhs Islamic education
## No 1 1 1 0 0
## Yes 0 0 0 1 1
##
## Islamic Education IT KENMS Kirkhs KIRKHS koe Koe KOE Kop Law Laws Malcom
## No 1 1 0 1 1 0 0 2 0 0 2 1
## Yes 0 0 1 0 0 1 1 2 1 1 0 0
##
## Marine science Mathemathics MHSC Nursing Pendidikan islam
## No 0 1 1 1 1
## Yes 1 0 0 0 0
##
## Pendidikan Islam psychology Psychology Radiography TAASL Usuluddin
## No 2 0 1 1 1 1
## Yes 0 2 0 0 0 0
ax6 <- prop.table(a6)
addmargins(ax6)
##
## Accounting ALA Banking Studies BCS Benl BENL
## No 0.00990099 0.00990099 0.00990099 0.11881188 0.00990099 0.00990099
## Yes 0.00000000 0.00000000 0.00000000 0.05940594 0.00000000 0.00990099
## Sum 0.00990099 0.00990099 0.00990099 0.17821782 0.00990099 0.01980198
##
## Biomedical science Biotechnology BIT Business Administration
## No 0.03960396 0.00990099 0.01980198 0.00990099
## Yes 0.00000000 0.00000000 0.07920792 0.00000000
## Sum 0.03960396 0.00990099 0.09900990 0.00990099
##
## Communication CTS Diploma Nursing DIPLOMA TESL Econs
## No 0.00000000 0.00990099 0.00990099 0.00990099 0.00000000
## Yes 0.00990099 0.00000000 0.00000000 0.00000000 0.00990099
## Sum 0.00990099 0.00990099 0.00990099 0.00990099 0.00990099
##
## engin Engine Engineering ENM Fiqh Fiqh fatwa
## No 0.00990099 0.01980198 0.12871287 0.00000000 0.00990099 0.00990099
## Yes 0.00000000 0.00000000 0.03960396 0.00990099 0.00000000 0.00000000
## Sum 0.00990099 0.01980198 0.16831683 0.00990099 0.00990099 0.00990099
##
## Human Resources Human Sciences Irkhs Islamic education
## No 0.00990099 0.00990099 0.00000000 0.00000000
## Yes 0.00000000 0.00000000 0.00990099 0.00990099
## Sum 0.00990099 0.00990099 0.00990099 0.00990099
##
## Islamic Education IT KENMS Kirkhs KIRKHS koe
## No 0.00990099 0.00990099 0.00000000 0.00990099 0.00990099 0.00000000
## Yes 0.00000000 0.00000000 0.00990099 0.00000000 0.00000000 0.00990099
## Sum 0.00990099 0.00990099 0.00990099 0.00990099 0.00990099 0.00990099
##
## Koe KOE Kop Law Laws Malcom
## No 0.00000000 0.01980198 0.00000000 0.00000000 0.01980198 0.00990099
## Yes 0.00990099 0.01980198 0.00990099 0.00990099 0.00000000 0.00000000
## Sum 0.00990099 0.03960396 0.00990099 0.00990099 0.01980198 0.00990099
##
## Marine science Mathemathics MHSC Nursing Pendidikan islam
## No 0.00000000 0.00990099 0.00990099 0.00990099 0.00990099
## Yes 0.00990099 0.00000000 0.00000000 0.00000000 0.00000000
## Sum 0.00990099 0.00990099 0.00990099 0.00990099 0.00990099
##
## Pendidikan Islam psychology Psychology Radiography TAASL Usuluddin
## No 0.01980198 0.00000000 0.00990099 0.00990099 0.00990099 0.00990099
## Yes 0.00000000 0.01980198 0.00000000 0.00000000 0.00000000 0.00000000
## Sum 0.01980198 0.01980198 0.00990099 0.00990099 0.00990099 0.00990099
##
## Sum
## No 0.66336634
## Yes 0.33663366
## Sum 1.00000000
Kết quả cho thấy tỷ lệ phần trăm sinh viên mắc chứng trầm cảm không có liên quan nhiều đến ngành học.
t1 <- table(TL2$`a treatment`, TL2$Anxiety)
t1
##
## No Yes
## No 64 31
## Yes 3 3
tr1 <- prop.table(t1)
addmargins(tr1)
##
## No Yes Sum
## No 0.63366337 0.30693069 0.94059406
## Yes 0.02970297 0.02970297 0.05940594
## Sum 0.66336634 0.33663366 1.00000000
Kết quả cho thấy có 31 sinh viên mắc chứng rối loạn lo âu có tiếp nhận điều trị y tế, 3 sinh viên mắc chứng rối loạn lo âu không tiếp nhận điều trị y tế
ggplot(TL2, aes(`a treatment`, fill = Anxiety)) + geom_bar(position = 'dodge')
t2 <- table(TL2$`a treatment`, TL2$Depression)
t2
##
## No Yes
## No 66 29
## Yes 0 6
tr2 <- prop.table(t2)
addmargins(tr2)
##
## No Yes Sum
## No 0.65346535 0.28712871 0.94059406
## Yes 0.00000000 0.05940594 0.05940594
## Sum 0.65346535 0.34653465 1.00000000
Kết quả cho thấy có 29 sinh viên mắc chứng trầm cảm không tiếp nhận điều trị y tế, 6 sinh viên mắc chứng trầm cảm có tiếp nhận điều trị y tế
ggplot(TL2, aes(`a treatment`, fill = Depression)) + geom_bar(position = 'dodge')
d1 <- table(TL2$gender, TL2$Depression)
chisq.test(d1)
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: d1
## X-squared = 1.4409, df = 1, p-value = 0.23
Kết quả kiểm định cho thấy chưa có đủ cơ sở để chỉ ra rằng 2 biến gender và Depression độc lập với nhau
d2 <- table(TL2$Age, TL2$Depression)
chisq.test(d2)
## Warning in chisq.test(d2): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: d2
## X-squared = 3.8536, df = 6, p-value = 0.6965
Kết quả kiểm định cho thấy chưa có đủ cơ sở để chỉ ra rằng 2 biến Age và Depression độc lập với nhau.
chisq.test(d4)
## Warning in chisq.test(d4): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: d4
## X-squared = 2.505, df = 3, p-value = 0.4744
Kết quả kiểm định cho thấy chưa có đủ cơ sở để chỉ ra rằng 2 biến year of study và Depression độc lập với nhau
chisq.test(d5)
## Warning in chisq.test(d5): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: d5
## X-squared = 8.9975, df = 4, p-value = 0.06116
Kết quả kiểm định cho thấy chưa có đủ cơ sở để chỉ ra rằng 2 biến year of study và Depression độc lập với nhau
chisq.test(d6)
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: d6
## X-squared = 32.504, df = 1, p-value = 1.19e-08
Kết quả kiểm định cho thấy có sự độc lập giữa biến Depression với biến Marital status
chisq.test(a1)
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: a1
## X-squared = 0.12961, df = 1, p-value = 0.7188
Kết quả kiểm định cho thấy chưa có đủ cơ sở để chỉ ra rằng 2 biến Anxiety và gender độc lập với nhau
chisq.test(a2)
## Warning in chisq.test(a2): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: a2
## X-squared = 7.4827, df = 6, p-value = 0.2785
Kết quả kiểm định cho thấy chưa có đủ cơ sở để chỉ ra rằng 2 biến Anxiety và Age độc lập với nhau
chisq.test(a3)
## Warning in chisq.test(a3): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: a3
## X-squared = 0.56162, df = 3, p-value = 0.9052
Kết quả kiểm định cho thấy chưa có đủ cơ sở để chỉ ra rằng 2 biến Anxiety và year of study độc lập với nhau
chisq.test(a4)
## Warning in chisq.test(a4): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: a4
## X-squared = 3.5243, df = 4, p-value = 0.4742
Kết quả kiểm định cho thấy chưa có đủ cơ sở để chỉ ra rằng 2 biến Anxiety và CGPA độc lập với nhau
chisq.test(a5)
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: a5
## X-squared = 0.4126, df = 1, p-value = 0.5207
Kết quả kiểm định cho thấy chưa có đủ cơ sở để chỉ ra rằng 2 biến Anxiety và Marital status độc lập với nhau
chisq.test(t1)
## Warning in chisq.test(t1): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: t1
## X-squared = 0.18297, df = 1, p-value = 0.6688
Kết quả kiểm định cho thấy chưa có đủ cơ sở để chỉ ra rằng 2 biến Anxiety và a treatment độc lập với nhau
chisq.test(t2)
## Warning in chisq.test(t2): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: t2
## X-squared = 9.1565, df = 1, p-value = 0.002478
Kết quả kiểm định cho thấy 2 Biến Depression và biến a treatment độc lập với nhau
Đặt giả thiết:
\(H_O:\) Với các sinh viên có điểm GPA cao hơn 2.50 , tỷ lệ giữa sinh viên mắc chứng trầm cảm và sinh viên không mắc chức trầm cảm không có chênh lệch đáng kể.
\(H_1:\) Với các sinh viên có điểm GPA cao hơn 2.50 , tỷ lệ giữa sinh viên mắc chứng trầm cảm và sinh viên không mắc chức trầm cảm không có chênh lệch đáng kể.
pur <- TL2[TL2$Depression == 'Yes',]
purf <- TL2[TL2$Depression == 'No',]
pur1 <- pur[pur$CGPA > 2.50,]
purf1 <- purf[purf$CGPA > 2.50,]
a1 <- c(nrow(pur), nrow(purf))
b1 <- c(nrow(pur1), nrow(purf1))
prop.test(b1,a1)
## Warning in prop.test(b1, a1): Chi-squared approximation may be incorrect
##
## 2-sample test for equality of proportions with continuity correction
##
## data: b1 out of a1
## X-squared = 1.9514, df = 1, p-value = 0.1624
## alternative hypothesis: two.sided
## 95 percent confidence interval:
## -0.0003082852 0.1821264670
## sample estimates:
## prop 1 prop 2
## 1.0000000 0.9090909
Đặt giả thiết:
\(H_O:\) Với các sinh viên có điểm GPA cao hơn 2.50 , tỷ lệ giữa sinh viên mắc chứng rối loạn lo âu và sinh viên không mắc chứng rối loạn lo âu không có chênh lệch đáng kể.
\(H_1:\) Với các sinh viên có điểm GPA cao hơn 2.50 , tỷ lệ giữa sinh viên mắc chứng rối loạn lo âu và sinh viên không mắc chứng rối loạn lo âu không có chênh lệch đáng kể.
pur2 <- TL2[TL2$Anxiety == 'Yes',]
purf2 <- TL2[TL2$Anxiety == 'No',]
pur3 <- pur2[pur2$CGPA > 2.50,]
purf3 <- purf2[purf2$CGPA > 2.50,]
a2 <- c(nrow(pur2), nrow(purf2))
b2 <- c(nrow(pur3), nrow(purf3))
prop.test(b2,a2)
## Warning in prop.test(b2, a2): Chi-squared approximation may be incorrect
##
## 2-sample test for equality of proportions with continuity correction
##
## data: b2 out of a2
## X-squared = 1.8328, df = 1, p-value = 0.1758
## alternative hypothesis: two.sided
## 95 percent confidence interval:
## -0.0009880382 0.1800925158
## sample estimates:
## prop 1 prop 2
## 1.0000000 0.9104478
d1 <- table(TL2$gender, TL2$Depression)
riskratio(d1)
## $data
##
## No Yes Total
## Female 46 29 75
## Male 20 6 26
## Total 66 35 101
##
## $measure
## risk ratio with 95% C.I.
## estimate lower upper
## Female 1.000000 NA NA
## Male 0.596817 0.2798223 1.272917
##
## $p.value
## two-sided
## midp.exact fisher.exact chi.square
## Female NA NA NA
## Male 0.1574026 0.2312876 0.1500096
##
## $correction
## [1] FALSE
##
## attr(,"method")
## [1] "Unconditional MLE & normal approximation (Wald) CI"
Tỷ lệ sinh viên nam mắc chứng trầm cảm bằng 59.68% tỷ lệ sinh viên nữ mắc chứng trầm cảm
OddsRatio(d1)
## [1] 0.4758621
Tỷ lệ nữ sinh mắc chứng trầm cảm nhiều hơn 47.58% nam sinh
d6 <- table(TL2$`Marital status`, TL2$Depression)
riskratio(d6)
## $data
##
## No Yes Total
## No 66 19 85
## Yes 0 16 16
## Total 66 35 101
##
## $measure
## risk ratio with 95% C.I.
## estimate lower upper
## No 1.000000 NA NA
## Yes 4.473684 3.010164 6.648757
##
## $p.value
## two-sided
## midp.exact fisher.exact chi.square
## No NA NA NA
## Yes 2.538726e-09 2.538726e-09 2.130253e-09
##
## $correction
## [1] FALSE
##
## attr(,"method")
## [1] "Unconditional MLE & normal approximation (Wald) CI"
OddsRatio(d6)
## [1] 112.5385
Tỷ lệ sinh viên đã kết hôn mắc chứng trầm cảm cao hơn 112 lần so với tỷ lệ sinh viên mắc chứng trầm cảm khi chưa kết hôn
a1<-table(TL2$gender, TL2$Anxiety)
riskratio(a1)
## $data
##
## No Yes Total
## Female 51 24 75
## Male 16 10 26
## Total 67 34 101
##
## $measure
## risk ratio with 95% C.I.
## estimate lower upper
## Female 1.000000 NA NA
## Male 1.201923 0.6678796 2.162993
##
## $p.value
## two-sided
## midp.exact fisher.exact chi.square
## Female NA NA NA
## Male 0.5545312 0.6318167 0.5479666
##
## $correction
## [1] FALSE
##
## attr(,"method")
## [1] "Unconditional MLE & normal approximation (Wald) CI"
OddsRatio(a1)
## [1] 1.328125
Tỷ lệ sinh viên nữ mắc chứng rối loạn lo âu cao hơn 1.328 lần so với tỷ lệ sinh viên nam mắc chứng rối loạn lo âu
a5<-table(TL2$`Marital status`, TL2$Anxiety)
riskratio(a5)
## $data
##
## No Yes Total
## No 58 27 85
## Yes 9 7 16
## Total 67 34 101
##
## $measure
## risk ratio with 95% C.I.
## estimate lower upper
## No 1.000000 NA NA
## Yes 1.377315 0.7284284 2.604231
##
## $p.value
## two-sided
## midp.exact fisher.exact chi.square
## No NA NA NA
## Yes 0.369388 0.3939337 0.3520173
##
## $correction
## [1] FALSE
##
## attr(,"method")
## [1] "Unconditional MLE & normal approximation (Wald) CI"
OddsRatio(a5)
## [1] 1.670782
Tỷ lệ sinh viên đã kết hôn mắc chứng rối loạn lo âu cao hơn 1.67 lần so với tỷ lệ sinh viên mắc chứng rối loạn lo âu khi chưa kết hôn
TL2$Depression[TL2$Depression == 'Yes'] <- 1
TL2$Depression[TL2$Depression == 'No'] <- 0
head(TL2)
## # A tibble: 6 × 10
## Timestamp gender Age course `year of Study` CGPA `Marital status`
## <chr> <chr> <dbl> <chr> <chr> <chr> <chr>
## 1 44050.501388888886 Female 18 Engine… year 1 3.00… No
## 2 44050.50277777778 Male 21 Islami… year 2 3.00… No
## 3 44050.503472222219 Male 19 BIT year 1 3.00… No
## 4 44050.504166666666 Female 22 Laws year 3 3.00… Yes
## 5 44050.509027777778 Male 23 Mathem… year 4 3.00… No
## 6 44050.521527777775 Male 19 Engine… year 2 3.50… No
## # ℹ 3 more variables: Depression <chr>, Anxiety <chr>, `a treatment` <chr>
de1 <- glm(factor(Depression) ~ gender + Age + `year of Study`+ CGPA + `Marital status`, family = binomial(link = 'logit'), data = TL2)
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
summary(de1)
##
## Call:
## glm(formula = factor(Depression) ~ gender + Age + `year of Study` +
## CGPA + `Marital status`, family = binomial(link = "logit"),
## data = TL2)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.3889 -0.6965 -0.2127 0.0000 2.3988
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -14.8651 6086.0379 -0.002 0.998
## genderMale -0.8667 0.7851 -1.104 0.270
## Age -0.1874 0.1359 -1.379 0.168
## `year of Study`year 2 -1.3146 0.8071 -1.629 0.103
## `year of Study`year 3 -1.0417 0.8464 -1.231 0.218
## `year of Study`year 4 -16.9835 1934.8019 -0.009 0.993
## CGPA2.00 - 2.49 -0.3630 8918.8588 0.000 1.000
## CGPA2.50 - 2.99 19.0829 6086.0376 0.003 0.997
## CGPA3.00 - 3.49 18.9102 6086.0374 0.003 0.998
## CGPA3.50 - 4.00 17.3978 6086.0374 0.003 0.998
## `Marital status`Yes 33.7276 2849.5344 0.012 0.991
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 129.489 on 99 degrees of freedom
## Residual deviance: 71.772 on 89 degrees of freedom
## (1 observation deleted due to missingness)
## AIC: 93.772
##
## Number of Fisher Scoring iterations: 18
de2 <- glm(factor(Depression) ~ gender + Age + `year of Study`+ CGPA + `Marital status`, family = binomial(link = 'probit'), data = TL2)
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
summary(de2)
##
## Call:
## glm(formula = factor(Depression) ~ gender + Age + `year of Study` +
## CGPA + `Marital status`, family = binomial(link = "probit"),
## data = TL2)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.3360 -0.7318 -0.1987 0.0000 2.3563
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -3.63388 1422.73275 -0.003 0.998
## genderMale -0.48179 0.44166 -1.091 0.275
## Age -0.09268 0.07558 -1.226 0.220
## `year of Study`year 2 -0.71393 0.45354 -1.574 0.115
## `year of Study`year 3 -0.53294 0.47852 -1.114 0.265
## `year of Study`year 4 -5.11959 433.74513 -0.012 0.991
## CGPA2.00 - 2.49 -0.43238 2069.26623 0.000 1.000
## CGPA2.50 - 2.99 5.75176 1422.73240 0.004 0.997
## CGPA3.00 - 3.49 5.62321 1422.73209 0.004 0.997
## CGPA3.50 - 4.00 4.76262 1422.73210 0.003 0.997
## `Marital status`Yes 10.64880 635.98349 0.017 0.987
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 129.489 on 99 degrees of freedom
## Residual deviance: 72.271 on 89 degrees of freedom
## (1 observation deleted due to missingness)
## AIC: 94.271
##
## Number of Fisher Scoring iterations: 18
de3 <- glm(factor(Depression) ~ gender + Age + `year of Study`+ CGPA + `Marital status`, family = binomial(link = 'cloglog'), data = TL2)
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
summary(de3)
##
## Call:
## glm(formula = factor(Depression) ~ gender + Age + `year of Study` +
## CGPA + `Marital status`, family = binomial(link = "cloglog"),
## data = TL2)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.5296 -0.6727 -0.2152 0.0000 2.4240
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -16.9327 15883.0752 -0.001 0.9991
## genderMale -0.7648 0.6678 -1.145 0.2521
## Age -0.1837 0.1161 -1.582 0.1136
## `year of Study`year 2 -1.2418 0.6831 -1.818 0.0691 .
## `year of Study`year 3 -0.9900 0.6880 -1.439 0.1501
## `year of Study`year 4 -16.8422 1995.1642 -0.008 0.9933
## CGPA2.00 - 2.49 -0.3296 23533.1521 0.000 1.0000
## CGPA2.50 - 2.99 20.8247 15883.0751 0.001 0.9990
## CGPA3.00 - 3.49 20.5790 15883.0751 0.001 0.9990
## CGPA3.50 - 4.00 19.2360 15883.0751 0.001 0.9990
## `Marital status`Yes 20.5105 2021.5521 0.010 0.9919
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 129.49 on 99 degrees of freedom
## Residual deviance: 70.69 on 89 degrees of freedom
## (1 observation deleted due to missingness)
## AIC: 92.69
##
## Number of Fisher Scoring iterations: 20
AIC và Deviance
Từ kết quả 3 mô hình hồi quy, ta có:
logit: AIC=93.772, Deviance=71.772
probit: AIC=94.271, Deviance=72.271
cloglog: AIC=92.69, Deviance=70.69
BrierScore
BrierScore(de1)
## [1] 0.1144766
BrierScore(de2)
## [1] 0.1161953
BrierScore(de3)
## [1] 0.1118644
Ma trận nhầm lẫn
Logit
e1 <- predict(de1, newdata = TL2, type = "response")
f1 <- ifelse(e1 > 0.5, "1", "0") # Chỉnh ngưỡng phân loại
g1<-factor(f1, levels = c("0","1"))
h1<- factor(TL2$Anxiety, labels = c("0","1"))
confusionMatrix(table(g1, h1))
## Confusion Matrix and Statistics
##
## h1
## g1 0 1
## 0 53 24
## 1 13 10
##
## Accuracy : 0.63
## 95% CI : (0.5276, 0.7244)
## No Information Rate : 0.66
## P-Value [Acc > NIR] : 0.7715
##
## Kappa : 0.1054
##
## Mcnemar's Test P-Value : 0.1002
##
## Sensitivity : 0.8030
## Specificity : 0.2941
## Pos Pred Value : 0.6883
## Neg Pred Value : 0.4348
## Prevalence : 0.6600
## Detection Rate : 0.5300
## Detection Prevalence : 0.7700
## Balanced Accuracy : 0.5486
##
## 'Positive' Class : 0
##
Mô hình có độ chính xác toàn thể là 63%, độ nhạy là 80,3% và độ hiệu quả là 29,41%
Probit
e2 <- predict(de2, newdata = TL2, type = "response")
f2 <- ifelse(e2 > 0.5, "1", "0") # Chỉnh ngưỡng phân loại
g2<-factor(f2, levels = c("0","1"))
h2<- factor(TL2$Anxiety, labels = c("0","1"))
confusionMatrix(table(g2, h2))
## Confusion Matrix and Statistics
##
## h2
## g2 0 1
## 0 53 24
## 1 13 10
##
## Accuracy : 0.63
## 95% CI : (0.5276, 0.7244)
## No Information Rate : 0.66
## P-Value [Acc > NIR] : 0.7715
##
## Kappa : 0.1054
##
## Mcnemar's Test P-Value : 0.1002
##
## Sensitivity : 0.8030
## Specificity : 0.2941
## Pos Pred Value : 0.6883
## Neg Pred Value : 0.4348
## Prevalence : 0.6600
## Detection Rate : 0.5300
## Detection Prevalence : 0.7700
## Balanced Accuracy : 0.5486
##
## 'Positive' Class : 0
##
Mô hình có độ chính xác toàn thể là 63%, độ nhạy là 80,3% và độ hiệu quả là 29,41%
Cloglog
e3 <- predict(de3, newdata = TL2, type = "response")
f3 <- ifelse(e3 > 0.5, "1", "0") # Chỉnh ngưỡng phân loại
g3<-factor(f3, levels = c("0","1"))
h3<- factor(TL2$Anxiety, labels = c("0","1"))
confusionMatrix(table(g3, h3))
## Confusion Matrix and Statistics
##
## h3
## g3 0 1
## 0 53 24
## 1 13 10
##
## Accuracy : 0.63
## 95% CI : (0.5276, 0.7244)
## No Information Rate : 0.66
## P-Value [Acc > NIR] : 0.7715
##
## Kappa : 0.1054
##
## Mcnemar's Test P-Value : 0.1002
##
## Sensitivity : 0.8030
## Specificity : 0.2941
## Pos Pred Value : 0.6883
## Neg Pred Value : 0.4348
## Prevalence : 0.6600
## Detection Rate : 0.5300
## Detection Prevalence : 0.7700
## Balanced Accuracy : 0.5486
##
## 'Positive' Class : 0
##
Mô hình có độ chính xác toàn thể là 63%, độ nhạy là 80,3% và độ hiệu quả là 29,41%
Kết quả cho thấy ngoài confusionMatrix thì giá trị các chỉ số AIC, Deviance, Brier score của mô hình cloglog là nhỏ nhất. Vậy mô hình cloglog là tốt nhất.
gender: Hệ số cho giới tính là -0.7648, có nghĩa là nam giới có khả năng mắc chứng trầm cảm thấp hơn 0.7648 lần so với nữ. Tuy nhiên, giá trị p cho hệ số này là 0.2521, có nghĩa là bằng chứng cho mối liên quan này không có ý nghĩa thống kê.
Age: Hệ số cho tuổi là -0.1837, có nghĩa là cứ tăng 1 tuổi thì tỷ lệ mắc chứng trầm cảm sẽ giảm 0.1837 lần. Tuy nhiên, giá trị p cho hệ số này là 0.1136, có nghĩa là bằng chứng cho mối liên quan này không có ý nghĩa thống kê.
year of Study: Các hệ số cho year of Study là -1.2418(year2), -0.99(year3) và -16.8422(year4). Các hệ số này cho thấy sinh viên năm thứ hai, thứ ba và thứ tư có khả năng mắc chứng trầm cảm thấp hơn so với sinh viên năm thứ nhất. Tuy nhiên, các giá trị p cho các hệ số này đều tương đối cao, do đó bằng chứng cho các mối liên hệ này không có ý nghĩa thống kê.
Điểm trung bình tích lũy (GPA): Các hệ số cho GPA là -0.3296, 20.8247, 20.5790 và 19.2360. Các hệ số này cho thấy sinh viên có GPA thấp hơn có khả năng mắc chứng trầm cảm cao hơn, trong khi sinh viên có GPA cao hơn có khả năng mắc chứng trầm cảm thấp hơn. Bằng chứng cho các mối liên hệ này có ý nghĩa thống kê, nhưng quy mô của các tác động là tương đối nhỏ.
Marital status: Hệ số cho tình trạng hôn nhân là 20.5105, có nghĩa là sinh viên đã kết hôn có khả năng mắc chứng lo lắng cao hơn 20.5105 lần so với sinh viên chưa kết hôn. Tuy nhiên, giá trị p cho hệ số này là 0.9919, có nghĩa là bằng chứng cho mối liên hệ này không có ý nghĩa thống kê.
TL2$Depression[TL2$Depression == 'Yes'] <- 1
TL2$Depression[TL2$Depression == 'No'] <- 0
head(TL2)
## # A tibble: 6 × 10
## Timestamp gender Age course `year of Study` CGPA `Marital status`
## <chr> <chr> <dbl> <chr> <chr> <chr> <chr>
## 1 44050.501388888886 Female 18 Engine… year 1 3.00… No
## 2 44050.50277777778 Male 21 Islami… year 2 3.00… No
## 3 44050.503472222219 Male 19 BIT year 1 3.00… No
## 4 44050.504166666666 Female 22 Laws year 3 3.00… Yes
## 5 44050.509027777778 Male 23 Mathem… year 4 3.00… No
## 6 44050.521527777775 Male 19 Engine… year 2 3.50… No
## # ℹ 3 more variables: Depression <chr>, Anxiety <chr>, `a treatment` <chr>
an1 <- glm(factor(Anxiety) ~ gender + Age + `year of Study`+ CGPA + `Marital status`, family = binomial(link = 'logit'), data = TL2)
summary(an1)
##
## Call:
## glm(formula = factor(Anxiety) ~ gender + Age + `year of Study` +
## CGPA + `Marital status`, family = binomial(link = "logit"),
## data = TL2)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.2818 -0.9660 -0.7813 1.3145 1.8645
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.503e+01 1.353e+03 -0.011 0.991
## genderMale 4.441e-01 5.240e-01 0.848 0.397
## Age -8.418e-02 9.359e-02 -0.900 0.368
## `year of Study`year 2 3.164e-02 5.758e-01 0.055 0.956
## `year of Study`year 3 -1.690e-03 6.145e-01 -0.003 0.998
## `year of Study`year 4 -3.793e-01 9.085e-01 -0.417 0.676
## CGPA2.00 - 2.49 -7.202e-03 2.170e+03 0.000 1.000
## CGPA2.50 - 2.99 1.543e+01 1.353e+03 0.011 0.991
## CGPA3.00 - 3.49 1.588e+01 1.353e+03 0.012 0.991
## CGPA3.50 - 4.00 1.611e+01 1.353e+03 0.012 0.990
## `Marital status`Yes 5.444e-01 6.301e-01 0.864 0.388
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 128.21 on 99 degrees of freedom
## Residual deviance: 120.82 on 89 degrees of freedom
## (1 observation deleted due to missingness)
## AIC: 142.82
##
## Number of Fisher Scoring iterations: 15
an2 <- glm(factor(Anxiety) ~ gender + Age + `year of Study`+ CGPA + `Marital status`, family = binomial(link = 'probit'), data = TL2)
summary(an2)
##
## Call:
## glm(formula = factor(Anxiety) ~ gender + Age + `year of Study` +
## CGPA + `Marital status`, family = binomial(link = "probit"),
## data = TL2)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.2864 -0.9647 -0.7908 1.3132 1.8589
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -4.55797 339.44619 -0.013 0.989
## genderMale 0.27338 0.32301 0.846 0.397
## Age -0.05150 0.05684 -0.906 0.365
## `year of Study`year 2 0.01020 0.35329 0.029 0.977
## `year of Study`year 3 0.00402 0.37452 0.011 0.991
## `year of Study`year 4 -0.21076 0.53769 -0.392 0.695
## CGPA2.00 - 2.49 0.10102 546.10728 0.000 1.000
## CGPA2.50 - 2.99 4.81171 339.44548 0.014 0.989
## CGPA3.00 - 3.49 5.08052 339.44470 0.015 0.988
## CGPA3.50 - 4.00 5.21008 339.44471 0.015 0.988
## `Marital status`Yes 0.33676 0.38720 0.870 0.384
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 128.21 on 99 degrees of freedom
## Residual deviance: 120.88 on 89 degrees of freedom
## (1 observation deleted due to missingness)
## AIC: 142.88
##
## Number of Fisher Scoring iterations: 15
an3 <- glm(factor(Anxiety) ~ gender + Age + `year of Study`+ CGPA + `Marital status`, family = binomial(link = 'cloglog'), data = TL2)
summary(an3)
##
## Call:
## glm(formula = factor(Anxiety) ~ gender + Age + `year of Study` +
## CGPA + `Marital status`, family = binomial(link = "cloglog"),
## data = TL2)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.2798 -0.9554 -0.7763 1.3152 1.8729
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -16.15852 2152.17126 -0.008 0.994
## genderMale 0.36228 0.40240 0.900 0.368
## Age -0.07072 0.07597 -0.931 0.352
## `year of Study`year 2 0.06598 0.45514 0.145 0.885
## `year of Study`year 3 -0.04432 0.50377 -0.088 0.930
## `year of Study`year 4 -0.34415 0.78468 -0.439 0.661
## CGPA2.00 - 2.49 -0.04506 3431.29597 0.000 1.000
## CGPA2.50 - 2.99 16.14320 2152.17105 0.008 0.994
## CGPA3.00 - 3.49 16.53978 2152.17078 0.008 0.994
## CGPA3.50 - 4.00 16.75022 2152.17078 0.008 0.994
## `Marital status`Yes 0.44473 0.48047 0.926 0.355
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 128.21 on 99 degrees of freedom
## Residual deviance: 120.58 on 89 degrees of freedom
## (1 observation deleted due to missingness)
## AIC: 142.58
##
## Number of Fisher Scoring iterations: 16
AIC và Deviance
Từ kết quả 3 mô hình hồi quy, ta có:
logit: AIC=142.82, Deviance=120.82
probit: AIC=142.88, Deviance=120.88
cloglog: AIC=142.58, Deviance=120.58
BrierScore
BrierScore(an1)
## [1] 0.2106598
BrierScore(an2)
## [1] 0.2108299
BrierScore(an3)
## [1] 0.2099686
Ma trận nhầm lẫn
Logit
a1 <- predict(an1, newdata = TL2, type = "response")
b1 <- ifelse(a1 > 0.5, "1", "0") # Chỉnh ngưỡng phân loại
c1<-factor(b1, levels = c("0","1"))
d1<- factor(TL2$Anxiety, labels = c("0","1"))
confusionMatrix(table(c1, d1))
## Confusion Matrix and Statistics
##
## d1
## c1 0 1
## 0 64 29
## 1 2 5
##
## Accuracy : 0.69
## 95% CI : (0.5897, 0.7787)
## No Information Rate : 0.66
## P-Value [Acc > NIR] : 0.3018
##
## Kappa : 0.1446
##
## Mcnemar's Test P-Value : 3.016e-06
##
## Sensitivity : 0.9697
## Specificity : 0.1471
## Pos Pred Value : 0.6882
## Neg Pred Value : 0.7143
## Prevalence : 0.6600
## Detection Rate : 0.6400
## Detection Prevalence : 0.9300
## Balanced Accuracy : 0.5584
##
## 'Positive' Class : 0
##
Mô hình có độ chính xác toàn thể là 69%, độ nhạy là 96,97% và độ hiệu quả là 14,29%
Probit
a2 <- predict(an2, newdata = TL2, type = "response")
b2 <- ifelse(a2 > 0.5, "1", "0") # Chỉnh ngưỡng phân loại
c2<-factor(b2, levels = c("0","1"))
d2<- factor(TL2$Anxiety, labels = c("0","1"))
confusionMatrix(table(c2, d2))
## Confusion Matrix and Statistics
##
## d2
## c2 0 1
## 0 64 31
## 1 2 3
##
## Accuracy : 0.67
## 95% CI : (0.5688, 0.7608)
## No Information Rate : 0.66
## P-Value [Acc > NIR] : 0.4625
##
## Kappa : 0.073
##
## Mcnemar's Test P-Value : 1.093e-06
##
## Sensitivity : 0.96970
## Specificity : 0.08824
## Pos Pred Value : 0.67368
## Neg Pred Value : 0.60000
## Prevalence : 0.66000
## Detection Rate : 0.64000
## Detection Prevalence : 0.95000
## Balanced Accuracy : 0.52897
##
## 'Positive' Class : 0
##
Mô hình có độ chính xác toàn thể là 67%, độ nhạy là 96,97% và độ hiệu quả là 8,824%
Cloglog
a3 <- predict(an3, newdata = TL2, type = "response")
b3 <- ifelse(a3 > 0.5, "1", "0") # Chỉnh ngưỡng phân loại
c3<-factor(b3, levels = c("0","1"))
d3<- factor(TL2$Anxiety, labels = c("0","1"))
confusionMatrix(table(c3, d3))
## Confusion Matrix and Statistics
##
## d3
## c3 0 1
## 0 63 29
## 1 3 5
##
## Accuracy : 0.68
## 95% CI : (0.5792, 0.7698)
## No Information Rate : 0.66
## P-Value [Acc > NIR] : 0.3797
##
## Kappa : 0.1247
##
## Mcnemar's Test P-Value : 9.897e-06
##
## Sensitivity : 0.9545
## Specificity : 0.1471
## Pos Pred Value : 0.6848
## Neg Pred Value : 0.6250
## Prevalence : 0.6600
## Detection Rate : 0.6300
## Detection Prevalence : 0.9200
## Balanced Accuracy : 0.5508
##
## 'Positive' Class : 0
##
Mô hình có độ chính xác toàn thể là 68%, độ nhạy là 95,45% và độ hiệu quả là 14,71%
Kết quả cho thấy ngoài confusionMatrix thì giá trị các chỉ số AIC, Deviance, Brier score của mô hình cloglog là nhỏ nhất. Vậy mô hình cloglog là tốt nhất.
gender: Hệ số cho giới tính là 0.36228, có nghĩa là nam giới có khả năng mắc chứng lo âu cao hơn 0.36228 lần so với nữ. Tuy nhiên, giá trị p cho hệ số này là 0.368, có nghĩa là bằng chứng cho mối liên quan này không có ý nghĩa thống kê.
Age: Hệ số cho tuổi là -0.07072, có nghĩa là cứ tăng 1 tuổi thì tỷ lệ mắc chứng lo âu sẽ giảm 0.07072. Tuy nhiên, giá trị p cho hệ số này là 0.352, có nghĩa là bằng chứng cho mối liên quan này không có ý nghĩa thống kê.
year of Study: Các hệ số cho year of Study là 0.06598(year2), -0.04432(year3) và -0.34415(year4). Các hệ số này cho thấy sinh viên năm thứ hai có khả năng mắc chứng lo lắng cao hơn một chút so với sinh viên năm thứ nhất, trong khi sinh viên năm thứ ba và thứ tư có khả năng mắc chứng lo lắng thấp hơn so với sinh viên năm thứ nhất. Tuy nhiên, các giá trị p cho các hệ số này đều tương đối cao, do đó bằng chứng cho các mối liên hệ này không có ý nghĩa thống kê.
Điểm trung bình tích lũy (GPA): Các hệ số cho GPA là -0.04506, 16.14320, 16.53978 và 16.75022. Các hệ số này cho thấy sinh viên có GPA thấp hơn có khả năng mắc chứng lo lắng cao hơn, trong khi sinh viên có GPA cao hơn có khả năng mắc chứng lo lắng thấp hơn. Bằng chứng cho các mối liên hệ này có ý nghĩa thống kê, nhưng quy mô của các tác động là tương đối nhỏ.
Marital status: Hệ số cho tình trạng hôn nhân là 0.44473, có nghĩa là sinh viên đã kết hôn có khả năng mắc chứng lo lắng cao hơn 0.44473 lần so với sinh viên chưa kết hôn. Tuy nhiên, giá trị p cho hệ số này là 0.355, có nghĩa là bằng chứng cho mối liên hệ này không có ý nghĩa thống kê.
dy <- subset(TL2,TL2$`a treatment` =="Yes")
dy
## # A tibble: 6 × 10
## Timestamp gender Age course `year of Study` CGPA `Marital status`
## <chr> <chr> <dbl> <chr> <chr> <chr> <chr>
## 1 44050.581944444442 Female 24 BIT year 3 3.50… Yes
## 2 44050.604861111111 Male 18 BCS year 2 3.50… Yes
## 3 44050.62222222222 Female 24 Engin… year 2 2.50… Yes
## 4 44050.643750000003 Female 23 ALA year 1 2.50… Yes
## 5 44050.664583333331 Female 19 BCS year 1 3.50… No
## 6 13/07/2020 10:33:47 Female 18 psych… year 1 3.50… No
## # ℹ 3 more variables: Depression <chr>, Anxiety <chr>, `a treatment` <chr>
table(dy$`a treatment`)
##
## Yes
## 6
Ta thấy chỉ có 6 sinh viên có vấn đề về sức khỏe tinh thần đồng ý tiếp nhận điều trị y tế, trong đó chỉ có 1 sinh viên nữ. Chiếm tỷ lệ vô cùng nhỏ trong tổng số các sinh viên có vấn đề về sức khỏe tinh thần.
Qúa trình học đại học có thể là một thời gian căng thẳng đối với nhiều sinh viên. Ngoài việc đối phó với áp lực học tập, một số sinh viên phải đối mặt với những nhiệm vụ căng thẳng của việc rời xa gia đình và phải sống tự lập, trong khi một số khác có thể phải mang nặng trách nhiệm đối với gia đình và phải đi làm thêm liên tục để kiếm sống. Trong hoàn cảnh này, nhiều sinh viên đại học gặp các vấn đề về sức khỏe tâm thần.
Kết quả phân tích ở trên cho thấy các yếu tố như độ tuổi, năm đang theo học đại học, điểm GPA và tình trạng hôn nhân có ảnh hưởng khá lớn đến sức khỏe tinh thần của sinh viên đại học. Trong đó, tình trạng hôn nhân là yếu tố có sức ảnh hưởng lớn nhất. Tuy nhiên trong số các sinh viên có vấn đề về tinh thần, cụ thể là sinh viên mắc chứng trầm cảm, chứng rối loạn lo âu hay thậm chí có một số sinh viên có biểu hiện của cả 2 loại bệnh thì chỉ có 6 sinh viên đã từng tiếp nhận điều trị y tế. Có thể thấy tỷ lệ nữ sinh có vấn đề về sức khỏe tinh thần cao hơn so với nam sinh và những sinh viên có điểm GPA cao (nằm trong khoảng 3.50-4.00) có khả năng mắc bệnh tâm lý cao hơn số sinh viên có điểm GPA thấp.
Cần có các biện pháp can thiệp kiến thức về sức khỏe tâm thần cho sinh viên. Do tỷ lệ sinh viên có ý định tìm kiếm sự trợ giúp cụ thể là tiếp nhận điều trị y tế tương đối thấp nên cần phải khám phá thêm các rào cản đối với ý định tìm kiếm sự trợ giúp từ các nguồn chuyên nghiệp.
Do dữ liệu nghiên cứu được tổng hợp từ cuộc khảo sát trên google form nên bài nghiên cứu vẫn còn một số hạn chế như kết quá có thể sai lệch vì thiếu dữ liệu, hoặc chỉ tập trung vào một số ngành nhất định, chưa mang tính khái quát (Pham và cs., 2020). Do đó, cần có thêm các nghiên cứu khoa học để cung cấp thêm dữ liệu thống kê từ đó thúc đẩy quá trình tiến hành các chương trình can thiệp SKTT cho SV, nâng cao nhận thức của giới trẻ về vấn đề SKTT nói chung và tình trạng phổ biến cúa RLTT ở giới trẻ.
[1] Rodgers, L. S., Tennison, L. R. (2009). A preliminary assessment of adjustment disorder among first-year college students. Archives of Psychiatric Nursing, 23(3), 220-230.
[2] Bratman, G.N., Anderson, C.B., Berman, M.G., Cochran, B., De Vries, S., Flanders, J., Daily, G.C. (2019). Nature and mental health: An ecosystem service perspective. Science advances, 5(7), eaax0903.
[3] Eisenberg, D., Gollust, S.E., Golberstein, E., Hefner, J.L. (2007). Prevalence and correlates of depression, anxiety, and suicidality among university students. American journal of orthopsychiatry, 77(4), 534-542.
[4] Rodgers, L. S., Tennison, L. R. (2009). A preliminary assessment of adjustment disorder among first-year college students. Archives of Psychiatric Nursing, 23(3), 220-230.
[5] Pham, T., Bui, L., Nguyen, A., Nguyen, B., Tran, P., Vu, P., Dang, L. (2019). The prevalence of depression and associated risk factors among medical students: An untold story in Vietnam. PLOS One, 14(8), e0221432.
[6] Cadigan, J.M., Lee, C.M., Larimer, M.E. (2019). Young adult mental health: A prospective examination of service utilization, perceived unmet service needs, attitudes, and barriers to service use. Prevention Science, 20(3), 366-376
[7] Coles, M.E., Ravid, A., Gibb, B., George-Denn, D., Bronstein, L.R., McLeod, S. (2016). Adolescent mental health literacy: Young people’s knowledge of depression and social anxiety disorder. Journal of Adolescent Health, 58(1), 57–62.
[8] Hunt, J., Eisenberg, D. (2010). Mental health problems and help-seeking behavior among college students. Journal of adolescent health, 46(1), 3-10.
[9] Nguyen Thai, Q. C., Nguyen, T. H. (2018). Mental health literacy: Knowledge of depression among undergraduate students in Hanoi, Vietnam. International Journal of Mental Health Systems, 12(1), 19.