Introducción

En los últimos años, la salud mental ha cobrado una relevancia creciente, especialmente dentro del ámbito educativo. Estudiantes de todos los niveles enfrentan presiones académicas, sociales y personales que pueden afectar significativamente su bienestar emocional. En este contexto, entender los factores que influyen en la salud mental de los estudiantes universitarios es fundamental para desarrollar estrategias de apoyo más efectivas.

Este proyecto presenta un análisis exploratorio de datos (EDA) enfocado en un conjunto de información recopilada mediante encuestas a estudiantes universitarios sobre su salud mental. A través de una serie de visualizaciones interactivas, se busca identificar patrones, relaciones y posibles factores de riesgo o protección que inciden en el bienestar psicológico de esta población.

Para hacer una apropiada síntesis de estos datos vemos preciso utilizar las herramientas de visualizacion grafica que el lenguaje R es capaz de facilitar, ya que más que sólo mostrar datos, pretendemos apuntar a las causas, los patrones y los factores que influyen negativamente sobre la salud mental de los estudiantes, para de esta manera, tanto los estudiantes como las instituciones puedan valorar qué se puede mejorar para una mantener una buena salud mental.

Descripción del problema

La etapa universitaria representa un periodo de profundos cambios y exigencias para los jóvenes. Factores como la carga académica, la adaptación social, la presión por el rendimiento, la incertidumbre sobre el futuro y la falta de redes de apoyo pueden desencadenar altos niveles de estrés, ansiedad y otros problemas de salud mental.

A pesar del creciente reconocimiento de este fenómeno, muchas universidades aún carecen de mecanismos adecuados para detectar y atender oportunamente estos problemas. A menudo, los estudiantes no buscan ayuda profesional por desconocimiento, estigmatización o falta de recursos accesibles.

Este proyecto parte de una pregunta central: ¿Qué patrones o factores pueden estar asociados con la salud mental de los estudiantes universitarios, según los datos autodeclarados en una encuesta?

Entre las preguntas específicas que guiarán este análisis se encuentran:

¿Qué tan frecuente es el estrés entre los estudiantes encuestados?

¿Existen diferencias entre géneros o cursos en cuanto a la búsqueda de ayuda profesional?

¿Qué relación existe entre la edad, el tipo de institución y la presencia de problemas mentales?

El objetivo de este análisis es proporcionar una visión basada en datos que permita comprender mejor la situación actual de los estudiantes y, eventualmente, ofrecer información útil para la toma de decisiones institucionales.

Definición de fuentes de datos

Para este análisis se utiliza un conjunto de datos denominado “Student Mental Health”, que recopila respuestas de estudiantes universitarios a una encuesta enfocada en su estado emocional, hábitos y acceso a servicios de salud mental.

Características principales del conjunto de datos:

Cantidad de observaciones: 101 estudiantes

Variables a usar:

timestamp: Fecha y hora de la respuesta.

gender: Género del estudiante.

age: Edad del estudiante.

course: Carrera o área de estudio.

year of study: Año actual de carrera.

cgpa: Promedio de calificaciones.

marital status: Estado marital del estudiante.

stress: Indica si el estudiante reporta sentirse estresado.

depression: Presencia de síntomas depresivos.

anxiety: Presencia de ansiedad.

panick attack: Indica si se han presentado ataques de ansiedad.

seek treatment: Indica si el estudiante ha buscado ayuda profesional.

library(readxl)
library(ggplot2)
library(plotly)

Adjuntando el paquete: ‘plotly’

The following object is masked from ‘package:ggplot2’:

    last_plot

The following object is masked from ‘package:stats’:

    filter

The following object is masked from ‘package:graphics’:

    layout
library(dplyr)

Adjuntando el paquete: ‘dplyr’

The following objects are masked from ‘package:stats’:

    filter, lag

The following objects are masked from ‘package:base’:

    intersect, setdiff, setequal, union
library(tidyr)
datos <- read_excel("C:/Users/jsuec/Downloads/Student_Mental_Health_Cleaned.xlsx")

grafico <- ggplot(data = datos, aes(x = factor(gender), fill = factor(gender))) +
  geom_bar(alpha = 0.8) +
  labs(title = "Genero de encuestados", x = "Genero", y = "Cantidad", fill = "Genero")
ggplotly(grafico)

La distribución por género permite conocer la representatividad de los estudiantes encuestados. En muchos estudios sobre salud mental, se observan diferencias notables entre géneros tanto en la prevalencia de síntomas como en la búsqueda de ayuda.

tabla_ansiedad <- table(datos$anxiety)

grafico_pastel <- plot_ly(labels = names(tabla_ansiedad), 
                          values = tabla_ansiedad, 
                          type = "pie", 
                          textinfo = "percent+label",  
                          marker = list(colors = c("lightblue", "salmon"))) %>%
  layout(title = "Distribución de estudiantes con ansiedad")


grafico_pastel
NA

La ansiedad es una de las condiciones más frecuentes entre estudiantes universitarios. Esta gráfica busca cuantificar cuántos estudiantes reconocen sentirse con ansiedad. En la misma, podemos ver que una buena parte de los estudiantes encuestados no se sienten con ansiedad.

plot_ly(datos, x=~cgpa, type='histogram')%>%
  layout(
    title = "Histograma de rendimiento",
    yaxis = list(title = "Cantidad de estudiantes")
  )

El rendimiento académico puede relacionarse con la salud mental, tanto como causa como consecuencia. Observar su distribución puede revelar si hay un sesgo hacia cierto tipo de estudiante.Si observamos, en la gráfica se ve que una gran mayoría tiene un rendimiento por arriba de 3 y unos pocos por debajo de este.

grafico <- ggplot(data = datos, aes(x = factor(seek_treatment), fill = factor(seek_treatment))) +
  geom_bar(alpha = 0.8) +
  labs(title = "Cantidad de encuestados que buscan ayuda profesional",x="Respuesta",y = "Cantidad", fill = "Cantidad")
ggplotly(grafico)

Si analizamos el grafico, podemos darnos cuenta que la gran parte de los encuestados no han buscado orientación profesional o bien desconocen de la existencia de estos recursos en su institucion.

#bivariable

datos <- datos %>%
  mutate(Area = case_when(
    course %in% c("Laws", "Law", "Psychology", "Human Resources", "Irkhs", "Kirkhs", "KIRKHS", "Usuluddin",
                  "Fiqh", "Fiqh fatwa", "Pendidikan Islam", "Islamic Education", "Communication", "Malcom", "Human Sciences") ~ "Ciencias Sociales y Humanidades",
    
    course %in% c("Biomedical science", "Biomedical Science", "Nursing", "Diploma Nursing", "Radiography", "Biotechnology", "MHSC") ~ "Ciencias de la Salud",
    
    course %in% c("Mathematics", "Mathemathics", "Marine science", "Econs", "Economics") ~ "Ciencias Exactas y Naturales",
    
    course %in% c("Accounting", "Banking Studies", "Business Administration", "KENMS", "Kop") ~ "Negocios y Economía",
    
    course %in% c("BIT", "BCS", "CTS", "IT", "Engineering", "Engine", "engin", "KOE", "ENM", "KOA", "BENL") ~ "Tecnología e Ingeniería",
    
    course %in% c("DIPLOMA TESL", "Pendidikan Islam", "Islamic Education") ~ "Educación y Formación Docente",
    
    TRUE ~ "Otros"
  ))


df_summary <- datos %>%
  filter(!is.na(depression)) %>%
  group_by(Area,depression) %>%
  summarise(count = n(), .groups = "drop")


plot_ly(df_summary,
        x = ~Area,
        y = ~count,
        color = ~depression,
        colors = c("#66c2a5", "#fc8d62"),
        type = "bar") %>%
  layout(title = "Distribución de depresion por área académica",
         xaxis = list(title = "Área Académica", tickangle = -30),
         yaxis = list(title = "Cantidad de estudiantes"),
         barmode = "group")
NA

En el grafico visto, podemos notar una alta densidad de estudiantes en las carreras de tecnología y en ciencias sociales. A su vez, estas parecen tener la mayor incidencia en padecimientos de despresión. Tambien es importante notar que en aquellas otras carreras que no se pudieron catalogar se ve que un mayor porcentaje de estudiantes presenta sintomas de depresion que los que no.


datos_contados <- datos %>%
  group_by(depression, seek_treatment) %>%
  summarise(count = n(), .groups = 'drop')


plot_ly(
  datos_contados,
  x = ~depression,
  y = ~count,
  color = ~seek_treatment,
  colors = c("steelblue", "firebrick"),
  type = "bar"
) %>%
  layout(
    title = "Estudiantes con depresión que buscan ayuda profesional",
    xaxis = list(title = "¿Depresión?"),
    yaxis = list(title = "Cantidad de estudiantes"),
    barmode = "group"  
  )

Revisando la grafica, podemos notar varias cosas, ninguno de los estudiantes que dijeron no tener depresión acude a un profesional. Mientras tanto, observamos que los estudiantes que dicen tener depresion son una minoría los que acuden recurren a tratamiento.


df <- datos %>%
  mutate(
    año = case_when(
      year_of_study == "foundation" ~ 0,
      year_of_study == "year 1" ~ 1,
      year_of_study == "year 2" ~ 2,
      year_of_study == "year 3" ~ 3,
      year_of_study == "year 4" ~ 4
    ),
    cgpa = case_when(
      cgpa == "0 - 1.99" ~ 1.0,
      cgpa == "2.00 - 2.49" ~ 2.25,
      cgpa == "2.50 - 2.99" ~ 2.75,
      cgpa == "3.00 - 3.49" ~ 3.25,
      cgpa == "3.50 - 4.00" ~ 3.75
    ),
    mental_health_score = (depression == "Yes") + 
                          (anxiety == "Yes") + 
                          (panic_attack == "Yes")
  )

fig <- plot_ly(
  data = df,
  x = ~age,
  y = ~cgpa,
  z = ~año,
  color = ~seek_treatment,
  size = ~mental_health_score,
  symbol = ~gender,
  text = ~paste("Course:", course,
                "<br>Depression:", depression,
                "<br>Anxiety:", anxiety,
                "<br>Panic Attack:", panic_attack),
  type = "scatter3d",
  mode = "markers"
)

fig <- fig %>% layout(title = "Relación entre Edad, CGPA y Año de Estudio con Salud Mental")
fig
Aviso: Ignoring 1 observationsAviso: `line.width` does not currently support multiple values.Aviso: `line.width` does not currently support multiple values.Aviso: `line.width` does not currently support multiple values.Aviso: minimal value for n is 3, returning requested palette with 3 different levels
Aviso: minimal value for n is 3, returning requested palette with 3 different levels
Aviso: Ignoring 1 observationsAviso: `line.width` does not currently support multiple values.Aviso: `line.width` does not currently support multiple values.Aviso: `line.width` does not currently support multiple values.Aviso: minimal value for n is 3, returning requested palette with 3 different levels
Aviso: minimal value for n is 3, returning requested palette with 3 different levels

Para dar algo de contexto sobre este grafico 3D podemos empezar diciendo que el tamaño de las burbujas crece segun que tantos padecimientos tenga la persona encuestada, y que segun el color de la burbuja representa si buscó ayuda profesional, con esto en mente podemos observar distintos patrones curiosos, como por ejemplo que las personas que presentan padecimientos de salud mental no siempre buscan tratamiento, y esto es mas notable en los primeros años de estudio y a edades mas tempranas, y tambien podemos observar que las personas con un rendimiento academico mas bajo tienden a presentar mas condiciones de salud mental


graficoFaceta <- ggplot(df, aes(x = gender, fill = seek_treatment)) +
  geom_bar(position = "fill") +
  facet_grid(depression ~ year_of_study) +
  labs(
    y = "Proporción",
    title = "Búsqueda de tratamiento por género, año y presencia de depresión",
    fill = "Busca tratamiento"
  ) +
  theme_minimal()
ggplotly(graficoFaceta)

En este grafico podemos observar varios comportamientos interesantes, en primer lugar podemos ver que las personas que presentan depresion son los unicos que se plantean el buscar tratamiento profesional, luego podemos observar como las mujeres son mas propensas a buscar ayuda profesional, mas que los hombres.

grafico1 <- plot_ly(data = datos, x = ~gender, color = ~depression, type = "histogram") %>%
  layout(title = list(text = "Depresión por género", y = 0.98),  
         xaxis = list(title = "Género"), 
         yaxis = list(title = "Cantidad"))

grafico2 <- plot_ly(data = datos, x = ~year_of_study, color = ~anxiety, type = "histogram") %>%
  layout(title = list(text = "Ansiedad por año de estudio", y = 0.98),
         xaxis = list(title = "Año de estudio"), 
         yaxis = list(title = "Cantidad"))

grafico3 <- plot_ly(data = datos, x = ~cgpa, color = ~seek_treatment, type = "histogram") %>%
  layout(title = list(text = "Búsqueda de tratamiento por CGPA", y = 0.98),
         xaxis = list(title = "CGPA"), 
         yaxis = list(title = "Cantidad"))


grafico_compuesto <- subplot(
  grafico1, grafico2, grafico3,
  nrows = 2, 
  margin = 0.1,  
  titleY = TRUE,  
  titleX = TRUE,  
  heights = c(0.5, 0.5)  
) %>% 
  layout(
    title = list(text = "Análisis compuesto de salud mental en estudiantes", 
                 x = 0.5, y = 0.98, xanchor = "center"),  
    showlegend = TRUE,
    annotations = list(
      list(x = 0.2, y = 1.0, text = "Depresión por género", showarrow = FALSE, xref = "paper", yref = "paper"),
      list(x = 1, y = 1.0, text = "Ansiedad por año de estudio", showarrow = FALSE, xref = "paper", yref = "paper"),
      list(x = 0.10, y = 0.40, text = "Búsqueda de tratamiento por CGPA", showarrow = FALSE, xref = "paper", yref = "paper")
    )
  )
Aviso: minimal value for n is 3, returning requested palette with 3 different levels
Aviso: minimal value for n is 3, returning requested palette with 3 different levels
Aviso: minimal value for n is 3, returning requested palette with 3 different levels
Aviso: minimal value for n is 3, returning requested palette with 3 different levels
Aviso: minimal value for n is 3, returning requested palette with 3 different levels
Aviso: minimal value for n is 3, returning requested palette with 3 different levels
grafico_compuesto

Los gráficos muestran patrones importantes sobre la salud mental de los estudiantes universitarios. Por ejemplo, se observa que las mujeres tienden a presentar más síntomas de depresión. También se nota que quienes están en los primeros años de carrera suelen sentir más ansiedad, posiblemente por el reto de adaptarse al nuevo ambiente académico y social. Además, los estudiantes con promedios más bajos (menos de 3.0) son menos propensos a buscar ayuda profesional, incluso si experimentan ansiedad o depresión. Esto podría deberse al estigma o a la falta de recursos accesibles. En general, los datos muestran la necesidad de ofrecer apoyo psicológico adaptado al género, al año de estudios y al rendimiento académico, y de promover campañas que ayuden a normalizar el cuidado de la salud mental en las universidades.

A partir de lo anteriormente expuesto, tenemos varias conclusiones que podemos hacer respecto a los estudiantes entrevistados, que si bien los graficos pueden variar dependiendo del lugar y la universidad, mucho de lo que se puede apreciar en estos datos se pueden extrapolar a otros lugares.

-Tan solo una minoría busca asesoramiento profesional ante la depresión y la ansiedad

-Se pudo observar que estudiantes de menor edad y en sus primeros años de estudio tienden a presentar más sintomas de depresion y ansiedad

-Los estudiantes con menor rendimiento academico se ven mayormente afectados tanto por depresion o por ansiedad

-Según la muestra de datos, los estudiantes del area de tecnologia y de ciencias sociales y humanidades, aparte de ser un sector mas denso, son los que tienden a ser más afectados por depresion o ansiedad.

-Vemos que a pesar de las pocas instancias, dentro de estas las mujeres fueron las que mas buscaron ayuda profesional.

Siendo esta la situación hay puntos que pueden ser algo alarmantes, por ejemplo:

La baja búsqueda de ayuda profesional sugiere que muchos estudiantes pueden estar enfrentando trastornos emocionales sin el acompañamiento adecuado, lo que podría estar manifestando un deterioro progresivo de su salud mental, ademas de esto, la baja búsqueda de ayuda profesional sugiere que muchos estudiantes pueden estar enfrentando trastornos emocionales sin el acompañamiento adecuado, lo que podría derivar en un deterioro progresivo de su bienestar psicológico.

A su vez, los estudiantes más jóvenes y de primeros años, al ser más afectados podrían tener mayores dificultades de adaptación al entorno universitario, afectando de mala manera su permanencia y el desarrollo académico.

De la misma forma, aunque las mujeres buscan más ayuda, sigue siendo preocupante que los hombres, posiblemente por estigmas de género, no accedan a apoyo profesional, reprimiendo así sus aflicciones.

Siendo así, sería útil implementar acciones que propicien la buena salud mental , quizas fortaleciendo los servicios de salud mental en universidades, haciendo campañas de concientización y desestigmatización o fomentar aún más el equilibrio entre vida académica y personal

