La depresión afecta a aproximadamente el 5% de los adultos y a unos 350 millones de personas en el mundo. La música puede ser una herramienta terapéutica efectiva para tratar la depresión, así como también bajo ciertos contextos puede agravarla. El proposito de este análisis es identificar si existe alguna relación entre los niveles de depresión autopercibidad y los habitos musicales de los participantes. Esto puede contribuir al desarrollo orientativo de la musicoterapia y/o terapias psicológicas para la depresión.
Se analizará la base de datos “Music x Mental Health” usando R studio, adquirida mediante la plataforma Kaggle.En esta los encuestados responden preguntas sobre sus gustos y hábitos musicales, y auto reportan su percepción personal de niveles de depresión. Los participantes califican su nivel de depresión del 1 al 10 donde: - 0: No lo experimento. - 10: Lo experimento con regularidad. También seleccionan su género musical favorito y describen la frecuencia de escucha para cada género musical ()
El tamaño de la muestra es de 715, correspondiente a la cantidad de personas que alcanzaron a responderla dentro del plazo entregado. Para esta investigación se considerarán solo 704 ya que se delimitó un rango de edad entre 15 a 75 años.
Instalación de paquetes
install.packages("tidyverse")
library(tidyverse)
Lectura de datos
datos <- read.csv("mxmh_survey_results.csv")
Filtro por rango etario
datos <- datos %>%
filter(Age >= 15 & Age <= 75)
datos %>%
group_by(Fav.genre) %>%
summarise(n = n()) %>%
ungroup() %>%
mutate(porcentaje = (n / sum(n)) * 100)
## # A tibble: 16 × 3
## Fav.genre n porcentaje
## <chr> <int> <dbl>
## 1 Classical 43 6.11
## 2 Country 24 3.41
## 3 EDM 37 5.26
## 4 Folk 29 4.12
## 5 Gospel 6 0.852
## 6 Hip hop 34 4.83
## 7 Jazz 19 2.70
## 8 K pop 25 3.55
## 9 Latin 3 0.426
## 10 Lofi 9 1.28
## 11 Metal 88 12.5
## 12 Pop 111 15.8
## 13 R&B 34 4.83
## 14 Rap 19 2.70
## 15 Rock 184 26.1
## 16 Video game music 39 5.54
Para analizar la relación de los niveles depresivos con los gustos musicales se definió como rango de depresión auto percibida extrema o muy severa aquellos puntajes mayores a 8. Se utilizaron las respuestas de los 704 participantes.
datos %>%
group_by(Fav.genre) %>%
summarise(
total = n(),
Dbaja = sum(Depression <= 8),
porcentaje_baja = (sum(Depression <= 8) / n()) * 100,
Dalta = sum(Depression > 8),
porcentaje_alta = (sum(Depression > 8) / n()) * 100)
## # A tibble: 16 × 6
## Fav.genre total Dbaja porcentaje_baja Dalta porcentaje_alta
## <chr> <int> <int> <dbl> <int> <dbl>
## 1 Classical 43 40 93.0 3 6.98
## 2 Country 24 21 87.5 3 12.5
## 3 EDM 37 31 83.8 6 16.2
## 4 Folk 29 25 86.2 4 13.8
## 5 Gospel 6 5 83.3 1 16.7
## 6 Hip hop 34 30 88.2 4 11.8
## 7 Jazz 19 18 94.7 1 5.26
## 8 K pop 25 22 88 3 12
## 9 Latin 3 3 100 0 0
## 10 Lofi 9 7 77.8 2 22.2
## 11 Metal 88 78 88.6 10 11.4
## 12 Pop 111 105 94.6 6 5.41
## 13 R&B 34 31 91.2 3 8.82
## 14 Rap 19 17 89.5 2 10.5
## 15 Rock 184 153 83.2 31 16.8
## 16 Video game music 39 37 94.9 2 5.13
Para analizar los intervalos de confianza en torno a la proporción se usaron los 4 géneros musicales con mayor frecuencia de favoritismos, otorgando un total de participantes 376, correspondientes al Rock (n=153), Pop (n=105), Metal (n=78) y Classical (n=40). Esto en busca de minimizar lo más posible el margen de error. Se consideró un α=0.05.
intervalo <- datos %>%
group_by(Fav.genre) %>%
summarise(
total = n(),
Dalta = sum(Depression > 8),
p = Dalta / total,
q = 1 - p,
# Intervalo de confianza para la proporción
se = sqrt(p * q / total), # error estándar
lci = p - 1.96 * se, # límite inferior del intervalo de confianza
uci = p + 1.96 * se # límite superior del intervalo de confianza
) %>%
filter(total >= 43)
Para facilitar la creción del gráfico se creo un dataframe que contiene unicamente los valores que serán utilizados para el gráfico
data <- data.frame(
Fav.genre = c("Classical", "Metal", "Pop", "Rock"),
total = c(43, 88, 111, 184),
Dalta = c(3, 10, 6, 31),
p = c(6.98, 11.4, 5.41, 16.85),
q = c(93.0, 88.6, 94.6, 83.2),
se = c(3.88, 3.38, 2.15, 2.76),
lci = c(-0.638, 4.73, 1.20, 11.4),
uci = c(14.6, 18.0, 9.61, 22.3)
)
ggplot(data, aes(x = Fav.genre, y = p)) +
geom_point(color = "red", size = 3) +
geom_errorbar(aes(ymin = lci, ymax = uci), width = 0.2) +
geom_text(aes(label = round(p, 2), hjust = -0.3)) +
labs(title = "Gráfico 1. Barras de error de género musical favorito\npor autopercepción severa de depresión",
x = "Género musical favorito",
y = "Autopercepción depresiva severa (%)") +
theme_minimal() +
scale_y_continuous(labels = scales::percent_format(scale = 1))
El intervalo de prevalencia con un mayor límite superior corresponde al del rock. Su margen de error es de alrededor del 5% por lo que se considera aceptable. El género con el intervalo más acotado y con menor límite superior fue el pop, el margen de error es de un 4.2%. El Metal y Classical tienen intervalos bastante amplios ya que sus errores son de más del 6%. Se espera, con un 95% de confianza, que entre el 11.4% y 22.3% de la población que tiene como género musical favorito el rock, perciba en sí mismo niveles severos de depresión, mientras que para el pop se espera que solo sea entre el 1.2% y el 9.6%.
Debido a la alta prevalencia encontrada para el Rock, por último, se visualizará la relación entre la frecuencia con la que los participantes escuchan rock.
datos %>%
group_by(Frequency..Rock.) %>%
summarise(n = n()) %>%
ungroup() %>%
mutate(porcentaje = (n / sum(n)) * 100)
## # A tibble: 4 × 3
## Frequency..Rock. n porcentaje
## <chr> <int> <dbl>
## 1 Never 79 11.2
## 2 Rarely 89 12.6
## 3 Sometimes 213 30.3
## 4 Very frequently 323 45.9
datos %>%
group_by(Frequency..Rock.) %>%
ggplot(aes(x = Frequency..Rock., y = Depression)) +
geom_boxplot(fill = "skyblue", color = "black") +
stat_summary(fun = median, geom = "text", aes(label = round(..y.., 1)), vjust = -0.5) +
labs(title = "Gráfico 2. Diagrama de caja para la Frecuencia de escucha de Rock y el nivel de depresión auto",
x = "Frecuencia de escucha de Rock",
y = "Nivel de depresión autoreportado") +
theme_minimal() +
scale_y_continuous(breaks = seq(0, 10, 1), limits = c(0, 10))
## Warning: The dot-dot notation (`..y..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(y)` instead.
Pareciera existir una correlación positiva entre estas. Mientras más frecuencia de escucha, mayor es el nivel de depresión auto percibido. El 50% de los encuestados que escucha rock frecuentemente auto reportan 6 o más puntos de depresión, y su distribución es más acotada en torno a valores elevados. Solo hasta el 25% tendría valores de hasta 3 puntos, todo el resto estaría sobre eso, dentro de los cuales un 25% tendría 8 o más puntos. Cerca del 25% de las personas que escuchan rock frecuentemente auto reportaron una autopercepción severa de depresión. En contraste, el 50% de los que nunca escuchan rock reportan solo hasta 4 puntos y tienen un rango más amplio de distribución, que engloba valores bajos.
Si bien no se puede definir a ningún género musical como “causante” de una autopercepción alta de depresión, si se encontraron relaciones que resultan interesantes:
• Los géneros musicales favoritos con una mayor prevalencia de autopercepción severa de depresión fueron: Lofi (22.2), Gospel (17.1), Rock (16.8) y EDM (16.1).
• Se espera que alrededor de un 11% a un 22% de la población que tiene como genero favorito el Rock auto reporte niveles extremos de depresión. Es una prevalencia bastante alta, sobre todo considerando lo masivo e importante que es el rock para la industria musical.
• Se encontró una correlación positiva entre la frecuencia de escucha de Rock y los niveles de depresión auto percibidos. Mientras mayor fue la frecuencia de escucha de Rock, mayores fueron los rangos de depresión auto percibidos.
Este análisis presenta algunas limitaciones que deben tenerse en cuenta al interpretar los resultados. En primer lugar, el tamaño muestral no es tan adecuado, lo que limita la interpolación extrapolación de los hallazgos. Se recomienda ampliar la muestra a uno que permita equilibrar la frecuencia de los géneros musicales para obtener conclusiones más sólidas.
Además, se utilizó una escala de autopercepción, lo que puede introducir sesgos y variaciones en las respuestas de los participantes. Por esto sería interesante utilizar alguna escala operacionalizada para medir el nivel de depresión en los participantes, como por ejemplo la Escala de Depresión de Beck (BDI).
Se sugiere que futuros análisis aborden estas limitaciones para obtener una comprensión más completa de la relación entre la música y la salud mental.