Introducción

La relación entre trastornos mentales y el consumo de drogas es ampliamente estudiada de manera bidireccional. Sin embargo, en Chile, los estudios que exploren esta interacción de manera integral son limitados. Este análisis busca contribuir al conocimiento local a partir de datos recientes y representativos.

La literatura sugiere que condiciones como la depresión y el TDAH aumentan la probabilidad de iniciar y mantener el consumo de tabaco (Audrain-McGovern et al., 2015; van Amsterdam et al., 2018), mientras que la cesación del hábito reduce síntomas de depresión, ansiedad y estrés, además de mejorar el rendimiento cognitivo (Taylor et al., 2014b; Vermeulen et al., 2018).

En cuanto al alcohol, los trastornos mentales en la infancia están relacionados con un mayor riesgo de dependencia en la adultez (Groenman et al., 2017), y el consumo excesivo puede exacerbar síntomas depresivos, aunque esta relación disminuye al controlar variables de confusión (Li et al., 2020). Respecto al cannabis, aunque la evidencia es más limitada, estudios han señalado que trastornos como la depresión y la ansiedad incrementan el riesgo de iniciación en su uso (Wittchen et al., 2007).

En este contexto, se utilizarán datos de la Décima Encuesta Nacional de Juventudes (2022) para analizar cómo estas asociaciones se manifiestan en jóvenes chilenos de 15 a 29 años. El objetivo es identificar patrones de consumo de sustancias como alcohol, tabaco y cannabis, en relación con trastornos mentales como ansiedad, depresión y TDAH, proporcionando evidencia que oriente estrategias de intervención y políticas públicas integrales.

Materiales y métodos

Se analizará la Décima Encuesta Nacional de Juventudes, publicada en noviembre de 2022, que estudia a personas entre los 15 y 29 años. Se realizaron 9700 encuestas, de estas 1057 reciben algún tipo de tratamiento de salud mental.

Se utilizarán las variables correspondientes a las preguntas del Módulo 14: Salud Mental (P102, P103, P104 y P105) Y P76 del Módulo 12:

Caption for the picture. Caption for the picture.

Preparación

Instalación de paquetes

install.packages("tidyverse")
library(tidyverse)
install.packages("haven")
library(haven)
install.packages("kableExtra")
library(kableExtra)
install.packages("knitr")
library(knitr)

Lectura de datos

data <- readRDS(url("https://github.com/JoseRTM/Clases-R/raw/main/jovenes.rds"))

Selección y limpieza

Se renombraron las variables para hacer más digerible el análisis.

Todos los 99 se trasformaron en NA.

Las variables se recodificaron trasformando las variables dicotómicas de (1,2) a (0,1), esto debido a que así las prevalencias se pueden calcular directamente a través de la media.

datos <- data %>%
  select(edad = EDAD, sexo = SEXO, 
         alcohol = P76_1, cigarro = P76_2, marihuana = P76_3, cocaina = P76_4, pbc =P76_5, 
         depresion = P104_1, ansiedad= P104_2, TCA= P104_4, TDAH = P104_5, OCD =P104_6, sustancias = P104_3, estres =P104_7, otro = P104_8, no_he = P104_9,
         P102_1,P102_2,P102_3, P102_4, P102_5, P102_6,P102_7,
         tratamiento= P103, nivel_felicidad= P5, P105_1,P105_2,P105_3) %>%
  mutate(across(everything(), ~ replace(., . == 99, NA))) %>%
  mutate(across(c(alcohol, cigarro, marihuana, cocaina, pbc, depresion, ansiedad, TCA, TDAH, OCD, sustancias, tratamiento, estres, otro, no_he), 
                ~ ifelse(. == 2, 0, .)))

Todos quienes respondan la pregunta P103 deben elegir al menos una opción entre la P104_1 Y P104_9. Algunos encuestados no lo hicieron por lo que no se considerará su respuesta para la P103.

datos <- datos %>%  
  mutate(tratamiento = ifelse(tratamiento == 1 & rowSums(select(., depresion, ansiedad, TCA, TDAH, OCD, estres, otro, sustancias, no_he)) == 0, 0, tratamiento))

Análisis descriptivo

Exploración

datos %>%
  count(tratamiento)

#diagnostico explicitamente mencionado
datos %>%
  filter(tratamiento == 1 & rowSums(select(., depresion, ansiedad, TCA, TDAH, OCD,estres, sustancias)) >= 1) %>%
  nrow()

#otros trastornos
datos %>%filter(tratamiento == 1) %>% count(otro==1)
#sin diagnostico
datos %>% filter(tratamiento == 1) %>% count(no_he==1) 

#diagnostico y el menps una droga
datos %>% filter(rowSums(select(., alcohol, cigarro, marihuana, cocaina, pbc), na.rm = TRUE) >= 1) %>% 
  filter(tratamiento==1) %>% count() 

#Edad
datos %>% filter(rowSums(select(., alcohol, cigarro, marihuana, cocaina, pbc), na.rm = TRUE) >= 1) %>% 
  filter(tratamiento==1) %>% summarise(media= mean(edad),
                                       menores = sum(edad<18)) #127 son menores de edad
#Sexo
datos %>% filter(rowSums(select(., alcohol, cigarro, marihuana, cocaina, pbc), na.rm = TRUE) >= 1) %>% 
  filter(tratamiento==1) %>% count(sexo)

De las 1057 personas que reciben algún tratamiento, 908 tienen diagnostico para algún trastorno explícitamente mencionado en la encuesta, 127 para otros trastornos , y 83 aún no tienen claro su trastorno o no han recibido un diagnóstico. Por último, de estas 1057 personas que reciben algún tratamiento 791 consumen al menos una droga, 127 de ellos son menores de edad, 254 son hombres y 533 mujeres.

Durante el análisis se debe tener en cuenta que las preguntas P104_1 a P104_9 solo podían ser respondidas en caso de que recibieran algún tratamiento (P103=1). Esta base de datos excluye a todas las personas que tienen algún trastorno, pero no reciben tratamiento. Además, de las 1057 personas que reciben tratamiento solo 864 tienen alguno de los trastornos mencionados en la encuesta.

Distribución de trastornos

Esta tabla considera la distribución de trastornos para los encuestados que consumen al menos una drogra.

datos %>%
  filter(tratamiento == 1) %>% 
  filter(rowSums(select(., alcohol, cigarro, marihuana, cocaina, pbc), na.rm = TRUE) >= 1) %>% 
  summarise(
    Depresión = sum(depresion == 1, na.rm = TRUE),
    Ansiedad = sum(ansiedad == 1, na.rm = TRUE),
    TCA = sum(TCA == 1, na.rm = TRUE),
    TDAH = sum(TDAH == 1, na.rm = TRUE),
    OCD = sum(OCD == 1, na.rm = TRUE),
    Estres = sum(estres == 1, na.rm = TRUE),
    Otro = sum(otro == 1, na.rm = TRUE),
    No_he = sum(no_he == 1, na.rm = TRUE),
    Sustancias = sum(sustancias == 1, na.rm = TRUE)
  )%>%
  kable(caption = "Resumen de Trastornos y Comportamientos en Tratamiento", format = "markdown")
Resumen de Trastornos y Comportamientos en Tratamiento
Depresión Ansiedad TCA TDAH OCD Estres Otro No_he Sustancias
414 466 36 39 37 166 94 57 23

El trastorno más presente es la ansiedad (466), seguido de depresión (416) y estrés (166). El resto de trastornos los tienen una cantidad baja de personas, sobre todo para la adicción a sustancias (23) y TCA (36). Esto debe tenerse en cuenta a la hora de hacer interpretaciones.

Distribución de consumo

Esta tabla considera la distribución de consumo de drogas para los encuestados que tienen al menos un trastorno.

datos %>%
  filter(tratamiento == 1) %>%
  summarise(
    alcohol = sum(alcohol, na.rm = TRUE),
    marihuana = sum(marihuana, na.rm = TRUE),
    cigarro = sum(cigarro, na.rm = TRUE),
    pbc = sum(pbc, na.rm = TRUE),
    cocaina = sum(cocaina, na.rm = TRUE)
  )%>%
  kable(caption = "Distribución consumo de drogas", format = "markdown")
Distribución consumo de drogas
alcohol marihuana cigarro pbc cocaina
678 385 461 4 34

La droga más consumida es el alcohol (678), seguida del cigarro (461) y la marihuana (385). La cantidad de personas que tienen al menos un trastorno y consumen cocaína (34) y pbc (4) es bastante baja, por lo que será difícil obtener resultados estadísticamente significantes para estas drogas.

Consumo de sustancias por trastorno

prevalencias_df <- datos %>%
  pivot_longer(cols = c(alcohol, cigarro, marihuana, cocaina, pbc), names_to = "Sustancia", values_to = "Consumo") %>%
  pivot_longer(cols = c(depresion, ansiedad, TCA, TDAH, OCD, estres, sustancias, otro), names_to = "Trastorno", values_to = "Diagnostico") %>%
  filter(Diagnostico == 1) %>%
  group_by(Trastorno, Sustancia) %>%
  summarise(Prevalencia = mean(Consumo == 1, na.rm = TRUE) * 100) %>%
  ungroup() %>%
  pivot_wider(names_from = Sustancia, values_from = Prevalencia, names_prefix = "prevalencia_")

prevalencias_largo <- prevalencias_df %>%
  pivot_longer(cols = c(prevalencia_alcohol, prevalencia_cigarro, prevalencia_marihuana, prevalencia_cocaina, prevalencia_pbc),
               names_to = "Sustancia", values_to = "Prevalencia")

ggplot(prevalencias_largo, aes(x = Trastorno, y = Prevalencia, fill = Sustancia)) +
  geom_bar(stat = "identity", position = "dodge", width = 0.7) +  # Barras separadas
  labs(title = "Prevalencia de Consumo de Sustancias por Trastorno",
       x = "Trastorno",
       y = "Prevalencia (%)") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

prevalencias_df %>%
  kable("html", caption = "Prevalencias por Trastorno y Sustancia") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE) %>%
  scroll_box(width = "100%", height = "280px") 
Prevalencias por Trastorno y Sustancia
Trastorno prevalencia_alcohol prevalencia_cigarro prevalencia_cocaina prevalencia_marihuana prevalencia_pbc
OCD 73.46939 45.83333 4.4444444 46.93878 2.2222222
TCA 68.00000 52.00000 4.1666667 40.81633 2.1276596
TDAH 52.30769 34.37500 4.7619048 35.38462 1.5873016
ansiedad 66.11570 44.51827 2.5466893 36.24382 0.5067568
depresion 66.28352 48.94434 3.9138943 39.19694 0.3960396
estres 64.00000 44.39462 2.7397260 34.82143 0.0000000
otro 63.77953 48.81890 0.8064516 30.40000 0.0000000
sustancias 62.96296 59.25926 22.2222222 70.37037 4.0000000
datos %>%
  summarise(
    prevalencia_alcohol = mean(alcohol, na.rm = TRUE),
    prevalencia_marihuana = mean(marihuana, na.rm = TRUE),
    prevalencia_cigarro = mean(cigarro, na.rm = TRUE),
    prevalencia_cocaina = mean(cocaina, na.rm = TRUE),
    prevalencia_pbc = mean(pbc, na.rm = TRUE)
  ) %>%
  kable(caption = "Resumen de prevalencias de consumo para toda la muestra", format = "markdown")
Resumen de prevalencias de consumo para toda la muestra
prevalencia_alcohol prevalencia_marihuana prevalencia_cigarro prevalencia_cocaina prevalencia_pbc
0.5853992 0.2685527 0.3432159 0.0199016 0.0033287
prevalencias_dif <- prevalencias_df %>%
  mutate(
    prevalencia_alcohol = prevalencia_alcohol - 0.5853992*100,
    prevalencia_marihuana = prevalencia_marihuana - 0.2685527*100,
    prevalencia_cigarro = prevalencia_cigarro - 0.3432159*100,
    prevalencia_cocaina = prevalencia_cocaina - 0.0199016*100,
    prevalencia_pbc = prevalencia_pbc - 0.0033287*100
  )
prevalencias_dif_long <- prevalencias_dif %>%
  pivot_longer(cols = starts_with("prevalencia"), 
               names_to = "Sustancia", 
               values_to = "Diferencia")

# Crear el heatmap
ggplot(prevalencias_dif_long, aes(x = Trastorno, y = Sustancia, fill = Diferencia)) +
  geom_tile() +
  scale_fill_gradient2(low = "blue", high = "red", mid = "white", midpoint = 0) +
  theme_minimal() +
  labs(title = "Heatmap de Diferencias en la Prevalencia de Consumo entre Personas con Trastornos y la Muestra",
       x = "Trastorno",
       y = "Sustancia",
       fill = "Diferencia") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) 

Para todos los trastornos, menos la adicción a sustancias, la droga con mayor prevalencia de consumo es el alcohol, alcanzando un 73.5% para el trastorno obsesivo compulsivo. La mayoría de trastornos, exceptuando el TDAH, tienen una diferencia de prevalencia de consumo de marihuana, cigarro y alcohol de más del 10% comparado con el resto de la muestra.

Porcentajes segun grupo de consumo

Para esto se añadió la columna grupo_consumo, que clasifica por grupo de consumo entre monocosumidor (solo una sustancias), biconsumidor(dos sustancias) y policonsumidor (3 o más).

datos <- datos %>%
  mutate(grupo_consumo = case_when(
    rowSums(datos[c("alcohol", "cigarro", "marihuana", "cocaina", "pbc")], na.rm = TRUE) == 1 ~ "1 (Monoconsumidor)",
    rowSums(datos[c("alcohol", "cigarro", "marihuana", "cocaina", "pbc")], na.rm = TRUE) == 2 ~ "2 (Biconsumidor)",
    rowSums(datos[c("alcohol", "cigarro", "marihuana", "cocaina", "pbc")], na.rm = TRUE) > 2 ~ "3 o más (policonsumidor)",
    TRUE ~ NA_character_  # Para el caso en que no consumen nada, si es necesario
  ))

 porcentajes <-   datos %>%
    filter(tratamiento == 1) %>%
    filter(!is.na(grupo_consumo)) %>%
    filter(depresion == 1 | ansiedad == 1 | TCA == 1 | TDAH == 1 | OCD == 1 | estres == 1 | sustancias == 1 | otro == 1) %>%
    pivot_longer(cols = c(depresion, ansiedad, TCA, TDAH, OCD, estres, sustancias, otro),
                 names_to = "trastorno", values_to = "presencia") %>%
    filter(presencia == 1) %>%
    count(trastorno, grupo_consumo) %>%
    group_by(trastorno) %>%
    mutate(total_trastorno = sum(n)) %>%
    ungroup() %>%
    mutate(porcentaje = n / total_trastorno * 100) %>%
    select(trastorno, grupo_consumo, porcentaje) %>%
    pivot_wider(names_from = grupo_consumo, values_from = porcentaje, values_fill = list(porcentaje = 0)) %>%
    arrange(trastorno) 
porcentajes_long <- porcentajes %>%
  pivot_longer(cols = `1 (Monoconsumidor)`: `3 o más (policonsumidor)`,
               names_to = "grupo_consumo",
               values_to = "porcentaje")
ggplot(porcentajes_long, aes(x = porcentaje, y = trastorno, fill = grupo_consumo)) +
  geom_bar(stat = "identity", position = "stack") +  
  scale_x_continuous(labels = scales::percent_format(scale = 1)) +  
  scale_fill_manual(values = c(
    "1 (Monoconsumidor)" = "#A7C7E7",  
    "2 (Biconsumidor)" = "#4682B4", 
    "3 o más (policonsumidor)" = "#1C3F60"  
  )) + 
  labs(
    title = "Porcentaje de Trastornos por Tipo de Consumo en Tratamiento",
    x = "Porcentaje (%)",
    y = "Trastorno",
    fill = "Grupo de Consumo"
  ) +
  theme_minimal() +  # Tema limpio
  theme(axis.text.y = element_text(size = 10),  
        axis.text.x = element_text(size = 10)) + 
  theme(axis.text.x = element_text(angle = 0))  

porcentajes %>%
  kable("html", caption = "Distribución porcentual de tipo de consumo por trastorno")
Distribución porcentual de tipo de consumo por trastorno
trastorno 1 (Monoconsumidor) 2 (Biconsumidor) 3 o más (policonsumidor)
OCD 27.02703 27.02703 45.94595
TCA 25.00000 25.00000 50.00000
TDAH 35.89744 25.64103 38.46154
ansiedad 36.90987 34.54936 28.54077
depresion 33.57488 36.47343 29.95169
estres 38.55422 28.31325 33.13253
otro 38.29787 29.78723 31.91489
sustancias 13.04348 43.47826 43.47826

La tabla muestra la distribución porcentual del tipo de consumo por trastorno, revelando que, en general, la proporción de personas que consumen dos o más sustancias es superior a la de aquellos que consumen solo una. Este patrón es evidente en todos los trastornos analizados, donde más del 50% de los afectados pertenecen a las categorías de biconsumidores y policonsumidores. Por ejemplo, en trastornos como ansiedad, depresión, estrés y otros, la mayoría de las personas tienden a consumir al menos dos sustancias, con la categoría de biconsumidores alcanzando valores significativos, especialmente en depresión y ansiedad. Solo en el trastorno de sustancias se observa una distribución más equilibrada entre las categorías de consumo, con una alta proporción de personas que consumen tanto dos como tres o más sustancias.

Análisis frecuencia de molestias (P102)

Se analizarán las preguntas P102_1 a P102_7 donde los participantes califican la frecuencia del 1 al 4 con la que han sentido durante las últimas dos semanas cada molestia, siento 1 para nada y 4 casi todos los días.

El siguiente gráfico muestra la proporción de personas en tratamiento en cada pregunta para todas las personas que respondieron que han sentido estas molestias casi a diario (P102_x == 4).

# Preparar los datos para el gráfico
datos_largos <- datos %>%
  pivot_longer(cols = starts_with("P102_"), 
               names_to = "pregunta", 
               values_to = "respuesta") %>%
  filter(!is.na(respuesta) & respuesta == 4, !is.na(tratamiento)) %>%
  count(pregunta, tratamiento) %>%
  group_by(pregunta) %>%
  mutate(porcentaje = n / sum(n) * 100)  
ggplot(datos_largos, aes(x = pregunta, y = n, fill = factor(tratamiento))) +
  geom_bar(stat = "identity", position = "stack") +  # Apilado por n
  geom_text(aes(label = paste0(n, " (", round(porcentaje, 1), "%)")),
            position = position_stack(vjust = 0.5), size = 2.8) +  # Etiquetas con n y porcentaje
  scale_fill_manual(values = c("0" = "#8B7B8B", "1" = "#FFE1FF"), 
                    labels = c("Sin tratamiento", "En tratamiento")) +
  labs(
    title = "Distribución de tratamiento por pregunta",
    x = "Pregunta",
    y = "Cantidad (n)",
    fill = "Estado de tratamiento"
  ) +
  theme_minimal() +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1)
  )

Para todas las preguntas se repite la tendencia de que más del 65% no tiene algún tratamiento en la actualidad. Casi a diario 1348 personas han tenido molestias asociadas al insomnio (P102_5), 930 no han sido capaces de controlar su preocupación y 435 tienen pensamientos suicidas (P102_7), pero menos del 35% asiste actualmente a algún tratamiento.

Estos porcentajes nos dan cuenta también del sesgo que se puede estar generando al registrar los diagnósticos solo de quienes acceden actualmente a algún tratamiento. Tal vez de ese 66% de personas sin tratamiento que tienen pensamientos suicidas casi a diario, hay personas con algún diagnóstico, pero no tenemos forma de saberlo.

datos_lineas_filtrados <- datos %>%
  pivot_longer(cols = starts_with("P102_"), names_to = "pregunta", values_to = "respuesta") %>%
  pivot_longer(cols = c(marihuana, cigarro, alcohol, pbc, cocaina), names_to = "droga", values_to = "consumo") %>%
  filter(!is.na(respuesta), !is.na(consumo), droga %in% c("marihuana", "cigarro", "alcohol")) %>%
  group_by(pregunta, respuesta, droga) %>%
  summarize(prevalencia = mean(consumo == 1) * 100, .groups = "drop")

El siguiente gráfico muestra los cambios en la prevalencia de consumo de alcohol, cigarro y marihuana según la frecuencia con la que experimentan cada molestia

ggplot(datos_lineas_filtrados, aes(x = factor(respuesta), y = prevalencia, color = droga, group = droga)) +
  geom_line(size = 1) +
  geom_point(size = 2) +
  # Agregar etiquetas para "Para nada" y "Casi todos los días"
  geom_text(
    data = datos_lineas_filtrados %>% filter(respuesta %in% c(1, 4)),
    aes(label = paste0(round(prevalencia, 1), "%")),
    vjust = 1, size = 2.5
  ) +
  facet_wrap(~ pregunta, ncol = 2, labeller = labeller(pregunta = c(
    "P102_1" = "Pregunta 1", "P102_2" = "Pregunta 2",
    "P102_3" = "Pregunta 3", "P102_4" = "Pregunta 4",
    "P102_5" = "Pregunta 5", "P102_6" = "Pregunta 6",
    "P102_7" = "Pregunta 7"
  ))) +
  scale_x_discrete(labels = c("1" = "Para nada", "2" = "Varios días", 
                              "3" = "Más de la mitad", "4" = "Casi todos los días")) +
  scale_color_manual(values = c("marihuana" = "#66CC66", "cigarro" = "#FF9999", "alcohol" = "#99CCFF")) +
  labs(
    title = "Cambio en la prevalencia de consumo según la frecuencia (P102)",
    subtitle = "Marihuana, alcohol y cigarro",
    x = "Frecuencia de respuesta",
    y = "Prevalencia de consumo (%)",
    color = "Droga"
  ) +
  theme_minimal() +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1),
    legend.position = "bottom"
  )
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.

Se repite la tendencia de que la prevalencia de consumo aumenta a medida que lo hace la frecuencia. La diferencia de prevalencia de consumo entre los que experimentan estas molestias para nada es lo que la experimentan casi a diario es de más del 10% en la mayoria de los casos.

Análisis acceso a atención (P105)

La siguiente tabla muestra la proporción de respuestas para las preguntas 105_1,105_2 y 105_3 referentes al acceso a consulta , medicamentos y exámenes, respectivamente. Siendo 1 “Nada Posible” y 4 “Muy posible”

 datos %>%
  pivot_longer(cols = starts_with("P105_"), 
               names_to = "pregunta", 
               values_to = "respuesta") %>%
  filter(!is.na(respuesta)) %>%
  group_by(pregunta, respuesta) %>%
  summarise(
    n_respuestas = n(),
    .groups = "drop"
  ) %>%
  group_by(pregunta) %>%
  mutate(
    proporcion = n_respuestas / sum(n_respuestas) * 100  
  )%>%
  kable("html", caption = "Proporción respuestas preguntas P105") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE) %>%
  scroll_box(width = "100%", height = "250px") 
Proporción respuestas preguntas P105
pregunta respuesta n_respuestas proporcion
P105_1 1 2754 29.64478
P105_1 2 1983 21.34553
P105_1 3 2497 26.87836
P105_1 4 2056 22.13132
P105_2 1 2927 32.06968
P105_2 2 1997 21.88014
P105_2 3 2349 25.73682
P105_2 4 1854 20.31336
P105_3 1 3032 33.32967
P105_3 2 2001 21.99626
P105_3 3 2313 25.42596
P105_3 4 1751 19.24810

Cerca del 50% de las personas ven el acceso a consulta, medicamenos y exámenes como nada o poco posible. Puede ser por esto que dentro de la base de datos hay una proporción baja de personas con algún tratamiento en la actualidad.

Análisis inferencial

Prueba z para dos proporciones

Proporción de consumo para personas con y sin trastornos

Ho: P1=P2

H1: P1 =/ P2

p1: proporción de consumo para personas con al menos un trastorno mental

p2: proporción de consumo para personas sin trastornos mentales

  tabla_combinada <- datos %>%
    filter(!is.na(tratamiento)) %>%
    mutate(tratamiento = factor(tratamiento, levels = c(1, 0))) %>%
    group_by(tratamiento) %>%
    summarise(
      total = n(),  
      cigarro = sum(cigarro == 1, na.rm = TRUE), 
      marihuana = sum(marihuana == 1, na.rm = TRUE),  
      alcohol = sum(alcohol == 1, na.rm = TRUE),  
      cocaina = sum(cocaina == 1, na.rm = TRUE), 
      pbc = sum(pbc == 1, na.rm = TRUE)  
    )

  # Para cigarro
  prop_cigarro <- prop.test(x = tabla_combinada$cigarro, n = tabla_combinada$total)
  prop_cigarro
  
  # Para marihuana
  prop_marihuana <- prop.test(x = tabla_combinada$marihuana, n = tabla_combinada$total)
  prop_marihuana
  
  # Para alcohol
  prop_alcohol <- prop.test(x = tabla_combinada$alcohol, n = tabla_combinada$total)
  prop_alcohol
  
  # Para cocaina
  prop_cocaina <- prop.test(x = tabla_combinada$cocaina, n = tabla_combinada$total)
  prop_cocaina

  # Para pbc
  prop_pbc <- prop.test(x = tabla_combinada$pbc, n = tabla_combinada$total)
  prop_pbc

ic_tabla <- tibble(
    droga = c("Cigarro", "Marihuana", "Alcohol","Cocaina", "PBC"),
    ic_inferior = c(prop_cigarro$conf.int[1], prop_marihuana$conf.int[1],  prop_alcohol$conf.int[1], prop_cocaina$conf.int[1],prop_pbc$conf.int[1] ),
    ic_superior = c(prop_cigarro$conf.int[2], prop_marihuana$conf.int[2],  prop_alcohol$conf.int[2], prop_cocaina$conf.int[2], prop_pbc$conf.int[2]))

ic_tabla <- ic_tabla %>%
  mutate(signif = ifelse(ic_inferior > 0 | ic_superior < 0, "*", ""))
  ggplot(ic_tabla, aes(x = droga, ymin = ic_inferior, ymax = ic_superior)) +
    geom_errorbar(width = 0.2, color = "red") +  # Barras de error para los intervalos de confianza
    geom_point(aes(y = (ic_inferior + ic_superior) / 2), size = 3, color = "blue") +  # Punto medio para cada intervalo
    labs(
      title = "Intervalos de Confianza para diferencia entre P1 y P2 para diferentes drogas",
      x = "Droga",
      y = "Intervalo de Confianza"
    ) +
    theme_minimal() +  # Tema limpio
    theme(axis.text.x = element_text(angle = 45, hjust = 1))   +
    geom_text(aes(y = ic_superior + 0.01, label = signif),  # Coloca el asterisco sobre los intervalos
              position = position_dodge(width = 0.5), size = 5, color = "black")  # Ajusta el color y la posición

ic_tabla %>%
  kable("html", caption = "Intervalos de confianza")
Intervalos de confianza
droga ic_inferior ic_superior signif
Cigarro 0.0783496 0.1424693
Marihuana 0.0810509 0.1430306
Alcohol 0.0358794 0.0985053
Cocaina 0.0032939 0.0263515
PBC -0.0033462 0.0054503

Los intervalos de confianza muestran la diferencia en la proporción de consumo entre personas con al menos un trastorno y aquellas sin trastornos. Para el alcohol, la proporción de consumo es entre 3.59% y 9.85% mayor en personas con trastornos. En el caso de la marihuana, la diferencia es entre 8.1% y 14.3% mayor, y para el cigarro, la proporción es entre 7.8% y 14.2% mayor. Para la cocaína, el intervalo es entre 0.33% y 2.64% mayor, siendo más estrecho que el de las otras sustancias. Todos estos intervalos son positivos y no incluyen el 0, lo que indica que las diferencias observadas son estadísticamente significativas. Por otro lado, el intervalo para PBC incluye el 0, lo que sugiere que no hay una diferencia significativa en su consumo entre ambos grupos.

Proporción de consumo para cada trastorno

Ho: P1=P2

H1: P1 =/ P2

p1: proporción de consumo para personas que tienen el trastorno

p2: proporción de consumo para personas que no tienen el trastorno

# Tabla para Depresión
tabla_depresion <- datos %>%
  mutate(depresion = ifelse(is.na(depresion), 0, depresion)) %>%
  group_by(depresion) %>%
  mutate(depresion = factor(depresion, levels = c(1, 0))) %>%
  summarise(
    total = n(),  # Total de personas en cada grupo
    cigarro = sum(cigarro == 1, na.rm = TRUE),  # Número de personas que consumen cigarro
    marihuana = sum(marihuana == 1, na.rm = TRUE),  # Número de personas que consumen marihuana
    alcohol = sum(alcohol == 1, na.rm = TRUE),  # Número de personas que consumen alcohol
    cocaina = sum(cocaina == 1, na.rm = TRUE),  # Número de personas que consumen cocaína
    pbc = sum(pbc == 1, na.rm = TRUE)  # Número de personas que consumen PBC
  )

# Realizar la prueba de proporciones para cada droga en Depresión
prop_cigarro_depresion <- prop.test(x = tabla_depresion$cigarro, n = tabla_depresion$total)
prop_marihuana_depresion <- prop.test(x = tabla_depresion$marihuana, n = tabla_depresion$total)
prop_alcohol_depresion <- prop.test(x = tabla_depresion$alcohol, n = tabla_depresion$total)
prop_cocaina_depresion <- prop.test(x = tabla_depresion$cocaina, n = tabla_depresion$total)
prop_pbc_depresion <- prop.test(x = tabla_depresion$pbc, n = tabla_depresion$total)

# Tabla para Ansiedad
tabla_ansiedad <- datos %>%
  mutate(ansiedad = ifelse(is.na(ansiedad), 0, ansiedad)) %>%
  group_by(ansiedad) %>%
  mutate(ansiedad = factor(ansiedad, levels = c(1, 0))) %>%
  summarise(
    total = n(),  # Total de personas en cada grupo
    cigarro = sum(cigarro == 1, na.rm = TRUE),
    marihuana = sum(marihuana == 1, na.rm = TRUE),
    alcohol = sum(alcohol == 1, na.rm = TRUE),
    cocaina = sum(cocaina == 1, na.rm = TRUE),
    pbc = sum(pbc == 1, na.rm = TRUE)
  )

# Realizar la prueba de proporciones para cada droga en Ansiedad
prop_cigarro_ansiedad <- prop.test(x = tabla_ansiedad$cigarro, n = tabla_ansiedad$total)
prop_marihuana_ansiedad <- prop.test(x = tabla_ansiedad$marihuana, n = tabla_ansiedad$total)
prop_alcohol_ansiedad <- prop.test(x = tabla_ansiedad$alcohol, n = tabla_ansiedad$total)
prop_cocaina_ansiedad <- prop.test(x = tabla_ansiedad$cocaina, n = tabla_ansiedad$total)
prop_pbc_ansiedad <- prop.test(x = tabla_ansiedad$pbc, n = tabla_ansiedad$total)

# Tabla para Estrés
tabla_estres <- datos %>%
  mutate(estres = ifelse(is.na(estres), 0, estres)) %>%
  group_by(estres) %>%
  mutate(estres = factor(estres, levels = c(1, 0))) %>%
  summarise(
    total = n(),
    cigarro = sum(cigarro == 1, na.rm = TRUE),
    marihuana = sum(marihuana == 1, na.rm = TRUE),
    alcohol = sum(alcohol == 1, na.rm = TRUE),
    cocaina = sum(cocaina == 1, na.rm = TRUE),
    pbc = sum(pbc == 1, na.rm = TRUE)
  )

# Realizar la prueba de proporciones para cada droga en Estrés
prop_cigarro_estres <- prop.test(x = tabla_estres$cigarro, n = tabla_estres$total)
prop_marihuana_estres <- prop.test(x = tabla_estres$marihuana, n = tabla_estres$total)
prop_alcohol_estres <- prop.test(x = tabla_estres$alcohol, n = tabla_estres$total)
prop_cocaina_estres <- prop.test(x = tabla_estres$cocaina, n = tabla_estres$total)
prop_pbc_estres <- prop.test(x = tabla_estres$pbc, n = tabla_estres$total)

# Tabla para TCA (Trastorno de la Conducta Alimentaria)
tabla_tca <- datos %>%
  mutate(TCA = ifelse(is.na(TCA), 0, TCA)) %>%
  group_by(TCA) %>%
  mutate(TCA = factor(TCA, levels = c(1, 0))) %>%
  summarise(
    total = n(),
    cigarro = sum(cigarro == 1, na.rm = TRUE),
    marihuana = sum(marihuana == 1, na.rm = TRUE),
    alcohol = sum(alcohol == 1, na.rm = TRUE),
    cocaina = sum(cocaina == 1, na.rm = TRUE),
    pbc = sum(pbc == 1, na.rm = TRUE)
  )

# Realizar la prueba de proporciones para cada droga en TCA
prop_cigarro_tca <- prop.test(x = tabla_tca$cigarro, n = tabla_tca$total)
prop_marihuana_tca <- prop.test(x = tabla_tca$marihuana, n = tabla_tca$total)
prop_alcohol_tca <- prop.test(x = tabla_tca$alcohol, n = tabla_tca$total)
prop_cocaina_tca <- prop.test(x = tabla_tca$cocaina, n = tabla_tca$total)
prop_pbc_tca <- prop.test(x = tabla_tca$pbc, n = tabla_tca$total)

# Tabla para OCD (Trastorno Obsesivo-Compulsivo)
tabla_ocd <- datos %>%
  mutate(OCD = ifelse(is.na(OCD), 0, OCD)) %>%
  group_by(OCD) %>%
  mutate(OCD = factor(OCD, levels = c(1, 0))) %>%
  summarise(
    total = n(),
    cigarro = sum(cigarro == 1, na.rm = TRUE),
    marihuana = sum(marihuana == 1, na.rm = TRUE),
    alcohol = sum(alcohol == 1, na.rm = TRUE),
    cocaina = sum(cocaina == 1, na.rm = TRUE),
    pbc = sum(pbc == 1, na.rm = TRUE)
  )

# Realizar la prueba de proporciones para cada droga en OCD
prop_cigarro_ocd <- prop.test(x = tabla_ocd$cigarro, n = tabla_ocd$total)
prop_marihuana_ocd <- prop.test(x = tabla_ocd$marihuana, n = tabla_ocd$total)
prop_alcohol_ocd <- prop.test(x = tabla_ocd$alcohol, n = tabla_ocd$total)
prop_cocaina_ocd <- prop.test(x = tabla_ocd$cocaina, n = tabla_ocd$total)
prop_pbc_ocd <- prop.test(x = tabla_ocd$pbc, n = tabla_ocd$total)

# Tabla para TDAH (Trastorno por Déficit de Atención e Hiperactividad)
tabla_tdah <- datos %>%
  mutate(TDAH = ifelse(is.na(TDAH), 0, TDAH)) %>%
  group_by(TDAH) %>%
  mutate(TDAH = factor(TDAH, levels = c(1, 0))) %>%
  summarise(
    total = n(),
    cigarro = sum(cigarro == 1, na.rm = TRUE),
    marihuana = sum(marihuana == 1, na.rm = TRUE),
    alcohol = sum(alcohol == 1, na.rm = TRUE),
    cocaina = sum(cocaina == 1, na.rm = TRUE),
    pbc = sum(pbc == 1, na.rm = TRUE)
  )

# Realizar la prueba de proporciones para cada droga en TDAH
prop_cigarro_tdah <- prop.test(x = tabla_tdah$cigarro, n = tabla_tdah$total)
prop_marihuana_tdah <- prop.test(x = tabla_tdah$marihuana, n = tabla_tdah$total)
prop_alcohol_tdah <- prop.test(x = tabla_tdah$alcohol, n = tabla_tdah$total)
prop_cocaina_tdah <- prop.test(x = tabla_tdah$cocaina, n = tabla_tdah$total)
prop_pbc_tdah <- prop.test(x = tabla_tdah$pbc, n = tabla_tdah$total)

# Tabla para Sustancias (consumo general)
tabla_sustancias <- datos %>%
  mutate(sustancias = ifelse(is.na(sustancias), 0, sustancias)) %>%
  group_by(sustancias) %>%
  mutate(sustancias = factor(sustancias, levels = c(1, 0))) %>%
  summarise(
    total = n(),
    cigarro = sum(cigarro == 1, na.rm = TRUE),
    marihuana = sum(marihuana == 1, na.rm = TRUE),
    alcohol = sum(alcohol == 1, na.rm = TRUE),
    cocaina = sum(cocaina == 1, na.rm = TRUE),
    pbc = sum(pbc == 1, na.rm = TRUE)
  )

# Realizar la prueba de proporciones para cada droga en Sustancias
prop_cigarro_sustancias <- prop.test(x = tabla_sustancias$cigarro, n = tabla_sustancias$total)
prop_marihuana_sustancias <- prop.test(x = tabla_sustancias$marihuana, n = tabla_sustancias$total)
prop_alcohol_sustancias <- prop.test(x = tabla_sustancias$alcohol, n = tabla_sustancias$total)
prop_cocaina_sustancias <- prop.test(x = tabla_sustancias$cocaina, n = tabla_sustancias$total)
prop_pbc_sustancias <- prop.test(x = tabla_sustancias$pbc, n = tabla_sustancias$total)

# Crear los intervalos de confianza combinados
ic_combined <- tibble(
  droga = rep(c("Cigarro", "Marihuana", "Alcohol", "Cocaína", "PBC"), 7),
  ic_inferior = c(
    prop_cigarro_depresion$conf.int[1], prop_marihuana_depresion$conf.int[1], prop_alcohol_depresion$conf.int[1], prop_cocaina_depresion$conf.int[1], prop_pbc_depresion$conf.int[1],
    prop_cigarro_ansiedad$conf.int[1], prop_marihuana_ansiedad$conf.int[1], prop_alcohol_ansiedad$conf.int[1], prop_cocaina_ansiedad$conf.int[1], prop_pbc_ansiedad$conf.int[1],
    prop_cigarro_estres$conf.int[1], prop_marihuana_estres$conf.int[1], prop_alcohol_estres$conf.int[1], prop_cocaina_estres$conf.int[1], prop_pbc_estres$conf.int[1],
    prop_cigarro_tca$conf.int[1], prop_marihuana_tca$conf.int[1], prop_alcohol_tca$conf.int[1], prop_cocaina_tca$conf.int[1], prop_pbc_tca$conf.int[1],
    prop_cigarro_ocd$conf.int[1], prop_marihuana_ocd$conf.int[1], prop_alcohol_ocd$conf.int[1], prop_cocaina_ocd$conf.int[1], prop_pbc_ocd$conf.int[1],
    prop_cigarro_tdah$conf.int[1], prop_marihuana_tdah$conf.int[1], prop_alcohol_tdah$conf.int[1], prop_cocaina_tdah$conf.int[1], prop_pbc_tdah$conf.int[1],
    prop_cigarro_sustancias$conf.int[1], prop_marihuana_sustancias$conf.int[1], prop_alcohol_sustancias$conf.int[1], prop_cocaina_sustancias$conf.int[1], prop_pbc_sustancias$conf.int[1]
  ),
  ic_superior = c(
    prop_cigarro_depresion$conf.int[2], prop_marihuana_depresion$conf.int[2], prop_alcohol_depresion$conf.int[2], prop_cocaina_depresion$conf.int[2], prop_pbc_depresion$conf.int[2],
    prop_cigarro_ansiedad$conf.int[2], prop_marihuana_ansiedad$conf.int[2], prop_alcohol_ansiedad$conf.int[2], prop_cocaina_ansiedad$conf.int[2], prop_pbc_ansiedad$conf.int[2],
    prop_cigarro_estres$conf.int[2], prop_marihuana_estres$conf.int[2], prop_alcohol_estres$conf.int[2], prop_cocaina_estres$conf.int[2], prop_pbc_estres$conf.int[2],
    prop_cigarro_tca$conf.int[2], prop_marihuana_tca$conf.int[2], prop_alcohol_tca$conf.int[2], prop_cocaina_tca$conf.int[2], prop_pbc_tca$conf.int[2],
    prop_cigarro_ocd$conf.int[2], prop_marihuana_ocd$conf.int[2], prop_alcohol_ocd$conf.int[2], prop_cocaina_ocd$conf.int[2], prop_pbc_ocd$conf.int[2],
    prop_cigarro_tdah$conf.int[2], prop_marihuana_tdah$conf.int[2], prop_alcohol_tdah$conf.int[2], prop_cocaina_tdah$conf.int[2], prop_pbc_tdah$conf.int[2],
    prop_cigarro_sustancias$conf.int[2], prop_marihuana_sustancias$conf.int[2], prop_alcohol_sustancias$conf.int[2], prop_cocaina_sustancias$conf.int[2], prop_pbc_sustancias$conf.int[2]
  ),
  condicion = rep(c("Depresión", "Ansiedad", "Estrés", "TCA", "OCD", "TDAH", "Sustancias"), each = 5)
)

# Añadir columna para indicar si el intervalo de confianza no incluye cero
ic_combined <- ic_combined %>%
  mutate(significancia = ifelse(ic_inferior > 0 | ic_superior < 0, "*", ""))  %>%
  mutate(droga = factor(droga, levels = c("Cigarro", "Marihuana", "Alcohol", "Cocaína", "PBC"))) %>%
  arrange(droga)  
# Gráfico de intervalos de confianza con asteriscos por encima de los intervalos
ggplot(ic_combined, aes(x = droga, ymin = ic_inferior, ymax = ic_superior, color = condicion, group = condicion)) +
  geom_errorbar(width = 0.2, position = position_dodge(width = 0.5)) +  # Barras de error sin superposición
  geom_point(aes(y = (ic_inferior + ic_superior) / 2), size = 3, position = position_dodge(width = 0.5)) +  # Puntos para cada intervalo
  scale_color_manual(values = c("Depresión" = "#1f77b4",  # Azul
                                "Ansiedad" = "#ff7f0e",  # Naranja
                                "Estrés" = "#2ca02c",  # Verde
                                "TCA" = "#d62728",  # Rojo
                                "OCD" = "#9467bd",  # Púrpura
                                "TDAH" = "#8c564b",  # Marrón
                                "Sustancias" = "#e377c2")) +  # Rosa
  labs(
    title = "Intervalos de Confianza para proporción de consumo en Personas con Diferentes Trastornos",
    x = "Droga",
    y = "Intervalo de Confianza"
  ) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  geom_hline(yintercept = 0, linetype = "dashed", color = "red", size = 1) +
  geom_text(aes(y = ic_superior + 0.05, label = significancia),  # Coloca el asterisco sobre los intervalos
            position = position_dodge(width = 0.5), size = 5, color = "black")  # Ajusta el color y la posición

ic_combined %>%
  kable("html", caption = "Intervalos de confianza") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE) %>%
  scroll_box(width = "80%", height = "280px") 
Intervalos de confianza
droga ic_inferior ic_superior condicion significancia
Cigarro 0.1141335 0.2037801 Depresión
Cigarro 0.0688196 0.1515929 Ansiedad
Cigarro 0.0374993 0.1727847 Estrés
Cigarro 0.0367450 0.3344467 TCA
Cigarro -0.0356448 0.2640361 OCD
Cigarro -0.1154189 0.1216622 TDAH
Cigarro 0.0538056 0.4620939 Sustancias
Marihuana 0.0918640 0.1792246 Depresión
Marihuana 0.0643945 0.1443490 Ansiedad
Marihuana 0.0199679 0.1497149 Estrés
Marihuana -0.0076793 0.2845705 TCA
Marihuana 0.0579060 0.3584366 OCD
Marihuana -0.0321221 0.2165139 TDAH
Marihuana 0.2516393 0.6336964 Sustancias
Alcohol 0.0465456 0.1321491 Depresión
Alcohol 0.0455899 0.1254400 Ansiedad
Alcohol -0.0016118 0.1298641 Estrés
Alcohol -0.0337155 0.2457363 TCA
Alcohol 0.0267053 0.2952366 OCD
Alcohol -0.1813734 0.0777607 TDAH
Alcohol -0.1457382 0.2562329 Sustancias
Cocaína 0.0023956 0.0376096 Depresión
Cocaína -0.0077216 0.0191935 Ansiedad
Cocaína -0.0158545 0.0309531 Estrés
Cocaína -0.0435038 0.0853691 TCA
Cocaína -0.0439731 0.0874750 OCD
Cocaína -0.0316639 0.0859851 TDAH
Cocaína 0.0282054 0.3790221 Sustancias
PBC -0.0053933 0.0066908 Depresión
PBC -0.0047023 0.0083610 Ansiedad
PBC -0.0066872 0.0001430 Estrés
PBC -0.0319818 0.0657642 TCA
PBC -0.0325608 0.0671601 OCD
PBC -0.0254144 0.0499563 TDAH
PBC -0.0558775 0.1237487 Sustancias

Hay varios intervalos que no pasan por 0, sobre todo para las drogas con más consumidores: cigarro, marihuana y alcohol. A su vez, los intervalos más estrechos, y por tanto más exactos, son de los trastornos más registrados en la encuesta: Ansiedad, Depresión y Estrés. Se analizarán los intervalos en torno a estas 6.

Depresión

En personas con depresión, se observa un aumento en las proporciones de consumo de todas las sustancias analizadas. Para el alcohol, la proporción de consumo es entre 4.6% y 13.2% mayor en comparación con quienes no tienen depresión. En el caso del cigarro, la diferencia es más pronunciada, oscilando entre 11.4% y 20.3% mayor. La marihuana también muestra un aumento significativo, con un incremento entre 9.2% y 17.9%.

Ansiedad

En personas con ansiedad, el consumo de alcohol es entre 4.6% y 12.5% mayor que en aquellas sin ansiedad. El cigarro muestra un incremento en el consumo entre 6.9% y 15.2%, mientras que la marihuana presenta un aumento entre 6.4% y 14.4%.

Estrés

Para el estrés, se observa un comportamiento mixto. El consumo de alcohol no muestra un incremento significativo. Sin embargo, el consumo de cigarro y marihuana sí está asociado con mayores proporciones: entre 3.7% y 17.3% para el cigarro y entre 2.0% y 14.9% para la marihuana.

CHI-SQUARE

Lo utilizamos para evaluar la independencia de dos variables categóricas.

H0: Variables son independientes H1: Variables están relacionadas

Usando Chi-squere solo se encontró una relación estadísticamente significante entre la depresión y el cigarro.

tabla_depresion_cigarro <- table(datos$depresion, datos$cigarro)
chisq.test(tabla_depresion_cigarro)
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  tabla_depresion_cigarro
## X-squared = 9.6049, df = 1, p-value = 0.001941

Conclusión y recomendaciones

Los resultados de este análisis confirman una asociación entre el consumo de sustancias y la presencia de trastornos mentales entre jóvenes chilenos de 15 a 29 años. Específicamente, se observó que condiciones como la ansiedad y la depresión están vinculadas a un mayor riesgo de consumo de tabaco y alcohol, coherente con estudios previos que identifican estos trastornos como factores de riesgo para la iniciación y mantenimiento del consumo (Audrain-McGovern et al., 2015; Groenman et al., 2017). Asimismo, la relación entre el uso de cannabis y síntomas de trastornos mentales, aunque presente, es menos consistente, lo que se alinea con la evidencia limitada y mixta reportada en la literatura internacional (Wittchen et al., 2007).

En el sentido inverso, los resultados sugieren que el consumo persistente de sustancias podría exacerbar síntomas de trastornos mentales, coincidiendo con hallazgos previos que asocian la cesación del consumo con mejoras en salud mental (Taylor et al., 2014b; Charlet & Heinz, 2017). Sin embargo, la causalidad en esta relación no pudo ser plenamente establecida en este análisis debido al diseño transversal de los datos.

Estos hallazgos refuerzan la necesidad de abordar la salud mental y el consumo de sustancias de manera integrada en las políticas de salud pública en Chile, especialmente en programas dirigidos a jóvenes. Intervenciones que combinen estrategias de prevención del consumo y tratamiento de trastornos mentales podrían generar beneficios recíprocos, reduciendo la carga de ambos problemas en esta población.

Limitaciones

Una limitación clave de este estudio es su diseño transversal, que impide determinar direccionalidad o causalidad en las asociaciones observadas. Además, el autoinforme como fuente de datos puede estar sujeto a sesgos de recuerdo o deseabilidad social. Por último, aunque se identificaron patrones relevantes, la falta de datos longitudinales limita la capacidad para evaluar la evolución de estas relaciones a lo largo del tiempo.

Futuros estudios deberían emplear diseños prospectivos y ampliar la muestra para incluir datos más diversos, permitiendo comprender mejor la complejidad bidireccional entre el consumo de sustancias y los trastornos mentales en el contexto chileno.

Bibliografía