Introducción

Durante el mes de marzo se aplicó el cuestionario de riesgos psicosociales elaborado por investigadores independientes en colaboración con el Sistema Municipal para el Desarrollo Integral de la Familia (SMDIF) y el Centro de Estudios Científicos y Tecnológicos de Tabasco (CECyTE) con el objetivo de conocer la situación psicosocial que presentan actualmente los adolescentes en el municipio de Centro.

Para realizar el análisis de datos, el flujo de trabajo definido será el siguiente: lectura, limpieza, organización, manipulación y presentación de la información.

Los datos

Tenemos respuestas a un cuestionario aplicado a estudiantes (observaciones) con las respuestas en las columnas (características o atributos). Algunas de las columnas caracterizan a los alumnos, mientras que otras responden a varias preguntas, algunas de ellas binarias (sí o no) y otras de opción múltiple. Ejemplos:

##  [1] "Selecciona tu plantel:"                                                             
##  [2] "Selecciona tu sexo:"                                                                
##  [3] "Mi edad:"                                                                           
##  [4] "Grado escolar que estudio:"                                                         
##  [5] "¿Cómo es tu hogar?"                                                                 
##  [6] "Ademas de estudiar, ¿realizas algún trabajo?"                                       
##  [7] "¿Te sientes seguro/a en tu escuela?"                                                
##  [8] "Si requieres de ayuda, ¿cuentas con personas dispuestas a auxiliarte en tu escuela?"
##  [9] "¿Te sientes seguro/a en tu casa?"                                                   
## [10] "Si requirieras ayuda en tu hogar, ¿cuentas con personas dispuestas a auxiliarte?"

Para conocer a la población se realiza un análisis exploratorio de datos, se ubican los valores faltantes (NAs), el tipo de datos, la calidad de estos, entre otros.

Estadísticas descriptivas

Podemos analizar las características de nuestra población, de acuerdo a diferentes criterios como a qué plantel pertenece, cuál es su sexo, su edad o su grado de estudios.

Vemos que hay dos planteles que concentran la mayor cantidad de estudiantes que respondieron la encuesta, por lo que, no podemos generalizar nuestras conclusiones a toda la población, esto es uno de los posibles impedimentos a considerar. En nuestro caso nos enfocaremos únicamente en los planteles que pertenecen al muncipio de Centro (7, 11, 12 y 19).

Hay categorías que presentan información marginal que podemos excluir de nuestro análisis, pero en nuestro caso no lo haremos ya que pueden estar representando a un grupo de población minoritario.

Al inspeccionar la edad reportada nos encontramos con una serie de datos irregulares.

##  [1] "17"              "18"              "15 años"         "17 Años"        
##  [5] "15"              "16"              "19"              "17 año"         
##  [9] "18 años"         "16 años"         "17 años"         "20"             
## [13] "16 años de edad" "17años"          "15 Años"         "16."            
## [17] "Jalpade Mendez"  "14"              "15 anos"         "23"

Vemos la disparidad de respuestas para una misma edad (p.e., 15, 15 años, 15 años de edad, etc.). En este caso, extraemos solo los números de todas las respuestas para tener las categorías adecuadas para su uso y análisis.

Hipótesis y pruebas

Es importante que al analizar las respuestas se tengan presente los posibles controles a los que puede estar sujeta nuestra población: en este caso, la edad, el plantel, el sexo, si trabaja o no, etc., son factores que pueden influir en el estado de ánimo de los alumnos.

Hipotésis 1

Para probar la primera hipótesis nos enfocaremos en aquellos alumnos que hayan contestado sentir algún tipo de tristeza y su relación con el consumo de alcohol, para posteriormente comparar con aquellos que no se identifican con el sexo binario (hombre o mujer).

Utilizaremos la pregunta En el último mes, has sentido de manera continua:, creamos una variable booleana la cual será cierta si hay una coincidencia con la palabra tristeza.

Algunas de las respuestas que nos interesan son:

## # A tibble: 10 × 1
##    Emociones                                                                    
##    <chr>                                                                        
##  1 tristeza;ansiedad                                                            
##  2 tristeza                                                                     
##  3 tristeza;ansiedad;enojo o rabia                                              
##  4 tristeza;no, no he sentido nada, me siento muy bien                          
##  5 tristeza;enojo o rabia                                                       
##  6 tristeza;ansiedad;enojo o rabia;no, no he sentido nada, me siento muy bien   
##  7 tristeza;ansiedad;no, no he sentido nada, me siento muy bien                 
##  8 tristeza;ansiedad;enojo o rabia;decepción                                    
##  9 tristeza;ansiedad;enojo o rabia;tengo cambios de humor muy de la nada, pero …
## 10 tristeza;ansiedad;enojo o rabia;mi mente se cae a pedazos

Ahora, a través de un cuadro comparativo cruzamos esto con las preguntas relacionadas con el consumo de alcohol: Durante el mes pasado, ¿alguna vez tomaste alcohol como para sentirte borracho/a?:

# Variable booleana para identificar si el estudiante se ha emborrachado.
planteles_centro_plus <- planteles_centro_plus %>% 
  mutate(Alcohol = if_else(`Durante el mes pasado, ¿alguna vez tomaste alcohol como para sentirte borracho/a?` == "Sí",
                           TRUE, FALSE)) 

Observamos para ver si existe relación alguna entre el consumo de alcohol y sentimientos relacionados con la tristeza. Sin que esto implique que haya necesariamente una correlación directa entre ambas variables.

Tabla 1
Tristeza Alcohol n pct
FALSE FALSE 1247 89.00785
FALSE TRUE 154 10.99215
TRUE FALSE 413 82.43513
TRUE TRUE 88 17.56487

Vemos que, para alumnos que no han sentido algún tipo de tristeza, el 10.99 por ciento ha consumido alcohol para emborracharse, mientras que el 17.56 por ciento de los alumnos que han sentido tristeza han consumido alcochol con el mismo propósito.

Adicionalmente, agregamos una variable más para ver si existe alguna relación con el sexo para el caso de aquellos alumnos que no se identifican con las opciones: hombre o mujer (es decir, quienes eligieron la respuesta No me identifico con ninguna de las 2 anteriores).

Tabla 2
Sexo Tristeza Alcohol n pct
TRUE FALSE FALSE 12 54.545454
TRUE TRUE FALSE 9 40.909091
TRUE TRUE TRUE 1 4.545454

Para este caso el tamaño de nuestra muestra es demasiado pequeño por lo que podríamos caer en conclusiones anticipadas. Lo que nos dicen los datos es que el 4.55 por ciento ha sentido tristeza y ha consumido alcohol para emborracharse. Mientras que el 40.91 por ciento ha sentido tristeza, pero no ha consumido alcohol para emborracharse. De aquellos que no dijeron sentir tristeza, ninguno respondió haber consumido alcohol para emborracharse.

Hipotésis 2

Para la segunda hipótesis queremos ver cuántos de los alumnos que dijeron tener relaxiones sexuales no estuvieron de acuerdo con ello.

Primero, queremos conocer la edad en la que nuestra población inició su vida sexual, para ello obtenemos los datos de la pregunta ¿A qué edad tuviste tu primera relación sexual?:

Para probar la segunda hipótesis utilizaremos la pregunta ¿Haz tenido relaciones sexuales? y haremos la comparación con ¿Estuviste de acuerdo en tener relaciones sexuales?.Para estos casos nuestras respuestas son Sí/No, por lo que, transformaremos las variables a booleanas de manera directa.

Relaciones Consensuadas n pct
FALSE NA 1536 100.000000
TRUE FALSE 16 4.371585
TRUE TRUE 350 95.628415

En nuestra tabla comparativa podemos observar que de los alumnos que dicen haber tenido relaciones sexuales, el 4.37 por ciento dijo no haber estado de acuerdo con ello.

Hipótesis 3

Cuántos alumnos contestaron haber consumido drogas y cuál es su edad

Algunas de las respuestas que nos interesan son:

## # A tibble: 10 × 1
##    Sustancias                                              
##    <chr>                                                   
##  1 marihuana                                               
##  2 marihuana;cocaína;metanfetaminas;alucinógenos           
##  3 marihuana;cocaína;inhalantes;lsd y cigarro              
##  4 marihuana;cocaína;heroína;metanfetaminas;éxtasis        
##  5 marihuana;cocaína                                       
##  6 marihuana;cocaína;alucinógenos                          
##  7 marihuana;dextrometorfano, alcohol (si llegase a contar)
##  8 marihuana;alucinógenos                                  
##  9 marihuana;inhalantes                                    
## 10 marihuana;cocaína;inhalantes;éxtasis;alucinógenos

Para hacer la distinción

Drogas Marihuana n pct
TRUE FALSE 14 10.85271
TRUE TRUE 115 89.14729
Drogas Marihuana Cocaina n pct
TRUE FALSE FALSE 5 3.875969
TRUE FALSE TRUE 9 6.976744
TRUE TRUE FALSE 83 64.341085
TRUE TRUE TRUE 32 24.806202

Conclusiones

Como primer ejercicio no podemos tener conclusiones definitivas, sino únicamente de valor analítico para comprender el universo de información del que disponemos. Sin embargo, para elaborar conclusiones serias se debe trabajar de la mano de expertos en la materia con quienes se pueda seguir realizando pruebas y elaborando hipótesis.