Durante el mes de marzo se aplicó el cuestionario de riesgos psicosociales elaborado por investigadores independientes en colaboración con el Sistema Municipal para el Desarrollo Integral de la Familia (SMDIF) y el Centro de Estudios Científicos y Tecnológicos de Tabasco (CECyTE) con el objetivo de conocer la situación psicosocial que presentan actualmente los adolescentes en el municipio de Centro.
Para realizar el análisis de datos, el flujo de trabajo definido será el siguiente: lectura, limpieza, organización, manipulación y presentación de la información.
Tenemos respuestas a un cuestionario aplicado a estudiantes (observaciones) con las respuestas en las columnas (características o atributos). Algunas de las columnas caracterizan a los alumnos, mientras que otras responden a varias preguntas, algunas de ellas binarias (sí o no) y otras de opción múltiple. Ejemplos:
## [1] "Selecciona tu plantel:"
## [2] "Selecciona tu sexo:"
## [3] "Mi edad:"
## [4] "Grado escolar que estudio:"
## [5] "¿Cómo es tu hogar?"
## [6] "Ademas de estudiar, ¿realizas algún trabajo?"
## [7] "¿Te sientes seguro/a en tu escuela?"
## [8] "Si requieres de ayuda, ¿cuentas con personas dispuestas a auxiliarte en tu escuela?"
## [9] "¿Te sientes seguro/a en tu casa?"
## [10] "Si requirieras ayuda en tu hogar, ¿cuentas con personas dispuestas a auxiliarte?"
Para conocer a la población se realiza un análisis exploratorio de
datos, se ubican los valores faltantes (NAs), el tipo de
datos, la calidad de estos, entre otros.
Podemos analizar las características de nuestra población, de acuerdo a diferentes criterios como a qué plantel pertenece, cuál es su sexo, su edad o su grado de estudios.
Vemos que hay dos planteles que concentran la mayor cantidad de estudiantes que respondieron la encuesta, por lo que, no podemos generalizar nuestras conclusiones a toda la población, esto es uno de los posibles impedimentos a considerar. En nuestro caso nos enfocaremos únicamente en los planteles que pertenecen al muncipio de Centro (7, 11, 12 y 19).
Hay categorías que presentan información marginal que podemos excluir de nuestro análisis, pero en nuestro caso no lo haremos ya que pueden estar representando a un grupo de población minoritario.
Al inspeccionar la edad reportada nos encontramos con una serie de datos irregulares.
## [1] "17" "18" "15 años" "17 Años"
## [5] "15" "16" "19" "17 año"
## [9] "18 años" "16 años" "17 años" "20"
## [13] "16 años de edad" "17años" "15 Años" "16."
## [17] "Jalpade Mendez" "14" "15 anos" "23"
Vemos la disparidad de respuestas para una misma edad (p.e., 15, 15 años, 15 años de edad, etc.). En este caso, extraemos solo los números de todas las respuestas para tener las categorías adecuadas para su uso y análisis.
Es importante que al analizar las respuestas se tengan presente los posibles controles a los que puede estar sujeta nuestra población: en este caso, la edad, el plantel, el sexo, si trabaja o no, etc., son factores que pueden influir en el estado de ánimo de los alumnos.
Para probar la primera hipótesis nos enfocaremos en aquellos alumnos que hayan contestado sentir algún tipo de tristeza y su relación con el consumo de alcohol, para posteriormente comparar con aquellos que no se identifican con el sexo binario (hombre o mujer).
Utilizaremos la pregunta
En el último mes, has sentido de manera continua:, creamos
una variable booleana la cual será cierta si hay una coincidencia con la
palabra tristeza.
Algunas de las respuestas que nos interesan son:
## # A tibble: 10 × 1
## Emociones
## <chr>
## 1 tristeza;ansiedad
## 2 tristeza
## 3 tristeza;ansiedad;enojo o rabia
## 4 tristeza;no, no he sentido nada, me siento muy bien
## 5 tristeza;enojo o rabia
## 6 tristeza;ansiedad;enojo o rabia;no, no he sentido nada, me siento muy bien
## 7 tristeza;ansiedad;no, no he sentido nada, me siento muy bien
## 8 tristeza;ansiedad;enojo o rabia;decepción
## 9 tristeza;ansiedad;enojo o rabia;tengo cambios de humor muy de la nada, pero …
## 10 tristeza;ansiedad;enojo o rabia;mi mente se cae a pedazos
Ahora, a través de un cuadro comparativo cruzamos esto con las
preguntas relacionadas con el consumo de alcohol:
Durante el mes pasado, ¿alguna vez tomaste alcohol como para sentirte borracho/a?:
# Variable booleana para identificar si el estudiante se ha emborrachado.
planteles_centro_plus <- planteles_centro_plus %>%
mutate(Alcohol = if_else(`Durante el mes pasado, ¿alguna vez tomaste alcohol como para sentirte borracho/a?` == "Sí",
TRUE, FALSE))
Observamos para ver si existe relación alguna entre el consumo de alcohol y sentimientos relacionados con la tristeza. Sin que esto implique que haya necesariamente una correlación directa entre ambas variables.
| Tristeza | Alcohol | n | pct |
|---|---|---|---|
| FALSE | FALSE | 1247 | 89.00785 |
| FALSE | TRUE | 154 | 10.99215 |
| TRUE | FALSE | 413 | 82.43513 |
| TRUE | TRUE | 88 | 17.56487 |
Vemos que, para alumnos que no han sentido algún tipo de tristeza, el 10.99 por ciento ha consumido alcohol para emborracharse, mientras que el 17.56 por ciento de los alumnos que han sentido tristeza han consumido alcochol con el mismo propósito.
Adicionalmente, agregamos una variable más para ver si existe alguna
relación con el sexo para el caso de aquellos alumnos que no se
identifican con las opciones: hombre o mujer (es decir, quienes
eligieron la respuesta
No me identifico con ninguna de las 2 anteriores).
| Sexo | Tristeza | Alcohol | n | pct |
|---|---|---|---|---|
| TRUE | FALSE | FALSE | 12 | 54.545454 |
| TRUE | TRUE | FALSE | 9 | 40.909091 |
| TRUE | TRUE | TRUE | 1 | 4.545454 |
Para este caso el tamaño de nuestra muestra es demasiado pequeño por
lo que podríamos caer en conclusiones anticipadas. Lo que nos dicen los
datos es que el 4.55 por ciento ha sentido tristeza y ha
consumido alcohol para emborracharse. Mientras que el 40.91 por ciento
ha sentido tristeza, pero no ha consumido alcohol para emborracharse. De
aquellos que no dijeron sentir tristeza, ninguno respondió haber
consumido alcohol para emborracharse.
Para la segunda hipótesis queremos ver cuántos de los alumnos que dijeron tener relaxiones sexuales no estuvieron de acuerdo con ello.
Primero, queremos conocer la edad en la que nuestra población inició
su vida sexual, para ello obtenemos los datos de la pregunta
¿A qué edad tuviste tu primera relación sexual?:
Para probar la segunda hipótesis utilizaremos la pregunta
¿Haz tenido relaciones sexuales? y haremos la comparación
con
¿Estuviste de acuerdo en tener relaciones sexuales?.Para
estos casos nuestras respuestas son Sí/No, por lo que,
transformaremos las variables a booleanas de manera directa.
| Relaciones | Consensuadas | n | pct |
|---|---|---|---|
| FALSE | NA | 1536 | 100.000000 |
| TRUE | FALSE | 16 | 4.371585 |
| TRUE | TRUE | 350 | 95.628415 |
En nuestra tabla comparativa podemos observar que de los alumnos que dicen haber tenido relaciones sexuales, el 4.37 por ciento dijo no haber estado de acuerdo con ello.
Cuántos alumnos contestaron haber consumido drogas y cuál es su edad
Algunas de las respuestas que nos interesan son:
## # A tibble: 10 × 1
## Sustancias
## <chr>
## 1 marihuana
## 2 marihuana;cocaína;metanfetaminas;alucinógenos
## 3 marihuana;cocaína;inhalantes;lsd y cigarro
## 4 marihuana;cocaína;heroína;metanfetaminas;éxtasis
## 5 marihuana;cocaína
## 6 marihuana;cocaína;alucinógenos
## 7 marihuana;dextrometorfano, alcohol (si llegase a contar)
## 8 marihuana;alucinógenos
## 9 marihuana;inhalantes
## 10 marihuana;cocaína;inhalantes;éxtasis;alucinógenos
Para hacer la distinción
| Drogas | Marihuana | n | pct |
|---|---|---|---|
| TRUE | FALSE | 14 | 10.85271 |
| TRUE | TRUE | 115 | 89.14729 |
| Drogas | Marihuana | Cocaina | n | pct |
|---|---|---|---|---|
| TRUE | FALSE | FALSE | 5 | 3.875969 |
| TRUE | FALSE | TRUE | 9 | 6.976744 |
| TRUE | TRUE | FALSE | 83 | 64.341085 |
| TRUE | TRUE | TRUE | 32 | 24.806202 |
Como primer ejercicio no podemos tener conclusiones definitivas, sino únicamente de valor analítico para comprender el universo de información del que disponemos. Sin embargo, para elaborar conclusiones serias se debe trabajar de la mano de expertos en la materia con quienes se pueda seguir realizando pruebas y elaborando hipótesis.