15/5/2022

Librerías usadas

  • rmdformats, readr y readxl sirven para leer los archivos utilizados en este caso de estudio.
  • Ggplot2: para crear gráficos ‘declarativamente’, basado en “La gramática de los gráficos”.
  • DT (data table): Basado en este paquete, puede filtrar, buscar y exportar datos a diferentes formatos fácilmente.
  • psych: Útil para la entrada de datos básicos y análisis descriptivos, para obtener una lista de todas las funciones.
  • GGally: Es un sistema de trazado basado en la gramática de los gráficos.

  • xtable: Convierta un objeto R en un objeto xtable, que luego se puede imprimir como una tabla LaTeX o HTML.
  • corrplot: Permite una visualización gráfica de una matriz de correlación, intervalo de confianza
  • readxl: Permite leer datos en archivos de excel.
  • tidyverse: para llamar a la familia de paquetes tidyverse, que nos ayudaran al procesamiento de nuestros datos.
  • rpart: el paquete con la implementación de árboles de clasificación que utilizaremos.
  • rpart.plot: para graficar los resultados de rpart.

Datos usados

Datos de una encuesta hecha durante las primeras dos semanas de mayo de 2022 sobre los niveles de estrés de los estudiantes de pregrado de ITSON, esta encuesta se le hizo a un total de 100 personas.

Antecedentes

Una publicación reciente de The Lancet (2021) evidencia el efecto que tuvo la pandemia en la salud mental en el continente americano.

Por supuesto que México ha sido uno de las víctimas de esta pandemia de trastornos y condiciones mentales, ya que nuestro país cuenta con el primer puesto a nivel mundial como el país con más estrés laboral, esto es sostenido por un estudio realizado por la OCCMundial sobre el “Estrés laboral en México”.

Esto enciende focos rojos, ya que el estrés y las condiciones emocionales y psicológica son algo que no se debe de tomar a la ligera.

Objetivos

Se busca detectar las causas que generan el estrés y cuál es la razón de esto, ya que son una infinidad de factores los que pueden propiciarlo.

Para llegar más profundo a la fenomenología del estrés también es importante entender cómo nos afecta en nuestra salud mental y física.

Una vez cubiertos los puntos anteriores, poder argumentar de manera lógica la estructura teórica del estrés y aún más importante, dar con las posibles soluciones para reducirlo de manera significativa.

Además se logrará responder si en realidad la pandemia y el confinamiento fueron un parteaguas en los niveles de estrés a nivel nacional, dando paso a lo que ahora se denomina como nueva normalidad.

Teoría

Existen varias definiciones sobre el estrés, una de ellas es la de Melgosa (1997), señala que, debido a las alteraciones que el estrés provoca en la persona, se puede entender este concepto como: “un conjunto de reacciones fisiológicas y psicológicas que experimenta el organismo cuando se lo somete a fuertes demandas”.

Se puede considerar como una respuesta del cuerpo que aparece cuando percibimos que nuestros recursos no son suficientes para afrontar los problemas, y cuando se produce una sobrecarga de tensión repercute en el organismo, provocando la aparición de enfermedades y anomalías patológicas que impiden el normal desarrollo y funcionamiento del cuerpo humano.

Características comunes

  • Se genera una situación nueva que nos exige un cambio.

  • Al principio suele haber una gran falta de información sobre esa situación que nos estresa.

  • Incertidumbre: ¿qué nos va a ocurrir?

  • Ambigüedad: a mayor ambigüedad más estrés.

  • Normalmente tampoco tenemos muchas habilidades para manejar esta nueva situación.

  • El estrés nos provoca alteraciones biológicas en el organismo que nos obligan a trabajar aún más para volver a un estado de equilibrio.

  • Cuanto más dure la situación, cuanto más crónica sea ésta, mayor nuestro desgaste.

Consecuencias físicas

  • Se pueden ver afectados los sistemas endócrino, nervioso e inmunológico
  • Enfermedades del corazón, vasos sanguíneos, riñones e incluso la muerte.
  • Acné, alopecia, dermatitis, colitis ulcerosa, estreñimiento, migrañas, náuseas, vómitos, temblores
  • Trastorno esquizofrénico y menstruales
  • Suicidio
  • Insomnio,
  • Infarto al miocardio
  • Epilepsia,
  • Diarrea
  • Asma

Consecuencias psicologicas

  • Preocupación excesiva
  • Obsesiones
  • Incapacidad para tomar decisiones, concentrarse y mantener la atención
  • Frecuentes olvidos
  • Bloqueos mentales
  • Mal humor
  • Adicción a drogas y alcohol
  • Depresión, ansiedad, miedos y fobias
  • Alteración de las conductas de alimentación

Metodos utilizados

Regresión Lineal

Es una técnica de modelado estadístico que se emplea para describir una variable de respuesta continua como una función de una o varias variables predictoras.

La variable que desea predecir se denomina variable dependiente, la variable que está utilizando para predecir el valor de la otra variable se denomina variable independiente.

Se estima los coeficientes de la ecuación lineal, involucrando una o a más variables independientes que mejor predicen el valor de la variable dependiente,

Regresión Logística

Es un método de regresión que permite estimar la probabilidad de una variable cualitativa binaria en función de una variable cuantitativa.

Aunque la regresión logística permite clasificar, se trata de un modelo de regresión que modela el logaritmo de la probabilidad de pertenecer a cada grupo.

La asignación final se hace en función de las probabilidades predichas. La regresión logística transforma el valor devuelto por la regresión lineal (β0+β1X) empleando una función cuyo resultado está siempre comprendido entre 0 y 1.

Regresión Lineal Múltiple

Permite generar un modelo lineal en el que el valor de la variable dependiente se determina a partir de un conjunto de variables independientes llamadas predictores x1x2x3.

Estos modelo pueden emplearse para predecir el valor de la variable dependiente o para evaluar la influencia que tienen los predictores sobre ella.

Para poder determinar qué impacto tienen en el modelo cada una de las variables, se emplean los coeficientes parciales estandarizados, que se obtienen al estandarizar las variables predictoras previo ajuste del modelo.

Resultados y discusión

¿Qué tan afectado se vio tu desarrollo social con la pandemia?

Angustia

Depresión

Ansiedad

Coeficiente de correlacion

Visualización grafica

Coeficiente de correlacion entre sintomas generados por niveles de estres

Cálculo y representación de la recta de mínimos cuadrados

Call:
lm(formula = Angustia ~ Incertidumbre, data = sintomas)

Residuals:
    Min      1Q  Median      3Q     Max 
-5.8768 -1.0315  0.1723  0.8978  7.6780 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)    2.32198    0.47238   4.916 3.56e-06 ***
Incertidumbre  0.72831    0.07101  10.256  < 2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.084 on 98 degrees of freedom
Multiple R-squared:  0.5177,    Adjusted R-squared:  0.5128 
F-statistic: 105.2 on 1 and 98 DF,  p-value: < 2.2e-16

El primer argumento de este comando es una fórmula y ~ x en la que se especifica cuál es la variable respuesta y cuál es la variable regresora.

El segundo argumento, especifica cuál es el fichero en el que se encuentran las variables.

El resultado lo guardamos en un objeto llamado regresión. Los parámetros de la ecuación de la recta de mínimos cuadrados que relaciona la cantidad de grasas en la sangre en función del peso vienen dados por la columna ‘Estimate’ de la tabla ‘Coefficients’ de la salida anterior.

La ecuación de la recta de mínimos cuadrados es: \[ y = 0.73987 + 0.84313x \]

Recta de minimos cuadrados

Calculo de predicciones

       1        2        3        4        5 
3.050296 3.778606 4.506917 5.235228 5.963539 

Intervalos de confianza

                  2.5 %    97.5 %
(Intercept)   1.3845655 3.2594043
Incertidumbre 0.5873892 0.8692323

Regresión lineal múltiple

Análisis con histogramas

Relacion utilizando ggplot y ggally

De los análisis realizados hasta el momento, podemos obtener las siguientes conclusiones preliminares:

  • Las variables que tienen una mayor relación lineal con la depresión son: ansiedad (r= 0.617), y tristeza (r= 0.728).

  • Incertidumbre y Angustia están medianamente correlacionados (r = 0.720) por lo que posiblemente no sea útil introducir ambos predictores en el modelo.

Generar el modelo

 DoloresMuscular    Angustia     Incertidumbre     FaltaSueño   
 Min.   : 0.0    Min.   : 0.00   Min.   : 0.00   Min.   : 0.00  
 1st Qu.: 3.0    1st Qu.: 5.00   1st Qu.: 4.00   1st Qu.: 5.00  
 Median : 6.0    Median : 7.00   Median : 6.00   Median : 7.00  
 Mean   : 5.2    Mean   : 6.67   Mean   : 5.97   Mean   : 6.27  
 3rd Qu.: 8.0    3rd Qu.: 9.25   3rd Qu.: 9.00   3rd Qu.: 9.00  
 Max.   :10.0    Max.   :10.00   Max.   :10.00   Max.   :10.00  
  DolorCabeza    CambiosApetito    Depresion     Claustrofobia  
 Min.   : 0.00   Min.   : 0.00   Min.   : 0.00   Min.   : 0.00  
 1st Qu.: 5.00   1st Qu.: 3.00   1st Qu.: 2.00   1st Qu.: 0.00  
 Median : 7.00   Median : 6.00   Median : 6.00   Median : 2.00  
 Mean   : 6.91   Mean   : 6.02   Mean   : 5.49   Mean   : 3.01  
 3rd Qu.:10.00   3rd Qu.: 9.00   3rd Qu.: 8.00   3rd Qu.: 5.00  
 Max.   :10.00   Max.   :10.00   Max.   :10.00   Max.   :10.00  
    Tristeza        Ansiedad        MalHumor       Impotencia   
 Min.   : 0.00   Min.   : 0.00   Min.   : 0.00   Min.   : 0.00  
 1st Qu.: 4.00   1st Qu.: 4.00   1st Qu.: 5.00   1st Qu.: 3.75  
 Median : 7.00   Median : 8.00   Median : 8.00   Median : 7.00  
 Mean   : 6.02   Mean   : 6.88   Mean   : 7.07   Mean   : 6.29  
 3rd Qu.: 8.25   3rd Qu.:10.00   3rd Qu.:10.00   3rd Qu.: 9.00  
 Max.   :10.00   Max.   :10.00   Max.   :10.00   Max.   :10.00  
    Paranoia    
 Min.   : 0.00  
 1st Qu.: 0.00  
 Median : 4.00  
 Mean   : 4.22  
 3rd Qu.: 7.00  
 Max.   :10.00  

Evaluando gráficamente el modelo

Múltiples predictores

Call:
lm(formula = Depresion ~ Angustia + Incertidumbre + Tristeza + 
    Ansiedad, data = sintomas)

Residuals:
    Min      1Q  Median      3Q     Max 
-7.7623 -1.0927  0.3631  1.1054  8.2703 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)   -1.01015    0.63102  -1.601   0.1127    
Angustia       0.27751    0.11938   2.325   0.0222 *  
Incertidumbre -0.04109    0.11675  -0.352   0.7257    
Tristeza       0.59492    0.09353   6.360 7.02e-09 ***
Ansiedad       0.19085    0.10036   1.902   0.0602 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.306 on 95 degrees of freedom
Multiple R-squared:  0.6049,    Adjusted R-squared:  0.5882 
F-statistic: 36.36 on 4 and 95 DF,  p-value: < 2.2e-16

Prueba de Breusch-Pagan

Intervalos de confianza

                     2.5 %    97.5 %
(Intercept)   -2.262880565 0.2425838
Angustia       0.040502962 0.5145151
Incertidumbre -0.272871772 0.1906937
Tristeza       0.409226358 0.7806057
Ansiedad      -0.008387509 0.3900941

Cada una de las pendientes de un modelo de regresión lineal múltiple se define del siguiente modo: Si el resto de variables se mantienen constantes, por cada unidad que aumenta el predictor en cuestión, la variable (Y) varía en promedio tantas unidades como indica la pendiente.

Distribución normal de los residuos

Prueba de shapiro wilk

    Shapiro-Wilk normality test

data:  regresion$residuals
W = 0.94764, p-value = 0.0005816

Esta prueba es aplicable cuando se analizan muestras compuestas por menos de 50 elementos, en otras palabras, muestras pequeñas. Como el p valor (0.01329) es menor a alfa (0,05), se rechaza la hipótesis nula (H0)

Regresión logística

Call:
glm(formula = Depresion ~ Tristeza, data = sintomas)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-7.9060  -1.2782   0.0262   1.2833   8.5799  

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  0.60940    0.52686   1.157     0.25    
Tristeza     0.81073    0.07723  10.498   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for gaussian family taken to be 6.142998)

    Null deviance: 1278.99  on 99  degrees of freedom
Residual deviance:  602.01  on 98  degrees of freedom
AIC: 469.3

Number of Fisher Scoring iterations: 2

Análisis gráfico descriptivo

Entrenando nuestro modelo

Usamos la función rpart de rpart para entrenar nuestro modelo. Esta función nos pide una fórmula para especificar la variable objetivo de la clasificación. La fórmula que usaremos es FaltaDinero ~ ., la cual expresa que intentaremos clasificar la falta de dinero usando a todas las demás variables como predictoras. En este primer intento no ajustaremos ningún otro parámetro.

Impacto al desarrollo social según el género

8.- Conclusión

….

Bibliografia

o Caparrini, F. S., & Windmill Web Work. (2020). Aprendizaje Supervisado y No Supervisado. Cs.Us.Es. http://www.cs.us.es/~fsancho/?e=77

o Suarez, A. (s.f.). Diferencias entre el Machine Learning supervisado y no supervisado. Bismart.com. http://blog.bismart.com/diferencias-machine-learning-supervisado-no-supervisado

o Naranjo P., M. (2009). Una Revisión Teórica sobre el Estrés y Algunos Aspectos Relevantes de Este en el Ámbito Educativo. Revista Educación, 33(2),171-190. Disponible en: https://www.redalyc.org/articulo.oa?id=44012058011 o Regueiro, A. (s.f.). Conceptos Básicos: ¿Qué es el Estrés y Cómo nos Afecta? Disponible en: https://www.uma.es/media/files/tallerestr%C3%A9s.pdf

o Persum Psicólogos Oviedo. (2018). Consecuencias del estrés. Disponible en: https://psicologosoviedo.com/especialidades/problemas-laborales/estres-negativo/

o Goldstein, A. (2017). Deconstructing Data Science: Breaking The Complex Craft Into Its Simplest Parts. Disponible en: https://ajgoldstein.com/2017/11/12/deconstructing-data-science/

o IBM. (s. f.). Acerca de la regresión lineal. México | IBM. Recuperado 6 de abril de 2022, de https://www.ibm.com/mx-es/analytics/learn/linear-regression

o Manuel Sánchez, J. (2010). Estrés laboral. Binasss. Recuperado 6 de abril de 2022, de https://www.binasss.sa.cr/opac-ms/media/digitales/Estr%C3%A9s%20laboral.pdf

o Rodrigo, J. A. (2016, julio). Introducción a la Regresión Lineal Múltiple. Ciencia de Datos. Recuperado 6 de abril de 2022, de https://www.cienciadedatos.net/documentos/25_regresion_lineal_multiple

o The Lancet. (2021, 15 noviembre). Strengthening mental health responses to COVID-19. The Lancet Regional Health Americas. Recuperado 6 de abril de 2022, de https://secure.jbs.elsevierhealth.com/action/cookieAbsent