TALLER EVALUATIVO - 202410

Author

Sebastián Pérez Albor, Iván Ramirez Mejia

Primer punto

En un estudio sobre la depresión en adultos mayores de la región Caribe colombiana, a través de un instrumento, se determinará cuáles de los 140 participantes padecen de depresión y cuáles no. Adicionalmente se les preguntará si tienen hábito de fumar o no, y si tienen contacto regular con sus familias o no. Para la muestra se elegirán al azar 20 adultos mayores de los 7 departamentos que conforman el Caribe colombiano que estén inscritos a programas de gestión social de las gobernaciones y alcaldías.

Población objetivo del estudio: Adultos mayores de la región Caribe colombiana.
Muestra: 20 adultos mayores al azar representado el 14% (20 de 140 participantes).
¿Qué tipo de muestreo consideras ha sido empleado? ¿Es adecuado?: Muestro estratificado, este tipo de muestreo se adapta bien para este estudio ya que incluye adultos mayores de cada departamento lo que permite hacer comparaciones entre departamentos, así como hacer un estudio más general de la región.
El investigador quiere estudiar la presencia de depresión relacionada al hábito de fumar ¿Qué hipótesis crees que debe rolver?: Hay relación entre el hábito de fumar y la presencia de depresión en los adultos mayores de la región caribe.

¿Qué variables están involucradas en el estudio? Operacionalizar las variables.

Variable	Naturaleza	Nivel de medición	Criterios de clasificación
Fuman	Cualitativa	Nominal	Si, no.
Contacto familiar	Cualitativa	Nominal	Si, no.
Edad *	Cuantitativa discreta	Razón	75,76,77, …

*Aunque no aparece explicitamente en el párrafo cremos que puede ser una variable que se tiene en cuenta a lo largo del estudio.

Segundo punto

Pratica en software

Realizar un descriptivo que permita caracterizar la población de estudio. Describirlas siguientes variables: edad, puntaje de angustia psicológica, puntuación de empatía cognitiva, según sexo y según estado de salud autoinformado del participante. Para el descriptivo use medidas de resumen numérico o gráficos.

Podemos observar que la edad de los encuestados oscila de forma general entre 17 y 49 años , aunque para los participantes de sexo no binario solo entre 20 y 28 años, para las edades de los participantes de sexo masculino y femenimo vemos que existe asimetria a la derecha, esto debido que presentan valores atipicos del lado derecho.

Para las personas del sexo no binario vemos que un 50% personas se encuentran entre 23 y 27 años, que la media de edad fue de 24.4( \pm 3.21) desvición estandar, la mediana fue de 24.4 (4) IQR, también que no existen datos atípicos.
En la caso de las personsas de sexo masculino encontramos que las edades van desde los 18 años hasta los 35 años, también que el 75% de los encuestados tienen como mucho 24 años, la mediana de edad fue 23 (2) IQR, la edad que mas se repite entre los hombres es de 23 años con 42 (15.3%) apariciones.
Analizando el comportamiento de las distribución de la variable de edad en las participantes de sexo femenino, se observa que la edades que menos son repite es 34, 38, 39, 44, 49 años (0.165% cada una), la edad minima fue de 17 y maxima de 49, un 50% esta entre 20 y 24 años, la mediana fue de 22 años (4) IQR.

En general se puede decir que para todas las categorías más del 50% de los participantes tiene más de 20 años, y a medida que van creciendo consideran que el estado de su salud es mejor.

Very dissatisfied: para esta clasificación contamos se puede observas 2 datos a típico, que son dos participantes con 34 y 44 años, por ello es útil ver que el valor la mediana es 23 años (con un rango intercuartílico de 5) y la moda también es 23. Además, se puede ver que parece tener un sesgo con una asimetría a la derecha.
Dissatisfied: En este caso se encontraron 2 valores atípicos, que en realidad no tienen una gran influencia, pues son 29 y 39, el 39 es el que puede afectar un poco el análisis de datos, pero el 29 esta bastante cerca al margen que manejan los datos. La media de los datos es de 22.25 años (con una desviación estándar de más o menos 3.18).
Neither satisfied nor unsatisfied: Para esta categoría de nuevo encontramos valores atípicos. La mediana de estos datos es de 22 años (siendo 4 años el rango intercuartílico) A pesar de los valores atípicos, la caja muestra como la distribución de los datos parece ser simétrica. Para los otros dos casos que son “Satisfied” y “Very satisfied” igualmente se observan datos a típicos, pero aun así parecen mostrar simetría, para ambas categorías la media fue de 22.3 (la desviación estándar de “Satisfied” es de más o menos 2.95 y la de “Very satisfied es de más o menos 3.27).

Se puede apreciar como la distribución del puntaje de angustiga para los participantes de sexo masculino y femenimo es parecida (parecen ser de distribución normal), asimetricas un poco hacia la izquierda, ambas tienen valores atípicos en el lado izquierdo, en el caso de los no binarios al ser solo 5 personas no presetan muchos datos, se observa que el mínimo para estos es de 10 y el maxido de 35 puntos, que le puntajes que mas se repite esta entre 25 y 30.

En el caso del sexo masculino vemos que hay un minimo de 9 puntos y un maximo de 35 puntos, un 50% tiene un puntaje entre 21 y 28, la mediana de puntuación fue 24 (7) IQR.

Para el sexo femenimo encontramos que las puntuaciones van desde los 6 a los 35 puntos, que el 75% tuvo como maximo 26 puntos, la mediana de puntuación de 23 (6) IQR.

En términos generales se puede ver que hay pocos datos atípicos, y que también se puede observar que en casi todas las categorías de estado de salud parece haber una distribución simétrica, excepto por la segunda categoría, que son quienes marcaron “Dissatisfied” esta distribución con media 22.93 puntos en la prueba de angustia(y una desviación estándar de más o menos 6.15) y una mediana de 23 ( con un rango intercuartílico de 9 puntos).

La distribución de la puntución empatía cognitica para los hombres presenta una leve asimetria hacia la derecha y la de las mujeres una leve asimetria hacia la izquierda, ambas presentan datos atipicos, para los no binario no hay muchos datos para describir su forma, observamos que cuenta con datos atipicos, los puntajes varian entre 37 y 75 puntos de empatía cognitiva, que al menos un 25% tiene 64 puntos, la mediana fue de 59 puntos, 9 IQR, para los hombres el puntaje varia de los 38 a los 76 puntos, un 75% obtuvo un puntaje de a los mas 62 puntos, la mediana fue de 57 puntos, 8 IQR, se observaron valores atípicos.

Para esta prueba ya se observan menos datos atípicos que en casos anteriores. Algo muy importante a observar por el grafico es que no hay una gran variabilidad entre las cajas, teniendo medias muy cercanas, 59.62 puntos para el estado 1 (DS de más o menos 6.70), 59.26 puntos para el estado 2 (DS de más o menos 7.22), 58.45 puntos para el estado 3 (DS de más o menos 7.08), 58.11 puntos para el estado 4 (DS de más o menos 6.3) y 58.85 para el estado 5 (DS de más o menos 6.41). Esto nos llevaría a decir que el estado de salud del paciente, no tiene gran influencia sobre la prueba de empatía cognitiva.

Tercer punto

ManJSPE <- subset(mental_psi$jspe, sexo==1)
WomanJSPE <- subset(mental_psi$jspe, sexo==2)
NonBJSPE <- subset(mental_psi$jspe, sexo==3)

shapiro.test(ManJSPE)


    Shapiro-Wilk normality test

data:  ManJSPE
W = 0.96501, p-value = 3.16e-06

shapiro.test(WomanJSPE)


    Shapiro-Wilk normality test

data:  WomanJSPE
W = 0.97739, p-value = 4.66e-08

shapiro.test(NonBJSPE)


    Shapiro-Wilk normality test

data:  NonBJSPE
W = 0.91337, p-value = 0.4881

#Con un nivel de significancia del 5% (alpha=0.05)
#Los datos del puntaje de satisfación laboral para los hombres no provienen de una distribucion normal debido a que el p-valor es menor que alpha

#Los datos del puntaje de satisfación laboral para las mujeres no provienen de una distribución normal debido a que el p-valor es menor que alpha

#Los datos del puntaje de satisfación laboral para los no binarios provienen de una distribucion normal debido a que el p-valor es mayor que alpha


leveneTest(mental_psi$jspe, sexo)

Levene's Test for Homogeneity of Variance (center = median)
       Df F value Pr(>F)
group   2  0.6117 0.5427
      883

# El p valor de 0.54 el cual es mayor que alpha, nos indica que las varianzas de los grupos es igual.

# Por ser un ejercicio acadamecio asuiremos que se cumplen los supuestos de normalidad en el caso del puntaje en los hombres y en las mujeres, para determinar si existe un diferencia en sus medias. 

#Varianza muestral combinada
var_muestral_combinada <- ((length(ManJSPE)-1)*var(ManJSPE) + (length(WomanJSPE)-1)*var(WomanJSPE) + (length(NonBJSPE)-1)*var(NonBJSPE))/(length(ManJSPE) -1 + length(WomanJSPE) - 1 + length(NonBJSPE) - 1)

# Resta de medias
resta_medias <- mean(ManJSPE) - mean(WomanJSPE) - mean(NonBJSPE)

# Error muestral
error_muestral <- sqrt(var_muestral_combinada/length(ManJSPE) + var_muestral_combinada/length(WomanJSPE) + var_muestral_combinada/length(NonBJSPE))

# Error 
error <- error_muestral*abs(qt(0.005,length(mental_psi$jspe) - 3))

# Inf
infimo <- resta_medias - error 

# Sup
supremo <- resta_medias + error

# -126.37  <  u1-u2-u3  < -105.98 


#Por lo que podemos determinar que la suma de la media del puntaje de satisfación laboral de las mujeres más la media de los no binarios es mayor que la media del puntaje de los hombres.

# Veamos ahora rapidamente si las diferencia entre la media del puntaje en las mujeres y los no binarios.

t.test(WomanJSPE,NonBJSPE, var.equal = TRUE)


    Two Sample t-test

data:  WomanJSPE and NonBJSPE
t = -1.8368, df = 609, p-value = 0.06673
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -14.4604584   0.4835607
sample estimates:
mean of x mean of y 
 107.0116  114.0000

t.test(ManJSPE, NonBJSPE, var.equal = TRUE)


    Two Sample t-test

data:  ManJSPE and NonBJSPE
t = -2.1969, df = 278, p-value = 0.02885
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -17.3814782  -0.9530672
sample estimates:
mean of x mean of y 
 104.8327  114.0000

t.test(ManJSPE, WomanJSPE, var.equal = TRUE)


    Two Sample t-test

data:  ManJSPE and WomanJSPE
t = -3.44, df = 879, p-value = 0.000609
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -3.421919 -0.935729
sample estimates:
mean of x mean of y 
 104.8327  107.0116

Cuarto punto

cogM <- subset(mental_psi$qcae_cog,mental_psi$sex==1)
cogW <- subset(mental_psi$qcae_cog,mental_psi$sex==2)
cogN <- subset(mental_psi$qcae_cog,mental_psi$sex==3)
shapiro.test(cogM)


    Shapiro-Wilk normality test

data:  cogM
W = 0.99018, p-value = 0.06102

shapiro.test(cogW)


    Shapiro-Wilk normality test

data:  cogW
W = 0.99307, p-value = 0.006718

shapiro.test(cogN)


    Shapiro-Wilk normality test

data:  cogN
W = 0.92814, p-value = 0.5838

#Con un nivel de significancia del 5% (alpha=0.05)
#Los datos del puntaje de empatia para los hombres pueden provenir de una distribucion normal debido a que el p-valor es mayor que alpha
#Los datos del puntaje de empatia para las mujeres no provienen de una distribución normal debido a que el p-valor es menor que alpha
#Los datos del puntaje de empatia para los no binarios pueden provenir de una distribucion normal debido a que el p-valor es mayor que alpha

Sex<-factor(mental_psi$sex)
leveneTest(mental_psi$qcae_cog,Sex)

Levene's Test for Homogeneity of Variance (center = median)
       Df F value Pr(>F)
group   2  1.3723 0.2541
      883

#Debido a que el p-valor arrojado por el test levene es mayor que alpha, no se rechaza la hipotesis nula, por lo tanto, se puede decir que las varianzas    de los grupos son iguales

#Construyendo el intervalo de confianza
sd(cogM)

[1] 6.501191

sd(cogW)

[1] 6.5631

sd(cogN)

[1] 3.605551

tamaños_muestrales<-c(275,606,5)
varianzas<-c(sd(cogM)^2,sd(cogW)^2,sd(cogN)^2)
varianza_combinada <- sum((tamaños_muestrales - 1) * varianzas) / sum(tamaños_muestrales - 3)
varianza_combinada

[1] 42.97911

dif_medias<-mean(cogM)-mean(cogW)-mean(cogN)
Error_al<-qt(0.975,883)
Error_muest<-sqrt((varianza_combinada/275)+(varianza_combinada/606)+(varianza_combinada/5))

#Con una confianza del 95%
# la cola inferior es
col_inf<-dif_medias-Error_al*Error_muest


#cola superior es 
col_sup<-dif_medias+Error_al*Error_muest

#El intervalo quedaria de la siguiente forma

#-68.42<u1-u2-u3<-56.76
#De esto y analizando los valores de cada grupo, se puede concluir que la media de puntaje de la prueba de empatia en el grupo de las mujeres es mayor que la media de puntaje de la prueba de empatia en el grupo de los hombres
#En esto hay que tener en cuenta que la poblacion de participantes no binarios, es muy baja, y que este ejercicio es puramente academico, ya que los datos de las mujeres no proviene de una distribución normal

--- title: "TALLER EVALUATIVO - 202410" author: "Sebastián Pérez Albor, Iván Ramirez Mejia" #date: "2024-02-21" toc: true format: html: html-math-method: katex code-tools: true self-contained: true execute: warning: false --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = FALSE) ``` ### Primer punto En un estudio sobre la depresión en adultos mayores de la región Caribe colombiana, a través de un instrumento, se determinará cuáles de los 140 participantes padecen de depresión y cuáles no. Adicionalmente se les preguntará si tienen hábito de fumar o no, y si tienen contacto regular con sus familias o no. Para la muestra se elegirán al azar 20 adultos mayores de los 7 departamentos que conforman el Caribe colombiano que estén inscritos a programas de gestión social de las gobernaciones y alcaldías. a. **Población objetivo del estudio:** Adultos mayores de la región Caribe colombiana.\ b. **Muestra:** 20 adultos mayores al azar representado el 14% (20 de 140 participantes).\ c. **¿Qué tipo de muestreo consideras ha sido empleado? ¿Es adecuado?:** Muestro estratificado, este tipo de muestreo se adapta bien para este estudio ya que incluye adultos mayores de cada departamento lo que permite hacer comparaciones entre departamentos, así como hacer un estudio más general de la región. d. **El investigador quiere estudiar la presencia de depresión relacionada al hábito de fumar ¿Qué hipótesis crees que debe rolver?:** Hay relación entre el hábito de fumar y la presencia de depresión en los adultos mayores de la región caribe. e. **¿Qué variables están involucradas en el estudio? Operacionalizar las variables.** | Variable | Naturaleza | Nivel de medición | **Criterios de clasificación** | |-----------------|-----------------|-----------------|--------------------| | Fuman | Cualitativa | Nominal | Si, no. | | Contacto familiar | Cualitativa | Nominal | Si, no. | | Edad \* | Cuantitativa discreta | Razón | 75,76,77, ... | \*Aunque no aparece explicitamente en el párrafo cremos que puede ser una variable que se tiene en cuenta a lo largo del estudio. \newpage ### Segundo punto ###### Pratica en software Realizar un descriptivo que permita caracterizar la población de estudio. Describirlas siguientes variables: edad, puntaje de angustia psicológica, puntuación de empatía cognitiva, según sexo y según estado de salud autoinformado del participante. Para el descriptivo use medidas de resumen numérico o gráficos. ```{r} library(readxl) mental_psi <- read_excel("C:/Users/sebas/Downloads/mental_psi (1).xlsx") View(mental_psi) ``` ```{r 2.1.1} sexo <- as.factor(mental_psi$sex) hombre_edad <- subset(mental_psi$age, sexo == 1) mujer_edad <- subset(mental_psi$age, sexo == 2) nobinario_edad <- subset(mental_psi$age, sexo == 3) par(mfrow=c(3,1), mar = c(4, 4, 2, 2)) hist(hombre_edad, main="Distribución de Edad - Hombre" ,xlab="Edad" ,ylab="Frencuencia" ,col="#7D0025" ) hist(mujer_edad, main="Distribución de Edad - Mujer" ,xlab="Edad" ,ylab="Frencuencia" ,col="#C01F00") hist(nobinario_edad, main="Distribución de Edad - No Binario" ,xlab="Edad" ,ylab="Frencuencia" ,col="#F6B62E") # Restaurar el layout original y los márgenes par(mfrow=c(1,1), mar = c(5, 4, 4, 2) + 0.1) ``` Podemos observar que la edad de los encuestados oscila de forma general entre 17 y 49 años , aunque para los participantes de sexo no binario solo entre 20 y 28 años, para las edades de los participantes de sexo masculino y femenimo vemos que existe asimetria a la derecha, esto debido que presentan valores atipicos del lado derecho. 1. Para las personas del sexo no binario vemos que un 50% personas se encuentran entre 23 y 27 años, que la media de edad fue de 24.4( $\pm$ 3.21) desvición estandar, la mediana fue de 24.4 (4) IQR, también que no existen datos atípicos. 2. En la caso de las personsas de sexo masculino encontramos que las edades van desde los 18 años hasta los 35 años, también que el 75% de los encuestados tienen como mucho 24 años, la mediana de edad fue 23 (2) IQR, la edad que mas se repite entre los hombres es de 23 años con 42 (15.3%) apariciones. 3. Analizando el comportamiento de las distribución de la variable de edad en las participantes de sexo femenino, se observa que la edades que menos son repite es 34, 38, 39, 44, 49 años (0.165% cada una), la edad minima fue de 17 y maxima de 49, un 50% esta entre 20 y 24 años, la mediana fue de 22 años (4) IQR. ```{r 2.1.2} color_base <- "#7D0025" num_colores <- 5 paleta_colores <- colorRampPalette(c(color_base,"#F6B62E"))(num_colores) boxplot(mental_psi$age ~ mental_psi$health ,horizontal = TRUE ,main ="Distribución de la edad según el estado de salud auto informado" ,ylab = "Estado de salud" ,xlab = "Edades" ,col= paleta_colores ) ``` En general se puede decir que para todas las categorías más del 50% de los participantes tiene más de 20 años, y a medida que van creciendo consideran que el estado de su salud es mejor. 1. Very dissatisfied: para esta clasificación contamos se puede observas 2 datos a típico, que son dos participantes con 34 y 44 años, por ello es útil ver que el valor la mediana es 23 años (con un rango intercuartílico de 5) y la moda también es 23. Además, se puede ver que parece tener un sesgo con una asimetría a la derecha. 2. Dissatisfied: En este caso se encontraron 2 valores atípicos, que en realidad no tienen una gran influencia, pues son 29 y 39, el 39 es el que puede afectar un poco el análisis de datos, pero el 29 esta bastante cerca al margen que manejan los datos. La media de los datos es de 22.25 años (con una desviación estándar de más o menos 3.18). 3. Neither satisfied nor unsatisfied: Para esta categoría de nuevo encontramos valores atípicos. La mediana de estos datos es de 22 años (siendo 4 años el rango intercuartílico) A pesar de los valores atípicos, la caja muestra como la distribución de los datos parece ser simétrica. Para los otros dos casos que son “Satisfied” y “Very satisfied” igualmente se observan datos a típicos, pero aun así parecen mostrar simetría, para ambas categorías la media fue de 22.3 (la desviación estándar de “Satisfied” es de más o menos 2.95 y la de “Very satisfied es de más o menos 3.27). ```{r 2.2.1} hombre_amsp <- subset(mental_psi$amsp, sexo == 1) mujer_amsp <- subset(mental_psi$amsp, sexo == 2) nobinario_amsp <- subset(mental_psi$amsp, sexo == 3) par(mfrow=c(3,1), mar = c(4, 4, 2, 2)) hist(hombre_amsp, main="Distribución puntaje de angustia - Hombre" ,xlab="Puntaje de angustia" ,ylab="Frencuencia" ,col="#EA4C3B" ) hist(mujer_amsp, main="Distribución puntaje de angustia - Mujer" ,xlab="Puntaje de angustia" ,ylab="Frencuencia" ,col="#F38458") hist(nobinario_amsp, main="Distribución puntaje de angustia - No Binario" ,xlab="Puntaje de angustia" ,ylab="Frencuencia" ,col="#FADDC3") # Restaurar el layout original y los márgenes par(mfrow=c(1,1), mar = c(5, 4, 4, 2) + 0.1) ``` Se puede apreciar como la distribución del puntaje de angustiga para los participantes de sexo masculino y femenimo es parecida (parecen ser de distribución normal), asimetricas un poco hacia la izquierda, ambas tienen valores atípicos en el lado izquierdo, en el caso de los no binarios al ser solo 5 personas no presetan muchos datos, se observa que el mínimo para estos es de 10 y el maxido de 35 puntos, que le puntajes que mas se repite esta entre 25 y 30. En el caso del sexo masculino vemos que hay un minimo de 9 puntos y un maximo de 35 puntos, un 50% tiene un puntaje entre 21 y 28, la mediana de puntuación fue 24 (7) IQR. Para el sexo femenimo encontramos que las puntuaciones van desde los 6 a los 35 puntos, que el 75% tuvo como maximo 26 puntos, la mediana de puntuación de 23 (6) IQR. ```{r 2.2.2} color_base <- "#F56653" num_colores <- 5 paleta_colores <- colorRampPalette(c(color_base,"#F0B462"))(num_colores) boxplot(mental_psi$amsp~mental_psi$health ,horizontal = TRUE ,main="Distribución del puntaje de angustia y estado de salud" ,ylab="Estado de salud" ,xlab = "Puntaje de angustia psicologica" ,col= paleta_colores ) ``` En términos generales se puede ver que hay pocos datos atípicos, y que también se puede observar que en casi todas las categorías de estado de salud parece haber una distribución simétrica, excepto por la segunda categoría, que son quienes marcaron “Dissatisfied” esta distribución con media 22.93 puntos en la prueba de angustia(y una desviación estándar de más o menos 6.15) y una mediana de 23 ( con un rango intercuartílico de 9 puntos). ```{r 2.3.1} hombre_cog <- subset(mental_psi$qcae_cog, sexo == 1) mujer_cog <- subset(mental_psi$qcae_cog, sexo == 2) nobinario_cog <- subset(mental_psi$qcae_cog, sexo == 3) par(mfrow=c(3,1), mar = c(4, 4, 2, 2)) hist(hombre_cog, main="Distribución Puntuación empatía cognitiva - Hombre" ,xlab="Puntuación empatía cognitiva" ,ylab="Frencuencia" ,col="#88002D" ) hist(mujer_cog, main="Distribución Puntuación empatía cognitiva - Mujer" ,xlab="Puntuación empatía cognitiva" ,ylab="Frencuencia" ,col="#DA3926") hist(nobinario_cog, main="Puntuación empatía cognitiva - No Binario" ,xlab="Puntuación empatía cognitiva" ,ylab="Frencuencia" ,col="#F6AC00") # Restaurar el layout original y los márgenes par(mfrow=c(1,1), mar = c(5, 4, 4, 2) + 0.1) ``` La distribución de la puntución empatía cognitica para los hombres presenta una leve asimetria hacia la derecha y la de las mujeres una leve asimetria hacia la izquierda, ambas presentan datos atipicos, para los no binario no hay muchos datos para describir su forma, observamos que cuenta con datos atipicos, los puntajes varian entre 37 y 75 puntos de empatía cognitiva, que al menos un 25% tiene 64 puntos, la mediana fue de 59 puntos, 9 IQR, para los hombres el puntaje varia de los 38 a los 76 puntos, un 75% obtuvo un puntaje de a los mas 62 puntos, la mediana fue de 57 puntos, 8 IQR, se observaron valores atípicos. ```{r 2.3.2} color_base <- "#E23D00" num_colores <- 5 paleta_colores <- colorRampPalette(c(color_base,"#F6AC00"))(num_colores) boxplot(mental_psi$qcae_cog~mental_psi$health,ylim=c(35,80) ,col=paleta_colores ,main="Distribución del puntaje de empatía a cognitiva y estado de salud" ,ylab = "Punataje de empatía" ,xlab = "Estado de salud") ``` Para esta prueba ya se observan menos datos atípicos que en casos anteriores. Algo muy importante a observar por el grafico es que no hay una gran variabilidad entre las cajas, teniendo medias muy cercanas, 59.62 puntos para el estado 1 (DS de más o menos 6.70), 59.26 puntos para el estado 2 (DS de más o menos 7.22), 58.45 puntos para el estado 3 (DS de más o menos 7.08), 58.11 puntos para el estado 4 (DS de más o menos 6.3) y 58.85 para el estado 5 (DS de más o menos 6.41). Esto nos llevaría a decir que el estado de salud del paciente, no tiene gran influencia sobre la prueba de empatía cognitiva. ### Tercer punto ```{r} library(car) ``` ```{r 3.1, echo=TRUE} ManJSPE <- subset(mental_psi$jspe, sexo==1) WomanJSPE <- subset(mental_psi$jspe, sexo==2) NonBJSPE <- subset(mental_psi$jspe, sexo==3) shapiro.test(ManJSPE) shapiro.test(WomanJSPE) shapiro.test(NonBJSPE) #Con un nivel de significancia del 5% (alpha=0.05) #Los datos del puntaje de satisfación laboral para los hombres no provienen de una distribucion normal debido a que el p-valor es menor que alpha #Los datos del puntaje de satisfación laboral para las mujeres no provienen de una distribución normal debido a que el p-valor es menor que alpha #Los datos del puntaje de satisfación laboral para los no binarios provienen de una distribucion normal debido a que el p-valor es mayor que alpha leveneTest(mental_psi$jspe, sexo) # El p valor de 0.54 el cual es mayor que alpha, nos indica que las varianzas de los grupos es igual. # Por ser un ejercicio acadamecio asuiremos que se cumplen los supuestos de normalidad en el caso del puntaje en los hombres y en las mujeres, para determinar si existe un diferencia en sus medias. #Varianza muestral combinada var_muestral_combinada <- ((length(ManJSPE)-1)*var(ManJSPE) + (length(WomanJSPE)-1)*var(WomanJSPE) + (length(NonBJSPE)-1)*var(NonBJSPE))/(length(ManJSPE) -1 + length(WomanJSPE) - 1 + length(NonBJSPE) - 1) # Resta de medias resta_medias <- mean(ManJSPE) - mean(WomanJSPE) - mean(NonBJSPE) # Error muestral error_muestral <- sqrt(var_muestral_combinada/length(ManJSPE) + var_muestral_combinada/length(WomanJSPE) + var_muestral_combinada/length(NonBJSPE)) # Error error <- error_muestral*abs(qt(0.005,length(mental_psi$jspe) - 3)) # Inf infimo <- resta_medias - error # Sup supremo <- resta_medias + error # -126.37 < u1-u2-u3 < -105.98 #Por lo que podemos determinar que la suma de la media del puntaje de satisfación laboral de las mujeres más la media de los no binarios es mayor que la media del puntaje de los hombres. # Veamos ahora rapidamente si las diferencia entre la media del puntaje en las mujeres y los no binarios. t.test(WomanJSPE,NonBJSPE, var.equal = TRUE) t.test(ManJSPE, NonBJSPE, var.equal = TRUE) t.test(ManJSPE, WomanJSPE, var.equal = TRUE) ``` ### Cuarto punto ```{r 3.2, echo=TRUE} cogM <- subset(mental_psi$qcae_cog,mental_psi$sex==1) cogW <- subset(mental_psi$qcae_cog,mental_psi$sex==2) cogN <- subset(mental_psi$qcae_cog,mental_psi$sex==3) shapiro.test(cogM) shapiro.test(cogW) shapiro.test(cogN) #Con un nivel de significancia del 5% (alpha=0.05) #Los datos del puntaje de empatia para los hombres pueden provenir de una distribucion normal debido a que el p-valor es mayor que alpha #Los datos del puntaje de empatia para las mujeres no provienen de una distribución normal debido a que el p-valor es menor que alpha #Los datos del puntaje de empatia para los no binarios pueden provenir de una distribucion normal debido a que el p-valor es mayor que alpha Sex<-factor(mental_psi$sex) leveneTest(mental_psi$qcae_cog,Sex) #Debido a que el p-valor arrojado por el test levene es mayor que alpha, no se rechaza la hipotesis nula, por lo tanto, se puede decir que las varianzas de los grupos son iguales #Construyendo el intervalo de confianza sd(cogM) sd(cogW) sd(cogN) tamaños_muestrales<-c(275,606,5) varianzas<-c(sd(cogM)^2,sd(cogW)^2,sd(cogN)^2) varianza_combinada <- sum((tamaños_muestrales - 1) * varianzas) / sum(tamaños_muestrales - 3) varianza_combinada dif_medias<-mean(cogM)-mean(cogW)-mean(cogN) Error_al<-qt(0.975,883) Error_muest<-sqrt((varianza_combinada/275)+(varianza_combinada/606)+(varianza_combinada/5)) #Con una confianza del 95% # la cola inferior es col_inf<-dif_medias-Error_al*Error_muest #cola superior es col_sup<-dif_medias+Error_al*Error_muest #El intervalo quedaria de la siguiente forma #-68.42<u1-u2-u3<-56.76 #De esto y analizando los valores de cada grupo, se puede concluir que la media de puntaje de la prueba de empatia en el grupo de las mujeres es mayor que la media de puntaje de la prueba de empatia en el grupo de los hombres #En esto hay que tener en cuenta que la poblacion de participantes no binarios, es muy baja, y que este ejercicio es puramente academico, ya que los datos de las mujeres no proviene de una distribución normal ```