DEBER 17 DE MAYO

Author

Bethys Solano Moreno - Karen Tuz

Base de Datos de Encuesta Nacional de Salud y Nutricion 2018

El presente deber se lo ha realizado tomando en cuenta la Base de datos del INEC

Cargar las librerías necesarias

library(dplyr) # Para manipular los datos library(ggplot2) # Para crear gráficos library(“foreign”) #Cargas datos .dta library(“msm”) library(“car”) require(plotrix) library(“plotrix”) library(foreign)

#Cambiar directorio de trabajo

setwd(“C:/Users/pajv2/OneDrive/Escritorio/DEBER 17 DE MAYO”)

library(haven)
data <- read_dta("Data1_R.dta")
View(data)
head(data)
# A tibble: 6 × 50
  area       empleo          region   edad t_hijos nac_vivo_murieron mortinato_2
  <dbl+lbl>  <dbl+lbl>       <dbl+l> <dbl>   <dbl> <dbl+lbl>         <dbl+lbl>  
1 1 [Urbano] 1 [Trabajó al… 1 [Sie…    19       1 0 [No]            0 [No]     
2 1 [Urbano] 0 [No trabajó] 1 [Sie…    23       1 0 [No]            0 [No]     
3 1 [Urbano] 1 [Trabajó al… 1 [Sie…    38       5 0 [No]            0 [No]     
4 1 [Urbano] 0 [No trabajó] 1 [Sie…    18       1 0 [No]            0 [No]     
5 1 [Urbano] 0 [No trabajó] 1 [Sie…    21       1 0 [No]            0 [No]     
6 1 [Urbano] 1 [Trabajó al… 1 [Sie…    22       1 0 [No]            0 [No]     
# ℹ 43 more variables: depresion_pp <dbl+lbl>, intensidad_dpp <dbl+lbl>,
#   etnia <dbl+lbl>, f2_s2_216_1 <dbl+lbl>, f2_s2_216_2 <dbl>,
#   f2_s2_218_1_a <dbl+lbl>, tiempo_dpp <dbl+lbl>, f2_s5_504a_1 <dbl+lbl>,
#   f2_s5_504b_1 <dbl+lbl>, f2_s5_504c_1 <dbl+lbl>, f2_s5_504d_1 <dbl+lbl>,
#   f2_s5_504e_1 <dbl+lbl>, f2_s5_504f_1 <dbl+lbl>, f2_s5_504g_1 <dbl+lbl>,
#   f2_s5_504h_1 <dbl+lbl>, f2_s5_504i_1 <dbl+lbl>, f2_s5_504j_1 <dbl+lbl>,
#   f2_s5_504k_1 <dbl+lbl>, est_civil <dbl+lbl>, q_usted <dbl+lbl>, …
media <- mean(data$ingrl, na.rm = TRUE)  # Calcula la media
print (media)
[1] 162.6633

En este caso se analiza que el promedio del salario de las mujeres en el año 2018 fue de $162,66 ctvs el mismo que esta debajo del salario basico unificado en el Ecuador para el año 2018, esta brecha salaria de genero se debería a que muchas mujeres estaban en empleos informales, subempleadas o discriminadas salarialmente, lo que evidencia desigualdades en el acceso a empleos formales y bien remunerados.

desviacion <- sd(data$ingrl, na.rm = TRUE)  # Calcula la desviación estándar
print (desviacion)
[1] 329.8832

El resultado de de la desviación estandar es de $329.8832 que se ha obtenido de este ejemplo

n <- length(data$ingrl)  # Número de observaciones
print(n)
[1] 16451

El numero total de observaciones en este ejemplo es de 16451.

summary(data$ingrl)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    0.0     0.0     0.0   162.7   200.0  3000.0 
error_estandar <- desviacion / sqrt(n)
print(error_estandar)
[1] 2.571959

El error estandar es de 2.57

z <- qnorm(0.975)  # Z-score para un intervalo de confianza del 95%
z2<- qnorm(0.95)   # Z-score para un intervalo de confianza del 90%
z3<- qnorm(0.995)   # Z-score para un intervalo de confianza del 99%
margen_error <- z * error_estandar  # Margen de error
print(margen_error)
[1] 5.040948

El margen de error es de 5.04

IC_inferior <- media - margen_error
print(IC_inferior)
[1] 157.6223

El margen inferior de este ejemplo es de 157.62

IC_superior <- media + margen_error
print(IC_superior)
[1] 167.7042

El margen superior de este ejemplo es de 167.70

cat("El intervalo de confianza para la media de 'ingrl' es: [", IC_inferior, ",", IC_superior, "]\n")
El intervalo de confianza para la media de 'ingrl' es: [ 157.6223 , 167.7042 ]

El intervalo de confianza para la media de ingreso de las mujeres en Ecuador esta entre 157.62 y 167.70

intervalo95<-cbind(IC_inferior,media,IC_superior);intervalo95
     IC_inferior    media IC_superior
[1,]    157.6223 162.6633    167.7042

En este ejemplo nos indica que el intervalo inferior es 157.62 la media es 162.66 y el intervalo superior es del 167.70

colnames(intervalo95)<-c("IC_low","media","IC_high");intervalo95
       IC_low    media  IC_high
[1,] 157.6223 162.6633 167.7042

FORMA SIMPLIFICADA DE SACAR INTERVALOS

media_test <- t.test(data$ingrl, conf.level = 0.95)
print(media_test$conf.int)
[1] 157.6220 167.7046
attr(,"conf.level")
[1] 0.95

Plotear los Intervalos de Confianza en un gráfico

labels<-c("CI_95")
names(labels)<-labels
labelsre1<-round(c(media),2) 
labelsre2<-round(c(IC_inferior),2) 
labelsre3<-round(c(IC_superior),2)
names(labelsre1)<-labelsre1

xre1<-c(media)
y1<-(4)
lre1<-c(IC_inferior)
ure1<-c(IC_superior)
options(repos = c(CRAN = "https://cloud.r-project.org"))
install.packages("plotrix")
Installing package into 'C:/Users/pajv2/AppData/Local/R/win-library/4.5'
(as 'lib' is unspecified)
package 'plotrix' successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\pajv2\AppData\Local\Temp\Rtmp6RGTRg\downloaded_packages
library(plotrix)
plotCI(xre1,y1, ui=ure1,li=lre1,col="#898989",scol="#898989",
       err="x",
       axes=FALSE,   ## disable axes (including tick labels)
       pch=21,
       pt.bg=16,
       cex = 0.30,
       slty = 1,
       lwd=1,
       xlab="",
       ylab="",
       ylim=c(1,7),
       xlim=c(154,169),   ## suppress x-axis label
       main="Intervalo de Confianza para el Ingreso Promedio",
       cex.main=0.85,
       font.main = 1)
abline(v = xre1, col = "red",lty = 2)
#text(-200,"Media",col="blue")
axis(side=1,cex.axis=0.65)         ## add default y-axis (ticks+labels)
axis(side=2,at=4,  ## add custom x-axis
     labels= labels,cex.axis=0.30)
box(bty="l")         ## add box
text(xre1, y1+0.03, labelsre1, cex = 0.65, pos= 3)
text(lre1, y1+0.03, labelsre2, cex = 0.65, pos= 3)
text(ure1, y1+0.03, labelsre3, cex = 0.65, pos= 3)

En base a la encuesta de Datos de Encuesta Nacional de Salud y Nutricion 2018, este gráfico del plano carteciano nos demuestra que el Intervalo inferior es de 157.62 la media es de 162.66 y el Intervalo superior es de 167.70 se puede tener un alto grado de certeza de que el ingreso real de la población está entre 157.62 y 167.7

Intervalo de Confianza para la proporción de la variable ‘depresion_pp’ post parto

install.packages("haven")
Warning: package 'haven' is in use and will not be installed
library(haven)
p <- sum(as_factor(data$depresion_pp) == "Si", na.rm = TRUE) / sum(!is.na(data$depresion_pp))
print(p)
[1] 0.2202298

De acuerdo a la encuesta Nacional de Salud y Nutricion 2018, En la muestra del caso de las mujeres ecuatorianas en el 2018 el 22.02 % sufrio de depresión posparto y la diferencia que es el 77.98% no sufrio de depreción posparto.

n <- length(data$depresion_pp)
print(n)
[1] 16451

Calcular el error estándar

error_estandarp <- sqrt((p * (1 - p)) / n)
print(error_estandarp)
[1] 0.003230912

El error estandar de la proporción de las mujeres ecuatorianas con depresión posparto es de 0.0032

Calcular el margen de error

margen_errorp <- z * error_estandarp
print(margen_errorp)
[1] 0.006332472

El margen de error de la proporción de las mujeres ecuatorianas con depresión posparto es de 0.0063

Calcular los límites del intervalo de confianza

límites del intervalo inferior

IC_inferiorp <- p - margen_errorp
print(IC_inferiorp)
[1] 0.2138973
IC_superiorp <- p + margen_errorp
print(IC_superiorp)
[1] 0.2265622

límites del intervalo superior

IC_superiorp <- p + margen_errorp
print(IC_superiorp)
[1] 0.2265622
cat("El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [", IC_inferiorp, ",", IC_superiorp, "]")
El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [ 0.2138973 , 0.2265622 ]
intervalo95p<-cbind(IC_inferiorp,p,IC_superiorp);intervalo95p #Para transformar a matriz
     IC_inferiorp         p IC_superiorp
[1,]    0.2138973 0.2202298    0.2265622
colnames(intervalo95p)<-c("IC_low","p","IC_high");intervalo95p #Para cambiar nombres más cortos de columnas
        IC_low         p   IC_high
[1,] 0.2138973 0.2202298 0.2265622

*Una forma más simplificada de calcular un intervalo de confianza para proporciones

library(haven)
depresion_factor <- as_factor(data$depresion_pp)

prop_test <- prop.test(
  sum(depresion_factor == "Si", na.rm = TRUE),  # éxitos
  sum(!is.na(depresion_factor)),                # total válido
  conf.level = 0.95
)
print(prop_test$conf.int)
[1] 0.2139329 0.2266579
attr(,"conf.level")
[1] 0.95

Prueba de hipótesis de Medias

Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’

*H0: El ingreso promedio poblacional es igual a $450

*HA: El ingreso promedio poblacional es diferente a $450

Realizar una prueba t para una sola muestra

t_prueba <- t.test(data$ingrl, mu = 450, conf.level = 0.95)
print(t_prueba)

    One Sample t-test

data:  data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 450
95 percent confidence interval:
 157.6220 167.7046
sample estimates:
mean of x 
 162.6633 

Análisis: p valor significativo, por lo tanto, rechazo la hipótesis nula y no rechazo la hipótesis alternativa, es decir acepto la hipótesis alternativa, dado que el ingreso promedio de las mujeres de Ecuador es de 162.66

Si el valor p es menor a 0.05, rechazamos la hipótesis nula

if (t_prueba$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es igual a 450.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.

Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’

H0: El ingreso promedio poblacional es mayor e igual a $450*

HA: El ingreso promedio poblacional es menor a $450

Recordar que la HA nunca contiene los signos “=” , “≤” o “≥”.

t_prueba2 <- t.test(data$ingrl, mu = 450, alternative = "less", conf.level = 0.95)
print(t_prueba2)

    One Sample t-test

data:  data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is less than 450
95 percent confidence interval:
    -Inf 166.894
sample estimates:
mean of x 
 162.6633 

p valor significativo, por lo tanto, rechazo la hipótesis nula y no rechazo la hipótesis alternativa, es decir que con un nivel de confianza del 0.95 se puede determinar que la media de ingresos es menor a 450

Interpretar los resultados:

Si el valor p es menor a 0.05, rechazamos la hipótesis nula

if (t_prueba$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es igual a 450.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.

Prueba de hipótesis de proporciones

Supongamos que queremos realizar una prueba de hipótesis para proporción de ‘depresion_pp’

H0: La proporción poblacional es igual a 0.10

HA: La proporción poblacional es diferente a 0.10 Recordar que la

HA nunca contiene los signos “=” , “≤” o “≥”.

library(haven)
depresion <- as_factor(data$depresion_pp)
prop_test <- prop.test(
  sum(depresion == "Si", na.rm = TRUE),              # cantidad de "Si"
  sum(!is.na(depresion)),                            # total válido
  p = 0.10,                                          # proporción esperada
  conf.level = 0.95
)
print(prop_test)

    1-sample proportions test with continuity correction

data:  sum(depresion == "Si", na.rm = TRUE) out of sum(!is.na(depresion)), null probability 0.1
X-squared = 2640.9, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.1
95 percent confidence interval:
 0.2139329 0.2266579
sample estimates:
        p 
0.2202298 

Análisis: Dado que, p.value es estadisticamente significativo tengo evidencia significativa para rechazar la hipótesis alternativa, es decir, que la proporcion de mujeres con depresión posparto es diferente de 0.10 y en este caso la proporcion es de 0.22

if (prop_test$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es igual a 0.10.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.

REVISIÓN DE LITERATURA

BRECHA SALARIAL

Revisado este articúlo (Zielińska et al. 2024) trata sobre el estudio exploratorio se basó en dos preguntas de investigación: ¿Por qué cambian de trabajo las mujeres? ¿Qué buscan las mujeres en un nuevo entorno laboral? Para realizar este estudio, se elaboró ​​un cuestionario en línea con preguntas abiertas. Las participantes fueron mujeres que solicitaron un puesto administrativo en Brasil, México, Polonia, Portugal y el Estado de Palestina. Las respuestas de 363 encuestadas se analizaron mediante el software Nvivo.

El estudio revela que las decisiones laborales de las mujeres están profundamente influenciadas por una combinación de desarrollo personal, bienestar emocional y condiciones estructurales en el trabajo. Además, muestra que las mujeres valoran tanto el progreso profesional como un entorno respetuoso y un liderazgo empático.

A diferencia de este estudio realizado en mujeres que solicitaron un puesto administrativo en Brasil, México, Polonia, Portugal y el Estado de Palestina en Ecuador las brechas salariales de deben a la falta de oportunidades laborales al genero fenemino, lo que ocasiona que la mayoría de las s mujeres ecuatorianas tengan un promedio del salario el año 2018 de $162,66 ctvs el mismo que esta debajo del salario basico unificado en el Ecuador para el año 2018, esta brecha salaria de genero se debería a que muchas mujeres estaban en empleos informales, subempleadas o discriminadas salarialmente, lo que evidencia desigualdades en el acceso a empleos formales y bien remunerados.(Zielińska et al. 2024)

DEPRESIÓN POSPARTO

De acuerdo a este articulo(Høgh et al. 2025)Identificamos tres temas clave. 1) La biología como factor contribuyente a la depresión posparto. Solo unas pocas mujeres consideraron que la depresión posparto podría estar relacionada con la sensibilidad a los cambios hormonales. 2) El papel de los eventos externos en la comprensión de la depresión posparto. La mayoría de las mujeres percibieron su depresión posparto como desencadenada principalmente por factores externos, más que por factores biológicos. 3) La ambigua posibilidad de realizar pruebas de marcadores genómicos de riesgo para la depresión posparto. Algunas mujeres consideraron que las pruebas de marcadores genómicos de riesgo podrían prevenir la depresión posparto y reducir el estigma. Sin embargo, al mismo tiempo, se percibía que conocer su riesgo podría inducir síntomas depresivos, mientras que en Ecuador estadisticamente significativo se evidencia que la proporcion de mujeres con depresión posparto es diferente de 0.10 y en este caso la proporcion es de 0.22

##Referencias

References

Høgh, Stinne, Hanne K. Hegaard, Kristina M. Renault, Mette N. Svendsen, Laura E. Navne, and Vibe G. Frokjaer. 2025. “Womens Perceptions of Biological Causes and Potentials of Genomic Risk Markers in Postpartum Depression: A Qualitative Study.” Sexual & Reproductive Healthcare 43 (March): 101057. https://doi.org/10.1016/j.srhc.2024.101057.
Zielińska, Agnieszka, María Ana Montes de Oca Ramirez, Enas Hosni Dahadha, and Ksenia Usanova. 2024. “Re-Visiting Womens Work Motivations and Career Needs: International Evidence from the Perspective of Self-Determination Theory.” Gender in Management: An International Journal 40 (3): 505–25. https://doi.org/10.1108/gm-01-2024-0029.