Tarea

Author

Liliana Romero

Encuesta Nacional de Salud y Nutrición 2018

El presente informe se basa en datos de la Encuesta Nacional de Salud y Nutrición 2018 (ENSA) proporcionados por el INEC. El objetivo principal es analizar los ingresos laborales de las mujeres ecuatorianas y contrastarlos con el Salario Básico Unificado (SBU) vigente durante ese año. A través del análisis estadístico básico, se busca visibilizar las inequidades salariales existentes y comprender mejor su magnitud.

Cargar las librerías necesarias

library(dplyr)   # Para manipular los datos

Adjuntando el paquete: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
library(ggplot2) # Para crear gráficos
library("foreign") #Cargas datos .dta
library("msm")
library("car")
Cargando paquete requerido: carData

Adjuntando el paquete: 'car'
The following object is masked from 'package:dplyr':

    recode
require(plotrix)
Cargando paquete requerido: plotrix
library("plotrix")

Setear directorio de trabajo

setwd(“C:/Users/LILIANA/Desktop/Tarea 2”)

Leer los datos desde un archivo .dta

data <- read.dta("Data1_R.dta")
library(haven)
data <- read_dta("Data1_R.dta")
View(data)

Verificar las primeras filas de datos

head(data)
# A tibble: 6 × 50
  area       empleo          region   edad t_hijos nac_vivo_murieron mortinato_2
  <dbl+lbl>  <dbl+lbl>       <dbl+l> <dbl>   <dbl> <dbl+lbl>         <dbl+lbl>  
1 1 [Urbano] 1 [Trabajó al… 1 [Sie…    19       1 0 [No]            0 [No]     
2 1 [Urbano] 0 [No trabajó] 1 [Sie…    23       1 0 [No]            0 [No]     
3 1 [Urbano] 1 [Trabajó al… 1 [Sie…    38       5 0 [No]            0 [No]     
4 1 [Urbano] 0 [No trabajó] 1 [Sie…    18       1 0 [No]            0 [No]     
5 1 [Urbano] 0 [No trabajó] 1 [Sie…    21       1 0 [No]            0 [No]     
6 1 [Urbano] 1 [Trabajó al… 1 [Sie…    22       1 0 [No]            0 [No]     
# ℹ 43 more variables: depresion_pp <dbl+lbl>, intensidad_dpp <dbl+lbl>,
#   etnia <dbl+lbl>, f2_s2_216_1 <dbl+lbl>, f2_s2_216_2 <dbl>,
#   f2_s2_218_1_a <dbl+lbl>, tiempo_dpp <dbl+lbl>, f2_s5_504a_1 <dbl+lbl>,
#   f2_s5_504b_1 <dbl+lbl>, f2_s5_504c_1 <dbl+lbl>, f2_s5_504d_1 <dbl+lbl>,
#   f2_s5_504e_1 <dbl+lbl>, f2_s5_504f_1 <dbl+lbl>, f2_s5_504g_1 <dbl+lbl>,
#   f2_s5_504h_1 <dbl+lbl>, f2_s5_504i_1 <dbl+lbl>, f2_s5_504j_1 <dbl+lbl>,
#   f2_s5_504k_1 <dbl+lbl>, est_civil <dbl+lbl>, q_usted <dbl+lbl>, …
media <- mean(data$ingrl, na.rm = TRUE)  # Calcula la media
print(media)
[1] 162.6633
desviacion <- sd(data$ingrl, na.rm = TRUE)  # Calcula la desviación estándar
print(desviacion)
[1] 329.8832
n <- length(data$ingrl)  # Número de observaciones
summary(data$ingrl)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    0.0     0.0     0.0   162.7   200.0  3000.0 
n <- length(data$ingrl)  # Número de observaciones
print(n)
[1] 16451
# Calcular el error estándar
error_estandar <- desviacion / sqrt(n)
print(error_estandar)
[1] 2.571959

Análisis: El promedio de ingresos mensuales de las mujeres en 2018 fue de aproximadamente $162.66, valor que se encuentra significativamente por debajo del Salario Básico Unificado (SBU) de ese año, que eres $386.

z <- qnorm(0.975)  # Z-score para un intervalo de confianza del 95%
z2<- qnorm(0.95)   # Z-score para un intervalo de confianza del 90%
z3<- qnorm(0.995)   # Z-score para un intervalo de confianza del 99%
margen_error <- z * error_estandar  # Margen de error
print(margen_error)
[1] 5.040948
IC_inferior <- media - margen_error
print(IC_inferior)
[1] 157.6223
IC_superior <- media + margen_error
print(IC_superior)
[1] 167.7042

Mostrar el intervalo de confianza cat es útil para imprimir mensajes de texto personalizados, combinando variables y texto

cat("El intervalo de confianza para la media de 'ingrl' es: [", IC_inferior, ",", IC_superior, "]\n")
El intervalo de confianza para la media de 'ingrl' es: [ 157.6223 , 167.7042 ]

cbind imprime texto en columnas

intervalo95<-cbind(IC_inferior,media,IC_superior);intervalo95 #Para transformar a matriz
     IC_inferior    media IC_superior
[1,]    157.6223 162.6633    167.7042
print(intervalo95)
     IC_inferior    media IC_superior
[1,]    157.6223 162.6633    167.7042
colnames(intervalo95)<-c("IC_low","media","IC_high");intervalo95 #Para cambiar nombres más cortos de columnas
       IC_low    media  IC_high
[1,] 157.6223 162.6633 167.7042

Forma simplificada de encontrar intervalos

media_test <- t.test(data$ingrl, conf.level = 0.95)
print(media_test$conf.int)
[1] 157.6220 167.7046
attr(,"conf.level")
[1] 0.95

Plotear los Intervalos de Confianza en un gráfico

labels<-c("CI_95")
names(labels)<-labels

Round, nos sirve para redondear

labelsre1<-round(c(media),2) 
labelsre2<-round(c(IC_inferior),2) 
labelsre3<-round(c(IC_superior),2) 
names(labelsre1)<-labelsre1

xre1<-c(media)
y1<-(4)
lre1<-c(IC_inferior)
ure1<-c(IC_superior)
options(repos = c(CRAN = "https://cloud.r-project.org"))
install.packages("plotrix")
Warning: package 'plotrix' is in use and will not be installed
library(plotrix)
plotCI(xre1,y1, ui=ure1,li=lre1,col="#898989",scol="#898989",
       err="x",
       axes=FALSE,   ## disable axes (including tick labels)
       pch=21,
       pt.bg=16,
       cex = 0.30,
       slty = 1,
       lwd=1,
       xlab="",
       ylab="",
       ylim=c(1,7),
       xlim=c(154,169),   ## suppress x-axis label
       main="Intervalo de Confianza para el Ingreso Promedio",
       cex.main=0.85,
       font.main = 1)
abline(v = xre1, col = "red",lty = 2)
#text(-200,"Media",col="blue")
axis(side=1,cex.axis=0.65)         ## add default y-axis (ticks+labels)
axis(side=2,at=4,  ## add custom x-axis
     labels= labels,cex.axis=0.30)
box(bty="l")         ## add box
text(xre1, y1+0.03, labelsre1, cex = 0.65, pos= 3)
text(lre1, y1+0.03, labelsre2, cex = 0.65, pos= 3)
text(ure1, y1+0.03, labelsre3, cex = 0.65, pos= 3)

Análisis: La gráfica presentada muestra el intervalo de confianza al 95% para el ingreso promedio mensual de las mujeres ecuatorianas en 2018. El valor promedio de $162.66 se encuentra muy por debajo del Salario Básico Unificado de ese año ($386), evidenciando una brecha salarial significativa. Este resultado es consistente con los valores extremos del intervalo ($157.62 y $167.70), los cuales tampoco alcanzan el mínimo legal, lo que resalta una situación de inequidad estructural en el mercado laboral femenino.

##Intervalo de Confianza para la proporción de la variable ‘depresion_pp’ post parto

install.packages("haven")
Warning: package 'haven' is in use and will not be installed
library(haven)
p <- sum(as_factor(data$depresion_pp) == "Si", na.rm = TRUE) / sum(!is.na(data$depresion_pp))
print(p)
[1] 0.2202298

En el caso de la muestra de las mujeres ecuatorionas han sufrido de depresión posparto 22%, y el 78% no ha sufrido.

n <- length(data$depresion_pp) #Tamaño de muestra
print(n)
[1] 16451

Calcular el error estándar

error_estandarp <- sqrt((p * (1 - p)) / n)
print(error_estandarp)
[1] 0.003230912

El error estandar de las mujeres ecuatorianas con depresión postparto es de 0.032

Calcular el margen de error

margen_errorp <- z * error_estandarp
print(margen_errorp)
[1] 0.006332472

El margen de error de la proporción de las mujeres con depresión postparto en Ecuador es de 0.006.

Calcular los límites del intervalo de confianza inferior

IC_inferiorp <- p - margen_errorp
print(IC_inferiorp)
[1] 0.2138973

Calcular los límites del intervalo de confianza superior

IC_superiorp <- p + margen_errorp
print(IC_superiorp)
[1] 0.2265622

Mostrar el intervalo de confianza para proporciones

cat("El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [", IC_inferiorp, ",", IC_superiorp, "]")
El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [ 0.2138973 , 0.2265622 ]
intervalo95p<-cbind(IC_inferiorp,p,IC_superiorp);intervalo95p #Para transformar a matriz
     IC_inferiorp         p IC_superiorp
[1,]    0.2138973 0.2202298    0.2265622
colnames(intervalo95p)<-c("IC_low","p","IC_high");intervalo95p #Para cambiar nombres más cortos de columnas
        IC_low         p   IC_high
[1,] 0.2138973 0.2202298 0.2265622

Una forma más simplificada de calcular un intervalo de confianza para proporciones

library(haven)
depresion_factor <- as_factor(data$depresion_pp)

prop_test <- prop.test(
  sum(depresion_factor == "Si", na.rm = TRUE),  # éxitos
  sum(!is.na(depresion_factor)),                # total válido
  conf.level = 0.95
)
print(prop_test$conf.int)
[1] 0.2139329 0.2266579
attr(,"conf.level")
[1] 0.95

Prueba de hipótesis de Medias

Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’

H0: El ingreso promedio poblacional es igual a $450

HA: El ingreso promedio poblacional es diferente a $450

Recordar que la HA nunca contiene los signos “=” , “≤” o “≥”. Realizar una prueba t para una sola muestra

t_prueba <- t.test(data$ingrl, mu = 450, conf.level = 0.95)
print(t_prueba)

    One Sample t-test

data:  data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 450
95 percent confidence interval:
 157.6220 167.7046
sample estimates:
mean of x 
 162.6633 

Análisis: valor significativo, por lo tanto, rechazo la hipótesis nula y no rechazo la hipótesis alternativa, es decir acepto la hipótesis alternativa. Dado a que el ingreso de mujeres en Ecuador es de $162.66, es decir menos del promedio poblacional.

Si el valor p es menor a 0.05, rechazamos la hipótesis nula

if (t_prueba$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es igual a 450.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.

Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’

H0: El ingreso promedio poblacional es mayor e igual a $450 HA: El ingreso promedio poblacional es menor a $450 Recordar que la HA nunca contiene los signos “=” , “≤” o “≥”.

t_prueba2 <- t.test(data$ingrl, mu = 450, alternative = "less", conf.level = 0.95)
print(t_prueba2)

    One Sample t-test

data:  data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is less than 450
95 percent confidence interval:
    -Inf 166.894
sample estimates:
mean of x 
 162.6633 

Análisis: p valor significativo, por lo tanto, rechazo la hipótesis nula y no rechazo la hipótesis alternativa.

Interpretar los resultados: Si el valor p es menor a 0.05, rechazamos la hipótesis nula.

if (t_prueba$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es menor a 450.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es mayor e igual a 450.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es menor a 450.

Prueba de hipótesis de proporciones

Supongamos que queremos realizar una prueba de hipótesis para proporción de ‘depresion_pp’

H0: La proporción poblacional de mujeres con depresión post parto es igual a 0.10

HA: La proporción poblacional de mujeres con depresión post parto es diferente a 0.10

Recordar que la HA nunca contiene los signos “=” , “≤” o “≥”.

Realizamos la prueba para saber si la proporción es diferente a 0.10

library(haven)
depresion <- as_factor(data$depresion_pp)
prop_test <- prop.test(
  sum(depresion == "Si", na.rm = TRUE),              # cantidad de "Si"
  sum(!is.na(depresion)),                            # total válido
  p = 0.10,                                          # proporción esperada
  conf.level = 0.95
)
print(prop_test)

    1-sample proportions test with continuity correction

data:  sum(depresion == "Si", na.rm = TRUE) out of sum(!is.na(depresion)), null probability 0.1
X-squared = 2640.9, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.1
95 percent confidence interval:
 0.2139329 0.2266579
sample estimates:
        p 
0.2202298 

Análisis: Dado a que el p-value es estadíticamente significativo, tengo evidencia sufiente para rechazar la hipótesis alternativa H0, es decir que, la proporción de mujeres con depresión postparto es diferente a 0.10, en este caso es de 0.22.

if (prop_test$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es igual a 0.10.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.

Revisión de literatura

De acuerdo con (Linthon-Delgado and Méndez-Heras 2021) en su investigación afirma lo siguiente: La brecha salarial de género es de 35.6 punto porcentuales. Las dotaciones de las mujeres (escolaridad y experiencia laboral) contribuyen a reducir la brecha mientras que los factores no observados (discriminación) la incrementan.

el autor (Herrera Dutan, Carriel Alvarez, and García Pacheco 2022) en su investigación menciona que al analizar los factores de riesgo mayor impacto y relevancia en la depresión post parto en Ecuador se determina que la depresión en la etapa post parto ha ido en aumento en los últimos años, al igual que los factores de riesgo de mayor prevalencia, destacando; el estado civil, nivel socio económico , y antecedentes de depresión previos.

Conclusión

El análisis realizado revela una brecha significativa entre los ingresos laborales promedio de las mujeres y el Salario Básico Unificado en Ecuador para el año 2018. A pesar de que muchas mujeres participan activamente en el mercado laboral, sus remuneraciones siguen siendo considerablemente bajas. Este resultado debe considerarse una alerta sobre la necesidad de implementar políticas públicas efectivas que promuevan la equidad salarial y el empoderamiento económico femenino.

Referencias

Herrera Dutan, Edgar Vinicio, María Gabriela Carriel Alvarez, and Andrea Verónica García Pacheco. 2022. “Factores de Riesgo Relacionados Con La Depresión Postparto.” Revista Vive 5 (15): 679–87. https://doi.org/10.33996/revistavive.v5i15.179.
Linthon-Delgado, Diego Emilio, and Lizethe Berenice Méndez-Heras. 2021. “Descomposición de La Brecha Salarial de Género En El Ecuador.” Revista Mexicana de Economía y Finanzas 17 (1): 1–25. https://doi.org/10.21919/remef.v17i1.706.