Deber 2

Author

Leslie Avila

Encuesta Nacional de Salud y Nutrición 2018

El presente trabajo se ejecuto con los datos del INEC, donde se pueden evidenciar una serie de variables las caules permitiran realizar los analisis correspondientes.

Cargar las librerías necesarias

library(dplyr) # Para manipular los datos library(ggplot2) # Para crear gráficos library(“foreign”) #Cargas datos .dta library(“msm”) library(“car”) require(plotrix) library(“plotrix”)

#Directorio de trabajo setwd(“C:/Users/Usuario iTC/Desktop/MAESTRIA/ANALYTICS/clase2/clase 11 mayo”)

data <- read_dta("Data1_R.dta")

Leer datos

library(foreign)
library(haven)
data <- read_dta("Data1_R.dta")
View(data)

Verificar filas de los datos de la base a seleccionada

head(data)
# A tibble: 6 × 50
  area       empleo          region   edad t_hijos nac_vivo_murieron mortinato_2
  <dbl+lbl>  <dbl+lbl>       <dbl+l> <dbl>   <dbl> <dbl+lbl>         <dbl+lbl>  
1 1 [Urbano] 1 [Trabajó al… 1 [Sie…    19       1 0 [No]            0 [No]     
2 1 [Urbano] 0 [No trabajó] 1 [Sie…    23       1 0 [No]            0 [No]     
3 1 [Urbano] 1 [Trabajó al… 1 [Sie…    38       5 0 [No]            0 [No]     
4 1 [Urbano] 0 [No trabajó] 1 [Sie…    18       1 0 [No]            0 [No]     
5 1 [Urbano] 0 [No trabajó] 1 [Sie…    21       1 0 [No]            0 [No]     
6 1 [Urbano] 1 [Trabajó al… 1 [Sie…    22       1 0 [No]            0 [No]     
# ℹ 43 more variables: depresion_pp <dbl+lbl>, intensidad_dpp <dbl+lbl>,
#   etnia <dbl+lbl>, f2_s2_216_1 <dbl+lbl>, f2_s2_216_2 <dbl>,
#   f2_s2_218_1_a <dbl+lbl>, tiempo_dpp <dbl+lbl>, f2_s5_504a_1 <dbl+lbl>,
#   f2_s5_504b_1 <dbl+lbl>, f2_s5_504c_1 <dbl+lbl>, f2_s5_504d_1 <dbl+lbl>,
#   f2_s5_504e_1 <dbl+lbl>, f2_s5_504f_1 <dbl+lbl>, f2_s5_504g_1 <dbl+lbl>,
#   f2_s5_504h_1 <dbl+lbl>, f2_s5_504i_1 <dbl+lbl>, f2_s5_504j_1 <dbl+lbl>,
#   f2_s5_504k_1 <dbl+lbl>, est_civil <dbl+lbl>, q_usted <dbl+lbl>, …

Calcular la media y la desviación estándar de la variable ‘ingrl’

media <- mean(data$ingrl, na.rm = TRUE)
print(media)
[1] 162.6633

En el año 2018, las mujeres en Ecuador percibían un ingreso promedio de 162,66USD cifra considerablemente inferior al salario básico unificado vigente en ese año, que era de $386. Esta diferencia refleja una brecha salarial de género, entendida como la desigualdad en las remuneraciones entre hombres y mujeres que desempeñan trabajos de igual valor. Según Cruz y Rivera (2024), esta disparidad hace referencia a factores estructurales, entre ellos la persistencia de roles de género tradicionales, la escasa participación femenina en cargos directivos y las limitadas oportunidades de formación y desarrollo profesional para las mujeres. # Calculo de la desviación estándar

desviacion <- sd(data$ingrl, na.rm = TRUE)
print (desviacion)
[1] 329.8832

Tomando como referencia la Encuesta Nacional de Salud y Nutrición con 16451 observaciones, la desviación standar es de 329.88 un valor significativo alto por el número de observaciones. # Número de observaciones

n <- length(data$ingrl) 
summary(data$ingrl)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    0.0     0.0     0.0   162.7   200.0  3000.0 
n <- length(data$ingrl) 
print (n)
[1] 16451

Calcular el error estándar

error_estandar <- desviacion / sqrt(n)
print (error_estandar)
[1] 2.571959

El error estandar identificado es de 2.57 un valor relativamente bajo, el cual se explica por el gran tamaño muestral, lo que contribuye a la confiabilidad estadística de las estimaciones.

Calcular el intervalo de confianza al 95%

z <- qnorm(0.975)  # Z-score para un intervalo de confianza del 95%
z2<- qnorm(0.95)   # Z-score para un intervalo de confianza del 90%
z3<- qnorm(0.995)   # Z-score para un intervalo de confianza del 99%

Margen de error

margen_error <- z * error_estandar
print (margen_error)
[1] 5.040948

El margen de error de obtenido apartir de la base analizada es de 5.04 para un intervalo de confianza del 95%. Esto implica que, con un 95% de confianza, el ingreso medio poblacional se encuentra dentro de un rango de ±$5.04 alrededor del promedio muestral.

Intervalo de confianza

IC_inferior <- media - margen_error
print(IC_inferior)
[1] 157.6223

El limite inferior es de 157.62 valor calculado de la media 162.66 menos el margen de error de 5.40

IC_superior <- media + margen_error
print (IC_superior)
[1] 167.7042

El limite superior es de 167.70 valor calculado de la media 162.66 más el margen de error de 5.40

Intervalo de confianza

cat("El intervalo de confianza para la media de 'ingrl' es: [", IC_inferior, ",", IC_superior, "]\n")
El intervalo de confianza para la media de 'ingrl' es: [ 157.6223 , 167.7042 ]

El intervalo de confianza para la media de ‘ingrl’ es: [ 157.6223 , 167.7042 ]

cbind imprime texxto en columnas

intervalo95<-cbind(IC_inferior,media,IC_superior);intervalo95
     IC_inferior    media IC_superior
[1,]    157.6223 162.6633    167.7042

Estos valores nos permiten conocer el pto estiamdo de 162.66; el limite de confianza inferior de 157.62; y el limite de confianza superior de 167.70

Otra forma de impirmir los resultados

colnames(intervalo95)<-c("IC_low","media","IC_high");intervalo95
       IC_low    media  IC_high
[1,] 157.6223 162.6633 167.7042

Los resultados no varian, lo unico que cambia es el enunciado de presentarlos.

Forma simplificada de encontrar intervalos

media_test <- t.test(data$ingrl, conf.level = 0.95)
print(media_test$conf.int)
[1] 157.6220 167.7046
attr(,"conf.level")
[1] 0.95

Esta nueva formula permite obtener los resultados de una manera mas rapida y resumida ### Plotear los Intervalos de Confianza en un gráfico”

labels<-c("CI_95")
names(labels)<-labels

round es para redondear, es este caso dos digitos

labelsre1<-round(c(media),2) 
labelsre2<-round(c(IC_inferior),2) 
labelsre3<-round(c(IC_superior),2) 
names(labelsre1)<-labelsre1

xre1<-c(media)
y1<-(4)
lre1<-c(IC_inferior)
ure1<-c(IC_superior)

Presentacion de graficos

options(repos = c(CRAN = "https://cloud.r-project.org"))
install.packages("plotrix")
Installing package into 'C:/Users/Usuario iTC/AppData/Local/R/win-library/4.5'
(as 'lib' is unspecified)
package 'plotrix' successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\Usuario iTC\AppData\Local\Temp\RtmpuWV4VT\downloaded_packages
library(plotrix)
plotCI(xre1,y1, ui=ure1,li=lre1,col="#898989",scol="#898989",
       err="x",
       axes=FALSE,   ## disable axes (including tick labels)
       pch=21,
       pt.bg=16,
       cex = 0.30,
       slty = 1,
       lwd=1,
       xlab="",
       ylab="",
       ylim=c(1,7),
       xlim=c(154,169),   ## suppress x-axis label
       main="Intervalo de Confianza para el Ingreso Promedio",
       cex.main=0.85,
       font.main = 1)
abline(v = xre1, col = "purple",lty = 2)
#text(-200,"Media",col="blue")
axis(side=1,cex.axis=0.65)         ## add default y-axis (ticks+labels)
axis(side=2,at=4,  ## add custom x-axis
     labels= labels,cex.axis=0.30)
box(bty="l")         ## add box
text(xre1, y1+0.03, labelsre1, cex = 0.65, pos= 3)
text(lre1, y1+0.03, labelsre2, cex = 0.65, pos= 3)
text(ure1, y1+0.03, labelsre3, cex = 0.65, pos= 3)

El presente gráfico, basado en datos de la Encuesta Nacional de Salud y Nutrición 2018, muestra un intervalo de confianza cuyos límites se ubican en 157.62 (límite inferior) y 167.7 (límite superior), con una amplitud de 10.08 unidades. Esta distancia refleja el grado de precisión de la estimación de la media: a mayor tamaño muestral, el intervalo tiende a ser más estrecho, lo cual indica una mayor precisión en la estimación del valor poblacional.

Ejemplo 2: Intervalo de Confianza para la proporción de la variable ‘depresion_pp’ post parto

Calcular la proporción muestral p

install.packages("haven")
Warning: package 'haven' is in use and will not be installed
library(haven)
p <- sum(as_factor(data$depresion_pp) == "Si", na.rm = TRUE) / sum(!is.na(data$depresion_pp))
print(p)
[1] 0.2202298

Este valor indica que el 22% de las mujeres en Ecuador que dieron a luz en el año 2018 presentaron síntomas de depresión posparto, lo cual representa una proporción considerable. En contraste, el 77.98% de las mujeres experimentaron una recuperación emocional estable tras el parto. Estos resultados sugieren la necesidad de implementar estrategias de acompañamiento psicológico en los servicios de salud, con el fin de fortalecer el bienestar emocional de las madres y prevenir posibles complicaciones psicológicas asociadas al posparto.

Tamaño de la muestra

n <- length(data$depresion_pp)
print(n)
[1] 16451

Calcular el error estándar

error_estandarp <- sqrt((p * (1 - p)) / n)
print(error_estandarp)
[1] 0.003230912

Se observa que el error estándar de la variable correspondiente a las mujeres con depresión posparto en Ecuador, en el año 2018, es de 0.0032, un valor que indica un nivel bajo de variabilidad en la estimación, lo que evidencia que la proporción estimada es bastante precisa y confiable dentro del contexto muestral analizado.

Calcular el margen de error

margen_errorp <- z * error_estandarp
print(margen_errorp)
[1] 0.006332472

El margen de error de la estimación de la proporción de mujeres con depresión posparto en Ecuador durante el año 2018 es de 0.006 valor que refuerza la precisión y confiabilidad de la estimación.

Calcular los límites del intervalo de confianza

IC_inferiorp <- p - margen_errorp
print(IC_inferiorp)
[1] 0.2138973

El valor del limite inferior de la proporcion de las mujeres con depresion es de 0.21

IC_superiorp <- p + margen_errorp
print(IC_superiorp)
[1] 0.2265622

El valor del limite superior de la proporcion de las mujeres con depresion es de 0.22

Intervalo de confianza para proporciones

cat("El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [", IC_inferiorp, ",", IC_superiorp, "]")
El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [ 0.2138973 , 0.2265622 ]

El intervalo de confianza se encuentra entre un rango del 21% y del 23%

intervalo95p<-cbind(IC_inferiorp,p,IC_superiorp);intervalo95p
     IC_inferiorp         p IC_superiorp
[1,]    0.2138973 0.2202298    0.2265622

Estos resultados evidencia que el limite inferior es de 21%; la media de 0.22 y el limite superior del 23%

colnames(intervalo95p)<-c("IC_low","p","IC_high");intervalo95p #Para cambiar nombres más cortos de columnas
        IC_low         p   IC_high
[1,] 0.2138973 0.2202298 0.2265622

Se evidencian los mismos resultados de una manera mas simplificada pero precisa igual que las anteiores formular.

Forma más simplificada de calcular un intervalo de confianza para proporciones

library(haven)
depresion_factor <- as_factor(data$depresion_pp)

prop_test <- prop.test(
  sum(depresion_factor == "Si", na.rm = TRUE),  # éxitos
  sum(!is.na(depresion_factor)),                # total válido
  conf.level = 0.95
)
print(prop_test$conf.int)
[1] 0.2139329 0.2266579
attr(,"conf.level")
[1] 0.95

A partir de los datos obtenidos en la Encuesta Nacional de Salud y Nutrición 2018, se estima que cerca del 22.02% de las mujeres que tuvieron un parto en Ecuador experimentaron síntomas de depresión posparto. Esta cifra no solo resulta significativa desde el punto de vista de salud pública, sino que también se respalda con un intervalo de confianza del 95% entre 0.2139 y 0.2267, lo que refleja una estimación precisa y confiable.

Ejemplo 3: Prueba de hipótesis de Medias

Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’

H0: El ingreso promedio poblacional es igual a $450

HA: El ingreso promedio poblacional es diferente a $450

Realizar una prueba t para una sola muestra

t_prueba <- t.test(data$ingrl, mu = 450, conf.level = 0.95)
print(t_prueba)

    One Sample t-test

data:  data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 450
95 percent confidence interval:
 157.6220 167.7046
sample estimates:
mean of x 
 162.6633 

El valor obtenido en p-value es estadisticamente significativo por lo tanto, rechazo la hipótesis nula y no rechazo la hipótesis alternativa ; es decir acepto la hipotesis alternativa ya que el ingreso promedio de las mujeres en Ecuador es de 162.66

Interpretar los resultados:

if (t_prueba$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es igual a 450.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.

Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’

H0: El ingreso promedio poblacional es mayor e igual a $450

HA: El ingreso promedio poblacional es menor a $450 Recordar que la HA nunca contiene los signos “=” , “≤” o “≥”.

t_prueba2 <- t.test(data$ingrl, mu = 450, alternative = "less", conf.level = 0.95)
print(t_prueba2)

    One Sample t-test

data:  data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is less than 450
95 percent confidence interval:
    -Inf 166.894
sample estimates:
mean of x 
 162.6633 

El resultado evidencia que la media es menor a 450, rechazo la hipótesis nula y no rechazo la hipótesis alternativa

Interpretar los resultados:

if (t_prueba$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es menor a 450.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es mayor e igual a 450.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es menor a 450.

Ejemplo 4: Prueba de hipótesis de proporciones

Supongamos que queremos realizar una prueba de hipótesis para proporción de ‘depresion_pp’

H0: La proporción poblacional es igual a 0.10

HA: La proporción poblacional es diferente a 0.10 ### Realizamos la prueba para saber si la proporción es diferente a 0.10

library(haven)
depresion <- as_factor(data$depresion_pp)
prop_test <- prop.test(
  sum(depresion == "Si", na.rm = TRUE),              # cantidad de "Si"
  sum(!is.na(depresion)),                            # total válido
  p = 0.10,                                          # proporción esperada
  conf.level = 0.95
)
print(prop_test)

    1-sample proportions test with continuity correction

data:  sum(depresion == "Si", na.rm = TRUE) out of sum(!is.na(depresion)), null probability 0.1
X-squared = 2640.9, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.1
95 percent confidence interval:
 0.2139329 0.2266579
sample estimates:
        p 
0.2202298 

El resultado es estadisticamente significativo, y rechazamos la hipotesis alternativa, es decir la proporcion de las mujeres en Ecuador con depresion postparto es diferente a 0.10 ya que es de 0.22.

if (prop_test$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es igual a 0.10.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.

Estudios previos

De acuerdo al autor (Giménez et al. 2025) corrobora que la depresion posparto representa un período vulnerable para la salud mental de las madres y sugiere recomendaciones esenciales para asegurar una atención fluida entre los niveles asistenciales para abordar la salud mental posparto de manera efectiva.

Otro criterio relevante sobre la depresión posparto lo plantea (Martínez-Paredes and Jácome-Pérez 2019) quien sostiene que esta condición afecta a una proporción significativa de la población femenina. Su estudio se enfoca en identificar las principales causas asociadas, entre las cuales destacan factores de riesgo como el abuso sexual, el embarazo a edad temprana y la violencia intrafamiliar. El autor subraya que el diagnóstico temprano resulta fundamental, ya que permite reducir tanto las conductas de riesgo como los trastornos del neurodesarrollo fetal y mejorar los desenlaces obstétricos.

Referencia

Giménez, Yolanda, Francesc Fatjó, Aida Mallorquí, Alba Sanvicente, Francesc Figueras, and Angela Arranz. 2025. “Progresión posparto de los niveles de ansiedad y depresión en madres de recién nacidos prematuros.” Atención Primaria 57 (3): 103085. https://doi.org/10.1016/j.aprim.2024.103085.
Martínez-Paredes, Jhon Freddy, and Nathalia Jácome-Pérez. 2019. “Depresión en el embarazo.” Revista Colombiana de Psiquiatría 48 (1): 58–65. https://doi.org/10.1016/j.rcp.2017.07.003.