data <- read_dta("Data1_R.dta")Deber 2
Encuesta Nacional de Salud y Nutrición 2018
El presente trabajo se ejecuto con los datos del INEC, donde se pueden evidenciar una serie de variables las caules permitiran realizar los analisis correspondientes.
Cargar las librerías necesarias
library(dplyr) # Para manipular los datos library(ggplot2) # Para crear gráficos library(“foreign”) #Cargas datos .dta library(“msm”) library(“car”) require(plotrix) library(“plotrix”)
#Directorio de trabajo setwd(“C:/Users/Usuario iTC/Desktop/MAESTRIA/ANALYTICS/clase2/clase 11 mayo”)
Leer datos
library(foreign)
library(haven)
data <- read_dta("Data1_R.dta")
View(data)Verificar filas de los datos de la base a seleccionada
head(data)# A tibble: 6 × 50
area empleo region edad t_hijos nac_vivo_murieron mortinato_2
<dbl+lbl> <dbl+lbl> <dbl+l> <dbl> <dbl> <dbl+lbl> <dbl+lbl>
1 1 [Urbano] 1 [Trabajó al… 1 [Sie… 19 1 0 [No] 0 [No]
2 1 [Urbano] 0 [No trabajó] 1 [Sie… 23 1 0 [No] 0 [No]
3 1 [Urbano] 1 [Trabajó al… 1 [Sie… 38 5 0 [No] 0 [No]
4 1 [Urbano] 0 [No trabajó] 1 [Sie… 18 1 0 [No] 0 [No]
5 1 [Urbano] 0 [No trabajó] 1 [Sie… 21 1 0 [No] 0 [No]
6 1 [Urbano] 1 [Trabajó al… 1 [Sie… 22 1 0 [No] 0 [No]
# ℹ 43 more variables: depresion_pp <dbl+lbl>, intensidad_dpp <dbl+lbl>,
# etnia <dbl+lbl>, f2_s2_216_1 <dbl+lbl>, f2_s2_216_2 <dbl>,
# f2_s2_218_1_a <dbl+lbl>, tiempo_dpp <dbl+lbl>, f2_s5_504a_1 <dbl+lbl>,
# f2_s5_504b_1 <dbl+lbl>, f2_s5_504c_1 <dbl+lbl>, f2_s5_504d_1 <dbl+lbl>,
# f2_s5_504e_1 <dbl+lbl>, f2_s5_504f_1 <dbl+lbl>, f2_s5_504g_1 <dbl+lbl>,
# f2_s5_504h_1 <dbl+lbl>, f2_s5_504i_1 <dbl+lbl>, f2_s5_504j_1 <dbl+lbl>,
# f2_s5_504k_1 <dbl+lbl>, est_civil <dbl+lbl>, q_usted <dbl+lbl>, …
Calcular la media y la desviación estándar de la variable ‘ingrl’
media <- mean(data$ingrl, na.rm = TRUE)
print(media)[1] 162.6633
En el año 2018, las mujeres en Ecuador percibían un ingreso promedio de 162,66USD cifra considerablemente inferior al salario básico unificado vigente en ese año, que era de $386. Esta diferencia refleja una brecha salarial de género, entendida como la desigualdad en las remuneraciones entre hombres y mujeres que desempeñan trabajos de igual valor. Según Cruz y Rivera (2024), esta disparidad hace referencia a factores estructurales, entre ellos la persistencia de roles de género tradicionales, la escasa participación femenina en cargos directivos y las limitadas oportunidades de formación y desarrollo profesional para las mujeres. # Calculo de la desviación estándar
desviacion <- sd(data$ingrl, na.rm = TRUE)
print (desviacion)[1] 329.8832
Tomando como referencia la Encuesta Nacional de Salud y Nutrición con 16451 observaciones, la desviación standar es de 329.88 un valor significativo alto por el número de observaciones. # Número de observaciones
n <- length(data$ingrl)
summary(data$ingrl) Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0 0.0 0.0 162.7 200.0 3000.0
n <- length(data$ingrl)
print (n)[1] 16451
Calcular el error estándar
error_estandar <- desviacion / sqrt(n)
print (error_estandar)[1] 2.571959
El error estandar identificado es de 2.57 un valor relativamente bajo, el cual se explica por el gran tamaño muestral, lo que contribuye a la confiabilidad estadística de las estimaciones.
Calcular el intervalo de confianza al 95%
z <- qnorm(0.975) # Z-score para un intervalo de confianza del 95%
z2<- qnorm(0.95) # Z-score para un intervalo de confianza del 90%
z3<- qnorm(0.995) # Z-score para un intervalo de confianza del 99%Margen de error
margen_error <- z * error_estandar
print (margen_error)[1] 5.040948
El margen de error de obtenido apartir de la base analizada es de 5.04 para un intervalo de confianza del 95%. Esto implica que, con un 95% de confianza, el ingreso medio poblacional se encuentra dentro de un rango de ±$5.04 alrededor del promedio muestral.
Intervalo de confianza
IC_inferior <- media - margen_error
print(IC_inferior)[1] 157.6223
El limite inferior es de 157.62 valor calculado de la media 162.66 menos el margen de error de 5.40
IC_superior <- media + margen_error
print (IC_superior)[1] 167.7042
El limite superior es de 167.70 valor calculado de la media 162.66 más el margen de error de 5.40
Intervalo de confianza
cat("El intervalo de confianza para la media de 'ingrl' es: [", IC_inferior, ",", IC_superior, "]\n")El intervalo de confianza para la media de 'ingrl' es: [ 157.6223 , 167.7042 ]
El intervalo de confianza para la media de ‘ingrl’ es: [ 157.6223 , 167.7042 ]
cbind imprime texxto en columnas
intervalo95<-cbind(IC_inferior,media,IC_superior);intervalo95 IC_inferior media IC_superior
[1,] 157.6223 162.6633 167.7042
Estos valores nos permiten conocer el pto estiamdo de 162.66; el limite de confianza inferior de 157.62; y el limite de confianza superior de 167.70
Otra forma de impirmir los resultados
colnames(intervalo95)<-c("IC_low","media","IC_high");intervalo95 IC_low media IC_high
[1,] 157.6223 162.6633 167.7042
Los resultados no varian, lo unico que cambia es el enunciado de presentarlos.
Forma simplificada de encontrar intervalos
media_test <- t.test(data$ingrl, conf.level = 0.95)
print(media_test$conf.int)[1] 157.6220 167.7046
attr(,"conf.level")
[1] 0.95
Esta nueva formula permite obtener los resultados de una manera mas rapida y resumida ### Plotear los Intervalos de Confianza en un gráfico”
labels<-c("CI_95")
names(labels)<-labelsround es para redondear, es este caso dos digitos
labelsre1<-round(c(media),2)
labelsre2<-round(c(IC_inferior),2)
labelsre3<-round(c(IC_superior),2) names(labelsre1)<-labelsre1
xre1<-c(media)
y1<-(4)
lre1<-c(IC_inferior)
ure1<-c(IC_superior)Presentacion de graficos
options(repos = c(CRAN = "https://cloud.r-project.org"))
install.packages("plotrix")Installing package into 'C:/Users/Usuario iTC/AppData/Local/R/win-library/4.5'
(as 'lib' is unspecified)
package 'plotrix' successfully unpacked and MD5 sums checked
The downloaded binary packages are in
C:\Users\Usuario iTC\AppData\Local\Temp\RtmpuWV4VT\downloaded_packages
library(plotrix)
plotCI(xre1,y1, ui=ure1,li=lre1,col="#898989",scol="#898989",
err="x",
axes=FALSE, ## disable axes (including tick labels)
pch=21,
pt.bg=16,
cex = 0.30,
slty = 1,
lwd=1,
xlab="",
ylab="",
ylim=c(1,7),
xlim=c(154,169), ## suppress x-axis label
main="Intervalo de Confianza para el Ingreso Promedio",
cex.main=0.85,
font.main = 1)
abline(v = xre1, col = "purple",lty = 2)
#text(-200,"Media",col="blue")
axis(side=1,cex.axis=0.65) ## add default y-axis (ticks+labels)
axis(side=2,at=4, ## add custom x-axis
labels= labels,cex.axis=0.30)
box(bty="l") ## add box
text(xre1, y1+0.03, labelsre1, cex = 0.65, pos= 3)
text(lre1, y1+0.03, labelsre2, cex = 0.65, pos= 3)
text(ure1, y1+0.03, labelsre3, cex = 0.65, pos= 3)El presente gráfico, basado en datos de la Encuesta Nacional de Salud y Nutrición 2018, muestra un intervalo de confianza cuyos límites se ubican en 157.62 (límite inferior) y 167.7 (límite superior), con una amplitud de 10.08 unidades. Esta distancia refleja el grado de precisión de la estimación de la media: a mayor tamaño muestral, el intervalo tiende a ser más estrecho, lo cual indica una mayor precisión en la estimación del valor poblacional.
Ejemplo 2: Intervalo de Confianza para la proporción de la variable ‘depresion_pp’ post parto
Calcular la proporción muestral p
install.packages("haven")Warning: package 'haven' is in use and will not be installed
library(haven)
p <- sum(as_factor(data$depresion_pp) == "Si", na.rm = TRUE) / sum(!is.na(data$depresion_pp))
print(p)[1] 0.2202298
Este valor indica que el 22% de las mujeres en Ecuador que dieron a luz en el año 2018 presentaron síntomas de depresión posparto, lo cual representa una proporción considerable. En contraste, el 77.98% de las mujeres experimentaron una recuperación emocional estable tras el parto. Estos resultados sugieren la necesidad de implementar estrategias de acompañamiento psicológico en los servicios de salud, con el fin de fortalecer el bienestar emocional de las madres y prevenir posibles complicaciones psicológicas asociadas al posparto.
Tamaño de la muestra
n <- length(data$depresion_pp)
print(n)[1] 16451
Calcular el error estándar
error_estandarp <- sqrt((p * (1 - p)) / n)
print(error_estandarp)[1] 0.003230912
Se observa que el error estándar de la variable correspondiente a las mujeres con depresión posparto en Ecuador, en el año 2018, es de 0.0032, un valor que indica un nivel bajo de variabilidad en la estimación, lo que evidencia que la proporción estimada es bastante precisa y confiable dentro del contexto muestral analizado.
Calcular el margen de error
margen_errorp <- z * error_estandarp
print(margen_errorp)[1] 0.006332472
El margen de error de la estimación de la proporción de mujeres con depresión posparto en Ecuador durante el año 2018 es de 0.006 valor que refuerza la precisión y confiabilidad de la estimación.
Calcular los límites del intervalo de confianza
IC_inferiorp <- p - margen_errorp
print(IC_inferiorp)[1] 0.2138973
El valor del limite inferior de la proporcion de las mujeres con depresion es de 0.21
IC_superiorp <- p + margen_errorp
print(IC_superiorp)[1] 0.2265622
El valor del limite superior de la proporcion de las mujeres con depresion es de 0.22
Intervalo de confianza para proporciones
cat("El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [", IC_inferiorp, ",", IC_superiorp, "]")El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [ 0.2138973 , 0.2265622 ]
El intervalo de confianza se encuentra entre un rango del 21% y del 23%
intervalo95p<-cbind(IC_inferiorp,p,IC_superiorp);intervalo95p IC_inferiorp p IC_superiorp
[1,] 0.2138973 0.2202298 0.2265622
Estos resultados evidencia que el limite inferior es de 21%; la media de 0.22 y el limite superior del 23%
colnames(intervalo95p)<-c("IC_low","p","IC_high");intervalo95p #Para cambiar nombres más cortos de columnas IC_low p IC_high
[1,] 0.2138973 0.2202298 0.2265622
Se evidencian los mismos resultados de una manera mas simplificada pero precisa igual que las anteiores formular.
Forma más simplificada de calcular un intervalo de confianza para proporciones
library(haven)
depresion_factor <- as_factor(data$depresion_pp)
prop_test <- prop.test(
sum(depresion_factor == "Si", na.rm = TRUE), # éxitos
sum(!is.na(depresion_factor)), # total válido
conf.level = 0.95
)
print(prop_test$conf.int)[1] 0.2139329 0.2266579
attr(,"conf.level")
[1] 0.95
A partir de los datos obtenidos en la Encuesta Nacional de Salud y Nutrición 2018, se estima que cerca del 22.02% de las mujeres que tuvieron un parto en Ecuador experimentaron síntomas de depresión posparto. Esta cifra no solo resulta significativa desde el punto de vista de salud pública, sino que también se respalda con un intervalo de confianza del 95% entre 0.2139 y 0.2267, lo que refleja una estimación precisa y confiable.
Ejemplo 3: Prueba de hipótesis de Medias
Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’
H0: El ingreso promedio poblacional es igual a $450
HA: El ingreso promedio poblacional es diferente a $450
Realizar una prueba t para una sola muestra
t_prueba <- t.test(data$ingrl, mu = 450, conf.level = 0.95)
print(t_prueba)
One Sample t-test
data: data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 450
95 percent confidence interval:
157.6220 167.7046
sample estimates:
mean of x
162.6633
El valor obtenido en p-value es estadisticamente significativo por lo tanto, rechazo la hipótesis nula y no rechazo la hipótesis alternativa ; es decir acepto la hipotesis alternativa ya que el ingreso promedio de las mujeres en Ecuador es de 162.66
Interpretar los resultados:
if (t_prueba$p.value < 0.05) {
cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.\n")
} else {
cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es igual a 450.\n")
}Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.
Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’
H0: El ingreso promedio poblacional es mayor e igual a $450
HA: El ingreso promedio poblacional es menor a $450 Recordar que la HA nunca contiene los signos “=” , “≤” o “≥”.
t_prueba2 <- t.test(data$ingrl, mu = 450, alternative = "less", conf.level = 0.95)
print(t_prueba2)
One Sample t-test
data: data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is less than 450
95 percent confidence interval:
-Inf 166.894
sample estimates:
mean of x
162.6633
El resultado evidencia que la media es menor a 450, rechazo la hipótesis nula y no rechazo la hipótesis alternativa
Interpretar los resultados:
if (t_prueba$p.value < 0.05) {
cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es menor a 450.\n")
} else {
cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es mayor e igual a 450.\n")
}Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es menor a 450.
Ejemplo 4: Prueba de hipótesis de proporciones
Supongamos que queremos realizar una prueba de hipótesis para proporción de ‘depresion_pp’
H0: La proporción poblacional es igual a 0.10
HA: La proporción poblacional es diferente a 0.10 ### Realizamos la prueba para saber si la proporción es diferente a 0.10
library(haven)
depresion <- as_factor(data$depresion_pp)
prop_test <- prop.test(
sum(depresion == "Si", na.rm = TRUE), # cantidad de "Si"
sum(!is.na(depresion)), # total válido
p = 0.10, # proporción esperada
conf.level = 0.95
)
print(prop_test)
1-sample proportions test with continuity correction
data: sum(depresion == "Si", na.rm = TRUE) out of sum(!is.na(depresion)), null probability 0.1
X-squared = 2640.9, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.1
95 percent confidence interval:
0.2139329 0.2266579
sample estimates:
p
0.2202298
El resultado es estadisticamente significativo, y rechazamos la hipotesis alternativa, es decir la proporcion de las mujeres en Ecuador con depresion postparto es diferente a 0.10 ya que es de 0.22.
if (prop_test$p.value < 0.05) {
cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.\n")
} else {
cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es igual a 0.10.\n")
}Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.
Estudios previos
De acuerdo al autor (Giménez et al. 2025) corrobora que la depresion posparto representa un período vulnerable para la salud mental de las madres y sugiere recomendaciones esenciales para asegurar una atención fluida entre los niveles asistenciales para abordar la salud mental posparto de manera efectiva.
Otro criterio relevante sobre la depresión posparto lo plantea (Martínez-Paredes and Jácome-Pérez 2019) quien sostiene que esta condición afecta a una proporción significativa de la población femenina. Su estudio se enfoca en identificar las principales causas asociadas, entre las cuales destacan factores de riesgo como el abuso sexual, el embarazo a edad temprana y la violencia intrafamiliar. El autor subraya que el diagnóstico temprano resulta fundamental, ya que permite reducir tanto las conductas de riesgo como los trastornos del neurodesarrollo fetal y mejorar los desenlaces obstétricos.