library(haven)DEBER 17 DE MAYO
Base de Datos de Encuesta Nacional de Salud y Nutricion 2018
El presente deber se lo ha realizado tomando en cuenta la Base de datos del INEC
Cargar las librerías necesarias
library(dplyr) # Para manipular los datos library(ggplot2) # Para crear gráficos library(“foreign”) #Cargas datos .dta library(“msm”) library(“car”) require(plotrix) library(“plotrix”) library(foreign)
#Cambiar directorio de trabajo
setwd(“C:/Users/pajv2/OneDrive/Escritorio/DEBER 17 DE MAYO”)
data <- read_dta("Data1_R.dta")
View(data)head(data)# A tibble: 6 × 50
area empleo region edad t_hijos nac_vivo_murieron mortinato_2
<dbl+lbl> <dbl+lbl> <dbl+l> <dbl> <dbl> <dbl+lbl> <dbl+lbl>
1 1 [Urbano] 1 [Trabajó al… 1 [Sie… 19 1 0 [No] 0 [No]
2 1 [Urbano] 0 [No trabajó] 1 [Sie… 23 1 0 [No] 0 [No]
3 1 [Urbano] 1 [Trabajó al… 1 [Sie… 38 5 0 [No] 0 [No]
4 1 [Urbano] 0 [No trabajó] 1 [Sie… 18 1 0 [No] 0 [No]
5 1 [Urbano] 0 [No trabajó] 1 [Sie… 21 1 0 [No] 0 [No]
6 1 [Urbano] 1 [Trabajó al… 1 [Sie… 22 1 0 [No] 0 [No]
# ℹ 43 more variables: depresion_pp <dbl+lbl>, intensidad_dpp <dbl+lbl>,
# etnia <dbl+lbl>, f2_s2_216_1 <dbl+lbl>, f2_s2_216_2 <dbl>,
# f2_s2_218_1_a <dbl+lbl>, tiempo_dpp <dbl+lbl>, f2_s5_504a_1 <dbl+lbl>,
# f2_s5_504b_1 <dbl+lbl>, f2_s5_504c_1 <dbl+lbl>, f2_s5_504d_1 <dbl+lbl>,
# f2_s5_504e_1 <dbl+lbl>, f2_s5_504f_1 <dbl+lbl>, f2_s5_504g_1 <dbl+lbl>,
# f2_s5_504h_1 <dbl+lbl>, f2_s5_504i_1 <dbl+lbl>, f2_s5_504j_1 <dbl+lbl>,
# f2_s5_504k_1 <dbl+lbl>, est_civil <dbl+lbl>, q_usted <dbl+lbl>, …
media <- mean(data$ingrl, na.rm = TRUE) # Calcula la media
print (media)[1] 162.6633
En este caso se analiza que el promedio del salario de las mujeres en el año 2018 fue de $162,66 ctvs el mismo que esta debajo del salario basico unificado en el Ecuador para el año 2018, esta brecha salaria de genero se debería a que muchas mujeres estaban en empleos informales, subempleadas o discriminadas salarialmente, lo que evidencia desigualdades en el acceso a empleos formales y bien remunerados.
desviacion <- sd(data$ingrl, na.rm = TRUE) # Calcula la desviación estándar
print (desviacion)[1] 329.8832
El resultado de de la desviación estandar es de $329.8832 que se ha obtenido de este ejemplo
n <- length(data$ingrl) # Número de observaciones
print(n)[1] 16451
El numero total de observaciones en este ejemplo es de 16451.
summary(data$ingrl) Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0 0.0 0.0 162.7 200.0 3000.0
error_estandar <- desviacion / sqrt(n)
print(error_estandar)[1] 2.571959
El error estandar es de 2.57
z <- qnorm(0.975) # Z-score para un intervalo de confianza del 95%
z2<- qnorm(0.95) # Z-score para un intervalo de confianza del 90%
z3<- qnorm(0.995) # Z-score para un intervalo de confianza del 99%margen_error <- z * error_estandar # Margen de error
print(margen_error)[1] 5.040948
El margen de error es de 5.04
IC_inferior <- media - margen_error
print(IC_inferior)[1] 157.6223
El margen inferior de este ejemplo es de 157.62
IC_superior <- media + margen_error
print(IC_superior)[1] 167.7042
El margen superior de este ejemplo es de 167.70
cat("El intervalo de confianza para la media de 'ingrl' es: [", IC_inferior, ",", IC_superior, "]\n")El intervalo de confianza para la media de 'ingrl' es: [ 157.6223 , 167.7042 ]
El intervalo de confianza para la media de ingreso de las mujeres en Ecuador esta entre 157.62 y 167.70
intervalo95<-cbind(IC_inferior,media,IC_superior);intervalo95 IC_inferior media IC_superior
[1,] 157.6223 162.6633 167.7042
En este ejemplo nos indica que el intervalo inferior es 157.62 la media es 162.66 y el intervalo superior es del 167.70
colnames(intervalo95)<-c("IC_low","media","IC_high");intervalo95 IC_low media IC_high
[1,] 157.6223 162.6633 167.7042
FORMA SIMPLIFICADA DE SACAR INTERVALOS
media_test <- t.test(data$ingrl, conf.level = 0.95)
print(media_test$conf.int)[1] 157.6220 167.7046
attr(,"conf.level")
[1] 0.95
Plotear los Intervalos de Confianza en un gráfico
labels<-c("CI_95")
names(labels)<-labelslabelsre1<-round(c(media),2)
labelsre2<-round(c(IC_inferior),2)
labelsre3<-round(c(IC_superior),2)names(labelsre1)<-labelsre1
xre1<-c(media)
y1<-(4)
lre1<-c(IC_inferior)
ure1<-c(IC_superior)options(repos = c(CRAN = "https://cloud.r-project.org"))
install.packages("plotrix")Installing package into 'C:/Users/pajv2/AppData/Local/R/win-library/4.5'
(as 'lib' is unspecified)
package 'plotrix' successfully unpacked and MD5 sums checked
The downloaded binary packages are in
C:\Users\pajv2\AppData\Local\Temp\Rtmp6RGTRg\downloaded_packages
library(plotrix)
plotCI(xre1,y1, ui=ure1,li=lre1,col="#898989",scol="#898989",
err="x",
axes=FALSE, ## disable axes (including tick labels)
pch=21,
pt.bg=16,
cex = 0.30,
slty = 1,
lwd=1,
xlab="",
ylab="",
ylim=c(1,7),
xlim=c(154,169), ## suppress x-axis label
main="Intervalo de Confianza para el Ingreso Promedio",
cex.main=0.85,
font.main = 1)
abline(v = xre1, col = "red",lty = 2)
#text(-200,"Media",col="blue")
axis(side=1,cex.axis=0.65) ## add default y-axis (ticks+labels)
axis(side=2,at=4, ## add custom x-axis
labels= labels,cex.axis=0.30)
box(bty="l") ## add box
text(xre1, y1+0.03, labelsre1, cex = 0.65, pos= 3)
text(lre1, y1+0.03, labelsre2, cex = 0.65, pos= 3)
text(ure1, y1+0.03, labelsre3, cex = 0.65, pos= 3)En base a la encuesta de Datos de Encuesta Nacional de Salud y Nutricion 2018, este gráfico del plano carteciano nos demuestra que el Intervalo inferior es de 157.62 la media es de 162.66 y el Intervalo superior es de 167.70 se puede tener un alto grado de certeza de que el ingreso real de la población está entre 157.62 y 167.7
Intervalo de Confianza para la proporción de la variable ‘depresion_pp’ post parto
install.packages("haven")Warning: package 'haven' is in use and will not be installed
library(haven)
p <- sum(as_factor(data$depresion_pp) == "Si", na.rm = TRUE) / sum(!is.na(data$depresion_pp))
print(p)[1] 0.2202298
De acuerdo a la encuesta Nacional de Salud y Nutricion 2018, En la muestra del caso de las mujeres ecuatorianas en el 2018 el 22.02 % sufrio de depresión posparto y la diferencia que es el 77.98% no sufrio de depreción posparto.
n <- length(data$depresion_pp)
print(n)[1] 16451
Calcular el error estándar
error_estandarp <- sqrt((p * (1 - p)) / n)
print(error_estandarp)[1] 0.003230912
El error estandar de la proporción de las mujeres ecuatorianas con depresión posparto es de 0.0032
Calcular el margen de error
margen_errorp <- z * error_estandarp
print(margen_errorp)[1] 0.006332472
El margen de error de la proporción de las mujeres ecuatorianas con depresión posparto es de 0.0063
Calcular los límites del intervalo de confianza
límites del intervalo inferior
IC_inferiorp <- p - margen_errorp
print(IC_inferiorp)[1] 0.2138973
IC_superiorp <- p + margen_errorp
print(IC_superiorp)[1] 0.2265622
límites del intervalo superior
IC_superiorp <- p + margen_errorp
print(IC_superiorp)[1] 0.2265622
cat("El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [", IC_inferiorp, ",", IC_superiorp, "]")El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [ 0.2138973 , 0.2265622 ]
intervalo95p<-cbind(IC_inferiorp,p,IC_superiorp);intervalo95p #Para transformar a matriz IC_inferiorp p IC_superiorp
[1,] 0.2138973 0.2202298 0.2265622
colnames(intervalo95p)<-c("IC_low","p","IC_high");intervalo95p #Para cambiar nombres más cortos de columnas IC_low p IC_high
[1,] 0.2138973 0.2202298 0.2265622
*Una forma más simplificada de calcular un intervalo de confianza para proporciones
library(haven)
depresion_factor <- as_factor(data$depresion_pp)
prop_test <- prop.test(
sum(depresion_factor == "Si", na.rm = TRUE), # éxitos
sum(!is.na(depresion_factor)), # total válido
conf.level = 0.95
)
print(prop_test$conf.int)[1] 0.2139329 0.2266579
attr(,"conf.level")
[1] 0.95
Prueba de hipótesis de Medias
Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’
*H0: El ingreso promedio poblacional es igual a $450
*HA: El ingreso promedio poblacional es diferente a $450
Realizar una prueba t para una sola muestra
t_prueba <- t.test(data$ingrl, mu = 450, conf.level = 0.95)
print(t_prueba)
One Sample t-test
data: data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 450
95 percent confidence interval:
157.6220 167.7046
sample estimates:
mean of x
162.6633
Análisis: p valor significativo, por lo tanto, rechazo la hipótesis nula y no rechazo la hipótesis alternativa, es decir acepto la hipótesis alternativa, dado que el ingreso promedio de las mujeres de Ecuador es de 162.66
Si el valor p es menor a 0.05, rechazamos la hipótesis nula
if (t_prueba$p.value < 0.05) {
cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.\n")
} else {
cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es igual a 450.\n")
}Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.
Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’
H0: El ingreso promedio poblacional es mayor e igual a $450*
HA: El ingreso promedio poblacional es menor a $450
Recordar que la HA nunca contiene los signos “=” , “≤” o “≥”.
t_prueba2 <- t.test(data$ingrl, mu = 450, alternative = "less", conf.level = 0.95)
print(t_prueba2)
One Sample t-test
data: data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is less than 450
95 percent confidence interval:
-Inf 166.894
sample estimates:
mean of x
162.6633
p valor significativo, por lo tanto, rechazo la hipótesis nula y no rechazo la hipótesis alternativa, es decir que con un nivel de confianza del 0.95 se puede determinar que la media de ingresos es menor a 450
Interpretar los resultados:
Si el valor p es menor a 0.05, rechazamos la hipótesis nula
if (t_prueba$p.value < 0.05) {
cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.\n")
} else {
cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es igual a 450.\n")
}Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.
Prueba de hipótesis de proporciones
Supongamos que queremos realizar una prueba de hipótesis para proporción de ‘depresion_pp’
H0: La proporción poblacional es igual a 0.10
HA: La proporción poblacional es diferente a 0.10 Recordar que la
HA nunca contiene los signos “=” , “≤” o “≥”.
library(haven)
depresion <- as_factor(data$depresion_pp)
prop_test <- prop.test(
sum(depresion == "Si", na.rm = TRUE), # cantidad de "Si"
sum(!is.na(depresion)), # total válido
p = 0.10, # proporción esperada
conf.level = 0.95
)
print(prop_test)
1-sample proportions test with continuity correction
data: sum(depresion == "Si", na.rm = TRUE) out of sum(!is.na(depresion)), null probability 0.1
X-squared = 2640.9, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.1
95 percent confidence interval:
0.2139329 0.2266579
sample estimates:
p
0.2202298
Análisis: Dado que, p.value es estadisticamente significativo tengo evidencia significativa para rechazar la hipótesis alternativa, es decir, que la proporcion de mujeres con depresión posparto es diferente de 0.10 y en este caso la proporcion es de 0.22
if (prop_test$p.value < 0.05) {
cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.\n")
} else {
cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es igual a 0.10.\n")
}Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.
REVISIÓN DE LITERATURA
BRECHA SALARIAL
Revisado este articúlo (Zielińska et al. 2024) trata sobre el estudio exploratorio se basó en dos preguntas de investigación: ¿Por qué cambian de trabajo las mujeres? ¿Qué buscan las mujeres en un nuevo entorno laboral? Para realizar este estudio, se elaboró un cuestionario en línea con preguntas abiertas. Las participantes fueron mujeres que solicitaron un puesto administrativo en Brasil, México, Polonia, Portugal y el Estado de Palestina. Las respuestas de 363 encuestadas se analizaron mediante el software Nvivo.
El estudio revela que las decisiones laborales de las mujeres están profundamente influenciadas por una combinación de desarrollo personal, bienestar emocional y condiciones estructurales en el trabajo. Además, muestra que las mujeres valoran tanto el progreso profesional como un entorno respetuoso y un liderazgo empático.
A diferencia de este estudio realizado en mujeres que solicitaron un puesto administrativo en Brasil, México, Polonia, Portugal y el Estado de Palestina en Ecuador las brechas salariales de deben a la falta de oportunidades laborales al genero fenemino, lo que ocasiona que la mayoría de las s mujeres ecuatorianas tengan un promedio del salario el año 2018 de $162,66 ctvs el mismo que esta debajo del salario basico unificado en el Ecuador para el año 2018, esta brecha salaria de genero se debería a que muchas mujeres estaban en empleos informales, subempleadas o discriminadas salarialmente, lo que evidencia desigualdades en el acceso a empleos formales y bien remunerados.(Zielińska et al. 2024)
DEPRESIÓN POSPARTO
De acuerdo a este articulo(Høgh et al. 2025)Identificamos tres temas clave. 1) La biología como factor contribuyente a la depresión posparto. Solo unas pocas mujeres consideraron que la depresión posparto podría estar relacionada con la sensibilidad a los cambios hormonales. 2) El papel de los eventos externos en la comprensión de la depresión posparto. La mayoría de las mujeres percibieron su depresión posparto como desencadenada principalmente por factores externos, más que por factores biológicos. 3) La ambigua posibilidad de realizar pruebas de marcadores genómicos de riesgo para la depresión posparto. Algunas mujeres consideraron que las pruebas de marcadores genómicos de riesgo podrían prevenir la depresión posparto y reducir el estigma. Sin embargo, al mismo tiempo, se percibía que conocer su riesgo podría inducir síntomas depresivos, mientras que en Ecuador estadisticamente significativo se evidencia que la proporcion de mujeres con depresión posparto es diferente de 0.10 y en este caso la proporcion es de 0.22
##Referencias