Trabajo Autónomo

Author

Thalia Guaicha

Encuesta Nacional de Salud y Nutrición 2018

La Encuesta Nacional de Salud y Nutrición – ENSANUT 2018 es una operación estadística por muestreo probabilístico que consta en el Programa Nacional Estadístico con periodicidad quinquenal y cuyo objetivo principal es generar indicadores sobre los principales problemas y la situación de salud de la población ecuatoriana con el fin de evaluar y generar las políticas públicas en temas de salud y nutrición. Este presente trabajo fue desarrollado en base a la información del INEC

Cargar las librerías necesarias

options(repos = c(CRAN = "https://cloud.r-project.org"))
install.packages("foreign")
Installing package into 'C:/Users/usuario/AppData/Local/R/win-library/4.4'
(as 'lib' is unspecified)
package 'foreign' successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\usuario\AppData\Local\Temp\RtmpaYSidG\downloaded_packages
library(foreign)
library(haven)
data <- read_dta("Data1_R.dta")
View(data)

options(repos = c(CRAN = “https://cloud.r-project.org”)) install.packages(“foreign”) library(foreign) library(haven) data <- read_dta(“Data1_R.dta”) View(data) library(dplyr) # Para manipular los datos library(ggplot2) # Para crear gráficos library(“foreign”) #Cargas datos .dta library(“msm”) library(“car”) require(plotrix) library(“plotrix”)


#Cambio de Directorio
setwd("C:/Users/usuario/Desktop/TRABAJO AUTONOMO ANALYTICS")

# Leer los datos desde un archivo .dta
::: {.cell}

```{.r .cell-code}
data <- read.dta("Data1_R.dta")

:::

library(haven)
data <- read_dta("Data1_R.dta")
View(data)

Verificar las primeras filas del conjunto de datos

head(data)
# A tibble: 6 × 50
  area       empleo          region   edad t_hijos nac_vivo_murieron mortinato_2
  <dbl+lbl>  <dbl+lbl>       <dbl+l> <dbl>   <dbl> <dbl+lbl>         <dbl+lbl>  
1 1 [Urbano] 1 [Trabajó al… 1 [Sie…    19       1 0 [No]            0 [No]     
2 1 [Urbano] 0 [No trabajó] 1 [Sie…    23       1 0 [No]            0 [No]     
3 1 [Urbano] 1 [Trabajó al… 1 [Sie…    38       5 0 [No]            0 [No]     
4 1 [Urbano] 0 [No trabajó] 1 [Sie…    18       1 0 [No]            0 [No]     
5 1 [Urbano] 0 [No trabajó] 1 [Sie…    21       1 0 [No]            0 [No]     
6 1 [Urbano] 1 [Trabajó al… 1 [Sie…    22       1 0 [No]            0 [No]     
# ℹ 43 more variables: depresion_pp <dbl+lbl>, intensidad_dpp <dbl+lbl>,
#   etnia <dbl+lbl>, f2_s2_216_1 <dbl+lbl>, f2_s2_216_2 <dbl>,
#   f2_s2_218_1_a <dbl+lbl>, tiempo_dpp <dbl+lbl>, f2_s5_504a_1 <dbl+lbl>,
#   f2_s5_504b_1 <dbl+lbl>, f2_s5_504c_1 <dbl+lbl>, f2_s5_504d_1 <dbl+lbl>,
#   f2_s5_504e_1 <dbl+lbl>, f2_s5_504f_1 <dbl+lbl>, f2_s5_504g_1 <dbl+lbl>,
#   f2_s5_504h_1 <dbl+lbl>, f2_s5_504i_1 <dbl+lbl>, f2_s5_504j_1 <dbl+lbl>,
#   f2_s5_504k_1 <dbl+lbl>, est_civil <dbl+lbl>, q_usted <dbl+lbl>, …

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Ejemplo 1: Intervalo de Confianza para la media de la variable ‘ingrl’ ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ El intervalo de confianza sirve para estimar un rango de valores dentro del cual se espera que se encuentre el valor real de un parámetro poblacional, con una cierta probabilidad o nivel de confianza. En otras palabras, permite cuantificar la incertidumbre asociada a la estimación del parámetro.

Poner en todas print (etiqueta)

Calcular la media y la desviación estándar de la variable ‘ingrl’

media <- mean(data$ingrl, na.rm = TRUE)  # Calcula la media
print (media)
[1] 162.6633

Las mujeres en promedio en el 2018 percibian 162, 66 en el cual se puede observar que esta por debado del Salario Minimo Unificado que es de 318, esto ratifica la disparidad de genero que existe entre la equidad de genero.

desviacion <- sd(data$ingrl, na.rm = TRUE)  # Calcula la desviación estándar
print (desviacion)
[1] 329.8832

La desviacion stander de este ejemplo es de 329,88 lo que significa que existe una desviación alta en relación a la media, por lo tanto, existe dispercion mayor en la muestr.

n <- length(data$ingrl)  # Número de observaciones
summary(data$ingrl)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    0.0     0.0     0.0   162.7   200.0  3000.0 
print (n)
[1] 16451

En este caso se ha encontrado N, que es el numero de obsarvaciones, en este caso de estudio es de 16451 datos, en este sentido se procede a calcular el error estandar que es Dividir la desviacion estandar por la raiz cuadrada de n y multiplicar por Z. Calcular el error estándar

error_estandar <- desviacion / sqrt(n)
print(error_estandar)
[1] 2.571959

El error estandar se encuentra por 2,57, esto significa que, en términos generales, hay una desviación esperada en la estimación de un parámetro de la población a partir de la muestra. Cuanto mayor sea el error estándar, mayor será la diferencia esperada entre la estimación de la muestra y el verdadero valor de la población. por lo que se procede a calcular el intervalo de confinza al 95%.

Intervalo de confianza al 95% Nota: Para un intervalo de confianza del 95% en una distribución normal, el 0.975 se refiere al percentil superior. Es decir, en una distribución normal, el 97.5% de las observaciones están a la izquierda de este valor de z, y solo el 2.5% están a la derecha. Por lo tanto, el valor calculado en qnorm(0.975) es el valor crítico z que se utiliza para calcular los intervalos de confianza del 95%.

z <- qnorm(0.975)  # Z-score para un intervalo de confianza del 95%
z2<- qnorm(0.95)   # Z-score para un intervalo de confianza del 90%
z3<- qnorm(0.995)   # Z-score para un intervalo de confianza del 99%

Despues de haber calculado los intervalos de confianza se observa que z:1,95, z2:1,64 y z3:2,57, se procede a calcular el margen de error. Margen de Error

margen_error <- z * error_estandar  # Margen de error
print (margen_error)
[1] 5.040948

Intervalo de confianza

IC_inferior <- media - margen_error
print(IC_inferior)
[1] 157.6223

El limite inferior es de 157.62

IC_superior <- media + margen_error
print(IC_superior)
[1] 167.7042

Mostrar el intervalo de confianza cat es útil para imprimir mensajes de texto personalizados, combinando variables y texto cat(“El intervalo de confianza para la media de ‘ingrl’ es: [”, IC_inferior, ”,”, IC_superior, ”]”) cbind imprime texxto en columnas

intervalo95<-cbind(IC_inferior,media,IC_superior);intervalo95 #Para transformar a matriz
     IC_inferior    media IC_superior
[1,]    157.6223 162.6633    167.7042
print(intervalo95)
     IC_inferior    media IC_superior
[1,]    157.6223 162.6633    167.7042
intervalo95<-cbind(IC_inferior,media,IC_superior);intervalo95 #Para transformar a matriz
     IC_inferior    media IC_superior
[1,]    157.6223 162.6633    167.7042
print(intervalo95)
     IC_inferior    media IC_superior
[1,]    157.6223 162.6633    167.7042
colnames(intervalo95)<-c("IC_low","media","IC_high");intervalo95 #Para cambiar nombres más cortos de columnas
       IC_low    media  IC_high
[1,] 157.6223 162.6633 167.7042
media_test <- t.test(data$ingrl, conf.level = 0.95)
print(media_test$conf.int)
[1] 157.6220 167.7046
attr(,"conf.level")
[1] 0.95
labels<-c("CI_95")
names(labels)<-labels
labelsre1<-round(c(media),2) 
labelsre2<-round(c(IC_inferior),2) 
labelsre3<-round(c(IC_superior),2) 


names(labelsre1)<-labelsre1

xre1<-c(media)
y1<-(4)
lre1<-c(IC_inferior)
ure1<-c(IC_superior)
options(repos = c(CRAN = "https://cloud.r-project.org"))
install.packages("plotrix")
Installing package into 'C:/Users/usuario/AppData/Local/R/win-library/4.4'
(as 'lib' is unspecified)
package 'plotrix' successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\usuario\AppData\Local\Temp\RtmpaYSidG\downloaded_packages
library(plotrix)
plotCI(xre1,y1, ui=ure1,li=lre1,col="#898989",scol="#898989",
       err="x",
       axes=FALSE,   ## disable axes (including tick labels)
       pch=21,
       pt.bg=16,
       cex = 0.30,
       slty = 1,
       lwd=1,
       xlab="",
       ylab="",
       ylim=c(1,7),
       xlim=c(154,169),   ## suppress x-axis label
       main="Intervalo de Confianza para el Ingreso Promedio",
       cex.main=0.85,
       font.main = 1)
abline(v = xre1, col = "red",lty = 2)
#text(-200,"Media",col="blue")
axis(side=1,cex.axis=0.65)         ## add default y-axis (ticks+labels)
axis(side=2,at=4,  ## add custom x-axis
     labels= labels,cex.axis=0.30)
box(bty="l")         ## add box
text(xre1, y1+0.03, labelsre1, cex = 0.65, pos= 3)
text(lre1, y1+0.03, labelsre2, cex = 0.65, pos= 3)
text(ure1, y1+0.03, labelsre3, cex = 0.65, pos= 3)

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Ejemplo 2: Intervalo de Confianza para la proporción de la variable ‘depresion_pp’ post parto ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Calcular la proporción muestral p

install.packages("haven")
Warning: package 'haven' is in use and will not be installed
library(haven)
p <- sum(as_factor(data$depresion_pp) == "Si", na.rm = TRUE) / sum(!is.na(data$depresion_pp))
print(p)
[1] 0.2202298

En el caso de la muestra de las mujeres ecuatorianas el 22,o2% sufrio de depresión posparto y el 77,98% no sufrio depresión

n <- length(data$depresion_pp)
print(n)
[1] 16451

Calcular el error estándar

error_estandarp <- sqrt((p * (1 - p)) / n)
print(error_estandarp)
[1] 0.003230912

El error estandar de la proporción de las mujeres que sufren depresión posparto es de 0,0032

Calcular el margen de error

margen_errorp <- z * error_estandarp
print(margen_errorp)
[1] 0.006332472

Calcular los límites del intervalo de confianza

IC_inferiorp <- p - margen_errorp
print(IC_inferiorp)
[1] 0.2138973
IC_superiorp <- p + margen_errorp
print(IC_superiorp)
[1] 0.2265622

Mostrar el intervalo de confianza para proporciones cat(“El intervalo de confianza para la media de ‘mujeres con depresión post partol’ es: [”, IC_inferiorp, ”,”, IC_superiorp, ”]”)

intervalo95p<-cbind(IC_inferiorp,p,IC_superiorp);intervalo95p #Para transformar a matriz
     IC_inferiorp         p IC_superiorp
[1,]    0.2138973 0.2202298    0.2265622
print(intervalo95p)
     IC_inferiorp         p IC_superiorp
[1,]    0.2138973 0.2202298    0.2265622

Interpretación.

colnames(intervalo95p)<-c("IC_low","p","IC_high");intervalo95p 
        IC_low         p   IC_high
[1,] 0.2138973 0.2202298 0.2265622

Una forma más simplificada de calcular un intervalo de confianza para proporciones

library(haven)
depresion_factor <- as_factor(data$depresion_pp)

prop_test <- prop.test(
  sum(depresion_factor == "Si", na.rm = TRUE),  # éxitos
  sum(!is.na(depresion_factor)),                # total válido
  conf.level = 0.95
)
print(prop_test$conf.int)
[1] 0.2139329 0.2266579
attr(,"conf.level")
[1] 0.95

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Ejemplo 3: Prueba de hipótesis de Medias ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’ H0: El ingreso promedio poblacional es igual a $450 HA: El ingreso promedio poblacional es diferente a $450 Recordar que la HA nunca contiene los signos “=” , “≤” o “≥”.

Realizar una prueba t para una sola muestra

t_prueba <- t.test(data$ingrl, mu = 450, conf.level = 0.95)
print(t_prueba)

    One Sample t-test

data:  data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 450
95 percent confidence interval:
 157.6220 167.7046
sample estimates:
mean of x 
 162.6633 

Como se puede observar el p-value es de 0.0002 es por ello que se rechaza la hipotesis nula y se acepta la hipotesis alternativa, debido a que el ingreso promedio de las mujeres es menos o diferente de 450,00

Interpretar los resultados: Si el valor p es menor a 0.05, rechazamos la hipótesis nula

if (t_prueba$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es igual a 450.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.

Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’ H0: El ingreso promedio poblacional es mayor e igual a $450 HA: El ingreso promedio poblacional es menor a $450 Recordar que la HA nunca contiene los signos “=” , “≤” o “≥”.

Realizar una prueba t para una sola muestra less menor

t_prueba2 <- t.test(data$ingrl, mu = 450, alternative = "less", conf.level = 0.95)
print(t_prueba2)

    One Sample t-test

data:  data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is less than 450
95 percent confidence interval:
    -Inf 166.894
sample estimates:
mean of x 
 162.6633 

p valor significativo, por lo tanto, rechazo la hipótesis nula y no rechazo la hipótesis alternativa

Interpretar los resultados: Si el valor p es menor a 0.05, rechazamos la hipótesis nula

if (t_prueba$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es menor a 450.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es mayor e igual a 450.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es menor a 450.

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Ejemplo 4: Prueba de hipótesis de proporciones ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Supongamos que queremos realizar una prueba de hipótesis para proporción de ‘depresion_pp’ H0: La proporción poblacional es igual a 0.10 HA: La proporción poblacional es diferente a 0.10 Recordar que la HA nunca contiene los signos “=” , “≤” o “≥”.

Realizamos la prueba para saber si la proporción es diferente a 0.10

library(haven)
depresion <- as_factor(data$depresion_pp)
prop_test <- prop.test(
  sum(depresion == "Si", na.rm = TRUE),              # cantidad de "Si"
  sum(!is.na(depresion)),                            # total válido
  p = 0.10,                                          # proporción esperada
  conf.level = 0.95
)
print(prop_test)

    1-sample proportions test with continuity correction

data:  sum(depresion == "Si", na.rm = TRUE) out of sum(!is.na(depresion)), null probability 0.1
X-squared = 2640.9, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.1
95 percent confidence interval:
 0.2139329 0.2266579
sample estimates:
        p 
0.2202298 

Interpretar los resultados: Si el valor p es menor a 0.05, rechazamos la hipótesis nula

if (prop_test$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es igual a 0.10.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.

Supongamos que queremos realizar una prueba de hipótesis para proporción de ‘depresion_pp’ H0: La proporción poblacional es menor e igual a 0.10 HA: La proporción poblacional es mayor a 0.10

Realizamos la prueba para saber si la proporción es mayor a 0.10 +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Revisión de Literatura +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Según Capa&Gonzalez (2018), la depresión posparto se relaciona con síntomas psicológicos y alteración de patrones biológicos, entre los que están un estado emocional triste, altos niveles de cansancio, trastornos del sueño y afectación del eje hipotalámico-hipofisiario-adrenal, responsable de la secreción de la hormona cortisol, necesaria para hacer frente a situaciones de estrés. Aunque los síntomas suelen aparecer tras el nacimiento del bebé, las mujeres que posteriormente desarrollan depresión posparto presentan síntomas psicológicos durante el embarazo (somatización, depresión, ansiedad y estrés específico del embarazo) y mayores niveles de cortisol desde el primer trimestre (4). Las altas tasas de depresión posparto entre mujeres latinoamericanas residentes en distintos países, junto con la mayor cantidad de síntomas psicopatológicos que las mujeres inmigrantes experimentan durante el período posparto, hacen necesaria la creación de estrategias para apoyar y facilitar el acceso de este grupo de riesgo a los servicios de salud mental. A este problema se suma que las mujeres buscan menos ayuda psicológica y médica durante el embarazo y el puerperio y por ese motivo tienen menos información sobre las vías de ayuda que otros grupos de mujeres. Además, durante el período perinatal existe un bajo reconocimiento de la efectividad de los servicios de salud mental. Asi mismo, Loaiza(2019) concuerda que el embarazo y el puerperio son etapas de cambios y adaptación para las mujeres, los cuales a su vez representan un periodo de vulnerabilidad para el desarrollo de un cuadro clínico depresivo, sobre todo si la mujer cuenta con factores de riesgo que aumenten su susceptibilidad al progreso de la enfermedad. La depresión posparto alcanza tasas de hasta el 20% de los casos y amerita un diagnóstico ágil con tratamiento diligente diferenciándolo de forma asertiva de la tristeza posparto, con el objetivo de disminuir las complicaciones a las que se exponen la madre y su hijo. +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Bibliografia +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ Caparros-Gonzalez, R. A., Romero-Gonzalez, B., & Peralta-Ramirez, M. I. (2018). Depresión posparto, un problema de salud pública mundial. Revista Panamericana de Salud Pública, 42, e97. Loaiza, N. V., Dachner, A. P., & Morales, J. A. V. (2019). Generalidades y diagnóstico de la depresión posparto. Revista Médica Sinergia, 4(7), 3-3.