TAREA SEMANA 2

Encuesta Nacional de Salud y Nutricion 2018

Para el presente trabajo se ha considerado necesario tomar la base de datos de la Encuesta Nacional de Salud y Nutricion ENSANUT (2018) la cual considera como importante estudiar todo lo concerniente a la salud ciudadana a nivel de Ecuador, y en base a ello, establecer medidas que permitan a la población vulnerable acceder a una mejor alimentación, lo cual se refleje en s salud y bienestar.

Cambiar directorio de trabajo

setwd("C:/Users/LENOVO/Desktop/TAREA 2 ANDREA")
options(repos = c(CRAN = "https://cloud.r-project.org"))
library(haven)
Warning: package 'haven' was built under R version 4.4.3
data <- read_dta("Data1_R.dta")
View(data)
library(haven)
data <- read_dta("Data1_R.dta")
View(data)
head(data)
# A tibble: 6 × 50
  area       empleo          region   edad t_hijos nac_vivo_murieron mortinato_2
  <dbl+lbl>  <dbl+lbl>       <dbl+l> <dbl>   <dbl> <dbl+lbl>         <dbl+lbl>  
1 1 [Urbano] 1 [Trabajó al… 1 [Sie…    19       1 0 [No]            0 [No]     
2 1 [Urbano] 0 [No trabajó] 1 [Sie…    23       1 0 [No]            0 [No]     
3 1 [Urbano] 1 [Trabajó al… 1 [Sie…    38       5 0 [No]            0 [No]     
4 1 [Urbano] 0 [No trabajó] 1 [Sie…    18       1 0 [No]            0 [No]     
5 1 [Urbano] 0 [No trabajó] 1 [Sie…    21       1 0 [No]            0 [No]     
6 1 [Urbano] 1 [Trabajó al… 1 [Sie…    22       1 0 [No]            0 [No]     
# ℹ 43 more variables: depresion_pp <dbl+lbl>, intensidad_dpp <dbl+lbl>,
#   etnia <dbl+lbl>, f2_s2_216_1 <dbl+lbl>, f2_s2_216_2 <dbl>,
#   f2_s2_218_1_a <dbl+lbl>, tiempo_dpp <dbl+lbl>, f2_s5_504a_1 <dbl+lbl>,
#   f2_s5_504b_1 <dbl+lbl>, f2_s5_504c_1 <dbl+lbl>, f2_s5_504d_1 <dbl+lbl>,
#   f2_s5_504e_1 <dbl+lbl>, f2_s5_504f_1 <dbl+lbl>, f2_s5_504g_1 <dbl+lbl>,
#   f2_s5_504h_1 <dbl+lbl>, f2_s5_504i_1 <dbl+lbl>, f2_s5_504j_1 <dbl+lbl>,
#   f2_s5_504k_1 <dbl+lbl>, est_civil <dbl+lbl>, q_usted <dbl+lbl>, …
media <- mean(data$ingrl, na.rm = TRUE)  # Calcula la media
print(media)
[1] 162.6633

En este caso se puede visualizar que el promedio de salario de las mujeres ecuatorianas para el año 2018 alcanzó los $162,66, mismo que esta muy por debajo del SBU, dejando de esta forma en claro que, a la época actual la desigualdad se hace presente entre hombres/mujeres, generando una considerable diferencia, la cual se refleja en la disminución de los procesos de equidad por los que muchas personas han luchado durante décadas.

desviacion <- sd(data$ingrl, na.rm = TRUE)  # Calcula la desviación estándar
print(desviacion)
[1] 329.8832

De acuerdo con lo previo, la desviacion estándar de este caso es de $329,88, lo cual nos deja en claro que, existe una dispersión considerable con respecto al salario promedio que perciben las mujeres, lo cual es evidente en gran parte, porque, existen mujeres que tienen trabajos de alto rango, lo cual se refleja en su salario mensual.

n <- length(data$ingrl)  # Número de observaciones
print(n)
[1] 16451

summary(data$ingrl)

error_estandar <- desviacion / sqrt(n)
print(error_estandar)
[1] 2.571959

Continuando con este análisis, el error estandar de los datos es de 2,57 el cual nos indica la distribución muestral de los datos objeto de estudio, en cuanto a lo que son sus variaciones de muestra a muestra.

z <- qnorm(0.975)  # Z-score para un intervalo de confianza del 95%
z2<- qnorm(0.95)   # Z-score para un intervalo de confianza del 90%
z3<- qnorm(0.995)   # Z-score para un intervalo de confianza del 99%
margen_error <- z * error_estandar  # Margen de error
print(margen_error)
[1] 5.040948

Por otro lado, el margen de error que existe en la data revisada es de 5.04, la cual nos deja en claro cuanto podrían variar los resultados de el presente estudio con respecto a los resultados que se lograrían obtener si se realizara el análisis a nivel de todas las mujeres del país, el cual según el INEC (2018) fueron 8 686 463.

IC_inferior <- media - margen_error
print(IC_inferior)
[1] 157.6223
IC_superior <- media + margen_error
print(IC_superior)
[1] 167.7042
cat("El intervalo de confianza para la media de 'ingrl' es: [", IC_inferior, ",", IC_superior, "]\n")
El intervalo de confianza para la media de 'ingrl' es: [ 157.6223 , 167.7042 ]
intervalo95<-cbind(IC_inferior,media,IC_superior);intervalo95 #Para transformar a matriz
     IC_inferior    media IC_superior
[1,]    157.6223 162.6633    167.7042

Como se logra observar, el intervalo de confianza entre el cual se mueve mayormente el ingreso de las mujeres es de $157,62 como límite inserior, y $167,70 como límite superior, manteniendo un salario promedio de $162,66.

colnames(intervalo95)<-c("IC_low","media","IC_high");intervalo95 #Para cambiar nombres más cortos de columnas
       IC_low    media  IC_high
[1,] 157.6223 162.6633 167.7042

##FORMA SIMPLIFICADA DE ENCONTRAR INTERVALOS

media_test <- t.test(data$ingrl, conf.level = 0.95)
print(media_test$conf.int)
[1] 157.6220 167.7046
attr(,"conf.level")
[1] 0.95

Plotear los Intervalos de Confianza en un gráfico

labels<-c("CI_95")
names(labels)<-labels
labelsre1<-round(c(media),2) 
labelsre2<-round(c(IC_inferior),2) 
labelsre3<-round(c(IC_superior),2) 
names(labelsre1)<-labelsre1

xre1<-c(media)
y1<-(4)
lre1<-c(IC_inferior)
ure1<-c(IC_superior)
options(repos = c(CRAN = "https://cloud.r-project.org"))
install.packages("plotrix")
Installing package into 'C:/Users/LENOVO/AppData/Local/R/win-library/4.4'
(as 'lib' is unspecified)
package 'plotrix' successfully unpacked and MD5 sums checked

The downloaded binary packages are in
    C:\Users\LENOVO\AppData\Local\Temp\Rtmpmgv58y\downloaded_packages
library(plotrix)
plotCI(xre1,y1, ui=ure1,li=lre1,col="#898989",scol="#898989",
       err="x",
       axes=FALSE,   ## disable axes (including tick labels)
       pch=21,
       pt.bg=16,
       cex = 0.30,
       slty = 1,
       lwd=1,
       xlab="",
       ylab="",
       ylim=c(1,7),
       xlim=c(154,169),   ## suppress x-axis label
       main="Intervalo de Confianza para el Ingreso Promedio",
       cex.main=0.85,
       font.main = 1)
abline(v = xre1, col = "red",lty = 2)
#text(-200,"Media",col="blue")
axis(side=1,cex.axis=0.65)         ## add default y-axis (ticks+labels)
axis(side=2,at=4,  ## add custom x-axis
     labels= labels,cex.axis=0.30)
box(bty="l")         ## add box
text(xre1, y1+0.03, labelsre1, cex = 0.65, pos= 3)
text(lre1, y1+0.03, labelsre2, cex = 0.65, pos= 3)
text(ure1, y1+0.03, labelsre3, cex = 0.65, pos= 3)

##Ejemplo 2: Intervalo de Confianza para la proporción de la variable ‘depresion_pp’ post parto

library(haven)
p <- sum(as_factor(data$depresion_pp) == "Si", na.rm = TRUE) / sum(!is.na(data$depresion_pp))
print(p)
[1] 0.2202298

En otra instancia, se ha considerado necesario analizar el tema de la depresión post parto en las mujeres, donde los datos reflejan que el 22% de las mismas tienen depresion depues de parto, mientras que, el 77,8 % no ha sufrido de depresion, lo cual es un tanto alarmante ya que, un fuerte número sufre de aquel dilema psicológico.

n <- length(data$depresion_pp)
print(n)
[1] 16451

Calcular el error estandar

error_estandarp <- sqrt((p * (1 - p)) / n)
print(error_estandarp)
[1] 0.003230912

El error estandar de la proporcion de las mujeres con depresion post parto es de 0,0032, lo cual muestra que la cantidad presentada por este estudio técnico difiere en una proporción significativamente baja con relación a la población completa de mujeres.

margen_errorp <- z * error_estandarp
print(margen_errorp)
[1] 0.006332472

El margen de error de la proporcion de las mujeres ecuatorianas con depresion post parto es de 0,006, lo cual nos pone en evidencia que existe una probabilidad considerablemente baja que los resultados de este estudio cambien, si acaso se hicieran otros análisis tomando como referencia toda la población de mujeres de Ecuador.

#Calcular los límites del intervalo de confianza

IC_inferiorp <- p - margen_errorp
print(IC_inferiorp)
[1] 0.2138973
IC_superiorp <- p + margen_errorp
print(IC_superiorp)
[1] 0.2265622

Las mujeres con depresion post parto en el Ecuador estarian entre el 21,38% y el 22,65%, ya que, no existe una variación tan alta en cuanto a mujeres que sufren de depresión post parto, estando dicha depresión acentuada mayormente en las madres adolescentes y las que no mantienen establidad mental ni económica, lo cual genera excesiva incertidumbre.

##Muestre el intervalo de confianza

cat("El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [", IC_inferiorp, ",", IC_superiorp, "]")
El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [ 0.2138973 , 0.2265622 ]
intervalo95p<-cbind(IC_inferiorp,p,IC_superiorp);intervalo95p #Para transformar a matriz
     IC_inferiorp         p IC_superiorp
[1,]    0.2138973 0.2202298    0.2265622
colnames(intervalo95p)<-c("IC_low","p","IC_high");intervalo95p #Para cambiar nombres más cortos de columnas
        IC_low         p   IC_high
[1,] 0.2138973 0.2202298 0.2265622

##Una forma mas simplificada para las proporciones

library(haven)
depresion_factor <- as_factor(data$depresion_pp)

prop_test <- prop.test(
  sum(depresion_factor == "Si", na.rm = TRUE),  # éxitos
  sum(!is.na(depresion_factor)),                # total válido
  conf.level = 0.95
)
print(prop_test$conf.int)
[1] 0.2139329 0.2266579
attr(,"conf.level")
[1] 0.95

##Pruebas de hipotesis de medias

H0: El ingreso promedio poblacional es igual a $450

HA: El ingreso promedio poblacional es diferente a $450

Realizar una prueba t para una sola muestra

t_prueba <- t.test(data$ingrl, mu = 450, conf.level = 0.95)
print(t_prueba)

    One Sample t-test

data:  data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 450
95 percent confidence interval:
 157.6220 167.7046
sample estimates:
mean of x 
 162.6633 

Analisis: p valor significativo, por lo tanto, procedo a rechazar la hipótesis nula y acepto la hipótesis alternativa, dado que el ingreso promedio de las mujeres ecuatorianas es de $162,66, lo cual tecnicamente es diferente del Salario Basico Unificado, siendo una cifra fuertemente baja.

if (t_prueba$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es igual a 450.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.

Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’

H0: El ingreso promedio poblacional es mayor e igual a $450

HA: El ingreso promedio poblacional es menor a $450

t_prueba2 <- t.test(data$ingrl, mu = 450, alternative = "less", conf.level = 0.95)
print(t_prueba2)

    One Sample t-test

data:  data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is less than 450
95 percent confidence interval:
    -Inf 166.894
sample estimates:
mean of x 
 162.6633 

Interpretar los resultados:

if (t_prueba$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es menor a 450.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es mayor e igual a 450.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es menor a 450.

Prueba de hipótesis de proporciones

Supongamos que queremos realizar una prueba de hipótesis para proporción de ‘depresion_pp’

H0: La proporción poblacional es igual a 0.10

HA: La proporción poblacional es diferente a 0.10

library(haven)
depresion <- as_factor(data$depresion_pp)
prop_test <- prop.test(
  sum(depresion == "Si", na.rm = TRUE),              # cantidad de "Si"
  sum(!is.na(depresion)),                            # total válido
  p = 0.10,                                          # proporción esperada
  conf.level = 0.95
)
print(prop_test)

    1-sample proportions test with continuity correction

data:  sum(depresion == "Si", na.rm = TRUE) out of sum(!is.na(depresion)), null probability 0.1
X-squared = 2640.9, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.1
95 percent confidence interval:
 0.2139329 0.2266579
sample estimates:
        p 
0.2202298 

Dado que el Pvalue es estadisticamente significativo, tenemos la evidencia para rechazar la Hipotesis alternativa, es decir, que la proporcion de mujeresque tienen depresion post parto difiere de 0,10: alcanzando en este caso el valor de 0,22.

# Interpretar los resultados:
# Si el valor p es menor a 0.05, rechazamos la hipótesis nula
if (prop_test$p.value < 0.05) {
  cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.\n")
} else {
  cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es igual a 0.10.\n")
}
Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.

REVISION DE LITERATURA

De acuerdo a [(Sierra Manzano, Carro García, and Ladrón Moreno 2002) menciona que la depresi[on post parto esta mayormente presente en naciones en vías de desarrollo, de manera particular en madres adolescentes y quienes tienen un nivel muy bajo de recursos. De manera similar lo afirma (Latorre-Latorre, Contreras-Pezzotti, and Herrán-Falla 2006) quienes hablan de la necesidad de adelantarse a realizar evaluaciones psicológicas a quienes tienen antecedentes de depresión o traumatismo de la niñez.

##Referencias

References

Latorre-Latorre, J. F., L. M. Contreras-Pezzotti, and O. F. Herrán-Falla. 2006. “Depresión posparto en una ciudad colombiana. Factores de riesgo.” Atención Primaria 37 (6): 332–38. https://doi.org/10.1157/13086714.
Sierra Manzano, J. M., T. Carro García, and E. Ladrón Moreno. 2002. “Variables asociadas al riesgo de depresión posparto. Edinburgh Postnatal Depression Scale.” Atención Primaria 30 (2): 103–11. https://doi.org/10.1016/s0212-6567(02)78979-8.