options(repos = c(CRAN = "https://cloud.r-project.org"))
library(haven)Warning: package 'haven' was built under R version 4.4.3
data <- read_dta("Data1_R.dta")
View(data)Para el presente trabajo se ha considerado necesario tomar la base de datos de la Encuesta Nacional de Salud y Nutricion ENSANUT (2018) la cual considera como importante estudiar todo lo concerniente a la salud ciudadana a nivel de Ecuador, y en base a ello, establecer medidas que permitan a la población vulnerable acceder a una mejor alimentación, lo cual se refleje en s salud y bienestar.
Cambiar directorio de trabajo
setwd("C:/Users/LENOVO/Desktop/TAREA 2 ANDREA")
options(repos = c(CRAN = "https://cloud.r-project.org"))
library(haven)Warning: package 'haven' was built under R version 4.4.3
data <- read_dta("Data1_R.dta")
View(data)library(haven)
data <- read_dta("Data1_R.dta")
View(data)head(data)# A tibble: 6 × 50
area empleo region edad t_hijos nac_vivo_murieron mortinato_2
<dbl+lbl> <dbl+lbl> <dbl+l> <dbl> <dbl> <dbl+lbl> <dbl+lbl>
1 1 [Urbano] 1 [Trabajó al… 1 [Sie… 19 1 0 [No] 0 [No]
2 1 [Urbano] 0 [No trabajó] 1 [Sie… 23 1 0 [No] 0 [No]
3 1 [Urbano] 1 [Trabajó al… 1 [Sie… 38 5 0 [No] 0 [No]
4 1 [Urbano] 0 [No trabajó] 1 [Sie… 18 1 0 [No] 0 [No]
5 1 [Urbano] 0 [No trabajó] 1 [Sie… 21 1 0 [No] 0 [No]
6 1 [Urbano] 1 [Trabajó al… 1 [Sie… 22 1 0 [No] 0 [No]
# ℹ 43 more variables: depresion_pp <dbl+lbl>, intensidad_dpp <dbl+lbl>,
# etnia <dbl+lbl>, f2_s2_216_1 <dbl+lbl>, f2_s2_216_2 <dbl>,
# f2_s2_218_1_a <dbl+lbl>, tiempo_dpp <dbl+lbl>, f2_s5_504a_1 <dbl+lbl>,
# f2_s5_504b_1 <dbl+lbl>, f2_s5_504c_1 <dbl+lbl>, f2_s5_504d_1 <dbl+lbl>,
# f2_s5_504e_1 <dbl+lbl>, f2_s5_504f_1 <dbl+lbl>, f2_s5_504g_1 <dbl+lbl>,
# f2_s5_504h_1 <dbl+lbl>, f2_s5_504i_1 <dbl+lbl>, f2_s5_504j_1 <dbl+lbl>,
# f2_s5_504k_1 <dbl+lbl>, est_civil <dbl+lbl>, q_usted <dbl+lbl>, …
media <- mean(data$ingrl, na.rm = TRUE) # Calcula la media
print(media)[1] 162.6633
En este caso se puede visualizar que el promedio de salario de las mujeres ecuatorianas para el año 2018 alcanzó los $162,66, mismo que esta muy por debajo del SBU, dejando de esta forma en claro que, a la época actual la desigualdad se hace presente entre hombres/mujeres, generando una considerable diferencia, la cual se refleja en la disminución de los procesos de equidad por los que muchas personas han luchado durante décadas.
desviacion <- sd(data$ingrl, na.rm = TRUE) # Calcula la desviación estándar
print(desviacion)[1] 329.8832
De acuerdo con lo previo, la desviacion estándar de este caso es de $329,88, lo cual nos deja en claro que, existe una dispersión considerable con respecto al salario promedio que perciben las mujeres, lo cual es evidente en gran parte, porque, existen mujeres que tienen trabajos de alto rango, lo cual se refleja en su salario mensual.
n <- length(data$ingrl) # Número de observaciones
print(n)[1] 16451
summary(data$ingrl)
error_estandar <- desviacion / sqrt(n)
print(error_estandar)[1] 2.571959
Continuando con este análisis, el error estandar de los datos es de 2,57 el cual nos indica la distribución muestral de los datos objeto de estudio, en cuanto a lo que son sus variaciones de muestra a muestra.
z <- qnorm(0.975) # Z-score para un intervalo de confianza del 95%
z2<- qnorm(0.95) # Z-score para un intervalo de confianza del 90%
z3<- qnorm(0.995) # Z-score para un intervalo de confianza del 99%margen_error <- z * error_estandar # Margen de error
print(margen_error)[1] 5.040948
Por otro lado, el margen de error que existe en la data revisada es de 5.04, la cual nos deja en claro cuanto podrían variar los resultados de el presente estudio con respecto a los resultados que se lograrían obtener si se realizara el análisis a nivel de todas las mujeres del país, el cual según el INEC (2018) fueron 8 686 463.
IC_inferior <- media - margen_error
print(IC_inferior)[1] 157.6223
IC_superior <- media + margen_error
print(IC_superior)[1] 167.7042
cat("El intervalo de confianza para la media de 'ingrl' es: [", IC_inferior, ",", IC_superior, "]\n")El intervalo de confianza para la media de 'ingrl' es: [ 157.6223 , 167.7042 ]
intervalo95<-cbind(IC_inferior,media,IC_superior);intervalo95 #Para transformar a matriz IC_inferior media IC_superior
[1,] 157.6223 162.6633 167.7042
Como se logra observar, el intervalo de confianza entre el cual se mueve mayormente el ingreso de las mujeres es de $157,62 como límite inserior, y $167,70 como límite superior, manteniendo un salario promedio de $162,66.
colnames(intervalo95)<-c("IC_low","media","IC_high");intervalo95 #Para cambiar nombres más cortos de columnas IC_low media IC_high
[1,] 157.6223 162.6633 167.7042
##FORMA SIMPLIFICADA DE ENCONTRAR INTERVALOS
media_test <- t.test(data$ingrl, conf.level = 0.95)
print(media_test$conf.int)[1] 157.6220 167.7046
attr(,"conf.level")
[1] 0.95
Plotear los Intervalos de Confianza en un gráfico
labels<-c("CI_95")
names(labels)<-labelslabelsre1<-round(c(media),2)
labelsre2<-round(c(IC_inferior),2)
labelsre3<-round(c(IC_superior),2) names(labelsre1)<-labelsre1
xre1<-c(media)
y1<-(4)
lre1<-c(IC_inferior)
ure1<-c(IC_superior)options(repos = c(CRAN = "https://cloud.r-project.org"))
install.packages("plotrix")Installing package into 'C:/Users/LENOVO/AppData/Local/R/win-library/4.4'
(as 'lib' is unspecified)
package 'plotrix' successfully unpacked and MD5 sums checked
The downloaded binary packages are in
C:\Users\LENOVO\AppData\Local\Temp\Rtmpmgv58y\downloaded_packages
library(plotrix)
plotCI(xre1,y1, ui=ure1,li=lre1,col="#898989",scol="#898989",
err="x",
axes=FALSE, ## disable axes (including tick labels)
pch=21,
pt.bg=16,
cex = 0.30,
slty = 1,
lwd=1,
xlab="",
ylab="",
ylim=c(1,7),
xlim=c(154,169), ## suppress x-axis label
main="Intervalo de Confianza para el Ingreso Promedio",
cex.main=0.85,
font.main = 1)
abline(v = xre1, col = "red",lty = 2)
#text(-200,"Media",col="blue")
axis(side=1,cex.axis=0.65) ## add default y-axis (ticks+labels)
axis(side=2,at=4, ## add custom x-axis
labels= labels,cex.axis=0.30)
box(bty="l") ## add box
text(xre1, y1+0.03, labelsre1, cex = 0.65, pos= 3)
text(lre1, y1+0.03, labelsre2, cex = 0.65, pos= 3)
text(ure1, y1+0.03, labelsre3, cex = 0.65, pos= 3)##Ejemplo 2: Intervalo de Confianza para la proporción de la variable ‘depresion_pp’ post parto
library(haven)
p <- sum(as_factor(data$depresion_pp) == "Si", na.rm = TRUE) / sum(!is.na(data$depresion_pp))
print(p)[1] 0.2202298
En otra instancia, se ha considerado necesario analizar el tema de la depresión post parto en las mujeres, donde los datos reflejan que el 22% de las mismas tienen depresion depues de parto, mientras que, el 77,8 % no ha sufrido de depresion, lo cual es un tanto alarmante ya que, un fuerte número sufre de aquel dilema psicológico.
n <- length(data$depresion_pp)
print(n)[1] 16451
error_estandarp <- sqrt((p * (1 - p)) / n)
print(error_estandarp)[1] 0.003230912
El error estandar de la proporcion de las mujeres con depresion post parto es de 0,0032, lo cual muestra que la cantidad presentada por este estudio técnico difiere en una proporción significativamente baja con relación a la población completa de mujeres.
margen_errorp <- z * error_estandarp
print(margen_errorp)[1] 0.006332472
El margen de error de la proporcion de las mujeres ecuatorianas con depresion post parto es de 0,006, lo cual nos pone en evidencia que existe una probabilidad considerablemente baja que los resultados de este estudio cambien, si acaso se hicieran otros análisis tomando como referencia toda la población de mujeres de Ecuador.
#Calcular los límites del intervalo de confianza
IC_inferiorp <- p - margen_errorp
print(IC_inferiorp)[1] 0.2138973
IC_superiorp <- p + margen_errorp
print(IC_superiorp)[1] 0.2265622
Las mujeres con depresion post parto en el Ecuador estarian entre el 21,38% y el 22,65%, ya que, no existe una variación tan alta en cuanto a mujeres que sufren de depresión post parto, estando dicha depresión acentuada mayormente en las madres adolescentes y las que no mantienen establidad mental ni económica, lo cual genera excesiva incertidumbre.
##Muestre el intervalo de confianza
cat("El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [", IC_inferiorp, ",", IC_superiorp, "]")El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [ 0.2138973 , 0.2265622 ]
intervalo95p<-cbind(IC_inferiorp,p,IC_superiorp);intervalo95p #Para transformar a matriz IC_inferiorp p IC_superiorp
[1,] 0.2138973 0.2202298 0.2265622
colnames(intervalo95p)<-c("IC_low","p","IC_high");intervalo95p #Para cambiar nombres más cortos de columnas IC_low p IC_high
[1,] 0.2138973 0.2202298 0.2265622
##Una forma mas simplificada para las proporciones
library(haven)
depresion_factor <- as_factor(data$depresion_pp)
prop_test <- prop.test(
sum(depresion_factor == "Si", na.rm = TRUE), # éxitos
sum(!is.na(depresion_factor)), # total válido
conf.level = 0.95
)
print(prop_test$conf.int)[1] 0.2139329 0.2266579
attr(,"conf.level")
[1] 0.95
##Pruebas de hipotesis de medias
H0: El ingreso promedio poblacional es igual a $450
HA: El ingreso promedio poblacional es diferente a $450
Realizar una prueba t para una sola muestra
t_prueba <- t.test(data$ingrl, mu = 450, conf.level = 0.95)
print(t_prueba)
One Sample t-test
data: data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 450
95 percent confidence interval:
157.6220 167.7046
sample estimates:
mean of x
162.6633
Analisis: p valor significativo, por lo tanto, procedo a rechazar la hipótesis nula y acepto la hipótesis alternativa, dado que el ingreso promedio de las mujeres ecuatorianas es de $162,66, lo cual tecnicamente es diferente del Salario Basico Unificado, siendo una cifra fuertemente baja.
if (t_prueba$p.value < 0.05) {
cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.\n")
} else {
cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es igual a 450.\n")
}Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.
H0: El ingreso promedio poblacional es mayor e igual a $450
HA: El ingreso promedio poblacional es menor a $450
t_prueba2 <- t.test(data$ingrl, mu = 450, alternative = "less", conf.level = 0.95)
print(t_prueba2)
One Sample t-test
data: data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is less than 450
95 percent confidence interval:
-Inf 166.894
sample estimates:
mean of x
162.6633
if (t_prueba$p.value < 0.05) {
cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es menor a 450.\n")
} else {
cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es mayor e igual a 450.\n")
}Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es menor a 450.
Supongamos que queremos realizar una prueba de hipótesis para proporción de ‘depresion_pp’
H0: La proporción poblacional es igual a 0.10
HA: La proporción poblacional es diferente a 0.10
library(haven)
depresion <- as_factor(data$depresion_pp)
prop_test <- prop.test(
sum(depresion == "Si", na.rm = TRUE), # cantidad de "Si"
sum(!is.na(depresion)), # total válido
p = 0.10, # proporción esperada
conf.level = 0.95
)
print(prop_test)
1-sample proportions test with continuity correction
data: sum(depresion == "Si", na.rm = TRUE) out of sum(!is.na(depresion)), null probability 0.1
X-squared = 2640.9, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.1
95 percent confidence interval:
0.2139329 0.2266579
sample estimates:
p
0.2202298
Dado que el Pvalue es estadisticamente significativo, tenemos la evidencia para rechazar la Hipotesis alternativa, es decir, que la proporcion de mujeresque tienen depresion post parto difiere de 0,10: alcanzando en este caso el valor de 0,22.
# Interpretar los resultados:
# Si el valor p es menor a 0.05, rechazamos la hipótesis nula
if (prop_test$p.value < 0.05) {
cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.\n")
} else {
cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es igual a 0.10.\n")
}Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.
REVISION DE LITERATURA
De acuerdo a [(Sierra Manzano, Carro García, and Ladrón Moreno 2002) menciona que la depresi[on post parto esta mayormente presente en naciones en vías de desarrollo, de manera particular en madres adolescentes y quienes tienen un nivel muy bajo de recursos. De manera similar lo afirma (Latorre-Latorre, Contreras-Pezzotti, and Herrán-Falla 2006) quienes hablan de la necesidad de adelantarse a realizar evaluaciones psicológicas a quienes tienen antecedentes de depresión o traumatismo de la niñez.
##Referencias