library(haven)
data <- read_dta("Data1_R.dta")
View(data)Tarea 2
Encuesta
library(dplyr) # Para manipular los datos
library(ggplot2) # Para crear gráficos
library("foreign") #Cargas datos .dta
library("msm")
library("car")
require(plotrix)
library("plotrix")
Cambiar sitio carpeta
setwd("C:/Users/JEFERSON CHAMBA/Desktop/Tarea 2")
Verificar las primeras filas del conjunto de datos head(data)
Ejemplo 1: Intervalo de Confianza para la media de la variable ‘ingrl’
Calcular la media y la desviación estándar de la variable ‘ingrl’
Calcula la media
media <- mean(data$ingrl, na.rm = TRUE)
print (media)[1] 162.6633
Calcula la desviación estándar
desviacion <- sd(data$ingrl, na.rm = TRUE)
print (desviacion)[1] 329.8832
Número de observaciones
n <- length(data$ingrl)
print (n)[1] 16451
summary(data$ingrl) Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0 0.0 0.0 162.7 200.0 3000.0
Calcular el error estándar
error_estandar <- desviacion / sqrt(n)
print (error_estandar)[1] 2.571959
Calcular el intervalo de confianza al 95%
Z-score para un intervalo de confianza del 95%
z <- qnorm(0.975)
print (z)[1] 1.959964
Z-score para un intervalo de confianza del 90%
z2<- qnorm(0.95)
print (z2)[1] 1.644854
Z-score para un intervalo de confianza del 99%
z3<- qnorm(0.995)
print (z3)[1] 2.575829
Margen de error
margen_error <- z * error_estandar
print (margen_error)[1] 5.040948
Intervalo de confianza
IC_inferior <- media - margen_error
IC_superior <- media + margen_error
print (IC_inferior)[1] 157.6223
print (IC_superior)[1] 167.7042
Mostrar el intervalo de confianza
cat("El intervalo de confianza para la media de 'ingrl' es: [", IC_inferior, ",", IC_superior, "]\n")El intervalo de confianza para la media de 'ingrl' es: [ 157.6223 , 167.7042 ]
cbind imprime texxto en columnas
intervalo95<-cbind(IC_inferior,media,IC_superior);intervalo95 IC_inferior media IC_superior
[1,] 157.6223 162.6633 167.7042
Otra forma de impirmir los resultados
colnames(intervalo95)<-c("IC_low","media","IC_high");intervalo95 IC_low media IC_high
[1,] 157.6223 162.6633 167.7042
Una forma más simplificada de calcular un intervalo de confianza
media_test <- t.test(data$ingrl, conf.level = 0.95)
print(media_test$conf.int)[1] 157.6220 167.7046
attr(,"conf.level")
[1] 0.95
Plotear los Intervalos de Confianza en un gráfico”
labels<-c("CI_95")
names(labels)<-labelsround es para redondear, es este caso dos digitos
labelsre1<-round(c(media),2)
labelsre2<-round(c(IC_inferior),2)
labelsre3<-round(c(IC_superior),2) names(labelsre1)<-labelsre1xre1<-c(media)
y1<-(4)
lre1<-c(IC_inferior)
ure1<-c(IC_superior)(repos = c(CRAN = "https://cloud.r-project.org")) CRAN
"https://cloud.r-project.org"
library(plotrix)
plotCI(xre1,y1, ui=ure1,li=lre1,col="#898989",scol="#898989",
err="x",
axes=FALSE,
pch=21,
pt.bg=16,
cex = 0.30,
slty = 1,
lwd=1,
xlab="",
ylab="",
ylim=c(1,7),
xlim=c(154,169),
main="Intervalo de Confianza para el Ingreso Promedio",
cex.main=0.85,
font.main = 1)
abline(v = xre1, col = "red",lty = 2)
#text(-200,"Media",col="blue")
axis(side=1,cex.axis=0.65)
axis(side=2,at=4,
labels= labelsre1,cex.axis=0.30)
box(bty="l")
text(xre1, y1+0.03, labelsre1, cex = 0.65, pos= 3)
text(lre1, y1+0.03, labelsre2, cex = 0.65, pos= 3)
text(ure1, y1+0.03, labelsre3, cex = 0.65, pos= 3)Ejemplo 2: Intervalo de Confianza para la proporción de la variable ‘depresion_pp’ post parto
Calcular la proporción muestral p
library(haven)
p <- sum(as_factor(data$depresion_pp) == "Si", na.rm = TRUE) / sum(!is.na(data$depresion_pp))
print(p)[1] 0.2202298
Tamaño de la muestra
n <- length(data$depresion_pp)
print(n)[1] 16451
Calcular el error estándar
error_estandarp <- sqrt((p * (1 - p)) / n)
print(error_estandarp)[1] 0.003230912
El error estandar de la proporción del promedio de mujeres ecuatorianas con depresión post parto es de 0.0032
Calcular el margen de error
margen_errorp <- z * error_estandarp
print(margen_errorp)[1] 0.006332472
El margen de error de la proporción del promedio de mujeres ecuatorianas con depresión post parto es de 0.0063
Calcular los límites del intervalo de confianza
IC_inferiorp <- p - margen_errorp
IC_superiorp <- p + margen_errorp
print(IC_inferiorp)[1] 0.2138973
print(IC_superiorp)[1] 0.2265622
De la muestra de las mujeres proemdio ecuatorianas en el 2018 la depresion posparto esta entre 21.39 % y 22,75 $ valor alto evidenciando la necesidad inmediata por parte del estado mediante el gobierno de turno en la formulación de politicas publicas que ayuden a un mejor acompañamiento en las mujeres que han tenido un hijo o tambien analizando el caso para identificar cuales nomas son los factores que intervienen en esta depresión.
cat("El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [", IC_inferiorp, ",", IC_superiorp, "]")El intervalo de confianza para la media de 'mujeres con depresión post partol' es: [ 0.2138973 , 0.2265622 ]
intervalo95p<-cbind(IC_inferiorp,p,IC_superiorp);intervalo95p IC_inferiorp p IC_superiorp
[1,] 0.2138973 0.2202298 0.2265622
colnames(intervalo95p)<-c("IC_low","p","IC_high");intervalo95p IC_low p IC_high
[1,] 0.2138973 0.2202298 0.2265622
Una forma más simplificada de calcular un intervalo de confianza para proporciones
library(haven)
depresion_factor <- as_factor(data$depresion_pp)
prop_test <- prop.test(
sum(depresion_factor == "Si", na.rm = TRUE), # éxitos
sum(!is.na(depresion_factor)), # total válido
conf.level = 0.95
)
print(prop_test$conf.int)[1] 0.2139329 0.2266579
attr(,"conf.level")
[1] 0.95
Ejemplo 3: Prueba de hipótesis de Medias
Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’
H0: El ingreso promedio poblacional es igual a $450
HA: El ingreso promedio poblacional es diferente a $450
Realizar una prueba t para una sola muestra
t_prueba <- t.test(data$ingrl, mu = 450, conf.level = 0.95)
print(t_prueba)
One Sample t-test
data: data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 450
95 percent confidence interval:
157.6220 167.7046
sample estimates:
mean of x
162.6633
p valor significativo, por lo tanto, rechazo la hipótesis nula y no rechazo la hipótesis alternativa, dado que el ingreso promedio de las mujeres en Ecuador es de 162.66.
Interpretar los resultados: Si el valor p es menor a 0.05, rechazamos la hipótesis nula
if (t_prueba$p.value < 0.05) {
cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.\n")
} else {
cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es igual a 450.\n")
}Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media de 'ingrl' es diferente de 450.
Supongamos que queremos realizar una prueba de hipótesis para la media de ‘ingrl’
H0: El ingreso promedio poblacional es mayor e igual a $450
HA: El ingreso promedio poblacional es menor a $450
t_prueba2 <- t.test(data$ingrl, mu = 450, alternative = "less", conf.level = 0.95)
print(t_prueba2)
One Sample t-test
data: data$ingrl
t = -111.72, df = 16450, p-value < 2.2e-16
alternative hypothesis: true mean is less than 450
95 percent confidence interval:
-Inf 166.894
sample estimates:
mean of x
162.6633
p valor significativo, por lo tanto, rechazo la hipótesis nula y no rechazo la hipótesis alternativa dado que el ingreso promedio poblacional es de 162.66 osea menor a 450.
Interpretar los resultados: Si el valor p es menor a 0.05, rechazamos la hipótesis nula
if (t_prueba$p.value < 0.05) {
cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es menor a 450.\n")
} else {
cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es mayor e igual a 450.\n")
}Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la media poblacional de 'ingrl' es menor a 450.
Ejemplo 4: Prueba de hipótesis de proporciones
Supongamos que queremos realizar una prueba de hipótesis para proporción de ‘depresion_pp’
H0: La proporción poblacional con las mujeres post parto es igual a 0.10
HA: La proporción poblacional con las mujeres post parto es diferente a 0.10
library(haven)
depresion <- as_factor(data$depresion_pp)
prop_test <- prop.test(
sum(depresion == "Si", na.rm = TRUE), # cantidad de "Si"
sum(!is.na(depresion)), # total válido
p = 0.10, # proporción esperada
conf.level = 0.95
)
print(prop_test)
1-sample proportions test with continuity correction
data: sum(depresion == "Si", na.rm = TRUE) out of sum(!is.na(depresion)), null probability 0.1
X-squared = 2640.9, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.1
95 percent confidence interval:
0.2139329 0.2266579
sample estimates:
p
0.2202298
mediante una prueba bilateral rechazamos nuestra hipotesis nula ya que la depresión pos parto es diferente de 0.10
Interpretar los resultados: Si el valor p es menor a 0.05, rechazamos la hipótesis nula
if (prop_test$p.value < 0.05) {
cat("Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.\n")
} else {
cat("No rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es igual a 0.10.\n")
}Rechazamos la hipótesis nula: Entonces tenemos evidencia de que la proporción de 'depresion_pp' es diferente a 0.10.
Revisión de Literatura
De acuerdo (Merialdi 2023) crean El OdonAssist™, un dispositivo en investigación para el parto vaginal asistido (PVA), podría aportar un nuevo punto de vista a este debate, ya que los ensayos clínicos previos a la comercialización indican un perfil de seguridad fetal positivo, relativa facilidad de uso, requisitos de capacitación limitados y alta aceptabilidad de las mujeres.
En un objetivo por centrar esfuerzos en el pos parto (Vila-Candel et al. 2021) mencionan que un estudio observacional descriptivo, retrospectivo y multicéntrico realizado a través de la revisión de historias clínicas de gestantes ingresadas para parto entre el 1 de marzo y el 30 de junio de 2020.