El formato de respuesta es el siguiente:
Abajo del encabezado, debe estar escrita la pregunta. Agregar los códigos en chunks e incluir el output de ser necesario.
La explicación de las respuestas (si es que hay análisis) debe ir como texto, fuera del chunk.
El título del informe debe ser “Tarea 3” y el nombre de los integrantes debe ir en autor. La actividad deberá ser entregado en link de rpubs.
También debe enviar su archivo en formato R Markdown como respaldo.
Recuerde que puede usar todo el material visto para apoyarse.
Todos los integrantes del grupo deben enviar el archivo de Rmarkdown
Tienen hasta el domingo 19 de septiembre a las 23:55 hrs para enviar la tarea.
El formato tiene puntaje.(3 ptos)
Suprimir warning y mensajes(3 ptos)
Cargue las librerias data.table y ggplot2. Además cargue la bases de datos del ive, a este objeto llamelo ive rm(list=ls())
library(data.table)
library(ggplot2)
path <- 'C:/Users/Rorro Bielenberg/Desktop/UAI/Data Science/Tarea 3/'
ive <- fread(paste0(path,'IVE.csv'), encoding="UTF-8")
ive[MES=="1.ENERO",MES:="01"]
ive[MES=="2.FEBRERO",MES:="02"]
ive[MES=="3.MARZO",MES:="03"]
ive[MES=="4.ABRIL",MES:="04"]
ive[MES=="5.MAYO",MES:="05"]
ive[MES=="6.JUNIO",MES:="06"]
ive[MES=="7.JULIO",MES:="07"]
ive[MES=="8.AGOSTO",MES:="08"]
ive[MES=="9.SEPTIEMBRE",MES:="09"]
ive[MES=="10.OCTUBRE",MES:="10"]
ive[MES=="11.NOVIEMBRE",MES:="11"]
ive[MES=="12.DICIEMBRE",MES:="12"]
ive <- ive[MES!='SIN INFORMACIÓN']
ive$AÑO <- as.character(ive$AÑO)
ive[,fecha:=as.Date(paste0(AÑO,"-",MES,"-01"))]
Pregunta 1 Cree una nueva variable llamada tipo_causal donde:
CAUSAL tipo_causal Causal 1 Peligro mujer Causal 2 Inviabilidad fetal Causal 3 Violación
ive[CAUSAL == "Causal 1", tipo_causal := "Peligro mujer"]
ive[CAUSAL == "Causal 2", tipo_causal := "Inviabilidad fetal"]
ive[CAUSAL == "Causal 3", tipo_causal := "Violacion"]
Pregunta 2 Realice un análisis descriptivo de la variable edad, esto es, cuál es la edad promedio de las mujeres que hayan abortado, la edad minima, edad máxima.
summary(ive$EDAD_MUJER)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 11.00 24.00 30.00 29.61 36.00 48.00 10
#La edad promedio es de 30 años, la minima es de 11 y la maxima es de 48.
Pregunta 3 Realice un histograma con la edad de las mujeres que deciden interrumpir su embarazo independiente de la causal
ggplot(ive,aes(EDAD_MUJER)) +
geom_histogram()
Pregunta 4 ¿Cuántas mujeres tienen cada tipo de previsión? Agrupe las mujeres que no informaron que previsión tenian, SIN PREVISIÓN y DESCONOCIDO como NINGUNA, SISTEMA PREVISIONAL DE LAS FFAA como CAPREDENA
ive[PREVISION_SALUD == "SIN PREVISIÓN", PREVISION_SALUD := "NINGUNA"]
ive[PREVISION_SALUD == "DESCONOCIDO", PREVISION_SALUD := "NINGUNA"]
ive[PREVISION_SALUD == "SIN INFORMACIÓN", PREVISION_SALUD := "NINGUNA"]
ive[PREVISION_SALUD == "SISTEMA PREVISIONAL DE LAS FFAA", PREVISION_SALUD := "CAPREDENA"]
ive[,.N,by=.(PREVISION_SALUD)]
## PREVISION_SALUD N
## 1: FONASA 2152
## 2: ISAPRE 299
## 3: NINGUNA 73
## 4: SISA 4
## 5: CAPREDENA 6
## 6: DIPRECA 14
Pregunta 5 ¿Cuántas mujeres por causal hay en cada previsión? Muestre un grafico de barras de todos los tipos vistos en clases.
ive[,.N,by=.(PREVISION_SALUD, tipo_causal)]
## PREVISION_SALUD tipo_causal N
## 1: FONASA Peligro mujer 713
## 2: ISAPRE Peligro mujer 52
## 3: NINGUNA Peligro mujer 26
## 4: SISA Peligro mujer 1
## 5: CAPREDENA Peligro mujer 2
## 6: DIPRECA Peligro mujer 1
## 7: FONASA Inviabilidad fetal 1028
## 8: ISAPRE Inviabilidad fetal 226
## 9: NINGUNA Inviabilidad fetal 19
## 10: SISA Inviabilidad fetal 3
## 11: CAPREDENA Inviabilidad fetal 4
## 12: DIPRECA Inviabilidad fetal 11
## 13: FONASA Violacion 411
## 14: NINGUNA Violacion 28
## 15: ISAPRE Violacion 21
## 16: DIPRECA Violacion 2
ggplot(ive,aes(x=tipo_causal, fill=PREVISION_SALUD)) + geom_bar(position = 'dodge')
Pregunta 6 Elija alguno de los gráficos hechos anteriormente y muestre esta información por tipo_causal. Además agregue etiquetas a los ejes, títulos y subtítulos, además de que el eje x sea lejible.
ggplot(ive, aes(x=tipo_causal)) + geom_bar() +
ggtitle(expression(atop("Mujeres por Cuasal", atop(italic("Fuente: IVE"), "")))) +
labs(x = "Tipos de Causales",y = "Numero de Mujeres")
Pregunta 7 Cree un nuevo objeto ive1 donde cuente la cantidad de abortos por la variable fecha y tipo_causal. Tenga en cuenta que debe filtrar la base donde HITO2_DECISION_MUJER_IVE sea igual a INTERRUMPIR EL EMBARAZO.
Luego realice un gráfico donde muestre la cantidad de abortos por fecha y causa.
ive1 <- ive[HITO2_DECISION_MUJER_IVE== "INTERRUMPIR EL EMBARAZO",.N,by=.(fecha,tipo_causal)]
ggplot(ive1, aes(x=fecha,y=N, fill=tipo_causal))+
geom_bar(stat='identity')
Pregunta 8 Agregar etiquetas a los ejes, títulos y subtítulos al gráfico de la pregunta 6.
ggplot(ive1, aes(x=fecha,y=N, fill=tipo_causal))+
geom_bar(stat='identity') +
ggtitle(expression(atop("Abortos por Fecha y Causal", atop(italic("Fuente: IVE"), "")))) +
labs(x = "FECHA",y = "Numero de Mujeres")
Pregunta 9 ¿Existe alguna relación entre la edad de la mujer con la edad gestacional diferenciando por la causal?
ggplot(ive,aes(x=EDAD_MUJER, y=HITO1_EDAD_GESTACIONAL_SEMANAS, fill=tipo_causal)) + geom_point() + geom_smooth()
#Si existe una relación. Por ejemplo, en el caso de violación, existe una relacíon entre la edad gestacional semanal, que tiende a ser menor a 10 semanas, para toda edad de las mujeres. Mientras que en el caso de inviabilidad fetal o peligro mujer, la edad de gestacion semanal se mantiene cerca de las 20 semanas, siendo bastantes similares entre ellas, ya que ambas dependen de la salud de la mujer, destacando que estas generalmente desean tener a ese hijo.