El formato de respuesta es el siguiente:

Abajo del encabezado, debe estar escrita la pregunta. Agregar los códigos en chunks e incluir el output de ser necesario.

La explicación de las respuestas (si es que hay análisis) debe ir como texto, fuera del chunk.

El título del informe debe ser “Tarea 3” y el nombre de los integrantes debe ir en autor. La actividad deberá ser entregado en link de rpubs.

También debe enviar su archivo en formato R Markdown como respaldo.

Recuerde que puede usar todo el material visto para apoyarse.

Todos los integrantes del grupo deben enviar el archivo de Rmarkdown

Tienen hasta el domingo 19 de septiembre a las 23:55 hrs para enviar la tarea.

El formato tiene puntaje.(3 ptos)

Suprimir warning y mensajes(3 ptos)

Cargue las librerias data.table y ggplot2. Además cargue la bases de datos del ive, a este objeto llamelo ive rm(list=ls())

library(data.table)
library(ggplot2)

path <- 'C:/Users/Rorro Bielenberg/Desktop/UAI/Data Science/Tarea 3/'
ive <- fread(paste0(path,'IVE.csv'), encoding="UTF-8")
ive[MES=="1.ENERO",MES:="01"]
ive[MES=="2.FEBRERO",MES:="02"]
ive[MES=="3.MARZO",MES:="03"]
ive[MES=="4.ABRIL",MES:="04"]
ive[MES=="5.MAYO",MES:="05"]
ive[MES=="6.JUNIO",MES:="06"]
ive[MES=="7.JULIO",MES:="07"]
ive[MES=="8.AGOSTO",MES:="08"]
ive[MES=="9.SEPTIEMBRE",MES:="09"]
ive[MES=="10.OCTUBRE",MES:="10"]
ive[MES=="11.NOVIEMBRE",MES:="11"]
ive[MES=="12.DICIEMBRE",MES:="12"]
ive <- ive[MES!='SIN INFORMACIÓN']
ive$AÑO <- as.character(ive$AÑO)
ive[,fecha:=as.Date(paste0(AÑO,"-",MES,"-01"))]

Pregunta 1 Cree una nueva variable llamada tipo_causal donde:

CAUSAL tipo_causal Causal 1 Peligro mujer Causal 2 Inviabilidad fetal Causal 3 Violación

ive[CAUSAL == "Causal 1", tipo_causal := "Peligro mujer"]
ive[CAUSAL == "Causal 2", tipo_causal := "Inviabilidad fetal"]
ive[CAUSAL == "Causal 3", tipo_causal := "Violacion"]

Pregunta 2 Realice un análisis descriptivo de la variable edad, esto es, cuál es la edad promedio de las mujeres que hayan abortado, la edad minima, edad máxima.

summary(ive$EDAD_MUJER)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   11.00   24.00   30.00   29.61   36.00   48.00      10

#La edad promedio es de 30 años, la minima es de 11 y la maxima es de 48.

Pregunta 3 Realice un histograma con la edad de las mujeres que deciden interrumpir su embarazo independiente de la causal

ggplot(ive,aes(EDAD_MUJER)) +
  geom_histogram()

Pregunta 4 ¿Cuántas mujeres tienen cada tipo de previsión? Agrupe las mujeres que no informaron que previsión tenian, SIN PREVISIÓN y DESCONOCIDO como NINGUNA, SISTEMA PREVISIONAL DE LAS FFAA como CAPREDENA

ive[PREVISION_SALUD == "SIN PREVISIÓN", PREVISION_SALUD := "NINGUNA"]
ive[PREVISION_SALUD == "DESCONOCIDO", PREVISION_SALUD := "NINGUNA"]
ive[PREVISION_SALUD == "SIN INFORMACIÓN", PREVISION_SALUD := "NINGUNA"]
ive[PREVISION_SALUD == "SISTEMA PREVISIONAL DE LAS FFAA", PREVISION_SALUD := "CAPREDENA"]

ive[,.N,by=.(PREVISION_SALUD)]
##    PREVISION_SALUD    N
## 1:          FONASA 2152
## 2:          ISAPRE  299
## 3:         NINGUNA   73
## 4:            SISA    4
## 5:       CAPREDENA    6
## 6:         DIPRECA   14

Pregunta 5 ¿Cuántas mujeres por causal hay en cada previsión? Muestre un grafico de barras de todos los tipos vistos en clases.

ive[,.N,by=.(PREVISION_SALUD, tipo_causal)]
##     PREVISION_SALUD        tipo_causal    N
##  1:          FONASA      Peligro mujer  713
##  2:          ISAPRE      Peligro mujer   52
##  3:         NINGUNA      Peligro mujer   26
##  4:            SISA      Peligro mujer    1
##  5:       CAPREDENA      Peligro mujer    2
##  6:         DIPRECA      Peligro mujer    1
##  7:          FONASA Inviabilidad fetal 1028
##  8:          ISAPRE Inviabilidad fetal  226
##  9:         NINGUNA Inviabilidad fetal   19
## 10:            SISA Inviabilidad fetal    3
## 11:       CAPREDENA Inviabilidad fetal    4
## 12:         DIPRECA Inviabilidad fetal   11
## 13:          FONASA          Violacion  411
## 14:         NINGUNA          Violacion   28
## 15:          ISAPRE          Violacion   21
## 16:         DIPRECA          Violacion    2
ggplot(ive,aes(x=tipo_causal, fill=PREVISION_SALUD)) + geom_bar(position = 'dodge')

Pregunta 6 Elija alguno de los gráficos hechos anteriormente y muestre esta información por tipo_causal. Además agregue etiquetas a los ejes, títulos y subtítulos, además de que el eje x sea lejible.

ggplot(ive, aes(x=tipo_causal)) + geom_bar() +
    ggtitle(expression(atop("Mujeres por Cuasal", atop(italic("Fuente: IVE"), "")))) +
    labs(x = "Tipos de Causales",y = "Numero de Mujeres")

Pregunta 7 Cree un nuevo objeto ive1 donde cuente la cantidad de abortos por la variable fecha y tipo_causal. Tenga en cuenta que debe filtrar la base donde HITO2_DECISION_MUJER_IVE sea igual a INTERRUMPIR EL EMBARAZO.

Luego realice un gráfico donde muestre la cantidad de abortos por fecha y causa.

ive1 <- ive[HITO2_DECISION_MUJER_IVE== "INTERRUMPIR EL EMBARAZO",.N,by=.(fecha,tipo_causal)]


ggplot(ive1, aes(x=fecha,y=N, fill=tipo_causal))+
  geom_bar(stat='identity')

Pregunta 8 Agregar etiquetas a los ejes, títulos y subtítulos al gráfico de la pregunta 6.

ggplot(ive1, aes(x=fecha,y=N, fill=tipo_causal))+
  geom_bar(stat='identity') + 
  ggtitle(expression(atop("Abortos por Fecha y Causal", atop(italic("Fuente: IVE"), "")))) +
    labs(x = "FECHA",y = "Numero de Mujeres")

Pregunta 9 ¿Existe alguna relación entre la edad de la mujer con la edad gestacional diferenciando por la causal?

ggplot(ive,aes(x=EDAD_MUJER, y=HITO1_EDAD_GESTACIONAL_SEMANAS, fill=tipo_causal)) +  geom_point() + geom_smooth()

#Si existe una relación. Por ejemplo, en el caso de violación, existe una relacíon entre la edad gestacional semanal, que tiende a ser menor a 10 semanas, para toda edad de las mujeres. Mientras que en el caso de inviabilidad fetal o peligro mujer, la edad de gestacion semanal se mantiene cerca de las 20 semanas, siendo bastantes similares entre ellas, ya que ambas dependen de la salud de la mujer, destacando que estas generalmente desean tener a ese hijo.