###Pregunta 1 Limpie el environment para comenzar a trabajar. (1 punto)
rm(list= ls())
El environment esta limpio
###Pregunta 2 Cargue los paquetes necesarios para trabajar con DT. (1 punto)
library(data.table)
library(knitr)
Para cargar data table se usa la funcion library
###Pregunta 3 Abra las bases de datos egresos y Enfermedades. (3 puntos)
egresos <- readRDS("/Users/antoniasalinas/Desktop/Data Science/Control 1 /egresos.RDS")
class(egresos)
## [1] "data.frame"
egresos <- as.data.table(egresos)
class(egresos)
## [1] "data.table" "data.frame"
Abri base de datos egresos, y cambie su formato de data.frame a data.table
enfermedades <- fread("/Users/antoniasalinas/Desktop/Data Science/Control 1 /Enfermedades.csv")
Abri la base de datos enfermedades.
###Pregunta 4### Muestre cuántas personas de cada región hay en la base egresos. (3 puntos)**
egresos[,.N, by= REGION]
## REGION N
## 1: 2 47329
## 2: 13 516477
## 3: 14 23380
## 4: 99 4804
## 5: 5 128170
## 6: 15 18023
## 7: 1 26275
## 8: 6 46286
## 9: 10 64371
## 10: 12 20623
## 11: 3 15970
## 12: 8 18543
## 13: 9 18721
## 14: 7 16674
## 15: 4 51373
## 16: 591 156
## 17: 11 1707
## 18: 2000 240
## 19: 51 72
## 20: 54 84
Vemos el numero que hay en cada region
###Pregunta 5 Repita la pregunta anterior, pero esta vez considerando solo a las 15 regiones de Chile
egresos [REGION!= 99 & REGION!= 591 & REGION!= 2000 & REGION!= 51 & REGION!= 54 ,.N, by ="REGION"]
## REGION N
## 1: 2 47329
## 2: 13 516477
## 3: 14 23380
## 4: 5 128170
## 5: 15 18023
## 6: 1 26275
## 7: 6 46286
## 8: 10 64371
## 9: 12 20623
## 10: 3 15970
## 11: 8 18543
## 12: 9 18721
## 13: 7 16674
## 14: 4 51373
## 15: 11 1707
###Pregunta 6 Existe una inconsistencia en la base de datos egresos, ya que hay personas que tienen más días de estadía en el hospital que días vividos. Por lo tanto, debemos eliminar estos casos de la base de datos. Para esto, cree una nueva variable que corresponda a los días de vida de una persona y elimine aquellas observaciones que tengan más días de estadía en un hospital que días de vida.
egresos[,edad.dias:= EDAD*365]
egresos[,incosistencia:=edad.dias-DIAS_ESTAD]
###Pregunta 7 ¿Cuántas personas hay según previsión en la base egresos?
egresos[,.N, by= Prevision]
## Prevision N
## 1: FONASA 687209
## 2: ISAPRE 234500
## 3: DIPRECA 22047
## 4: CAPREDENA 21701
## 5: OTRA 22021
## 6: SIN PREVISION 28522
## 7: IGNORADA 3278
Hay tal cantidad de personas en cada previsión
###Pregunta 8 Realice un resumen de las características de las personas de la base egresos según su previsión y sexo. Este resumen debe contener: edad promedio y días de estadía promedio en un hospital.
resumen <- egresos [,mean(EDAD),by=. (Prevision,SEXO)]
resumen_ <- egresos [,mean(DIAS_ESTAD),by=. (Prevision, SEXO)]
###Pregunta 9 Cree un nuevo objeto que corresponda a un merge entre la base egresos y Enfermedades.
egresos_enfermedades <- merge (x=egresos, y= enfermedades, by.x= "Tipo_Tratamiento",by.y = "Codigo",all.x= T)
Cree el nuevo objeto uniendo las bases de datos
###Pregunta 10 Ahora queremos identificar, con este nuevo objeto, la proporción de enfermos que hay por región y tipo de tratamiento,es decir, del total de enfermos por región cuántos corresponden a cada tratamiento.
Enf_Region<-egresos_enfermedades[,.N,by=.(REGION)]
Enf_Tratamientos<-egresos_enfermedades[,.N, by=.(Tratamiento)]
Merge.ET<-merge (x=Enf_Region, y= Enf_Tratamientos,all.x= T)
###Pregunta 11 ¿En qué región se atienden quienes tienen que realizarse cirugías y de qué región provienen?
###Pregunta 12 ¿Las personas suelen atenderse en la misma región donde viven? Para respoder esta pregunta, puedes modificar el objeto creado en la pregunta 11 y así podrás visualizar mejor la información. ¿Cuántas personas se realizan intervenciones quirúrgicas en su región y cuantas en otra?
###BONUS Realice el mismo ejercicio de la pregunta 11 y 12, pero considerando a aquellas personas que pertenecen a Fonasa y se realizan intervenciones quirúrgicas.¿Cambia en algo el análisis con respecto a las preguntas anteriores?