1.Limpie el enviroment para comenzar desde cero. (1 punto)
rm(list=ls())
library(data.table)
2.Abra las bases de datos egresos y Enfermedades. (3 puntos)
path<-"C:/Users/Usuario/Desktop/data"
setwd(path)
enfermedades<-fread("Enfermedades.csv")
enfermedades<-as.data.table(enfermedades)
class(enfermedades)
## [1] "data.table" "data.frame"
egresos<-readRDS("egresos.RDS")
class(egresos)
## [1] "data.frame"
egresos<-as.data.table(egresos)
3.Muestre cuántas personas de cada región hay en la base egresos. (3 puntos)
tabla1<-egresos[,.N,by=REGION]
4.Solucione el problema de la pregunta anterior y considere solo las 15 regiones de Chile. (3 puntos)
regionesmalas <- c("52","54","99", "591", "2000")
egresos <- egresos[!egresos$REGION %in% regionesmalas]
5.Existe una inconsistencia en la base de datos egresos, ya que hay personas que tienen más días de estadía en el hospital que días vividos. Por lo tanto, debemos eliminar estos casos de la base de datos. Para esto, cree una nueva variable que corresponda a los días de vida de una persona y elimine aquellas observaciones que tengan más días de estadía en un hospital que días de vida. (5 puntos)
names(egresos)
## [1] "Tipo_Tratamiento" "ESTAB" "Seremi" "ServicioSalud"
## [5] "SEXO" "EDAD" "PREVI" "BENEF"
## [9] "MOD" "COMUNA" "REGION" "SERV_RES"
## [13] "FECHA_EGR" "SERC_EGR" "DIAG1" "DIAG2"
## [17] "DIAS_ESTAD" "COND_EGR" "INTERV_Q" "Prevision"
## [21] "CodRegion_ESTAB" "Tipo_ESTAB"
egresos[,dias_de_vida:=EDAD*365]
egresos<-egresos[!(dias_de_vida<DIAS_ESTAD)]
6.¿Cuántas personas hay según previsión en la base egresos? (3 puntos)
tabla2<-egresos[,.N,by=Prevision]
7.Realice un resumen de las características de las personas de la base egresos según su previsión y sexo. Este resumen debe contener: edad promedio y días de estadía promedio en un hospital. (5 puntos)
names(egresos)
## [1] "Tipo_Tratamiento" "ESTAB" "Seremi" "ServicioSalud"
## [5] "SEXO" "EDAD" "PREVI" "BENEF"
## [9] "MOD" "COMUNA" "REGION" "SERV_RES"
## [13] "FECHA_EGR" "SERC_EGR" "DIAG1" "DIAG2"
## [17] "DIAS_ESTAD" "COND_EGR" "INTERV_Q" "Prevision"
## [21] "CodRegion_ESTAB" "Tipo_ESTAB" "dias_de_vida"
resumen<- egresos[,.(mean(EDAD,na.rm = TRUE),mean(DIAS_ESTAD,na.rm = TRUE)),by=.(Prevision,SEXO)]
names(resumen)[3]<-"Edad Promedio"
names(resumen)[4]<-"Estadía Promedio"
8.Cree un nuevo objeto que corresponda a un merge entre la base egresos y Enfermedades. (5 puntos)
names(enfermedades)[1]<-"Tipo_Tratamiento"
hospital<-merge(x=egresos,y=enfermedades,by="Tipo_Tratamiento")
names(hospital)
## [1] "Tipo_Tratamiento" "ESTAB" "Seremi" "ServicioSalud"
## [5] "SEXO" "EDAD" "PREVI" "BENEF"
## [9] "MOD" "COMUNA" "REGION" "SERV_RES"
## [13] "FECHA_EGR" "SERC_EGR" "DIAG1" "DIAG2"
## [17] "DIAS_ESTAD" "COND_EGR" "INTERV_Q" "Prevision"
## [21] "CodRegion_ESTAB" "Tipo_ESTAB" "dias_de_vida" "Tratamiento"
9.Ahora queremos identificar, con este nuevo objeto, la proporción de enfermos que hay por región y tipo de tratamiento,es decir, del total de enfermos por región cuántos corresponden a cada tratamiento. (8 puntos)
tabla1<-hospital[,.N,by=REGION]
tabla3<-hospital[,.N,by=.(Tipo_Tratamiento,REGION)]
tabla_proporcion<-merge(tabla1, tabla3,by="REGION")
tabla_proporcion[,Proporcion:=N.y/N.x]
Pista: Para esto puede crear un objeto que contenga el total de enfermos por región, otro objeto que contenga el total de enfermos por tratamiento y región y luego unirlos para obtener el porcentaje.
10.¿En qué región se atienden los individuos que tienen que realizarse cirugías y de qué región provienen?. (5 puntos)
Pista: Para responder esta pregunta, primero debe identificar la cantidad de personas que se realizan intervenciones quirúrgicas según su región y la región del establecimiento donde se atienden.
11.¿Las personas suelen atenderse en sus regiones?. Para poder responder esta pregunta, es recomendable modificar el objeto anterior y así poder visualizar mejor la información. Para esto, se aconseja realizar un reshape y reemplazar los NApor valores 0. (5 puntos)
Bonus: Realice el mismo ejercicio de la pregunta 11 y 12, pero considerando a aquellas personas que pertenecen a Fonasa y se realizan intervenciones quirúrgicas.¿Cambia en algo el análisis con respecto a las preguntas anteriores? (5 puntos)}