Pregunta 1

Limpie el environment para comenzar a trabajar. (1 punto)

rm(list=ls())

Pregunta 2

Cargue los paquetes necesarios para trabajar con DT. (1 punto)

library(data.table)

Pregunta 3

Abra las bases de datos egresos y Enfermedades. (3 puntos)

Pista: Para los archivos .RDS utilice la función readRDS. Ojo que la base de datos no se abrirá como un DT, por lo tanto tiene que transformarla.

egresos <- readRDS("egresos.RDS")
egresos <- as.data.table(egresos)
enfermedades <- fread("Enfermedades.csv")

Pregunta 4

Muestre cuántas personas de cada región hay en la base egresos. (3 puntos)

egresos[,.N,by=REGION]

Pregunta 5

Repita la pregunta anterior, pero esta vez considerando solo a las 15 regiones de Chile

egresos <- egresos[REGION<=15]
egresos[,.N,by=REGION]

Pregunta 6

Existe una inconsistencia en la base de datos egresos, ya que hay personas que tienen más días de estadía en el hospital que días vividos. Por lo tanto, debemos eliminar estos casos de la base de datos. Para esto, cree una nueva variable que corresponda a los días de vida de una persona y elimine aquellas observaciones que tengan más días de estadía en un hospital que días de vida. (5 puntos)

egresos[,dias_vida:= EDAD*365]
egresos <- egresos[!DIAS_ESTAD>dias_vida]

Pregunta 7

¿Cuántas personas hay según previsión en la base egresos?

egresos[,.N,by=Prevision]

Pregunta 8

Realice un resumen de las características de las personas de la base egresos según su previsión y sexo. Este resumen debe contener: edad promedio y días de estadía promedio en un hospital. (5 puntos)

egresos[,.(edad_promedio=mean(EDAD),  dias_promedio=mean(DIAS_ESTAD)), by=.(Prevision, SEXO)]

Pregunta 9

Cree un nuevo objeto que corresponda a un merge entre la base egresos y Enfermedades. (5 puntos)

Pista: la variable identificador en la base egresos se llama Tipo_Tratamiento y en la base Enfermedades se llama Codigo. Por lo tanto, puede que renombrar una variable para que queden con el mismo nombre.

names(egresos)[1] <- "Codigo"
base_nueva <- merge(egresos,enfermedades,by="Codigo")

Pregunta 10

Ahora queremos identificar, con este nuevo objeto, la proporción de enfermos que hay por región y tipo de tratamiento,es decir, del total de enfermos por región cuántos corresponden a cada tratamiento. (8 puntos)

Pista: Para esto puede crear un objeto que contenga el total de enfermos por región, otro objeto que contenga el total de enfermos por tratamiento y región y luego unirlos para obtener el porcentaje.

Tabla1 <- base_nueva[,.N,by=REGION]
Tabla2 <- base_nueva[,.N,by=.(REGION,Tratamiento)]
TABLA <- merge(Tabla1,Tabla2, by="REGION")

TABLA[,porcentaje:=(N.y/N.x)*100]

BONUS

Pregunta 11

¿En qué región se atienden quienes tienen que realizarse cirugías y de qué región provienen? (5 puntos)

Pista: Para responder esta pregunta, primero debe identificar la cantidad de personas que se realizan intervenciones quirúrjicas según su región y la región del establecimiento donde se atienden.

movimientos <- base_nueva[INTERV_Q=="Sí",.N,  by=.(REGION,CodRegion_ESTAB)]

Pregunta 12

¿Las personas suelen atenderse en la misma región donde viven? Para respoder esta pregunta, puedes modificar el objeto creado en la pregunta 11 y así podrás visualizar mejor la información. ¿Cuántas personas se realizan intervenciones quirúrgicas en su región y cuantas en otra?

movimientos[,mismaregion:=0]
movimientos[REGION==CodRegion_ESTAB,mismaregion:=1]
movimientos[mismaregion==1,sum(N)]
movimientos[mismaregion==0,sum(N)]
movimientos[,sum(N)]

Realice el mismo ejercicio de la pregunta 11 y 12, pero considerando a aquellas personas que pertenecen a Fonasa y se realizan intervenciones quirúrgicas.¿Cambia en algo el análisis con respecto a las preguntas anteriores? (5 puntos)

movimientos1 <- base_nueva[INTERV_Q=="Sí", .N, by=.(REGION, CodRegion_ESTAB, Prevision)]
movimientos1[,mismaregion:=0]
movimientos1[REGION==CodRegion_ESTAB, mismaregion:=1]
movimientos1[mismaregion==1 & Prevision=="FONASA",sum(N)]
movimientos1[mismaregion==0 & Prevision=="FONASA",sum(N)]
movimientos1[Prevision=="FONASA",sum(N)]