#Paula Flores
Limpie el enviroment para comenzar desde cero. (1 punto)
rm(list=ls())
Cargue los paquetes necesarios para trabajar con DT. (1 punto)
library(data.table)
Abra las bases de datos egresos y Enfermedades. (3 puntos) Pista: Para los archivos .RDS utilice la función readRDS. Ojo que la base de datos no se abrirá como un DT, por lo tanto tiene que transformarla.
"C:/Users/mariajesustraub/Desktop/Rstudio/control 1"
## [1] "C:/Users/mariajesustraub/Desktop/Rstudio/control 1"
path<-("C:/Users/mariajesustraub/Desktop/Rstudio/control 1")
setwd(path)
Egresos<-readRDS("egresos.RDS")
Egresos<-as.data.table(Egresos)
class(Egresos)
## [1] "data.table" "data.frame"
Enfermedades<-fread("Enfermedades.csv")
class(Enfermedades)
## [1] "data.table" "data.frame"
Muestre cuántas personas de cada región hay en la base egresos. (3 puntos)
Egresos[,.N,by="REGION"]
## REGION N
## 1: 2 47329
## 2: 13 516477
## 3: 14 23380
## 4: 99 4804
## 5: 5 128170
## 6: 15 18023
## 7: 1 26275
## 8: 6 46286
## 9: 10 64371
## 10: 12 20623
## 11: 3 15970
## 12: 8 18543
## 13: 9 18721
## 14: 7 16674
## 15: 4 51373
## 16: 591 156
## 17: 11 1707
## 18: 2000 240
## 19: 51 72
## 20: 54 84
###P5
Solucione el problema de la pregunta anterior y considere solo las 15 regiones de Chile. (3 puntos)
Egresos<-Egresos[!REGION>15]
Egresos[,.N,by="REGION"]
## REGION N
## 1: 2 47329
## 2: 13 516477
## 3: 14 23380
## 4: 5 128170
## 5: 15 18023
## 6: 1 26275
## 7: 6 46286
## 8: 10 64371
## 9: 12 20623
## 10: 3 15970
## 11: 8 18543
## 12: 9 18721
## 13: 7 16674
## 14: 4 51373
## 15: 11 1707
###P6 Existe una inconsistencia en la base de datos egresos, ya que hay personas que tienen más días de estadía en el hospital que días vividos. Por lo tanto, debemos eliminar estos casos de la base de datos. Para esto, cree una nueva variable que corresponda a los días de vida de una persona y elimine aquellas observaciones que tengan más días de estadía en un hospital que días de vida. (5 puntos)
Egresos[,Dias_vida:=(EDAD*365)]
names(Egresos)
## [1] "Tipo_Tratamiento" "ESTAB" "Seremi" "ServicioSalud"
## [5] "SEXO" "EDAD" "PREVI" "BENEF"
## [9] "MOD" "COMUNA" "REGION" "SERV_RES"
## [13] "FECHA_EGR" "SERC_EGR" "DIAG1" "DIAG2"
## [17] "DIAS_ESTAD" "COND_EGR" "INTERV_Q" "Prevision"
## [21] "CodRegion_ESTAB" "Tipo_ESTAB" "Dias_vida"
Egresos<-Egresos[!(Dias_vida<=DIAS_ESTAD)]
##P7 ¿Cuántas personas hay según previsión en la base egresos?
Egresos[,.N,by="Prevision"]
## Prevision N
## 1: FONASA 649267
## 2: ISAPRE 225594
## 3: DIPRECA 21204
## 4: CAPREDENA 20925
## 5: OTRA 20664
## 6: SIN PREVISION 23624
## 7: IGNORADA 1834
###P8 Realice un resumen de las características de las personas de la base egresos según su previsión y sexo. Este resumen debe contener: edad promedio y días de estadía promedio en un hospital.
Resumen<-Egresos[,.(mean(EDAD,na.rm=T),mean(DIAS_ESTAD,na.rm=T))]
###P9 Cree un nuevo objeto que corresponda a un merge entre la base egresos y Enfermedades. (5 puntos)
Pista: la variable identificador en la base egresos se llama Tipo_Tratamiento y en la base Enfermedades se llama Codigo. Por lo tanto, puede que renombrar una variable para que queden con el mismo nombre.
names(Enfermedades)[1]<-"Tipo_Tratamiento"
tipo_tratamieto<-merge(x=Egresos,y=Enfermedades,by="Tipo_Tratamiento")
###P10
Ahora queremos identificar, con este nuevo objeto, la proporción de enfermos que hay por región y tipo de tratamiento,es decir, del total de enfermos por región cuántos corresponden a cada tratamiento. (8 puntos)
Pista: Para esto puede crear un objeto que contenga el total de enfermos por región, otro objeto que contenga el total de enfermos por tratamiento y región y luego unirlos para obtener el porcentaje.
Total_enfermos_Region<-tipo_tratamieto[,.N,by=REGION]
Total_enfermos_tratamiento<-tipo_tratamieto[,.N,by=.(Tipo_Tratamiento,Tratamiento,REGION)]
¿En qué región se atienden los individuos que tienen que realizarse cirugías y de qué región provienen?. (5 puntos) Pista: Para responder esta pregunta, primero debe identificar la cantidad de personas que se realizan intervenciones quirúrgicas según su región y la región del establecimiento donde se atienden.
tipo_tratamieto[INTERV_Q=="Sí",.N,by=.(REGION,Tipo_ESTAB)]
## REGION Tipo_ESTAB N
## 1: 13 Establecimiento Alta Complejidad 103943
## 2: 13 Clínica 122721
## 3: 6 Establecimiento Mediana Complejidad 2970
## 4: 5 Establecimiento Alta Complejidad 27697
## 5: 6 Establecimiento Alta Complejidad 9104
## 6: 12 Establecimiento Alta Complejidad 5048
## 7: 4 Establecimiento Alta Complejidad 18145
## 8: 14 Establecimiento Alta Complejidad 5720
## 9: 13 Establecimiento Mediana Complejidad 4715
## 10: 1 Establecimiento Alta Complejidad 6355
## 11: 2 Establecimiento Alta Complejidad 7626
## 12: 5 Clínica 25852
## 13: 5 Hospital (No perteneciente al SNSS) 10068
## 14: 4 Clínica 6692
## 15: 3 Establecimiento Alta Complejidad 4049
## 16: 10 Establecimiento Alta Complejidad 12833
## 17: 13 Hospital (No perteneciente al SNSS) 37481
## 18: 3 Establecimiento Mediana Complejidad 464
## 19: 2 Hospital (No perteneciente al SNSS) 3331
## 20: 6 Hospital (No perteneciente al SNSS) 4282
## 21: 1 Clínica 6953
## 22: 6 Clínica 7530
## 23: 15 Establecimiento Alta Complejidad 7371
## 24: 3 Clínica 3143
## 25: 7 Hospital (No perteneciente al SNSS) 1740
## 26: 2 Clínica 13931
## 27: 10 Clínica 13407
## 28: 8 Clínica 926
## 29: 7 Clínica 2340
## 30: 15 Clínica 1083
## 31: 12 Clínica 3264
## 32: 7 Establecimiento Alta Complejidad 4549
## 33: 14 Clínica 3020
## 34: 4 Hospital (No perteneciente al SNSS) 916
## 35: 4 Establecimiento Mediana Complejidad 1387
## 36: 9 Establecimiento Alta Complejidad 4938
## 37: 12 Hospital (No perteneciente al SNSS) 1809
## 38: 8 Establecimiento Baja Complejidad 645
## 39: 11 Establecimiento Alta Complejidad 491
## 40: 3 Hospital (No perteneciente al SNSS) 284
## 41: 10 Hospital (No perteneciente al SNSS) 429
## 42: 11 Hospital (No perteneciente al SNSS) 12
## 43: 8 Hospital (No perteneciente al SNSS) 739
## 44: 9 Hospital (No perteneciente al SNSS) 469
## 45: 8 Establecimiento Alta Complejidad 607
## 46: 14 Hospital (No perteneciente al SNSS) 164
## 47: 15 Hospital (No perteneciente al SNSS) 232
## 48: 1 Hospital (No perteneciente al SNSS) 383
## 49: 9 Clínica 704
## 50: 14 Establecimiento Baja Complejidad 439
## 51: 5 Establecimiento Baja Complejidad 194
## 52: 7 Establecimiento Mediana Complejidad 84
## 53: 10 Establecimiento Mediana Complejidad 129
## 54: 6 Establecimiento Baja Complejidad 374
## 55: 8 Establecimiento Mediana Complejidad 2211
## 56: 4 Establecimiento Baja Complejidad 108
## 57: 12 Establecimiento Mediana Complejidad 281
## 58: 2 Establecimiento Baja Complejidad 245
## 59: 11 Clínica 24
## 60: 2 Establecimiento Mediana Complejidad 5
## 61: 10 Establecimiento Baja Complejidad 629
## 62: 9 Establecimiento Baja Complejidad 25
## 63: 9 Establecimiento Mediana Complejidad 5
## 64: 1 Establecimiento Mediana Complejidad 1
## 65: 11 Establecimiento Mediana Complejidad 2
## 66: 5 Establecimiento Mediana Complejidad 4
## 67: 14 Establecimiento Mediana Complejidad 4
## 68: 12 Establecimiento Baja Complejidad 2
## 69: 11 Establecimiento Baja Complejidad 1
## REGION Tipo_ESTAB N
¿Las personas suelen atenderse en sus regiones?. Para poder responder esta pregunta, es recomendable modificar el objeto anterior y así poder visualizar mejor la información. Para esto, se aconseja realizar un reshape y reemplazar los NApor valores 0
tipo_tratamieto[INTERV_Q=="Sí" & REGION==CodRegion_ESTAB,.N,by=.(REGION,Tipo_ESTAB)]
## REGION Tipo_ESTAB N
## 1: 13 Establecimiento Alta Complejidad 103333
## 2: 13 Clínica 122251
## 3: 6 Establecimiento Mediana Complejidad 2967
## 4: 5 Establecimiento Alta Complejidad 27107
## 5: 6 Establecimiento Alta Complejidad 8223
## 6: 12 Establecimiento Alta Complejidad 4926
## 7: 4 Establecimiento Alta Complejidad 17576
## 8: 14 Establecimiento Alta Complejidad 5583
## 9: 13 Establecimiento Mediana Complejidad 4702
## 10: 1 Establecimiento Alta Complejidad 6108
## 11: 2 Establecimiento Alta Complejidad 7325
## 12: 5 Clínica 22725
## 13: 5 Hospital (No perteneciente al SNSS) 8351
## 14: 3 Establecimiento Alta Complejidad 3741
## 15: 10 Establecimiento Alta Complejidad 12497
## 16: 13 Hospital (No perteneciente al SNSS) 37359
## 17: 3 Establecimiento Mediana Complejidad 464
## 18: 2 Hospital (No perteneciente al SNSS) 2682
## 19: 1 Clínica 6370
## 20: 6 Clínica 5001
## 21: 15 Establecimiento Alta Complejidad 7178
## 22: 3 Clínica 2300
## 23: 2 Clínica 12301
## 24: 10 Clínica 12518
## 25: 12 Clínica 2932
## 26: 7 Establecimiento Alta Complejidad 3957
## 27: 14 Clínica 2596
## 28: 4 Establecimiento Mediana Complejidad 1378
## 29: 9 Establecimiento Alta Complejidad 4586
## 30: 11 Establecimiento Alta Complejidad 465
## 31: 6 Hospital (No perteneciente al SNSS) 2738
## 32: 12 Hospital (No perteneciente al SNSS) 1561
## 33: 8 Establecimiento Alta Complejidad 206
## 34: 4 Clínica 4739
## 35: 14 Establecimiento Baja Complejidad 439
## 36: 8 Establecimiento Baja Complejidad 644
## 37: 5 Establecimiento Baja Complejidad 194
## 38: 7 Establecimiento Mediana Complejidad 76
## 39: 8 Clínica 94
## 40: 10 Establecimiento Mediana Complejidad 127
## 41: 15 Clínica 821
## 42: 6 Establecimiento Baja Complejidad 374
## 43: 8 Establecimiento Mediana Complejidad 2210
## 44: 4 Establecimiento Baja Complejidad 108
## 45: 12 Establecimiento Mediana Complejidad 279
## 46: 7 Clínica 204
## 47: 2 Establecimiento Baja Complejidad 245
## 48: 10 Establecimiento Baja Complejidad 563
## 49: 11 Establecimiento Mediana Complejidad 2
## 50: 12 Establecimiento Baja Complejidad 2
## 51: 11 Establecimiento Baja Complejidad 1
## REGION Tipo_ESTAB N
###BONUS Realice el mismo ejercicio de la pregunta 11 y 12, pero considerando a aquellas personas que pertenecen a Fonasa y se realizan intervenciones quirúrgicas.¿Cambia en algo el análisis con respecto a las preguntas anteriores?