source("cargar_datos.R")
nombre1= "FERNANDO MATIAS PEREZ CORTEZ"
nombre2= "IGNACIO NAHUEL MOREIRA CARVACHO"
datos = cargar_datos(nombre1,nombre2)
knitr::kable(head(datos[,2:ncol(datos)]))
| diagnostico | comorbilidad | sexo | prom_edad | ds_edad | egreso | DE | freq |
|---|---|---|---|---|---|---|---|
| 3rd Degree Sideburns | Alien DNA | Femenino | 32 | 2.18 | Alta | 169 | 45 |
| 3rd Degree Sideburns | Alien DNA | Femenino | 9 | 4.98 | Fallecido(a) | 139 | 7 |
| 3rd Degree Sideburns | Alien DNA | Masculino | 66 | 0.09 | Alta | 145 | 36 |
| 3rd Degree Sideburns | Alien DNA | Masculino | 65 | 1.77 | Fallecido(a) | 42 | 7 |
| 3rd Degree Sideburns | Alien DNA | Otro | 17 | 0.30 | Alta | 75 | 10 |
| 3rd Degree Sideburns | Alien DNA | Otro | 97 | 0.72 | Fallecido(a) | 141 | 2 |
El Diagnóstico Corresponde a la enfermedad diagnosticada al paciente. Es cualitativa, nominal y politómica.
La Comorbilidad corresponde a una variable cualitativa, nominal y politómica.
Corresponde al sexo biológico de un paciente. Es cualitativa, nominal y politómica.
Promedio edad: variable cuantitativa, ratio y discreta.
Edad: Corresponde a la desviación estándar de la edad. Es cuantitativa, ratio y continua.
Egreso: Corresponde a la clasificación del egreso puede ser “alta” o “fallecido” de un paciente del hospital. Es cualitativa, nominal y dicotómica.
Días de estada: Corresponde al total de días de estadía de un paciente en el hospital, es decir, días de hospitalización. Es cuantitativa, ratio y discreta.
Frecuencia: Variable cuantitativa, ratio y discreta
#para este caso los casos "favorables" son los pacientes que lamentablemente fallecieron
# la poblacion es todos los pacientes, entonces sabiento esto se tiene:
poblacion = sum(datos["freq"])
favorable = filter(datos, egreso=="Fallecido(a)")
favorable_total = sum(favorable["freq"])
prob = (favorable_total)/poblacion #tasa de mortalidad
## La probabilidad de que un paciente fallezca en nuestro hospital es del 0.12765
## la tasa de mortalidad de nuestro hospital es del: 12.765 %
Como la tasa de mortalidad de nuestro hospital es de 12.77% aproximadamente se puede concluir que se tiene en nuestro hosiptal una tasa de mortalidad baja, debido a que una tasa de mortalidad se define como alta si ésta es del 30%.
fallecidos_hombres = filter(datos, sexo == "Masculino", egreso == "Fallecido(a)")
datos_hombres= select(fallecidos_hombres, diagnostico, sexo, egreso, freq)
#datos_hombres
tabla_hombre = group_by(datos_hombres, diagnostico)
resumen_hombres = dplyr::summarise(tabla_hombre, freq = sum(freq))
#resumen_hombres
max_hombres= max(resumen_hombres$freq)
#max_hombres
resultado = filter(resumen_hombres, freq==max_hombres)
#resultado$diagnostico
#cat("El diagnostico más letal para los hombres corresponde a ", resultado$diagnostico)
fallecidos_mujeres = filter(datos, sexo == "Femenino", egreso == "Fallecido(a)")
datos_mujeres= select(fallecidos_mujeres, diagnostico, sexo, egreso, freq)
tabla_mujeres = group_by(datos_mujeres, diagnostico)
resumen_mujeres = dplyr::summarise(tabla_mujeres, freq = sum(freq))
max_mujeres= max(resumen_mujeres$freq)
resultado_mujeres = filter(resumen_mujeres, freq==max_mujeres)
#resultado_mujeres$diagnostico
#cat("El diagnostico más letal para las mujeres corresponde a ", resultado_mujeres$diagnostico)
## El diagnostico con mayor probabilidad de falleciemiento en los hombres es: TV Personalities
## El diagnostico con mayor probabilidad de falleciemiento en las mujeres es Invisibility
datos1 = select(datos, comorbilidad, prom_edad, egreso, freq)
datos_prg = group_by(filter(datos1, prom_edad >18, egreso == "Fallecido(a)"), comorbilidad)
final = dplyr::summarise(datos_prg, freq = sum(freq))
resultado = filter(final, freq== max(final$freq))
#resultado$comorbilidad
## La comorbilidad que presenta mayor probabilidad de aparición en personas adultas fallecidas de nuestro hospital es: Baldness
Para la resolución de esta pregunta utilzaremos una distribución hipergeometrica, debido a que tenemos un conjunto de 100 personas de los cuales N de ellos seran nuestro caso de “exito” que corresponde a que fallezcan y que 100 - N personas sobrevivan, siendo este nuestro evento fallido, para este problema se ocupa la funcion “dhyper” debido a que preguntan el valor de probabilidad puntual que toma la variable a estudiar de acuerdo a los parametros especificados.
N=sample(seq(5,50),1)
patologia_masletal = filter(datos, egreso == "Fallecido(a)")
patologia_masletal = select(patologia_masletal, diagnostico, egreso, freq)
patologia_masletal = group_by(patologia_masletal, diagnostico)
patologia_masletal = dplyr::summarise(patologia_masletal, freq = sum(freq))
patologia_masletal = filter(patologia_masletal, freq== max(patologia_masletal$freq))
patologia_masletal$diagnostico
## [1] "3rd Degree Sideburns"
f1 = patologia_masletal$freq
frecuencia_masletas = filter(datos, diagnostico == patologia_masletal$diagnostico)
frecuencia_masletas = select(frecuencia_masletas, diagnostico, freq)
frecuencia_masletas = group_by(frecuencia_masletas, diagnostico)
frecuencia_masletas = dplyr::summarise(frecuencia_masletas, freq = sum(freq))
frecuencia_masletas = filter(frecuencia_masletas, freq== max(frecuencia_masletas$freq))
frecuencia_masletas$diagnostico
## [1] "3rd Degree Sideburns"
f2 = frecuencia_masletas$freq
resultado_final = dhyper(N, f1, f2 - f1, 100)
#resultado_final
## La probabilidad de que si el proximo año se hospitalizan 100 personas con la patologia más letal N de ellas fallezcan es de: 0.04168264
Lo principal es que nuestro hospital no tiene una tasa de mortalidad alta, debido a que es del 12%, otro factor importante es que la patología más frecuente en nuestro hospital corresponde a “3rd Degree Sideburns”, mientras que la cormobilidad más común en las personas fallecidas es “Baldness”, por otro lado mujeres y hombres no comparten el mismo diagnostico más letal.
dias = select(datos, DE, freq)
diasestadia = sum(dias[1]* dias[2])
promedioestadia = diasestadia / sum(dias[2])
#promedioestadia
## El promedio de días de estada corresponde a 100.7839
como se pide que sea despues de 30 días de estada se busca calcular p(x>30) y esto es quivalente a decir 1 - p(x <= 30), sabiendo esto
pediatria = select(filter(datos, prom_edad < 18, egreso == "Alta"), DE, freq)
freq_dias = pediatria[1] * pediatria[2]
dias = sum(dnorm(freq_dias$DE))
promedio = dias / sum(pediatria$freq)
resultado = pnorm(30, promedio, 0.2, lower.tail = FALSE)
## La probabilidad de que un paciente pediátrico sea dado de alta de la patología más frecuentes después de 30 diás es: 1
Que el resultado sea 1 significa que la distribucion es 0 y por consiguiente, todos los pacientes pediatricos que sufren la patología más frecuente son dado de alta después de 30 días de estadía en el hospital.
Para esto se considera calcular P(x<= 10).
resultado = pnorm(10, promedioestadia, 0.2)
#resultado
## La probabilidad de que si nosotros somos hospitalizados en nuestro hospital y nos dan el alta antes de los 10 días es: 0 siguiendo una distribución normal
Que el resultado haya sido 0 significa que al menos tendremos que estar 10 días hospitalizados para que nos den el alta.
Se puede concluir que los dias de estada en promedio en nuestro hosiptal es de 100.78, lo que está muy lejos de ser lo óptimo, pero por otro lado nuestra área pedríatica nos dice que a todos los paciente de este tipo que les da la patología más frecuente son dados de altas después de 30 días, los que nos indica que a largo plazo podremos seguir mejorando debido a que estamos preparados para enfrentar a la patología más frecuentes de los pacientes que confían en nuestro hospital
suponiendo que al salir con el alta un paciente, inmediatamente ingresa otro, es decir, se supone reposición de pacientes.
aparecible = select(datos, diagnostico,egreso, freq)
aparecible = group_by(filter(aparecible, egreso == "Alta"), diagnostico)
#aparecible
aparecible = dplyr::summarise(aparecible, freq = sum(freq))
#aparecible
aparecible = filter(aparecible, freq== max(aparecible$freq))
#aparecible
frecuencia_patologia = aparecible$freq
#frecuencia_patologia
prob = (4 / frecuencia_patologia)
#prob
## La probabilidad de que al salir 4 pacientes cada uno de ellos hayan tenido la patología con mayor probabilidad es: 0.005298013
Para esta pregunta se utiliza la distribucion de Poisson siguiendo P(x>30), lo que se puede escribir como 1 - P(x< = 30). También se ocupa la función “dpois” debido a que se pregutna el valor de la función de densidad de poison teniendo un N aleatorio.
N=sample(seq(5,50),1)
N
## [1] 31
distribucion = dpois(N,30)
resultado = 1- distribucion
#resultado
## Si todos los médicos especialistas están atendiendo en promodio a 30 personas por hora, la probabilidad de que en la siguiente hora se atiendan como mínimo a N persona es: 0.9297085