source("cargar_datos.R")

nombre1= "FERNANDO MATIAS PEREZ CORTEZ"
nombre2= "IGNACIO NAHUEL MOREIRA CARVACHO"
datos = cargar_datos(nombre1,nombre2)
knitr::kable(head(datos[,2:ncol(datos)]))
diagnostico comorbilidad sexo prom_edad ds_edad egreso DE freq
3rd Degree Sideburns Alien DNA Femenino 32 2.18 Alta 169 45
3rd Degree Sideburns Alien DNA Femenino 9 4.98 Fallecido(a) 139 7
3rd Degree Sideburns Alien DNA Masculino 66 0.09 Alta 145 36
3rd Degree Sideburns Alien DNA Masculino 65 1.77 Fallecido(a) 42 7
3rd Degree Sideburns Alien DNA Otro 17 0.30 Alta 75 10
3rd Degree Sideburns Alien DNA Otro 97 0.72 Fallecido(a) 141 2

El Diagnóstico Corresponde a la enfermedad diagnosticada al paciente. Es cualitativa, nominal y politómica.

La Comorbilidad corresponde a una variable cualitativa, nominal y politómica.

Corresponde al sexo biológico de un paciente. Es cualitativa, nominal y politómica.

Promedio edad: variable cuantitativa, ratio y discreta.

Edad: Corresponde a la desviación estándar de la edad. Es cuantitativa, ratio y continua.

Egreso: Corresponde a la clasificación del egreso puede ser “alta” o “fallecido” de un paciente del hospital. Es cualitativa, nominal y dicotómica.

Días de estada: Corresponde al total de días de estadía de un paciente en el hospital, es decir, días de hospitalización. Es cuantitativa, ratio y discreta.

Frecuencia: Variable cuantitativa, ratio y discreta

2.2.1 ¿Cuál es la probabilidad que tiene un/una paciente de fallecer en su establecimiento hospitalario? Indique la tasa de mortalidad hospitalaria de su establecimiento.

#para este caso los casos "favorables" son los pacientes que lamentablemente fallecieron
# la poblacion es todos los pacientes, entonces sabiento esto se tiene:

poblacion = sum(datos["freq"])
favorable = filter(datos, egreso=="Fallecido(a)")
favorable_total = sum(favorable["freq"])
prob = (favorable_total)/poblacion #tasa de mortalidad
## La probabilidad de que un paciente fallezca en nuestro hospital es del  0.12765
## la tasa de mortalidad de nuestro hospital es del:  12.765 %

Como la tasa de mortalidad de nuestro hospital es de 12.77% aproximadamente se puede concluir que se tiene en nuestro hosiptal una tasa de mortalidad baja, debido a que una tasa de mortalidad se define como alta si ésta es del 30%.

2.2.2 ¿Cuál es el diagnóstico principal que tienen mayor probabilidad de fallecimiento (letalidad) en su hospital según cada sexo biológico?

fallecidos_hombres = filter(datos, sexo == "Masculino", egreso == "Fallecido(a)")
datos_hombres= select(fallecidos_hombres, diagnostico, sexo, egreso, freq)
#datos_hombres
tabla_hombre = group_by(datos_hombres, diagnostico)
resumen_hombres = dplyr::summarise(tabla_hombre, freq = sum(freq))
#resumen_hombres
max_hombres= max(resumen_hombres$freq)
#max_hombres
resultado = filter(resumen_hombres, freq==max_hombres)
#resultado$diagnostico
#cat("El diagnostico más letal para los hombres corresponde a ", resultado$diagnostico)



fallecidos_mujeres = filter(datos, sexo == "Femenino", egreso == "Fallecido(a)")

datos_mujeres= select(fallecidos_mujeres, diagnostico, sexo, egreso, freq)
tabla_mujeres = group_by(datos_mujeres, diagnostico)
resumen_mujeres = dplyr::summarise(tabla_mujeres, freq = sum(freq))

max_mujeres= max(resumen_mujeres$freq)

resultado_mujeres = filter(resumen_mujeres, freq==max_mujeres)
#resultado_mujeres$diagnostico
#cat("El diagnostico más letal para las mujeres corresponde a ", resultado_mujeres$diagnostico)
## El diagnostico con mayor probabilidad de falleciemiento en los hombres es:  TV Personalities
## El diagnostico con mayor probabilidad de falleciemiento en las mujeres es  Invisibility

2.2.3 ¿Cuál es la comorbilidad que presenta mayor probabilidad de aparición en personas adultas fallecidas en su establecimiento hospitalario?

Para esta pregunta se asume que una persona es adulta si su edad es 18 años o más.

datos1 = select(datos, comorbilidad, prom_edad, egreso, freq)
datos_prg = group_by(filter(datos1, prom_edad >18, egreso == "Fallecido(a)"), comorbilidad)
final = dplyr::summarise(datos_prg, freq = sum(freq))
resultado = filter(final, freq== max(final$freq))
#resultado$comorbilidad
## La comorbilidad que presenta mayor probabilidad de aparición en personas adultas fallecidas de nuestro hospital es:  Baldness

2.2.4 Usando como base el diagnóstico principal con mayor probabilidad de fallecimiento (letalidad) en su hospital: ¿cuál es la probabilidad de que si el próximo año se hospitalizan 100 personas con esa patología, N de ellas fallezcan?

Para la resolución de esta pregunta utilzaremos una distribución hipergeometrica, debido a que tenemos un conjunto de 100 personas de los cuales N de ellos seran nuestro caso de “exito” que corresponde a que fallezcan y que 100 - N personas sobrevivan, siendo este nuestro evento fallido, para este problema se ocupa la funcion “dhyper” debido a que preguntan el valor de probabilidad puntual que toma la variable a estudiar de acuerdo a los parametros especificados.

N=sample(seq(5,50),1)
patologia_masletal = filter(datos, egreso == "Fallecido(a)")
patologia_masletal = select(patologia_masletal, diagnostico, egreso, freq)
patologia_masletal = group_by(patologia_masletal, diagnostico)
patologia_masletal = dplyr::summarise(patologia_masletal, freq = sum(freq))
patologia_masletal = filter(patologia_masletal, freq== max(patologia_masletal$freq))
patologia_masletal$diagnostico
## [1] "3rd Degree Sideburns"
f1 = patologia_masletal$freq

frecuencia_masletas = filter(datos, diagnostico == patologia_masletal$diagnostico)
frecuencia_masletas = select(frecuencia_masletas, diagnostico, freq)
frecuencia_masletas = group_by(frecuencia_masletas, diagnostico)
frecuencia_masletas = dplyr::summarise(frecuencia_masletas, freq = sum(freq))
frecuencia_masletas = filter(frecuencia_masletas, freq== max(frecuencia_masletas$freq))
frecuencia_masletas$diagnostico
## [1] "3rd Degree Sideburns"
f2 = frecuencia_masletas$freq




resultado_final = dhyper(N, f1, f2 - f1, 100)
#resultado_final
## La probabilidad de que si el proximo año se hospitalizan 100 personas con la patologia más letal N de ellas fallezcan es de:  0.04168264

2.2.5 ¿Qué puede concluir de los resultados con relación a las características y gestión de su establecimiento hospitalario?

Lo principal es que nuestro hospital no tiene una tasa de mortalidad alta, debido a que es del 12%, otro factor importante es que la patología más frecuente en nuestro hospital corresponde a “3rd Degree Sideburns”, mientras que la cormobilidad más común en las personas fallecidas es “Baldness”, por otro lado mujeres y hombres no comparten el mismo diagnostico más letal.

2.3.1 ¿Cuál es el promedio de día de estadas (DE) de su establecimiento hospitalario?

dias = select(datos, DE, freq)
diasestadia = sum(dias[1]* dias[2])
promedioestadia = diasestadia / sum(dias[2])
#promedioestadia
## El promedio de días de estada corresponde a  100.7839

2.3.2 ¿Cuál es la probabilidad de que un paciente pediátrico (menor a 18 años) sea dado de alta de la patología más frecuente después de 30 días de estada? Asuma en ambos casos una distribución normal y una desviación estándar típica de 0.2 para los DE.

como se pide que sea despues de 30 días de estada se busca calcular p(x>30) y esto es quivalente a decir 1 - p(x <= 30), sabiendo esto

pediatria = select(filter(datos, prom_edad < 18, egreso == "Alta"), DE, freq)

freq_dias = pediatria[1] * pediatria[2]
dias = sum(dnorm(freq_dias$DE))

promedio = dias / sum(pediatria$freq)

resultado = pnorm(30, promedio, 0.2, lower.tail = FALSE)
## La probabilidad de que un paciente pediátrico sea dado de alta de la patología más frecuentes después de 30 diás es:  1

Que el resultado sea 1 significa que la distribucion es 0 y por consiguiente, todos los pacientes pediatricos que sufren la patología más frecuente son dado de alta después de 30 días de estadía en el hospital.

2.3.3 ¿Cuál es la probabilidad de que si usted es o ustedes son hospitalizados en su establecimiento hospitalario sean dados de alta antes de los 10 días? Al igual que el ejercicio anterior, asuma una distribución normal y una desviación estándar típica de 0.2 para los DE.

Para esto se considera calcular P(x<= 10).

resultado = pnorm(10, promedioestadia, 0.2)
#resultado
## La probabilidad de que si nosotros somos hospitalizados en nuestro hospital y nos dan el alta antes de los 10 días es:  0  siguiendo una distribución normal

Que el resultado haya sido 0 significa que al menos tendremos que estar 10 días hospitalizados para que nos den el alta.

2.3.4 ¿Qué puede concluir de los resultados con relación a las características y gestión de su establecimiento hospitalario?

Se puede concluir que los dias de estada en promedio en nuestro hosiptal es de 100.78, lo que está muy lejos de ser lo óptimo, pero por otro lado nuestra área pedríatica nos dice que a todos los paciente de este tipo que les da la patología más frecuente son dados de altas después de 30 días, los que nos indica que a largo plazo podremos seguir mejorando debido a que estamos preparados para enfrentar a la patología más frecuentes de los pacientes que confían en nuestro hospital

Si usted ve/ustedes ven salir de su hospital a cuatro pacientes dados de alta del hospital caminando uno tras otro: ¿cuál es la probabilidad de que todos/todas ellos/ellas hayan tenido la patología con mayor probabilidad de aparición atendida en su establecimiento?

suponiendo que al salir con el alta un paciente, inmediatamente ingresa otro, es decir, se supone reposición de pacientes.

aparecible =  select(datos, diagnostico,egreso, freq)
aparecible = group_by(filter(aparecible, egreso == "Alta"), diagnostico)
#aparecible
aparecible = dplyr::summarise(aparecible, freq = sum(freq))
#aparecible
aparecible = filter(aparecible, freq== max(aparecible$freq))
#aparecible
frecuencia_patologia = aparecible$freq
#frecuencia_patologia
prob = (4 / frecuencia_patologia)
#prob
## La probabilidad de que al salir 4 pacientes cada uno de ellos hayan tenido la patología con mayor probabilidad es:  0.005298013

Usted ha/ustedes han decidido ir al área ambulatoria de consultas médicas. Si entre todos/todas los/las especialistas médicos se está atendiendo un promedio a treinta pacientes por hora ¿cuál es la probabilidad que en la siguiente hora se atienda como mínimo a N pacientes?

Para esta pregunta se utiliza la distribucion de Poisson siguiendo P(x>30), lo que se puede escribir como 1 - P(x< = 30). También se ocupa la función “dpois” debido a que se pregutna el valor de la función de densidad de poison teniendo un N aleatorio.

N=sample(seq(5,50),1)
N
## [1] 31
distribucion = dpois(N,30)
resultado = 1- distribucion
#resultado
## Si todos los médicos especialistas están atendiendo en promodio a 30 personas por hora, la probabilidad de que en la siguiente hora se atiendan como mínimo a N persona es:  0.9297085