Testeo de muestra de datos

kable(head(datos[,2:ncol(datos)]))
diagnostico comorbilidad sexo prom_edad ds_edad egreso DE freq
3rd Degree Sideburns Alien DNA Femenino 18 0.96 Alta 17 28
3rd Degree Sideburns Alien DNA Femenino 75 3.54 Fallecido(a) 200 7
3rd Degree Sideburns Alien DNA Masculino 40 2.39 Alta 158 28
3rd Degree Sideburns Alien DNA Masculino 19 2.50 Fallecido(a) 128 9
3rd Degree Sideburns Alien DNA Otro 86 1.80 Alta 170 5
3rd Degree Sideburns Alien DNA Otro 71 2.56 Fallecido(a) 85 1

Actividades

1. Describa cada una de las variables del conjunto de datos indicando su clasificación según tipo: medición y precisión.

Diagnóstico: Es la determinación del estado de salud de un paciente. Dentro de la clasificación de medición, es no métrica nominal, debido a que no se puede jerarquerizar. Además, dentro de la clasificación de precisión, la observamos como politómica debido a la gran cantidad de tipos existentes.

Comorbilidad: Es la señalización de uno o más transtornos. También se puede entender como el efecto de estos trastornos o enfermedades adicionales. Esta variable tampoco es cualitativa, por ende cae dentro de la clasificación de medición nominal. Por otro lado, posee muchos tipos, por ende, en la categoría de precisión se asigna como politómica.

Sexo: Se refiere al sexo biológico de los pacientes. En la categoría de medición es no métrica nominal y en la de precisión politómica.

Prom_edad: Es el promedio de edad de los pacientes que han sido atendidos por el hospital. Este promedio se saca según al sexo y el egreso. Es una variable que se encuentra en la categoría de medición como ratio (debido a la existencia del 0) y dentro de la de precisión como discreta (enteros).

Ds_edad: Se refiere a la desviación estándar de la edad o qué tan dispersa es la edad de los distintos pacientes atendidos. Se mide como una variable cuantitativa de ratio (es posible que sea 0) y se precisa como una variable continua, debido a que la fórmula permite decimales.

Egreso: Nombra la forma de salida del hospital; si salió de alta o este falleció. Es una variable no métrica nominal y en la categoría de precisión es no métrica dicotómica debido a sus 2 posibles opciones.

DE: Es el total de días que el paciente estuvo dentro del hospital. Es una variable de categoría medición cuantitativa y de ratio (puede ser 0) y en la categoría precisión es discreta. Freq: Ccantidad de personas dentro de las diversas categorías. Es una variable de categoría medición cuantitativa y de ratio (puede ser 0) y en la categoría precisión es discreta.

2.1¿Cuál es la probabilidad que tiene un/una paciente de fallecer en su establecimiento hospitalario? Indique la tasa de mortalidad hospitalaria de su establecimiento.

i = 1
acum_facellidos = 0
acum_pacientes = 0

while(i <= nrow(datos)){
  if(datos[i,7] == "Fallecido(a)"){
    acum_facellidos = acum_facellidos + datos[i,9]
  }
  acum_pacientes = acum_pacientes + datos[i,9]
  i = i +1
}

cat("La tasa de mortalidad es de: ",acum_facellidos/acum_pacientes)
## La tasa de mortalidad es de:  0.27925

2.2 ¿Cuál es el diagnóstico principal que tienen mayor probabilidad de fallecimiento (letalidad) en su hospital según cada sexo biológico?

i = 2
diagnostico = datos[i,2]
sexo = datos[i,4]
frecuencia_particular = datos[i,9]
i = i + 2
while(i <= nrow(datos)){
  
  if(frecuencia_particular < datos[i,9]){
    diagnostico = datos[i,2]
    sexo = datos[i,4]
    frecuencia_particular = datos[i,9]
  }
  i = i + 2
}
cat("El diagnóstico principial con más fallecidos es:",diagnostico,", según sexo biológico, el cual es", sexo)
## El diagnóstico principial con más fallecidos es: Ruptured Nodules , según sexo biológico, el cual es Masculino

2.3 ¿Cuál es la comorbilidad que presenta mayor probabilidad de aparición en personas adultas fallecidas en su establecimiento hospitalario?

i = 1
temp_acum = 0
major_acum = 0
temp_name_cormo = datos[1,3]
major_name_cormo = datos[1,3]
while(i <= nrow(datos)){
  while(identical(datos[i,3],temp_name_cormo)){
    if(datos[i,5] >= 18 & datos[i,7]=="Fallecido(a)"){
      temp_acum = temp_acum + datos[i,9]
    }
    i = i + 1
  }
  if(temp_acum > major_acum){
    major_acum = temp_acum
    major_name_cormo = temp_name_cormo
  }
  temp_name_cormo = datos[i,3]
  
  temp_acum = 0
}

cat("La cormobilidad que más se presenta en pacientes adultos fallecidos es: ",major_name_cormo)
## La cormobilidad que más se presenta en pacientes adultos fallecidos es:  Bloaty Head

2.4 Usando como base el diagnóstico principal con mayor probabilidad de fallecimiento (letalidad) en su hospital: ¿cuál es la probabilidad de que si el próximo año se hospitalizan 100 personas con esa patología, N de ellas fallezcan?

n=100
x = sample(seq(5,50),1)
N=acum_pacientes
M = frecuencia_particular

dhyper(x,M,N-M,n)
## [1] 1.022977e-26

2.5 ¿Qué puede concluir de los resultados con relación a las características y gestión de su establecimiento hospitalario?

Dado que la tasa de mortalidad del hospital es cercana al 27%, podríamos considerar el tipo de paciente que llega al hospital además de los diagnósticos para entender que son situaciones complejas las que se deben tratar. Por ende, es lógico pensar que la tasa de mortalidad es apropiada para el hospital. De igual manera, hay muchos promedios de edades que son más propensos a tener fallecimientos, como edades tempranas y edades avanzadas (menos de 5 años y sobre 90 años). Cabe destacar que por lo visto en los datos, los pacientes no necesariamente son humanos, por consecuente, habría que considerar cómo afecta la edad a la raza del paciente.

3. Considerando la estancia de los/las pacientes atendidos/atendidas en su establecimiento hospitalario:

3.1 ¿Cuál es el promedio de día de estadas (DE) de su establecimiento hospitalario?

i = 1
promedio_DE = 0
while(i <= nrow(datos)){
  promedio_DE = promedio_DE + datos[i,8]
  i=i+1
}
promedio = promedio_DE/nrow(datos)
cat("El promedio de día de estadas es: ",promedio)
## El promedio de día de estadas es:  100.3604

3.2 ¿Cuál es la probabilidad de que un paciente pediátrico (menor a 18 años) sea dado de alta de la patología más frecuente después de 30 días de estada? Asuma en ambos casos una distribución normal y una desviación estándar típica de 0.2 para los DE.

#Considerando el supuesto de que las patoloígas son equivalentes a los diagnósticos
i = 1
temp_acum = 0
major_acum = 0
temp_name_diag = datos[1,2]
major_name_diag = datos[1,2]
while(i <= nrow(datos)){
  while(identical(datos[i,2],temp_name_diag)){
    if(datos[i,5] < 18 & datos[i,8]>30){
      temp_acum = temp_acum + datos[i,9]
    }
    i = i + 1
  }
  if(temp_acum > major_acum){
    major_acum = temp_acum
    major_name_diag = temp_name_diag
  }
  temp_name_diag = datos[i,2]
  temp_acum = 0
}

cat("La probabilidad es:",((major_acum/acum_pacientes)/pnorm(30,promedio,0.2,lower.tail=FALSE)))
## La probabilidad es: 0.0111

3.3 ¿Cuál es la probabilidad de que si usted es o ustedes son hospitalizados en su establecimiento hospitalario sean dados de alta antes de los 10 días? Al igual que el ejercicio anterior, asuma una distribución normal y una desviación estándar típica de 0.2 para los DE.

cat("La probabilidad es:",pnorm(10,promedio,0.2))
## La probabilidad es: 0

3.4 ¿Qué puede concluir de los resultados con relación a las características y gestión de su establecimiento hospitalario?

Que el promedio de estadía sean 100 días es demasiado. Esto podría atribuirse a que los diagnósticos revisados poseen tiempos de tratamiento muy largos o la gestión de pacientes es muy mala. Nuevamente cabe destacar que pareciese que los pacientes no son humanos.

4.1 Si usted ve/ustedes ven salir de su hospital a cuatro pacientes dados de alta del hospital caminando uno tras otro: ¿cuál es la probabilidad de que todos/todas ellos/ellas hayan tenido la patología con mayor probabilidad de aparición atendida en su establecimiento?

i = 1
temp_acum = 0
major_acum = 0
temp_name_diag_prin = datos[1,2]
major_name_diag = datos[1,2]
while(i <= nrow(datos)){
  while(identical(datos[i,2],temp_name_diag_prin)){
    temp_acum = temp_acum + datos[i,9]
    i = i + 1
  }
  if(temp_acum > major_acum){
    major_acum = temp_acum
    major_name_diag = temp_name_diag_prin
  }
  temp_name_diag_prin = datos[i,2]
  temp_acum = 0
}
prob_major_diag_prin = major_acum/acum_pacientes

cat("La probabilidad es: ",prob_major_diag_prin*prob_major_diag_prin*prob_major_diag_prin*prob_major_diag_prin)
## La probabilidad es:  3.231941e-06

4.2 Usted ha/ustedes han decidido ir al área ambulatoria de consultas médicas. Si entre todos/todas los/las especialistas médicos se está atendiendo un promedio a treinta pacientes por hora ¿cuál es la probabilidad que en la siguiente hora se atienda como mínimo a N pacientes?

#Poisson
N=sample(seq(5,50),1)
distribucion = dpois(N,30)
cat("La probabilidad sería: ",distribucion)
## La probabilidad sería:  0.02416867