Com os dados selecionados, uma análise Multi Estado tem se demonstrado estatisticamente inviável.
O modelo proposto, até o momento, é de riscos competitivos. Neste modelo, estudamos apenas dois eventos de interesse: alta e óbito.
Entretanto, como inicialmente tinhamos o desejo de estudar a trajetória do paciente dentro do hospital, em especial a necessidade ou não da UTI, foi inserido uma covariável númerica contando no modelo. Assim, embora não estejamos modelando a presença do paciente na UTI diretamente, podemos avaliar seu efeito no desfecho final.
A estrutura do modelo é:
## Warning: pacote 'knitr' foi compilado no R versão 4.4.2
Eventos Riscos Competitivos
A incidência acumulada, definida como probabilidade de ocorrência acumulada dos eventos dado que um inibe o outro.
De maneira similar, a probabilidade da ocorrência dos eventos pode ser calculada separadamente considerando as covariáveis categóricas.
| Categoria | Frequencia | Percentual |
|---|---|---|
| 0 | 172 | 42.1 |
| 1 | 237 | 57.9 |
| Categoria | Frequencia | Percentual |
|---|---|---|
| 0 | 210 | 51.3 |
| 1 | 199 | 48.7 |
| Categoria | Frequencia | Percentual |
|---|---|---|
| 0 | 275 | 67.2 |
| 1 | 134 | 32.8 |
| Categoria | Frequencia | Percentual |
|---|---|---|
| 0 | 370 | 90.5 |
| 1 | 39 | 9.5 |
| Categoria | Frequencia | Percentual |
|---|---|---|
| 0 | 153 | 39.1 |
| 1 | 104 | 26.6 |
| 2 | 123 | 31.5 |
| 3 | 11 | 2.8 |
| Categoria | Frequencia | Percentual |
|---|---|---|
| 0 | 147 | 37.7 |
| 1 | 29 | 7.4 |
| 2 | 177 | 45.4 |
| 3 | 37 | 9.5 |
| Categoria | Frequencia | Percentual |
|---|---|---|
| 0 | 278 | 68 |
| 1 | 131 | 32 |
| Categoria | Frequencia | Percentual |
|---|---|---|
| 0 | 387 | 94.6 |
| 1 | 22 | 5.4 |
| Categoria | Frequencia | Percentual |
|---|---|---|
| 0 | 406 | 99.3 |
| 1 | 3 | 0.7 |
Para a Frequência Respiratória (FR), na classificação inicial, percebe-se duas coisas:
Podemos ver a distribuição dos casos:
| Categoria | Frequencia | Percentual |
|---|---|---|
| ótimo | 2 | 0.6 |
| normal | 54 | 16.4 |
| anormal | 88 | 26.7 |
| def. anormal | 109 | 33.1 |
| péssimo | 76 | 23.1 |
Com o objetivo de buscar maior estabilidade numérica durante os cálculos e simplificar o modelo, é proposto uma classificação mais próxima das referências. Isto é, juntar em apenas duas categorias:
Com isso:
Outra categorização proposta pelos pesquisadores é a separação em três categorias:
| Categoria | Frequencia | Percentual |
|---|---|---|
| 0 | 405 | 99 |
| 1 | 4 | 1 |
| Categoria | Frequencia | Percentual |
|---|---|---|
| 0 | 394 | 96.3 |
| 1 | 15 | 3.7 |
| Categoria | Frequencia | Percentual |
|---|---|---|
| 0 | 359 | 87.8 |
| 1 | 50 | 12.2 |
| Categoria | Frequencia | Percentual |
|---|---|---|
| jovem | 11 | 2.7 |
| médio | 218 | 53.3 |
| idoso | 180 | 44.0 |
Um estudo inicial dos exames laboratoriais foi feito.
| Exames | Exames.1 | Exames.2 |
|---|---|---|
| Hemoglobina_HB | Glicose | Tempo_de_protrombina_TP |
| Hematócrito_HT | Aspartato_Aminotransferase_AST | RNI |
| Leucócitos_totais_WBC | Alanina_aminotransferase_ALT | Tempo_de_tromboplastina_parcial_ativada_TTPA |
| Neutrófilos_SEG | Creatinina | Lactato |
| Linfócitos_LINFO | Ureia | PH |
| Plaquetas_PLT | Fibrinogênio | pO2 |
| Proteína_C_Reativa_PCR | Ferritina | pCO2 |
| Troponina | Hemoglobina_glicosilada | Bicarbonato_(HCO3) |
| LDH | TSH | - |
| Dímero-D | Tiroxina_Livre_T4 | - |
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 3.10 12.50 13.90 13.57 15.10 19.20 1
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 9.70 37.80 41.40 40.56 44.50 60.40 1
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.060 6.003 7.990 9.516 10.912 249.380 1
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.160 4.090 6.145 6.741 8.685 26.890 1
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.0600 0.6175 0.9900 4.0241 1.4325 940.0000 1
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 2.35 151.75 191.00 209.81 246.00 667.00 1
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 1.69 47.65 89.40 106.38 159.25 376.00 17
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 3.00 6.05 9.80 23.67 18.29 805.40 106
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 25.0 246.2 300.0 322.3 383.2 825.0 111
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 45 548 907 3265 2069 80000 9
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 47.0 107.0 129.5 157.1 165.0 836.0 27
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 8.00 25.00 35.00 43.42 50.00 300.00 16
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 5.00 21.00 31.00 42.49 50.50 483.00 10
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.340 0.790 0.960 1.355 1.250 15.150
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 8.00 27.00 36.00 44.86 51.00 344.00
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 45.0 454.0 562.9 554.9 656.5 900.0 123
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 35.31 494.40 941.30 1245.83 1770.00 6405.00 192
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 4.300 5.800 6.300 7.142 7.400 16.300 184
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.0140 0.6125 1.1550 2.0184 2.4300 29.4900 195
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.240 1.070 1.250 1.256 1.442 2.950 221
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 9.5 11.5 12.1 12.6 12.8 69.7 28
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.830 0.980 1.035 1.084 1.100 7.200 29
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.82 24.80 27.70 28.12 30.68 111.60 35
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.50 1.10 1.40 1.64 2.00 6.00 1
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 6.828 7.404 7.446 7.433 7.474 7.790 2
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 16.80 56.70 68.70 73.05 83.35 355.00 2
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 15.20 29.55 32.90 34.29 37.60 78.70 2
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 2.40 20.60 22.50 22.43 24.40 41.50 2
Existem, basicamente, duas classes de modelos estatísticos:
Neste relatório apresentamos o primeiro.
Para a construção dos modelos, foi escolhido não incorporar os efeitos das covariáveis Tabagismo e Etilismo, pois o critério de classificação junto aos pacientes foi subjetivo. Ou seja, segundo os pesquisadores, a qualidade do dado pode não ser ideal.
Também foi escolhido não implementar as covariáveis: Troponina, LDH, Fibrogênio, Ferritina, Hemoglobina Glicada, TSH e Tiroxina T4, dado que existem muitos dados faltantes.
Como sugestão dos pesquisarores resposáveis, foi proposto a criação de modelos separados considerando exames de gasometria, hemograma e para as variáveis gerais. Neste relatório também é proposto a seleção das variáveis significativas (0,05) para a criação de um modelo com as covariáveis mistas. Embora seja um método arbitrário e não recomendável, tal escolha foi feita na ausência (até o presente momento) de ferramentas de seleção mais refinadas. Metodolodias como step-wise requerem o uso das mesmas informações nas etapas, com nossos dados, considerando a quantidade de covariáveis e a quantidade de informações faltantes, este método seria aplicável em uma quantidade muito baixa de pacientes (<100).
## var_1 exp(coef)_1 p-value_1 var_2 exp(coef)_2 p-value_2
## Hiper_1:2 1.06 0.67 Hiper_1:3 0.92 0.82
## Obesidade_1:2 1.16 0.24 Obesidade_1:3 0.56 0.15
## Diabetes1_1:2 0.91 0.5 Diabetes1_1:3 0.85 0.64
## DPOC1_1:2 0.95 0.88 DPOC1_1:3 0.21 0.15
## Genero1_1:2 1.16 0.21 Genero1_1:3 0.93 0.84
## Nausea1_1:2 0.47 0.32 Nausea1_1:3 0.84 0.83
## vascular1_1:2 0.47 0 vascular1_1:3 0.78 0.53
## renal1_1:2 0.32 0 renal1_1:3 2.14 0.04
## UTI1_1:2 0.26 0 UTI1_1:3 2.23 0.07
## agemédio_1:2 0.93 0.8 agemédio_1:3 0.32 0.17
## ageidoso_1:2 0.82 0.49 ageidoso_1:3 0.95 0.95
Considerando somente as de efeito marginalmente significativos:
## var_1 exp(coef)_1 p-value_1 var_2 exp(coef)_2 p-value_2
## vascular1_1:2 0.49 0 vascular1_1:3 0.87 0.69
## renal1_1:2 0.31 0 renal1_1:3 2.04 0.05
## UTI1_1:2 0.26 0 UTI1_1:3 1.99 0.11
## agemédio_1:2 0.94 0.83 agemédio_1:3 0.34 0.14
## ageidoso_1:2 0.79 0.44 ageidoso_1:3 1 1
Considerando somente os exames de gasometria:
## var_1 exp(coef)_1 p-value_1 var_2 exp(coef)_2
## Lactato_1:2 0.93 0.34 Lactato_1:3 1.57
## PH_1:2 0.96 0.97 PH_1:3 3.93
## pO2_1:2 1 0.72 pO2_1:3 1
## pCO2_1:2 0.95 0 pCO2_1:3 1.02
## Bicarbonato_HCO3_1:2 1.08 0.01 Bicarbonato_HCO3_1:3 0.97
## p-value_2
## 0.01
## 0.54
## 0.86
## 0.55
## 0.74
## var_1 exp(coef)_1 p-value_1 var_2
## Hemoglobina_HB_1:2 1.02 0.82 Hemoglobina_HB_1:3
## Hematocrito_HT_1:2 1.03 0.38 Hematocrito_HT_1:3
## Leucocitos_totais_WBC_1:2 1 0.29 Leucocitos_totais_WBC_1:3
## Neutrofilos_SEG_1:2 0.95 0 Neutrofilos_SEG_1:3
## Linfocitos_LINFO_1:2 1 0 Linfocitos_LINFO_1:3
## Plaquetas_PLT_1:2 1 0 Plaquetas_PLT_1:3
## exp(coef)_2 p-value_2
## 0.78 0.48
## 1.06 0.68
## 1.02 0.2
## 0.96 0.34
## 1 0.77
## 1 0.14
Considerando alguns outros exames até então não utilizados e a juntão dos exames acima:
## var_1 exp(coef)_1 p-value_1
## Proteina_C_Reativa_PCR_1:2 1 0
## Dimero_D_1:2 1 0.12
## Glicose_1:2 1 0
## Aspartato_Aminotransferase_AST_1:2 1 0.94
## Alanina_aminotransferase_ALT_1:2 1 0.59
## Creatinina_1:2 0.9 0.02
## var_2 exp(coef)_2 p-value_2
## Proteina_C_Reativa_PCR_1:3 1 0.06
## Dimero_D_1:3 1 0.31
## Glicose_1:3 1 0.65
## Aspartato_Aminotransferase_AST_1:3 1.01 0.14
## Alanina_aminotransferase_ALT_1:3 0.99 0.06
## Creatinina_1:3 1.01 0.82
## var_1 exp(coef)_1 p-value_1
## Hemoglobina_HB_1:2 0.93 0.58
## Hematocrito_HT_1:2 1.08 0.09
## Leucocitos_totais_WBC_1:2 0.99 0.14
## Neutrofilos_SEG_1:2 0.96 0.07
## Linfocitos_LINFO_1:2 1 0
## Plaquetas_PLT_1:2 1 0
## Proteina_C_Reativa_PCR_1:2 1 0
## Dimero_D_1:2 1 0.16
## Glicose_1:2 1 0.05
## Aspartato_Aminotransferase_AST_1:2 1 0.73
## Alanina_aminotransferase_ALT_1:2 1 0.09
## Creatinina_1:2 1.01 0.78
## Tempo_de_protrombina_TP_1:2 0.86 0.16
## RNI_1:2 9.35 0.07
## Tempo_de_tromboplastina_parcial_ativada_TTPA_1:2 0.97 0.22
## Lactato_1:2 0.94 0.45
## PH_1:2 1.38 0.77
## pO2_1:2 1 0.39
## pCO2_1:2 0.96 0.02
## Bicarbonato_HCO3_1:2 1.06 0.1
## var_2 exp(coef)_2 p-value_2
## Hemoglobina_HB_1:3 0.75 0.47
## Hematocrito_HT_1:3 1.07 0.65
## Leucocitos_totais_WBC_1:3 1.03 0
## Neutrofilos_SEG_1:3 0.89 0.02
## Linfocitos_LINFO_1:3 1 0.83
## Plaquetas_PLT_1:3 1 0.04
## Proteina_C_Reativa_PCR_1:3 1 0.1
## Dimero_D_1:3 1 0.21
## Glicose_1:3 1 0.69
## Aspartato_Aminotransferase_AST_1:3 1 0.7
## Alanina_aminotransferase_ALT_1:3 1 0.53
## Creatinina_1:3 0.96 0.69
## Tempo_de_protrombina_TP_1:3 0.76 0.36
## RNI_1:3 43.31 0.27
## Tempo_de_tromboplastina_parcial_ativada_TTPA_1:3 1.04 0.11
## Lactato_1:3 1.86 0
## PH_1:3 3.44 0.69
## pO2_1:3 1 0.28
## pCO2_1:3 1.03 0.53
## Bicarbonato_HCO3_1:3 0.98 0.78
Agora, selecionando somente os exames significativos:
## var_1 exp(coef)_1 p-value_1 var_2
## Leucocitos_totais_WBC_1:2 1 0.27 Leucocitos_totais_WBC_1:3
## Neutrofilos_SEG_1:2 0.96 0.05 Neutrofilos_SEG_1:3
## Linfocitos_LINFO_1:2 1 0 Linfocitos_LINFO_1:3
## Plaquetas_PLT_1:2 1 0 Plaquetas_PLT_1:3
## Proteina_C_Reativa_PCR_1:2 1 0 Proteina_C_Reativa_PCR_1:3
## Glicose_1:2 1 0.01 Glicose_1:3
## Lactato_1:2 0.99 0.93 Lactato_1:3
## pCO2_1:2 0.98 0.04 pCO2_1:3
## exp(coef)_2 p-value_2
## 1.02 0
## 0.91 0.04
## 1 0.97
## 1 0.07
## 1 0.02
## 1 0.9
## 1.71 0
## 1.02 0.17
Selecionando as covariáveis de efeito considerável, apresentado nas etapas anteriores o modelo abaixo é proposto:
## var_1 exp(coef)_1 p-value_1 var_2
## vascular1_1:2 0.46 0 vascular1_1:3
## renal1_1:2 0.33 0 renal1_1:3
## UTI1_1:2 0.27 0 UTI1_1:3
## agemédio_1:2 0.98 0.96 agemédio_1:3
## ageidoso_1:2 0.83 0.59 ageidoso_1:3
## Leucocitos_totais_WBC_1:2 1 0.37 Leucocitos_totais_WBC_1:3
## Neutrofilos_SEG_1:2 0.98 0.26 Neutrofilos_SEG_1:3
## Linfocitos_LINFO_1:2 1 0 Linfocitos_LINFO_1:3
## Plaquetas_PLT_1:2 1 0 Plaquetas_PLT_1:3
## Proteina_C_Reativa_PCR_1:2 1 0.26 Proteina_C_Reativa_PCR_1:3
## Glicose_1:2 1 0.16 Glicose_1:3
## Lactato_1:2 0.97 0.69 Lactato_1:3
## pCO2_1:2 0.99 0.13 pCO2_1:3
## exp(coef)_2 p-value_2
## 1.08 0.85
## 2.58 0.03
## 1.53 0.43
## 0.35 0.06
## 0.99 0.99
## 1.02 0
## 0.93 0.18
## 1 0.33
## 1 0.04
## 1 0.18
## 1 0.92
## 1.79 0
## 1.01 0.5
Novamente, retirando as covariáveis que falham no teste de hipótese:
## var_1 exp(coef)_1 p-value_1 var_2
## vascular1_1:2 0.48 0 vascular1_1:3
## renal1_1:2 0.31 0 renal1_1:3
## UTI1_1:2 0.26 0 UTI1_1:3
## agemédio_1:2 1.07 0.82 agemédio_1:3
## ageidoso_1:2 0.89 0.7 ageidoso_1:3
## Leucocitos_totais_WBC_1:2 0.99 0.1 Leucocitos_totais_WBC_1:3
## Linfocitos_LINFO_1:2 1 0 Linfocitos_LINFO_1:3
## Plaquetas_PLT_1:2 1 0 Plaquetas_PLT_1:3
## Lactato_1:2 0.91 0.19 Lactato_1:3
## exp(coef)_2 p-value_2
## 0.94 0.85
## 2.01 0.05
## 1.78 0.21
## 0.18 0.02
## 0.7 0.58
## 1.01 0
## 1 0.24
## 1 0.01
## 1.81 0
Este modelo será chamado de md.mix.sig
Embora o AIC seja um bom critério para selecionar o modelo, é importante verificar que no relatório ele não é diretamente aplicável, pois diferentes observações são utilizadas na estimação. Isto ocorre pela falta de informações dos pacientes.
Os valores do AIC são apresentado a seguir:
## Warning in AIC.default(md.com, md.com.sig, md.gasm, md.hem, md.otex, md.ex.all,
## : os modelos não foram todos ajustados com o mesmo número de observações
## df AIC nrow mean concordance
## md.com 22 3842.389 409 9.394595 0.7690155
## md.com.sig 10 3830.393 409 9.365263 0.7603828
## md.gasm 10 4060.195 407 9.975910 0.5673050
## md.hem 12 4061.848 408 9.955511 0.6068943
## md.otex 12 3312.167 345 9.600485 0.6531239
## md.ex.all 40 2988.857 319 9.369459 0.6988941
## md.ex.sig 16 3501.370 363 9.645648 0.6569691
## md.mix 26 3294.388 363 9.075449 0.7892954
## md.mix.sig 18 3785.882 407 9.301922 0.7786062
Perecebe-se que os modelos md.com.sig ,md.mix e
md.mix.sig parecem ter um ajuste razoável e preferível em
relação aos demais. O modelo escolhido será o md.mix.sig
A construção do modelo supõe a proporcionalidade dos efeitos, uma hipótese relativamente forte. Sendo assim, é necessário avaliar se a hipótese é (estatisticamente) aceitáel. Para isso, a análise dos resíduos é feita.
## chisq df p
## vascular_1:2 5.1357 1 0.023
## renal_1:2 2.8910 1 0.089
## UTI_1:2 1.4584 1 0.227
## age_1:2 3.8460 2 0.146
## Leucocitos_totais_WBC_1:2 0.3239 1 0.569
## Linfocitos_LINFO_1:2 0.2582 1 0.611
## Plaquetas_PLT_1:2 0.3569 1 0.550
## Lactato_1:2 0.0667 1 0.796
## vascular_1:3 0.4316 1 0.511
## renal_1:3 0.2753 1 0.600
## UTI_1:3 0.0349 1 0.852
## age_1:3 0.2169 2 0.897
## Leucocitos_totais_WBC_1:3 1.5497 1 0.213
## Linfocitos_LINFO_1:3 3.8469 1 0.050
## Plaquetas_PLT_1:3 0.4780 1 0.489
## Lactato_1:3 0.4068 1 0.524
## GLOBAL 17.9185 18 0.461
Para verificar a qualidade do ajuste do modelo, a análise dos resíduos de Cox-Snell é proposta e apresentada a seguir.
## concordant discordant tied.x tied.y tied.xy concordance
## 5.568000e+04 1.581200e+04 0.000000e+00 3.215000e+03 0.000000e+00 7.788284e-01
## std
## 1.323647e-02
## concordant discordant tied.x tied.y tied.xy concordance
## 6.459000e+03 1.857000e+03 0.000000e+00 2.500000e+01 0.000000e+00 7.766955e-01
## std
## 3.782735e-02
Sendo assim, avaliar as incidências acumuladas não permite compreender, diretamente, os efeitos das covariáveis no modelo.