Introdução

Com os dados selecionados, uma análise Multi Estado tem se demonstrado estatisticamente inviável.

O modelo proposto, até o momento, é de riscos competitivos. Neste modelo, estudamos apenas dois eventos de interesse: alta e óbito.

Entretanto, como inicialmente tinhamos o desejo de estudar a trajetória do paciente dentro do hospital, em especial a necessidade ou não da UTI, foi inserido uma covariável númerica contando no modelo. Assim, embora não estejamos modelando a presença do paciente na UTI diretamente, podemos avaliar seu efeito no desfecho final.

Estrutura do Modelo

A estrutura do modelo é:

## Warning: pacote 'knitr' foi compilado no R versão 4.4.2
Eventos Riscos Competitivos

Eventos Riscos Competitivos

Tratamento dos dados

O tratamento dos dados foi feito basicamente atribuindo 0 para unchecked e 1 para checked.
  • Etilismo e Tabagismo as faltas de informações foram consideradas como uma categoria, não exclúidas.
  • Renal é a indicação de alguma problema renal entre os 4 apresentados nos dados.
  • Frequência respiratória: <12- ótimo; 13-20- normal; 21-24- anormal; 25-30- definitivamente anormal e >30 péssimo.
  • Diabetes, asma(DPOC) e cancer é a indicadora de dois, de cada, dos dados coletados. Por exemplo, Diabetes = Diabetes tipo 1 + Diabetes tipo 2.

Resultados iniciais

A incidência acumulada, definida como probabilidade de ocorrência acumulada dos eventos dado que um inibe o outro.


Variáveis Gerais

De maneira similar, a probabilidade da ocorrência dos eventos pode ser calculada separadamente considerando as covariáveis categóricas.

Gênero
Categoria Frequencia Percentual
0 172 42.1
1 237 57.9


Hipertensão
Categoria Frequencia Percentual
0 210 51.3
1 199 48.7


Obesidade
Categoria Frequencia Percentual
0 275 67.2
1 134 32.8


Renal
Categoria Frequencia Percentual
0 370 90.5
1 39 9.5


Tabagismo
Categoria Frequencia Percentual
0 153 39.1
1 104 26.6
2 123 31.5
3 11 2.8


Etilismo
Categoria Frequencia Percentual
0 147 37.7
1 29 7.4
2 177 45.4
3 37 9.5


Diabetes
Categoria Frequencia Percentual
0 278 68
1 131 32


DPOC
Categoria Frequencia Percentual
0 387 94.6
1 22 5.4


Cancer
Categoria Frequencia Percentual
0 406 99.3
1 3 0.7


Para a Frequência Respiratória (FR), na classificação inicial, percebe-se duas coisas:

Podemos ver a distribuição dos casos:

FR
Categoria Frequencia Percentual
ótimo 2 0.6
normal 54 16.4
anormal 88 26.7
def. anormal 109 33.1
péssimo 76 23.1

Com o objetivo de buscar maior estabilidade numérica durante os cálculos e simplificar o modelo, é proposto uma classificação mais próxima das referências. Isto é, juntar em apenas duas categorias:

  • boa - (classificações: ótima e normal)
  • ruim - (classificações de anormal até péssimo)

Com isso:


Outra categorização proposta pelos pesquisadores é a separação em três categorias:

  • boa - (classificações: ótima e normal)
  • médio - (classificações: anormal e def. anormal)
  • ruim - (classificação: péssimo)


Nausea
Categoria Frequencia Percentual
0 405 99
1 4 1


Diarreia
Categoria Frequencia Percentual
0 394 96.3
1 15 3.7


Vascular
Categoria Frequencia Percentual
0 359 87.8
1 50 12.2


Age
Categoria Frequencia Percentual
jovem 11 2.7
médio 218 53.3
idoso 180 44.0

Exames Laboratoriais

Um estudo inicial dos exames laboratoriais foi feito.

Exames Exames.1 Exames.2
Hemoglobina_HB Glicose Tempo_de_protrombina_TP
Hematócrito_HT Aspartato_Aminotransferase_AST RNI
Leucócitos_totais_WBC Alanina_aminotransferase_ALT Tempo_de_tromboplastina_parcial_ativada_TTPA
Neutrófilos_SEG Creatinina Lactato
Linfócitos_LINFO Ureia PH
Plaquetas_PLT Fibrinogênio pO2
Proteína_C_Reativa_PCR Ferritina pCO2
Troponina Hemoglobina_glicosilada Bicarbonato_(HCO3)
LDH TSH -
Dímero-D Tiroxina_Livre_T4 -
Detalhes dos exames:

Hemoglobina (HB)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    3.10   12.50   13.90   13.57   15.10   19.20       1

Hematócrito (HT)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    9.70   37.80   41.40   40.56   44.50   60.40       1

Leucócitos totais (WBC)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   1.060   6.003   7.990   9.516  10.912 249.380       1

Neutrófilos (SEG)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.160   4.090   6.145   6.741   8.685  26.890       1

Linfócitos (LINFO)

##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max.     NA's 
##   0.0600   0.6175   0.9900   4.0241   1.4325 940.0000        1

Plaquetas (PLT)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    2.35  151.75  191.00  209.81  246.00  667.00       1

Proteína C-Reativa (PCR)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    1.69   47.65   89.40  106.38  159.25  376.00      17

Troponina

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    3.00    6.05    9.80   23.67   18.29  805.40     106

LDH

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    25.0   246.2   300.0   322.3   383.2   825.0     111

Dímero-D

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##      45     548     907    3265    2069   80000       9

Glicose

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    47.0   107.0   129.5   157.1   165.0   836.0      27

AST

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    8.00   25.00   35.00   43.42   50.00  300.00      16

ALT

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    5.00   21.00   31.00   42.49   50.50  483.00      10

Creatinina

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.340   0.790   0.960   1.355   1.250  15.150

Ureia

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    8.00   27.00   36.00   44.86   51.00  344.00

Fibrinogênio

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    45.0   454.0   562.9   554.9   656.5   900.0     123

Ferritina

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   35.31  494.40  941.30 1245.83 1770.00 6405.00     192

Hemoglobina glicada

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   4.300   5.800   6.300   7.142   7.400  16.300     184

TSH

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##  0.0140  0.6125  1.1550  2.0184  2.4300 29.4900     195

Tiroxina livre (T4)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.240   1.070   1.250   1.256   1.442   2.950     221

Tempo de Protrombina (TP)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##     9.5    11.5    12.1    12.6    12.8    69.7      28

RNI

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   0.830   0.980   1.035   1.084   1.100   7.200      29

TTPA

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    0.82   24.80   27.70   28.12   30.68  111.60      35

Lactato

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    0.50    1.10    1.40    1.64    2.00    6.00       1

pH

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   6.828   7.404   7.446   7.433   7.474   7.790       2

pO₂

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   16.80   56.70   68.70   73.05   83.35  355.00       2

pCO₂

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   15.20   29.55   32.90   34.29   37.60   78.70       2

Bicarbonato (HCO₃⁻)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    2.40   20.60   22.50   22.43   24.40   41.50       2

Modelos

Existem, basicamente, duas classes de modelos estatísticos:

  • Riscos proporcionais (Cox)
  • Fine-Gray

Neste relatório apresentamos o primeiro.

Para a construção dos modelos, foi escolhido não incorporar os efeitos das covariáveis Tabagismo e Etilismo, pois o critério de classificação junto aos pacientes foi subjetivo. Ou seja, segundo os pesquisadores, a qualidade do dado pode não ser ideal.

Também foi escolhido não implementar as covariáveis: Troponina, LDH, Fibrogênio, Ferritina, Hemoglobina Glicada, TSH e Tiroxina T4, dado que existem muitos dados faltantes.

Como sugestão dos pesquisarores resposáveis, foi proposto a criação de modelos separados considerando exames de gasometria, hemograma e para as variáveis gerais. Neste relatório também é proposto a seleção das variáveis significativas (0,05) para a criação de um modelo com as covariáveis mistas. Embora seja um método arbitrário e não recomendável, tal escolha foi feita na ausência (até o presente momento) de ferramentas de seleção mais refinadas. Metodolodias como step-wise requerem o uso das mesmas informações nas etapas, com nossos dados, considerando a quantidade de covariáveis e a quantidade de informações faltantes, este método seria aplicável em uma quantidade muito baixa de pacientes (<100).

Modelo cov. gerais

##          var_1 exp(coef)_1 p-value_1         var_2 exp(coef)_2 p-value_2
##      Hiper_1:2        1.06      0.67     Hiper_1:3        0.92      0.82
##  Obesidade_1:2        1.16      0.24 Obesidade_1:3        0.56      0.15
##  Diabetes1_1:2        0.91       0.5 Diabetes1_1:3        0.85      0.64
##      DPOC1_1:2        0.95      0.88     DPOC1_1:3        0.21      0.15
##    Genero1_1:2        1.16      0.21   Genero1_1:3        0.93      0.84
##    Nausea1_1:2        0.47      0.32   Nausea1_1:3        0.84      0.83
##  vascular1_1:2        0.47         0 vascular1_1:3        0.78      0.53
##     renal1_1:2        0.32         0    renal1_1:3        2.14      0.04
##       UTI1_1:2        0.26         0      UTI1_1:3        2.23      0.07
##   agemédio_1:2        0.93       0.8  agemédio_1:3        0.32      0.17
##   ageidoso_1:2        0.82      0.49  ageidoso_1:3        0.95      0.95

Considerando somente as de efeito marginalmente significativos:

##          var_1 exp(coef)_1 p-value_1         var_2 exp(coef)_2 p-value_2
##  vascular1_1:2        0.49         0 vascular1_1:3        0.87      0.69
##     renal1_1:2        0.31         0    renal1_1:3        2.04      0.05
##       UTI1_1:2        0.26         0      UTI1_1:3        1.99      0.11
##   agemédio_1:2        0.94      0.83  agemédio_1:3        0.34      0.14
##   ageidoso_1:2        0.79      0.44  ageidoso_1:3           1         1

Modelo exame de gasometria

Considerando somente os exames de gasometria:

##                 var_1 exp(coef)_1 p-value_1                var_2 exp(coef)_2
##           Lactato_1:2        0.93      0.34          Lactato_1:3        1.57
##                PH_1:2        0.96      0.97               PH_1:3        3.93
##               pO2_1:2           1      0.72              pO2_1:3           1
##              pCO2_1:2        0.95         0             pCO2_1:3        1.02
##  Bicarbonato_HCO3_1:2        1.08      0.01 Bicarbonato_HCO3_1:3        0.97
##  p-value_2
##       0.01
##       0.54
##       0.86
##       0.55
##       0.74

Modelo exame hemograma

##                      var_1 exp(coef)_1 p-value_1                     var_2
##         Hemoglobina_HB_1:2        1.02      0.82        Hemoglobina_HB_1:3
##         Hematocrito_HT_1:2        1.03      0.38        Hematocrito_HT_1:3
##  Leucocitos_totais_WBC_1:2           1      0.29 Leucocitos_totais_WBC_1:3
##        Neutrofilos_SEG_1:2        0.95         0       Neutrofilos_SEG_1:3
##       Linfocitos_LINFO_1:2           1         0      Linfocitos_LINFO_1:3
##          Plaquetas_PLT_1:2           1         0         Plaquetas_PLT_1:3
##  exp(coef)_2 p-value_2
##         0.78      0.48
##         1.06      0.68
##         1.02       0.2
##         0.96      0.34
##            1      0.77
##            1      0.14

Modelo outros exames

Considerando alguns outros exames até então não utilizados e a juntão dos exames acima:

##                               var_1 exp(coef)_1 p-value_1
##          Proteina_C_Reativa_PCR_1:2           1         0
##                        Dimero_D_1:2           1      0.12
##                         Glicose_1:2           1         0
##  Aspartato_Aminotransferase_AST_1:2           1      0.94
##    Alanina_aminotransferase_ALT_1:2           1      0.59
##                      Creatinina_1:2         0.9      0.02
##                               var_2 exp(coef)_2 p-value_2
##          Proteina_C_Reativa_PCR_1:3           1      0.06
##                        Dimero_D_1:3           1      0.31
##                         Glicose_1:3           1      0.65
##  Aspartato_Aminotransferase_AST_1:3        1.01      0.14
##    Alanina_aminotransferase_ALT_1:3        0.99      0.06
##                      Creatinina_1:3        1.01      0.82
##                                             var_1 exp(coef)_1 p-value_1
##                                Hemoglobina_HB_1:2        0.93      0.58
##                                Hematocrito_HT_1:2        1.08      0.09
##                         Leucocitos_totais_WBC_1:2        0.99      0.14
##                               Neutrofilos_SEG_1:2        0.96      0.07
##                              Linfocitos_LINFO_1:2           1         0
##                                 Plaquetas_PLT_1:2           1         0
##                        Proteina_C_Reativa_PCR_1:2           1         0
##                                      Dimero_D_1:2           1      0.16
##                                       Glicose_1:2           1      0.05
##                Aspartato_Aminotransferase_AST_1:2           1      0.73
##                  Alanina_aminotransferase_ALT_1:2           1      0.09
##                                    Creatinina_1:2        1.01      0.78
##                       Tempo_de_protrombina_TP_1:2        0.86      0.16
##                                           RNI_1:2        9.35      0.07
##  Tempo_de_tromboplastina_parcial_ativada_TTPA_1:2        0.97      0.22
##                                       Lactato_1:2        0.94      0.45
##                                            PH_1:2        1.38      0.77
##                                           pO2_1:2           1      0.39
##                                          pCO2_1:2        0.96      0.02
##                              Bicarbonato_HCO3_1:2        1.06       0.1
##                                             var_2 exp(coef)_2 p-value_2
##                                Hemoglobina_HB_1:3        0.75      0.47
##                                Hematocrito_HT_1:3        1.07      0.65
##                         Leucocitos_totais_WBC_1:3        1.03         0
##                               Neutrofilos_SEG_1:3        0.89      0.02
##                              Linfocitos_LINFO_1:3           1      0.83
##                                 Plaquetas_PLT_1:3           1      0.04
##                        Proteina_C_Reativa_PCR_1:3           1       0.1
##                                      Dimero_D_1:3           1      0.21
##                                       Glicose_1:3           1      0.69
##                Aspartato_Aminotransferase_AST_1:3           1       0.7
##                  Alanina_aminotransferase_ALT_1:3           1      0.53
##                                    Creatinina_1:3        0.96      0.69
##                       Tempo_de_protrombina_TP_1:3        0.76      0.36
##                                           RNI_1:3       43.31      0.27
##  Tempo_de_tromboplastina_parcial_ativada_TTPA_1:3        1.04      0.11
##                                       Lactato_1:3        1.86         0
##                                            PH_1:3        3.44      0.69
##                                           pO2_1:3           1      0.28
##                                          pCO2_1:3        1.03      0.53
##                              Bicarbonato_HCO3_1:3        0.98      0.78

Agora, selecionando somente os exames significativos:

##                       var_1 exp(coef)_1 p-value_1                      var_2
##   Leucocitos_totais_WBC_1:2           1      0.27  Leucocitos_totais_WBC_1:3
##         Neutrofilos_SEG_1:2        0.96      0.05        Neutrofilos_SEG_1:3
##        Linfocitos_LINFO_1:2           1         0       Linfocitos_LINFO_1:3
##           Plaquetas_PLT_1:2           1         0          Plaquetas_PLT_1:3
##  Proteina_C_Reativa_PCR_1:2           1         0 Proteina_C_Reativa_PCR_1:3
##                 Glicose_1:2           1      0.01                Glicose_1:3
##                 Lactato_1:2        0.99      0.93                Lactato_1:3
##                    pCO2_1:2        0.98      0.04                   pCO2_1:3
##  exp(coef)_2 p-value_2
##         1.02         0
##         0.91      0.04
##            1      0.97
##            1      0.07
##            1      0.02
##            1       0.9
##         1.71         0
##         1.02      0.17

Modelo com covariáveis mistas

Selecionando as covariáveis de efeito considerável, apresentado nas etapas anteriores o modelo abaixo é proposto:

##                       var_1 exp(coef)_1 p-value_1                      var_2
##               vascular1_1:2        0.46         0              vascular1_1:3
##                  renal1_1:2        0.33         0                 renal1_1:3
##                    UTI1_1:2        0.27         0                   UTI1_1:3
##                agemédio_1:2        0.98      0.96               agemédio_1:3
##                ageidoso_1:2        0.83      0.59               ageidoso_1:3
##   Leucocitos_totais_WBC_1:2           1      0.37  Leucocitos_totais_WBC_1:3
##         Neutrofilos_SEG_1:2        0.98      0.26        Neutrofilos_SEG_1:3
##        Linfocitos_LINFO_1:2           1         0       Linfocitos_LINFO_1:3
##           Plaquetas_PLT_1:2           1         0          Plaquetas_PLT_1:3
##  Proteina_C_Reativa_PCR_1:2           1      0.26 Proteina_C_Reativa_PCR_1:3
##                 Glicose_1:2           1      0.16                Glicose_1:3
##                 Lactato_1:2        0.97      0.69                Lactato_1:3
##                    pCO2_1:2        0.99      0.13                   pCO2_1:3
##  exp(coef)_2 p-value_2
##         1.08      0.85
##         2.58      0.03
##         1.53      0.43
##         0.35      0.06
##         0.99      0.99
##         1.02         0
##         0.93      0.18
##            1      0.33
##            1      0.04
##            1      0.18
##            1      0.92
##         1.79         0
##         1.01       0.5

Novamente, retirando as covariáveis que falham no teste de hipótese:

##                      var_1 exp(coef)_1 p-value_1                     var_2
##              vascular1_1:2        0.48         0             vascular1_1:3
##                 renal1_1:2        0.31         0                renal1_1:3
##                   UTI1_1:2        0.26         0                  UTI1_1:3
##               agemédio_1:2        1.07      0.82              agemédio_1:3
##               ageidoso_1:2        0.89       0.7              ageidoso_1:3
##  Leucocitos_totais_WBC_1:2        0.99       0.1 Leucocitos_totais_WBC_1:3
##       Linfocitos_LINFO_1:2           1         0      Linfocitos_LINFO_1:3
##          Plaquetas_PLT_1:2           1         0         Plaquetas_PLT_1:3
##                Lactato_1:2        0.91      0.19               Lactato_1:3
##  exp(coef)_2 p-value_2
##         0.94      0.85
##         2.01      0.05
##         1.78      0.21
##         0.18      0.02
##          0.7      0.58
##         1.01         0
##            1      0.24
##            1      0.01
##         1.81         0

Seleção do Modelo

Embora o AIC seja um bom critério para selecionar o modelo, é importante verificar que no relatório ele não é diretamente aplicável, pois diferentes observações são utilizadas na estimação. Isto ocorre pela falta de informações dos pacientes.

Os valores do AIC são apresentado a seguir:

## Warning in AIC.default(md.com, md.com.sig, md.gasm, md.hem, md.otex, md.ex.all,
## : os modelos não foram todos ajustados com o mesmo número de observações
##            df      AIC nrow     mean concordance
## md.com     22 3842.389  409 9.394595   0.7690155
## md.com.sig 10 3830.393  409 9.365263   0.7603828
## md.gasm    10 4060.195  407 9.975910   0.5673050
## md.hem     12 4061.848  408 9.955511   0.6068943
## md.otex    12 3312.167  345 9.600485   0.6531239
## md.ex.all  40 2988.857  319 9.369459   0.6988941
## md.ex.sig  16 3501.370  363 9.645648   0.6569691
## md.mix     26 3294.388  363 9.075449   0.7892954
## md.mix.sig 18 3785.882  407 9.301922   0.7786062
Perecebe-se que os modelos md.com.sig ,md.mix e md.mix.sig parecem ter um ajuste razoável e preferível em relação aos demais. O modelo escolhido será o md.mix.sig
o modelo md.mix parece ser interessante, porém ele falha no teste global de proporcionalidade, realizado abaixo

Hipotese de proporcionalidade

A construção do modelo supõe a proporcionalidade dos efeitos, uma hipótese relativamente forte. Sendo assim, é necessário avaliar se a hipótese é (estatisticamente) aceitáel. Para isso, a análise dos resíduos é feita.

##                             chisq df     p
## vascular_1:2               5.1357  1 0.023
## renal_1:2                  2.8910  1 0.089
## UTI_1:2                    1.4584  1 0.227
## age_1:2                    3.8460  2 0.146
## Leucocitos_totais_WBC_1:2  0.3239  1 0.569
## Linfocitos_LINFO_1:2       0.2582  1 0.611
## Plaquetas_PLT_1:2          0.3569  1 0.550
## Lactato_1:2                0.0667  1 0.796
## vascular_1:3               0.4316  1 0.511
## renal_1:3                  0.2753  1 0.600
## UTI_1:3                    0.0349  1 0.852
## age_1:3                    0.2169  2 0.897
## Leucocitos_totais_WBC_1:3  1.5497  1 0.213
## Linfocitos_LINFO_1:3       3.8469  1 0.050
## Plaquetas_PLT_1:3          0.4780  1 0.489
## Lactato_1:3                0.4068  1 0.524
## GLOBAL                    17.9185 18 0.461

Resíduos de Cox-Snell

Para verificar a qualidade do ajuste do modelo, a análise dos resíduos de Cox-Snell é proposta e apresentada a seguir.

##   concordant   discordant       tied.x       tied.y      tied.xy  concordance 
## 5.568000e+04 1.581200e+04 0.000000e+00 3.215000e+03 0.000000e+00 7.788284e-01 
##          std 
## 1.323647e-02

##   concordant   discordant       tied.x       tied.y      tied.xy  concordance 
## 6.459000e+03 1.857000e+03 0.000000e+00 2.500000e+01 0.000000e+00 7.766955e-01 
##          std 
## 3.782735e-02