Relatório: Multiestado

Introdução

Neste relatório é apresentado os resultados iniciais para uma análise multiestado da trajetória de pacientes internados por COVID-19 no Hospital das Clínicas da Unicamp, Campinas.

Análises similares foram propostas por diversos autores

links

Os dados contém 220 covariáveis distintas, como sexo, idade, exames laboratoriais e clínicos. Também existem covariáveis descrevendo as datas e informações relativas da saúde do paciente nos estados.

Para esta análise, o pacote msm foi utilizado. Em geral, os modelos tem se mostrados estatisticamente inviáveis para os dados. A causa pode ser dada por diversos fatores: poucos dados e/ou instabildiade matemática (intrinsica dos dados coletados) e/ou poucas transições por pacientes.

Estrutura do Modelo

A estrutura do modelo é:

Estados

Durante a análise os estados são numerados:

1- hosp. (paciente está em um quarto/enfermaria)
2- Uti. (paciente está na UTI)
3- pos.uti (paciente volta para a quarto/enfermaria ao sair da UTI)
4- alta (paciente recebe alta)
5- óbito (paciente vaia óbito)

Elementos matemáticos

Neste tipo de modelagem, tipicamente não se calculam as probabilidades diretamente, mas sim as intensidades. Define-se uma matrix Q onde cada elemento \(q_{ij}\) com \(i \neq j\) representa da probabilidade instantânea de transição do estado \(i\) para o estado \(j\). Os elementos \(q_{ij}\) com \(i=j\) são definidos como o oposto da soma de todos os elementos de sua linha. Pode-se pensar como sendo a taxa instanânea de saída do estado \(i\).

Para o modelo, define-se:

\[\begin{array}{cc} \begin{matrix} \\ \text{hosp.} \\ \text{uti} \\ \text{pos.hosp} \\ \text{alt.} \\ \text{morte} \end{matrix} & \begin{array}{c} \text{hosp} \quad \quad \text{uti}\quad \quad \text{pos.hosp.}\quad \quad \text{alt.}\quad \quad \text{morte} \\ \begin{bmatrix} -3 & 1 & 0 & 1 & 1 \\ 0 & -3 & 1 & 1 & 1 \\ 0 & 0 & -2 & 1 & 1 \\ 0 & 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 0 & 1 \end{bmatrix} \end{array} \end{array}\]

Tratamento dos dados

O tratamento dos dados é realizado transformando os dados em long-format, conforme a metodologia empregada em referências e pacotes.

É importante comentar que é acrescentado uma observação informando que o paciente se encontra no estado 1 (hosp.) no tempo 0, assim é possível modelar a saída dos pacientes deste estado.

Uma contagem das transições efetuadas é apresentada a seguir:

##     to
## from   1   2   3   4   5
##    1   0 198   0 203   5
##    2   0   0 131  24  43
##    3   0   0   0 125   3

A distribuição da quantidade de transições dos pacientes:

##      media mediana min(n) max(n)
## 1 2.802956       2      2      4

Modelos

Diversos modelos podem ser propostos. Aqui é feita a separação em duas classes:

Modelos Markovianos;
Modelos Semi-Markovianos.

O primeiro pressupõe que as probabilidades de transição de um estado para o outro não dependem de todo o histórico, mas somente do estado atual. O segundo tem a mesma hipótese, porém é também é considerado que o processo se renova, no sentido de que ao entrar em um novo estado, o processo volta ao tempo incial. Algumas referências costumam classificar como clock-foward e clock-reset.

Para os modelos Markovianos o pacote requer a classificação das observações em três tipos diferentes:

1- observação feita em um tempo arbitrário (snapshot). O estado entre as observações é desconhecido.
2- observação realizada no tempo exato da transição. O estado anterior é mantido.
3- observação realizada no tempo exato da transição. O estado anterior é desconhecido.

Para todos os modelos a classificação 1 e 3 tem se demonstrado inviáveis. Entretanto, se todas as observações são do tipo 2, então outros métodos estatísticos podem ser propostos. Também perde-se o teste de hipótese proposto por Aguirre-Hernandez and Farewell, 2002 (prevalence.msm).

Para evaluar os parâmetros (intensidades) é necessário apresentar uma estimativa inicial para estas quantidades. Um argumento que reforça a baixa estabilidade numérica encontrada nos dados é pouca diferença entre a estimativa inicial e o valor encontrado pelo algoritmo.

Modelo - Markoviano de intensidades constantes.

Considerando obstype = 2. As matrizes de intensidade instantânea e inicial seguem, respectivamente, abaixo:

##            1           2           3           4           5
## 1 -0.1773659  0.08649865  0.00000000 0.088682962 0.002184309
## 2  0.0000000 -0.05898216  0.03902355 0.007149353 0.012809258
## 3  0.0000000  0.00000000 -0.15238095 0.148809524 0.003571429
##    0.0000000  0.00000000  0.00000000 0.000000000 0.000000000
##    0.0000000  0.00000000  0.00000000 0.000000000 0.000000000

##            1           2           3           4           5
## 1 -0.1773659  0.08649865  0.00000000 0.088682962 0.002184309
## 2  0.0000000 -0.05898216  0.03902355 0.007149353 0.012809258
## 3  0.0000000  0.00000000 -0.15238095 0.148809524 0.003571429
##    0.0000000  0.00000000  0.00000000 0.000000000 0.000000000
##    0.0000000  0.00000000  0.00000000 0.000000000 0.000000000

Com estes valores é possível avaliar a qualidade geral do ajuste pelo gráfico de prevalência, que mostra a proporção dos pacientes em cada estado.

De maneira similar, considerando obstype = 3:

##            1           2           3           4           5
## 1 -0.2433658  0.11990361  0.00000000 0.121262729 0.002199479
## 2  0.0000000 -0.05993472  0.03995202 0.007154468 0.012828234
## 3  0.0000000  0.00000000 -0.15238095 0.148809524 0.003571429
##    0.0000000  0.00000000  0.00000000 0.000000000 0.000000000
##    0.0000000  0.00000000  0.00000000 0.000000000 0.000000000

##            1           2           3           4           5
## 1 -0.1773659  0.08649865  0.00000000 0.088682962 0.002184309
## 2  0.0000000 -0.05898216  0.03902355 0.007149353 0.012809258
## 3  0.0000000  0.00000000 -0.15238095 0.148809524 0.003571429
##    0.0000000  0.00000000  0.00000000 0.000000000 0.000000000
##    0.0000000  0.00000000  0.00000000 0.000000000 0.000000000

Modelo- Markoviano de intensidade constante por partes.

Com os dados anteriores é possível perceber que o modelo estima que desde o início existem pacientes recebendo alta, porém isto não é observado. Pelos dados coletados os pacientes foram internados no hospital começam a receber alta após o quarto dia. Sendo assim, é razoável supor que os riscos são possivelmente diferentes entre o tempo de admissão (t = 0) até o quarto dia (t = 4) e do quarto dia em seguinte.

Fixando o efeito inicial da transição 1-4 em 0.005 (um escolha ad hoc) temos:

Modelo- Markoviano intensidades constantes e covariáveis.

Assumindo um modelo de riscos proprocionais (análogo ao modelo de Cox) entre as mesmas transições pode-se estimar os efeitos das covariáveis nas transições.

Como no modelo de riscos competitivos, não existe um método direto e formal para escolher as covariáveis. Metodologias como o step-wise não são viáveis, pela quantidade de informações faltantes e estabilidade do modelo.

Análises prelimares mostram que embora seja possível obter estimativas dos efeitos de uma covariável em todas as transições, em geral quase todas se mostram não siginificativas e as covariáveis que apresentaram efeitos consideráveis mostram isso somente em algumas transições.

Por exemplo, o efeito da covariável Vascular:

 msm.m<- msm( to ~ Tstop ,  
              subject=id, data= dt,
             qmatrix = Q.crude,
             covariates = ~ vascular ,
             obstype = 2,
             control = list(fnscale = 800000, maxit = 1000),
             method = "BFGS")

msm.m

## 
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q.crude,     obstype = 2, covariates = ~vascular, control = list(fnscale = 8e+05,         maxit = 1000), method = "BFGS")
## 
## Maximum likelihood estimates
## Baselines are with covariates set to their means
## 
## Transition intensities with hazard ratios for each covariate
##       Baseline                         vascular                
## 1 - 1 -0.174842 (-0.1931682,-0.158254)                         
## 1 - 2  0.086875 ( 0.0755671, 0.099875) 1.5878 (1.08912, 2.3148)
## 1 - 4  0.085786 ( 0.0742588, 0.099103) 0.5616 (0.32065, 0.9836)
## 1 - 5  0.002181 ( 0.0008996, 0.005286) 0.8641 (0.04425,16.8767)
## 2 - 2 -0.060820 (-0.0699917,-0.052851)                         
## 2 - 3  0.040641 ( 0.0342465, 0.048229) 0.5746 (0.36242, 0.9109)
## 2 - 4  0.007619 ( 0.0051318, 0.011311) 0.4343 (0.13399, 1.4073)
## 2 - 5  0.012561 ( 0.0091804, 0.017186) 1.1587 (0.59715, 2.2483)
## 3 - 3 -0.160926 (-0.1914329,-0.135281)                         
## 3 - 4  0.157359 ( 0.1320342, 0.187541) 0.4612 (0.28411, 0.7488)
## 3 - 5  0.003567 ( 0.0010862, 0.011716) 1.0394 (0.08687,12.4364)
## 
## -2 * log-likelihood:  5415.002

Perebe-se que o efeito é considerável somente nas transições 1-2 e 1-4.

Sendo assim, os modelos são construídos de acordo com a literatura disponível e através de critérios escolhidos pelos pesquisadores.

Modelo: Idade + Gênero

Considerando que as transições 1-2, 1-4, 2-3, 2-5, 3-4 e 3-5 dependem da idade, em 3 categorias e o gênero:

## 
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q.crude,     obstype = 2, covariates = list(`1-2` = ~age + Genero, `1-4` = ~age +         Genero, `2-3` = ~age + Genero, `2-5` = ~age + Genero,         `3-4` = ~age + Genero, `3-5` = ~age + Genero), center = FALSE,     control = list(fnscale = 8000, maxit = 1000), method = "BFGS")
## 
## Maximum likelihood estimates
## Baselines are with covariates set to 0
## 
## Transition intensities with hazard ratios for each covariate
##       Baseline                          agemiddle                   
## 1 - 1 -0.187129 (-3.381e-01,-1.036e-01)                             
## 1 - 2  0.062857 ( 2.334e-02, 1.693e-01) 1.4664 (5.303e-01,4.055e+00)
## 1 - 4  0.122087 ( 5.769e-02, 2.584e-01) 0.8431 (3.833e-01,1.854e+00)
## 1 - 5  0.002184 ( 9.092e-04, 5.248e-03) 1.0000                      
## 2 - 2 -0.046495 (-1.090e-01,-1.984e-02)                             
## 2 - 3  0.021748 ( 5.385e-03, 8.784e-02) 2.2609 (5.450e-01,9.379e+00)
## 2 - 4  0.007149 ( 4.792e-03, 1.067e-02) 1.0000                      
## 2 - 5  0.017597 ( 4.186e-03, 7.397e-02) 0.3798 (7.814e-02,1.846e+00)
## 3 - 3 -1.019904 (-4.320e+00,-2.408e-01)                             
## 3 - 4  1.018415 ( 2.405e-01, 4.312e+00) 0.1795 (4.262e-02,7.556e-01)
## 3 - 5  0.001489 ( 8.097e-29, 2.740e+22) 0.2460 (6.670e-27,9.071e+24)
##       ageelderly                   ageSenior                   
## 1 - 1                                                          
## 1 - 2 0.9225 (3.317e-01,2.566e+00) 1.3395 (4.927e-01,3.642e+00)
## 1 - 4 0.7831 (3.599e-01,1.704e+00) 0.6261 (2.895e-01,1.354e+00)
## 1 - 5 1.0000                       1.0000                      
## 2 - 2                                                          
## 2 - 3 2.2474 (5.378e-01,9.392e+00) 1.7324 (4.229e-01,7.096e+00)
## 2 - 4 1.0000                       1.0000                      
## 2 - 5 0.2443 (4.395e-02,1.358e+00) 0.9254 (2.198e-01,3.895e+00)
## 3 - 3                                                          
## 3 - 4 0.1765 (4.138e-02,7.529e-01) 0.1195 (2.854e-02,5.005e-01)
## 3 - 5 0.2534 (6.980e-27,9.202e+24) 6.8203 (3.767e-25,1.235e+26)
##       Genero1               
## 1 - 1                       
## 1 - 2 1.2093 (0.90879,1.609)
## 1 - 4 0.9879 (0.74838,1.304)
## 1 - 5 1.0000                
## 2 - 2                       
## 2 - 3 0.8591 (0.60101,1.228)
## 2 - 4 1.0000                
## 2 - 5 1.2730 (0.68280,2.373)
## 3 - 3                       
## 3 - 4 0.9661 (0.67311,1.387)
## 3 - 5 0.3817 (0.03477,4.191)
## 
## -2 * log-likelihood:  5410.123

Neste modelo é possível inferir que não existem evidências estatísticas de que o efeito relativo ao gênero é significativo.

De forma similar, a prevalência pode ser comparada:

Modelo: Exames gasometria

## 
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q.crude,     obstype = 2, covariates = ~Lactato + PH + pO2 + pCO2 + Bicarbonato_HCO3,     center = FALSE, control = list(fnscale = 8000, maxit = 1000),     method = "BFGS")
## 
## Maximum likelihood estimates
## Baselines are with covariates set to 0
## 
## Transition intensities with hazard ratios for each covariate
##       Baseline                            Lactato              
## 1 - 1 -0.170959 ( -2.344e+13, -1.247e-15)                      
## 1 - 2  0.081872 (  1.063e-21,  6.307e+18) 1.2521 (1.0402,1.507)
## 1 - 4  0.087003 (  4.648e-22,  1.629e+19) 0.9535 (0.7806,1.165)
## 1 - 5  0.002085 ( 1.116e-138, 3.896e+132) 2.8713 (1.1170,7.381)
## 2 - 2 -0.058472 ( -1.104e+10, -3.097e-13)                      
## 2 - 3  0.038924 (  1.998e-15,  7.583e+11) 0.9622 (0.7698,1.203)
## 2 - 4  0.006967 (  1.379e-44,  3.520e+39) 1.1162 (0.6731,1.851)
## 2 - 5  0.012581 (  1.732e-25,  9.137e+20) 1.4527 (1.0652,1.981)
## 3 - 3 -0.160874 ( -1.405e+08, -1.842e-10)                      
## 3 - 4  0.157806 (  1.804e-10,  1.381e+08) 0.8684 (0.6761,1.116)
## 3 - 5  0.003068 (  3.378e-94,  2.786e+88) 1.7106 (0.3367,8.690)
##       PH                           pO2                   pCO2                 
## 1 - 1                                                                         
## 1 - 2 0.7968 (1.561e-03,4.067e+02) 1.0109 (1.0064,1.015) 1.1163 (1.0276,1.213)
## 1 - 4 0.9613 (1.720e-03,5.372e+02) 1.0001 (0.9947,1.006) 0.9863 (0.9051,1.075)
## 1 - 5 0.7192 (2.864e-19,1.806e+18) 1.0132 (0.9839,1.043) 1.1270 (0.6536,1.943)
## 2 - 2                                                                         
## 2 - 3 1.0946 (1.740e-02,6.885e+01) 1.0023 (0.9974,1.007) 0.9505 (0.8980,1.006)
## 2 - 4 0.8617 (1.900e-06,3.909e+05) 0.9972 (0.9829,1.012) 0.9733 (0.8388,1.129)
## 2 - 5 0.9269 (7.270e-04,1.182e+03) 0.9993 (0.9906,1.008) 0.9961 (0.9128,1.087)
## 3 - 3                                                                         
## 3 - 4 1.0334 (6.416e-02,1.665e+01) 0.9984 (0.9933,1.003) 0.9561 (0.9091,1.005)
## 3 - 5 0.3291 (2.138e-13,5.066e+11) 1.0095 (0.9678,1.053) 0.9809 (0.6992,1.376)
##       Bicarbonato_HCO3    
## 1 - 1                     
## 1 - 2 0.867 (0.7480,1.005)
## 1 - 4 1.038 (0.8991,1.198)
## 1 - 5 0.812 (0.3025,2.180)
## 2 - 2                     
## 2 - 3 1.047 (0.9403,1.165)
## 2 - 4 1.099 (0.8405,1.436)
## 2 - 5 1.005 (0.8399,1.202)
## 3 - 3                     
## 3 - 4 1.077 (0.9832,1.180)
## 3 - 5 1.380 (0.6767,2.814)
## 
## -2 * log-likelihood:  5320.657

Neste modelo as covariáveis que apresentaram efeitos significativos foram: Lactato, pO2 e pCO2. Em geral, os efeitos são significativos somente para a transição 1-2. Entretanto, a variável Lactato apresentou fortes efeitos nos transições 1-5 e 2-5.

Novamente, o gráfico de prevalência segue:

Modelo: hemograma

## 
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q.crude,     obstype = 2, covariates = ~Hemoglobina_HB + Hematocrito_HT +         Leucocitos_totais_WBC + Neutrofilos_SEG + Linfocitos_LINFO +         Plaquetas_PLT, center = FALSE, control = list(fnscale = 8000,         maxit = 1000), method = "BFGS")
## 
## Maximum likelihood estimates
## Baselines are with covariates set to 0
## 
## Transition intensities with hazard ratios for each covariate
##       Baseline                          Hemoglobina_HB         
## 1 - 1 -3.518e-01 (-6.245e+00,-0.019822)                        
## 1 - 2  3.920e-02 ( 1.397e-02, 0.109973) 0.8193 (0.62727, 1.070)
## 1 - 4  2.295e-02 ( 7.649e-03, 0.068871) 0.9932 (0.75948, 1.299)
## 1 - 5  2.897e-01 ( 8.839e-03, 9.493789) 1.5979 (0.23251,10.981)
## 2 - 2 -6.152e-02 (-2.443e-01,-0.015493)                        
## 2 - 3  1.515e-02 ( 4.181e-03, 0.054909) 1.2546 (0.89132, 1.766)
## 2 - 4  6.616e-05 ( 1.428e-06, 0.003066) 0.7955 (0.36490, 1.734)
## 2 - 5  4.630e-02 ( 7.784e-03, 0.275424) 0.7111 (0.38961, 1.298)
## 3 - 3 -4.011e-02 (-1.736e-01,-0.009264)                        
## 3 - 4  3.748e-02 ( 8.980e-03, 0.156440) 1.3107 (0.92746, 1.852)
## 3 - 5  2.626e-03 ( 2.599e-07,26.520176) 0.7679 (0.05778,10.205)
##       Hematocrito_HT        Leucocitos_totais_WBC   Neutrofilos_SEG        
## 1 - 1                                                                      
## 1 - 2 1.0756 (0.9790,1.182) 1.0191 (0.99838, 1.040) 1.0819 (1.04134, 1.124)
## 1 - 4 1.0317 (0.9379,1.135) 0.9911 (0.94779, 1.036) 0.9740 (0.90845, 1.044)
## 1 - 5 0.7653 (0.4052,1.445) 0.9382 (0.18707, 4.705) 1.2794 (0.22025, 7.432)
## 2 - 2                                                                      
## 2 - 3 0.9400 (0.8285,1.066) 0.9106 (0.70183, 1.182) 1.0846 (0.81754, 1.439)
## 2 - 4 1.2107 (0.9105,1.610) 1.0362 (1.01060, 1.062) 0.9227 (0.82469, 1.032)
## 2 - 5 1.1117 (0.8889,1.390) 1.0109 (0.95592, 1.069) 0.9466 (0.85763, 1.045)
## 3 - 3                                                                      
## 3 - 4 0.9418 (0.8297,1.069) 0.9388 (0.70118, 1.257) 1.0645 (0.77672, 1.459)
## 3 - 5 1.1060 (0.4295,2.848) 0.5814 (0.02632,12.844) 1.3120 (0.04995,34.460)
##       Linfocitos_LINFO        Plaquetas_PLT        
## 1 - 1                                              
## 1 - 2 0.9805 (0.95505, 1.007) 0.9994 (0.9976,1.001)
## 1 - 4 1.0009 (0.99894, 1.003) 1.0020 (1.0001,1.004)
## 1 - 5 0.8329 (0.09837, 7.053) 0.9896 (0.9758,1.004)
## 2 - 2                                              
## 2 - 3 1.1043 (0.81511, 1.496) 1.0027 (1.0009,1.004)
## 2 - 4 0.9524 (0.88517, 1.025) 1.0010 (0.9961,1.006)
## 2 - 5 1.0020 (0.93745, 1.071) 0.9962 (0.9923,1.000)
## 3 - 3                                              
## 3 - 4 1.1460 (0.77294, 1.699) 1.0007 (0.9991,1.002)
## 3 - 5 1.1984 (0.03130,45.890) 1.0092 (0.9966,1.022)
## 
## -2 * log-likelihood:  5329.904

Analisando o gráfico de prevalência verifica-se que o modelo não apresentou uma boa convergência:

Modelo: comorbidades

Neste modelo busca-se avaliar o efeitos das covariáveis relativas a alguma comobidade do paciente:

## 
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q.crude,     obstype = 2, covariates = ~renal + vascular + DPOC + Obesidade +         Hiper + Diabetes, center = FALSE, control = list(fnscale = 8000,         maxit = 1000), method = "BFGS")
## 
## Maximum likelihood estimates
## Baselines are with covariates set to 0
## 
## Transition intensities with hazard ratios for each covariate
##       Baseline                         renal                      
## 1 - 1 -1.606e-01 (-1.890e-01,-0.13651)                            
## 1 - 2  5.295e-02 ( 4.104e-02, 0.06832)  2.0732 (1.52136,2.825e+00)
## 1 - 4  1.048e-01 ( 8.489e-02, 0.12934)  0.4395 (0.29641,6.516e-01)
## 1 - 5  2.906e-03 ( 7.754e-04, 0.01089)  2.0275 (0.28028,1.467e+01)
## 2 - 2 -1.046e-01 (-1.361e-01,-0.08034)                            
## 2 - 3  7.599e-02 ( 5.600e-02, 0.10311)  0.3740 (0.25735,5.436e-01)
## 2 - 4  1.920e-02 ( 9.717e-03, 0.03795)  0.4144 (0.17276,9.939e-01)
## 2 - 5  9.368e-03 ( 4.398e-03, 0.01995)  2.1718 (1.02292,4.611e+00)
## 3 - 3 -2.285e-01 (-3.085e-01,-0.16918)                            
## 3 - 4  2.284e-01 ( 1.691e-01, 0.30847)  0.4965 (0.33378,7.384e-01)
## 3 - 5  3.923e-05 ( 4.302e-09, 0.35775) 16.9020 (0.01871,1.527e+04)
##       vascular                      DPOC                        
## 1 - 1                                                           
## 1 - 2 1.64011 (1.135e+00,   2.3705) 1.5384 (8.867e-01,    2.669)
## 1 - 4 0.64478 (3.728e-01,   1.1151) 1.0339 (5.051e-01,    2.116)
## 1 - 5 0.06219 (1.110e-06,3485.9199) 0.1191 (2.166e-06, 6548.072)
## 2 - 2                                                           
## 2 - 3 0.64142 (4.002e-01,   1.0280) 0.8222 (4.525e-01,    1.494)
## 2 - 4 0.27296 (6.430e-02,   1.1587) 0.3274 (4.246e-02,    2.524)
## 2 - 5 1.00882 (5.158e-01,   1.9733) 0.2292 (3.049e-02,    1.724)
## 3 - 3                                                           
## 3 - 4 0.46337 (2.826e-01,   0.7598) 1.7061 (9.132e-01,    3.188)
## 3 - 5 0.72579 (6.135e-02,   8.5869) 0.1604 (2.264e-06,11362.851)
##       Obesidade               Hiper                      
## 1 - 1                                                    
## 1 - 2 1.5219 (1.12454,2.0597)  0.6772 (0.47631,9.627e-01)
## 1 - 4 1.0771 (0.79836,1.4531)  1.1089 (0.79616,1.544e+00)
## 1 - 5 0.7287 (0.07837,6.7747)  1.0656 (0.14963,7.589e+00)
## 2 - 2                                                    
## 2 - 3 1.0875 (0.76271,1.5507)  0.7892 (0.52306,1.191e+00)
## 2 - 4 1.0788 (0.47139,2.4690)  0.9227 (0.36378,2.341e+00)
## 2 - 5 0.4564 (0.21871,0.9525)  1.0619 (0.52148,2.163e+00)
## 3 - 3                                                    
## 3 - 4 0.9918 (0.67658,1.4539)  1.1859 (0.75886,1.853e+00)
## 3 - 5 0.8107 (0.06701,9.8075) 16.6411 (0.01625,1.704e+04)
##       Diabetes                   
## 1 - 1                            
## 1 - 2 1.72793 (1.233e+00,  2.422)
## 1 - 4 0.95722 (6.663e-01,  1.375)
## 1 - 5 0.01557 (3.477e-07,697.079)
## 2 - 2                            
## 2 - 3 1.08340 (7.222e-01,  1.625)
## 2 - 4 0.47026 (1.697e-01,  1.303)
## 2 - 5 1.03449 (5.314e-01,  2.014)
## 3 - 3                            
## 3 - 4 0.81939 (5.427e-01,  1.237)
## 3 - 5 1.09297 (9.797e-02, 12.193)
## 
## -2 * log-likelihood:  5267.042

Note que o efeito da variável renal (indicadora de problemas renais) é significativo em quase todas as transições. As outras covariáveis apresentam efeitos significativos em apenas algumas transições.

Modelo: Proposta 1

Juntando os efeitos significativos em suas respectivas transições temos:

## 
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q.crude,     obstype = 2, covariates = list(`1-2` = ~Lactato + pO2 + pCO2 +         Neutrofilos_SEG + vascular + Obesidade + Hiper + Diabetes +         renal, `1-4` = ~vascular + renal, `1-5` = ~Lactato, `2-3` = ~renal,         `2-4` = ~renal, `2-5` = ~Lactato + renal + Obesidade,         `3-4` = ~vascular + renal), center = FALSE, control = list(fnscale = 8000,         maxit = 1000), method = "BFGS")
## 
## Maximum likelihood estimates
## Baselines are with covariates set to 0
## 
## Transition intensities with hazard ratios for each covariate
##       Baseline                          Lactato             
## 1 - 1 -0.1123335 (-1.310e-01,-0.096348)                     
## 1 - 2  0.0017982 ( 5.741e-04, 0.005632) 1.164 (0.9621,1.409)
## 1 - 4  0.1100996 ( 9.427e-02, 0.128593) 1.000               
## 1 - 5  0.0004357 ( 4.969e-05, 0.003821) 2.377 (0.9804,5.761)
## 2 - 2 -0.0822614 (-9.979e-02,-0.067813)                     
## 2 - 3  0.0662516 ( 5.342e-02, 0.082160) 1.000               
## 2 - 4  0.0119239 ( 7.180e-03, 0.019803) 1.000               
## 2 - 5  0.0040859 ( 1.714e-03, 0.009739) 1.550 (1.1465,2.096)
## 3 - 3 -0.2367340 (-2.960e-01,-0.189361)                     
## 3 - 4  0.2331195 ( 1.860e-01, 0.292252) 1.000               
## 3 - 5  0.0036145 ( 1.166e-03, 0.011207) 1.000               
##       pO2                 pCO2                Neutrofilos_SEG    
## 1 - 1                                                            
## 1 - 2 1.007 (1.003,1.011) 1.057 (1.031,1.082) 1.135 (1.097,1.174)
## 1 - 4 1.000               1.000               1.000              
## 1 - 5 1.000               1.000               1.000              
## 2 - 2                                                            
## 2 - 3 1.000               1.000               1.000              
## 2 - 4 1.000               1.000               1.000              
## 2 - 5 1.000               1.000               1.000              
## 3 - 3                                                            
## 3 - 4 1.000               1.000               1.000              
## 3 - 5 1.000               1.000               1.000              
##       vascular               Obesidade             Hiper                 
## 1 - 1                                                                    
## 1 - 2 1.5342 (1.0542,2.2329) 1.203 (0.8795,1.6448) 0.6457 (0.4539,0.9186)
## 1 - 4 0.6447 (0.3741,1.1108) 1.000                 1.0000                
## 1 - 5 1.0000                 1.000                 1.0000                
## 2 - 2                                                                    
## 2 - 3 1.0000                 1.000                 1.0000                
## 2 - 4 1.0000                 1.000                 1.0000                
## 2 - 5 1.0000                 0.406 (0.1919,0.8592) 1.0000                
## 3 - 3                                                                    
## 3 - 4 0.4682 (0.2833,0.7737) 1.000                 1.0000                
## 3 - 5 1.0000                 1.000                 1.0000                
##       Diabetes           renal                 
## 1 - 1                                          
## 1 - 2 1.877 (1.319,2.67) 2.0053 (1.4745,2.7274)
## 1 - 4 1.000              0.4516 (0.3108,0.6562)
## 1 - 5 1.000              1.0000                
## 2 - 2                                          
## 2 - 3 1.000              0.3424 (0.2394,0.4898)
## 2 - 4 1.000              0.3666 (0.1606,0.8372)
## 2 - 5 1.000              2.3777 (1.1404,4.9573)
## 3 - 3                                          
## 3 - 4 1.000              0.5042 (0.3473,0.7320)
## 3 - 5 1.000              1.0000                
## 
## -2 * log-likelihood:  5201.288

Simplificando este modelo:

## 
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q.crude,     obstype = 2, covariates = list(`1-2` = ~pO2 + pCO2 + Neutrofilos_SEG +         vascular + Hiper + Diabetes + renal, `1-4` = ~renal,         `2-3` = ~renal, `2-4` = ~renal, `2-5` = ~Lactato + renal +             Obesidade, `3-4` = ~vascular + renal), center = FALSE,     control = list(fnscale = 8000, maxit = 1000), method = "BFGS")
## 
## Maximum likelihood estimates
## Baselines are with covariates set to 0
## 
## Transition intensities with hazard ratios for each covariate
##       Baseline                         pO2                 pCO2               
## 1 - 1 -0.110994 (-0.1286914,-0.095730)                                        
## 1 - 2  0.002575 ( 0.0008779, 0.007556) 1.006 (1.002,1.011) 1.056 (1.031,1.082)
## 1 - 4  0.106223 ( 0.0913096, 0.123573) 1.000               1.000              
## 1 - 5  0.002195 ( 0.0009135, 0.005273) 1.000               1.000              
## 2 - 2 -0.082649 (-0.1002102,-0.068166)                                        
## 2 - 3  0.066596 ( 0.0537312, 0.082541) 1.000               1.000              
## 2 - 4  0.012018 ( 0.0072509, 0.019919) 1.000               1.000              
## 2 - 5  0.004035 ( 0.0016894, 0.009639) 1.000               1.000              
## 3 - 3 -0.237277 (-0.2965309,-0.189863)                                        
## 3 - 4  0.233664 ( 0.1864552, 0.292826) 1.000               1.000              
## 3 - 5  0.003613 ( 0.0011648, 0.011204) 1.000               1.000              
##       Neutrofilos_SEG   vascular               Hiper                 
## 1 - 1                                                                
## 1 - 2 1.137 (1.1,1.175) 1.4729 (1.0143,2.1388) 0.6376 (0.4522,0.8989)
## 1 - 4 1.000             1.0000                 1.0000                
## 1 - 5 1.000             1.0000                 1.0000                
## 2 - 2                                                                
## 2 - 3 1.000             1.0000                 1.0000                
## 2 - 4 1.000             1.0000                 1.0000                
## 2 - 5 1.000             1.0000                 1.0000                
## 3 - 3                                                                
## 3 - 4 1.000             0.4763 (0.2896,0.7833) 1.0000                
## 3 - 5 1.000             1.0000                 1.0000                
##       Diabetes           renal                  Lactato            
## 1 - 1                                                              
## 1 - 2 1.959 (1.39,2.759) 1.9245 (1.4215,2.6056) 1.000              
## 1 - 4 1.000              0.4472 (0.3081,0.6490) 1.000              
## 1 - 5 1.000              1.0000                 1.000              
## 2 - 2                                                              
## 2 - 3 1.000              0.3470 (0.2432,0.4952) 1.000              
## 2 - 4 1.000              0.3631 (0.1591,0.8285) 1.000              
## 2 - 5 1.000              2.4044 (1.1496,5.0287) 1.547 (1.145,2.092)
## 3 - 3                                                              
## 3 - 4 1.000              0.5070 (0.3498,0.7349) 1.000              
## 3 - 5 1.000              1.0000                 1.000              
##       Obesidade             
## 1 - 1                       
## 1 - 2 1.0000                
## 1 - 4 1.0000                
## 1 - 5 1.0000                
## 2 - 2                       
## 2 - 3 1.0000                
## 2 - 4 1.0000                
## 2 - 5 0.4176 (0.1984,0.8791)
## 3 - 3                       
## 3 - 4 1.0000                
## 3 - 5 1.0000                
## 
## -2 * log-likelihood:  5211.434

Uma outra opção é propor um modelo não homogêneo. Pela dificuldade numérica do modelo, escolhe-se apenas as covariáveis renal e vascular para todas as transições.:

## 
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q,     obstype = 2, covariates = ~vascular + renal, pci = c(4),     center = FALSE, control = list(fnscale = 8e+05, maxit = 1000),     method = "BFGS")
## 
## Maximum likelihood estimates
## Baselines are with covariates set to 0
## 
## Transition intensities with hazard ratios for each covariate
##       Baseline                         vascular                
## 1 - 1 -0.129174 (-1.545e-01,-0.107981)                         
## 1 - 2  0.104008 ( 8.515e-02, 0.127040) 1.7687 (1.22547, 2.5529)
## 1 - 4  0.023161 ( 1.519e-02, 0.035305) 0.5587 (0.32606, 0.9574)
## 1 - 5  0.002005 ( 5.051e-04, 0.007963) 0.7599 (0.03636,15.8783)
## 2 - 2 -0.077241 (-1.176e-01,-0.050719)                         
## 2 - 3  0.056548 ( 3.436e-02, 0.093052) 0.6357 (0.39789, 1.0156)
## 2 - 4  0.015046 ( 5.575e-03, 0.040606) 0.3706 (0.09378, 1.4643)
## 2 - 5  0.005647 ( 1.862e-03, 0.017124) 1.0211 (0.52414, 1.9891)
## 3 - 3 -0.157293 (-7.494e-01,-0.033015)                         
## 3 - 4  0.154160 ( 3.177e-02, 0.747958) 0.4912 (0.30198, 0.7991)
## 3 - 5  0.003133 ( 1.179e-07,83.231231) 1.0264 (0.09928,10.6112)
##       renal                   timeperiod[4,Inf)           
## 1 - 1                                                     
## 1 - 2 2.3623 (1.7818, 3.1319) 0.1219 (7.911e-02,1.879e-01)
## 1 - 4 0.3581 (0.2463, 0.5207) 9.5731 (6.137e+00,1.493e+01)
## 1 - 5 1.1946 (0.1934, 7.3775) 1.2065 (2.120e-01,6.867e+00)
## 2 - 2                                                     
## 2 - 3 0.3489 (0.2435, 0.5000) 1.3174 (7.792e-01,2.227e+00)
## 2 - 4 0.3557 (0.1498, 0.8449) 0.8689 (2.957e-01,2.553e+00)
## 2 - 5 2.2004 (1.0533, 4.5967) 1.3438 (4.739e-01,3.811e+00)
## 3 - 3                                                     
## 3 - 4 0.5022 (0.3464, 0.7280) 1.5187 (3.087e-01,7.472e+00)
## 3 - 5 1.8052 (0.1850,17.6156) 0.8954 (2.978e-05,2.692e+04)
## 
## -2 * log-likelihood:  5002.487

Resultado e interpretação

Escolhendo o modelo não homogêneo da proposta, com as covariáveis vascular e renal, as probabilidades podem ser calculadas evaluando a exponencial das matrizes de transição. Para isso também é preciso verificar quais os resultados das covariáveis.

Como interpretação do modelo, é importante ver que, mantendo todos as outras covariáveis, por exemplo, um paciente com problemas vasculares tem 78\(\%\) a mais de chance de ir para UTI do que um paciente que não tem problemas vasculares. Por outro lado, um paciente com problemas renais tem 136\(\%\) a mais de chances de ir para a UTI.

Embora seja interessante saber a odds ratio, a interpretação das probabilidades não é direta. Para enxergar os efeitos da probabilidade de ocupação do estados um exemplo segue abaixo. Foi escolhido do tempo inicial até o décimo quinto dia, para cada combinação possível das covariáveis vascular e renal. Na tabela abaixo 1 é indicadora de problemas e 0 a ausência.