Neste relatório é apresentado os resultados iniciais para uma análise multiestado da trajetória de pacientes internados por COVID-19 no Hospital das Clínicas da Unicamp, Campinas.
Análises similares foram propostas por diversos autores.
Os dados contém 220 covariáveis distintas, como sexo, idade, exames laboratoriais e clínicos. Também existem covariáveis descrevendo as datas e informações relativas da saúde do paciente nos estados.
Para esta análise, o pacote msm foi utilizado. Em geral, os modelos tem se mostrados estatisticamente inviáveis para os dados. A causa pode ser dada por diversos fatores: poucos dados e/ou instabildiade matemática (intrinsica dos dados coletados) e/ou poucas transições por pacientes.
A estrutura do modelo é:
Estados
Durante a análise os estados são numerados:
Neste tipo de modelagem, tipicamente não se calculam as probabilidades diretamente, mas sim as intensidades. Define-se uma matrix Q onde cada elemento \(q_{ij}\) com \(i \neq j\) representa da probabilidade instantânea de transição do estado \(i\) para o estado \(j\). Os elementos \(q_{ij}\) com \(i=j\) são definidos como o oposto da soma de todos os elementos de sua linha. Pode-se pensar como sendo a taxa instanânea de saída do estado \(i\).
Para o modelo, define-se:
\[\begin{array}{cc} \begin{matrix} \\ \text{hosp.} \\ \text{uti} \\ \text{pos.hosp} \\ \text{alt.} \\ \text{morte} \end{matrix} & \begin{array}{c} \text{hosp} \quad \quad \text{uti}\quad \quad \text{pos.hosp.}\quad \quad \text{alt.}\quad \quad \text{morte} \\ \begin{bmatrix} -3 & 1 & 0 & 1 & 1 \\ 0 & -3 & 1 & 1 & 1 \\ 0 & 0 & -2 & 1 & 1 \\ 0 & 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 0 & 1 \end{bmatrix} \end{array} \end{array}\]O tratamento dos dados é realizado transformando os dados em long-format, conforme a metodologia empregada em referências e pacotes.
É importante comentar que é acrescentado uma observação informando que o paciente se encontra no estado 1 (hosp.) no tempo 0, assim é possível modelar a saída dos pacientes deste estado.
Uma contagem das transições efetuadas é apresentada a seguir:
## to
## from 1 2 3 4 5
## 1 0 198 0 203 5
## 2 0 0 131 24 43
## 3 0 0 0 125 3
A distribuição da quantidade de transições dos pacientes:
## media mediana min(n) max(n)
## 1 2.802956 2 2 4
Diversos modelos podem ser propostos. Aqui é feita a separação em duas classes:
O primeiro pressupõe que as probabilidades de transição de um estado para o outro não dependem de todo o histórico, mas somente do estado atual. O segundo tem a mesma hipótese, porém é também é considerado que o processo se renova, no sentido de que ao entrar em um novo estado, o processo volta ao tempo incial. Algumas referências costumam classificar como clock-foward e clock-reset.
Para os modelos Markovianos o pacote requer a classificação das observações em três tipos diferentes:
Para todos os modelos a classificação 1 e 3 tem se demonstrado inviáveis. Entretanto, se todas as observações são do tipo 2, então outros métodos estatísticos podem ser propostos. Também perde-se o teste de hipótese proposto por Aguirre-Hernandez and Farewell, 2002 (prevalence.msm).
Para evaluar os parâmetros (intensidades) é necessário apresentar uma estimativa inicial para estas quantidades. Um argumento que reforça a baixa estabilidade numérica encontrada nos dados é pouca diferença entre a estimativa inicial e o valor encontrado pelo algoritmo.
Considerando obstype = 2. As matrizes de intensidade instantânea e inicial seguem, respectivamente, abaixo:
## 1 2 3 4 5
## 1 -0.1773659 0.08649865 0.00000000 0.088682962 0.002184309
## 2 0.0000000 -0.05898216 0.03902355 0.007149353 0.012809258
## 3 0.0000000 0.00000000 -0.15238095 0.148809524 0.003571429
## 0.0000000 0.00000000 0.00000000 0.000000000 0.000000000
## 0.0000000 0.00000000 0.00000000 0.000000000 0.000000000
## 1 2 3 4 5
## 1 -0.1773659 0.08649865 0.00000000 0.088682962 0.002184309
## 2 0.0000000 -0.05898216 0.03902355 0.007149353 0.012809258
## 3 0.0000000 0.00000000 -0.15238095 0.148809524 0.003571429
## 0.0000000 0.00000000 0.00000000 0.000000000 0.000000000
## 0.0000000 0.00000000 0.00000000 0.000000000 0.000000000
Com estes valores é possível avaliar a qualidade geral do ajuste pelo
gráfico de prevalência, que mostra a proporção dos pacientes em cada
estado.
De maneira similar, considerando obstype = 3:
## 1 2 3 4 5
## 1 -0.2433658 0.11990361 0.00000000 0.121262729 0.002199479
## 2 0.0000000 -0.05993472 0.03995202 0.007154468 0.012828234
## 3 0.0000000 0.00000000 -0.15238095 0.148809524 0.003571429
## 0.0000000 0.00000000 0.00000000 0.000000000 0.000000000
## 0.0000000 0.00000000 0.00000000 0.000000000 0.000000000
## 1 2 3 4 5
## 1 -0.1773659 0.08649865 0.00000000 0.088682962 0.002184309
## 2 0.0000000 -0.05898216 0.03902355 0.007149353 0.012809258
## 3 0.0000000 0.00000000 -0.15238095 0.148809524 0.003571429
## 0.0000000 0.00000000 0.00000000 0.000000000 0.000000000
## 0.0000000 0.00000000 0.00000000 0.000000000 0.000000000
Com os dados anteriores é possível perceber que o modelo estima que desde o início existem pacientes recebendo alta, porém isto não é observado. Pelos dados coletados os pacientes foram internados no hospital começam a receber alta após o quarto dia. Sendo assim, é razoável supor que os riscos são possivelmente diferentes entre o tempo de admissão (t = 0) até o quarto dia (t = 4) e do quarto dia em seguinte.
Fixando o efeito inicial da transição 1-4 em 0.005 (um escolha ad hoc) temos:
Assumindo um modelo de riscos proprocionais (análogo ao modelo de Cox) entre as mesmas transições pode-se estimar os efeitos das covariáveis nas transições.
Como no modelo de riscos competitivos, não existe um método direto e formal para escolher as covariáveis. Metodologias como o step-wise não são viáveis, pela quantidade de informações faltantes e estabilidade do modelo.
Análises prelimares mostram que embora seja possível obter estimativas dos efeitos de uma covariável em todas as transições, em geral quase todas se mostram não siginificativas e as covariáveis que apresentaram efeitos consideráveis mostram isso somente em algumas transições.
Por exemplo, o efeito da covariável Vascular:
msm.m<- msm( to ~ Tstop ,
subject=id, data= dt,
qmatrix = Q.crude,
covariates = ~ vascular ,
obstype = 2,
control = list(fnscale = 800000, maxit = 1000),
method = "BFGS")
msm.m
##
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q.crude, obstype = 2, covariates = ~vascular, control = list(fnscale = 8e+05, maxit = 1000), method = "BFGS")
##
## Maximum likelihood estimates
## Baselines are with covariates set to their means
##
## Transition intensities with hazard ratios for each covariate
## Baseline vascular
## 1 - 1 -0.174842 (-0.1931682,-0.158254)
## 1 - 2 0.086875 ( 0.0755671, 0.099875) 1.5878 (1.08912, 2.3148)
## 1 - 4 0.085786 ( 0.0742588, 0.099103) 0.5616 (0.32065, 0.9836)
## 1 - 5 0.002181 ( 0.0008996, 0.005286) 0.8641 (0.04425,16.8767)
## 2 - 2 -0.060820 (-0.0699917,-0.052851)
## 2 - 3 0.040641 ( 0.0342465, 0.048229) 0.5746 (0.36242, 0.9109)
## 2 - 4 0.007619 ( 0.0051318, 0.011311) 0.4343 (0.13399, 1.4073)
## 2 - 5 0.012561 ( 0.0091804, 0.017186) 1.1587 (0.59715, 2.2483)
## 3 - 3 -0.160926 (-0.1914329,-0.135281)
## 3 - 4 0.157359 ( 0.1320342, 0.187541) 0.4612 (0.28411, 0.7488)
## 3 - 5 0.003567 ( 0.0010862, 0.011716) 1.0394 (0.08687,12.4364)
##
## -2 * log-likelihood: 5415.002
Perebe-se que o efeito é considerável somente nas transições 1-2 e 1-4.
Sendo assim, os modelos são construídos de acordo com a literatura disponível e através de critérios escolhidos pelos pesquisadores.
Considerando que as transições 1-2, 1-4, 2-3, 2-5, 3-4 e 3-5 dependem da idade, em 3 categorias e o gênero:
##
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q.crude, obstype = 2, covariates = list(`1-2` = ~age + Genero, `1-4` = ~age + Genero, `2-3` = ~age + Genero, `2-5` = ~age + Genero, `3-4` = ~age + Genero, `3-5` = ~age + Genero), center = FALSE, control = list(fnscale = 8000, maxit = 1000), method = "BFGS")
##
## Maximum likelihood estimates
## Baselines are with covariates set to 0
##
## Transition intensities with hazard ratios for each covariate
## Baseline agemiddle
## 1 - 1 -0.187129 (-3.381e-01,-1.036e-01)
## 1 - 2 0.062857 ( 2.334e-02, 1.693e-01) 1.4664 (5.303e-01,4.055e+00)
## 1 - 4 0.122087 ( 5.769e-02, 2.584e-01) 0.8431 (3.833e-01,1.854e+00)
## 1 - 5 0.002184 ( 9.092e-04, 5.248e-03) 1.0000
## 2 - 2 -0.046495 (-1.090e-01,-1.984e-02)
## 2 - 3 0.021748 ( 5.385e-03, 8.784e-02) 2.2609 (5.450e-01,9.379e+00)
## 2 - 4 0.007149 ( 4.792e-03, 1.067e-02) 1.0000
## 2 - 5 0.017597 ( 4.186e-03, 7.397e-02) 0.3798 (7.814e-02,1.846e+00)
## 3 - 3 -1.019904 (-4.320e+00,-2.408e-01)
## 3 - 4 1.018415 ( 2.405e-01, 4.312e+00) 0.1795 (4.262e-02,7.556e-01)
## 3 - 5 0.001489 ( 8.097e-29, 2.740e+22) 0.2460 (6.670e-27,9.071e+24)
## ageelderly ageSenior
## 1 - 1
## 1 - 2 0.9225 (3.317e-01,2.566e+00) 1.3395 (4.927e-01,3.642e+00)
## 1 - 4 0.7831 (3.599e-01,1.704e+00) 0.6261 (2.895e-01,1.354e+00)
## 1 - 5 1.0000 1.0000
## 2 - 2
## 2 - 3 2.2474 (5.378e-01,9.392e+00) 1.7324 (4.229e-01,7.096e+00)
## 2 - 4 1.0000 1.0000
## 2 - 5 0.2443 (4.395e-02,1.358e+00) 0.9254 (2.198e-01,3.895e+00)
## 3 - 3
## 3 - 4 0.1765 (4.138e-02,7.529e-01) 0.1195 (2.854e-02,5.005e-01)
## 3 - 5 0.2534 (6.980e-27,9.202e+24) 6.8203 (3.767e-25,1.235e+26)
## Genero1
## 1 - 1
## 1 - 2 1.2093 (0.90879,1.609)
## 1 - 4 0.9879 (0.74838,1.304)
## 1 - 5 1.0000
## 2 - 2
## 2 - 3 0.8591 (0.60101,1.228)
## 2 - 4 1.0000
## 2 - 5 1.2730 (0.68280,2.373)
## 3 - 3
## 3 - 4 0.9661 (0.67311,1.387)
## 3 - 5 0.3817 (0.03477,4.191)
##
## -2 * log-likelihood: 5410.123
Neste modelo é possível inferir que não existem evidências estatísticas de que o efeito relativo ao gênero é significativo.
De forma similar, a prevalência pode ser comparada:
##
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q.crude, obstype = 2, covariates = ~Lactato + PH + pO2 + pCO2 + Bicarbonato_HCO3, center = FALSE, control = list(fnscale = 8000, maxit = 1000), method = "BFGS")
##
## Maximum likelihood estimates
## Baselines are with covariates set to 0
##
## Transition intensities with hazard ratios for each covariate
## Baseline Lactato
## 1 - 1 -0.170959 ( -2.344e+13, -1.247e-15)
## 1 - 2 0.081872 ( 1.063e-21, 6.307e+18) 1.2521 (1.0402,1.507)
## 1 - 4 0.087003 ( 4.648e-22, 1.629e+19) 0.9535 (0.7806,1.165)
## 1 - 5 0.002085 ( 1.116e-138, 3.896e+132) 2.8713 (1.1170,7.381)
## 2 - 2 -0.058472 ( -1.104e+10, -3.097e-13)
## 2 - 3 0.038924 ( 1.998e-15, 7.583e+11) 0.9622 (0.7698,1.203)
## 2 - 4 0.006967 ( 1.379e-44, 3.520e+39) 1.1162 (0.6731,1.851)
## 2 - 5 0.012581 ( 1.732e-25, 9.137e+20) 1.4527 (1.0652,1.981)
## 3 - 3 -0.160874 ( -1.405e+08, -1.842e-10)
## 3 - 4 0.157806 ( 1.804e-10, 1.381e+08) 0.8684 (0.6761,1.116)
## 3 - 5 0.003068 ( 3.378e-94, 2.786e+88) 1.7106 (0.3367,8.690)
## PH pO2 pCO2
## 1 - 1
## 1 - 2 0.7968 (1.561e-03,4.067e+02) 1.0109 (1.0064,1.015) 1.1163 (1.0276,1.213)
## 1 - 4 0.9613 (1.720e-03,5.372e+02) 1.0001 (0.9947,1.006) 0.9863 (0.9051,1.075)
## 1 - 5 0.7192 (2.864e-19,1.806e+18) 1.0132 (0.9839,1.043) 1.1270 (0.6536,1.943)
## 2 - 2
## 2 - 3 1.0946 (1.740e-02,6.885e+01) 1.0023 (0.9974,1.007) 0.9505 (0.8980,1.006)
## 2 - 4 0.8617 (1.900e-06,3.909e+05) 0.9972 (0.9829,1.012) 0.9733 (0.8388,1.129)
## 2 - 5 0.9269 (7.270e-04,1.182e+03) 0.9993 (0.9906,1.008) 0.9961 (0.9128,1.087)
## 3 - 3
## 3 - 4 1.0334 (6.416e-02,1.665e+01) 0.9984 (0.9933,1.003) 0.9561 (0.9091,1.005)
## 3 - 5 0.3291 (2.138e-13,5.066e+11) 1.0095 (0.9678,1.053) 0.9809 (0.6992,1.376)
## Bicarbonato_HCO3
## 1 - 1
## 1 - 2 0.867 (0.7480,1.005)
## 1 - 4 1.038 (0.8991,1.198)
## 1 - 5 0.812 (0.3025,2.180)
## 2 - 2
## 2 - 3 1.047 (0.9403,1.165)
## 2 - 4 1.099 (0.8405,1.436)
## 2 - 5 1.005 (0.8399,1.202)
## 3 - 3
## 3 - 4 1.077 (0.9832,1.180)
## 3 - 5 1.380 (0.6767,2.814)
##
## -2 * log-likelihood: 5320.657
Neste modelo as covariáveis que apresentaram efeitos significativos foram: Lactato, pO2 e pCO2. Em geral, os efeitos são significativos somente para a transição 1-2. Entretanto, a variável Lactato apresentou fortes efeitos nos transições 1-5 e 2-5.
Novamente, o gráfico de prevalência segue:
##
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q.crude, obstype = 2, covariates = ~Hemoglobina_HB + Hematocrito_HT + Leucocitos_totais_WBC + Neutrofilos_SEG + Linfocitos_LINFO + Plaquetas_PLT, center = FALSE, control = list(fnscale = 8000, maxit = 1000), method = "BFGS")
##
## Maximum likelihood estimates
## Baselines are with covariates set to 0
##
## Transition intensities with hazard ratios for each covariate
## Baseline Hemoglobina_HB
## 1 - 1 -3.518e-01 (-6.245e+00,-0.019822)
## 1 - 2 3.920e-02 ( 1.397e-02, 0.109973) 0.8193 (0.62727, 1.070)
## 1 - 4 2.295e-02 ( 7.649e-03, 0.068871) 0.9932 (0.75948, 1.299)
## 1 - 5 2.897e-01 ( 8.839e-03, 9.493789) 1.5979 (0.23251,10.981)
## 2 - 2 -6.152e-02 (-2.443e-01,-0.015493)
## 2 - 3 1.515e-02 ( 4.181e-03, 0.054909) 1.2546 (0.89132, 1.766)
## 2 - 4 6.616e-05 ( 1.428e-06, 0.003066) 0.7955 (0.36490, 1.734)
## 2 - 5 4.630e-02 ( 7.784e-03, 0.275424) 0.7111 (0.38961, 1.298)
## 3 - 3 -4.011e-02 (-1.736e-01,-0.009264)
## 3 - 4 3.748e-02 ( 8.980e-03, 0.156440) 1.3107 (0.92746, 1.852)
## 3 - 5 2.626e-03 ( 2.599e-07,26.520176) 0.7679 (0.05778,10.205)
## Hematocrito_HT Leucocitos_totais_WBC Neutrofilos_SEG
## 1 - 1
## 1 - 2 1.0756 (0.9790,1.182) 1.0191 (0.99838, 1.040) 1.0819 (1.04134, 1.124)
## 1 - 4 1.0317 (0.9379,1.135) 0.9911 (0.94779, 1.036) 0.9740 (0.90845, 1.044)
## 1 - 5 0.7653 (0.4052,1.445) 0.9382 (0.18707, 4.705) 1.2794 (0.22025, 7.432)
## 2 - 2
## 2 - 3 0.9400 (0.8285,1.066) 0.9106 (0.70183, 1.182) 1.0846 (0.81754, 1.439)
## 2 - 4 1.2107 (0.9105,1.610) 1.0362 (1.01060, 1.062) 0.9227 (0.82469, 1.032)
## 2 - 5 1.1117 (0.8889,1.390) 1.0109 (0.95592, 1.069) 0.9466 (0.85763, 1.045)
## 3 - 3
## 3 - 4 0.9418 (0.8297,1.069) 0.9388 (0.70118, 1.257) 1.0645 (0.77672, 1.459)
## 3 - 5 1.1060 (0.4295,2.848) 0.5814 (0.02632,12.844) 1.3120 (0.04995,34.460)
## Linfocitos_LINFO Plaquetas_PLT
## 1 - 1
## 1 - 2 0.9805 (0.95505, 1.007) 0.9994 (0.9976,1.001)
## 1 - 4 1.0009 (0.99894, 1.003) 1.0020 (1.0001,1.004)
## 1 - 5 0.8329 (0.09837, 7.053) 0.9896 (0.9758,1.004)
## 2 - 2
## 2 - 3 1.1043 (0.81511, 1.496) 1.0027 (1.0009,1.004)
## 2 - 4 0.9524 (0.88517, 1.025) 1.0010 (0.9961,1.006)
## 2 - 5 1.0020 (0.93745, 1.071) 0.9962 (0.9923,1.000)
## 3 - 3
## 3 - 4 1.1460 (0.77294, 1.699) 1.0007 (0.9991,1.002)
## 3 - 5 1.1984 (0.03130,45.890) 1.0092 (0.9966,1.022)
##
## -2 * log-likelihood: 5329.904
Analisando o gráfico de prevalência verifica-se que o modelo não apresentou uma boa convergência:
Neste modelo busca-se avaliar o efeitos das covariáveis relativas a alguma comobidade do paciente:
##
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q.crude, obstype = 2, covariates = ~renal + vascular + DPOC + Obesidade + Hiper + Diabetes, center = FALSE, control = list(fnscale = 8000, maxit = 1000), method = "BFGS")
##
## Maximum likelihood estimates
## Baselines are with covariates set to 0
##
## Transition intensities with hazard ratios for each covariate
## Baseline renal
## 1 - 1 -1.606e-01 (-1.890e-01,-0.13651)
## 1 - 2 5.295e-02 ( 4.104e-02, 0.06832) 2.0732 (1.52136,2.825e+00)
## 1 - 4 1.048e-01 ( 8.489e-02, 0.12934) 0.4395 (0.29641,6.516e-01)
## 1 - 5 2.906e-03 ( 7.754e-04, 0.01089) 2.0275 (0.28028,1.467e+01)
## 2 - 2 -1.046e-01 (-1.361e-01,-0.08034)
## 2 - 3 7.599e-02 ( 5.600e-02, 0.10311) 0.3740 (0.25735,5.436e-01)
## 2 - 4 1.920e-02 ( 9.717e-03, 0.03795) 0.4144 (0.17276,9.939e-01)
## 2 - 5 9.368e-03 ( 4.398e-03, 0.01995) 2.1718 (1.02292,4.611e+00)
## 3 - 3 -2.285e-01 (-3.085e-01,-0.16918)
## 3 - 4 2.284e-01 ( 1.691e-01, 0.30847) 0.4965 (0.33378,7.384e-01)
## 3 - 5 3.923e-05 ( 4.302e-09, 0.35775) 16.9020 (0.01871,1.527e+04)
## vascular DPOC
## 1 - 1
## 1 - 2 1.64011 (1.135e+00, 2.3705) 1.5384 (8.867e-01, 2.669)
## 1 - 4 0.64478 (3.728e-01, 1.1151) 1.0339 (5.051e-01, 2.116)
## 1 - 5 0.06219 (1.110e-06,3485.9199) 0.1191 (2.166e-06, 6548.072)
## 2 - 2
## 2 - 3 0.64142 (4.002e-01, 1.0280) 0.8222 (4.525e-01, 1.494)
## 2 - 4 0.27296 (6.430e-02, 1.1587) 0.3274 (4.246e-02, 2.524)
## 2 - 5 1.00882 (5.158e-01, 1.9733) 0.2292 (3.049e-02, 1.724)
## 3 - 3
## 3 - 4 0.46337 (2.826e-01, 0.7598) 1.7061 (9.132e-01, 3.188)
## 3 - 5 0.72579 (6.135e-02, 8.5869) 0.1604 (2.264e-06,11362.851)
## Obesidade Hiper
## 1 - 1
## 1 - 2 1.5219 (1.12454,2.0597) 0.6772 (0.47631,9.627e-01)
## 1 - 4 1.0771 (0.79836,1.4531) 1.1089 (0.79616,1.544e+00)
## 1 - 5 0.7287 (0.07837,6.7747) 1.0656 (0.14963,7.589e+00)
## 2 - 2
## 2 - 3 1.0875 (0.76271,1.5507) 0.7892 (0.52306,1.191e+00)
## 2 - 4 1.0788 (0.47139,2.4690) 0.9227 (0.36378,2.341e+00)
## 2 - 5 0.4564 (0.21871,0.9525) 1.0619 (0.52148,2.163e+00)
## 3 - 3
## 3 - 4 0.9918 (0.67658,1.4539) 1.1859 (0.75886,1.853e+00)
## 3 - 5 0.8107 (0.06701,9.8075) 16.6411 (0.01625,1.704e+04)
## Diabetes
## 1 - 1
## 1 - 2 1.72793 (1.233e+00, 2.422)
## 1 - 4 0.95722 (6.663e-01, 1.375)
## 1 - 5 0.01557 (3.477e-07,697.079)
## 2 - 2
## 2 - 3 1.08340 (7.222e-01, 1.625)
## 2 - 4 0.47026 (1.697e-01, 1.303)
## 2 - 5 1.03449 (5.314e-01, 2.014)
## 3 - 3
## 3 - 4 0.81939 (5.427e-01, 1.237)
## 3 - 5 1.09297 (9.797e-02, 12.193)
##
## -2 * log-likelihood: 5267.042
Note que o efeito da variável renal (indicadora de problemas renais) é significativo em quase todas as transições. As outras covariáveis apresentam efeitos significativos em apenas algumas transições.
Juntando os efeitos significativos em suas respectivas transições temos:
##
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q.crude, obstype = 2, covariates = list(`1-2` = ~Lactato + pO2 + pCO2 + Neutrofilos_SEG + vascular + Obesidade + Hiper + Diabetes + renal, `1-4` = ~vascular + renal, `1-5` = ~Lactato, `2-3` = ~renal, `2-4` = ~renal, `2-5` = ~Lactato + renal + Obesidade, `3-4` = ~vascular + renal), center = FALSE, control = list(fnscale = 8000, maxit = 1000), method = "BFGS")
##
## Maximum likelihood estimates
## Baselines are with covariates set to 0
##
## Transition intensities with hazard ratios for each covariate
## Baseline Lactato
## 1 - 1 -0.1123335 (-1.310e-01,-0.096348)
## 1 - 2 0.0017982 ( 5.741e-04, 0.005632) 1.164 (0.9621,1.409)
## 1 - 4 0.1100996 ( 9.427e-02, 0.128593) 1.000
## 1 - 5 0.0004357 ( 4.969e-05, 0.003821) 2.377 (0.9804,5.761)
## 2 - 2 -0.0822614 (-9.979e-02,-0.067813)
## 2 - 3 0.0662516 ( 5.342e-02, 0.082160) 1.000
## 2 - 4 0.0119239 ( 7.180e-03, 0.019803) 1.000
## 2 - 5 0.0040859 ( 1.714e-03, 0.009739) 1.550 (1.1465,2.096)
## 3 - 3 -0.2367340 (-2.960e-01,-0.189361)
## 3 - 4 0.2331195 ( 1.860e-01, 0.292252) 1.000
## 3 - 5 0.0036145 ( 1.166e-03, 0.011207) 1.000
## pO2 pCO2 Neutrofilos_SEG
## 1 - 1
## 1 - 2 1.007 (1.003,1.011) 1.057 (1.031,1.082) 1.135 (1.097,1.174)
## 1 - 4 1.000 1.000 1.000
## 1 - 5 1.000 1.000 1.000
## 2 - 2
## 2 - 3 1.000 1.000 1.000
## 2 - 4 1.000 1.000 1.000
## 2 - 5 1.000 1.000 1.000
## 3 - 3
## 3 - 4 1.000 1.000 1.000
## 3 - 5 1.000 1.000 1.000
## vascular Obesidade Hiper
## 1 - 1
## 1 - 2 1.5342 (1.0542,2.2329) 1.203 (0.8795,1.6448) 0.6457 (0.4539,0.9186)
## 1 - 4 0.6447 (0.3741,1.1108) 1.000 1.0000
## 1 - 5 1.0000 1.000 1.0000
## 2 - 2
## 2 - 3 1.0000 1.000 1.0000
## 2 - 4 1.0000 1.000 1.0000
## 2 - 5 1.0000 0.406 (0.1919,0.8592) 1.0000
## 3 - 3
## 3 - 4 0.4682 (0.2833,0.7737) 1.000 1.0000
## 3 - 5 1.0000 1.000 1.0000
## Diabetes renal
## 1 - 1
## 1 - 2 1.877 (1.319,2.67) 2.0053 (1.4745,2.7274)
## 1 - 4 1.000 0.4516 (0.3108,0.6562)
## 1 - 5 1.000 1.0000
## 2 - 2
## 2 - 3 1.000 0.3424 (0.2394,0.4898)
## 2 - 4 1.000 0.3666 (0.1606,0.8372)
## 2 - 5 1.000 2.3777 (1.1404,4.9573)
## 3 - 3
## 3 - 4 1.000 0.5042 (0.3473,0.7320)
## 3 - 5 1.000 1.0000
##
## -2 * log-likelihood: 5201.288
Simplificando este modelo:
##
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q.crude, obstype = 2, covariates = list(`1-2` = ~pO2 + pCO2 + Neutrofilos_SEG + vascular + Hiper + Diabetes + renal, `1-4` = ~renal, `2-3` = ~renal, `2-4` = ~renal, `2-5` = ~Lactato + renal + Obesidade, `3-4` = ~vascular + renal), center = FALSE, control = list(fnscale = 8000, maxit = 1000), method = "BFGS")
##
## Maximum likelihood estimates
## Baselines are with covariates set to 0
##
## Transition intensities with hazard ratios for each covariate
## Baseline pO2 pCO2
## 1 - 1 -0.110994 (-0.1286914,-0.095730)
## 1 - 2 0.002575 ( 0.0008779, 0.007556) 1.006 (1.002,1.011) 1.056 (1.031,1.082)
## 1 - 4 0.106223 ( 0.0913096, 0.123573) 1.000 1.000
## 1 - 5 0.002195 ( 0.0009135, 0.005273) 1.000 1.000
## 2 - 2 -0.082649 (-0.1002102,-0.068166)
## 2 - 3 0.066596 ( 0.0537312, 0.082541) 1.000 1.000
## 2 - 4 0.012018 ( 0.0072509, 0.019919) 1.000 1.000
## 2 - 5 0.004035 ( 0.0016894, 0.009639) 1.000 1.000
## 3 - 3 -0.237277 (-0.2965309,-0.189863)
## 3 - 4 0.233664 ( 0.1864552, 0.292826) 1.000 1.000
## 3 - 5 0.003613 ( 0.0011648, 0.011204) 1.000 1.000
## Neutrofilos_SEG vascular Hiper
## 1 - 1
## 1 - 2 1.137 (1.1,1.175) 1.4729 (1.0143,2.1388) 0.6376 (0.4522,0.8989)
## 1 - 4 1.000 1.0000 1.0000
## 1 - 5 1.000 1.0000 1.0000
## 2 - 2
## 2 - 3 1.000 1.0000 1.0000
## 2 - 4 1.000 1.0000 1.0000
## 2 - 5 1.000 1.0000 1.0000
## 3 - 3
## 3 - 4 1.000 0.4763 (0.2896,0.7833) 1.0000
## 3 - 5 1.000 1.0000 1.0000
## Diabetes renal Lactato
## 1 - 1
## 1 - 2 1.959 (1.39,2.759) 1.9245 (1.4215,2.6056) 1.000
## 1 - 4 1.000 0.4472 (0.3081,0.6490) 1.000
## 1 - 5 1.000 1.0000 1.000
## 2 - 2
## 2 - 3 1.000 0.3470 (0.2432,0.4952) 1.000
## 2 - 4 1.000 0.3631 (0.1591,0.8285) 1.000
## 2 - 5 1.000 2.4044 (1.1496,5.0287) 1.547 (1.145,2.092)
## 3 - 3
## 3 - 4 1.000 0.5070 (0.3498,0.7349) 1.000
## 3 - 5 1.000 1.0000 1.000
## Obesidade
## 1 - 1
## 1 - 2 1.0000
## 1 - 4 1.0000
## 1 - 5 1.0000
## 2 - 2
## 2 - 3 1.0000
## 2 - 4 1.0000
## 2 - 5 0.4176 (0.1984,0.8791)
## 3 - 3
## 3 - 4 1.0000
## 3 - 5 1.0000
##
## -2 * log-likelihood: 5211.434
Uma outra opção é propor um modelo não homogêneo. Pela dificuldade numérica do modelo, escolhe-se apenas as covariáveis renal e vascular para todas as transições.:
##
## Call:
## msm(formula = to ~ Tstop, subject = id, data = dt, qmatrix = Q, obstype = 2, covariates = ~vascular + renal, pci = c(4), center = FALSE, control = list(fnscale = 8e+05, maxit = 1000), method = "BFGS")
##
## Maximum likelihood estimates
## Baselines are with covariates set to 0
##
## Transition intensities with hazard ratios for each covariate
## Baseline vascular
## 1 - 1 -0.129174 (-1.545e-01,-0.107981)
## 1 - 2 0.104008 ( 8.515e-02, 0.127040) 1.7687 (1.22547, 2.5529)
## 1 - 4 0.023161 ( 1.519e-02, 0.035305) 0.5587 (0.32606, 0.9574)
## 1 - 5 0.002005 ( 5.051e-04, 0.007963) 0.7599 (0.03636,15.8783)
## 2 - 2 -0.077241 (-1.176e-01,-0.050719)
## 2 - 3 0.056548 ( 3.436e-02, 0.093052) 0.6357 (0.39789, 1.0156)
## 2 - 4 0.015046 ( 5.575e-03, 0.040606) 0.3706 (0.09378, 1.4643)
## 2 - 5 0.005647 ( 1.862e-03, 0.017124) 1.0211 (0.52414, 1.9891)
## 3 - 3 -0.157293 (-7.494e-01,-0.033015)
## 3 - 4 0.154160 ( 3.177e-02, 0.747958) 0.4912 (0.30198, 0.7991)
## 3 - 5 0.003133 ( 1.179e-07,83.231231) 1.0264 (0.09928,10.6112)
## renal timeperiod[4,Inf)
## 1 - 1
## 1 - 2 2.3623 (1.7818, 3.1319) 0.1219 (7.911e-02,1.879e-01)
## 1 - 4 0.3581 (0.2463, 0.5207) 9.5731 (6.137e+00,1.493e+01)
## 1 - 5 1.1946 (0.1934, 7.3775) 1.2065 (2.120e-01,6.867e+00)
## 2 - 2
## 2 - 3 0.3489 (0.2435, 0.5000) 1.3174 (7.792e-01,2.227e+00)
## 2 - 4 0.3557 (0.1498, 0.8449) 0.8689 (2.957e-01,2.553e+00)
## 2 - 5 2.2004 (1.0533, 4.5967) 1.3438 (4.739e-01,3.811e+00)
## 3 - 3
## 3 - 4 0.5022 (0.3464, 0.7280) 1.5187 (3.087e-01,7.472e+00)
## 3 - 5 1.8052 (0.1850,17.6156) 0.8954 (2.978e-05,2.692e+04)
##
## -2 * log-likelihood: 5002.487
Escolhendo o modelo não homogêneo da proposta, com as covariáveis vascular e renal, as probabilidades podem ser calculadas evaluando a exponencial das matrizes de transição. Para isso também é preciso verificar quais os resultados das covariáveis.
Como interpretação do modelo, é importante ver que, mantendo todos as outras covariáveis, por exemplo, um paciente com problemas vasculares tem 78\(\%\) a mais de chance de ir para UTI do que um paciente que não tem problemas vasculares. Por outro lado, um paciente com problemas renais tem 136\(\%\) a mais de chances de ir para a UTI.
Embora seja interessante saber a odds ratio, a interpretação das probabilidades não é direta. Para enxergar os efeitos da probabilidade de ocupação do estados um exemplo segue abaixo. Foi escolhido do tempo inicial até o décimo quinto dia, para cada combinação possível das covariáveis vascular e renal. Na tabela abaixo 1 é indicadora de problemas e 0 a ausência.