Transformação Digital: Internações no SUS

Estrutura fatorial ou de componentes

N da amostra de treino usada nas análises: 1611896.

A análise da correlação entre as variáveis identificou que a variável CEP é colinear com a variável MORTE (r = 0.995). IND_VDRL também é correlato com SEXO (r = 0.9189195). A QT_DIARIAS é colinear com DIAS_PERM (r = 0.9143275), PROC_SOLIC é colinear com PROC_REA (r = 0.977681) e DT_SAIDA é colinear com DATA_CMPT (r = 0.9982248). Com base nisso, as variáveis MORTE, IND_VDRL, QT_DIARIAS, PROC_REA e DATA_CMPT foram retiradas das análises fatoriais.

Nota: é importante analisar por que a morte é tão relacionada ao CEP.

EFA

Foram usados 161190 casos nesta análise.

Parallel analysis suggests that the number of factors =  9  and the number of components =  7 
[1] 9

Foi realizada uma analise paralela para detectar o numero de fatores, usando Maximun Likelihood como estimador, foram sugeridos 8 fatores.

Factor Analysis using method =  ml
Call: fa(r = cor, nfactors = fap$nfact, n.obs = nrow(s), rotate = "oblimin", 
    impute = "median", symmetric = TRUE, fm = "ml")
Standardized loadings (pattern matrix) based upon correlation matrix
             ML1   ML7   ML3   ML4   ML5   ML2   ML8   ML6   ML9    h2     u2
UF_ZI       0.01 -0.02 -0.01  0.00  0.97 -0.05  0.09  0.01 -0.05 0.995 0.0048
ESPEC       0.06 -0.08  0.03  0.00  0.03  0.02 -0.03  0.01 -0.69 0.472 0.5279
CEP         0.00 -0.02  0.04  0.00  0.06  1.02  0.17  0.00 -0.05 0.995 0.0049
idade      -0.12  0.14 -0.10  0.03  0.00  0.01  0.08  0.16  0.03 0.054 0.9457
SEXO        0.01 -0.10  0.90  0.00  0.08  0.02  0.02 -0.03  0.27 0.995 0.0047
UTI_MES_TO  1.02 -0.05 -0.01  0.00  0.00  0.00 -0.01  0.03 -0.01 0.995 0.0050
MARCA_UTI   0.51  0.10 -0.02  0.01 -0.02  0.01  0.00 -0.01  0.01 0.337 0.6631
DIAR_ACOM  -0.13  0.01  0.03  0.05  0.01  0.04  0.01  0.41  0.08 0.150 0.8502
PROC_SOLIC -0.11  0.19 -0.04  0.00  0.02 -0.01 -0.09 -0.18  0.12 0.074 0.9262
VAL_SH      0.03  0.96 -0.02  0.00  0.00  0.00  0.01  0.03 -0.07 0.995 0.0050
VAL_SP      0.07  0.78  0.05  0.01  0.01 -0.02  0.04  0.01  0.17 0.730 0.2697
VAL_UTI     0.65  0.32  0.03  0.01  0.02 -0.01  0.02 -0.03  0.01 0.801 0.1987
DT_INTER    0.03 -0.01  0.00  0.99  0.00 -0.01 -0.01 -0.06  0.00 0.995 0.0050
DT_SAIDA   -0.04  0.01  0.00  0.87  0.01  0.01  0.01  0.09  0.00 0.741 0.2589
COBRANCA    0.05 -0.02  0.12  0.00 -0.02 -0.07  0.09 -0.01  0.64 0.443 0.5566
NAT_JUR    -0.01  0.05 -0.07 -0.01 -0.01  0.12  0.92 -0.01  0.05 0.841 0.1587
GESTAO      0.02  0.03 -0.09  0.02 -0.32  0.67 -0.43 -0.02  0.12 0.995 0.0046
MUNIC_MOV  -0.02  0.06 -0.06 -0.02  0.69  0.06 -0.49  0.00  0.13 0.730 0.2701
DIAS_PERM   0.02  0.01  0.00 -0.01  0.00  0.00 -0.01  0.99  0.00 0.995 0.0050
CNES       -0.02  0.07  1.01  0.00 -0.08  0.01 -0.06  0.01 -0.16 0.995 0.0048
           com
UF_ZI      1.0
ESPEC      1.1
CEP        1.1
idade      4.4
SEXO       1.2
UTI_MES_TO 1.0
MARCA_UTI  1.1
DIAR_ACOM  1.3
PROC_SOLIC 3.9
VAL_SH     1.0
VAL_SP     1.1
VAL_UTI    1.5
DT_INTER   1.0
DT_SAIDA   1.0
COBRANCA   1.2
NAT_JUR    1.1
GESTAO     2.3
MUNIC_MOV  1.9
DIAS_PERM  1.0
CNES       1.1

                       ML1  ML7  ML3  ML4  ML5  ML2  ML8  ML6  ML9
SS loadings           1.94 1.92 1.90 1.73 1.60 1.58 1.32 1.22 1.10
Proportion Var        0.10 0.10 0.10 0.09 0.08 0.08 0.07 0.06 0.06
Cumulative Var        0.10 0.19 0.29 0.38 0.46 0.53 0.60 0.66 0.72
Proportion Explained  0.14 0.13 0.13 0.12 0.11 0.11 0.09 0.09 0.08
Cumulative Proportion 0.14 0.27 0.40 0.52 0.64 0.75 0.84 0.92 1.00

 With factor correlations of 
      ML1   ML7   ML3   ML4   ML5   ML2   ML8   ML6   ML9
ML1  1.00  0.69 -0.03  0.04 -0.01  0.02  0.00  0.31  0.02
ML7  0.69  1.00 -0.09  0.05 -0.04  0.04  0.00  0.29  0.03
ML3 -0.03 -0.09  1.00  0.01 -0.05 -0.07  0.02 -0.11  0.17
ML4  0.04  0.05  0.01  1.00 -0.08  0.03 -0.03 -0.12  0.01
ML5 -0.01 -0.04 -0.05 -0.08  1.00 -0.36  0.03  0.05  0.07
ML2  0.02  0.04 -0.07  0.03 -0.36  1.00 -0.06 -0.05  0.09
ML8  0.00  0.00  0.02 -0.03  0.03 -0.06  1.00 -0.02 -0.12
ML6  0.31  0.29 -0.11 -0.12  0.05 -0.05 -0.02  1.00 -0.10
ML9  0.02  0.03  0.17  0.01  0.07  0.09 -0.12 -0.10  1.00

Mean item complexity =  1.5
Test of the hypothesis that 9 factors are sufficient.

The degrees of freedom for the null model are  190  and the objective function was  39.57 with Chi Square of  6377333
The degrees of freedom for the model are 46  and the objective function was  26.22 

The root mean square of the residuals (RMSR) is  0.04 
The df corrected root mean square of the residuals is  0.08 

The harmonic number of observations is  161190 with the empirical chi square  94576.34  with prob <  0 
The total number of observations was  161190  with Likelihood Chi Square =  4225434  with prob <  0 

Tucker Lewis Index of factoring reliability =  -1.737
RMSEA index =  0.755  and the 90 % confidence intervals are  0.753 NA
BIC =  4224883
Fit based upon off diagonal values = 0.97
Measures of factor score adequacy             
                                                   ML1  ML7  ML3  ML4  ML5  ML2
Correlation of (regression) scores with factors   1.00 1.00 1.00 1.00 1.00 1.00
Multiple R square of scores with factors          1.00 0.99 1.00 0.99 0.99 1.00
Minimum correlation of possible factor scores     0.99 0.99 0.99 0.99 0.99 0.99
                                                   ML8  ML6  ML9
Correlation of (regression) scores with factors   0.99 1.00 0.98
Multiple R square of scores with factors          0.97 0.99 0.96
Minimum correlation of possible factor scores     0.95 0.99 0.91

Loadings:
           ML1    ML7    ML3    ML4    ML5    ML2    ML8    ML6    ML9   
UF_ZI                                   0.969                            
ESPEC                                                              -0.692
CEP                                            1.018  0.166              
idade      -0.125  0.141                                     0.155       
SEXO              -0.105  0.898                                     0.271
UTI_MES_TO  1.017                                                        
MARCA_UTI   0.506  0.102                                                 
DIAR_ACOM  -0.132                                            0.413       
PROC_SOLIC -0.107  0.191                                    -0.181  0.121
VAL_SH             0.964                                                 
VAL_SP             0.777                                            0.171
VAL_UTI     0.652  0.319                                                 
DT_INTER                         0.987                                   
DT_SAIDA                         0.869                                   
COBRANCA                  0.124                                     0.638
NAT_JUR                                        0.124  0.916              
GESTAO                                 -0.322  0.674 -0.426         0.120
MUNIC_MOV                               0.695        -0.485         0.129
DIAS_PERM                                                    0.987       
CNES                      1.009                                    -0.160

                 ML1   ML7   ML3   ML4   ML5   ML2   ML8   ML6   ML9
SS loadings    1.777 1.737 1.875 1.735 1.545 1.520 1.323 1.218 1.080
Proportion Var 0.089 0.087 0.094 0.087 0.077 0.076 0.066 0.061 0.054
Cumulative Var 0.089 0.176 0.269 0.356 0.433 0.509 0.576 0.637 0.691

A estrutura fatorial fica assim quando agrupamos os itens em fatores com a maior carga fatorial, sem permitir cross-loading:

ml8 ~= ESPEC + VAL_SH + VAL_SP

ml2 ~= DT_INTER + DT_SAIDA

ml5 ~= UF_ZI + MUNIC_MOV

ml7 ~= NAT_JUR + CEP

ml3 ~= COBRANCA

ml1 ~= SEXO + VAL_UTI

ml2 ~= DIAR_ACOMP + GESTAO + DIAS_PERM

MGM

MGM (Mixed Graphical Model) é um modelo de análise que permite analisar variáveis de diferentes tipos em um diagrama de redes.

No grafo, é poissível observar que as variáveis relacionadas ao tempo de permaência estão agrupadas; o tempo de permanência está relacionado aos valores (através da ligação entre UTI_MES_TO e VAL_UTI). A idade está positivamente relacionada ao tempo de internação e está relacionada à especialidade.

Note that the sign of parameter estimates is stored separately; see ?mgm

EGA

A Exploratory Graph Analysis também segue a lógica de análise de variáveis a partir de um grafo, mas é realizada à partir de uma matriz de correlação (que foi a mesma usada na EFA).

A vantagem do EGA em relação ao MGM é a classificação destas variáveis em fatores, como demonstrado na imagem.

Desta forma, podemos observar 5 fatores. Um dos fatores é composto por dados geográficos, da natureza jurídica do hospital e da gestão; um fator composto pelas especialidades da internação, os procedimentos, o sexo, idade e o resultado da internação. Outro fator foi composto pelo mês da internação, marca da UTI e valores relacionados à internação. Um fator foi composto pelo tempo de internação e outro fator pelas datas de internação. Como agrupar as datas de internação em um fator geraria um fator muito semelhante aos dias de internação, ele foi ignorado nas análises seguintes.

Number of communities: 5 

     UF_ZI      ESPEC        CEP      idade       SEXO UTI_MES_TO  MARCA_UTI 
         3          1          3          1          1          2          2 
 DIAR_ACOM PROC_SOLIC     VAL_SH     VAL_SP    VAL_UTI   DT_INTER   DT_SAIDA 
         4          1          2          2          2          5          5 
  COBRANCA    NAT_JUR     GESTAO  MUNIC_MOV  DIAS_PERM 
         1          3          3          3          4 

Methods:
                                                         
Correlations =          auto (from qgraph)               
Model =                 glasso                           
Algorithm =             walktrap                         
Unidimensional Method = louvain with consensus clustering

Cluster

À partir dos 4 fatores criados pela EGA encontramos 4 grupos.

[1] 4 4 4 4 3 3
[1] 956846.9 543287.0 822481.2 368093.3
[1]  30586 272042 816361 492907

4 fatores e 4 grupos

Análisando o modelo de 4 fatores e 4 grupos, podemo observar que para o fator 1 há uma divisão clara, onde o grupo 3 está abaixo da média neste fator e o grupo 4 está acima da média. Os demais grupos estão distribuidos.

Já no fator 2, o grupo 4 está abaixo da média e o grupo 2 está acima da média.

No fator 3 e 4, o grupo 1 está distribuído acima da média, enquanto os demais grupos estão agrupados próximos à média.

Desta forma, o grupo 1 é caracterizado pelos fatores 3 e 4. Os grupos 2, 3 e 4 são caracterizados pelos fatores 1 e 2.

Grupo 1

O grupo 1 é caracterizado pelos fatores 3 e 4. O fator 3 é formado pelas variáveis relacionadas aos valores da internação, ao mês de internação e à marca da UTI.

Através dos gráficos a seguir é possível observar que o grupo 1 contém as internações com os maiores valores.

O grupo 1 também concentra as internações com maior tempo de permanência.

O grupo 1 também tem uma maior concentração de marcas de UTI específicas.

Grupo 2

Os grupos 2, 3, 4 possuem distribuição semelhantes entre si em algumas variáveis, mas que os distinguem do grupo 1. Em relação à variável “COBRANCA”, que determina o motivo do término da internação, os grupos 2, 3 e 4 possuem a maior quantidade de internações com alta (números de 10 a 19 no gráfico). No entanto, os grupos 2 e 3 são distinto sdos demais por possuirem o maior número de internações com alta por reoperação c/ menos do que 24 horas após 1^a cirurgia (número 61) e maior número de óbitos nas primeiras 48 horas (número 41).

Em relação aos procedimentos solicitados (PROC_SOLIC), o grupo 2 concentra Cirurgias fistulizantes com implantes valvulares (303100044), Autotransplante com microcirurgia (310010039), procedimento na base do crânio (411010034) e tratamentos de pneumonias ou influenza (303140151).

A natureza jurídica (NAT_JUR) é muito distintiva no grupo 2, que concentra a maior parte das internações com natureza de associação privada (3999) e fundação privada (3069), ambas sem fins lucrativos. O grupo 2 também conta com alguns casos de “Sociedade Empresária Limitada” (2062) e “Sociedade Simples Limitada” (2240).

O tipo de gestão também distintivo para o grupo 2 é que a maior parte dos casos são de gestão “municipal plena assist” (1).

Geograficamente, as internações do grupo 2 são correspondentes aos municípios de Silva Jardim e São Francisco de Itabapoana.

Grupos 3 e 4

Os grupos 3 concentra os procedimentos de parto normal (310010039).

Em relação à natureza jurídica, os grupos 3 e 4 possuem distribuições semelhantes, com administração pelo município (1244 e 1031), administração estadual ou pelo distrito federal (1023) e administração federal (1015). No entanto, o grupo 3 concentra mais hospitais sobre a administração municipal do que o grupo 4.

# A tibble: 5 × 6
  NAT_JUR `Grupo 3`   `%` NAT_JUR `Grupo 4`   `%`
    <int>     <int> <dbl>   <int>     <int> <dbl>
1    1244         3 14.3     1031         4  8.49
2    1031         3 14.0     1244         4  6.14
3    1023         3  8.52    1023         4  6.04
4    1015         3  3.35    1015         4  4.17
5    2062         3  3.03    1104         4  1.08

Em relação à gestão, os grupos 3 e 4 estão distribuídos de maneira semelhante, com uma parte sob gestão estadual plena (2) e a maior parte com gestão municipal plena assistida (1).

Geograficamente, o grupo 3 está concentrado em alguns municípios da região leste do estado, enquanto o grupo 4 está distribuído ao norte do estado.