Qui-quadrado de independência

Passo 1: Carregar os pacotes que serão usados

if(!require(dplyr)) install.packages("dplyr") 
## Loading required package: dplyr
## Warning: package 'dplyr' was built under R version 4.0.5
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(dplyr)
if(!require(rstatix)) install.packages("rstatix") 
## Loading required package: rstatix
## Warning: package 'rstatix' was built under R version 4.0.5
## 
## Attaching package: 'rstatix'
## The following object is masked from 'package:stats':
## 
##     filter
library(rstatix)
if(!require(psych)) install.packages("psych") 
## Loading required package: psych
## Warning: package 'psych' was built under R version 4.0.5
library(psych)
if(!require(corrplot)) install.packages("corrplot") 
## Loading required package: corrplot
## corrplot 0.90 loaded
library(corrplot)

Análise entre Sexo e TMO

**Hipotese Nula (H0): Não há associação entre sexo e realização de TMO –> P>0,05

**Hipotese Alternativa (H1): Há associação entre sexo e realização de TMO –> P<=0,05

Passo 2: Carregamento do banco de dados e montagem do modelo

  • Carregamento do Banco
dados_sexo <- read.csv2('tabela_sexo.csv', row.names = 1)
  • Visualizar
View(dados_sexo)                # Visualização dos dados em janela separada
glimpse(dados_sexo)              # Visualização de um resumo dos dados
## Rows: 2
## Columns: 2
## $ MASCULINO <int> 49, 22
## $ FEMININO  <int> 34, 27
  • Realização do teste de Qui-quadrado
quiqua_sexo <- chisq.test(dados_sexo, correct = F) #Desativa a correção de Yates
quiqua_sexo
## 
##  Pearson's Chi-squared test
## 
## data:  dados_sexo
## X-squared = 2.4777, df = 1, p-value = 0.1155

O resultado indica que o valor de P encontrado foi maior que 0,05 e isso indica que o meu resultado não foi estatisticamente significativo.

Passo 3: Análise das frequências esperadas

Pressuposto: frequências esperadas > 5

O que siginifica frequencia esperada? Seria a frequencia observada caso não existisse nenhuma associação entre sexo e TMO

quiqua_sexo$expected  #Todos os valores esperados foram maiores que 5, então podemos segir com o teste
##     MASCULINO FEMININO
## Sim  44.64394 38.35606
## Não  26.35606 22.64394

Passo 4: Análise dos resíduos padronizados ajustados

  • Resíduo padronizado ajustado (SPSS):
quiqua_sexo$stdres
##     MASCULINO  FEMININO
## Sim  1.574069 -1.574069
## Não -1.574069  1.574069

Consideramos que a diferença entre a célula observada e esperada é estatisticamente significativa quando residuo padronizado ajustado superior a 1,96 ou inferior a -1,96 (> 1,96 ou < -1,96 – alfa de 5%)

Como o meus resíduos ficaram entre -1,57 e 1,57, isso quer dizer a diferença entre eles não foi significativa em ambas categorias. Mas teoricamente poderia interpretar o meu resultado no sentido que: Uma frequencia maior de homens não fazem o TMO, enquanto uma frequencia maior de mulheres fazem o TMO

Passo 5: Representação visual dos resíduos ajustados

corrplot(quiqua_sexo$stdres, is.cor = FALSE,
         method = "color",
         tl.col = "black", tl.srt = 0,
         title = "Sexo")

Gráfico de Correlação = ele vai ser pintado de acordo com a intensidade dos resíduos. O R pinta de vermelho o que é negativo (observado foi inferior ao esperado) e de azul o que é positivo (observado foi superior ao esperado)


Análise entre Idade e TMO

**Hipotese Nula (H0): Não há associação entre idade e realização de TMO –> P>0,05

**Hipotese Alternativa (H1): Há associação entre idade e realização de TMO –> P<=0,05

Passo 2: Carregamento do banco de dados e montagem do modelo

  • Carregamento do Banco
dados_idade <- read.csv2('tabela_idade.csv', row.names = 1)
  • Visualizar
View(dados_idade)                # Visualização dos dados em janela separada
glimpse(dados_idade)              # Visualização de um resumo dos dados
## Rows: 2
## Columns: 3
## $ Abaixo.de.60.anos  <int> 56, 1
## $ Entre.60.e.70.anos <int> 27, 10
## $ Acima.de.70.anos   <int> 0, 38
  • Teste qui-quadrado
quiqua_idade <- chisq.test(dados_idade, correct = F) #Desativa a correção de Yates
quiqua_idade
## 
##  Pearson's Chi-squared test
## 
## data:  dados_idade
## X-squared = 96.528, df = 2, p-value < 2.2e-16

O resultado indica que o valor de P encontrado foi menor que 0,05 e isso indica que o meu resultado foi estatisticamente significativo.

Passo 3: Análise das frequências esperadas

Pressuposto: frequências esperadas > 5

O que siginifica frequencia esperada? Seria a frequencia observada caso não existisse nenhuma associação entre idade e TMO

quiqua_idade$expected
##                   Abaixo.de.60.anos Entre.60.e.70.anos Acima.de.70.anos
## Realizou TCTH              35.84091           23.26515         23.89394
## Nao Elegivel TCTH          21.15909           13.73485         14.10606

Passo 4: Análise dos resíduos padronizados ajustados

Resíduo padronizado ajustado (SPSS):

quiqua_idade$stdres
##                   Abaixo.de.60.anos Entre.60.e.70.anos Acima.de.70.anos
## Realizou TCTH              7.332072           1.498077         -9.50727
## Nao Elegivel TCTH         -7.332072          -1.498077          9.50727

Consideramos que a diferença entre a célula observada e esperada é estatisticamente significativa quando residuo padronizado ajustado superior a 1,96 ou inferior a -1,96 (> 1,96 ou < -1,96 – alfa de 5%)

Como o meus resíduos ficaram em duas categorias ficaram acima de 1,96, isso quer dizer a diferença entre eles foi significativa em ambas categorias. Mas teoricamente poderia interpretar o meu resultado no sentido que: Uma frequencia maior de pessoas que tiveram seu diagnostico abaixo de 60 anos de fazerem o TMO, enquanto há uma frequencia maior de pessoas que foram diagnosticadas com idade acima de 70 anos de fazerem o TMO

Passo 5: Representação visual dos resíduos ajustados

corrplot(quiqua_idade$stdres, is.cor = FALSE,
         method = "color",
         tl.col = "black", tl.srt = 0)


Análise Comorbidade e TMO

**Hipotese Nula (H0): Não há associação entre comorbidade e realização de TMO –> P>0,05

**Hipotese Alternativa (H1): Há associação entre comorbidade e realização de TMO –> P<=0,05

Passo 2: Carregamento do banco de dados e montagem do modelo

  • Carregamento do Banco
dados_comorbidade <- read.csv2('tabela_comorbidades.csv', row.names = 1)
  • Visualizar
View(dados_comorbidade)                # Visualização dos dados em janela separada
glimpse(dados_comorbidade)              # Visualização de um resumo dos dados
## Rows: 2
## Columns: 2
## $ MULTICOMORBIDADES     <int> 34, 36
## $ SEM_MULTICOMORBIDADES <int> 49, 13
  • Teste qui-quadrado
quiqua_comorbidade <- chisq.test(dados_comorbidade, correct = F) #Desativa a correção de Yates
quiqua_comorbidade
## 
##  Pearson's Chi-squared test
## 
## data:  dados_comorbidade
## X-squared = 13.07, df = 1, p-value = 0.0003001

O resultado indica que o valor de P encontrado foi menor que 0,05 e isso indica que o meu resultado foi estatisticamente significativo.

Passo 3: Análise das frequências esperadas

Pressuposto: frequências esperadas > 5

quiqua_comorbidade$expected
##                   MULTICOMORBIDADES SEM_MULTICOMORBIDADES
## Realizou TCTH              44.01515              38.98485
## Nao Elegivel TCTH          25.98485              23.01515

Passo 4: Análise dos resíduos padronizados ajustados

Resíduo padronizado ajustado (SPSS):

quiqua_comorbidade$stdres
##                   MULTICOMORBIDADES SEM_MULTICOMORBIDADES
## Realizou TCTH             -3.615234              3.615234
## Nao Elegivel TCTH          3.615234             -3.615234

Consideramos que a diferença entre a célula observada e esperada é estatisticamente significativa quando residuo padronizado ajustado superior a 1,96 ou inferior a -1,96 (> 1,96 ou < -1,96 – alfa de 5%)

Como o meus resíduos ficaram em duas categorias ficaram acima de 1,96, isso quer dizer a diferença entre eles foi significativa em ambas categorias. Mas teoricamente poderia interpretar o meu resultado no sentido que: Uma frequencia maior de pessoas que tinham multicomorbidades não fizeram TMO, enquanto pessoas sem multicomorbiodades fizeram mais TMO

Passo 5: Representação visual dos resíduos ajustados

corrplot(quiqua_comorbidade$stdres, is.cor = FALSE,
         method = "color",
         tl.col = "black", tl.srt = 0)


Análise Polifarmacia e TMO

**Hipotese Nula (H0): Não há associação entre polifarmacia e realização de TMO –> P>0,05

**Hipotese Alternativa (H1): Há associação entre polifarmacia e realização de TMO –> P<=0,05

Passo 2: Carregamento do banco de dados e montagem do modelo

  • Carregamento do Banco
dados_polifarmacia <- read.csv2('tabela_polifarmacia.csv', row.names = 1)
  • Visualizar
View(dados_polifarmacia)                # Visualização dos dados em janela separada
glimpse(dados_polifarmacia)              # Visualização de um resumo dos dados
## Rows: 2
## Columns: 2
## $ POLIFARMACIA     <int> 35, 29
## $ SEM_POLIFARMACIA <int> 48, 20
  • Teste qui-quadrado
quiqua_polifarmacia <- chisq.test(dados_polifarmacia, correct = F) #Desativa a correção de Yates
quiqua_polifarmacia
## 
##  Pearson's Chi-squared test
## 
## data:  dados_polifarmacia
## X-squared = 3.5713, df = 1, p-value = 0.05879

O resultado indica que o valor de P encontrado foi menor que 0,05 e isso indica que o meu resultado foi estatisticamente significativo.

Passo 3: Análise das frequências esperadas

Pressuposto: frequências esperadas > 5

quiqua_polifarmacia$expected
##                   POLIFARMACIA SEM_POLIFARMACIA
## Realizou TCTH         40.24242         42.75758
## Nao Elegivel TCTH     23.75758         25.24242

Passo 4: Análise dos resíduos padronizados ajustados

Resíduo padronizado ajustado (SPSS):

quiqua_polifarmacia$stdres
##                   POLIFARMACIA SEM_POLIFARMACIA
## Realizou TCTH        -1.889781         1.889781
## Nao Elegivel TCTH     1.889781        -1.889781

Consideramos que a diferença entre a célula observada e esperada é estatisticamente significativa quando residuo padronizado ajustado superior a 1,96 ou inferior a -1,96 (> 1,96 ou < -1,96 – alfa de 5%)

Como o meus resíduos ficaram em duas categorias ficaram abaixo de 1,96, isso quer dizer a diferença entre eles não foi significativa em ambas categorias. Mas teoricamente poderia interpretar o meu resultado no sentido que: Uma frequencia maior de pessoas que faziam uso de muitos medicamentos não fizeram TMO, enquanto outras pessoas fizeram mais TMO

Passo 5: Representação visual dos resíduos ajustados

corrplot(quiqua_polifarmacia$stdres, is.cor = FALSE,
         method = "color",
         tl.col = "black", tl.srt = 0)


Análise ISS e TMO

**Hipotese Nula (H0): Não há associação entre ISS e realização de TMO –> P>0,05

**Hipotese Alternativa (H1): Há associação entre ISS e realização de TMO –> P<=0,05

Passo 2: Carregamento do banco de dados e montagem do modelo

  • Carregamento do Banco
dados_iss <- read.csv2('tabela_iss.csv', row.names = 1)
  • Visualizar
View(dados_iss)                # Visualização dos dados em janela separada
glimpse(dados_iss)              # Visualização de um resumo dos dados
## Rows: 2
## Columns: 4
## $ I         <int> 22, 12
## $ II        <int> 24, 12
## $ III       <int> 0, 19
## $ NÃ.o.sabe <int> 37, 6
  • Teste qui-quadrado
quiqua_iss <- chisq.test(dados_iss, correct = F) #Desativa a correção de Yates
quiqua_iss
## 
##  Pearson's Chi-squared test
## 
## data:  dados_iss
## X-squared = 42.342, df = 3, p-value = 3.395e-09

O resultado indica que o valor de P encontrado foi menor que 0,05 e isso indica que o meu resultado foi estatisticamente significativo.

Passo 3: Análise das frequências esperadas

Pressuposto: frequências esperadas > 5

quiqua_iss$expected
##             I       II      III NÃ.o.sabe
## Sim  21.37879 22.63636 11.94697  27.03788
## Não 12.62121 13.36364  7.05303  15.96212

Passo 4: Análise dos resíduos padronizados ajustados

Resíduo padronizado ajustado (SPSS):

quiqua_iss$stdres
##               I         II       III NÃ.o.sabe
## Sim   0.2559241  0.5516143 -6.131483  3.829538
## Não -0.2559241 -0.5516143  6.131483 -3.829538

Consideramos que a diferença entre a célula observada e esperada é estatisticamente significativa quando residuo padronizado ajustado superior a 1,96 ou inferior a -1,96 (> 1,96 ou < -1,96 – alfa de 5%)

Passo 5: Representação visual dos resíduos ajustados

corrplot(quiqua_iss$stdres, is.cor = FALSE,
         method = "color",
         tl.col = "black", tl.srt = 0)

Conclusão

De acordo com os resultados encontrados, observa-se que as características sexo e polifarmácia apresentaram valor-p maior que 0,05. Isso indica que a hipótese nula é verdadeira e com isso, não é possível determinar uma associação entre sexo e polifarmácia e a realização do TCTH. Por outro lado, as características idade e comorbidade apresentaram valor-p menor que 0,05. O que indica que a hipótese nula é falsa e consequentemente a hipótese alternativa é verdadeira, assim conclui-se que há associação entre a realização do procedimento TCTH e as características idade e multicomorbidade.

O qui-quadrado de independência mostrou que há associação entre a faixa etária e a realização do procedimento TCTH (X2 = 96,528; P < 2.2e-16). A análise dos resíduos padronizados ajustados mostrou que há mais casos de transplante em pessoas com diagnostico na faixa etária de “menos 60 anos” e menos casos na faixa etária “mais de 70 anos”. No mesmo sentido, foi possível determinar que associação entre presença de multicomorbidade e a realização do procedimento TCTH (X2 = 11,797; P = 0,0005). A análise dos resíduos padronizados ajustados mostrou que há mais casos de transplante em pessoas sem multicomorbidades e menos casos do procedimento em pessoas com multicomorbidades.