Exercícios Extras - P1 - Dados Categóricos

library(adc)
library(DescTools)


Exercício 01

(1.a)

Esse estudo etiológico refere-se a um caso-controle, pois tenta avaliar retrospectivamente o histórico de consumo de leite/adoecimento com os casos confirmados de nefrite (inflamação dos rins).

(1.b)

Inserindo os dados e formulação do teste de hipóteses:

  • \(H_0\): Não há associação entre o histórico do consumo de leite e/ou adoecimento e contrair nefrite.

  • \(H_1\): Há associação entre o histórico do consumo de leite e/ou adoecimento e contrair nefrite.

tab1 <- matrix(c(107,200,68,975), byrow = T, nrow = 2,
               dimnames = list("Consumo/Historico"=c("Sim","Nao"),
                               "Doença"=c("Sim","Nao"))) ;tab1
##                  Doença
## Consumo/Historico Sim Nao
##               Sim 107 200
##               Nao  68 975
yates.chisq.test(tab1, alfa = 0.05)
## 
##  Valores Esperados
##                   Doença
## Consumo/Historico   Sim   Nao
##               Sim  39.8 267.2
##               Nao 135.2 907.8
## 
##  Resultados
## 
##       Valor      p-valor
## Qc 168.7676 1.375107e-38
## Qy 166.2657 0.000000e+00

Com n grande e observando os valores esperados, não precisaremos usar a correção de Yates. Portanto iremos aplicar um teste de Qui-quadrado de Pearson, sem correção, para um \(\alpha=5\%\).

Com um nível de significância de 5%, rejeita-se fortemente a hipótese nula (p-valor = 0.0000… ; df =1). Há evidências amostrais de que existe associação entre o histórico de consumo de leite/e ou adoecimento e contrair nefrite (inflamação dos rins).

Com isso, podemos calcular OR:

epi.2by2(tab1, method = "case.control", conf.level = 0.95)
##              Outcome +    Outcome -      Total                       Odds
## Exposed +          107          200        307        0.54 (0.42 to 0.67)
## Exposed -           68          975       1043        0.07 (0.05 to 0.09)
## Total              175         1175       1350        0.15 (0.13 to 0.17)
## 
## Point estimates and 95% CIs:
## -------------------------------------------------------------------
## Exposure odds ratio                            7.67 (5.46, 10.78)
## Attrib fraction (est) in the exposed (%)      86.93 (81.43, 90.87)
## Attrib fraction (est) in the population (%)   53.17 (43.51, 61.18)
## -------------------------------------------------------------------
## Uncorrected chi2 test that OR = 1: chi2(1) = 168.768 Pr>chi2 = <0.001
## Fisher exact test that OR = 1: Pr>chi2 = <0.001
##  Wald confidence limits
##  CI: confidence interval

Com 95% de confiança, podemos afirmar que filha que pessoas que tem um histórico de consumo de leite/e ou adoecimento apresentaram uma chance 7.67 vezes maior de contrair nefrite, quando comparadas às que não tiveram histórico de consumo de leite/ e ou adoecimento. OR=7.67 IC95%: [5.46;10.78].


Exercício 02

Temos um estudo de caso-controle pareado. Utilizaremos o teste Qui-quadrado de McNemar para amostras pareadas.

Formulando as hipóteses:

  • \(H_0\): A proporção de pessoas que tiveram melhora não mudou de acordo com o tratamento oferecido.
  • \(H_1\): A proporção de pessoas que tiveram melhora mudou de acordo com o tratamento oferecido..
tab2 <- dataSkin
trat0 <- subset(tab2, tab2$trat==0)
trat1 <- subset(tab2, tab2$trat==1)

tab2 <- table(trat0$melhora, trat1$melhora);
mcnemar.test(tab2, correct = T)
## 
##  McNemar's Chi-squared test with continuity correction
## 
## data:  tab2
## McNemar's chi-squared = 3.1296, df = 1, p-value = 0.07688

De acordo com o teste de McNemar (\(X^2=3.1296; pvalor=0.07688; df:1)\), não rejeitamos a hipótese nula com 5% de significância. Isso indica que não houve evidência estatística de diferença nas proporções de melhora para o problema de pele de acordo com o tratamento recebido.
Portanto, o tratamento com remédio real não parece ter influenciado a melhora do problema de pele dos pacientes, tendo a mesma eficâcia do placebo.


Exercício 03

Precisamos dar entrada nos dados, criando uma tabela tridimensional, separada por sexo (feminino x masculino).

Formulação das hipóteses:

  • \(H_0\): O odds ratio comum entre o tipo de tratamento feito para insuficiencia renal crônica e possuir depressão, ajustado por sexo, é igual a 1 (não existe associação entre tratamento e depressão).
  • \(H_1\): O odds ratio comum é diferente de 1 (existe associação entre tratamento e depressão, mesmo controlando por sexo).
tab3 <- dataPsi
tab3$escoreD <- ifelse(tab3$escoreD>=7,1,0)
tab3 <- table(tab3$trat, tab3$escoreD, tab3$sexo) ;tab3
## , ,  = feminino
## 
##                 
##                   0  1
##   hemo           24 17
##   transplantados  5  0
## 
## , ,  = masculino
## 
##                 
##                   0  1
##   hemo           43 27
##   transplantados 24  6

Para dados estratificados, iremos aplicar o teste de Mantel-Haenszel, e caso significativo, aplicaremos teste de igualidade de OR, Breslow Day.

mantelhaen.test(tab3, conf.level = 0.95)
## 
##  Mantel-Haenszel chi-squared test with continuity correction
## 
## data:  tab3
## Mantel-Haenszel X-squared = 4.7884, df = 1, p-value = 0.02865
## alternative hypothesis: true common odds ratio is not equal to 1
## 95 percent confidence interval:
##  0.1157975 0.8288516
## sample estimates:
## common odds ratio 
##         0.3098047

Temos uma estatística teste de \(4.7884;Pvalor:0.02865; df:1\) .Como o p-valor é menor que 0.05, rejeitamos a hipótese nula com 95% de confiança, e concluímos que há diferença estatisticamente significativa na chance do tratamento estar associado com depressão, quando controlado por sexo.

Agora precisamos calcular se a OR é igual para o sexo masculino e sexo feminino.

  • \(H_0\): OR é o mesmo para ambos os sexos.
  • \(H_1\): OR é diferente para cada sexo.
BreslowDayTest(tab3)
## 
##  Breslow-Day test on Homogeneity of Odds Ratios
## 
## data:  tab3
## X-squared = 1.3148, df = 1, p-value = 0.2515

Com estatística \(X^2:1.3148; pvalor:0.2515;df:1\), não rejeitamos a hipótese nula de que as OR são iguais, ou seja, as chances de ter depressão independente do tratamento são as mesmas para homem ou mulher. Quantificando:

tab3 <- dataPsi
tab3$escoreD <- ifelse(tab3$escoreD>=7,1,0)
tab3 <- table(tab3$trat, tab3$escoreD) ;tab3
##                 
##                   0  1
##   hemo           67 44
##   transplantados 29  6
IC.efeito(tab3, alfa = 0.05)
Medida Li.M1 Ls.M1 Li.M2 Ls.M2
RR 0.73 0.96 0.55 0.59 0.90
OR 0.32 0.87 0.11 0.12 0.82

De acordo com a tabela, pessoas que fizeram tratamento com hemodiálise tem chance 0.32 vezes menor de serem dignosticadas com depressão comparadas as pessoas que fizeram transplante. OR=0.32; IC95%:[0.12;0.82]


Exercício 04

Inserção dos dados e cálculo da prevalência populacional:

tab4 <- matrix(c(170,15,18,550), nrow = 2, byrow = T,
               dimnames = list("igM"=c("SIM","NÃO"),
                               "Ouro"=c("SIM","NÃO")))
tab4
##      Ouro
## igM   SIM NÃO
##   SIM 170  15
##   NÃO  18 550
casos_parana <- 3041284 ;casos_parana
## [1] 3041284
pop_parana <- 11800000 ;pop_parana
## [1] 11800000
prevalencia <- 3041284/11800000 ;prevalencia
## [1] 0.2577359

Calculando as métricas do teste:

diag.tab.test(tab4, p0 = prevalencia, conf = 0.95, semente = 333)
## Resultados: 
##      Ouro
## igM   SIM NÃO
##   SIM 170  15
##   NÃO  18 550
## 
## 
## |    |     %|    Li|    Ls|
## |:---|-----:|-----:|-----:|
## |p   |  25.0|  22.0|  28.2|
## |ac  |  95.6|  93.9|  96.9|
## |s   |  90.4|  85.4|  93.9|
## |e   |  97.3|  95.7|  98.4|
## -------------------------------------------- 
## Considerando a prevalencia amostral:  25 %
## 
## 
## |      |     %|    Li|    Ls|
## |:-----|-----:|-----:|-----:|
## |VPP   |  91.9|  87.1|  95.0|
## |VPN   |  96.8|  95.0|  98.0|
## |VPFP  |   8.1|   5.0|  12.9|
## |VPFN  |   3.2|   2.0|   5.0|
## -------------------------------------------- 
## Considerando a prevalencia populacional (p0):  25.8 %
## 
## 
## |      |     %|    Li|    Ls|
## |:-----|-----:|-----:|-----:|
## |VPP   |  92.2|  87.7|  95.4|
## |VPN   |  96.7|  94.8|  97.8|
## |VPFP  |   7.8|   4.6|  12.3|
## |VPFN  |   3.3|   2.2|   5.2|

Observando os resultados, o teste IgM apresenta ser bastante eficaz na triagem de pessoas com COVID 19, especialmente quando avaliamos sua utilidade para decisões de isolamento domiciliar. Possui uma acurácia de 95.6%;IC95%[93.9;96.9]%, alta sensibilidade (90.4%;IC95%[85.4;93.9]%) e especificidade (97.3%;IC95%[95.7;98.4]%). O teste apresenta bom equilibrio entre identificar corretamente indiviudos infectados e evitar falsos alarmes. Os valores preditivos positivos e negativos também são elevados, com prevalência populacional de 25.8%, em torno de 92.7%;IC95%[87.7;95.4]% e 96.7%;IC95%[94.8;97.8]% respectivamente, o que confere segurança nos resultados.

No entanto, os erros diagnósticos, embora baixos, merecem atenção. A taxa de falsos positivos (VPFP) de 7,8%;IC[4.6;12.3]% indica que algumas pessoas seriam isoladas sem necessidade, o que pode ter impactos sociais e econômicos, mas ainda é um erro aceitável dentro de uma estratégia de precaução em saúde pública. Já a taxa de falsos negativos (VPFN) de 3,3%;IC95%[2.2;5.2]% é mais crítica, pois representa indivíduos infectados que poderiam continuar circulando e transmitindo o vírus.