Análise de Correspondência

Introdução

Esta análise aplica a Análise de Correspondência (AC) aos dados de assassinatos entre 1970 e 1977, classificados por método. O objetivo é identificar possíveis associações entre os anos e os métodos utilizados, por meio da decomposição da inércia total e projeção dos dados em um espaço de menor dimensão.

dados_assassinato
##                       1970 1971 1972 1973 1974 1975 1976 1977
## Tiro ou explosão        15   15   31   17   42   49   38   27
## Esfaqueamento           95  113   94  125  124  126  148  127
## Instrumento cortante    23   16   34   34   35   33   41   41
## Veneno                   9    4    8    3    5    3    1    4
## Violência manual        47   60   54   70   69   66   70   60
## Estrangulamento         43   45   43   53   51   63   47   51
## Asfixia ou afogamento   26   16   20   24   15   15   15   15
res.ca <- ca(dados_assassinato, graph = FALSE)
summary(res.ca)
## 
## Principal inertias (eigenvalues):
## 
##  dim    value      %   cum%   scree plot               
##  1      0.016614  54.7  54.7  **************           
##  2      0.008076  26.6  81.4  *******                  
##  3      0.003550  11.7  93.1  ***                      
##  4      0.001029   3.4  96.5  *                        
##  5      0.000609   2.0  98.5  *                        
##  6      0.000467   1.5 100.0                           
##         -------- -----                                 
##  Total: 0.030346 100.0                                 
## 
## 
## Rows:
##     name   mass  qlt  inr    k=1 cor ctr    k=2 cor ctr  
## 1 | Trxp |   93  972  341 |  292 768 478 | -151 205 263 |
## 2 | Esfq |  378  834   64 |   -7   9   1 |   65 825 198 |
## 3 | Inst |  102  195  114 |   67 134  28 |  -46  61  26 |
## 4 | Venn |   15  944  208 | -436 442 168 | -464 502 392 |
## 5 | Vlnc |  197  484   31 |  -17  63   4 |   45 421  48 |
## 6 | Estr |  157  118   41 |  -27  94   7 |  -14  24   4 |
## 7 | Asfx |   58  945  201 | -300 853 314 |  -98  92  69 |
## 
## Columns:
##     name   mass  qlt  inr    k=1 cor ctr    k=2 cor ctr  
## 1 | 1970 |  102  980  256 | -253 843 395 | -102 137 132 |
## 2 | 1971 |  107  706  146 | -119 339  90 |  123 367 201 |
## 3 | 1972 |  113  914  101 |  -24  21   4 | -156 894 340 |
## 4 | 1973 |  129  804  111 | -113 490  99 |   91 314 131 |
## 5 | 1974 |  135  871   64 |  103 746  87 |  -42 125  30 |
## 6 | 1975 |  141  755  159 |  154 690 201 |  -47  65  39 |
## 7 | 1976 |  143  806  117 |  117 555 118 |   79 251 110 |
## 8 | 1977 |  129  167   46 |   27  67   6 |   33 100  17 |

Os dois primeiros eixos explicam 81,4% da variância total (Dim1: 54,7% e Dim2: 26,6%), o que indica uma boa representação bidimensional dos dados.

Visualização do Espaço de Correspondência

  • “Veneno” aparece isolado no canto inferior esquerdo → método raro e atípico, mais usado em anos específicos.

  • “Tiro ou explosão” está à direita → associado principalmente aos anos 1974 e 1975.

  • “Asfixia ou afogamento” se aproxima de 1970, indicando maior uso nesse ano.

  • “Esfaqueamento”, “Violência manual” e “Estrangulamento” estão próximos ao centro → métodos comuns em vários anos.

  • 1972 se destaca negativamente na Dim2, próximo de “Veneno” → perfil de crimes diferente dos demais anos.

  • 1971, 1973 e 1977 estão agrupados, sem grande destaque → anos com distribuição equilibrada de métodos.

Contribuições das Linhas (Métodos)

Dimensão 1:

  • “Tiro ou explosão” (≈ 45%) e “Asfixia ou afogamento” (≈ 35%) são os métodos que mais contribuem para diferenciar os anos ao longo da Dim1.
  • Isso indica que esses métodos foram mais comuns ou distintos em anos específicos, sendo decisivos na estrutura dos dados.

Dimensão 2:

  • “Veneno” contribui com mais de 35%, sendo um método raro e concentrado em anos específicos.

  • “Esfaqueamento” também aparece com contribuição importante, mostrando variação em sua presença ao longo dos anos.

Contribuições das Colunas (Anos)

Dimensão 1:

  • O ano 1970 tem a maior contribuição (≈ 40%) para a Dim1, seguido de 1975, indicando que nesses anos os padrões de assassinato foram bem distintos em relação aos outros anos.

Dimensão 2:

  • O ano 1972 tem contribuição destacada (≈ 33%) na Dim2, seguido por 1971, mostrando que nesses anos houve uso de métodos particularmente diferentes (como “Veneno”).

Conclusão

  • Forte associação entre métodos atípicos (como “Veneno” ou “Tiro”) e anos específicos.

  • 1970, 1975 e 1972 foram anos com perfis bem distintos de assassinatos.

  • Métodos como “Esfaqueamento”, “Violência manual” e “Estrangulamento” estão mais próximos do centro, indicando uso consistente ao longo do período.

A análise gráfica permitiu identificar associações temporais com os tipos de crime, reforçando o poder exploratório da Análise de Correspondência em dados categóricos.

Análise OR estratificada (Mantel-Haenszel)

Introdução

Essa parte apresenta uma análise estatística sobre a relação entre o nível de partículas no ar (alto ou baixo) e a ocorrência de bronquite entre pacientes com tuberculose, estratificada por faixas etárias (15-24, 23-39 e 40+ anos).

Construção da Tabela de Contingência

tabela <- array(c(20, 9, 382, 214, 10, 7, 172, 120, 12, 6, 327, 183),
                dim = c(2, 2, 3),
                dimnames = list(
                  Particulas = c("Alto", "Baixo"),
                  Bronquite = c("Sim", "Não"),
                  Idade = c("15-24", "23-39", "40+")))
ftable(tabela, col.vars = "Bronquite", row.vars = c("Idade", "Particulas"))
##                  Bronquite Sim Não
## Idade Particulas                  
## 15-24 Alto                  20 382
##       Baixo                  9 214
## 23-39 Alto                  10 172
##       Baixo                  7 120
## 40+   Alto                  12 327
##       Baixo                  6 183

Teste de Associação: Mantel-Haenszel

library(epitools)
mantelhaen.test(tabela)
## 
##  Mantel-Haenszel chi-squared test with continuity correction
## 
## data:  tabela
## Mantel-Haenszel X-squared = 0.11442, df = 1, p-value = 0.7352
## alternative hypothesis: true common odds ratio is not equal to 1
## 95 percent confidence interval:
##  0.6693022 1.9265813
## sample estimates:
## common odds ratio 
##          1.135546

Interpretação: O teste de Mantel-Haenszel para associação entre bronquite e partículas, ajustado por idade, resultou em um valor de p = 0.7352. Isso indica que não há evidência estatística significativa de associação entre o nível de partículas e a ocorrência de bronquite, controlando por idade.

Gráfico de Barras por Faixa Etária

Estimativas de Odds Ratio por Estrato

or1 <- oddsratio(tabela[,,1])
or2 <- oddsratio(tabela[,,2])
or3 <- oddsratio(tabela[,,3])

As razões de chances (odds ratios) para cada estrato de idade foram:

  • 15-24: OR = 1.23 [0.56 ; 2.91]

  • 23-39: OR = 0.99 [0.36 ; 2.84]

  • 40+: OR = 1.10 [0.42 ; 3.28]

  • Combinado (MH): OR = 1.14 [0.67 ; 1.93]

Esses resultados sugerem que as estimativas individuais também não indicam uma forte associação.

Forest Plot

Conclusão

Apesar de haver variações nas estimativas de odds ratio entre os grupos etários, o teste de Mantel-Haenszel e os intervalos de confiança amplos sugerem ausência de associação estatisticamente significativa entre o nível de partículas e a bronquite.