UNIRIO
Queremos saber se homens ou mulheres gostam mais de chocolate. Para isso, coletamos uma amostra de 100 homens e mulheres e perguntamos a cada um deles se gostam não de chocolate.
| Gosta | Não gosta | Total | |
|---|---|---|---|
| Mulher | 51 | 5 | 56 |
| Homem | 29 | 15 | 44 |
| Total | 80 | 20 | 100 |
Karl Pearson (1857 - 1936)
O valor esperado das células deve ser 5 ou mais em pelo menos 80% das células, e nenhuma célula deve ter um valor esperado menor que um.
Quando os dados não apresentam essas condições, podemos utilizar como alternativa o teste exato de Fisher.
Para cada célula da tabela, temos que calcular o valor esperado sob H0. Para uma determinada célula, o valor esperado é calculado da seguinte forma:
Célula Mulher x Gosta:
| Gosta | Não gosta | Total | |
|---|---|---|---|
| Mulher | 51 (44,8) | 5 (11,2) | 56 |
| Homem | 29 (35,2) | 15 (8,8) | 44 |
| Total | 80 | 20 | 100 |
Após ter calculado todos os valores esperados, calculamos a estatística do teste por meio da fórmula:
em que \(o\) representa os valores observados, ou seja, os valores da tabela, e \(e\) são os valores esperados calculados.
| Gosta | Não gosta | Total | |
|---|---|---|---|
| Mulher | \(\frac{(51-44,8)^2}{44,8}=0,86\) | \(\frac{(5-11,2)^2}{11,2}=3,43\) | 56 |
| Homem | \(\frac{(29-35,2)^2}{35,2}=1,09\) | \(\frac{(15-8,8)^2}{8,8}=4,37\) | 44 |
| Total | 80 | 20 | 100 |
Essa estatística qui-quadrado calculada é comparada ao valor crítico (obtido pelas tabelas estatísticas) com graus de liberdade \(gl = (l-1)\times(c-1)\), em que \(l\) é o número de linhas na tabela de contingência e \(c\) é o número de colunas na tabela de contingência.
A correlação explora a relação entre duas variáveis quantitativas.
Charles Spearman (1863 - 1945)
Ao realizarmos um teste de correlação, dois resultados principais serão fornecidos:
Para o teste de correlação de Pearson, iremos utilizar a fórmula abaixo:
Nesta fórmula, \(x\) e \(y\) são dois vetores de tamanho \(n\), e \(m_{x}\) e \(m_{y}\) corresponde às médias de \(x\) e \(y\), respectivamente.
O valor-p da correlação pode ser determinado usando a tabela de coeficientes de correlação para os graus de liberdade (\(gl = n-2\)), em que \(n\) é o número de observação nas variáveis \(x\) e \(y\).
Para o teste de correlação de Spearman, iremos utilizar a fórmula abaixo:
Nesta fórmula, \(x'\) e \(y'\) são os ranqueamentos de \(x\) e \(y\), e \(m_{x'}\) e \(m_{y'}\) corresponde às médias dos ranqueamentos.
O valor-p da correlação pode ser determinado usando a tabela de coeficientes de correlação para os graus de liberdade (\(gl = n-2\)), em que \(n\) é o número de observação nas variáveis \(x\) e \(y\).
BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. Ed. UFSC, 2008.
DANCEY, Christine P.; REIDY, John G.; ROWE, Richard. Estatística Sem Matemática para as Ciências da Saúde. Penso Editora, 2017.
HAIR, J. F. et al. Multivariate data analysis. Cengage. Hampshire, United Kingdom, 2019.
leticia.raposo@uniriotec.br