Qual teste de hipótese usar?

Dependemos dos tipos das variáveis

Testes para duas variáveis qualitativas

Teste qui-quadrado e teste exato de fischer

O teste qui-quadrado é o mais adequado mas caso suas condições não sejam encontradas utilizamos o teste exato de fischer.

PASSO 1 : formular hipótese

PASSO 2 : escolher o alpha e a regra de decisão

PAsso 3 : testamos os pressupostos do teste qui-quadrado

PASSO 4 : calcular a distância/variância entre o esperado (H0) e o resultado -> X = ∑(O - E)^2/E (em que O é o observado e E é o esperado)

Se o resultado for baixo, maior a possibilidade de rejeição de H0, quanto maior menos possibilidade de rejeição.

Exemplo do teste qui-quadrado:

exemplo = as.table(rbind(c(117, 54), c(950, 348)))
dimnames(exemplo) = list(Atualmente = c("Vivo", "Morto"),
                    Habito_de_fumar = c("Fumantes", "Não fumantes"))
exemplo
##           Habito_de_fumar
## Atualmente Fumantes Não fumantes
##      Vivo       117           54
##      Morto      950          348

PASSO 1:

H0: Não há associação entre as duas variáveis

H1: Há associação entre as duas variáveis

PASSO 2:

α(nível de confiança) = 0,05

Se P-value for menor que α rejeitamos H0, se for maior que α não rejeitamos H0.

Testamos então se podemos utilizar o teste qui-quadrado. Se algum valor esperado for menor que 5 não podemos utiliza-lo.

TQQ = chisq.test(exemplo)
TQQ$expected
##           Habito_de_fumar
## Atualmente Fumantes Não fumantes
##      Vivo  124.2049      46.7951
##      Morto 942.7951     355.2049

Todos os valores esperado são maiores que 5, logo o pressuposto do teste qui-quadrado foi cumprido e podemos utiliza-lo.

Agora buscamos o P-value:

TQQ$p.value
## [1] 0.221151

O p-value é de 0,22 que é maior que o α então não rejeitamos a H0.

Exemplo 2:

load("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\Titanic.RData")
Titanic$Classe = gsub("Tripula<e7><e3>o", "Tripulacao", Titanic$Classe)

PASSO 1:

H0: Não há associação entre sexo e sobrevivência H1: Há associação entre sexo e sobrevivência

PASSO 2:

α = 0,05

Regra de decisão: Se P-value for menor que α rejeitamos H0, se for maior que α não rejeitamos H0.

PASSO 3:

tabela_sexo = table(Titanic$Sexo, Titanic$Sobreviveu)
tabela_sexo
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366
TQQ_sexo = chisq.test(tabela_sexo)
TQQ_sexo$expected
##            
##             Não sobreviveu Sobreviveu
##   Feminino        318.3182   151.6818
##   Masculino      1171.6818   558.3182

Pressuposto atendido, todos os valores esperados são maiores que 5, logo o teste qui-quadrado é adequado.

PASSO 4:

Encontramos o p-value:

TQQ_sexo$p.value
## [1] 4.654621e-101

O p-value é menor que o α, logo rejeitamos a H0.

Há associação entre as variáveis, logo as mulheres sobreviveram mais que os homens.

Atividade de teste qui-quadrado

1)

Associação entre classe e sobrevivência

H0: Não há associação entre classe e sobrevivência H1: Há associação entre classe e sobrevivência

α = 0,05

tabela_classe = table(Titanic$Classe, Titanic$Sobreviveu)
tabela_classe
##             
##              Não sobreviveu Sobreviveu
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178
##   Tripulacao            673        212
TQQ_classe = chisq.test(tabela_classe)
TQQ_classe$expected
##             
##              Não sobreviveu Sobreviveu
##   Primeira         219.4364  104.56364
##   Segunda          193.0227   91.97727
##   Terceira         478.1545  227.84545
##   Tripulacao       599.3864  285.61364
TQQ_classe$p.value
## [1] 9.814761e-41

O p-value é menor que o α, logo rejeitamos o H0, há associação entre as variáveis. Há desigualdade de classes na sobrevivência.

2)

Associação entre idade e sobrevivência

H0: Não há associação entre classe e sobrevivência H1: Há associação entre classe e sobrevivência

α = 0,05

tabela_idade = table(Titanic$Idade, Titanic$Sobreviveu)
tabela_idade
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653
TQQ_idade = chisq.test(tabela_idade)
TQQ_idade$expected
##          
##           Não sobreviveu Sobreviveu
##   criança       73.82273   35.17727
##   adulto      1416.17727  674.82273
TQQ_idade$p.value
## [1] 7.433272e-06

O p-value é menor que o α, logo rejeitamos o H0, há associação entre as variáveis. Crianças sobreviveram mais que adultos.


Exemplo de teste exato de fischer

“O gosto do chá muda de acordo com a ordem em que as ervas e o leite são colocados? Uma britânica diz ser uma especialista em chá. Ela afirmou ser capaz de distinguir se leite ou chá foi adicionado à xícara primeiro. Leite sobre o chá ou chá sobre o leite.

Para testar, ela recebeu 8 xícaras de chá, das quais quatro o chá foi adicionado antes do leite.”

PASSO 1:

H0: Não há associação H1: Há associação

PASSO 2:

α = 0,05

PASSO 3:

Testamos para ver se podemos utilizar o teste qui-quadrado

resultado_xicaras = matrix(c(3, 1, 1, 3),
       nrow = 2, dimnames = 
         list(opiniao = c("Leite", "Chá"),
              verdadeiro_result = c("Leite", "Chá")))
resultado_xicaras
##        verdadeiro_result
## opiniao Leite Chá
##   Leite     3   1
##   Chá       1   3
TQQ_cha = chisq.test(resultado_xicaras)
TQQ_cha$expected
##        verdadeiro_result
## opiniao Leite Chá
##   Leite     2   2
##   Chá       2   2

O pressuposto foi violado, logo o teste qui-quadrado não é adequado para esses dados.

PASSO 4:

Utilizamos o teste exato de fischer

Teste_fisher = fisher.test(resultado_xicaras, alternative = "greater")
Teste_fisher
## 
##  Fisher's Exact Test for Count Data
## 
## data:  resultado_xicaras
## p-value = 0.2429
## alternative hypothesis: true odds ratio is greater than 1
## 95 percent confidence interval:
##  0.3135693       Inf
## sample estimates:
## odds ratio 
##   6.408309
Teste_fisher$p.value
## [1] 0.2428571

O p-value é maior que o α, logo não rejeitamos a hipótese nula. Não há associação.


Chances

Chance é eventoA/eventoB.

Razão de chances é (eventoA/eventoB)/(eventoC/eventoD).

exemplo:

Quão maior é a chance de uma mulher sobreviver no titanic?

chanceA = 344/366
chanceB = 126/1354
RC = chanceA/chanceB
RC
## [1] 10.1001

As mulheres tem 9 vezes mais chance de sobreviver que os homens

Fazendo no R

library(epitools)
oddsratio(tabela_sexo)
## $data
##            
##             Não sobreviveu Sobreviveu Total
##   Feminino             126        344   470
##   Masculino           1364        366  1730
##   Total               1490        710  2200
## 
## $measure
##            odds ratio with 95% C.I.
##               estimate      lower     upper
##   Feminino  1.00000000         NA        NA
##   Masculino 0.09850138 0.07768518 0.1242006
## 
## $p.value
##            two-sided
##             midp.exact fisher.exact   chi.square
##   Feminino          NA           NA           NA
##   Masculino          0 1.765449e-96 1.41408e-101
## 
## $correction
## [1] FALSE
## 
## attr(,"method")
## [1] "median-unbiased estimate & mid-p exact CI"
1/0.09850138 
## [1] 10.15214

As mulheres tem 9 vezes mais chance de sobreviver que os homens

oddsratio(tabela_classe)
## $data
##             
##              Não sobreviveu Sobreviveu Total
##   Primeira              122        202   324
##   Segunda               167        118   285
##   Terceira              528        178   706
##   Tripulacao            673        212   885
##   Total                1490        710  2200
## 
## $measure
##             odds ratio with 95% C.I.
##               estimate     lower     upper
##   Primeira   1.0000000        NA        NA
##   Segunda    0.4275952 0.3079714 0.5914162
##   Terceira   0.2040974 0.1535857 0.2700065
##   Tripulacao 0.1906369 0.1448185 0.2499950
## 
## $p.value
##             two-sided
##                midp.exact fisher.exact   chi.square
##   Primeira             NA           NA           NA
##   Segunda    2.419968e-07 2.795202e-07 2.414955e-07
##   Terceira   0.000000e+00 6.562131e-30 1.898696e-30
##   Tripulacao 0.000000e+00 1.980243e-34 1.241031e-35
## 
## $correction
## [1] FALSE
## 
## attr(,"method")
## [1] "median-unbiased estimate & mid-p exact CI"
1/0.1906369
## [1] 5.245574

A primeira classe tem 4 vezes mais chance de sobreviver que a tripulação.


MAPA

library(geojsonio)
library(leaflet)
library(dplyr)
bairros = geojson_read("C:\\Users\\15781634711\\Downloads\\Limite_de_Bairros.geojson")
class(bairros)
## [1] "list"
names(bairros)
## [1] "type"     "features"
m = leaflet(bairros) %>% 
    addTiles() %>% 
    addProviderTiles("CartoDB.Positron")