O teste qui-quadrado é o mais adequado mas caso suas condições não sejam encontradas utilizamos o teste exato de fischer.
PASSO 1 : formular hipótese
PASSO 2 : escolher o alpha e a regra de decisão
PAsso 3 : testamos os pressupostos do teste qui-quadrado
PASSO 4 : calcular a distância/variância entre o esperado (H0) e o resultado -> X = ∑(O - E)^2/E (em que O é o observado e E é o esperado)
Se o resultado for baixo, maior a possibilidade de rejeição de H0, quanto maior menos possibilidade de rejeição.
exemplo = as.table(rbind(c(117, 54), c(950, 348)))
dimnames(exemplo) = list(Atualmente = c("Vivo", "Morto"),
Habito_de_fumar = c("Fumantes", "Não fumantes"))
exemplo
## Habito_de_fumar
## Atualmente Fumantes Não fumantes
## Vivo 117 54
## Morto 950 348
PASSO 1:
H0: Não há associação entre as duas variáveis
H1: Há associação entre as duas variáveis
PASSO 2:
α(nível de confiança) = 0,05
Se P-value for menor que α rejeitamos H0, se for maior que α não rejeitamos H0.
Testamos então se podemos utilizar o teste qui-quadrado. Se algum valor esperado for menor que 5 não podemos utiliza-lo.
TQQ = chisq.test(exemplo)
TQQ$expected
## Habito_de_fumar
## Atualmente Fumantes Não fumantes
## Vivo 124.2049 46.7951
## Morto 942.7951 355.2049
Todos os valores esperado são maiores que 5, logo o pressuposto do teste qui-quadrado foi cumprido e podemos utiliza-lo.
Agora buscamos o P-value:
TQQ$p.value
## [1] 0.221151
O p-value é de 0,22 que é maior que o α então não rejeitamos a H0.
load("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\Titanic.RData")
Titanic$Classe = gsub("Tripula<e7><e3>o", "Tripulacao", Titanic$Classe)
PASSO 1:
H0: Não há associação entre sexo e sobrevivência H1: Há associação entre sexo e sobrevivência
PASSO 2:
α = 0,05
Regra de decisão: Se P-value for menor que α rejeitamos H0, se for maior que α não rejeitamos H0.
PASSO 3:
tabela_sexo = table(Titanic$Sexo, Titanic$Sobreviveu)
tabela_sexo
##
## Não sobreviveu Sobreviveu
## Feminino 126 344
## Masculino 1364 366
TQQ_sexo = chisq.test(tabela_sexo)
TQQ_sexo$expected
##
## Não sobreviveu Sobreviveu
## Feminino 318.3182 151.6818
## Masculino 1171.6818 558.3182
Pressuposto atendido, todos os valores esperados são maiores que 5, logo o teste qui-quadrado é adequado.
PASSO 4:
Encontramos o p-value:
TQQ_sexo$p.value
## [1] 4.654621e-101
O p-value é menor que o α, logo rejeitamos a H0.
Há associação entre as variáveis, logo as mulheres sobreviveram mais que os homens.
Associação entre classe e sobrevivência
H0: Não há associação entre classe e sobrevivência H1: Há associação entre classe e sobrevivência
α = 0,05
tabela_classe = table(Titanic$Classe, Titanic$Sobreviveu)
tabela_classe
##
## Não sobreviveu Sobreviveu
## Primeira 122 202
## Segunda 167 118
## Terceira 528 178
## Tripulacao 673 212
TQQ_classe = chisq.test(tabela_classe)
TQQ_classe$expected
##
## Não sobreviveu Sobreviveu
## Primeira 219.4364 104.56364
## Segunda 193.0227 91.97727
## Terceira 478.1545 227.84545
## Tripulacao 599.3864 285.61364
TQQ_classe$p.value
## [1] 9.814761e-41
O p-value é menor que o α, logo rejeitamos o H0, há associação entre as variáveis. Há desigualdade de classes na sobrevivência.
Associação entre idade e sobrevivência
H0: Não há associação entre classe e sobrevivência H1: Há associação entre classe e sobrevivência
α = 0,05
tabela_idade = table(Titanic$Idade, Titanic$Sobreviveu)
tabela_idade
##
## Não sobreviveu Sobreviveu
## criança 52 57
## adulto 1438 653
TQQ_idade = chisq.test(tabela_idade)
TQQ_idade$expected
##
## Não sobreviveu Sobreviveu
## criança 73.82273 35.17727
## adulto 1416.17727 674.82273
TQQ_idade$p.value
## [1] 7.433272e-06
O p-value é menor que o α, logo rejeitamos o H0, há associação entre as variáveis. Crianças sobreviveram mais que adultos.
“O gosto do chá muda de acordo com a ordem em que as ervas e o leite são colocados? Uma britânica diz ser uma especialista em chá. Ela afirmou ser capaz de distinguir se leite ou chá foi adicionado à xícara primeiro. Leite sobre o chá ou chá sobre o leite.
Para testar, ela recebeu 8 xícaras de chá, das quais quatro o chá foi adicionado antes do leite.”
PASSO 1:
H0: Não há associação H1: Há associação
PASSO 2:
α = 0,05
PASSO 3:
Testamos para ver se podemos utilizar o teste qui-quadrado
resultado_xicaras = matrix(c(3, 1, 1, 3),
nrow = 2, dimnames =
list(opiniao = c("Leite", "Chá"),
verdadeiro_result = c("Leite", "Chá")))
resultado_xicaras
## verdadeiro_result
## opiniao Leite Chá
## Leite 3 1
## Chá 1 3
TQQ_cha = chisq.test(resultado_xicaras)
TQQ_cha$expected
## verdadeiro_result
## opiniao Leite Chá
## Leite 2 2
## Chá 2 2
O pressuposto foi violado, logo o teste qui-quadrado não é adequado para esses dados.
PASSO 4:
Utilizamos o teste exato de fischer
Teste_fisher = fisher.test(resultado_xicaras, alternative = "greater")
Teste_fisher
##
## Fisher's Exact Test for Count Data
##
## data: resultado_xicaras
## p-value = 0.2429
## alternative hypothesis: true odds ratio is greater than 1
## 95 percent confidence interval:
## 0.3135693 Inf
## sample estimates:
## odds ratio
## 6.408309
Teste_fisher$p.value
## [1] 0.2428571
O p-value é maior que o α, logo não rejeitamos a hipótese nula. Não há associação.
Chance é eventoA/eventoB.
Razão de chances é (eventoA/eventoB)/(eventoC/eventoD).
exemplo:
Quão maior é a chance de uma mulher sobreviver no titanic?
chanceA = 344/366
chanceB = 126/1354
RC = chanceA/chanceB
RC
## [1] 10.1001
As mulheres tem 9 vezes mais chance de sobreviver que os homens
library(epitools)
oddsratio(tabela_sexo)
## $data
##
## Não sobreviveu Sobreviveu Total
## Feminino 126 344 470
## Masculino 1364 366 1730
## Total 1490 710 2200
##
## $measure
## odds ratio with 95% C.I.
## estimate lower upper
## Feminino 1.00000000 NA NA
## Masculino 0.09850138 0.07768518 0.1242006
##
## $p.value
## two-sided
## midp.exact fisher.exact chi.square
## Feminino NA NA NA
## Masculino 0 1.765449e-96 1.41408e-101
##
## $correction
## [1] FALSE
##
## attr(,"method")
## [1] "median-unbiased estimate & mid-p exact CI"
1/0.09850138
## [1] 10.15214
As mulheres tem 9 vezes mais chance de sobreviver que os homens
oddsratio(tabela_classe)
## $data
##
## Não sobreviveu Sobreviveu Total
## Primeira 122 202 324
## Segunda 167 118 285
## Terceira 528 178 706
## Tripulacao 673 212 885
## Total 1490 710 2200
##
## $measure
## odds ratio with 95% C.I.
## estimate lower upper
## Primeira 1.0000000 NA NA
## Segunda 0.4275952 0.3079714 0.5914162
## Terceira 0.2040974 0.1535857 0.2700065
## Tripulacao 0.1906369 0.1448185 0.2499950
##
## $p.value
## two-sided
## midp.exact fisher.exact chi.square
## Primeira NA NA NA
## Segunda 2.419968e-07 2.795202e-07 2.414955e-07
## Terceira 0.000000e+00 6.562131e-30 1.898696e-30
## Tripulacao 0.000000e+00 1.980243e-34 1.241031e-35
##
## $correction
## [1] FALSE
##
## attr(,"method")
## [1] "median-unbiased estimate & mid-p exact CI"
1/0.1906369
## [1] 5.245574
A primeira classe tem 4 vezes mais chance de sobreviver que a tripulação.
library(geojsonio)
library(leaflet)
library(dplyr)
bairros = geojson_read("C:\\Users\\15781634711\\Downloads\\Limite_de_Bairros.geojson")
class(bairros)
## [1] "list"
names(bairros)
## [1] "type" "features"
m = leaflet(bairros) %>%
addTiles() %>%
addProviderTiles("CartoDB.Positron")