Teste Qui-quadrado e Distribuição Normal

H0: p = 0,5

H1:1 p != 0,5

alpha: 0,05

prop.test(541, 1000, p = 0.5, conf.level = 0.95)
## 
##  1-sample proportions test with continuity correction
## 
## data:  541 out of 1000, null probability 0.5
## X-squared = 6.561, df = 1, p-value = 0.01042
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
##  0.5095159 0.5721653
## sample estimates:
##     p 
## 0.541

Se pvalor < alpha Rej H0

Se pvalor > alpha NAO Rej H0

p-value = 0,0104

alpha = 0,05

como pvalor < alpha REJ H0. Essa moeda é desonesta

#————————————————-

Quali X Quali

Teste qui-quadrado

H0: Não há associação entre as variaveis (fumar e mortalidade)

H1: Há associação entre as variáveis

alpha: 0,05

Tabela para o teste

tabela <- as.table(rbind(c(117, 54), c(950, 348)))

Rótulos para tabela

dimnames(tabela) <- list(mortalidade = c("Vivo","Morto"),
                         habito = c("Não fuma", "Fuma"))

tabela
##            habito
## mortalidade Não fuma Fuma
##       Vivo       117   54
##       Morto      950  348

se pvalor < alpha REJ H0

se pvalor > alpha NAO REJ H0

TQQ = chisq.test(tabela)

Pressuposto atendido! Posso usar o teste qui-quadrado

TQQ$expected
##            habito
## mortalidade Não fuma     Fuma
##       Vivo  124.2049  46.7951
##       Morto 942.7951 355.2049
TQQ$observed
##            habito
## mortalidade Não fuma Fuma
##       Vivo       117   54
##       Morto      950  348
TQQ$p.value
## [1] 0.221151

pvalor = 0,22

alpha = 0,05

pvalor > alpha NAO REF H0

As variáveis são independentes

#———————————————-

resultado_xicaras = matrix(c(3,1,1,3),
                           nrow = 2, dimnames =
                             list(opiniao = c ("Leite", "Cha"),
                              verdadeiro_result = c("Leite", "Cha")))

resultado_xicaras
##        verdadeiro_result
## opiniao Leite Cha
##   Leite     3   1
##   Cha       1   3

H0: Não há associação H1: Há associação alpha: 0,05

TQQ2 = chisq.test(resultado_xicaras)
## Warning in chisq.test(resultado_xicaras): Chi-squared approximation may be
## incorrect
TQQ2$expected
##        verdadeiro_result
## opiniao Leite Cha
##   Leite     2   2
##   Cha       2   2

Não posso usar o teste qui-quadrado

TEF = fisher.test(resultado_xicaras)
TEF
## 
##  Fisher's Exact Test for Count Data
## 
## data:  resultado_xicaras
## p-value = 0.4857
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
##    0.2117329 621.9337505
## sample estimates:
## odds ratio 
##   6.408309

p-value = 0.4857 alpha 0,05

se pvalor < alpha REJ H0

se pvalor > alpha NAO REJ H0

#—————————————-

load("C:/Users/manue/Base_de_dados-master/Titanic.RData")

TT1 = table(Titanic$Classe, Titanic$Sobreviveu)
TT1
##             
##              Não sobreviveu Sobreviveu
##   Tripulação            673        212
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178

H0 : não há associação entre as variáveis classe e sobrevivencia

H1: há associação entre as variáveis

alpha 0,05

TQ3 = chisq.test (TT1)

avaliar o pressuposto

TQ3$expected
##             
##              Não sobreviveu Sobreviveu
##   Tripulação       599.3864  285.61364
##   Primeira         219.4364  104.56364
##   Segunda          193.0227   91.97727
##   Terceira         478.1545  227.84545
options (scipen=999)

TQ3$p.value
## [1] 0.00000000000000000000000000000000000000009814761

p.value = 0.00000000000000000000000000000000000000009814761 como pvalor < alpha REJ H0

há impacto da classe na sobrevivencia

#———————————-

Tem impacto da idade na sobrevivencia?

H0: Não existe associação H1: Existe associação alpha: 0,05

TQQ4 = chisq.test(table(Titanic$Idade,
                        Titanic$Sobreviveu))

TQQ4$expected
##          
##           Não sobreviveu Sobreviveu
##   criança       73.82273   35.17727
##   adulto      1416.17727  674.82273

Posso usar o test qui-quadrado

TQQ4$p.value
## [1] 0.000007433272

existe impacto da idade na sobrevivencia

#———————————– #———————————– #———————————–

Teste de Normalidade

load("C:/Users/manue/Base_de_dados-master/CARROS.RData")

H0: Os dados seguem uma distribuição normal

H1: Os dados NÃO seguem uma distribuição normaç

alpha: 0, 05

se pvalor < alpha REJ H0

se pvalor > alpha NAO REJ H0

shapiro.test(CARROS$Preco)
## 
##  Shapiro-Wilk normality test
## 
## data:  CARROS$Preco
## W = 0.92001, p-value = 0.02081

p-value = 0.02081

O preço do carro não tem uma distribuição normal

hist(CARROS$Preco)

#———————————————

O km por litro tem distribuição normal?

H0: Os dados seguem uma distribuição normal

H1: Os dados NÃO seguem uma distribuição normaç

alpha: 0, 05

se pvalor < alpha REJ H0

se pvalor > alpha NAO REJ H0

shapiro.test(CARROS$Kmporlitro)
## 
##  Shapiro-Wilk normality test
## 
## data:  CARROS$Kmporlitro
## W = 0.94756, p-value = 0.1229

p-value = 0.1229

o km por livro tem distribuição normal

#—————————————————-

Peso e Km/L

H0: rho = 0

H1: rho != 0

alpha: 0,05

se pvalor < alpha REJ H0

se pvalor > alpha NAO REJ H0

cor.test (CARROS$Peso,CARROS$Kmporlitro,
          method = "pearson", conf.level = 0.95)
## 
##  Pearson's product-moment correlation
## 
## data:  CARROS$Peso and CARROS$Kmporlitro
## t = -9.559, df = 30, p-value = 0.0000000001294
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.9338264 -0.7440872
## sample estimates:
##        cor 
## -0.8676594

p-value = 0.0000000001294

A correlação é diferente de zero

#———————————————-

Preço e Hp

H0: rho = 0

H1: rho != 0

alpha: 0, 05

se pvalor < alpha REJ H0

se pvalor > alpha NAO REJ H0

cor.test(CARROS$Preco, CARROS$HP, method = "spearman",
         conf.level = 0.95)
## Warning in cor.test.default(CARROS$Preco, CARROS$HP, method = "spearman", :
## Cannot compute exact p-value with ties
## 
##  Spearman's rank correlation rho
## 
## data:  CARROS$Preco and CARROS$HP
## S = 812.71, p-value = 0.0000000006791
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.8510426

p-value = 0.0000000006791

Estão correlacionadas as duas variáveis

#———————————————-

Km/L e Preço

(normal) (nao normal)

no caso de duas variáveis, sendo uma normal e outra não é preciso usar o método Spearman

H0: rho = 0

H1: rho != 0

alpha: 0, 05

se pvalor < alpha REJ H0

se pvalor > alpha NAO REJ H0

cor.test(CARROS$Kmporlitro, CARROS$Preco,
         method = "spearman", conf.level = 0.95)
## Warning in cor.test.default(CARROS$Kmporlitro, CARROS$Preco, method =
## "spearman", : Cannot compute exact p-value with ties
## 
##  Spearman's rank correlation rho
## 
## data:  CARROS$Kmporlitro and CARROS$Preco
## S = 10415, p-value = 0.000000000000637
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##        rho 
## -0.9088824

p-value = 0.000000000000637

Tem uma correlação entre as variáveis