Aula 4.24

Qui-Quadrado - Teste de variáveis Categóricas. Tanto as variáveis explicativas quanto as vatiáveis resposta são categóricas. Não é um teste paramétrico.

Objetivo: Realizar teste Qui-Quadrado para verificar a associação de um conjunto de dados em que as variáveis explicativas e resposta são categóricas.

Este material está disponível em: http://rpubs.com/leonardoreffatti.

#Carregar o conjunto de Dados.
setwd("C:/R/Curso do R/MODULO_4.2")
dados<-read.table("sanhaços.txt", header = TRUE)
attach(dados)
summary(dados)
##        UA                Ave                Árvore  
##  Min.   : 1.0   Outras_aves:74   Melastomatacea:47  
##  1st Qu.:25.5   Sanhaço    :25   Outras_árvores:52  
##  Median :50.0                                       
##  Mean   :50.0                                       
##  3rd Qu.:74.5                                       
##  Max.   :99.0
str(dados)
## 'data.frame':    99 obs. of  3 variables:
##  $ UA    : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ Ave   : Factor w/ 2 levels "Outras_aves",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ Árvore: Factor w/ 2 levels "Melastomatacea",..: 1 1 1 1 1 1 1 1 1 1 ...
#Criar a tabela de contingência das variáveis.
tabela1<-table(Ave, Árvore)
tabela1
##              Árvore
## Ave           Melastomatacea Outras_árvores
##   Outras_aves             34             40
##   Sanhaço                 13             12
tabela2<-table(Árvore, Ave)
tabela2
##                 Ave
## Árvore           Outras_aves Sanhaço
##   Melastomatacea          34      13
##   Outras_árvores          40      12
barplot(tabela1, beside = T, legend=row.names(tabela1))

barplot(tabela2, beside = T, legend=row.names(tabela2))

#Para executar o teste estatístico do Qui-Quadrado, utilizamos a função chisq.test()
resultado<-chisq.test(tabela1)
resultado
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  tabela1
## X-squared = 0.085531, df = 1, p-value = 0.7699
#Valor de Qui-Quadrado foi de 0.085531.
#O valor do grau de liberdade foi de 1. Seu cálculo é de o número de classes de uma variável -1, multiplicado pelo número de classes da outra variável -1.
#O valor de p foi de 0.7699, ou seja, não se rejeita a hipótese nula, a qual nos diz que as classes das variáveis estudadas não apresentam associação.

#visualização da tabela de valores esperados
resultado$expected
##              Árvore
## Ave           Melastomatacea Outras_árvores
##   Outras_aves       35.13131       38.86869
##   Sanhaço           11.86869       13.13131
#visualização da tabela 1
tabela1
##              Árvore
## Ave           Melastomatacea Outras_árvores
##   Outras_aves             34             40
##   Sanhaço                 13             12