Aula 4.32

ANCOVA - Híbrido de ANOVA e Regressão Linear. É uma análise onde a variável resposta é quantitativa, e temos duas variáveis explicativas. Sendo uma variável categórica (semelhante a ANOVA) e a outra variável é quantitativa (semelhante a Regressão)

Objetivo: Realizar teste de ANCOVA para verificar o efeito do Tipo de Ambiente sobre a Riqueza de Espécies e o quanto desse efeito depende da Área dos Fragmentos.

Este material está disponível em: http://rpubs.com/leonardoreffatti.

#Carregar o conjunto de Dados.
setwd("C:/R/Curso do R/MODULO_4.3")
dados<-read.table("pratica1.txt", header = TRUE)
attach(dados)
summary(dados)
##        UA              Ambiente       Área          Riqueza     
##  Min.   : 1.00   primário  :22   Min.   : 40.0   Min.   :14.00  
##  1st Qu.:13.25   secundário:28   1st Qu.: 79.5   1st Qu.:23.00  
##  Median :25.50                   Median :102.5   Median :29.50  
##  Mean   :25.50                   Mean   :102.5   Mean   :29.22  
##  3rd Qu.:37.75                   3rd Qu.:127.8   3rd Qu.:35.00  
##  Max.   :50.00                   Max.   :167.0   Max.   :48.00  
##    Abund_sp1   
##  Min.   :0.00  
##  1st Qu.:1.00  
##  Median :2.00  
##  Mean   :2.16  
##  3rd Qu.:3.00  
##  Max.   :8.00
str(dados)
## 'data.frame':    50 obs. of  5 variables:
##  $ UA       : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ Ambiente : Factor w/ 2 levels "primário","secundário": 1 1 1 1 1 1 1 1 1 1 ...
##  $ Área     : int  101 115 143 92 51 89 128 149 127 108 ...
##  $ Riqueza  : int  35 31 39 25 22 35 43 48 35 38 ...
##  $ Abund_sp1: int  3 3 1 6 1 0 3 5 0 2 ...
#Buscando dados da regressões simples feitas para verificar os gráficos
resultado.p<-lm(Riqueza[Ambiente=="primário"]~Área[Ambiente=="primário"])
resultado.s<-lm(Riqueza[Ambiente=="secundário"]~Área[Ambiente=="secundário"])

summary(resultado.p)
## 
## Call:
## lm(formula = Riqueza[Ambiente == "primário"] ~ Área[Ambiente == 
##     "primário"])
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -6.640 -3.639 -1.092  3.974 11.617 
## 
## Coefficients:
##                              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                  11.61574    3.47606   3.342  0.00325 ** 
## Área[Ambiente == "primário"]  0.19612    0.03219   6.092 5.92e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.108 on 20 degrees of freedom
## Multiple R-squared:  0.6498, Adjusted R-squared:  0.6323 
## F-statistic: 37.12 on 1 and 20 DF,  p-value: 5.916e-06
summary(resultado.s)
## 
## Call:
## lm(formula = Riqueza[Ambiente == "secundário"] ~ Área[Ambiente == 
##     "secundário"])
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -14.2452  -5.0998   0.7625   4.1806  11.4737 
## 
## Coefficients:
##                                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                    16.59948    3.28663   5.051 2.94e-05 ***
## Área[Ambiente == "secundário"]  0.10398    0.03003   3.462  0.00187 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6.121 on 26 degrees of freedom
## Multiple R-squared:  0.3155, Adjusted R-squared:  0.2892 
## F-statistic: 11.99 on 1 and 26 DF,  p-value: 0.001867
#Estimativa mata primaria, 0.19612, a cada 1km2 a mais de área a riqueza aumenta 0.19 espécies.
#Estimativa mata secundaria, 0.10398, a cada 1km2 a mais de área a riqueza aumenta 0.10 espécies.


#ancova - Regressão linear da Riqueza em função da interação Ambiente e Área
resultado<-lm(Riqueza~Ambiente*Área)
summary(resultado)
## 
## Call:
## lm(formula = Riqueza ~ Ambiente * Área)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -14.2452  -3.9963   0.1727   4.0702  11.6169 
## 
## Coefficients:
##                         Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             11.61574    3.88076   2.993  0.00443 ** 
## Ambientesecundário       4.98374    4.94332   1.008  0.31864    
## Área                     0.19612    0.03594   5.457 1.87e-06 ***
## Ambientesecundário:Área -0.09214    0.04555  -2.023  0.04891 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.703 on 46 degrees of freedom
## Multiple R-squared:  0.5267, Adjusted R-squared:  0.4958 
## F-statistic: 17.06 on 3 and 46 DF,  p-value: 1.374e-07
#Quando fazemos ANCOVA, estamos comparando essas Estimativas.
#Onde essas diferenças dos coeficientes de regressão da mata primaria e secundária apresentam diferença significativa.

#INTERAÇÃO apresentou dif. significativa.

##Ambiente:Área  1  133.1   133.1   4.093  0.04891 *  (resultado.p)
#Ambientesecundário:Área -0.09214    0.04555  -2.023  0.04891 *  (resultado.s)

#De fato, o resultado do coeficiente depende do tipo de Ambiente.
#o coeficiente de cada regressão é diferente.

#Na análise de co-variância realizado, apresentando efeito estatististicamente significativo da a interação Ambiente e Área sobre a Riqueza de espécies. O resultado é que o efeito da Área sobre a Riqueza de espécies dependente do tipo de Ambiente.

#Resultados
plot(Riqueza~Área, las=1, pch=16, col=c("green4", "red")[Ambiente])
abline(resultado.p, lty=2, col="green4")
abline(resultado.s, lty=2, col="red")
legend("topleft", pch=16, col=c("green4", "red"), legend=levels(Ambiente))
text(85, 47, "y=11.6+0.19x", col="green4")
text(85, 43, "y=16.6+0.10x", col="red")

#Existe um efeito da área sobre a riqueza dependente de cada tipo de ambiente.
#A ANCOVA explica essa interação p=0.04891.
#Esse efeito da área sobre a riqueza em cada tipo de ambiente é estatisticamente significativo.


#Verificar Pressupostos - ANCOVA
#1 - Pressuposto de Normalidade dos resíduos
qqnorm(resultado$residuals)
qqline(resultado$residuals, lty=2)

#2 - Pressuposto da Homocedasticidade, esperando que os resíduos variem em torno da reta da regressão de maneira homogenea
#através de inspeção visual dos resíduos
plot(resultado$fitted.values, resultado$residuals)
#fitted.values, valores ajustados na reta
abline(h=0, lty=2)

#Apresentação dos resultados, em formato de tabela de ANOVA fatorial
anova(resultado)
## Analysis of Variance Table
## 
## Response: Riqueza
##               Df  Sum Sq Mean Sq F value    Pr(>F)    
## Ambiente       1  246.97  246.97  7.5938  0.008366 ** 
## Área           1 1284.50 1284.50 39.4963 1.083e-07 ***
## Ambiente:Área  1  133.10  133.10  4.0926  0.048906 *  
## Residuals     46 1496.01   32.52                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#RESUMO FINAL ANCOVA
resultado<-lm(Riqueza~Ambiente*Área) #ANCOVA
summary(resultado) #Resultado detalhado
## 
## Call:
## lm(formula = Riqueza ~ Ambiente * Área)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -14.2452  -3.9963   0.1727   4.0702  11.6169 
## 
## Coefficients:
##                         Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             11.61574    3.88076   2.993  0.00443 ** 
## Ambientesecundário       4.98374    4.94332   1.008  0.31864    
## Área                     0.19612    0.03594   5.457 1.87e-06 ***
## Ambientesecundário:Área -0.09214    0.04555  -2.023  0.04891 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.703 on 46 degrees of freedom
## Multiple R-squared:  0.5267, Adjusted R-squared:  0.4958 
## F-statistic: 17.06 on 3 and 46 DF,  p-value: 1.374e-07
anova(resultado) #Resultado em tabela de ANOVA
## Analysis of Variance Table
## 
## Response: Riqueza
##               Df  Sum Sq Mean Sq F value    Pr(>F)    
## Ambiente       1  246.97  246.97  7.5938  0.008366 ** 
## Área           1 1284.50 1284.50 39.4963 1.083e-07 ***
## Ambiente:Área  1  133.10  133.10  4.0926  0.048906 *  
## Residuals     46 1496.01   32.52                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Resultados nos gráficos
plot(Riqueza~Área, las=1, pch=16, col=c("green4", "red")[Ambiente])
abline(resultado.p, lty=2, col="green4")
abline(resultado.s, lty=2, col="red")
legend("topleft", pch=16, col=c("green4", "red"), legend=levels(Ambiente))
text(85, 47, "y=11.6+0.19x", col="green4")
text(85, 43, "y=16.6+0.10x", col="red")

#Existe um efeito da área sobre a riqueza dependente de cada tipo de ambiente.
#A ANCOVA explica essa interação p=0.04891.
#Esse efeito da área sobre a riqueza em cada tipo de ambiente é estatisticamente significativo.