Aula 10 - Exercícios

Prof. Lorenzo Zanette -



Analisando variâncias

Q1. Compare o sucesso da germinação de sementes nos dois tipos de areia, utilizando os dados da tabela_1.

R. Então, podemos comparar com um anova (assumindo que as vars são homogêneas nos diferentes níveis e que a normalidade dos resíduos está ok). Olhando para os resíduos com plot(modelo) parece estar tudo ok.

Não há diferença entre os tipos de areia em relação ao sucesso de germinação. Podemos ver isso nos resultados em formato de anova, modelo linear ou mesmo um teste-t. Claro, já sabiamos que não havia diferença entre areais pois quando criamos os dados germi<-c(round(rnorm(10,5,2),2),round(rnorm(10,6,4),2)) colocamos uma diferença muito pequena (1) entre as médias. Então, tudo ok.

##             Df Sum Sq Mean Sq F value Pr(>F)
## areias       1   8.37   8.372   0.755  0.396
## Residuals   18 199.63  11.091
## 
## Call:
## lm(formula = germi ~ areias)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -3.924 -1.893 -0.374  1.393 10.132 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)       4.234      1.053   4.020 0.000802 ***
## areiasvermelha    1.294      1.489   0.869 0.396372    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.33 on 18 degrees of freedom
## Multiple R-squared:  0.04025,    Adjusted R-squared:  -0.01307 
## F-statistic: 0.7549 on 1 and 18 DF,  p-value: 0.3964
## 
##  Welch Two Sample t-test
## 
## data:  germi[areias == "branca"] and germi[areias == "vermelha"]
## t = -0.86884, df = 12.738, p-value = 0.401
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -4.51826  1.93026
## sample estimates:
## mean of x mean of y 
##     4.234     5.528

Q2. Compare o sucesso da germinação de sementes nos quatro tipos de areia, utilizando os dados da tabela_2.

OBS: Atente para os pressupostos da análise escolhida.

R: Aqui, começamos com o pressuposto de vars homegênas

## 
##  Fligner-Killeen test of homogeneity of variances
## 
## data:  germi by areias
## Fligner-Killeen:med chi-squared = 52.758, df = 3, p-value = 2.064e-11

Tá ruim! Há diferenças entre as variâncias e são significativas. Podemos rodar a análise ver os resíduos

## 
## Call:
## lm(formula = germi ~ areias)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -13.1462  -2.7907  -0.3398   2.0320  19.1537 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     13.4262     0.8072  16.633  < 2e-16 ***
## areiasbranca    -9.2537     1.1416  -8.106 1.43e-13 ***
## areiasrosa      -5.2510     1.1416  -4.600 8.70e-06 ***
## areiasvermelha  -7.6792     1.1416  -6.727 3.10e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.105 on 156 degrees of freedom
## Multiple R-squared:  0.3259, Adjusted R-squared:  0.3129 
## F-statistic: 25.14 on 3 and 156 DF,  p-value: 2.53e-13

##              Df Sum Sq Mean Sq F value   Pr(>F)    
## areias        3   1966   655.2   25.14 2.53e-13 ***
## Residuals   156   4066    26.1                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Ainda ruim. Notem que no resultado do plot vemos um dos níveis bem diferente dos outros. Podemos melhorar isso, uzando o log da variável resposta.

##              Df Sum Sq Mean Sq F value   Pr(>F)    
## areias        3  26.31   8.771   17.66 6.42e-10 ***
## Residuals   156  77.49   0.497                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Ou ainda, colocando pesos para a nossa variável resposta, uma maneira de corrigir as diferenças de var.

##    amarela     branca       rosa   vermelha 
## 0.01372188 0.30010538 0.10011120 0.05537592
## [1] 0.01372188 0.30010538 0.10011120 0.05537592

##              Df Sum Sq Mean Sq F value   Pr(>F)    
## areias        3  84.43   28.14   28.14 1.33e-14 ***
## Residuals   156 156.00    1.00                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Vejam como os resultados de plot melhoraram. Notem que a distribuição dos resíduos é ainda melhor qdo usamos “pesos”.

Q3(a) Qual o possível efeito da germinação de sementes e do tipo de areia na abundância de herbívoros (herbi: tabela_3)?

Q3(b) Podemos obter efeitos independentes para cada variável explicativa? Como?

OBS: Atente para o tipo de variável explicativa.

##   germi areias herbi
## 1 12.59 branca 33.40
## 2 15.55 branca 44.01
## 3 17.17 branca 46.02
## 4 10.31 branca 34.16
## 5 15.86 branca 49.98
## 6 16.01 branca 52.02
##      germi            areias       herbi      
##  Min.   : 8.78   amarela :40   Min.   :10.01  
##  1st Qu.:13.91   branca  :40   1st Qu.:42.76  
##  Median :16.98   rosa    :40   Median :52.99  
##  Mean   :18.56   vermelha:40   Mean   :53.21  
##  3rd Qu.:23.54                 3rd Qu.:62.84  
##  Max.   :32.36                 Max.   :83.54

Aqui passamos a uma análise mais complexa e precisamos ter atenção com as variáveis explicativas, são duas e de tipos diferentes. Como elas são colocadas no modelo afeta o resultado do modelo.

##              Df Sum Sq Mean Sq F value Pr(>F)    
## areias        3  14995    4998   73.61 <2e-16 ***
## germi         1   5829    5829   85.84 <2e-16 ***
## Residuals   155  10525      68                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##              Df Sum Sq Mean Sq F value Pr(>F)    
## germi         1  20711   20711 305.002 <2e-16 ***
## areias        3    112      37   0.552  0.648    
## Residuals   155  10525      68                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R. (a) e (b) podem ser respondidas com osummary.aov. Que nos informe o quanto da variabilidade total presente na variável resposta pode ser atribuída a cada variável explicativa. Percebam que se considerarmos a variável contínua antes, o resultado muda.

Se nos interessarem diferenças entre os níveis da variável categoria “tipo de areia” podemos utilizar summary, ou seja tratar o modelo como um (g)lm. Nesta caso a ordem com que colocamos as variáveis explicativas não afeta os resultados (vejam os valores estimados para os parâmetros - lembrando que são mostrados contrastes, i.e. diferenças entre valores estimados).

Resumindo, mesmo havendo diferenças significativas entre substratos diferentes (ver resultado de summary.aov(ancovis)e o gráfico), a variável germinação parece ter o maior efeito sobre herbivoria.

## 
## Call:
## lm(formula = herbi ~ areias + germi, na.action = "na.fail")
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -27.9726  -4.7562   0.2882   4.1023  23.4832 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     17.4084     3.9158   4.446 1.66e-05 ***
## areiasbranca     0.1350     2.0201   0.067    0.947    
## areiasrosa       2.9836     2.4335   1.226    0.222    
## areiasvermelha   1.0223     1.9151   0.534    0.594    
## germi            1.8728     0.2021   9.265  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8.24 on 155 degrees of freedom
## Multiple R-squared:  0.6643, Adjusted R-squared:  0.6556 
## F-statistic: 76.66 on 4 and 155 DF,  p-value: < 2.2e-16
## 
## Call:
## lm(formula = herbi ~ germi + areias, na.action = "na.fail")
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -27.9726  -4.7562   0.2882   4.1023  23.4832 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     17.4084     3.9158   4.446 1.66e-05 ***
## germi            1.8728     0.2021   9.265  < 2e-16 ***
## areiasbranca     0.1350     2.0201   0.067    0.947    
## areiasrosa       2.9836     2.4335   1.226    0.222    
## areiasvermelha   1.0223     1.9151   0.534    0.594    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8.24 on 155 degrees of freedom
## Multiple R-squared:  0.6643, Adjusted R-squared:  0.6556 
## F-statistic: 76.66 on 4 and 155 DF,  p-value: < 2.2e-16
## Fixed term is "(Intercept)"
## Global model call: lm(formula = herbi ~ areias + germi, na.action = "na.fail")
## ---
## Model selection table 
##   (Intrc) areis germi df   logLik   AICc  delta weight
## 3   15.65       2.023  3 -562.789 1131.7   0.00  0.913
## 4   17.41     + 1.873  6 -561.939 1136.4   4.69  0.087
## 2   51.62     +        5 -597.196 1204.8  73.05  0.000
## 1   53.21              2 -649.251 1302.6 170.85  0.000
## Models ranked by AICc(x)

Lembrando sempre de checar os resíduos…Está tudo ok.