Q1. Compare o sucesso da germinação de sementes nos dois tipos de areia, utilizando os dados da tabela_1.
set.seed(1234)
germi<-c(round(rnorm(10,5,2),2),round(rnorm(10,6,4),2))
areias<-c(rep("branca",10),rep("vermelha",10))
as.factor(areias)->areias
data.frame(germi,areias)->tabela_1
write.table(tabela_1,"tabela_1.txt",sep="\t",row.names=FALSE)R. Então, podemos comparar com um anova (assumindo que as vars são homogêneas nos diferentes níveis e que a normalidade dos resíduos está ok). Olhando para os resíduos com
plot(modelo)parece estar tudo ok.
Não há diferença entre os tipos de areia em relação ao sucesso de germinação. Podemos ver isso nos resultados em formato de anova, modelo linear ou mesmo um teste-t. Claro, já sabiamos que não havia diferença entre areais pois quando criamos os dados
germi<-c(round(rnorm(10,5,2),2),round(rnorm(10,6,4),2))colocamos uma diferença muito pequena (1) entre as médias. Então, tudo ok.
## Df Sum Sq Mean Sq F value Pr(>F)
## areias 1 8.37 8.372 0.755 0.396
## Residuals 18 199.63 11.091
##
## Call:
## lm(formula = germi ~ areias)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.924 -1.893 -0.374 1.393 10.132
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.234 1.053 4.020 0.000802 ***
## areiasvermelha 1.294 1.489 0.869 0.396372
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.33 on 18 degrees of freedom
## Multiple R-squared: 0.04025, Adjusted R-squared: -0.01307
## F-statistic: 0.7549 on 1 and 18 DF, p-value: 0.3964
##
## Welch Two Sample t-test
##
## data: germi[areias == "branca"] and germi[areias == "vermelha"]
## t = -0.86884, df = 12.738, p-value = 0.401
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -4.51826 1.93026
## sample estimates:
## mean of x mean of y
## 4.234 5.528
Q2. Compare o sucesso da germinação de sementes nos quatro tipos de areia, utilizando os dados da tabela_2.
OBS: Atente para os pressupostos da análise escolhida.
set.seed(1234)
germi<-c(abs(round(rnorm(40,5,2),2)),abs(round(rnorm(40,6,4),2)),abs(round(rnorm(40,8,4),2)),abs(round(rnorm(40,12,10),2)))
areias<-c(rep("branca",40),rep("vermelha",40),rep("rosa",40),rep("amarela",40))
as.factor(areias)->areias
data.frame(germi,areias)->tabela_2
write.table(tabela_2,"tabela_2.txt",sep="\t",row.names=FALSE)R: Aqui, começamos com o pressuposto de vars homegênas
##
## Fligner-Killeen test of homogeneity of variances
##
## data: germi by areias
## Fligner-Killeen:med chi-squared = 52.758, df = 3, p-value = 2.064e-11
Tá ruim! Há diferenças entre as variâncias e são significativas. Podemos rodar a análise ver os resíduos
##
## Call:
## lm(formula = germi ~ areias)
##
## Residuals:
## Min 1Q Median 3Q Max
## -13.1462 -2.7907 -0.3398 2.0320 19.1537
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 13.4262 0.8072 16.633 < 2e-16 ***
## areiasbranca -9.2537 1.1416 -8.106 1.43e-13 ***
## areiasrosa -5.2510 1.1416 -4.600 8.70e-06 ***
## areiasvermelha -7.6792 1.1416 -6.727 3.10e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.105 on 156 degrees of freedom
## Multiple R-squared: 0.3259, Adjusted R-squared: 0.3129
## F-statistic: 25.14 on 3 and 156 DF, p-value: 2.53e-13
## Df Sum Sq Mean Sq F value Pr(>F)
## areias 3 1966 655.2 25.14 2.53e-13 ***
## Residuals 156 4066 26.1
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ainda ruim. Notem que no resultado do
plotvemos um dos níveis bem diferente dos outros. Podemos melhorar isso, uzando o log da variável resposta.
## Df Sum Sq Mean Sq F value Pr(>F)
## areias 3 26.31 8.771 17.66 6.42e-10 ***
## Residuals 156 77.49 0.497
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ou ainda, colocando pesos para a nossa variável resposta, uma maneira de corrigir as diferenças de var.
## amarela branca rosa vermelha
## 0.01372188 0.30010538 0.10011120 0.05537592
## [1] 0.01372188 0.30010538 0.10011120 0.05537592
c(rep(pesos[2],40),rep(pesos[4],40),rep(pesos[3],40),rep(pesos[1],40))->pesos
cbind(tabela_2,pesos)->tabela_2
lm(germi~areias,weights=pesos)->aov3
par(mfrow=c(2,2))
plot(aov3)## Df Sum Sq Mean Sq F value Pr(>F)
## areias 3 84.43 28.14 28.14 1.33e-14 ***
## Residuals 156 156.00 1.00
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Vejam como os resultados de
plotmelhoraram. Notem que a distribuição dos resíduos é ainda melhor qdo usamos “pesos”.
Q3(a) Qual o possível efeito da germinação de sementes e do tipo de areia na abundância de herbívoros (herbi: tabela_3)?
Q3(b) Podemos obter efeitos independentes para cada variável explicativa? Como?
OBS: Atente para o tipo de variável explicativa.
set.seed(1234)
germi<-c(round(rnorm(40,15,2),2),round(rnorm(40,16,4),2),round(rnorm(40,26,3),2),round(rnorm(40,18,4),2))
areias<-c(rep("branca",40),rep("vermelha",40),rep("rosa",40),rep("amarela",40))
alpha<-15
beta1<-2
erro<-rnorm(160,0,8)
herbi<-alpha+(beta1*germi)+erro
herbi<-round(herbi,2)
as.factor(areias)->areias
data.frame(germi,areias,herbi)->tabela_3
head(tabela_3)## germi areias herbi
## 1 12.59 branca 33.40
## 2 15.55 branca 44.01
## 3 17.17 branca 46.02
## 4 10.31 branca 34.16
## 5 15.86 branca 49.98
## 6 16.01 branca 52.02
## germi areias herbi
## Min. : 8.78 amarela :40 Min. :10.01
## 1st Qu.:13.91 branca :40 1st Qu.:42.76
## Median :16.98 rosa :40 Median :52.99
## Mean :18.56 vermelha:40 Mean :53.21
## 3rd Qu.:23.54 3rd Qu.:62.84
## Max. :32.36 Max. :83.54
Aqui passamos a uma análise mais complexa e precisamos ter atenção com as variáveis explicativas, são duas e de tipos diferentes. Como elas são colocadas no modelo afeta o resultado do modelo.
lm(herbi~areias+germi,na.action = "na.fail")->ancovis
lm(herbi~germi+areias,na.action = "na.fail")->ancovos
summary.aov(ancovis)## Df Sum Sq Mean Sq F value Pr(>F)
## areias 3 14995 4998 73.61 <2e-16 ***
## germi 1 5829 5829 85.84 <2e-16 ***
## Residuals 155 10525 68
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Df Sum Sq Mean Sq F value Pr(>F)
## germi 1 20711 20711 305.002 <2e-16 ***
## areias 3 112 37 0.552 0.648
## Residuals 155 10525 68
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
R. (a) e (b) podem ser respondidas com o
summary.aov. Que nos informe o quanto da variabilidade total presente na variável resposta pode ser atribuída a cada variável explicativa. Percebam que se considerarmos a variável contínua antes, o resultado muda.
Se nos interessarem diferenças entre os níveis da variável categoria “tipo de areia” podemos utilizar
summary, ou seja tratar o modelo como um (g)lm. Nesta caso a ordem com que colocamos as variáveis explicativas não afeta os resultados (vejam os valores estimados para os parâmetros - lembrando que são mostrados contrastes, i.e. diferenças entre valores estimados).
Resumindo, mesmo havendo diferenças significativas entre substratos diferentes (ver resultado de
summary.aov(ancovis)e o gráfico), a variável germinação parece ter o maior efeito sobre herbivoria.
##
## Call:
## lm(formula = herbi ~ areias + germi, na.action = "na.fail")
##
## Residuals:
## Min 1Q Median 3Q Max
## -27.9726 -4.7562 0.2882 4.1023 23.4832
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 17.4084 3.9158 4.446 1.66e-05 ***
## areiasbranca 0.1350 2.0201 0.067 0.947
## areiasrosa 2.9836 2.4335 1.226 0.222
## areiasvermelha 1.0223 1.9151 0.534 0.594
## germi 1.8728 0.2021 9.265 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 8.24 on 155 degrees of freedom
## Multiple R-squared: 0.6643, Adjusted R-squared: 0.6556
## F-statistic: 76.66 on 4 and 155 DF, p-value: < 2.2e-16
##
## Call:
## lm(formula = herbi ~ germi + areias, na.action = "na.fail")
##
## Residuals:
## Min 1Q Median 3Q Max
## -27.9726 -4.7562 0.2882 4.1023 23.4832
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 17.4084 3.9158 4.446 1.66e-05 ***
## germi 1.8728 0.2021 9.265 < 2e-16 ***
## areiasbranca 0.1350 2.0201 0.067 0.947
## areiasrosa 2.9836 2.4335 1.226 0.222
## areiasvermelha 1.0223 1.9151 0.534 0.594
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 8.24 on 155 degrees of freedom
## Multiple R-squared: 0.6643, Adjusted R-squared: 0.6556
## F-statistic: 76.66 on 4 and 155 DF, p-value: < 2.2e-16
## Fixed term is "(Intercept)"
## Global model call: lm(formula = herbi ~ areias + germi, na.action = "na.fail")
## ---
## Model selection table
## (Intrc) areis germi df logLik AICc delta weight
## 3 15.65 2.023 3 -562.789 1131.7 0.00 0.913
## 4 17.41 + 1.873 6 -561.939 1136.4 4.69 0.087
## 2 51.62 + 5 -597.196 1204.8 73.05 0.000
## 1 53.21 2 -649.251 1302.6 170.85 0.000
## Models ranked by AICc(x)
Lembrando sempre de checar os resíduos…Está tudo ok.