Para este exercício, imaginemos que temos um grupo de insetos (ex. libélulas) que variam bastante no comprimento de suas asas. Formulamos uma hipótese de que animais com asas maiores tem maior capacidade de dispersão. A previsão é que deveria existir uma correlação positiva entre o tamanho da asa e o quanto uma espécie é capaz de dispersar.

Primeiro coletamos os dados de 8 espécies.

Temos as espécies de A até E e as características X e Y. O primeiro passo sempre deve ser plotar os dados

X<-c(10,6 ,3,2, 7)
Y<-c(23,11,7,5,12)
dat<-data.frame(X,Y)
rownames(dat)<-c("A","B","C","D","E")
plot(dat$Y ~ dat$X)

Ou, se quisermos já começar a aprender a deixar os gráficos mais arrumados:

plot(dat$Y ~ dat$X, xlab="Tamanho da asa (cm)", ylab="Distância de dispersão (km)", main="Meu lindo gráfico")

Agora vamos testar com o teste de correlação:

cor.test(dat$Y, dat$X)
## 
##  Pearson's product-moment correlation
## 
## data:  dat$Y and dat$X
## t = 6.0362, df = 3, p-value = 0.009117
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.5195237 0.9975289
## sample estimates:
##      cor 
## 0.961211

O valor de p é muito baixo, o que sugere que essa aparente relação entre as duas variáveis não é por acaso.

Caso nossa hipótese sugira que o tamanho da asa é que influencia a capacidade de dispersão (e não o contrário), fazemos um teste de regressão.

res<-lm(dat$Y ~ dat$X)
summary(res)
## 
## Call:
## lm(formula = dat$Y ~ dat$X)
## 
## Residuals:
##       1       2       3       4       5 
##  2.1942 -1.4369  0.8398  0.9320 -2.5291 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)   
## (Intercept)  -0.1165     2.1812  -0.053  0.96076   
## dat$X         2.0922     0.3466   6.036  0.00912 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.225 on 3 degrees of freedom
## Multiple R-squared:  0.9239, Adjusted R-squared:  0.8986 
## F-statistic: 36.44 on 1 and 3 DF,  p-value: 0.009117

Podemos incluir a reta da regressão no próprio gráfico.

plot(dat$Y ~ dat$X, xlab="Tamanho da asa (cm)", ylab="Distância de dispersão (km)", main="Meu lindo gráfico")
abline(res)

Exercício para a próxima aula.

  1. Formule uma hipótese sobre algum fenômeno que você gostaria de explicar. Neste caso, pense em algo que trate de variáveis contínuas para que o tese possa utilizar métodos como correlação ou regressão linear.
  2. Que previsão você poderia fazer a partir desta hipótese?
  3. Obtenha dados (se isso não for possível, use dados fictícios) e teste a sua hipótese.
  4. Entregue um texto breve (incluindo gráficos, se preferir) onde você relata os passos acima.