Aula 8

Prof. Lorenzo Zanette -





Como analisamos relações entre duas variáveis contínuas?

A regressão para a média (de K. Pearson)

Regression towards mediocrity in hereditary stature



Problema 1 : definir relação causa e efeito



Problema 0 : Definir variáveis e relação entre variáveis

No mundo real, em geral…

Ou ainda multivariadamente pior:




Um exemplo: herbívoros x predadores

##  [1] 13.34 25.22 31.68  4.23 26.43 27.05 18.40 18.63 18.48 15.88
##  [1]  59.36  89.77 111.36  37.45 112.99 104.14  74.20  70.87  71.18  95.90
## 
##  Pearson's product-moment correlation
## 
## data:  herbivoros and predadores
## t = 5.9282, df = 8, p-value = 0.0003504
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.6321222 0.9769825
## sample estimates:
##       cor 
## 0.9025378

No entanto, não inferimos sobre causalidade…

Mas, se construíssemos um modelo para testar um relação linear possível?

variável resposta ~ variável explicativa

predadores ~ herbívoros

“Traduzindo” se predadores são y e herbívoros são x , a relação entre eles pode ser aproximada por algo parecido com:

y = a + bx + erro

Lembram!!!

Precisamos estimar valores de b e a

Mas e o b, o b…o grande b

## [1] 1579.556
## [1] 571.4448
## [1] 2.764144

Temos b, falta a

Tomemos um atalho: se y = a + bx

## [1] 27.62155

Agora faltam os outros valores para formar a reta:

##  [1]  64.49523  97.33327 115.18964  39.31388 100.67788 102.39165  78.48180
##  [8]  79.11756  78.70293  71.51616

Agora tomemos o caminho mais curto…

Um modelo linear no R:

Testamos a normalidade para ficar em uma regressão simples:

E finalmente…

## (Intercept)  herbivoros 
##   27.621554    2.764144

## 
## Call:
## lm(formula = predadores ~ herbivoros)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.2476 -6.9260 -4.0557  0.8453 24.3838 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  27.6216     9.9405   2.779  0.02397 *  
## herbivoros    2.7641     0.4663   5.928  0.00035 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 11.15 on 8 degrees of freedom
## Multiple R-squared:  0.8146, Adjusted R-squared:  0.7914 
## F-statistic: 35.14 on 1 and 8 DF,  p-value: 0.0003504

E jamais, esqueçam de olhar para os resíduos…eles é que precisam ser normais e sem padrões

Para ver mesmo…simulemos um amostra enorme!!!

## (Intercept)  herbivoros 
##   22.946362    3.025908

Cuidado com a joaninhas