Análise de Regressão

Os dados que se seguem (Steel e Torrie, 1980) referem-se ao peso médio (\(\color{red}{\text{X}}\)) de 50 galinhas e consumo de alimentos (\(\color{red}{\text{Y}}\)), para 10 linhagens White Leghorn.

X <- c(4.6,5.1,4.8, 4.4, 5.9, 4.7, 5.1, 5.2, 4.9, 5.1)
Y <- c(87.1, 93.1, 89.8, 91.4, 99.5, 92.1, 95.5, 99.3, 93.4, 94.4)

O gráfico de dispersão dos dados é dado por:

  1. Usando a função plot.
plot(Y~X)

  1. Adicionando a figura.

Gráfico de dispersão.{}

Sabe-se que \(\color{red}{\text{X}}\) e \(\color{red}{\text{Y}}\) são, respectivamente, as variáveis preditora e resposta. A função lm fornece o ajuste de um modelo de regressão linear de primeira ordem: \(Y = \beta_0 + \beta_1X + \epsilon\), onde \(\color{blue}{\text{$\beta_0$}}\) e \(\color{blue}{\text{$\beta_1$}}\) são parâmetros desconhecidos e \(\color{blue}{\text{$\epsilon$}}\) é o erro aleatório.

ajuste<-lm(Y~X)
summary(ajuste)
## 
## Call:
## lm(formula = Y ~ X)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.5378 -1.3208  0.1862  0.9362  4.0482 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   55.263      9.535   5.796 0.000407 ***
## X              7.690      1.909   4.029 0.003794 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.366 on 8 degrees of freedom
## Multiple R-squared:  0.6699, Adjusted R-squared:  0.6286 
## F-statistic: 16.23 on 1 and 8 DF,  p-value: 0.003794

Logo, a equação da reta ajustada é dada por \(\color{green}{\text{$\hat{Y}=55.26+7.69X$}}\) e o diagrama de dispersão para as variáveis em estudo é construído com a execução do comando:

plot(Y~X)
abline(lm(Y~X))

Pode-se calcular os intervalos de confiança para \(\color{blue}{\text{$\beta_0$}}\) e \(\color{blue}{\text{$\beta_1$}}\) utilizando a seguinte função:

confint(ajuste)
##                 2.5 %   97.5 %
## (Intercept) 33.275785 77.25078
## X            3.288554 12.09165