Os dados que se seguem (Steel e Torrie, 1980) referem-se ao peso médio (\(\color{red}{\text{X}}\)) de 50 galinhas e consumo de alimentos (\(\color{red}{\text{Y}}\)), para 10 linhagens White Leghorn.
X <- c(4.6,5.1,4.8, 4.4, 5.9, 4.7, 5.1, 5.2, 4.9, 5.1)
Y <- c(87.1, 93.1, 89.8, 91.4, 99.5, 92.1, 95.5, 99.3, 93.4, 94.4)
plot(Y~X)
{}
Sabe-se que \(\color{red}{\text{X}}\) e \(\color{red}{\text{Y}}\) são, respectivamente, as variáveis preditora e resposta. A função lm fornece o ajuste de um modelo de regressão linear de primeira ordem: \(Y = \beta_0 + \beta_1X + \epsilon\), onde \(\color{blue}{\text{$\beta_0$}}\) e \(\color{blue}{\text{$\beta_1$}}\) são parâmetros desconhecidos e \(\color{blue}{\text{$\epsilon$}}\) é o erro aleatório.
ajuste<-lm(Y~X)
summary(ajuste)
##
## Call:
## lm(formula = Y ~ X)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.5378 -1.3208 0.1862 0.9362 4.0482
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 55.263 9.535 5.796 0.000407 ***
## X 7.690 1.909 4.029 0.003794 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.366 on 8 degrees of freedom
## Multiple R-squared: 0.6699, Adjusted R-squared: 0.6286
## F-statistic: 16.23 on 1 and 8 DF, p-value: 0.003794
Logo, a equação da reta ajustada é dada por \(\color{green}{\text{$\hat{Y}=55.26+7.69X$}}\) e o diagrama de dispersão para as variáveis em estudo é construído com a execução do comando:
plot(Y~X)
abline(lm(Y~X))
Pode-se calcular os intervalos de confiança para \(\color{blue}{\text{$\beta_0$}}\) e \(\color{blue}{\text{$\beta_1$}}\) utilizando a seguinte função:
confint(ajuste)
## 2.5 % 97.5 %
## (Intercept) 33.275785 77.25078
## X 3.288554 12.09165