Q) 데이터 mtcars에서 자동차의 중량(wt)와 연료 효율(mpg)의 관계를
선형회귀분석법으로 설명하시오.
dat <- mtcars
head(dat)
## mpg cyl disp hp drat wt qsec vs am gear carb
## Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
## Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
## Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
## Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
## Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
## Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
선형회귀 모형 생성하여 model 객체에 담기
- p value는 1.788e-07, r-squared : 0.6024 (별로 안맞음)
model_1 <- lm(mpg ~ wt, data = dat)
summary(model_1)
##
## Call:
## lm(formula = mpg ~ wt, data = dat)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
- 산점도와 회귀선 그리기
- 결과: b1의 기울기 즉, p value가 1.788e-07, (0.05보다 작기 때문에) H0
기각한다.
- wt와 mpg는 서로 correlation이 없다고 판단 할 수 없다.
plot(dat$wt, dat$mpg, main = "Scatter plot of wt vs mpg with Regression Line",
xlab = "weight of cars (wt)", ylab = "Miles Per Gallons(mpg)")
abline(model_1, col = "red")
