과제 1

Q) 데이터 mtcars에서 자동차의 중량(wt)와 연료 효율(mpg)의 관계를 선형회귀분석법으로 설명하시오.

  • 데이터 불러오기
dat <- mtcars
head(dat)
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

선형회귀 모형 생성하여 model 객체에 담기

  • p value는 1.788e-07, r-squared : 0.6024 (별로 안맞음)
model_1 <- lm(mpg ~ wt, data = dat)
summary(model_1)
## 
## Call:
## lm(formula = mpg ~ wt, data = dat)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10
  • 산점도와 회귀선 그리기
  • 결과: b1의 기울기 즉, p value가 1.788e-07, (0.05보다 작기 때문에) H0 기각한다.
  • wt와 mpg는 서로 correlation이 없다고 판단 할 수 없다.
plot(dat$wt, dat$mpg, main = "Scatter plot of wt vs mpg with Regression Line", 
     xlab = "weight of cars (wt)", ylab = "Miles Per Gallons(mpg)")
abline(model_1, col = "red")