데이터 mtcars에서 자동차의 중량(wt)이 연료 효율(mpg)에 미치는 영향을 선형회귀 분석법으로 설명하세요. 1. 데이터 불러오기 2. 독립변수와 종속변수는 무엇인가? 3. 선형회귀 모형 생성 (lm 함수) 4. 선형회귀 모형 출력하고 결과 해석 (summary 함수) à 두 변수 간 관계가 통계적으로 유의한가? 관계가 어떠한가? 5. 산점도와 회귀선 그리기
dat <- mtcars
독립변수: 자동차의 중량(wt) 종속변수: 연료 효율(mpg)
model <- lm(mpg ~ wt, data = dat)
summary(model)
##
## Call:
## lm(formula = mpg ~ wt, data = dat)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
wt의 p-value는 1.29e-10이므로 두 변수 간 관계가 통계적으로 유의하다고 볼수 있다. 즉 wt의 회귀계수는 0이 아니다라고 볼 수 있다. wt의 회귀계수가 -5.34이므로 두 변수 사이에는 음의 상관성이 존재한다. 또한 R-squared의 값이 0.6이므로 회귀선이 데이터를 어느정도 잘 설명하고 있다고 볼 수 있다.
plot(dat$wt, dat$mpg,
main = "중량과 연료 효율",
xlab = "중량 (1000 lbs)",
ylab = "연료 효율 (mpg)")
abline(model, col = "red")
데이터 ToothGrowth는 오렌지 주스(OJ)와 비타민C (VC)를 다양한 농도(dose)로 섭취하였을 때 치아 모세포 (odontoblast)의 길 이(len)에 미치는 영향에 관한 데이터이다. 섭취 농도(dose)가 치아 모세포 길이(len)에 미치는 영향을 선형회귀 분석법으로 설명하세요. 1. 데이터 불러오기 2. 독립변수와 종속변수는 무엇인가? 3. 선형회귀 모형 생성 (lm 함수) 4. 선형회귀 모형 출력하고 결과 해석 (summary 함수) à 두 변수 간 관계가 통계적으로 유의한가? 관계가 어떠한가? 5. 산점도와 회귀선 그리기
dat <- ToothGrowth
독립변수: 섭취 농도(dose) 종속변수: 치아 모세포 길이(len)
model <- lm(len ~ dose, data = ToothGrowth)
summary(model)
##
## Call:
## lm(formula = len ~ dose, data = ToothGrowth)
##
## Residuals:
## Min 1Q Median 3Q Max
## -8.4496 -2.7406 -0.7452 2.8344 10.1139
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.4225 1.2601 5.89 2.06e-07 ***
## dose 9.7636 0.9525 10.25 1.23e-14 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.601 on 58 degrees of freedom
## Multiple R-squared: 0.6443, Adjusted R-squared: 0.6382
## F-statistic: 105.1 on 1 and 58 DF, p-value: 1.233e-14
dose의 p-value는 1.23e-14이므로 두 변수 간 관계가 통계적으로 유의하다고 볼수 있다. 즉 dose의 회귀계수는 0이 아니다라고 볼 수 있다. wt의 회귀계수가 9.76이므로 두 변수 사이에는 양의 상관성이 존재한다. 또한 R-squared의 값이 0.6이므로 회귀선이 데이터를 어느정도 잘 설명하고 있다고 볼 수 있다.
plot(dat$dose, dat$len,
main = "섭취 농도에 따른 치아 모세포 길이",
xlab = "섭취 농도 (dose)",
ylab = "치아 모세포 길이 (len)")
abline(model, col = "red")