데이터 mtcars에서 자동차의 중량(wt)이 연료 효율(mpg)에 미치는
영향을 선형회귀 분석법으로 설명하세요.
1. 데이터
불러오기
head(mtcars)
## mpg cyl disp hp drat wt qsec vs am gear carb
## Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
## Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
## Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
## Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
## Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
## Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
| 독립변수 | 종속변수 |
|---|---|
| wt(자동차의 중량) | mpg(연료 효율) |
선형회귀 모형 생성 (lm 함수)
선형회귀 모형 출력하고 결과 해석 (summary 함수) à 두 변수 간 관계가 통계적으로 유의한가? 관계가 어떠한가?
summary(lm_mtcars)
##
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.5432 -2.3647 -0.1252 1.4096 6.8727
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.2851 1.8776 19.858 < 2e-16 ***
## wt -5.3445 0.5591 -9.559 1.29e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared: 0.7528, Adjusted R-squared: 0.7446
## F-statistic: 91.38 on 1 and 30 DF, p-value: 1.294e-10
wt의 p-value가 1.294e-10로 매우 작아, 통계적으로 유의미한 관계임을 확인할 수 있습니다. R-squared 값이 0.7446로, wt가 mpg의 약 75%의 변동성을 설명하고 있습니다. 이는 매우 높은 설명력으로, 중량(wt)이 연료 효율(mpg)에 강한 영향을 미친다고 볼 수 있습니다.
wt의 계수(Estimate)는 약 -5.3445로, 자동차 중량(wt)이 증가할수록 연료 효율(mpg)이 감소하는 경향이 있음을 보여줍니다.
plot(mtcars$wt, mtcars$mpg,
main = "중량(wt) vs 연료 효율(mpg)",
xlab = "중량 (wt)",
ylab = "연료 효율 (mpg)",
pch = 16, col = "blue")
abline(lm_mtcars, col = "red", lwd = 2)
데이터 ToothGrowth는 오렌지 주스(OJ)와 비타민C (VC)를 다양한
농도(dose)로 섭취하였을 때 치아 모세포 (odontoblast)의 길 이(len)에
미치는 영향에 관한 데이터이다.
섭취 농도(dose)가
치아 모세포 길이(len)에 미치는 영향을 선형회귀 분석법으로
설명하세요.
1. 데이터 불러오기
head(ToothGrowth)
## len supp dose
## 1 4.2 VC 0.5
## 2 11.5 VC 0.5
## 3 7.3 VC 0.5
## 4 5.8 VC 0.5
## 5 6.4 VC 0.5
## 6 10.0 VC 0.5
| 독립변수 | 종속변수 |
|---|---|
| dose(섭취 농도) | len (치아 모세포 길이) |
선형회귀 모형 생성 (lm 함수)
선형회귀 모형 출력하고 결과 해석 (summary 함수) à 두 변수 간 관계가 통계적으로 유의한가? 관계가 어떠한가?
summary(lm_tooth)
##
## Call:
## lm(formula = len ~ dose, data = ToothGrowth)
##
## Residuals:
## Min 1Q Median 3Q Max
## -8.4496 -2.7406 -0.7452 2.8344 10.1139
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.4225 1.2601 5.89 2.06e-07 ***
## dose 9.7636 0.9525 10.25 1.23e-14 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.601 on 58 degrees of freedom
## Multiple R-squared: 0.6443, Adjusted R-squared: 0.6382
## F-statistic: 105.1 on 1 and 58 DF, p-value: 1.233e-14
독립변수 dose의 p-value: 1.233e-14 (0.05보다 작음) → 통계적으로 유의함. R-squared 값: 0.6382 → dose가 len의 변동을 63.82% 설명함.
회귀 계수 (slope): 양수 → dose가 증가할수록 len이 증가하는 경향을 보이며, 통계적으로 유의한 관계임.
plot(ToothGrowth$dose, ToothGrowth$len, main="섭취 농도(dose) vs 치아 모세포 길이(len)",
xlab="섭취 농도 (dose)", ylab="치아 모세포 길이 (len)", pch=16, col="blue")
abline(lm_tooth, col="red", lwd=2)