과제 1

데이터 mtcars에서 자동차의 중량(wt)이 연료 효율(mpg)에 미치는 영향을 선형회귀 분석법으로 설명하세요.
1. 데이터 불러오기

head(mtcars)
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
  1. 독립변수와 종속변수는 무엇인가?
독립변수 종속변수
wt(자동차의 중량) mpg(연료 효율)
  1. 선형회귀 모형 생성 (lm 함수)

  2. 선형회귀 모형 출력하고 결과 해석 (summary 함수) à 두 변수 간 관계가 통계적으로 유의한가? 관계가 어떠한가?

summary(lm_mtcars)
## 
## Call:
## lm(formula = mpg ~ wt, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5432 -2.3647 -0.1252  1.4096  6.8727 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  37.2851     1.8776  19.858  < 2e-16 ***
## wt           -5.3445     0.5591  -9.559 1.29e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.046 on 30 degrees of freedom
## Multiple R-squared:  0.7528, Adjusted R-squared:  0.7446 
## F-statistic: 91.38 on 1 and 30 DF,  p-value: 1.294e-10

wt의 p-value가 1.294e-10로 매우 작아, 통계적으로 유의미한 관계임을 확인할 수 있습니다. R-squared 값이 0.7446로, wt가 mpg의 약 75%의 변동성을 설명하고 있습니다. 이는 매우 높은 설명력으로, 중량(wt)이 연료 효율(mpg)에 강한 영향을 미친다고 볼 수 있습니다.

wt의 계수(Estimate)는 약 -5.3445로, 자동차 중량(wt)이 증가할수록 연료 효율(mpg)이 감소하는 경향이 있음을 보여줍니다.

  1. 산점도와 회귀선 그리기
plot(mtcars$wt, mtcars$mpg, 
     main = "중량(wt) vs 연료 효율(mpg)",
     xlab = "중량 (wt)", 
     ylab = "연료 효율 (mpg)", 
     pch = 16, col = "blue")

abline(lm_mtcars, col = "red", lwd = 2)

과제 2

데이터 ToothGrowth는 오렌지 주스(OJ)와 비타민C (VC)를 다양한 농도(dose)로 섭취하였을 때 치아 모세포 (odontoblast)의 길 이(len)에 미치는 영향에 관한 데이터이다.
섭취 농도(dose)가 치아 모세포 길이(len)에 미치는 영향을 선형회귀 분석법으로 설명하세요.
1. 데이터 불러오기

head(ToothGrowth)
##    len supp dose
## 1  4.2   VC  0.5
## 2 11.5   VC  0.5
## 3  7.3   VC  0.5
## 4  5.8   VC  0.5
## 5  6.4   VC  0.5
## 6 10.0   VC  0.5
  1. 독립변수와 종속변수는 무엇인가?
독립변수 종속변수
dose(섭취 농도) len (치아 모세포 길이)
  1. 선형회귀 모형 생성 (lm 함수)

  2. 선형회귀 모형 출력하고 결과 해석 (summary 함수) à 두 변수 간 관계가 통계적으로 유의한가? 관계가 어떠한가?

summary(lm_tooth)
## 
## Call:
## lm(formula = len ~ dose, data = ToothGrowth)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.4496 -2.7406 -0.7452  2.8344 10.1139 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   7.4225     1.2601    5.89 2.06e-07 ***
## dose          9.7636     0.9525   10.25 1.23e-14 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.601 on 58 degrees of freedom
## Multiple R-squared:  0.6443, Adjusted R-squared:  0.6382 
## F-statistic: 105.1 on 1 and 58 DF,  p-value: 1.233e-14

독립변수 dose의 p-value: 1.233e-14 (0.05보다 작음) → 통계적으로 유의함. R-squared 값: 0.6382 → dose가 len의 변동을 63.82% 설명함.

회귀 계수 (slope): 양수 → dose가 증가할수록 len이 증가하는 경향을 보이며, 통계적으로 유의한 관계임.

  1. 산점도와 회귀선 그리기
plot(ToothGrowth$dose, ToothGrowth$len, main="섭취 농도(dose) vs 치아 모세포 길이(len)",
     xlab="섭취 농도 (dose)", ylab="치아 모세포 길이 (len)", pch=16, col="blue")

abline(lm_tooth, col="red", lwd=2)