# 1번 문제

# 데이터 확인
data(mtcars)

# 다중 선형회귀모형 적합
model <- lm(mpg ~ wt + hp + drat, data = mtcars)

# 회귀 결과 요약
summary(model)
## 
## Call:
## lm(formula = mpg ~ wt + hp + drat, data = mtcars)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.3598 -1.8374 -0.5099  0.9681  5.7078 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 29.394934   6.156303   4.775 5.13e-05 ***
## wt          -3.227954   0.796398  -4.053 0.000364 ***
## hp          -0.032230   0.008925  -3.611 0.001178 ** 
## drat         1.615049   1.226983   1.316 0.198755    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.561 on 28 degrees of freedom
## Multiple R-squared:  0.8369, Adjusted R-squared:  0.8194 
## F-statistic: 47.88 on 3 and 28 DF,  p-value: 3.768e-11
# 1. wt, hp, drat 중 어떤 변수가 통계적으로 유의미한가? 이유를 설명하시오. → wt와 hp는 유의수준 0.05보다 작으므로 통계적으로 유의미
# → drat은 p > 0.2로 유의하지 않음
# 2. 결정계수 0.84는 모형의 적합도를 어떻게 나타내는가?
# R² = 0.84는 mpg의 변동 중 약 84%가 wt, hp, drat에 의해 설명된다는 의미
# 3. F-검정 결과를 바탕으로 이 회귀모형의 전반적인 설명력을 해석하시오. p < 0.001 적어도 하나 이상의 설명변수가 종속변수에 유의미한 영향을 준다고 해석 가능

# 2번 문제

# 데이터 확인
data(iris)

# 다중 선형회귀모형 적합
model <- lm(Sepal.Length ~ Sepal.Width + Petal.Length + Petal.Width, data = iris)

# 회귀 결과 요약
summary(model)
## 
## Call:
## lm(formula = Sepal.Length ~ Sepal.Width + Petal.Length + Petal.Width, 
##     data = iris)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.82816 -0.21989  0.01875  0.19709  0.84570 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   1.85600    0.25078   7.401 9.85e-12 ***
## Sepal.Width   0.65084    0.06665   9.765  < 2e-16 ***
## Petal.Length  0.70913    0.05672  12.502  < 2e-16 ***
## Petal.Width  -0.55648    0.12755  -4.363 2.41e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.3145 on 146 degrees of freedom
## Multiple R-squared:  0.8586, Adjusted R-squared:  0.8557 
## F-statistic: 295.5 on 3 and 146 DF,  p-value: < 2.2e-16
# 1. Petal.Length, Petal.Width 변수는 어떤 점에서 유의미한가?
# → Petal.Length와 Petal.Width는 p < 0.05로 유의미
# 2. R² = 0.76은 이 회귀모형에 대해 어떤 해석을 가능하게 하는가?
# R² = 0.76은 Sepal.Length의 변동 중 76%가 설명된다는 뜻
# 3. 모형의 F-검정이 유의하다면, 이 회귀모형이 데이터에 얼마나 잘 맞는지 설명하시오. 종속변수(Sepal.Length)에 영향을 주는 설명변수가 존재한다는 것을 의미합니다.

# 3번문제

# 결측치 제거
data(airquality)
airquality_clean <- na.omit(airquality)

# 다중 선형회귀모형 적합
model <- lm(Ozone ~ Solar.R + Wind + Temp, data = airquality_clean)

# 회귀 결과 요약
summary(model)
## 
## Call:
## lm(formula = Ozone ~ Solar.R + Wind + Temp, data = airquality_clean)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -40.485 -14.219  -3.551  10.097  95.619 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -64.34208   23.05472  -2.791  0.00623 ** 
## Solar.R       0.05982    0.02319   2.580  0.01124 *  
## Wind         -3.33359    0.65441  -5.094 1.52e-06 ***
## Temp          1.65209    0.25353   6.516 2.42e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 21.18 on 107 degrees of freedom
## Multiple R-squared:  0.6059, Adjusted R-squared:  0.5948 
## F-statistic: 54.83 on 3 and 107 DF,  p-value: < 2.2e-16
# 1. Wind의 음의 회귀계수는 어떤 의미를 가지는가?
# → Wind의 계수가 음수 → 풍속이 클수록 오존 농도는 낮아지는 경향
# → Temp는 양수 → 기온이 높을수록 오존 농도가 높아짐
# 2. 결정계수 0.60은 회귀모형의 설명력을 어떻게 해석해야 하는가?
# R² = 0.60 → 오존 농도의 60%를 세 독립변수가 설명함
# 3. F-검정이 유의하다면, 이 모형의 유효성은 어떻게 판단할 수 있는가?
# p < 0.001 → 적어도 하나의 설명변수가 종속변수에 유의한 영향을 미친다는 것을 의미함