MTCars 데이터셋 상관관계 분석 보고서
1. 개요
본 보고서는 자동차 성능 데이터셋인 mtcars를 사용하여 자동차의 연비(MPG)와 마력(HP) 사이의 상관관계를 분석한 결과를 담고 있습니다. mtcars 데이터셋은 1974년 Motor Trend 미국 잡지에서 추출한 32개 자동차 모델의 데이터를 포함하고 있습니다.
2. 데이터 요약
변수 |
설명 |
최소값 |
최대값 |
평균 |
mpg |
연비 (Miles Per Gallon) |
10.4 |
33.9 |
20.09 |
hp |
마력 (Horsepower) |
52 |
335 |
146.69 |
데이터 포인트 수: 32개 차량 모델
실린더 분포: 4기통(11대), 6기통(7대), 8기통(14대)
3. 상관관계 분석
mpg(연비)와 hp(마력) 사이의 피어슨 상관계수는 r = -0.7762로 계산되었습니다. 이는 두 변수 사이에 강한 음의 상관관계가 있음을 의미합니다. 즉, 마력이 높을수록 연비는 낮아지는 경향이 뚜렷하게 나타납니다.
선형 회귀 분석 결과, 다음과 같은 회귀식이 도출되었습니다:
mpg = 30.10 + (-0.0682 * hp)
이 식에 따르면, 마력(hp)이 1단위 증가할 때마다 연비(mpg)는 평균적으로 약 0.0682 단위 감소하는 경향이 있습니다.
4. 시각화 분석
위 그래프를 통해 다음과 같은 관찰 결과를 얻을 수 있습니다:
- 마력과 연비 사이에는 뚜렷한 음의 상관관계가 있습니다.
- 4기통 차량(파란색 점)은 대체로 낮은 마력과 높은 연비 특성을 보입니다.
- 8기통 차량(빨간색 점)은 높은 마력과 낮은 연비를 나타냅니다.
- 6기통 차량(노란색 점)은 중간 범위에 분포되어 있습니다.
- 회귀선이 데이터 포인트의 전반적인 경향을 잘 나타내고 있으며, 이는 두 변수 사이의 관계가 비교적 선형적임을 시사합니다.
5. 결론
본 분석을 통해 자동차의 마력과 연비 사이에는 통계적으로 유의미한 음의 상관관계가 존재함을 확인했습니다. 이는 자동차 설계에서 동력 성능과 연료 효율성 사이의 일반적인 트레이드오프를 반영합니다.
분석 결과를 바탕으로 다음과 같은 결론을 내릴 수 있습니다:
- 연비를 중시하는 소비자라면 낮은 마력의 4기통 엔진 차량이 더 적합할 수 있습니다.
- 높은 성능을 원하는 소비자는 연비의 감소를 감수해야 할 수 있습니다.
- 6기통 차량은 성능과 연비 사이의 균형점을 제공할 수 있습니다.
이 분석은 1974년 데이터를 기반으로 하고 있어, 현대 자동차 기술의 발전으로 인한 변화는 반영하지 않습니다. 최신 하이브리드 기술이나 전기차의 경우 높은 성능과 연비를 동시에 달성할 수 있습니다.
6. 부록: 분석에 사용된 코드
# R 코드 예시
data(mtcars)
cor.test(mtcars$mpg, mtcars$hp)
model <- lm(mpg ~ hp, data = mtcars)
summary(model)
# 그래프 생성
library(ggplot2)
ggplot(mtcars, aes(x = hp, y = mpg, color = factor(cyl))) +
geom_point(size = 3) +
geom_smooth(method = "lm", formula = y ~ x, color = "black", se = FALSE) +
scale_color_manual(values = c("4" = "#4575b4", "6" = "#fee090", "8" = "#d73027"),
name = "실린더 수") +
labs(title = "MPG와 HP의 상관관계",
x = "마력(HP)",
y = "연비(MPG)") +
theme_minimal()