보고일자: 2025년 12월 15일 (월요일)
보고 장소: 수원특례시
보고 담당 직원:마케팅 팀1부 000
자동차의 cty(도시 연비) 변수가 전체적으로 어떻게 분포되어 있는지 히스토그램을 사용하여 시각화 해봤습니다. 조건은 아래와 같이 설정하였습니다.
binwidth는 2로 설정 구동 방식(drv)별로 다른 색상으로 표현 drv는 범주형 변수로 전환처리하여 색상 분리를 원활하게 함 겹치는 막대는 alpha로 조절
mpg$drv <- as.factor(mpg$drv)
p <- ggplot()
p + geom_histogram(mapping = aes(x = cty, fill = drv),
data = mpg,
position = "identity",
binwidth = 2,
alpha = 0.5)
도시 연비는 15~20 사이에 많이 분포하는 경향이 있으며, f (전륜구동)가 상대적으로 더 효율적인 모델에 많습니다.
자동차의 등급(class: x축)에 따라 도시 연비(cty: y축)가 어떻게 다른지 상자 그림(boxplot)을 통해 비교 시각화해보았습니다. 시각화 해석 시, 주석을 달아서 이상치 유무를 해석하고, 중앙값의 차이를 중심으로 비교 서술하려고 합니다.
관련 분석을 진행한 결과는 다음과 같습니다. 보고사항 2번은
그래프만 보여드립니다.
시각화 결과, 아래와 같은 특징을 발견할 수 있었습니다.
1) 이상치 유무: 2saterm midsize, minivan, subcompact 등에서 이상치가 나타납니다. 2) 중앙값 차이:subcompact, compact 등 승용차 등급은 전반적으로 엔진 크기가 작으며, 중앙값이 2.5 이하에 위치합니다. 3) 반면 pickup, suv 클래스는 4.5 이상의 중앙값을 보이며, 배기량이 큰 차량이 많음을 나타냅니다.
고속도로 연비(hwy)의 분포가 구동방식(drv)과 변속기 종류(trans)에 따라 어떻게 달라지는지 시각화한 뒤 그 특징을 분석하고자 했습니다. 조건은 fill = drv, alpha = 0.5으로 설정하였습니다. 그런 다음 연비 특성이 구동방식과 변속기 조합에 따라 어떻게 다른지 관찰해보았습니다.
관련 분석을 진행한 결과는 다음과 같습니다. 보고사항 3번도 역시
그래프만 보여드립니다.
시각화 결과, 아래와 같은 특징을 발견할 수 있었습니다.
1) 구동방식(drv)과 변속기(trans)의 조합에 따라 고속도로 연비(hwy) 분포가 달라지는 것을 확인할 수 있습니다. 2) 전륜구동(f) 차량은 자동 변속기(예: auto(l5), auto(l4), manual(m5))에서 비교적 연비가 높게 분포합니다 (hwy 25~35 중심). 3) 후륜구동(r)의 경우 연비 분포가 낮은 쪽에 치우쳐 있고, 자동 변속기에서 가장 낮은 연비대를 형성합니다. 4) 4륜구동(4)은 전체적으로 연비가 낮고, 자동 변속기에서도 평균 연비가 낮은 편입니다.
이상 보고를 마칩니다. 감사합니다.