혼자서 해보기

1

Q1. mpg 데이터의 cty(도시 연비)와 hwy(고속도로 연비) 간에 어떤 관계가 있는지 알아보려고 합니다. x축은 cty, y축은 hwy로 된 산점도를 만들어 보세요.

ggplot(mpg,aes(x=cty,y=hwy)) + geom_point()

Q2. 미국 지역별 인구통계 정보를 담은 ggplot2 패키지의 midwest 데이터를 이용해서 전체 인구와 아시아인 인구 간에 어떤 관계가 있는지 알아보려고 합니다. x축은 poptotal(전체 인구), y축은 popasian(아시아인 인구)으로 된 산점도를 만들어 보세요. 전체 인구는 50만 명 이하, 아시아인 인구는 1만 명 이하인 지역만 산점도에 표시되게 설정하세요.

ggplot(midwest,aes(x=poptotal,y=popasian)) + geom_point() + xlim(0,500000) + ylim(0,10000)
## Warning: Removed 15 rows containing missing values (geom_point).

#2 Q1. 어떤 회사에서 생산한 “suv” 차종의 도시 연비가 높은지 알아보려고 합니다. “suv” 차종을 대상으로 평균 cty(도시 연비)가 가장 높은 회사 다섯 곳을 막대 그래프로 표현해 보세요. 막대는 연비 가 높은 순으로 정렬하세요.

df_mpg <- mpg %>% filter(class=="suv") %>% group_by(manufacturer) %>% summarise(mean_cty=mean(cty)) %>% arrange(desc(mean_cty)) %>% head(5)
ggplot(df_mpg,aes(x=reorder(manufacturer,-mean_cty),y=mean_cty)) + geom_col()

Q2. 자동차 중에서 어떤 class(자동차 종류)가 가장 많은지 알아보려고 합니다. 자동차 종류별 빈도를 표현한 막대 그래프를 만들어 보세요.

ggplot(mpg,aes(x=class)) + geom_bar()

#3 Q1. psavert(개인 저축률)가 시간에 따라서 어떻게 변해왔는지 알아보려고 합니다. 시간에 따른 개인 저축률의 변화를 나타낸 시계열 그래프를 만들어 보세요.

ggplot(economics,aes(x=date,y=psavert)) + geom_line()

#4 Q1. class(자동차 종류)가 “compact”, “subcompact”, “suv”인 자동차의 cty(도시 연비)가 어떻게 다른지 비교해보려고 합니다. 세 차종의 cty를 나타낸 상자 그림을 만들어보세요.

df_mpg2 <- mpg %>% filter(class %in% c("compact","subcompact","suv"))

ggplot(df_mpg2,aes(x=class,y=cty)) + geom_boxplot()