x 축은 cty, y 축은 hwy 로 된 산점도를 만들어 보세요.
ggplot(data = mpg, aes(x = cty, y = hwy)) + geom_point()
Q2. 미국 지역별 인구통계 정보를 담은 ggplot2 패키지의 midwest 데이터를
이용해서 전체 인구와 아시아인 인구 간에 어떤 관계가 있는지 알아보려고
합니다. x 축은 poptotal(전체 인구), y 축은 popasian(아시아인 인구)으로
된 산점도를 만들어 보세요. 전체 인구는 50 만 명 이하, 아시아인 인구는 1
만 명 이하인 지역만 산점도에 표시되게 설정하세요
ggplot(data = midwest, aes(x = poptotal, y = popasian)) +
geom_point() +
xlim(0, 500000) +
ylim(0, 10000)
## Warning: Removed 15 rows containing missing values (`geom_point()`).
Q1. 어떤 회사에서 생산한 “suv” 차종의 도시 연비가 높은지 알아보려고
합니다. “suv” 차종을 대상으로 평균 cty(도시 연비)가 가장 높은 회사 다섯
곳을 막대 그래프로 표현해 보세요. 막대는 연비 가 높은 순으로
정렬하세요.
mpg %>% filter(class == "suv") %>%
group_by(manufacturer) %>%
summarise(mean_suv = mean(cty)) %>%
arrange(desc(mean_suv)) %>%
head(5) -> df_suv
ggplot(data = df_suv, aes(x = reorder(manufacturer, - mean_suv), y = mean_suv))+ geom_col()
Q2. 자동차 중에서 어떤 class(자동차 종류)가 가장 많은지 알아보려고
합니다. 자동차 종류별 빈도를 표현한 막대 그래프를 만들어 보세요.
ggplot(data = mpg, aes(x = class)) + geom_bar()
Q1. psavert(개인 저축률)가 시간에 따라서 어떻게 변해왔는지 알아보려고 합니다. 시간에 따른 개인 저축률의 변화를 나타낸 시계열 그래프를 만들어 보세요.
ggplot(data = economics, aes(x = date, y = psavert)) + geom_line()
Q1. class(자동차 종류)가 “compact”, “subcompact”, “suv”인 자동차의 cty(도시 연비)가 어떻게 다른지 비교해보려고 합니다. 세 차종의 cty를 나타낸 상자 그림을 만들어보세요.
mpg %>% filter(class == "compact"| class == "subcompact"| class == "suv") -> css
ggplot(data = css, aes(x = class, y = cty)) + geom_boxplot()
한국어 데이터를 이용해 box plot 그리기. x 축을 gender y 축을 response로 하는 그림을 그리세요.
read.table("korean_data.txt", fileEncoding="utf-8", head=T) ->korean
substr(korean$stimulus, 1,1) -> korean$gender
ggplot(data = korean, aes(x = gender, y = response)) + geom_boxplot()
그 후 boxplot에서 나타내는 25% 값, median, 75% 값을 각각 찾아 쓰세요.
교과서 176에 명령어 있어요.
boxplot(korean$response)$stats
## [,1]
## [1,] 1
## [2,] 1
## [3,] 4
## [4,] 7
## [5,] 7
25%= 1, median = 4, 75% = 7