[빅데이터 청년인재] 시각화 기초
1. 데이터에서 합계만 필터
2. 기본 그래프 이용
plot(d1$기간, d1$`1인 가구`, type="l")
lines(d1$기간, d1$`2인 가구`, col="red")
lines(d1$기간, d1$`3인 가구`, col="blue")
lines(d1$기간, d1$`4인 가구`, col="cyan")
lines(d1$기간, d1$`5인 가구`, col="green")
lines(d1$기간, d1$`6인이상 가구`, col="yellow")
위 그림의 문제점을 찾아 개선해보자.
3. ggplot
이용
ggplot
을 이용하기 위해서는 데이터를 long format 으로 먼저 바꿔야함
p <- ggplot(d2, aes(x=기간, y=value, group=house))
p <- p + geom_line(aes(color=house)) + geom_point()
p <- p + theme_classic()
p + theme(legend.position = "bottom")
- 퀴즈: 연도별 19세 이하 의 가구원수 데이터를 만들어보고 시각화 하시오.
p <- ggplot(d4, aes(x=기간, y=value, group=house))
p <- p + geom_line(aes(color=house)) + geom_point()
p <- p + theme_classic()
p + theme(legend.position = "bottom")
4. aggregate
함수를 이용한 summary
- ‘합계’ 값은 제외하고 전체 데이터를 long format 으로 만들기
- 기간별 합계를 구해보자.