Untuk melakukan data visualisasi pada R, kita bisa menggunakan
ggplot2 plot yang dimana itu merupakan sebuah tools untuk
mengubah data menjadi plot
Kita juga tidak bisa rely pada data viz saja, tetapi kita bisa menggunakan data transformation seperti:
Lalu, pada proses explore ini kita juga bisa melakukan proses Exploratory Data Analysis, yang dimana kita combine visualisasi dan data transformation untuk mencari sebuah insight dari data yang dimiliki
Untuk membuatnya pun cukup simple, bahkan jauh lebih mudah daripada
menggunakan matplotlib punya Python!!!
ggplot(data = <DATA>) +
<GEOM_FUNCTION>(mapping = aes(<MAPPINGS>))
Run ggplot(data = mpg) apa yang terjadi? Blank
canvas
Berapa banyak rows pada mpg? Berapa banyak cols nya?
Kita bisa pake function dim(nama_data)
dim(mpg)
## [1] 234 11
Apa deskripsi data drv? Kita bisa pakai function
?mpg –> tipe drive train, front wheel, rear wheel,
4wd
Buat Scatter Plot hwy vs cyl
ggplot(data = mpg) +
geom_point(mapping = aes(x = hwy, y = cyl))
class vs
drv? kenapa plot nya not useful? Karena kita nge compare
data categorical dengan numericalggplot(data = mpg) +
geom_point(mapping = aes(x = class, y = drv))
sapplysapply(mpg, class)
## manufacturer model displ year cyl trans
## "character" "character" "numeric" "integer" "integer" "character"
## drv cty hwy fl class
## "character" "integer" "integer" "character" "character"
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy)) +
facet_wrap(~ class, nrow = 2)
~ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy)) +
facet_wrap(drv ~ cyl)
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy)) +
facet_wrap(cty ~ cyl)
ggplot(data = mpg, mapping = aes(x = displ, y = hwy)) +
geom_point() +
geom_smooth()
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
ggplot