Praktikum 04 - Febri Lia Adi Candra dan Ismail Pranata
Visualisasi Data dengan ggplot2
Pada tugas kali ini saya akan membuat visualisasi data dengan menggunakan paket ggplot2. visualisasi data tersebut dibuat dengan melanggar 6 prinsip dari desain grafik ACCENT, yiatu: - Apprehension (pemahaman) - Clarity (kejelasan) - Consistency (konsistensi) - Efficiency (efisiensi) - Neccesity (kebutuhan) - Truthfulness (keadaan sebenarnya)
Menginstall packages
Mengimport data
Data yang digunakan adalah data House Price Prediction
Membuat grafik
Grafik yang akan saya buat adalah grafik mengenai regresi dengan peubah penjelas adalah jumlah kamar dan peubah y adalah tahun dibangun.
grafik<-ggplot(aes(x=bedrooms,
y=yr_built),
data=rumah)+
geom_point(color=rainbow(4600))+
geom_smooth(method="lm", formula=y~x, colour="black")+geom_line()+
labs(title="Model Regresi Jumlah Kamar Terhadap Tahun Berdiri")+
xlab("Jumlah Kamar")+
ylab("Tahun Berdiri")+xlim(0,50)+theme(plot.title = element_text(hjust = 0.5))
grafikPelanggaran 6 Prinsip ACCENT
Grafik tersebut adalah grafik regresi linier sederhana dengan penjelas jumlah kamar dan respon adalah tahun dibangun. Grafik tersebut melanggar prinsip-prinsip grafik yang baik ACCENT dengan penjelasan sebagai berikut:
Apprehension atau pemahaman. Aprrehension adalah kemampuan untuk melihat hubungan diantara data dengan benar. ini lebih menyangkut pada substansi data daripada desain grafik. Grafik di atas menjelaskan hubungan jumlah kamar dengan tahun berdiri. Secara teoritis, jumlah kamar tidak berhubungan sama sekali dengan tahun dibangunnya sebuah rumah. Hasil yang didapat dengan menggunakan regresi tidak dapat menyimpulkan sama sekali antara hubungan kedua variabel tersebut. Jadi, grafik di atas tidak mempunyai substansi yang jelas.
Clarity atau kejelasan. Clarity adalah kemampuan grafik untuk menafsirkan elemen grafik secara visual dengan jelas. Grafik di atas tidak dapat menampilkan elemen grafik secara jelas karena digunakan warna yang sangat beragam hanya untuk membedakan plot antara jumlah kamar dan tahun berdiri. ditambah lagi jumlah observasi sebanyak 4600, mengakibatkan grafik tidak dapat dilihat dengan jelas.
Concistency atau konsistensi. Konsistensi menyangkut kemampuan menafsirkan grafik berdasarkan pada grafik serupa di masa lalu atau standar universal. grafik di atas tidak konsisten dengan standar karena dalam standar yang bersifat umum, sebuah grafik regresi linier menggambarkan plot hubungan antara data variabel penjelas dan respon. Biasanya juga disertai hanya garis regresi untuk menjelaskannya. Akan tetapi, pada grafik di diatas ditambahkan plot garis yang menghubungkan antara titik satu dengan titik yang lain. Hal ini jelas tidak sesuai dengan standar dan tidak dibutuhkan.
Efficiency atau efisiensi. Efisiensi menyangkut kemampuan grafik untuk menggambarkan data dengan cara sesederhana mungkin. Grafik untuk menggambarkan model regresi cukup dengan menggunakan plot antara variabel penjelas dengan respon disertai dengan garis regresi. Penggunaan warna dan garis antar plot tidak diperlukan karena tidak menjelaskan apapun, justru membuat grafik lebih sulit untuk dipahami.
Necesity atau kebutuhan. Kebutuhan berkaitan dengan elemen grafik tertentu. Elemen garis antar plot tidak diperlukan dalam grafik.
Truthfulness atau keadaan sebenarnya. Truthfulness menyagkut apakah data diplot dengan benar dalam sistem koordinat yang ditentukan dengan baik. Jika dilihat, data bedroom hanya mempunyai range dari 1 hingga 10. Grafik di atas melakukan plot dengan label koordinat x dari 0-50. Hal ini menunjukkan bahwa data tidak diplot dengan sistem koordinat yang ditentukan dengan baik.
Referensi
anonym . tanpa tahun .qplot: Quick plot with ggplot2 - R software and data visualization [2 Maret 2021]. http://www.sthda.com/english/wiki/qplot-quick-plot-with-ggplot2-r-software-and-data-visualization
Chang W. 2013. R Graphic Cookbook. California : O’Really Media. http://www.cookbook-r.com/
de Vries A, Meys J. tanpa tahun. How to Get Geoms in ggplot in R [4 Maret 2021]. https://www.dummies.com/programming/r/how-to-get-geoms-in-ggplot-in-r/
Dito GA, Anisa R. 2020. Visualisasi Data dengan ggplot2. [1 Maret 2021].https://rpubs.com/gdito/viz-ggplot2
Lilis D. tanpa tahun .R Graphics: Plotting in Color with qplot Part 2 [4 Maret 2021]. https://www.theanalysisfactor.com/r-programming-plotting-color-part-2-qplot/
RStudio . tanpa tahun . Data Visualization with ggplot2 Cheat Sheet [4 Maret 2021]. https://rstudio.com/wp-content/uploads/2015/03/ggplot2-cheatsheet.pdf
Turner S. 2010. Arrange multiple ggplot2 plots in the same image window [3 Maret 2021]. https://gettinggeneticsdone.blogspot.com/2010/03/arrange-multiple-ggplot2-plots-in-same.html
Wickham H, Danielle N, Pedersen TL. 2016. ggplot2: Elegant Graphics for Data Analysis. Texas: Springer. https://ggplot2-book.org/
Nurussadad, A.A. (2021). Visualisasi Data dengan ggplot2. [3 Maret 2021]. https://rpubs.com/nurussadad/STA581-04-ggplot2