Teori

(Akumulasi poin → 30%)

1 Behind effective data visualization

Prinsip desain grafik
  • Mencapai integritas grafik –> visualisasi harus menunjukan data yang sebenarnya dan tidak menyesatkan

  • Memaksimalkan rasio data-ink –> Tinta hanya digunakan untuk hal-hal yang merepresentasikan data ( jadi ga buat hal-hal yang ga penting seperti background, garis border, garis, label, warna, spesial effect dan hal-hal yang tidak mewakili data lainya)

  • Hindari visualisasi Berlebihan –> seperti penggunaan efek shadow, warna seperti pelangi yang tidak membantu memberikan pemahaman kepada pembaca terkait insight data yang ingin kita sampaikan

  • Proporsi Ukuran Total Grafik –> proporsi harus sebagian besar beroientasi pada data, artinya dari keseluruhan ruang grafik yang ada digunakan untuk menampilkan data tanpa banyak tambahan yang tidak perlu. Jadi, semakin tinggi proporsi ukuran total grafik yang didedikasikan untuk menampilkan data, semakin efisien dan efektif grafik tersebut dalam menyampaikan informasi kepada pembaca.

  • Penerapan estetika dan fungsi –> Pelabelan yang jelas dan terperinci

==================================================================================================================
Cara memilih tipe/jenis visualisasi

Intinya adalah visulaisasi yang baik itu dapat menjelaskan apa yang ingin disampaikan atau dijelaskan melalui visualisasi tersebut Ada 4 kelompok tipe visualisasi –> Comparison, Composition, Distribution, and Relationship

  1. Comparasion –> ketika kita ingin membandingkan nilai atau atribut yang berbeda dalam data satu sama lain
    • Misalnya, membandingkan penjualan tahun ini dengan tahun lalu, atau membandingkan kinerja produk A, B, dan C dengan (Barplot atau Dots) .
  2. Composition –> bagaimana suatu bagian berkontribusi terhadap keseluruhan atau bagaimana kategori terpecah menjadi bagian-bagian
    • Misalnya, menunjukkan bagaimana penjualan bulan ini dibagi berdasarkan produk, atau bagaimana pangsa pasar dibagi antara beberapa pesaing.(Stack bar, Pie chart, multi pie chart dll)
  3. Distribution –> Menunjukkan sebaran atau pola data dan frekuensinya di sepanjang skala nilai atau dalam suatu ruang
    • Digunakan untuk menggambarkan distribusi data, apakah itu distribusi normal, skewness, atau kurtosis. Berguna untuk memahami pola di balik data dan melihat apakah data cenderung terkumpul dalam rentang tertentu atau merata di seluruh rentang nilai.(Boxplot)
  4. Relationship –> membandingkan 2 variabel atau lebih untuk mencari tahu hubungan/corelasi nya
    • Digunakan untuk mengeksplorasi hubungan antara variabel, apakah itu positif, negatif, atau tidak ada hubungan sama sekali. Misalnya, hubungan antara pengeluaran per kapita dan harapan hidup di berbagai negara. (Sactter plot, bubble plot)
==================================================================================================================
Penggunaan warna dalam visualisasi data

Tujuan warna pada visualisasi data :

  1. untuk membedakan kelompok data satu dengan yang lain
  2. untuk mewakili nilai data
  3. untuk menyoroti elemen tertentu
  • Intinya warna harus berorientasi pada data, warna bisa menjadi higliht terkait inti dari visual yang mau kita tampilkan itu apa, penggunaan warna yang baik yaitu skala warna aksen, yaitu dengan memberikan kontras pada hal-hal tertentu (yang ingin kita sampaikan kepada pembaca) dan yang lainya kita beri warna berbeda yang tidak mencolok seperti abu-abu/warna gelap lainya.

==================================================================================================================

2. R markdown report

Source : Links PPT Session 10-11
Umum
  • Definisi –> R markdown adalah bahasa teks biasa yang digunakan untuk menggabungkan bahasa R termasuk plot dan visualisasinya dan catatan/komentar tertulis layaknya sebuah laporan
    • Struktur –>
      • YAML sets untuk header ( berisi format output, tittle, author )
      • code chunk untuk penulisan code R,
      • Knitr untuk embedding format ke bentuk (pdf,html,word)
    • Text Formatting –> bold, italic, coret, superscript 2, subscript2, Link, list (-/+), tabsetPanel(tabPanel(“isi kode”)), unshowed text selama knit [ <‘!’– abc –> ],
    • Chuck Option

==================================================================================================================

Keuntungan
Keuntungan Deskripsi
Fleksibilitas dan Dinamisme Memungkinkan penyisipan kode R untuk membuat grafik, tabel, atau analisis lainnya langsung di dalam dokumen, yang memungkinkan laporan untuk berubah otomatis saat data atau analisis diperbarui.
Reproduktibilitas Memungkinkan laporan direproduksi dengan mudah karena semua analisis dan visualisasi berbasis kode, memastikan konsistensi dan transparansi.
Integrasi yang Luas Mendukung berbagai format output seperti HTML, PDF, Word, dan lainnya, sehingga dapat disesuaikan dengan kebutuhan atau preferensi audiens.
Pemformatan yang Konsisten Menggunakan sintaks Markdown untuk menciptakan laporan rapi dan terstruktur, termasuk judul, paragraf, dan daftar, mempermudah pembacaan.
Kemampuan Menyisipkan Kode dan Output Memungkinkan penyisipan kode R dan output (seperti tabel hasil analisis data) di dalam dokumen, memudahkan visualisasi dan pemahaman hasil.

==================================================================================================================

3.crafting data story

Source : Links PPT Session 13

Keuntungan
1. Memberikan perspektif baru.
2. Buat penemuan penting dapat diakses oleh sebanyak mungkin orang.
3. Bantu orang lain menafsirkan informasi yang kompleks.
4. Merangsang emosi dan pada akhirnya membantu menginspirasi tindakan yang berarti
Markdown adalah bahasa teks biasa yang digunakan untuk menggabungkan bahasa R termasuk plot dan visualisasinya dan catatan/komentar tertulis layaknya sebuah laporan.
Contoh R markdown

LINKS

Coding

(akumulasi 70% poin)

Dokumentasi R