Pendahuluan

Visualisasi data merupakan salah satu cara untuk menyajikan data agar lebih mudah dipahami dan dianalisis. Melalui visualisasi, distribusi dan perbandingan data dapat diamati dengan lebih jelas dibandingkan penyajian dalam bentuk tabel.

Laporan ini menyajikan visualisasi data kategorik menggunakan dataset diamonds pada R dengan bantuan package ggplot2. Analisis difokuskan pada variabel kualitas potongan (cut) dan tingkat kejernihan (clarity) melalui beberapa jenis bar chart.

Deskripsi Dataset

Dataset diamonds merupakan dataset bawaan R yang berisi lebih dari 50.000 observasi berlian. Dataset ini mencakup berbagai karakteristik berlian, baik dalam bentuk variabel kategorik maupun numerik.

Variabel yang digunakan dalam analisis ini adalah:

BAR CHART (FREKUENSI)

Grafik ini menunjukkan distribusi jumlah berlian pada setiap kategori kualitas potongan. Terlihat bahwa jumlah berlian tidak tersebar secara merata antar kategori, sehingga terdapat perbedaan dominasi pada beberapa kualitas potongan.

GROUPED BAR CHART

Grafik ini memperlihatkan perbandingan jumlah berlian berdasarkan tingkat kejernihan pada masing-masing kualitas potongan. Setiap kualitas potongan memiliki pola distribusi kejernihan yang berbeda, sehingga memudahkan perbandingan antar kategori kejernihan.

PROPORTION BAR CHART

Grafik ini memperlihatkan komposisi tingkat kejernihan pada masing-masing kualitas potongan berlian. Meskipun jumlah total berlian berbeda antar kualitas potongan, proporsi tingkat kejernihan pada setiap kategori potongan cenderung memiliki pola yang serupa, dengan beberapa tingkat kejernihan lebih mendominasi dibandingkan yang lain.

Kesimpulan

Berdasarkan hasil visualisasi data menggunakan dataset diamonds, dapat disimpulkan bahwa distribusi berlian tidak merata pada setiap kualitas potongan. Berlian dengan kualitas potongan yang lebih tinggi cenderung lebih banyak ditemukan dibandingkan dengan kualitas potongan yang lebih rendah.

Selain itu, tingkat kejernihan berlian menunjukkan variasi pada setiap kualitas potongan. Meskipun jumlah berlian berbeda antar kategori potongan, pola proporsi tingkat kejernihan pada masing-masing potongan relatif serupa.

Secara keseluruhan, Visualisasi menggunakan bar chart, grouped bar chart, dan proportion bar chart membantu memperjelas distribusi dan perbandingan antar kategori, sehingga karakteristik data dapat dipahami dengan lebih mudah.