Pendahuluan

Visualisasi ini menggunakan dataset diamonds yang berisi informasi mengenai karakteristik dan harga ribuan berlian. Visualisasi dilakukan untuk memahami bagaimana harga berlian berkaitan dengan karakteristik fisiknya, baik secara perbandingan kategori maupun hubungan antar variabel numerik. Dataset ini memuat beberapa variabel utama yang memengaruhi nilai jual berlian. Beberapa variabel yang digunakan dalam visualisasi ini antara lain:

variabel <- data.frame(
  Variabel = c("price", "carat", "cut", "color"),
  Keterangan = c("Harga berlian (dalam USD)",
                 "Berat berlian (dalam satuan carat)",
                 "Kualitas potongan berlian (Fair, Good, Very Good, Premium, Ideal)",
                 "Tingkat warna berlian dari D sampai J (D = jernih, J = kekuningan)")
)
knitr::kable(variabel, caption = "Variabel")
Variabel
Variabel Keterangan
price Harga berlian (dalam USD)
carat Berat berlian (dalam satuan carat)
cut Kualitas potongan berlian (Fair, Good, Very Good, Premium, Ideal)
color Tingkat warna berlian dari D sampai J (D = jernih, J = kekuningan)

Visualisasi

Scatter Plot

Visualisasi ini bertujuan untuk menganalisis hubungan antara berat berlian (carat) dan harga, serta melihat arah, pola, dan variasi hubungan tersebut.

ggplot(diamonds, aes(x = carat, y = price)) +
    geom_point(color = "slateblue4", alpha = 0.2) +
    labs(title = "Hubungan Berat Berlian vs Harga Berlian",
         x = "Berat (Carat)",
         y = "Harga (USD)") +
    theme_minimal()

Scatter plot di atas menunjukkan hubungan antara berat berlian dan harga berlian, yang setiap titiknya mewakili satu berlian. Titik-titik pada grafik terlihat membentuk pola yang naik dari kiri bawah ke kanan atas. Hal ini berarti adanya hubungan yang positif antara berat dan harga. Grafik menunjukkan bahwa semakin berat berlian, maka semakin tinggi harganya. Namun, kenaikan harga tidak terlihat lurus atau stabil. Karena pada berat berlian yang lebih besar, harga berlian tampak meningkat jauh lebih cepat dibandingkan berat yang kecil. Selain itu, pada berat berlian yang sama, harga bisa sangat bervariasi. Misalnya, berlian dengan berat sekitar 1 carat memiliki rentang harga yang cukup lebar. Dengan kata lain, selain berat berlian, ada faktor lain juga yang memengaruhi harga, seperti kualitas potongan, warna, atau kejernihannya. Maka dari itu, grafik di atas memperlihatkan bahwa berat merupakan faktor utama yang memengaruhi harga berlian, tetapi bukan satu-satunya.

Violin Plot

Lalu, violin plot ini akan berfokus untuk melihat dan membandingkan bentuk serta pola distribusi harga berlian pada setiap kategori warna, termasuk kepadatan harga, variasi, dan kecenderungan median.

ggplot(diamonds, aes(x = color, y = price)) +
  geom_violin(fill = "springgreen4", alpha = 0.6) +
  geom_boxplot(width = 0.1, fill = "white", color = "black", outlier.shape = NA) +
  labs(title = "Distribusi Harga Berlian berdasarkan Kategori Warna",
       x = "Warna Berlian (color)",
       y = "Harga Berlian (price)") +
  theme_minimal()

Grafik ini merupakan violin plot yang menunjukkan bentuk distribusi harga berlian berdasarkan tingkat warna. Setiap bentuk visualisasi yang menyerupai “biola” ini, menggambarkan sebaran harga berlian pada satu kategori warna, dari D (warna terbaik atau terjernih) hingga J (warna yang lebih rendah atau kekuningan). Pada grafik, harga berlian pada setiap kategori warna memiliki rentang yang cukup lebar, yang berarti harganya bisa sangat beragam. Jika dilihat dari posisi garis horizontal di tengah kotak putih (garis median), terdapat kecenderungan beberapa kategori warna tertentu memiliki harga median lebih tinggi, tapi tidak terlalu tajam.

Kemudian, bagian bawah violin yang terlihat lebih lebar menunjukkan bahwa sebagian besar berlian berada pada kisaran harga rendah hingga menengah, sedangkan bagian atas yang bentuknya semakin menyempit menunjukkan bahwa hanya sedikit berlian yang harganya sangat mahal. Jadi intinya, violin plot ini menunjukkan bahwa harga berlian pada setiap kategori cukup bervariasi dan sebagian besar berlian berada pada harga rendah hingga menengah. Lalu, dari grafik juga menunjukkan bahwa warna dapat memengaruhi harga berlian, tetapi bukan satu-satunya faktor penentu. Melainkan juga dari kombinasi beberapa karakteristik lain dari berlian.

Boxplot

Tujuan dari visualisasi boxplot tersebut nantinya untuk membandingkan distribusi harga berlian berdasarkan kualitas potongan (cut), khususnya dari sisi median (harga tengah), variasi harga, dan keberadaan nilai ekstrem (outlier).

ggplot(diamonds, aes(x = cut, y = price)) +
    geom_boxplot(fill = "olivedrab3", color = "darkblue") +
    labs(title = "Perbandingan Harga Berlian berdasarkan Kualitas Potongan",
         x = "Cut",
         y = "Price (USD)") +
    theme_minimal()

Boxplot ini menunjukkan perbandingan harga berlian berdasarkan kualitas potongannya. Setiap kelompok memperlihatkan rentang harga yang cukup lebar. Artinya, dalam setiap kategori potongan, ada berlian yang harganya relatif murah hingga yang sangat mahal. Kalau kita lihat garis dalam kotak (median), kategori Premium terlihat memiliki harga tengah (median) yang lebih tinggi dibandingkan kategori lainnya. Ini menunjukkan bahwa berlian dengan potongan Premium cenderung dijual dengan harga lebih mahal.

Padahal secara teori, potongan Ideal itu biasanya dianggap kualitas potongan terbaik. Namun, dalam dataset ini, median harga untuk potongan Idela justru lebih rendah. Selain itu, terlihat banyak titik harga yang jauh lebih tinggi dari kebanyakan data (titik-titik di bagian atas) yang menandakan adanya outlier harga tinggi. Artinya, banyak berlian dengan harga sangat mahal di setiap kategori potongan. Sehingga dapat disimpulkan, kualitas potongan memang berkaitan dengan harga, tetapi tidak hanya dipengaruhi oleh kualitas potongan saja.

Kesimpulan

Berdasarkan hasil visualisasi di atas, secara umum menunjukkan bahwa harga berlian sangat bervariasi dan dipengaruhi oleh beberapa faktor secara bersamaan. Visualisasi scatter plot (carat vs price) terlihat hubungan positif yang sangat jelas antara berat dan harga. Semakin berat berlian, harga cenderung meningkat, bahkan meningkat lebih cepat pada berlian dengan berat yang lebih besar.

Kemudian, melalui violin plot (color vs price) terlihat bahwa pada setiap kategori warna, sebagian besar berlian berada pada harga rendah hingga menengah, sementara hanya sedikit yang memiliki harga sangat tinggi. Sementara itu, boxplot (cut vs price) menunjukkan bahwa terdapat perbedaan median harga antar kualitas potongan. Namun, kualitas potongan terbaik tidak selalu memiliki median harga tertinggi.

Jika disederhanakan, berlian yang lebih berat hampir selalu lebih mahal. Lalu, kualitas potongan dan warna juga berpengaruh terhadap harga. Namun, tidak ada satu faktor pun yang berdiri sendiri. Harga berlian ditentukan oleh kombinasi beberapa karakteristik sekaligus. Dengan demikian, dapat dikatakan bahwa berat merupakan faktor yang sangat kuat dalam menentukan harga. Akan tetapi, berat tersebut bukanlah faktor satu-satunya. Karena warna dan kualitas potongan juga berpengaruh terhadap harga berlian dan dapat menjadi faktor dalam menentukan suatu harga berlian.