Sebagai langkah awal untuk lebih memahami produk berlian, saya akan melakukan eksplorasi terhadap data berlian (dari dataset diamonds). Fokusnya adalah pada tiga hal utama yang paling menentukan nilai dan daya tarik berlian yaitu potongan (cut), warna (color), dan kejernihan (clarity).

Tujuan analisis ini adalah mencari tahu berlian seperti apa yang paling banyak beredar di pasar, bagaimana hubungan antara kualitas-kualitas ini, dan apa artinya buat bisnis. Sehingga hasilnya bisa membantu perusahaan dalam mengambil keputusan, mulai dari stok barang sampai strategi jualannya.

Saya menggunakan library ggplot2 dan buat beberapa grafik batang (Bar Chart) untuk melihat perbandingan jumlah atau proporsi dari tiap kategori. Agar lebih mudah melihat perbedaannya, saya memberikan perbedaan warna di setiap grafik.

library(ggplot2)
library(dplyr)
library(scales)
library(tidyr)

data(diamonds)
warna <- c("#FFE600", "#7CFF00", "#00E676", "#00B0FF", "#1A33FF") #buat palet warna

Potongan(Cut) mana yang paling banyak muncul?

diamonds %>%
  count(cut) %>%
  mutate(warna = ifelse(n == max(n), "#1A33FF", "#00B0FF")) %>%
  ggplot(aes(x = cut, y = n, fill = warna)) +
  geom_col(alpha = 0.8) +
  scale_fill_identity() +
  labs(title = "Potongan Berlian yang Paling Banyak Muncul", x = "potongan (Cut)", y = "Frekuensi")

Berdasarkan grafik tersebut, terlihat jelas kalau potongan Ideal paling banyak (terlihat dari batang yang paling gelap). Disusul Premium dan Very Good. Fair dan Good jumlahnya relatif sedikit. Artinya pasar lebih suka potongan kualitas atas, jadi perusahaan harus jaga stok Ideal dan Premium dan stok Fair bisa dikurangi, khusus untuk pembeli yang cari opsi murah.

Apakah potongan(cut) mempengaruhi kejernihan(clarity)?

ggplot(diamonds, aes(x = clarity, fill = cut)) +
  geom_bar(position = "dodge") +
  scale_fill_manual(values = warna) +
  labs(title = "Cut per Clarity", x = "kejernihan (Clarity)", y = "Jumlah", fill = "Cut") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Grafik ini menunjukkan bahwa di kejernihan menengah (SI1, VS2, VS1), potongan Ideal dan Premium paling mendominasi. Bahkan, batang Ideal hampir selalu paling tinggi di semua tingkat kejernihan. Ini berarti kombinasi potongan bagus dengan kejernihan menengah adalah produk massal yang paling aman dijual. Jadi, untuk strategi stok, pilihan paling aman tetap memprioritaskan potongan Ideal

Bagaimana komposisi warna(Color) terhadap potongan(Cut)?

diamonds <- diamonds %>%
  mutate(color_group = case_when(
    color %in% c("D", "E", "F") ~ "Tinggi (D-F)",
    color %in% c("G", "H") ~ "Menengah (G-H)",
    color %in% c("I", "J") ~ "Rendah (I-J)"
  ))

# Grafik proporsi per potongan
ggplot(diamonds, aes(x = cut, fill = color_group)) +
  geom_bar(position = "fill") +
  scale_fill_manual(values = c("#1A33FF", "#00B0FF", "#FFE600")) +
  labs(title = "Komposisi Warna per Potongan (Dikelompokkan)",
       x = "Potongan (cut)", y = "Proporsi", fill = "Kelompok Warna") +
  scale_y_continuous(labels = scales::label_percent())

Dari grafik ini, terlihat jelas bahwa berlian dengan kualitas warna tinggi (D-F) mendominasi di semua jenis potongan, dari Fair hingga Ideal. Bagian warna kuning selalu menjadi yang terbesar di setiap batang, artinya mayoritas berlian di dataset ini memang punya warna bagus pada potongan kualitas rendah(Fair) atau sempurna(Ideal). Warna menengah (G-H) biasanya menempati posisi kedua dengan porsi yang cukup stabil, meskipun sempat naik sedikit di potongan Good dan Premium. Sementara itu, warna rendah (I-J) konsisten menjadi kelompok terkecil di semua potongan, menunjukkan bahwa pasar memang kurang berminat pada berlian dengan warna agak kekuningan.

Karena pasar didominasi warna tinggi, stok berlian dengan kualitas warna D-F adalah yang paling aman—apapun potongannya. Warna menengah bisa jadi pelengkap, terutama untuk potongan Good dan Premium yang porsinya sedikit lebih besar. Sedangkan warna rendah cukup sediakan terbatas karena permintaannya kecil.

Tingkat kejernihan(Clarity) mana yang mempunyai persentase paling tinggi?

clarity_summary <- diamonds %>%
  count(clarity) %>%
  mutate(pct = n/sum(n)*100)

ggplot(clarity_summary, aes(x = clarity, y = pct)) +
  geom_col(fill =  "#1A33FF") +
  geom_text(aes(label = sprintf("%.1f%%", pct)), vjust = -0.5) +
  labs(title = "Persentase Clarity", x = "Kejernihan(Clarity)", y = "Persentase (%)") +
  ylim(0, max(clarity_summary$pct) * 1.1)

Grafik ini menunjukkan bahwa hampir setengah dari total pasar (47%) didominasi oleh dua kategori, yaitu SI1 (24,2%) dan VS2 (22,7%). Kedua kategori ini dapat disebut sebagai “tulang punggung” penjualan karena volumenya yang paling besar. Artinya, jika perusahaan ingin mencapai target penjualan massal, maka fokus utama harus diarahkan pada pengadaan dan pemasaran berlian dengan tingkat kejernihan SI1 dan VS2. Segmen ini merupakan pasar paling aktif dengan permintaan tinggi, sehingga ketersediaan stok yang cukup sangat penting.

Sementara itu, kategori kejernihan yang lebih tinggi seperti VVS2, VVS1, dan IF hanya mencakup sekitar 10% dari total pasar. Meskipun pangsanya kecil, segmen ini memiliki nilai jual yang lebih tinggi karena kelangkaannya dan dapat dijadikan produk premium untuk menarik konsumen yang mencari eksklusivitas. Di sisi lain, kategori terendah yaitu I1 hanya menempati 0,8% pasar, yang umumnya ditujukan untuk kebutuhan industri atau konsumen dengan anggaran sangat terbatas.

Kesimpulan

Berdasarkan hasil eksplorasi data berlian, dapat disimpulkan bahwa pasar didominasi oleh berlian dengan potongan Ideal dan Premium, tingkat kejernihan menengah (khususnya SI1 dan VS2), serta kualitas warna tinggi (D-F). Kombinasi ini menjadi produk massal yang paling banyak dicari, mencakup hampir setengah dari total pasar. Temuan ini mengindikasikan bahwa konsumen cenderung memprioritaskan potongan berkualitas dengan harga yang masih terjangkau melalui kejernihan menengah, sementara warna berkualitas tinggi telah menjadi standar umum di semua tingkatan potongan. Implikasinya bagi bisnis adalah perlunya memprioritaskan stok pada kategori-kategori tersebut untuk memenuhi permintaan terbesar, menjadikannya sebagai tulang punggung penjualan. Sementara itu, produk dengan kejernihan sangat tinggi (VVS, IF) dapat diposisikan sebagai produk premium untuk pasar khusus, dan produk dengan kualitas rendah (I1, warna I-J) cukup disediakan secara terbatas untuk segmen anggaran. Dengan strategi ini, perusahaan dapat mengoptimalkan keputusan stok dan pemasaran agar selaras dengan preferensi pasar yang paling dominan.