#Satu Bab satu

library(ggplot2)
head(diamonds)
## # A tibble: 6 × 10
##   carat cut       color clarity depth table price     x     y     z
##   <dbl> <ord>     <ord> <ord>   <dbl> <dbl> <int> <dbl> <dbl> <dbl>
## 1  0.23 Ideal     E     SI2      61.5    55   326  3.95  3.98  2.43
## 2  0.21 Premium   E     SI1      59.8    61   326  3.89  3.84  2.31
## 3  0.23 Good      E     VS1      56.9    65   327  4.05  4.07  2.31
## 4  0.29 Premium   I     VS2      62.4    58   334  4.2   4.23  2.63
## 5  0.31 Good      J     SI2      63.3    58   335  4.34  4.35  2.75
## 6  0.24 Very Good J     VVS2     62.8    57   336  3.94  3.96  2.48
library(ggplot2)

ggplot(diamonds, aes(x = cut, fill = color)) +
  geom_bar(position = "dodge") +
  labs(
    title = "Grouped Bar Chart Diamonds",
    subtitle = "Distribusi Diamond berdasarkan Cut dan Color",
    x = "Cut",
    y = "Jumlah Diamond",
    fill = "Color"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold", size = 14),
    plot.subtitle = element_text(hjust = 0.5),
    axis.text.x = element_text(angle = 30, hjust = 1),
    legend.position = "right"
  )

Interpretasi

Grafik menunjukkan distribusi jumlah diamond berdasarkan kategori cut (Fair, Good, Very Good, Premium, Ideal) dengan pengelompokan berdasarkan color (D sampai J). Terlihat bahwa kategori Ideal memiliki jumlah diamond paling tinggi di hampir semua warna, yang menunjukkan bahwa potongan Ideal merupakan kualitas potongan yang paling dominan dalam dataset. Hal ini mengidentifikasikan bahwa pasar atau produksi diamond lebih banyak berfokus pada kualitas potongan terbaik.

Pada kategori Premium dan Very Good, jumlah diamond juga relatif tinggi, namun masih berada di bawah kategori Ideal. Sementara itu, kategori Good dan terutama Fair memiliki jumlah yang jauh lebih sedikit, menunjukkan bahwa kualitas potongan rendah tidak terlalu dominan dalam distribusi data.

Dari sisi warna (color), terlihat bahwa warna G dan H cenderung memiliki jumlah paling besar pada hampir semua kategori cut, khususnya pada cut Ideal dan Premium. Sebaliknya, warna D dan J relatif lebih sedikit jumlahnya, yang menunjukkan bahwa distribusi warna menengah (middle color grade) lebih mendominasi dibandingkan warna ekstrem (paling jernih atau paling rendah kualitas warna).

Secara keseluruhan, grafik ini menunjukkan bahwa distribusi diamond dalam dataset lebih terkonsentrasi pada cut berkualitas tinggi (Ideal, Premium, Very Good) dan warna menengah (G–H). Pola ini mengindikasikan bahwa kombinasi kualitas potongan tinggi dan warna menengah merupakan karakteristik dominan dari data diamonds, yang kemungkinan merefleksikan preferensi pasar terhadap keseimbangan antara kualitas dan ketersediaan (supply).