#Satu Bab satu

library(ggplot2)
head(diamonds)
## # A tibble: 6 × 10
##   carat cut       color clarity depth table price     x     y     z
##   <dbl> <ord>     <ord> <ord>   <dbl> <dbl> <int> <dbl> <dbl> <dbl>
## 1  0.23 Ideal     E     SI2      61.5    55   326  3.95  3.98  2.43
## 2  0.21 Premium   E     SI1      59.8    61   326  3.89  3.84  2.31
## 3  0.23 Good      E     VS1      56.9    65   327  4.05  4.07  2.31
## 4  0.29 Premium   I     VS2      62.4    58   334  4.2   4.23  2.63
## 5  0.31 Good      J     SI2      63.3    58   335  4.34  4.35  2.75
## 6  0.24 Very Good J     VVS2     62.8    57   336  3.94  3.96  2.48
ggplot(diamonds, aes(x = cut, y = carat)) +
  geom_bar(stat = "identity", fill = "blue") +
  labs(
    title = "Grouped Bar Chart Diamonds",
    subtitle = "Distribusi Diamond berdasarkan Cut dan Color",
    x = "Cut",
    y = "Carat Diamond"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold", size = 14),
    plot.subtitle = element_text(hjust = 0.5),
    axis.text.x = element_text(angle = 30, hjust = 1),
    legend.position = "right"
  )

Interpretasi

Diagram bar chart menunjukkan distribusi jumlah diamond berdasarkan kategori potongan Fair, Good, Very Good, Premium, dan Ideal, dengan pola yang meningkat dari kualitas potongan rendah ke kualitas potongan tinggi. Kategori Ideal memiliki jumlah diamond terbesar, diikuti oleh Premium dan Very Good, yang menunjukkan bahwa sebagian besar diamond dalam dataset tersebut memiliki kualitas potongan yang tinggi. Sebaliknya, kategori Good dan, khususnya, Fair memiliki jumlah diamond yang paling sedikit.

ggplot(diamonds, aes(x = cut, fill = color)) +
  geom_bar(position = "dodge") +
  labs(
    title = "Grouped Bar Chart Diamonds",
    subtitle = "Distribusi Diamond berdasarkan Cut dan Color",
    x = "Cut",
    y = "Jumlah Diamond",
    fill = "Color"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold", size = 14),
    plot.subtitle = element_text(hjust = 0.5),
    axis.text.x = element_text(angle = 30, hjust = 1),
    legend.position = "right"
  )

Interpretasi

Grafik menunjukkan distribusi jumlah diamond berdasarkan kategori cut (Fair, Good, Very Good, Premium, Ideal) dengan pengelompokan berdasarkan color (D sampai J). Terlihat bahwa kategori Ideal memiliki jumlah diamond paling tinggi di hampir semua warna, yang menunjukkan bahwa potongan Ideal merupakan kualitas potongan yang paling dominan dalam dataset. Hal ini mengidentifikasikan bahwa pasar atau produksi diamond lebih banyak berfokus pada kualitas potongan terbaik.

Pada kategori Premium dan Very Good, jumlah diamond juga relatif tinggi, namun masih berada di bawah kategori Ideal. Sementara itu, kategori Good dan terutama Fair memiliki jumlah yang jauh lebih sedikit, menunjukkan bahwa kualitas potongan rendah tidak terlalu dominan dalam distribusi data.

Dari sisi warna (color), terlihat bahwa warna G dan H cenderung memiliki jumlah paling besar pada hampir semua kategori cut, khususnya pada cut Ideal dan Premium. Sebaliknya, warna D dan J relatif lebih sedikit jumlahnya, yang menunjukkan bahwa distribusi warna menengah (middle color grade) lebih mendominasi dibandingkan warna ekstrem (paling jernih atau paling rendah kualitas warna).

Secara keseluruhan, grafik ini menunjukkan bahwa distribusi diamond dalam dataset lebih terkonsentrasi pada cut berkualitas tinggi (Ideal, Premium, Very Good) dan warna menengah (G–H). Pola ini mengindikasikan bahwa kombinasi kualitas potongan tinggi dan warna menengah merupakan karakteristik dominan dari data diamonds, yang kemungkinan merefleksikan preferensi pasar terhadap keseimbangan antara kualitas dan ketersediaan (supply).

ggplot(diamonds, aes(x = cut, fill = color)) +
  geom_bar(position = "fill") +
  labs(
    title = "Grouped Bar Chart Diamonds",
    subtitle = "Distribusi Diamond berdasarkan Cut dan Color",
    x = "Cut",
    y = "Jumlah Diamond",
    fill = "Color"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold", size = 14),
    plot.subtitle = element_text(hjust = 0.5),
    axis.text.x = element_text(angle = 30, hjust = 1),
    legend.position = "right"
  )

Interpretasi

Distribusi warna diamond pada setiap kategori cut menunjukkan pola yang relatif konsisten, di mana diamond dengan kualitas warna menengah–baik (E, F, dan G) mendominasi hampir semua jenis potongan. Warna D (kualitas tertinggi) namun tidak mendominasi, sedangkan warna I dan J (kualitas lebih rendah) memiliki proporsi paling kecil. Hal ini menunjukkan bahwa, terlepas dari perbedaan kualitas potongan, dataset diamond secara umum didominasi oleh diamond dengan kualitas warna yang cukup baik, sehingga baik cut rendah maupun tinggi tetap lebih banyak terdiri dari diamond berwarna menengah hingga tinggi kualitasnya.