Point Satu

head(diamonds)
## # A tibble: 6 × 10
##   carat cut       color clarity depth table price     x     y     z
##   <dbl> <ord>     <ord> <ord>   <dbl> <dbl> <int> <dbl> <dbl> <dbl>
## 1  0.23 Ideal     E     SI2      61.5    55   326  3.95  3.98  2.43
## 2  0.21 Premium   E     SI1      59.8    61   326  3.89  3.84  2.31
## 3  0.23 Good      E     VS1      56.9    65   327  4.05  4.07  2.31
## 4  0.29 Premium   I     VS2      62.4    58   334  4.2   4.23  2.63
## 5  0.31 Good      J     SI2      63.3    58   335  4.34  4.35  2.75
## 6  0.24 Very Good J     VVS2     62.8    57   336  3.94  3.96  2.48

Diagram bar chart menunjukkan distribusi jumlah diamond berdasarkan kategori potongan Fair, Good, Very Good, Premium, dan Ideal, dengan pola yang meningkat dari kualitas potongan rendah ke kualitas potongan tinggi. Kategori Ideal memiliki jumlah diamond terbesar, diikuti oleh Premium dan Very Good, yang menunjukkan bahwa sebagian besar diamond dalam dataset tersebut memiliki kualitas potongan yang tinggi. Sebaliknya, kategori Good dan, khususnya, Fair memiliki jumlah diamond yang paling sedikit.

Grafik menunjukkan distribusi jumlah diamond berdasarkan kategori cut (Fair, Good, Very Good, Premium, Ideal) dengan pengelompokan berdasarkan color (D sampai J). Terlihat bahwa kategori Ideal memiliki jumlah diamond paling tinggi di hampir semua warna, yang menunjukkan bahwa potongan Ideal merupakan kualitas potongan yang paling dominan dalam dataset. Hal ini mengidentifikasikan bahwa pasar atau produksi diamond lebih banyak berfokus pada kualitas potongan terbaik.

Pada kategori Premium dan Very Good, jumlah diamond juga relatif tinggi, namun masih berada di bawah kategori Ideal. Sementara itu, kategori Good dan terutama Fair memiliki jumlah yang jauh lebih sedikit, menunjukkan bahwa kualitas potongan rendah tidak terlalu dominan dalam distribusi data.

Dari sisi warna (color), terlihat bahwa warna G dan H cenderung memiliki jumlah paling besar pada hampir semua kategori cut, khususnya pada cut Ideal dan Premium. Sebaliknya, warna D dan J relatif lebih sedikit jumlahnya, yang menunjukkan bahwa distribusi warna menengah (middle color grade) lebih mendominasi dibandingkan warna ekstrem (paling jernih atau paling rendah kualitas warna).

Secara keseluruhan, grafik ini menunjukkan bahwa distribusi diamond dalam dataset lebih terkonsentrasi pada cut berkualitas tinggi (Ideal, Premium, Very Good) dan warna menengah (G–H). Pola ini mengindikasikan bahwa kombinasi kualitas potongan tinggi dan warna menengah merupakan karakteristik dominan dari data diamonds, yang kemungkinan merefleksikan preferensi pasar terhadap keseimbangan antara kualitas dan ketersediaan (supply).

Distribusi warna diamond pada setiap kategori cut menunjukkan pola yang relatif konsisten, di mana diamond dengan kualitas warna menengah–baik (E, F, dan G) mendominasi hampir semua jenis potongan. Warna D (kualitas tertinggi) namun tidak mendominasi, sedangkan warna I dan J (kualitas lebih rendah) memiliki proporsi paling kecil. Hal ini menunjukkan bahwa, terlepas dari perbedaan kualitas potongan, dataset diamond secara umum didominasi oleh diamond dengan kualitas warna yang cukup baik, sehingga baik cut rendah maupun tinggi tetap lebih banyak terdiri dari diamond berwarna menengah hingga tinggi kualitasnya.

Point Dua

Histogram tersebut memperlihatkan bahwa mayoritas berlian dalam dataset memiliki berat (carat) pada kategori kecil hingga menengah, dengan konsentrasi tertinggi berada pada kisaran sekitar 0,3–1 carat. Hal ini terlihat dari batang histogram yang paling tinggi pada rentang tersebut, yang menunjukkan frekuensi data terbesar. Seiring bertambahnya nilai carat, jumlah berlian semakin menurun, sehingga berlian dengan berat di atas 2 carat relatif jarang, dan yang mendekati atau melebihi 3 carat jumlahnya sangat terbatas. Secara umum, pola sebaran data membentuk distribusi yang condong ke kanan (right-skewed), yang menunjukkan bahwa data lebih terpusat pada berlian berukuran kecil, sedangkan berlian berukuran besar jauh lebih sedikit dalam dataset.

Box plot tersebut memperlihatkan adanya variasi berat berlian (carat) pada setiap kategori potongan. Nilai median carat pada potongan Fair dan Premium tampak relatif lebih tinggi, sementara potongan Ideal memiliki median yang lebih rendah, yang menunjukkan bahwa banyak berlian dengan potongan Ideal berukuran lebih kecil. Pada seluruh kategori juga terlihat keberadaan outlier di bagian atas, yang menandakan adanya beberapa berlian berukuran besar meskipun jumlahnya terbatas. Secara umum, sebagian besar berlian di tiap jenis potongan tetap berada pada rentang carat kecil hingga menengah.

Violin plot tersebut menggambarkan distribusi berat berlian (carat) berdasarkan kategori warna dari D hingga J. Pada seluruh warna, mayoritas berlian berada pada ukuran carat kecil, yang terlihat dari bagian grafik yang paling lebar di kisaran sekitar 0,3–1 carat. Namun, pada warna yang lebih rendah seperti I dan J, sebaran carat tampak lebih luas dan mencapai nilai yang lebih tinggi, sehingga menunjukkan bahwa berlian berukuran besar lebih sering ditemukan pada kategori warna tersebut. Sebaliknya, warna dengan kualitas lebih baik seperti D dan E menunjukkan distribusi yang lebih terkonsentrasi pada ukuran kecil hingga menengah. Secara keseluruhan, meskipun semua warna didominasi oleh berlian berukuran kecil, kategori warna yang lebih rendah cenderung memiliki variasi ukuran yang lebih besar.

Density plot tersebut memperlihatkan distribusi berat berlian (carat) dalam bentuk kurva kepadatan. Puncak tertinggi terlihat pada rentang carat kecil, sekitar 0,3–0,5 carat, yang menunjukkan bahwa ukuran tersebut merupakan yang paling dominan dalam data. Selanjutnya, kurva masih membentuk beberapa puncak yang lebih kecil di sekitar 1 carat dan sedikit di atasnya, menandakan bahwa berlian dengan ukuran tersebut juga cukup banyak dijumpai. Seiring bertambahnya nilai carat, kurva kepadatan terus menurun hingga mendekati nol, yang mengindikasikan bahwa berlian berukuran besar jumlahnya semakin jarang. Secara umum, grafik ini menunjukkan dominasi berlian berukuran kecil dengan pola distribusi yang condong ke kanan (right-skewed).