Đánh giá 53940 viên kim cương trên dữ liệu Diamonds, dựa trên tiêu chuẩn 4C được viết tắt từ 4 tiêu chí của GIA gồm:
CLARITY (Cấp độ tinh khiết của kim cương)
COLOR (Cấp độ màu của kim cương)
CARAT (Trọng lượng của kim cương)
CUT (Vết cắt của kim cương (bao gồm: depth và table))
Đánh giá kim cương thông qua tiêu chuẩn 4C dựa trên biểu đồ dạng Bar-chart
Trước hết, ta cần phải gọi dữ liệu diamonds lên
Đổi tên biến cut trong dữ liệu diamonds, thay bằng tên loại để tránh bị nhầm lẫn khi đánh giá giữa loại của kim cương và vết cắt của kim cương
Trong tiêu chuẩn 4C, độ tinh khiết của kim cương là số lượng và khả năng hiển thị của các đặc điểm bên trong và bên ngoài của một viên kim cương.
Cấp độ trong cao nhất là Hoàn mỹ, được ký hiệu là IF (Internal Flawless): Những viên kim cương này không có tạp chất tỳ vết nào được nhìn thấy dưới độ phóng đại 10 lần.
Hai lớp tiếp theo được nhóm lại với nhau là VVS1 và VVS2: Những viên kim cương này được định nghĩa là rất rất ít tỳ vết bên trong, gồm cấp độ thứ nhất (VVS1) hoặc thứ hai (VVS2).
Tiếp theo là các cấp độ tinh khiết VS1 và VS2: Các đầu kim (needle) và vết lông vũ nhỏ (small feather) có thể được tìm thấy trong các lớp VS1 và VS2 này nhưng chúng vẫn rất nhỏ so với kích thước của viên kim cương.
Cấp độ mà tỳ vết hoặc tạp chất có thể nhìn thấy rõ ràng là SI1 và SI2: Tạp chất dễ nhìn thấy dưới độ phóng đại ký loupe cầm tay nhưng thường không thể nhìn thấy bằng mắt thường.
Phạm vi cấp độ rõ ràng cuối cùng là I1: Các tạp chất có thể lớn hơn trong tự nhiên, có thể sẫm màu và có thể nhìn thấy bằng mắt trong số các thuộc tính có thể có khác.
d %>% group_by(clarity) %>% summarise(n = n()) %>%
ggplot(aes(clarity,n)) +
geom_col(fill='pink') +
geom_text(aes(label = n),vjust = 0, color = 'palevioletred') +
xlab('Độ tinh khiết') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 1: Cấp độ tinh khiết của kim cương')d %>% group_by(clarity) %>% summarise(n = n()) %>%
ggplot(aes(clarity,n)) +
geom_col(fill='pink') +
geom_text(aes(label = percent(n/length(d$clarity))),vjust = 0, color = 'palevioletred') +
xlab('Độ tinh khiết') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 2: Cấp độ tinh khiết của kim cương (%)')Qua hình trên ta thấy được:
Độ tinh khiết của kim cương có số lượng tăng dần từ cấp độ I1 đến SI1, nhưng lại giảm dần từ cấp độ VS2 đến cấp độ IF.
Kim cương chiếm số lượng nhiều nhất là ở độ tinh khiết SI1, điều này cho thấy ở cấp độ này người ta dễ dàng khai thác hơn các cấp độ còn lại.
Kim cương ở độ tinh khiết cao nhất IF chiếm số lượng không nhiều, điều này cho thấy muốn khai thác kim cương ở độ tinh khiết này không dễ dàng.
d <- d %>% mutate(clarity_code = case_when(
clarity == "IF" | clarity == "VVS1" | clarity == "VVS2" ~ 1,
clarity == "VS1" | clarity == "VS2" | clarity == "SI1" | clarity == "SI2" ~ 2,
clarity == "I1" ~ 3))
d <- mutate(d, clarityC = cut(clarity_code, 3, label = c('không tỳ vết', 'ít tỳ vết','nhiều tỳ vết')))
d %>% group_by(clarityC) %>% summarise(n=n()) %>%
ggplot(aes(clarityC, n)) +
geom_col(fill = 'pink') +
geom_text(aes(label = n), vjust = 0, color = 'palevioletred') +
xlab('Độ tinh khiết') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 3: Cấp độ tinh khiết của kim cương')Qua hình trên ta thấy được:
Có sự chênh lệch lớn về số lượng kim cương giữa 3 cấp độ.
Kim cương nhiều tỳ vết chiếm số lượng thấp nhất chỉ 741 viên trên tổng số 53940 viên, điều này cho thấy số lượng kim cương nhiều tỳ vết không đáng kể.
Kim cương không tỳ vết chiếm số lượng tương đối là 10511 viên trên tổng số 53940 viên, điều này có thể do kim cương có cấp độ tinh khiết cao hiếm hơn kim cương ở các cấp độ còn lại.
d %>% group_by(clarity) %>% summarise(m = mean(price)) %>%
ggplot(aes(clarity, m)) +
geom_col(fill = 'pink') +
geom_text(aes(label = round(m)), vjust = 0, color = 'palevioletred') +
xlab('Độ tinh khiết') +
ylab('Giá bán trung bình') +
labs(title = 'Hình 4: Cấp độ tinh khiết của kim cương dựa trên giá bán trung bình')d %>% group_by(clarity) %>% summarise(m = mean(price)) %>%
ggplot(aes(clarity,m)) +
geom_col(fill='pink') +
geom_text(aes(label = percent(m/length(d$clarity))), vjust = 0, color = 'palevioletred') +
xlab('Độ tinh khiết') +
ylab('Giá bán trung bình') +
labs(title = 'Hình 5: Cấp độ tinh khiết của kim cương dựa trên giá bán trung bình (%)')Qua hình trên ta thấy được:
Các cấp độ tinh khiết: I1, SI1, VS2, VS1 có độ chênh lệch giữa giá bán trung bình không đáng kể.
Kim cương ở cấp độ gần nhưng không có tỳ vết VVS1, VVS2 và IF lại có giá bán trung bình không cao, điều đó chứng tỏ khách hàng không chú trọng nhiều đến độ tinh khiết của kim cương hơn các yếu tố khác.
Kim cương ở cấp độ SI2 có giá bán cao nhất khoảng 9.4%, dù độ tinh khiết không cao nhưng kim cương SI2 lại có trọng lượng lớn hơn (chứng minh ở hình 19).
d %>% group_by(clarity,loai) %>% summarise(n=n()) %>%
ggplot(aes(x = clarity,y = n)) +
geom_col(fill='pink') +
geom_text(aes(label = round(n)), vjust = 0, color = 'palevioletred') +
facet_wrap(~loai) +
xlab('Độ tinh khiết') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 6: Cấp độ tinh khiết của kim cương dựa trên loại kim cương')## `summarise()` has grouped output by 'clarity'. You can override using the
## `.groups` argument.
Qua hình trên ta thấy được:
## `summarise()` has grouped output by 'clarity'. You can override using the
## `.groups` argument.
d1 %>% ggplot(aes(loai, n)) +
geom_col(data = d1 %>% filter(clarity == 'SI1'), fill = 'pink') +
geom_col(data = d1 %>% filter(clarity == 'SI2'), fill = 'palevioletred') +
xlab('Loại') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 7: Cấp độ tinh khiết SI1 và SI2 của kim cương dựa trên loại kim cương')Qua hình trên ta thấy được:
SI1: Tạp chất thường nằm ở vị trí khó nhìn thấy hơn, hoặc nhỏ hơn so với SI2. Ta cũng thấy SI1 có số lượng ít hơn SI2, điều này cũng có thể cho thấy quá trình khai thác và chế tác kim cương tạo ra ít kim cương có tạp chất ở mức độ SI1 hơn.
Do đó mà kim cương SI1 chiếm số lượng nhiều ở loại Ideal.
SI2: Tạp chất thường nằm ở vị trí dễ nhìn thấy hơn, hoặc lớn hơn so với SI1, cũng vì thế mà nó chiếm số lượng nhiều nhất ở loại Premium.
Cấp độ màu của kim cương không đề cập đến màu sắc mà là “độ trong” của màu sắc:
D, E và F đều được coi là các lớp kim cương không màu.
Chúng là nhóm màu trắng cao nhất trong thang GIA và chỉ có sự khác biệt nhỏ (chủ yếu là độ trong suốt) có thể xuất hiện với khó khăn trong việc phân tách các lớp dưới chế độ xem thông thường. G, H, I và J đều được coi là gần như không màu.
d %>% group_by(color) %>% summarise(n = n()) %>%
ggplot(aes(color,n)) +
geom_col(fill='firebrick') +
geom_text(aes(label = n),vjust = 0, color = 'black') +
xlab('Màu sắc') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 8: Cấp độ màu của kim cương')d %>% group_by(color) %>% summarise(n = n()) %>%
ggplot(aes(color,n)) +
geom_col(fill='firebrick') +
geom_text(aes(label = percent(n/length(d$color))),vjust = 0, color = 'black') +
xlab('Màu sắc') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 9: Cấp độ màu của kim cương (%)')Qua hình trên ta thấy được:
Màu G chiếm 20,93%, là màu sắc phổ biến nhất trong số các viên kim cương được phân loại.
Màu J chỉ Chiếm 5.21%, là màu sắc hiếm nhất, được xếp vào cấp độ “gần như không màu”.
Màu D, E, F được xếp cùng một nhóm nhưng màu D lại chiếm số lượng ít hơn chỉ 12.56%. Trong khi hai màu còn lại chiếm tỷ lệ tương đối đồng đều, dao động từ 17.69% đến 18.16%.
Nhóm màu G, H, I, J chiếm hơn 50% tổng số kim cương được phân loại và số lượng kim cương giảm dần theo cấp độ màu từ G đến J.
d <- d %>% mutate(color_code = case_when(
color == "D" | color == "E" | color == "F" ~ 1,
color == "G" | color == "H" | color == "I" | color == "J" ~ 2))
d <- mutate(d, colorC = cut(color_code, 2, label = c('không màu', 'gần như không màu')))
d %>% group_by(colorC) %>% summarise(n=n()) %>%
ggplot(aes(colorC, n)) +
geom_col(fill='firebrick') +
geom_text(aes(label = n), vjust = 0, color = 'black') +
xlab('Màu sắc') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 10: Cấp độ màu của kim cương')Qua hình trên ta thấy được:
d %>% group_by(color) %>% summarise(m = mean(price)) %>%
ggplot(aes(color, m)) +
geom_col(fill='firebrick') +
geom_text(aes(label = round(m)), vjust = 0, color = 'black') +
xlab('Màu sắc') +
ylab('Giá bán trung bình') +
labs(title = 'Hình 11: Cấp độ màu của kim cương dựa trên giá bán trung bình')d %>% group_by(color) %>% summarise(m = mean(price)) %>%
ggplot(aes(color,m)) +
geom_col(fill='firebrick') +
geom_text(aes(label = percent(m/length(d$color))),vjust = 0, color = 'black') +
xlab('Màu sắc') +
ylab('Giá bán trung bình') +
labs(title = 'Hình 12: Cấp độ màu của kim cương dựa trên giá bán trung bình (%)')Qua hình trên ta thấy được:
Giá bán trung bình tăng đều từ màu E đến màu J, trong khi nhóm màu D, E, F là nhóm có mức độ trong cao hơn nhưng lại có giá bán thấp hơn. Điều đó cho thấy, khách hàng lựa chọn mua kim cương không chỉ dựa vào màu sắc hay độ tinh khiết mà còn chịu tác động nhiều hơn của các yếu tố khác.
Màu D và E có sự chệnh lệch không nhiều về giá bán, điều đó cho thấy hai mức độ này gần như được xem xét và đánh giá gần giống nhau.
d %>% group_by(color, loai) %>% summarise(n=n()) %>%
ggplot(aes(x = color, y = n)) +
geom_col(fill='firebrick') +
geom_text(aes(label = round(n)), vjust = 0, color = 'black') +
facet_wrap(~loai) +
xlab('Màu sắc') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 13: Cấp độ màu của kim cương dựa trên loại kim cương')## `summarise()` has grouped output by 'color'. You can override using the
## `.groups` argument.
Qua hình trên ta thấy được:
Số lượng kim cương dựa trên màu kim cương hầu như tăng dần theo từng loại, từ loại Fair, Good, Very Good, Premium và Ideal. Điều đó cho thấy, kim cương ở loại càng cao thì có số lượng càng nhiều.
Trong đó ta thấy, màu J chiếm tỷ lệ thấp nhất trong tất cả các loại kim cương, điều này cho thấy màu J có mức độ hiếm nhất vì thế nên giá bán cũng cao nhất so với các cấp độ màu khác (chứng minh ở hình 12).
Trọng lượng carat của viên kim cương được xác định bằng cách cân viên kim cương trên một chiếc cân điện tử chính xác. Một carat bằng 1/5 gam, vì vậy một gam sẽ bằng năm carat.
Số carat thường được giữ hai số thập phân cuối cùng, ví dụ như 1.53 , 1.00 , 2.93 carat. Vì vậy, một viên kim cương một nửa carat sẽ được biểu thị bằng 0,50 carat, một viên kim cương một carat sẽ được biểu thị bằng 1,00.
Trọng lượng chính xác là rất quan trọng vì việc định giá dựa trên trọng lượng này và có sự khác biệt đáng kể về giá cả đôi khi chỉ hơn một phần trăm carat. Một viên kim cương nặng 0,99 carat có giá thấp hơn một viên kim cương nặng 1,00 carat. Tuy nhiên nếu nhìn bằng mắt thường bạn sẽ không phân biệt được sự khác biệt này.
d %>% group_by(carat) %>% filter(carat >= 0.4 & carat <= 0.45) %>% summarise(n = n()) %>%
ggplot(aes(carat,n)) +
geom_col(fill='lightblue') +
geom_text(aes(label = n),vjust = 0, color = 'navy') +
xlab('Trọng lượng') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 14: Trọng lượng từ 0.4 đến 0.45 của kim cương')d %>% group_by(carat) %>% filter(carat >= 0.4 & carat <= 0.45) %>% summarise(n = n()) %>%
ggplot(aes(carat,n)) +
geom_col(fill='lightblue') +
geom_text(aes(label = percent(n/length(d$carat))),vjust = 0, color = 'navy') +
xlab('Trọng lượng') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 15: Trọng lượng từ 0.4 đến 0.45 của kim cương (%)')Qua hình trên ta thấy được:
Nhóm 0.4 - 0.41 carat: Chiếm gần 50%, là nhóm trọng lượng phổ biến nhất trong số các viên kim cương được phân loại.
Nhóm 0.42 - 0.45 carat: Chiếm gần 30%, giảm dần từ 0.42 carat đến 0.45 carat, điều đó cho thấy mức độ phổ biến của nhóm trọng lượng này không cao.
d %>% group_by(carat) %>% filter(carat >= 0.4 & carat <= 0.45) %>% summarise(m = round(mean(price),0)) %>%
ggplot(aes(carat, m)) +
geom_col(fill='lightblue') +
geom_text(aes(label = m), vjust = 0, color = 'navy') +
xlab('Trọng lượng') +
ylab('Giá bán trung bình') +
labs(title = 'Hình 16: Trọng lượng từ 0.4 đến 0.45 của kim cương dựa trên giá bán trung bình')d %>% group_by(carat) %>% filter(carat >= 0.4 & carat <= 0.45) %>% summarise(m = round(mean(price),0)) %>%
ggplot(aes(carat,m)) +
geom_col(fill='lightblue') +
geom_text(aes(label = percent(m/length(d$carat))), vjust = 0, color = 'navy') +
xlab('Trọng lượng') +
ylab('Giá bán trung bình') +
labs(title = 'Hình 17: Trọng lượng từ 0.4 đến 0.45 của kim cương dựa trên giá bán trung bình (%)')Qua hình trên ta thấy được:
d %>% group_by(carat,loai) %>% filter(carat >= 0.4 & carat <= 0.45) %>% summarise(n=n()) %>%
ggplot(aes(x = carat,y = n)) +
geom_col(fill='lightblue') +
geom_text(aes(label = n), vjust = 0, color = 'navy') +
facet_wrap(~loai) +
xlab('Trọng lượng') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 18: Trọng lượng từ 0.4 đến 0.45 của kim cương dựa trên loại kim cương')## `summarise()` has grouped output by 'carat'. You can override using the
## `.groups` argument.
Qua hình trên ta thấy được:
## `summarise()` has grouped output by 'clarity'. You can override using the
## `.groups` argument.
d2 %>% ggplot(aes(clarity, n)) +
geom_col(data = d2 %>% filter(carat == '0.4'), fill = 'lightblue') +
geom_col(data = d2 %>% filter(carat == '2'), fill = 'navy') +
xlab('Loại') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 19: Trọng lượng 0.4 và 2 của kim cương dựa trên độ tinh khiết')Qua hình trên ta thấy được:
Vết cắt của viên kim cương trong tiêu chuẩn 4C thường bị nhầm lẫn với hình dạng thực sự của viên kim cương: Vết cắt (CUT) được đánh giá bằng các tỷ lệ chứ không phải về hình dạng, bao gồm
Mặt Bàn (table): Mặt bàn có hình lục giác, là bề mặt lớn nhất trên đỉnh của viên kim cương. Đo bằng milimét và sau đó chia cho đường kính trung bình của viên kim cương để lấy phần trăm (% table).
Đối với một viên kim cương tròn, 60% là tiêu chuẩn để giúp bạn so sánh vì đây là một kích thước mặt bàn kim cương đẹp.
Khi mặt bàn kim cương lớn hơn 65% được coi là lớn, là không còn là chỉ số tối ưu. Kích thước bảng dưới 60% được coi là nhiều hơn trong phạm vi “lý tưởng”, giảm xuống khoảng 53%. Dưới đó, bảng có thể được coi là quá nhỏ.
Chiều sâu (depth): Chiều sâu của viên kim cương có thể được tính bằng cách chia tổng chiều sâu từ đỉnh đến đáy của viên kim cương cho đường kính trung bình. Một lần nữa, 60% là tiêu chuẩn để đánh giá. Nếu viên kim cương quá sâu, nó có thể xuất hiện màu tối. Nếu viên kim cương quá nông, nó có thể mất độ sáng khi ánh sáng lọt ra ngoài. Thông thường, đối với một viên kim cương tròn, 57,5% đến 63% là phạm vi ưa thích.
d %>% group_by(table) %>% filter(table >= 56 & table <= 60) %>% summarise(n = n()) %>%
ggplot(aes(table, n)) +
geom_col(fill = 'lightgreen') +
geom_text(aes(label = n), vjust = 0, color = 'darkgreen') +
xlab('Chiều dài mặt bàn') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 20: Chiều dài mặt bàn từ 56% đến 60% của kim cương')Qua hình trên ta thấy được:
Từ biểu đồ trên ta có thể thấy các giá trị trong khoảng 56.1% - 56.9%, 57.1% - 57.9%, 58.1% - 58.9%, 59.1% - 59.9% chỉ chiếm số lượng rất ít. Ngược lại, các viên kim cương có % chiều dài mặt bàn là số tự nhiên như 56%, 57%, 58%, 59%, 60% lại chiếm tỷ lệ rất cao.
Tiến hành nghiên cứu chiều dài mặt bàn của kim cương có % chính xác là 56%, 57%, 58%, 59%, 60%
d %>% group_by(table) %>% filter(table == 56 | table == 57 | table == 58 | table == 59 | table == 60) %>% summarise(n = n()) %>%
ggplot(aes(table, n)) +
geom_col(fill = 'lightgreen') +
geom_text(aes(label = n), vjust = 0, color = 'darkgreen') +
xlab('Chiều dài mặt bàn') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 21: Chiều dài mặt bàn từ 56% đến 60% của kim cương')d %>% group_by(table) %>% filter(table == 56 | table == 57 | table == 58 | table == 59 | table == 60) %>% summarise(n = n()) %>%
ggplot(aes(table,n)) +
geom_col(fill='lightgreen') +
geom_text(aes(label = percent(n/length(d$table))),vjust = 0, color = 'darkgreen') +
xlab('Chiều dài mặt bàn') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 22: Chiều dài mặt bàn từ 56% đến 60% của kim cương (%)')Qua hình trên ta thấy được:
d %>% group_by(table) %>% filter(table == 56 | table == 57 | table == 58 | table == 59 | table == 60) %>% summarise(m = round(mean(price),0)) %>%
ggplot(aes(table, m)) +
geom_col(fill = 'lightgreen') +
geom_text(aes(label = m), vjust = 0, color = 'darkgreen') +
xlab('Chiều dài mặt bàn') +
ylab('Giá bán trung bình') +
labs(title = 'Hình 23: Chiều dài mặt bàn từ 56% đến 60% của kim cương dựa trên giá bán trung bình')d %>% group_by(table) %>% filter(table == 56 | table == 57 | table == 58 | table == 59 | table == 60) %>% summarise(m = mean(price)) %>%
ggplot(aes(table,m)) +
geom_col(fill='lightgreen') +
geom_text(aes(label = percent(m/length(d$table))), vjust = 0, color = 'darkgreen') +
xlab('Chiều dài mặt bàn') +
ylab('Giá bán trung bình') +
labs(title = 'Hình 24: Chiều dài mặt bàn từ 56% đến 60% của kim cương dựa trên giá bán trung bình (%)')Qua hình trên ta thấy được:
d %>% group_by(table,loai) %>% filter(table == 56 | table == 57 | table == 58 | table == 59 | table == 60) %>% summarise(n=n()) %>%
ggplot(aes(x = table,y = n)) +
geom_col(fill = 'lightgreen') +
geom_text(aes(label = n), vjust = 0, color = 'darkgreen') +
facet_wrap(~loai) +
xlab('Chiều dài mặt bàn') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 25: Chiều dài mặt bàn từ 56% đến 60% của kim cương dựa trên loại kim cương')## `summarise()` has grouped output by 'table'. You can override using the
## `.groups` argument.
Qua hình trên ta thấy được:
Ở loại Fair và Good chiếm số lượng kim cương dựa trên chiều dài mặt bàn là không đáng kể.
Kim cương phân bố ở loại Very Good số lượng không có biến động nhiều.
Kim cương có chiều dài mặt bàn 58%, 59% và 60% phân bố lớn nhất ở loại Premium, và có số lượng giảm dần từ 58% đến 60%.
Kim cương có chiều dài mặt bàn 56% và 57% phân bố lớn nhất ở loại Ideal, điều đó cho thấy loại Ideal được cắt gọt theo chiều dài mặt bàn 56% và 57% có tỷ lệ tối ưu, giúp kim cương có độ sáng, độ lửa và độ bóng tốt nhất.
d %>% group_by(depth) %>% filter(depth >= 60 & depth <= 63) %>% summarise(n = n()) %>%
ggplot(aes(depth,n)) +
geom_col(fill='orange') +
geom_text(aes(label = n), vjust = 0, color = 'tomato') +
xlab('Chiều sâu') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 26: Chiều sâu từ 60% đến 63% của kim cương')d %>% group_by(depth) %>% filter(depth >= 60 & depth <= 63) %>% summarise(n = n()) %>%
ggplot(aes(depth,n)) +
geom_col(fill='orange') +
geom_text(aes(label = percent(n/length(d$depth))), vjust = 0, color = 'tomato') +
xlab('Chiều sâu') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 27: Chiều sâu từ 60% đến 63% của kim cương (%)')Qua hình trên ta thấy được:
Chiều sâu kim cương từ 60% đến 63% có sự tăng giảm không đồng đều.
Chiều sâu từ 60% đến 62% hầu như tăng (có một số ít giảm nhưng không đáng kể) và chiếm tỷ lệ cao nhất là 4.151% ở chiều sâu 62%.
Kim cương có chiều sâu từ 62.1% đến 63% có xu hướng giảm dần (có một số ít tăng nhưng không đáng kể)
d %>% group_by(depth) %>% filter(depth >= 60 & depth <= 63) %>% summarise(m = round(mean(price),0)) %>%
ggplot(aes(depth, m)) +
geom_col(fill = 'orange') +
geom_text(aes(label = m), vjust = 0, color = 'tomato') +
xlab('Chiều sâu') +
ylab('Giá bán trung bình') +
labs(title = 'Hình 28: Chiều sâu từ 60% đến 63% của kim cương dựa trên giá bán trung bình')d %>% group_by(depth) %>% filter(depth >= 60 & depth <= 63) %>% summarise(m = round(mean(price),0)) %>%
ggplot(aes(depth, m)) +
geom_col(fill='orange') +
geom_text(aes(label = percent(m/length(d$depth))), vjust = 0, color = 'tomato') +
xlab('Chiều sâu') +
ylab('Giá bán trung bình') +
labs(title = 'Hình 29: Chiều sâu từ 60% đến 63% của kim cương dựa trên giá bán trung bình (%)')Qua hình trên ta thấy được:
d %>% group_by(depth,loai) %>% filter(depth >= 60 & depth <= 63) %>% summarise(n=n()) %>%
ggplot(aes(x = depth,y = n)) +
geom_col(fill='orange') +
facet_wrap(~loai) +
xlab('Chiều sâu') +
ylab('Số lượng (viên)') +
labs(title = 'Hình 30: Chiều sâu từ 60% đến 63% của kim cương dựa trên loại kim cương')## `summarise()` has grouped output by 'depth'. You can override using the
## `.groups` argument.
Qua hình trên ta thấy được:
Ở loại Fair và Good chiếm số lượng kim cương dựa trên chiều sâu là không đáng kể.
Ở loại Very Good và Premium số lượng kim cương hầu như tăng (có một số ít giảm nhưng không đáng kể)
Ở loại Ideal số lượng kim cương tăng dần từ chiều sâu 60% đến 62%, điều đó cho thấy kim cương có chiều sâu lớn hơn thường có chất lượng tốt hơn và việc cắt kim cương trở nên dễ dàng hơn. Do đó, có nhiều kim cương có thể đạt được cấp độ Ideal hơn.
Ở loại Ideal số lượng kim cương giảm dần từ chiều sâu 62.1% đến 63%. Điều đó cho thấy kim cương có chiều sâu quá lớn có thể gặp vấn đề về độ bền và việc cắt kim cương trở nên khó khăn hơn. Do đó, có ít kim cương có thể đạt được cấp độ Ideal hơn.