t <- diamonds
t %>% group_by(clarity) %>% summarise(m= mean(price)) %>%
ggplot(aes(x = clarity,y = m)) +
geom_col(position = 'dodge') +
geom_text(aes(label = round(m,1)), vjust = 2, color = 'green') +
labs(x = 'độ trong suốt', y = 'giá')
Ta phân loại kim cương theo độ trong suốt và tính giá trung bình của từng loại . Ở biểu đồ trên thì ta gắn x là độ trong suốt, y là giá trung bình của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 01 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ trên ta thấy kim cương có độ trong suốt SI2 là có giá trung bình cao nhất, tiếp đến là SI2, thấp hơn nữa lần lượt là VS2, I1, VS1, WS2, IF và thấp nhất là Ws1
t %>% group_by(color) %>% summarise(n = n()) %>%
ggplot(aes(color,n)) +
geom_col(fill='red') +
geom_text(aes(label = n),vjust = 2, color = 'black') +
xlab('Color') +
ylab('Số lượng') +
labs(title ='số lượng kim cương theo màu sắc')
Ta Phân loại kim cương theo màu sắc và tính số lượng của từng màu sắc. x là màu sắc của kim cương, y là số lượng của từng loại màu sắc. Các số liệu có màu đen, được điều chỉnh ở vị trí dọc cách cột 2 đơn vị. Màu của các cột là màu đỏ . Qua biểu đồ trên ta thấy được nhiều nhất là màu G với 11292 viên, tiếp đến là E với 9797 viên, F với 9542 viên, H với 8304 viên,D với 6775 viên, I với 5422 viên và ít nhất là màu J với 2808 viên # BIỂU ĐỒ 3
t %>% ggplot(aes(x = cut)) +
geom_bar() +
labs(x = 'Loại', y = 'Số lượng') +
coord_flip() +
labs(title = 'Số kim cương theo kiểu cắt(biểu đồ ngang)')
Ta phân loại kim cương theo kiểu cắt. Biểu đồ ngang trên cho ta thấy được kiểu Gía của kim cương theo từng kiểu cắt. Ta thấy số kim cương sẽ tăng dần từ Fair, Good, Very Good, Premium, Ideal
t %>% ggplot(aes(x = cut)) +
geom_bar() +
labs(x = 'Loại', y = 'Số lượng') +
labs(title = 'Số kim cương theo kiểu cắt(biểu đồ dọc)')
Ta phân loại kim cương theo kiểu cắt. Biểu đồ dọc trên cho ta thấy được kiểu Gía của kim cương theo từng kiểu cắt. Ta thấy số kim cương sẽ tăng dần từ Fair, Good, Very Good, Premium, Ideal
t %>% group_by(carat) %>% filter(carat == 0.5 | carat == 1.00 | carat == 1.5 | carat == 2.05) %>% summarise(n = n()) %>%
ggplot(aes(carat,n)) +
geom_col(fill='blue') +
geom_text(aes(label = n),vjust = 2, color = 'white') +
xlab('Carat') +
ylab('Số lượng')
*Ta phân loại kim cương theo trọng lượng carat ở các mốc 0.5, 1.0, 1.5, 2.0 và tính số lượng của từng mốc khối lương. ta gắn x là carat và y là số lượng từng mốc carat. Các cột biểu đồ có màu xanh lá cây, các số liệu có màu trắng, được điều chỉnh ở vị trí dọc cách cột 2 đơn vị . Qua biểu đồ trên ta thấy được số kim cương có trọng lượng 1.0 carat là nhiều nhất và thấp nhất là 2.0
t %>% group_by(cut) %>% summarise(n = mean(price)) %>%
ggplot(aes(cut,n)) +
geom_col(fill='green') +
geom_text(aes(label = round(n,2)),vjust = 2, color = 'red') +
labs(x = 'Loại', y = 'Số lượng')
Ta phân loại kim cương theo kiểu cắt và tính giá trung bình. Ta gắn x là kiểu cắt, y là số lượng. Các số liệu sẽ có màu đỏ, được làm tròn đến 2 chữ thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2; cột biểu đồ có màu xanh lá cây. Qua biểu đồ ta thấy giá trung bình của từng kiểu cắt sẽ tăng dần từ Ideal, Good, Very Good, Fair, Premium
t %>% group_by(cut) %>% summarise(m= mean(carat)) %>%
ggplot(aes(x = cut,y = m)) +
geom_col(position = 'dodge') +
geom_text(aes(label = round(m,2)), vjust = 2, color = 'red') +
labs(x = 'Kiểu cắt', y = 'Trọng lượng trung bình')
Ta phân loại kiểu cắt kim cương và tính trọng lượng trung bình (carat). ta gắn x là kiểu cắt, y là trọng lượng trung bình. Các số liệu sẽ có màu đỏ, được làm tròn đến 2 chữ thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ ta thấy được trọng lương trung bình của kim cương tăng từ Ideal(0.7 carat), Very Good(0.81 carat), Good(0.85 carat), Premium(0.89 carat) và Fair(1.05 carat)
t %>% group_by(color) %>% summarise(m= mean(carat)) %>%
ggplot(aes(x = color,y = m)) +
geom_col(position = 'dodge') +
geom_text(aes(label = round(m,2)), vjust = 2, color = 'green') +
labs(x = 'Màu', y = 'Trọng lượng trung bình')
Ta phân loại kim cương theo màu sắc và tính trọng lượng trung bình theo đơn vị carat của từng loại . Ở biểu đồ trên thì ta gắn x là màu sắc, y là trọng lượng trung bình của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 2 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ trên ta thấy màu J có trọng lượng trung bình cao nhất là giảm dần từ I, H , G , F, màu D Và E có trọng lượng trung bình thấp nhất.
t %>% group_by(color) %>% summarise(m= mean(price)) %>%
ggplot(aes(x = color,y = m)) +
geom_col(position = 'dodge') +
geom_text(aes(label = round(m,0)), vjust = 2, color = 'green') +
labs(x = 'màu sắc', y = 'Gía trung bình')
Ta phân loại kim cương theo màu sắc và tính giá trung bình của từng loại . Ở biểu đồ trên thì ta gắn x là màu sắc, y là giá trung bình của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 0 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ trên Ta thấy màu J có giá trung bình cao nhất và giảm dần từ I, H, G, F, D và thấp nhất là màu D VỚI 3170 Đơn vị giá # BIỂU ĐỒ 10
ggplot(diamonds , aes_string(x = "cut", y = "price")) +
geom_bar(stat = "identity") +
labs(title = "Giá kim cương theo kiểu cắt",
x = "Kiểu cắt",
y = "Giá")
Ta phân loại kim cương theo tổng giá và kiểu cắt. Biểu đồ trên cho ta thấy được kiểu Gía của kim cương theo từng kiểu cắt. Ta thấy kiểu cắt Ideal thì giá kim cương sẽ tăng dần từ Fair, Good, Very Good, Premium, Ideal
t %>% group_by(cut) %>% summarise(n = n()) %>%
ggplot(aes(cut,n)) +
geom_col(fill='green') +
geom_text(aes(label = n),vjust = 2, color = 'red') +
labs(x = 'Kiểu Cắt', y = 'Số lượng')
Ta phân loại kim cương theo kiểu cắt và tính số lượng của từng màu . Ở biểu đồ trên thì ta gắn x là kiểu cắt, y là số lượng của từng loại; các số liệu sẽ có màu đỏ và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2; các cột sẽ có màu xanh lá cây. Qua biểu đồ trên ta thấy loại Fair có số lượng ít nhất và tăng dần theo kiểu cắt Good, Very Good, Premium và kiểu cắt Premium là cố số lượng nhiều nhất # BIỂU ĐỒ 12
t %>% group_by(clarity) %>% summarise(n = n()) %>%
ggplot(aes(x = clarity,y = n)) +
geom_col(position = 'dodge') +
geom_text(aes(label = round(n,2)), vjust = 2, color = 'green') +
labs(x = 'độ trong suốt', y = 'số lượng')
Ta phân loại kim cương theo độ trong suốt và tính số lượng . Ở biểu đồ trên thì ta gắn x là độ trong suốt, y là số lượng của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 5 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ trên ta thấy độ trong suốt có số lượng nhiều nhất là SI1, giảm dần từ VS2 ,SI2, VS1, WS2, WS1, IF và I1 là độ trong suốt có số lượng thấp nhất
t %>% group_by(clarity) %>% summarise(m= mean(carat)) %>%
ggplot(aes(x = clarity,y = m)) +
geom_col(position = 'dodge') +
geom_text(aes(label = round(m,5)), vjust = 2, color = 'green') +
labs(x = 'độ trong suốt', y = 'trọng lượng trung bình')
Ta phân loại kim cương theo độ trong suốt và tính trọng lượng trung bình của chúng theo đơn vị carat. Ở biểu đồ trên thì ta gắn x là độ trong suốt, y là khối lượng trung bình của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 5 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Và ta thấy được kim cương có độ trong suốt cao nhất là I1, thấp hơn đó là SI2 và giảm dần từ SI1, VS2, VS1, WS2, WS1, và thấp nhất là IF.
t <- t %>% mutate(caratC = cut(carat,4, label = c('rất nhỏ', 'nhỏ','vừa','lớn')))
t %>% ggplot(aes(x = caratC)) +
geom_bar(fill = 'red') +
labs(x = 'phân loại', y = 'số lượng')
Ta thêm 1 cột dữ liêu caratC vào bộ dữ liệu t để đánh giá trọng lượng của các viên kim cương theo mức độ ‘rất nhỏ’ ‘nhỏ’, ‘vừa’ và ‘lớn’. Các cột biểu đồ có màu đỏ. Qua biểu đồ trên ta thấy số lượng kim cương có trọng lượng ‘rất nhỏ’ là lớn nhất và giảm dần từ ‘nhỏ’, ‘vừa’ và thấp nhất là loại ‘lớn’
t <- t %>% mutate(priceC = cut(price,5, label = c('rất thấp', 'thấp','vừa','cao','rất cao')))
t %>% ggplot(aes(x = priceC)) +
geom_bar(fill = 'red') +
labs(x = 'phân loại', y = 'số lượng')
Ta thêm 1 cột dữ liêu priceC vào bộ dữ liệu t để đánh giá Gía cả của các viên kim cương theo mức độ ‘rất thấp’ ‘thấp’, ‘vừa’, ‘cao’ và ‘rất cao’. Các cột biểu đồ có màu đỏ. Qua biểu đồ trên ta thấy số lượng kim cương có giá ‘rất thấp’ là lớn nhất và giảm dần từ ‘thấp’, ‘vừa’, ‘cao’ và thấp nhất là loại ‘rất cao’
t %>% group_by(clarity,color) %>% summarise(m = mean(price)) %>%
ggplot(aes(x = color,y = m)) +
geom_col(position = 'dodge', fill= 'gold') +
facet_wrap(~clarity) +
geom_text(aes(label = round(m))) +
labs(x = 'Color ', y = 'Số lượng')
## `summarise()` has grouped output by 'clarity'. You can override using the
## `.groups` argument.
-Trục X (“Color”): Trục này biểu diễn các mức độ màu sắc của kim cương (D, E, F, G, H, I, J).
-Trục Y (“Giá Trị Trung Bình”): Trục này thể hiện giá trị trung bình của kim cương cho mỗi mức độ màu sắc.
Biểu đồ này thể hiện giá trị trung bình của kim cương dựa trên mức độ màu sắc và clarity. Mỗi cột biểu thị giá trị trung bình tương ứng với mỗi mức độ màu sắc, và các cột này được nhóm lại theo clarity.
Biểu đồ này giúp thấy rõ mối quan hệ giữa giá trị trung bình của kim cương, màu sắc và clarity. Các facets cho phép bạn so sánh giá trị trung bình của kim cương theo màu sắc trong từng loại clarity khác nhau.
t %>% group_by(cut,clarity) %>% summarise(m = mean(price)) %>%
ggplot(aes(x = clarity,y = m)) +
geom_col(position = 'dodge', fill= 'gold') +
facet_wrap(~cut ) +
geom_text(aes(label = round(m))) +
labs(x = 'clarity ', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.
-Trục X (“Clarity”): Trục này biểu diễn các loại clarity (SI1, VS2, VS1, SI2, VVS2, VVS1, IF).
-Trục Y (“Giá Trị Trung Bình”): Trục này thể hiện giá trị trung bình của kim cương cho mỗi loại clarity.
Biểu đồ này thể hiện giá trị trung bình của kim cương dựa trên loại clarity và loại cắt. Mỗi cột biểu thị giá trị trung bình tương ứng với mỗi loại clarity, và các cột này được nhóm lại theo loại cắt.
Biểu đồ này giúp thấy rõ mối quan hệ giữa giá trị trung bình của kim cương, clarity và loại cắt. Các facets cho phép bạn so sánh giá trị trung bình của kim cương theo clarity trong từng loại cắt khác nhau.
t %>% group_by(cut,color) %>% summarise(m = mean(price)) %>%
ggplot(aes(x = color,y = m)) +
geom_col(position = 'dodge',fill= 'gold') +
facet_wrap(~cut ) +
geom_text(aes(label = round(m))) +
labs(x = 'Color ', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.
-Trục X (“Color”): Trục này biểu diễn các mức độ màu sắc của kim cương (D, E, F, G, H, I, J).
-Trục Y (“Giá Trị Trung Bình”): Trục này thể hiện giá trị trung bình của kim cương cho mỗi mức độ màu sắc.
Biểu đồ này thể hiện giá trị trung bình của kim cương dựa trên mức độ màu sắc và loại cắt. Mỗi cột biểu thị giá trị trung bình tương ứng với mỗi mức độ màu sắc, và các cột này được nhóm lại theo loại cắt.
Biểu đồ này giúp thấy rõ mối quan hệ giữa giá trị trung bình của kim cương, màu sắc và loại cắt. Các facets cho phép bạn so sánh giá trị trung bình của kim cương theo màu sắc trong từng loại cắt khác nhau.
tp1 <- t %>% mutate(Price = cut(price,5, label = c('rất thấp ', 'thấp','tb','cao','rất cao')))
tp1 %>% ggplot(aes(x = Price)) +
geom_bar(fill = 'red')
-Trục X (“Giá Trị”): Trục này biểu diễn các phân khúc giá của kim cương (rất thấp, thấp, trung bình, cao, rất cao).
-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương trong mỗi phân khúc giá.
Biểu đồ này thể hiện phân phối của kim cương dựa trên phân khúc giá. Mỗi cột biểu thị số lượng kim cương tương ứng với mỗi phân khúc giá.
Biểu đồ này giúp trực quan hóa cách kim cương phân phối trong các phân khúc giá khác nhau, giúp nhìn nhận mức độ phổ biến của kim cương trong mỗi khoảng giá.
tp2 <-t %>% mutate(Carat = cut(carat,5, label = c('rất nhỏ', 'nhỏ','vừa','lớn','rất lớn')))
tp2 %>% ggplot(aes(x = Carat)) +
geom_bar(fill = 'red')
-Trục X (“Carat”): Trục này biểu diễn các phân khúc trọng lượng carat của kim cương (rất nhỏ, nhỏ, vừa, lớn, rất lớn).
-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương trong mỗi phân khúc trọng lượng carat.
Biểu đồ này thể hiện phân phối của kim cương dựa trên trọng lượng carat. Mỗi cột biểu thị số lượng kim cương tương ứng với mỗi phân khúc trọng lượng carat.
Biểu đồ này giúp trực quan hóa cách kim cương phân phối trong các phân khúc trọng lượng carat khác nhau, giúp nhìn nhận mức độ phổ biến của kim cương dựa trên kích thước.
t <- diamonds
t %>% ggplot(aes(x = cut)) +
geom_bar(fill='navy') +
labs(x = 'Loại', y = 'Số lượng')
Đồ thị này thể hiện số lượng kim cương cho mỗi loại cắt.
-Trục X (“Loại”): Trục này thể hiện các loại cắt khác nhau của kim cương. Các loại cắt có thể là “Fair”, “Good”, “Very Good”, “Premium”, và “Ideal”.
-Trục Y (“Số lượng”): Trục này biểu diễn số lượng kim cương tương ứng với từng loại cắt trên trục X.
Các thanh cột trên biểu đồ biểu thị số lượng kim cương thuộc mỗi loại cắt. Nếu thanh cột của một loại cắt càng cao, điều này có nghĩa là có nhiều kim cương thuộc loại cắt đó trong bộ dữ liệu.
t <- diamonds
t %>% ggplot(aes(x = cut)) +
geom_bar(fill='gold') +
labs(x = 'Loại', y = 'Số lượng') +
coord_flip()
-Trục X (“Số lượng”): Trục này biểu diễn số lượng kim cương.
-Trục Y (“Loại”): Trục này thể hiện các loại cắt khác nhau của kim cương.
Biểu đồ này đã sử dụng coord_flip() để đảo ngược trục X và Y, biến nó từ một biểu đồ cột truyền thống thành một biểu đồ cột ngang. Các thanh cột ngang trên biểu đồ biểu thị số lượng kim cương cho mỗi loại cắt. Nếu thanh cột của một loại cắt càng dài, điều này chỉ ra rằng có nhiều kim cương thuộc loại cắt đó trong bộ dữ liệu.
t %>% group_by(cut) %>% summarise(n = n()) %>%
ggplot(aes(cut,n)) +
geom_col(fill='navy') +
geom_text(aes(label = n),vjust = 2, color = 'gold') +
labs(x = 'Loại', y = 'Số lượng')
-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương.
-Trục Y (“Số lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại cắt.
Biểu đồ này giúp hiểu rõ hơn về phân phối của số lượng kim cương trong từng loại cắt và cung cấp thông tin chi tiết về giá trị cụ thể của mỗi cột.
t %>% group_by(cut) %>% summarise(n = n()) %>%
ggplot(aes(cut,n)) +
geom_col(fill='gold') +
geom_text(aes(label = percent(n/length(t$carat))),vjust = 2, color = 'navy') +
labs(x = 'Loại', y = 'Số lượng')
-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương.
-Trục Y (“Số lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại cắt.
Đồ thị này giúp thấy rõ tỉ lệ phần trăm của mỗi loại cắt so với tổng số lượng kim cương trong dữ liệu. Tính theo tỉ lệ phần trăm, bạn có thể thấy được sự phân phối của kim cương theo loại cắt một cách trực quan.
t %>% group_by(cut,color) %>% summarise(n=n()) %>%
ggplot(aes(x = cut,y = n)) +
geom_col(position = 'dodge', fill='navy') +
facet_wrap(~color) +
labs(x = 'Loại', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.
-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương.
-Trục Y (“Số lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại cắt.
Các cột trên biểu đồ được nhóm dựa trên loại cắt và tô màu theo màu sắc của kim cương. Hàm facet_wrap(~color) được sử dụng để tạo các phân khúc riêng biệt cho từng màu sắc trên biểu đồ.
Đồ thị này giúp hiểu rõ hơn về sự phân bố của kim cương theo cả loại cắt và màu sắc. Các phân khúc riêng biệt cho mỗi màu sắc giúp so sánh hiệu quả số lượng kim cương theo loại cắt trong từng nhóm màu sắc khác nhau.
t %>% group_by(cut,color) %>% summarise(n=n()) %>%
ggplot(aes(x = cut,y = n)) +
geom_col(position = 'dodge', fill='gold') +
facet_wrap(~color) +
geom_text(aes(label = n),vjust = 2, color = 'navy') +
labs(x = 'Loại', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.
-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương.
-Trục Y (“Số lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại cắt.
Biểu đồ này giúp so sánh số lượng kim cương trong từng loại cắt, được phân loại theo màu sắc, và cung cấp cái nhìn tổng quan về phân phối của chúng trong bộ dữ liệu.
t <- diamonds
t %>% group_by(cut) %>% summarise(m= mean(carat)) %>%
ggplot(aes(x = cut,y = m)) +
geom_col(position = 'dodge', fill='navy') +
geom_text(aes(label = round(m,2)), vjust = 2, color = 'gold') +
labs(x = 'Màu', y = 'Mean')
-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương.
-Trục Y (“Trung bình Trọng Lượng Carat”): Trục này thể hiện giá trị trung bình của trọng lượng carat cho mỗi loại cắt.
Các cột trên biểu đồ biểu thị giá trị trung bình của trọng lượng carat cho từng loại cắt. Chú thích giá trị trên đỉnh mỗi cột giúp hiển thị số liệu chính xác và chi tiết hơn về giá trị trung bình của từng loại cắt.
Biểu đồ này giúp so sánh giá trị trung bình của trọng lượng carat trong từng loại cắt và cung cấp cái nhìn tổng quan về phân phối của chúng trong bộ dữ liệu.
t <- diamonds
t %>% group_by(cut,color) %>% summarise(m = mean(price)) %>%
ggplot(aes(x = cut,y = m)) +
geom_col(position = 'dodge', fill='gold') +
facet_wrap(~color) +
geom_text(aes(label = round(m))) +
labs(x = 'cut', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.
-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương.
-Trục Y (“Giá Trung bình”): Trục này thể hiện giá trung bình của kim cương cho mỗi loại cắt.
Các cột trên biểu đồ biểu thị giá trung bình của kim cương cho từng loại cắt và màu sắc. Phân khúc màu sắc và chú thích giá trung bình trên đỉnh mỗi cột giúp hiển thị sự phân phối của giá theo loại cắt và màu sắc.
Biểu đồ này giúp so sánh giá trung bình của kim cương trong từng loại cắt, được phân loại theo màu sắc, và cung cấp cái nhìn tổng quan về sự biến động giá theo các yếu tố này trong bộ dữ liệu.
t <- diamonds
o <- t %>% group_by(cut, color) %>% summarise(n = n())
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.
o %>% ggplot(aes(x = cut, y = n)) +
geom_col(data = o %>% filter(color == 'D'), fill = 'gold') +
geom_col(data = o %>% filter(color == 'J'), fill = 'navy')
-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương.
-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại cắt.
Các cột trên biểu đồ biểu thị số lượng kim cương cho mỗi loại cắt, nhưng chỉ giữ lại các dữ liệu liên quan đến màu sắc ‘D’ (vàng) và ‘J’ (navy). Mỗi màu sắc có một cột tương ứng trên biểu đồ, giúp so sánh số lượng kim cương của từng loại cắt giữa hai màu sắc khác nhau.
Biểu đồ này giúp thấy rõ sự chênh lệch trong số lượng kim cương giữa các loại cắt khi so sánh giữa màu sắc ‘D’ và ‘J’. Màu vàng biểu thị một mức độ và màu xanh navy biểu thị mức độ khác, giúp đánh bại sự chênh lệch giữa các nhóm.
t <- diamonds
c <- t %>% mutate(caratC = cut(carat,5, label = c('rất nhỏ', 'nhỏ','vừa','lớn','rất lớn')))
c %>% ggplot(aes(x = caratC)) +
geom_bar(fill = 'navy')
-Trục X (“Phân loại Trọng Lượng Carat”): Trục này biểu diễn các phân loại của trọng lượng carat, được xác định bằng hàm cut() từ thư viện dplyr.
-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương thuộc từng phân loại.
Biểu đồ này giúp thấy rõ sự phân bố của kim cương theo trọng lượng carat, được chia thành các nhóm rất nhỏ, nhỏ, vừa, lớn và rất lớn.