t <- diamonds

BIỂU ĐỒ 1

t %>% group_by(clarity) %>% summarise(m= mean(price)) %>%
  ggplot(aes(x = clarity,y = m)) +
  geom_col(position = 'dodge') +
  geom_text(aes(label = round(m,1)), vjust = 2, color = 'green') +
  labs(x = 'độ trong suốt', y = 'giá')

Ta phân loại kim cương theo độ trong suốt và tính giá trung bình của từng loại . Ở biểu đồ trên thì ta gắn x là độ trong suốt, y là giá trung bình của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 01 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ trên ta thấy kim cương có độ trong suốt SI2 là có giá trung bình cao nhất, tiếp đến là SI2, thấp hơn nữa lần lượt là VS2, I1, VS1, WS2, IF và thấp nhất là Ws1

BIỂU ĐỒ 2

t %>% group_by(color) %>% summarise(n = n()) %>%
  ggplot(aes(color,n)) +
    geom_col(fill='red') +
    geom_text(aes(label = n),vjust = 2, color = 'black') +
    xlab('Color') +
    ylab('Số lượng') +
    labs(title ='số lượng kim cương theo màu sắc')

Ta Phân loại kim cương theo màu sắc và tính số lượng của từng màu sắc. x là màu sắc của kim cương, y là số lượng của từng loại màu sắc. Các số liệu có màu đen, được điều chỉnh ở vị trí dọc cách cột 2 đơn vị. Màu của các cột là màu đỏ . Qua biểu đồ trên ta thấy được nhiều nhất là màu G với 11292 viên, tiếp đến là E với 9797 viên, F với 9542 viên, H với 8304 viên,D với 6775 viên, I với 5422 viên và ít nhất là màu J với 2808 viên # BIỂU ĐỒ 3

t %>% ggplot(aes(x = cut)) +
    geom_bar() +
    labs(x = 'Loại', y = 'Số lượng') +
    coord_flip() +
    labs(title = 'Số kim cương theo kiểu cắt(biểu đồ ngang)')

Ta phân loại kim cương theo kiểu cắt. Biểu đồ ngang trên cho ta thấy được kiểu Gía của kim cương theo từng kiểu cắt. Ta thấy số kim cương sẽ tăng dần từ Fair, Good, Very Good, Premium, Ideal

BIỂU ĐỒ 4

t %>% ggplot(aes(x = cut)) +
    geom_bar() +
    labs(x = 'Loại', y = 'Số lượng') +
    labs(title = 'Số kim cương theo kiểu cắt(biểu đồ dọc)')

Ta phân loại kim cương theo kiểu cắt. Biểu đồ dọc trên cho ta thấy được kiểu Gía của kim cương theo từng kiểu cắt. Ta thấy số kim cương sẽ tăng dần từ Fair, Good, Very Good, Premium, Ideal

BIỂU ĐỒ 5

t %>% group_by(carat) %>% filter(carat == 0.5 | carat == 1.00 | carat == 1.5 | carat == 2.05) %>% summarise(n = n()) %>%
  ggplot(aes(carat,n)) +
    geom_col(fill='blue') +
     geom_text(aes(label = n),vjust = 2, color = 'white') +
    xlab('Carat') +
    ylab('Số lượng')

*Ta phân loại kim cương theo trọng lượng carat ở các mốc 0.5, 1.0, 1.5, 2.0 và tính số lượng của từng mốc khối lương. ta gắn x là carat và y là số lượng từng mốc carat. Các cột biểu đồ có màu xanh lá cây, các số liệu có màu trắng, được điều chỉnh ở vị trí dọc cách cột 2 đơn vị . Qua biểu đồ trên ta thấy được số kim cương có trọng lượng 1.0 carat là nhiều nhất và thấp nhất là 2.0

BIỂU ĐỒ 6

t %>% group_by(cut) %>% summarise(n = mean(price)) %>%
  ggplot(aes(cut,n)) +
  geom_col(fill='green') +
  geom_text(aes(label = round(n,2)),vjust = 2, color = 'red') +
  labs(x = 'Loại', y = 'Số lượng')

Ta phân loại kim cương theo kiểu cắt và tính giá trung bình. Ta gắn x là kiểu cắt, y là số lượng. Các số liệu sẽ có màu đỏ, được làm tròn đến 2 chữ thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2; cột biểu đồ có màu xanh lá cây. Qua biểu đồ ta thấy giá trung bình của từng kiểu cắt sẽ tăng dần từ Ideal, Good, Very Good, Fair, Premium

BIỂU ĐỒ 7

t %>% group_by(cut) %>% summarise(m= mean(carat)) %>%
  ggplot(aes(x = cut,y = m)) +
  geom_col(position = 'dodge') +
  geom_text(aes(label = round(m,2)), vjust = 2, color = 'red') +
  labs(x = 'Kiểu cắt', y = 'Trọng lượng trung bình')

Ta phân loại kiểu cắt kim cương và tính trọng lượng trung bình (carat). ta gắn x là kiểu cắt, y là trọng lượng trung bình. Các số liệu sẽ có màu đỏ, được làm tròn đến 2 chữ thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ ta thấy được trọng lương trung bình của kim cương tăng từ Ideal(0.7 carat), Very Good(0.81 carat), Good(0.85 carat), Premium(0.89 carat) và Fair(1.05 carat)

BIỂU ĐỒ 8

t %>% group_by(color) %>% summarise(m= mean(carat)) %>%
  ggplot(aes(x = color,y = m)) +
  geom_col(position = 'dodge') +
  geom_text(aes(label = round(m,2)), vjust = 2, color = 'green') +
  labs(x = 'Màu', y = 'Trọng lượng trung bình')

Ta phân loại kim cương theo màu sắc và tính trọng lượng trung bình theo đơn vị carat của từng loại . Ở biểu đồ trên thì ta gắn x là màu sắc, y là trọng lượng trung bình của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 2 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ trên ta thấy màu J có trọng lượng trung bình cao nhất là giảm dần từ I, H , G , F, màu D Và E có trọng lượng trung bình thấp nhất.

BIỂU ĐỒ 9

t %>% group_by(color) %>% summarise(m= mean(price)) %>%
  ggplot(aes(x = color,y = m)) +
  geom_col(position = 'dodge') +
  geom_text(aes(label = round(m,0)), vjust = 2, color = 'green') +
  labs(x = 'màu sắc', y = 'Gía trung bình')

Ta phân loại kim cương theo màu sắc và tính giá trung bình của từng loại . Ở biểu đồ trên thì ta gắn x là màu sắc, y là giá trung bình của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 0 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ trên Ta thấy màu J có giá trung bình cao nhất và giảm dần từ I, H, G, F, D và thấp nhất là màu D VỚI 3170 Đơn vị giá # BIỂU ĐỒ 10

ggplot(diamonds , aes_string(x = "cut", y = "price")) +
  geom_bar(stat = "identity") +
  labs(title = "Giá kim cương theo kiểu cắt",
       x = "Kiểu cắt",
       y = "Giá")

Ta phân loại kim cương theo tổng giá và kiểu cắt. Biểu đồ trên cho ta thấy được kiểu Gía của kim cương theo từng kiểu cắt. Ta thấy kiểu cắt Ideal thì giá kim cương sẽ tăng dần từ Fair, Good, Very Good, Premium, Ideal

BIỂU ĐỒ 11

t %>% group_by(cut) %>% summarise(n = n()) %>%
  ggplot(aes(cut,n)) +
  geom_col(fill='green') +
  geom_text(aes(label = n),vjust = 2, color = 'red') +
  labs(x = 'Kiểu Cắt', y = 'Số lượng')

Ta phân loại kim cương theo kiểu cắt và tính số lượng của từng màu . Ở biểu đồ trên thì ta gắn x là kiểu cắt, y là số lượng của từng loại; các số liệu sẽ có màu đỏ và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2; các cột sẽ có màu xanh lá cây. Qua biểu đồ trên ta thấy loại Fair có số lượng ít nhất và tăng dần theo kiểu cắt Good, Very Good, Premium và kiểu cắt Premium là cố số lượng nhiều nhất # BIỂU ĐỒ 12

t %>% group_by(clarity) %>% summarise(n = n()) %>%
  ggplot(aes(x = clarity,y = n)) +
  geom_col(position = 'dodge') +
  geom_text(aes(label = round(n,2)), vjust = 2, color = 'green') +
  labs(x = 'độ trong suốt', y = 'số lượng')

Ta phân loại kim cương theo độ trong suốt và tính số lượng . Ở biểu đồ trên thì ta gắn x là độ trong suốt, y là số lượng của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 5 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ trên ta thấy độ trong suốt có số lượng nhiều nhất là SI1, giảm dần từ VS2 ,SI2, VS1, WS2, WS1, IF và I1 là độ trong suốt có số lượng thấp nhất

BIỂU ĐỒ 13

t %>% group_by(clarity) %>% summarise(m= mean(carat)) %>%
  ggplot(aes(x = clarity,y = m)) +
  geom_col(position = 'dodge') +
  geom_text(aes(label = round(m,5)), vjust = 2, color = 'green') +
  labs(x = 'độ trong suốt', y = 'trọng lượng trung bình')

Ta phân loại kim cương theo độ trong suốt và tính trọng lượng trung bình của chúng theo đơn vị carat. Ở biểu đồ trên thì ta gắn x là độ trong suốt, y là khối lượng trung bình của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 5 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Và ta thấy được kim cương có độ trong suốt cao nhất là I1, thấp hơn đó là SI2 và giảm dần từ SI1, VS2, VS1, WS2, WS1, và thấp nhất là IF.

BIỂU ĐỒ 14

t <- t %>% mutate(caratC = cut(carat,4, label = c('rất nhỏ', 'nhỏ','vừa','lớn')))
t %>% ggplot(aes(x = caratC)) +
  geom_bar(fill = 'red') +
  labs(x = 'phân loại', y = 'số lượng')

Ta thêm 1 cột dữ liêu caratC vào bộ dữ liệu t để đánh giá trọng lượng của các viên kim cương theo mức độ ‘rất nhỏ’ ‘nhỏ’, ‘vừa’ và ‘lớn’. Các cột biểu đồ có màu đỏ. Qua biểu đồ trên ta thấy số lượng kim cương có trọng lượng ‘rất nhỏ’ là lớn nhất và giảm dần từ ‘nhỏ’, ‘vừa’ và thấp nhất là loại ‘lớn’

BIỂU ĐỒ 15

t <- t %>% mutate(priceC = cut(price,5, label = c('rất thấp', 'thấp','vừa','cao','rất cao')))
t %>% ggplot(aes(x = priceC)) +
  geom_bar(fill = 'red') +
  labs(x = 'phân loại', y = 'số lượng')

Ta thêm 1 cột dữ liêu priceC vào bộ dữ liệu t để đánh giá Gía cả của các viên kim cương theo mức độ ‘rất thấp’ ‘thấp’, ‘vừa’, ‘cao’ và ‘rất cao’. Các cột biểu đồ có màu đỏ. Qua biểu đồ trên ta thấy số lượng kim cương có giá ‘rất thấp’ là lớn nhất và giảm dần từ ‘thấp’, ‘vừa’, ‘cao’ và thấp nhất là loại ‘rất cao’

BIỂU ĐỒ 16

t <- diamonds 
b <- t %>% group_by(cut, color) %>% summarise(n = n())
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.
b %>% ggplot(aes(x = cut, y = n)) +
  geom_col(data = b %>% filter(color == 'D'), fill = 'red') +
  geom_col(data = b %>% filter(color == 'J'), fill = 'blue')

Ta phân loại kim cương theo kiểu cắt và màu sắc sau đó tính số lượng . Ở biểu đồ trên thì ta gắn x là kiểu cắt, y là số lượng của từng loại; ta sẽ lọc các loại kim cương có màu D,cột biểu đồ có màu đỏ và lọc các loại kim cương có màu J, biểu đồ có màu xanh dương. Qua biểu đồ trên ta đã lọc được số lượng kim cương màu D phân bổ ít nhất ở kiểu cắt Fair và tăng dần lên từ Good, Very Good, Premium, và nhiều nhất là Ideal. Và số lượng kim cương có màu J cũng phẩn bổ tương tự như kim cương có màu D # BIỂU ĐỒ 17

t <- diamonds 
b <- t %>% group_by(cut, color) %>% summarise(n = n())
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.
b %>% ggplot(aes(x = cut, y = n)) +
  geom_col(data = b %>% filter(color == 'E'), fill = 'red') +
  geom_col(data = b %>% filter(color == 'H'), fill = 'blue')

***Tương tự như biểu đồ số 17, lần này thay vì lọc các kim cương có màu ‘D’ VÀ ‘J’ thì ta sẽ lọc các kim cương có màu ‘E’ VÀ ‘H’. Ở biểu đồ này ta thấy màu E không phân bổ ở loại kim cương có kiểu cắt Fair, Premium, và màu sắc này phân bổ nhiều nhất ở kiểu cắt Ideal giảm dần từ Very Good, Good. Màu H phân bổ ở các kiểu cắt, nhiều nhất là Ideal và giảm dần từ Premium, Very Good, Good và thấp nhất là Fair # BIỂU ĐỒ 18

b <- t %>% group_by(clarity, color) %>% summarise(n = n())
## `summarise()` has grouped output by 'clarity'. You can override using the
## `.groups` argument.
b %>% ggplot(aes(x = clarity, y = n)) +
  geom_col(data = b %>% filter(color == 'F'), fill = 'red') +
  geom_col(data = b %>% filter(color == 'J'), fill = 'blue')

Ta phân loại kim cương theo kiểu độ trong suốt và màu sắc sau đó tính số lượng . Ở biểu đồ trên thì ta gắn x là độ trong suốt, y là số lượng của từng loại; ta sẽ lọc các loại kim cương có màu ‘F’,cột biểu đồ có màu đỏ và lọc các loại kim cương có màu J, biểu đồ có màu xanh dương. Qua biểu đồ trên ta thấy các màu phân bổ ở tất cả độ trong suốt. Trong đó màu J sẽ phân bổ nhiều nhất ở SI1 rồi giảm dần từ VS2, VS1, SI2, WS2, WS1, IF và thấp nhất là I1. Còn màu F Phân bổ nhiều nhất ở VS2 rồi giảm dần từ SI1, SI2, VS1, WS2, WS1, IF và tháp nhất là I1.

BIỂU ĐỒ 19

b <- t %>% group_by(clarity, color) %>% summarise(n = n())
## `summarise()` has grouped output by 'clarity'. You can override using the
## `.groups` argument.
b %>% ggplot(aes(x = clarity, y = n)) +
  geom_col(data = b %>% filter(color == 'E'), fill = 'red') +
  geom_col(data = b %>% filter(color == 'G'), fill = 'blue')

Tương tự như biểu đồ số 18, lần này thay vì lọc các kim cương có màu ‘F’ VÀ ‘J’ thì ta sẽ lọc các kim cương có màu ‘E’ VÀ ‘G’. Ở biểu đồ này ta thấy màu E chỉ phân bổ ở loại kim cương độ trong suốt là SI2,VS2 và SI1. Còn kim cương màu G phân bổ ở tất cả độ trong suốt, trong đó nhiều nhất là VS2, giảm dần từ VS1, SI1, SI2, VVS2, VVS1, IF và phân bổ ít nhất ở I1.

BIỂU ĐỒ 20

c <- t %>% group_by(clarity, cut) %>% summarise(n = n())
## `summarise()` has grouped output by 'clarity'. You can override using the
## `.groups` argument.
c %>% ggplot(aes(x = cut, y = n)) +
  geom_col(data = c %>% filter(clarity == 'IF'), fill = 'red') +
  geom_col(data = c %>% filter(clarity == 'I1'), fill = 'blue')

Ta phân loại kim cương theo kiểu độ trong suốt và kiểu cắt sau đó tính số lượng . Ở biểu đồ trên thì ta gắn x là kiểu cắt, y là số lượng của từng loại; Ta lọc các kim cương có độ trong suốt ‘IF’ là các cột màu đỏ, các kim cương có độ trong suốt ‘I1’ là các cột màu xanh. Qua biểu đồ trên ta thấy kim cương có độ trong suốt ‘IF’ chỉ phân bổ ở kiểu cắt Ideal, Very Good, Premium theo số lượng giảm dần. Trong khi đó độ trong suốt I1 phân bổ ở mọi kiểu cắt, nhiều nhất là Premium và giảm dần từ Fair, Idea, Good, thấp nhất là Very Good.

BIỂU ĐỒ 21

f <- t %>% group_by(clarity, cut) %>% summarise(n = n())
## `summarise()` has grouped output by 'clarity'. You can override using the
## `.groups` argument.
f %>% ggplot(aes(x = cut, y = n)) +
  geom_col(data = f %>% filter(clarity == 'SI1'), fill = 'red') +
  geom_col(data = f %>% filter(clarity == 'SI2'), fill = 'blue')

Tương tự như biểu đồ số 20, lần này thay vì lọc các kim cương có độ trong suốt ‘iF’ VÀ ‘i1’ thì ta sẽ lọc các kim cương có độ trong suốt ‘SI1’ VÀ ‘SI2’. Ở biểu đồ này ta thấy độ trong suốt SI1 không phân bổ ở loại kim cương có kiểu cắt Fair, phân bố nhiều nhất ở kiểu cắt Ideal giảm dần từ Very Good, Premium và phân bổ ít nhất ở kiểu cắt Good. Kim cương có độ trong suốt SI2 phân bổ ở tất cả kiểu cắt, nhiều nhất ở kiểu cắt Premium giảm dần từ Ideal, Very Good, Good và phân bổ ít nhất ở kiểu cắt Fair.

BIỂU ĐỒ 22

t %>% group_by(cut) %>% summarise(n = n()) %>%
  ggplot(aes(cut,n)) +
  geom_col(fill='green') +
  geom_text(aes(label = percent(n/length(t$carat))),vjust = 2, color = 'red') +
  labs(x = 'Loại', y = 'Số lượng')

Ta phân loại kim cương theo kiểu cắt và tính số lượng của các kiểu cắt. ta gắn x là ‘Loại’, y là ‘Số Lượng’. Các cột biểu đồ được tô màu xanh lá cây, các số liệu là tỷ khối lượng của mỗi kiểu cắt, các số liệu này có màu đỏ và được điều chỉnh vị trí dọc các cột dữ liệu với đơn vị là 2. Qua biểu đồ trên ta thấy Kiểu cắt Ideal chiếm tỷ lệ cao nhất về trọng lượng (đơn vị carat) và giảm dần từ Premium, Very Good, Good và kiểu cắt Fair có tỷ lệ trọng lượng thấp nhất

BIỂU ĐỒ 23

t %>% group_by(color) %>% summarise(n = n()) %>%
  ggplot(aes(color,n)) +
  geom_col(fill='green') +
  geom_text(aes(label = percent(n/length(t$carat))),vjust = 2, color = 'red') +
  labs(x = 'Loại', y = 'Số lượng')

Ta phân loại kim cương theo kiểu màu sắc và tính số lượng của các màu. ta gắn x là ‘Loại’, y là ‘Số Lượng’. Các cột biểu đồ được tô màu xanh lá cây, các số liệu là tỷ lệ khối lượng của mỗi kiểu cắt, các số liệu này có màu đỏ và được điều chỉnh vị trí dọc các cột dữ liệu với đơn vị là 2. Qua biểu đồ trên ta thấy kim cương màu G chiếm tỷ lệ cao nhất về trọng lượng(20,93), giảm dần là E, F, H, D, I và kim cương màu J chiếm tỷ lệ thấp nhất (5,21%)

BIỂU ĐỒ 24

t %>% group_by(color) %>% summarise(n = n()) %>%
  ggplot(aes(color,n)) +
  geom_col(fill='green') +
  geom_text(aes(label = percent(n/length(t$price))),vjust = 2, color = 'red') +
  labs(x = 'Loại', y = 'Số lượng')

Ta phân loại kim cương theo kiểu màu sắc và tính số lượng của các màu. ta gắn x là ‘Loại’, y là ‘Số Lượng’. Các cột biểu đồ được tô màu xanh lá cây, các số liệu là tỷ lệ giá tiền của mỗi kiểu cắt, các số liệu này có màu đỏ và được điều chỉnh vị trí dọc các cột dữ liệu với đơn vị là 2. Qua biểu đồ trên ta thấy kim cương màu G chiếm tỷ lệ cao nhất về giá(20,93%), giảm dần là E, F, H, D, I và kim cương màu J chiếm tỷ lệ thấp nhất (5,21%)

BIỂU ĐỒ 25

t %>% group_by(clarity) %>% summarise(n = n()) %>%
  ggplot(aes(clarity,n)) +
  geom_col(fill='green') +
  geom_text(aes(label = percent(n/length(t$price))),vjust = 2, color = 'red') +
  labs(x = 'Loại', y = 'Số lượng')

Ta phân loại kim cương theo độ trong suốt và tính số lượng của các màu. ta gắn x là ‘Loại’, y là ‘Số Lượng’. Các cột biểu đồ được tô màu xanh lá cây, các số liệu là tỷ lệ giá tiền của mỗi loại kim cương, các số liệu này có màu đỏ và được điều chỉnh vị trí dọc các cột dữ liệu với đơn vị là 2. Qua biểu đồ trên ta thấy kim cương có độ trong suốt SI1 chiếm tỷ lệ giá cao nhất (24,2%), giảm dần từ VS2, SI2, VS1, VVS2, VVS1, IF, I1(1,4%)

BIỂU ĐỒ 26

t %>% group_by(cut) %>% summarise(n = n()) %>%
  ggplot(aes(cut,n)) +
  geom_col(fill='green') +
  geom_text(aes(label = percent(n/length(t$price))),vjust = 2, color = 'red') +
  labs(x = 'Loại', y = 'Số lượng')

BIỂU ĐỒ 27

t %>% group_by(cut,color) %>% summarise(n=n()) %>%
  ggplot(aes(x = cut,y = n)) +
    geom_col(position = 'dodge') +
    facet_wrap(~color) +
    labs(x = 'Loại', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.

Ta phân loại kim cương theo kiểu cắt và màu sắc sau đó tính số lượng. ta gắn x là loại, y la số lượng và ta chia thành 7 biểu đồ theo 7 loại màu sắc để so sánh. Qua 7 biểu đồ ta nhận xét các màu sắc phân bổ nhiều nhất ở kim cương có kiểu cắt Ideal, giảm dần qua các kiểu cắt Premium, Very Good, Good và phân bổ ít nhất ở kiểu cắt Fair

BIỂU ĐỒ 28

t %>% group_by(color) %>% summarise(m = mean(depth)) %>%
  ggplot(aes(color,m)) +
  geom_col(fill='green') +
  geom_text(aes(label = round(m,2)),vjust = 2, color = 'red') +
  labs(x = 'Loại', y = 'Số lượng')

Ta phân loại kim cương theo màu sắc và tính trung bình tỷ lệ độ sâu của từng loại. Các cột biểu đồ có màu xanh lá cây, các dữ liệu có màu đỏ, được làm tròn đến 2 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột 2 đơn vị. Qua biểu đồ trên ta thấy các loại màu của kim cương sẽ có xấp xỉ trung bình tỷ lệ độ sâu bằng nhau. Trong đó cao nhất là màu J và thấp nhất là màu E.

BIỂU ĐỒ 29

t %>% ggplot(aes(x = clarity)) +
  geom_bar() +
  labs(x = 'Cấp độ tinh khiết', y = 'Số lượng') +
  coord_flip() +
  labs(title = 'Cấp độ tinh khiết của kim cương (biểu đồ ngang)')

Ta phân loại kim cương theo độ trong suốt. ta gắn x là cấp độ tinh khiết, y là số lượng Và đây là biểu đồ ngang. Qua biểu đồ trên ta thấy SI1 có độ tinh khiết cao nhất, giảm dần từ VS2, SI2, VS1, VVS2, IF và I1 là kim cương có độ trong suốt thấp nhất

BIỂU ĐỒ 30

t %>% group_by(cut) %>% summarise(m= mean(depth)) %>%
  ggplot(aes(x = cut,y = m)) +
  geom_col(position = 'dodge') +
  geom_text(aes(label = round(m,2)), vjust = 2, color = 'green') +
  labs(x = 'Kiểu cắt', y = 'Mean')

Ta phân loại kim cương theo kiểu cắt và tính trung bình tỷ lệ độ sâu (trung bình z/x). ta gắn x là kiểu cắt, y là trung bình. các số liệu được làm tròn 2 chữ số thập phân, được điều chỉnh ở vị trí cách cột dọc 2 đơn vị và có màu xanh lá cây. Qua biểu đồ trên ta thấy kiểu cắt Fair có độ sâu trung bình lớn nhất, giảm dần từ Good, Very Good, Ideal và thấp nhất là Premium

Cảm ơn thầy đã đọc, chúc thầy 1 ngày làm việc vui vẻ

---
title: "Nhiệm vụ 4"
author: "Nguyễn Phúc Thịnh"
date: "`r format(Sys.time(), '%H:%M:%S, %d - %m - %Y')`"
output:
  html_document:
    code_download: true
    code_folding: show
    theme: "default"
    toc_depth: 3
    toc_float: true
    toc: true
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
library(dplyr)
library(tidyverse)
library(scales)
library(DT)
```

```{r echo=TRUE, warning=FALSE}
t <- diamonds
```

# BIỂU ĐỒ 1

```{r echo=TRUE, warning=FALSE}
t %>% group_by(clarity) %>% summarise(m= mean(price)) %>%
  ggplot(aes(x = clarity,y = m)) +
  geom_col(position = 'dodge') +
  geom_text(aes(label = round(m,1)), vjust = 2, color = 'green') +
  labs(x = 'độ trong suốt', y = 'giá')
```

***Ta phân loại kim cương theo độ trong suốt và tính giá trung bình của từng loại . Ở biểu đồ trên thì ta gắn x là độ trong suốt, y là giá trung bình của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 01 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ trên ta thấy kim cương có độ trong suốt SI2 là có giá trung bình cao nhất, tiếp đến là SI2, thấp hơn nữa lần lượt là VS2, I1, VS1, WS2, IF và thấp nhất là Ws1***

# BIỂU ĐỒ 2
```{r echo=TRUE, warning=FALSE}
t %>% group_by(color) %>% summarise(n = n()) %>%
  ggplot(aes(color,n)) +
    geom_col(fill='red') +
    geom_text(aes(label = n),vjust = 2, color = 'black') +
    xlab('Color') +
    ylab('Số lượng') +
    labs(title ='số lượng kim cương theo màu sắc')
```


***Ta Phân loại kim cương theo màu sắc và tính số lượng của từng màu sắc. x là màu sắc của kim cương, y là số lượng của từng loại màu sắc. Các số liệu có màu đen, được điều chỉnh ở vị trí dọc cách cột 2 đơn vị. Màu của các cột là màu đỏ  . Qua biểu đồ trên ta thấy được nhiều nhất là màu G với 11292 viên, tiếp đến là E với 9797 viên, F với 9542 viên, H với 8304 viên,D với 6775 viên, I với 5422 viên và ít nhất là màu J với 2808 viên***
# BIỂU ĐỒ 3

```{r echo=TRUE, warning=FALSE}
t %>% ggplot(aes(x = cut)) +
    geom_bar() +
    labs(x = 'Loại', y = 'Số lượng') +
    coord_flip() +
    labs(title = 'Số kim cương theo kiểu cắt(biểu đồ ngang)')
```

***Ta phân loại kim cương theo kiểu cắt. Biểu đồ ngang trên cho ta thấy được kiểu Gía của kim cương theo từng kiểu cắt. Ta thấy số kim cương sẽ tăng dần từ Fair, Good, Very Good, Premium, Ideal***

# BIỂU ĐỒ 4
```{r echo=TRUE, warning=FALSE}
t %>% ggplot(aes(x = cut)) +
    geom_bar() +
    labs(x = 'Loại', y = 'Số lượng') +
    labs(title = 'Số kim cương theo kiểu cắt(biểu đồ dọc)')
```

***Ta phân loại kim cương theo kiểu cắt. Biểu đồ dọc trên cho ta thấy được kiểu Gía của kim cương theo từng kiểu cắt. Ta thấy số kim cương sẽ tăng dần từ Fair, Good, Very Good, Premium, Ideal***

# BIỂU ĐỒ 5

```{r echo=TRUE, warning=FALSE}
t %>% group_by(carat) %>% filter(carat == 0.5 | carat == 1.00 | carat == 1.5 | carat == 2.05) %>% summarise(n = n()) %>%
  ggplot(aes(carat,n)) +
    geom_col(fill='blue') +
     geom_text(aes(label = n),vjust = 2, color = 'white') +
    xlab('Carat') +
    ylab('Số lượng')
```

***Ta phân loại kim cương theo trọng lượng carat ở các mốc 0.5, 1.0, 1.5, 2.0 và tính số lượng của từng mốc khối lương. ta gắn x là carat và y là số lượng từng mốc carat. Các cột biểu đồ có màu xanh lá cây, các số liệu có màu trắng, được điều chỉnh ở vị trí dọc cách cột 2 đơn vị . Qua biểu đồ trên ta thấy được số kim cương có trọng lượng 1.0 carat là nhiều nhất và thấp nhất là 2.0**

# BIỂU ĐỒ 6

```{r echo=TRUE, warning=FALSE}
t %>% group_by(cut) %>% summarise(n = mean(price)) %>%
  ggplot(aes(cut,n)) +
  geom_col(fill='green') +
  geom_text(aes(label = round(n,2)),vjust = 2, color = 'red') +
  labs(x = 'Loại', y = 'Số lượng')
```

***Ta phân loại kim cương theo kiểu cắt và tính giá trung bình. Ta gắn x là kiểu cắt, y là số lượng. Các số liệu sẽ có màu đỏ, được làm tròn đến 2 chữ thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2; cột biểu đồ có màu xanh lá cây. Qua biểu đồ ta thấy giá trung bình của từng kiểu cắt sẽ tăng dần từ Ideal, Good, Very Good, Fair, Premium***

# BIỂU ĐỒ 7

```{r echo=TRUE, warning=FALSE}
t %>% group_by(cut) %>% summarise(m= mean(carat)) %>%
  ggplot(aes(x = cut,y = m)) +
  geom_col(position = 'dodge') +
  geom_text(aes(label = round(m,2)), vjust = 2, color = 'red') +
  labs(x = 'Kiểu cắt', y = 'Trọng lượng trung bình')
```

***Ta phân loại kiểu cắt kim cương và tính trọng lượng trung bình (carat). ta gắn x là kiểu cắt, y là trọng lượng trung bình. Các số liệu sẽ có màu đỏ, được làm tròn đến 2 chữ thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ ta thấy được trọng lương trung bình của kim cương tăng từ Ideal(0.7 carat), Very Good(0.81 carat), Good(0.85 carat), Premium(0.89 carat) và Fair(1.05 carat)***

# BIỂU ĐỒ 8
```{r echo=TRUE, warning=FALSE}
t %>% group_by(color) %>% summarise(m= mean(carat)) %>%
  ggplot(aes(x = color,y = m)) +
  geom_col(position = 'dodge') +
  geom_text(aes(label = round(m,2)), vjust = 2, color = 'green') +
  labs(x = 'Màu', y = 'Trọng lượng trung bình')
```

***Ta phân loại kim cương theo màu sắc và tính trọng lượng trung bình theo đơn vị carat của từng loại . Ở biểu đồ trên thì ta gắn x là màu sắc, y là trọng lượng trung bình của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 2 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ trên ta thấy màu J có trọng lượng trung bình cao nhất là giảm dần từ I, H , G , F, màu D Và E có trọng lượng trung bình thấp nhất.***

# BIỂU ĐỒ 9

```{r echo=TRUE, warning=FALSE}
t %>% group_by(color) %>% summarise(m= mean(price)) %>%
  ggplot(aes(x = color,y = m)) +
  geom_col(position = 'dodge') +
  geom_text(aes(label = round(m,0)), vjust = 2, color = 'green') +
  labs(x = 'màu sắc', y = 'Gía trung bình')
```

***Ta phân loại kim cương theo màu sắc và tính giá trung bình của từng loại . Ở biểu đồ trên thì ta gắn x là màu sắc, y là giá trung bình của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 0 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ trên Ta thấy màu J có giá trung bình cao nhất và giảm dần từ I, H, G, F, D và thấp nhất là màu D VỚI 3170 Đơn vị giá***
# BIỂU ĐỒ 10
```{r echo=TRUE, warning=FALSE}
ggplot(diamonds , aes_string(x = "cut", y = "price")) +
  geom_bar(stat = "identity") +
  labs(title = "Giá kim cương theo kiểu cắt",
       x = "Kiểu cắt",
       y = "Giá")
```

***Ta phân loại kim cương theo tổng giá và kiểu cắt. Biểu đồ trên cho ta thấy được kiểu Gía của kim cương theo từng kiểu cắt. Ta thấy kiểu cắt  Ideal thì giá kim cương sẽ tăng dần từ Fair, Good, Very Good, Premium, Ideal***


# BIỂU ĐỒ 11
```{r echo=TRUE, warning=FALSE}
t %>% group_by(cut) %>% summarise(n = n()) %>%
  ggplot(aes(cut,n)) +
  geom_col(fill='green') +
  geom_text(aes(label = n),vjust = 2, color = 'red') +
  labs(x = 'Kiểu Cắt', y = 'Số lượng')
```

***Ta phân loại kim cương theo kiểu cắt và tính số lượng của từng màu . Ở biểu đồ trên thì ta gắn x là kiểu cắt, y là số lượng của từng loại; các số liệu sẽ có màu đỏ và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2; các cột sẽ có màu xanh lá cây. Qua biểu đồ trên ta thấy loại Fair có số lượng ít nhất và tăng dần theo kiểu cắt Good, Very Good, Premium và kiểu cắt Premium là cố số lượng nhiều nhất***
# BIỂU ĐỒ 12
```{r echo=TRUE, warning=FALSE}
t %>% group_by(clarity) %>% summarise(n = n()) %>%
  ggplot(aes(x = clarity,y = n)) +
  geom_col(position = 'dodge') +
  geom_text(aes(label = round(n,2)), vjust = 2, color = 'green') +
  labs(x = 'độ trong suốt', y = 'số lượng')
```

***Ta phân loại kim cương theo độ trong suốt và tính số lượng . Ở biểu đồ trên thì ta gắn x là độ trong suốt, y là số lượng của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 5 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Qua biểu đồ trên ta thấy độ trong suốt có số lượng nhiều nhất là SI1, giảm dần từ VS2 ,SI2, VS1, WS2, WS1, IF và I1 là độ trong suốt có số lượng thấp nhất***

# BIỂU ĐỒ 13
```{r echo=TRUE, warning=FALSE}
t %>% group_by(clarity) %>% summarise(m= mean(carat)) %>%
  ggplot(aes(x = clarity,y = m)) +
  geom_col(position = 'dodge') +
  geom_text(aes(label = round(m,5)), vjust = 2, color = 'green') +
  labs(x = 'độ trong suốt', y = 'trọng lượng trung bình')
```

***Ta phân loại kim cương theo độ trong suốt và tính trọng lượng trung bình của chúng theo đơn vị carat. Ở biểu đồ trên thì ta gắn x là độ trong suốt, y là khối lượng trung bình của từng loại; các số liệu sẽ có màu xanh lá cây, được làm tròn 5 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột với đơn vị là 2. Và ta thấy được kim cương có độ trong suốt cao nhất là I1, thấp hơn đó là SI2 và giảm dần từ SI1, VS2, VS1, WS2, WS1, và thấp nhất là IF.***

# BIỂU ĐỒ 14

```{r echo=TRUE, warning=FALSE}
t <- t %>% mutate(caratC = cut(carat,4, label = c('rất nhỏ', 'nhỏ','vừa','lớn')))
t %>% ggplot(aes(x = caratC)) +
  geom_bar(fill = 'red') +
  labs(x = 'phân loại', y = 'số lượng')
```

***Ta thêm 1 cột dữ liêu caratC vào bộ dữ liệu t để đánh giá trọng lượng của các viên kim cương theo mức độ 'rất nhỏ' 'nhỏ', 'vừa' và 'lớn'. Các cột biểu đồ có màu đỏ. Qua biểu đồ trên ta thấy số lượng kim cương có trọng lượng 'rất nhỏ' là lớn nhất và giảm dần từ 'nhỏ', 'vừa' và thấp nhất là loại 'lớn'***

# BIỂU ĐỒ 15

```{r echo=TRUE, warning=FALSE}
t <- t %>% mutate(priceC = cut(price,5, label = c('rất thấp', 'thấp','vừa','cao','rất cao')))
t %>% ggplot(aes(x = priceC)) +
  geom_bar(fill = 'red') +
  labs(x = 'phân loại', y = 'số lượng')
```

***Ta thêm 1 cột dữ liêu priceC vào bộ dữ liệu t để đánh giá Gía cả của các viên kim cương theo mức độ 'rất thấp' 'thấp', 'vừa', 'cao' và 'rất cao'. Các cột biểu đồ có màu đỏ. Qua biểu đồ trên ta thấy số lượng kim cương có giá 'rất thấp' là lớn nhất và giảm dần từ 'thấp', 'vừa', 'cao' và thấp nhất là loại 'rất cao'***

# BIỂU ĐỒ 16

```{r echo=TRUE, warning=FALSE}
t <- diamonds 
b <- t %>% group_by(cut, color) %>% summarise(n = n())
b %>% ggplot(aes(x = cut, y = n)) +
  geom_col(data = b %>% filter(color == 'D'), fill = 'red') +
  geom_col(data = b %>% filter(color == 'J'), fill = 'blue')
```

***Ta phân loại kim cương theo kiểu cắt và màu sắc sau đó tính số lượng . Ở biểu đồ trên thì ta gắn x là kiểu cắt, y là số lượng của từng loại; ta sẽ lọc các loại kim cương có màu D,cột biểu đồ có màu đỏ và lọc các loại kim cương có màu J, biểu đồ có màu xanh dương. Qua biểu đồ trên ta đã lọc được số lượng kim cương màu D phân bổ ít nhất ở kiểu cắt Fair và tăng dần lên từ Good, Very Good, Premium, và nhiều nhất là Ideal. Và số lượng kim cương có màu J cũng phẩn bổ tương tự như kim cương có màu D***
# BIỂU ĐỒ 17

```{r echo=TRUE, warning=FALSE}
t <- diamonds 
b <- t %>% group_by(cut, color) %>% summarise(n = n())
b %>% ggplot(aes(x = cut, y = n)) +
  geom_col(data = b %>% filter(color == 'E'), fill = 'red') +
  geom_col(data = b %>% filter(color == 'H'), fill = 'blue')

```

***Tương tự như biểu đồ số 17, lần này thay vì lọc các kim cương có màu 'D' VÀ 'J' thì ta sẽ lọc các kim cương có màu 'E' VÀ 'H'. Ở biểu đồ này ta thấy màu E không phân bổ ở loại kim cương có kiểu cắt Fair, Premium, và màu sắc này phân bổ nhiều nhất ở kiểu cắt Ideal giảm dần từ Very Good, Good. Màu H phân bổ ở các kiểu cắt, nhiều nhất là Ideal và giảm dần từ Premium, Very Good, Good và thấp nhất là Fair
# BIỂU ĐỒ 18

```{r echo=TRUE, warning=FALSE}
b <- t %>% group_by(clarity, color) %>% summarise(n = n())
b %>% ggplot(aes(x = clarity, y = n)) +
  geom_col(data = b %>% filter(color == 'F'), fill = 'red') +
  geom_col(data = b %>% filter(color == 'J'), fill = 'blue')

```

***Ta phân loại kim cương theo kiểu độ trong suốt và màu sắc sau đó tính số lượng . Ở biểu đồ trên thì ta gắn x là độ trong suốt, y là số lượng của từng loại; ta sẽ lọc các loại kim cương có màu 'F',cột biểu đồ có màu đỏ và lọc các loại kim cương có màu J, biểu đồ có màu xanh dương.  Qua biểu đồ trên ta thấy các màu phân bổ ở tất cả độ trong suốt. Trong đó màu J sẽ phân bổ nhiều nhất ở SI1 rồi giảm dần từ VS2, VS1, SI2, WS2, WS1, IF và thấp nhất là I1. Còn màu F Phân bổ nhiều nhất ở VS2 rồi giảm dần từ SI1, SI2, VS1, WS2, WS1, IF và tháp nhất là I1.***

# BIỂU ĐỒ 19

```{r echo=TRUE, warning=FALSE}
b <- t %>% group_by(clarity, color) %>% summarise(n = n())
b %>% ggplot(aes(x = clarity, y = n)) +
  geom_col(data = b %>% filter(color == 'E'), fill = 'red') +
  geom_col(data = b %>% filter(color == 'G'), fill = 'blue')
```

***Tương tự như biểu đồ số 18, lần này thay vì lọc các kim cương có màu 'F' VÀ 'J' thì ta sẽ lọc các kim cương có màu 'E' VÀ 'G'. Ở biểu đồ này ta thấy màu E chỉ phân bổ ở loại kim cương độ trong suốt là SI2,VS2 và SI1. Còn kim cương màu G phân bổ ở tất cả độ trong suốt, trong đó nhiều nhất là VS2, giảm dần từ VS1, SI1, SI2, VVS2, VVS1, IF và phân bổ ít nhất ở I1.***

# BIỂU ĐỒ 20

```{r echo=TRUE, warning=FALSE}

c <- t %>% group_by(clarity, cut) %>% summarise(n = n())
c %>% ggplot(aes(x = cut, y = n)) +
  geom_col(data = c %>% filter(clarity == 'IF'), fill = 'red') +
  geom_col(data = c %>% filter(clarity == 'I1'), fill = 'blue')
```

***Ta phân loại kim cương theo kiểu độ trong suốt và kiểu cắt sau đó tính số lượng . Ở biểu đồ trên thì ta gắn x là kiểu cắt, y là số lượng của từng loại; Ta lọc các kim cương có độ trong suốt 'IF' là các cột màu đỏ, các kim cương có độ trong suốt 'I1' là các cột màu xanh. Qua biểu đồ trên ta thấy kim cương có độ trong suốt 'IF' chỉ phân bổ ở kiểu cắt Ideal, Very Good, Premium theo số lượng giảm dần. Trong khi đó độ trong suốt I1 phân bổ ở mọi kiểu cắt, nhiều nhất là Premium và giảm dần từ Fair, Idea, Good, thấp nhất là Very Good.***

# BIỂU ĐỒ 21

```{r echo=TRUE, warning=FALSE}
f <- t %>% group_by(clarity, cut) %>% summarise(n = n())
f %>% ggplot(aes(x = cut, y = n)) +
  geom_col(data = f %>% filter(clarity == 'SI1'), fill = 'red') +
  geom_col(data = f %>% filter(clarity == 'SI2'), fill = 'blue')

```

***Tương tự như biểu đồ số 20, lần này thay vì lọc các kim cương có độ trong suốt 'iF' VÀ 'i1' thì ta sẽ lọc các kim cương có độ trong suốt 'SI1' VÀ 'SI2'. Ở biểu đồ này ta thấy độ trong suốt SI1 không phân bổ ở loại kim cương có kiểu cắt Fair, phân bố nhiều nhất ở kiểu cắt Ideal giảm dần từ Very Good, Premium và phân bổ ít nhất ở kiểu cắt Good. Kim cương có độ trong suốt SI2 phân bổ ở tất cả kiểu cắt, nhiều nhất ở kiểu cắt Premium giảm dần từ Ideal, Very Good, Good và phân bổ ít nhất ở kiểu cắt Fair.***

# BIỂU ĐỒ 22

```{r echo=TRUE, warning=FALSE}
t %>% group_by(cut) %>% summarise(n = n()) %>%
  ggplot(aes(cut,n)) +
  geom_col(fill='green') +
  geom_text(aes(label = percent(n/length(t$carat))),vjust = 2, color = 'red') +
  labs(x = 'Loại', y = 'Số lượng')
```

***Ta phân loại kim cương theo kiểu cắt và tính số lượng của các kiểu cắt. ta gắn x là 'Loại', y là 'Số Lượng'. Các cột biểu đồ được tô màu xanh lá cây, các số liệu là tỷ khối lượng của mỗi kiểu cắt, các số liệu này có màu đỏ và được điều chỉnh  vị trí dọc các cột dữ liệu với đơn vị là 2. Qua biểu đồ trên ta thấy Kiểu cắt Ideal chiếm tỷ lệ cao nhất về trọng lượng (đơn vị carat) và giảm dần từ Premium, Very Good, Good và kiểu cắt Fair có tỷ lệ trọng lượng thấp nhất***

# BIỂU ĐỒ 23

```{r echo=TRUE, warning=FALSE}
t %>% group_by(color) %>% summarise(n = n()) %>%
  ggplot(aes(color,n)) +
  geom_col(fill='green') +
  geom_text(aes(label = percent(n/length(t$carat))),vjust = 2, color = 'red') +
  labs(x = 'Loại', y = 'Số lượng')
```

***Ta phân loại kim cương theo kiểu màu sắc và tính số lượng của các màu. ta gắn x là 'Loại', y là 'Số Lượng'. Các cột biểu đồ được tô màu xanh lá cây, các số liệu là tỷ lệ khối lượng của mỗi kiểu cắt, các số liệu này có màu đỏ và được điều chỉnh  vị trí dọc các cột dữ liệu với đơn vị là 2. Qua biểu đồ trên ta thấy kim cương màu G chiếm tỷ lệ cao nhất về trọng lượng(20,93), giảm dần là E, F, H, D, I và kim cương màu J chiếm tỷ lệ thấp nhất (5,21%)***

# BIỂU ĐỒ 24

```{r echo=TRUE, warning=FALSE}
t %>% group_by(color) %>% summarise(n = n()) %>%
  ggplot(aes(color,n)) +
  geom_col(fill='green') +
  geom_text(aes(label = percent(n/length(t$price))),vjust = 2, color = 'red') +
  labs(x = 'Loại', y = 'Số lượng')
```

***Ta phân loại kim cương theo kiểu màu sắc và tính số lượng của các màu. ta gắn x là 'Loại', y là 'Số Lượng'. Các cột biểu đồ được tô màu xanh lá cây, các số liệu là tỷ lệ giá tiền của mỗi kiểu cắt, các số liệu này có màu đỏ và được điều chỉnh  vị trí dọc các cột dữ liệu với đơn vị là 2. Qua biểu đồ trên ta thấy kim cương màu G chiếm tỷ lệ cao nhất về giá(20,93%), giảm dần là E, F, H, D, I và kim cương màu J chiếm tỷ lệ thấp nhất (5,21%)***

# BIỂU ĐỒ 25

```{r echo=TRUE, warning=FALSE}
t %>% group_by(clarity) %>% summarise(n = n()) %>%
  ggplot(aes(clarity,n)) +
  geom_col(fill='green') +
  geom_text(aes(label = percent(n/length(t$price))),vjust = 2, color = 'red') +
  labs(x = 'Loại', y = 'Số lượng')
```

***Ta phân loại kim cương theo độ trong suốt và tính số lượng của các màu. ta gắn x là 'Loại', y là 'Số Lượng'. Các cột biểu đồ được tô màu xanh lá cây, các số liệu là tỷ lệ giá tiền của mỗi loại kim cương, các số liệu này có màu đỏ và được điều chỉnh  vị trí dọc các cột dữ liệu với đơn vị là 2. Qua biểu đồ trên ta thấy kim cương có độ trong suốt SI1 chiếm tỷ lệ giá cao nhất (24,2%), giảm dần từ VS2, SI2, VS1, VVS2, VVS1, IF, I1(1,4%)***

# BIỂU ĐỒ 26

```{r echo=TRUE, warning=FALSE}
t %>% group_by(cut) %>% summarise(n = n()) %>%
  ggplot(aes(cut,n)) +
  geom_col(fill='green') +
  geom_text(aes(label = percent(n/length(t$price))),vjust = 2, color = 'red') +
  labs(x = 'Loại', y = 'Số lượng')

```

# BIỂU ĐỒ 27

```{r echo=TRUE, warning=FALSE}
t %>% group_by(cut,color) %>% summarise(n=n()) %>%
  ggplot(aes(x = cut,y = n)) +
    geom_col(position = 'dodge') +
    facet_wrap(~color) +
    labs(x = 'Loại', y = 'Số lượng')
```

***Ta phân loại kim cương theo kiểu cắt và màu sắc sau đó tính số lượng. ta gắn x là loại, y la số lượng và ta chia thành 7 biểu đồ theo 7 loại màu sắc để so sánh. Qua 7 biểu đồ ta nhận xét các màu sắc phân bổ nhiều nhất ở kim cương có kiểu cắt Ideal, giảm dần qua các kiểu cắt Premium, Very Good, Good và phân bổ ít nhất ở kiểu cắt Fair ***

# BIỂU ĐỒ 28

```{r echo=TRUE, warning=FALSE}

t %>% group_by(color) %>% summarise(m = mean(depth)) %>%
  ggplot(aes(color,m)) +
  geom_col(fill='green') +
  geom_text(aes(label = round(m,2)),vjust = 2, color = 'red') +
  labs(x = 'Loại', y = 'Số lượng')
```

***Ta phân loại kim cương theo màu sắc và tính trung bình tỷ lệ độ sâu của từng loại. Các cột biểu đồ có màu xanh lá cây, các dữ liệu có màu đỏ, được làm tròn đến 2 chữ số thập phân và được điều chỉnh ở vị trí dọc cách cột 2 đơn vị. Qua biểu đồ trên ta thấy các loại màu của kim cương sẽ có xấp xỉ trung bình tỷ lệ độ sâu bằng nhau. Trong đó cao nhất là màu J và thấp nhất là màu E.***

# BIỂU ĐỒ 29

```{r echo=TRUE, warning=FALSE}
t %>% ggplot(aes(x = clarity)) +
  geom_bar() +
  labs(x = 'Cấp độ tinh khiết', y = 'Số lượng') +
  coord_flip() +
  labs(title = 'Cấp độ tinh khiết của kim cương (biểu đồ ngang)')
```

***Ta phân loại kim cương theo độ trong suốt. ta gắn x là cấp độ tinh khiết, y là số lượng Và đây là biểu đồ ngang. Qua biểu đồ trên ta thấy SI1 có độ tinh khiết cao nhất, giảm dần từ VS2, SI2, VS1, VVS2, IF và I1 là kim cương có độ trong suốt thấp nhất***

# BIỂU ĐỒ 30

```{r echo=TRUE, warning=FALSE}
t %>% group_by(cut) %>% summarise(m= mean(depth)) %>%
  ggplot(aes(x = cut,y = m)) +
  geom_col(position = 'dodge') +
  geom_text(aes(label = round(m,2)), vjust = 2, color = 'green') +
  labs(x = 'Kiểu cắt', y = 'Mean')
```

***Ta phân loại kim cương theo kiểu cắt và tính trung bình tỷ lệ độ sâu (trung bình z/x). ta gắn x là kiểu cắt, y là trung bình. các số liệu được làm tròn 2 chữ số thập phân, được điều chỉnh ở vị trí cách cột dọc 2 đơn vị và có màu xanh lá cây. Qua biểu đồ trên ta thấy kiểu cắt Fair có độ sâu trung bình lớn nhất, giảm dần từ Good, Very Good, Ideal và thấp nhất là Premium***


***Cảm ơn thầy đã đọc, chúc thầy 1 ngày làm việc vui vẻ***