04:19:56, 02 - 03 - 2024

NHIỆM VỤ 4


1. GIỚI THIỆU MỘT SỐ ĐỒ THỊ DẠNG BAR CHART CHO BỘ DỮ LIỆU DIAMOND

library(ggplot2)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ lubridate 1.9.3     ✔ tibble    3.2.1
## ✔ purrr     1.0.2     ✔ tidyr     1.3.0
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(scales)
## 
## Attaching package: 'scales'
## 
## The following object is masked from 'package:purrr':
## 
##     discard
## 
## The following object is masked from 'package:readr':
## 
##     col_factor
htp <- diamonds
htp$MG <- case_when(htp$price < 1000 ~'Loại  1', htp$price >= 1000 & htp$price < 5000 ~ ' Loại  2' , htp$price >= 5000 & htp$price< 10000 ~ 'Loại 3', htp$price >= 10000 & htp$price < 15000 ~ 'Loại 4', htp$price >= 15000 ~ 'Loại 5')

1.1 ĐỒ THỊ 1 - Biểu đồ Cột với Số Lượng Kim Cương theo Màu Sắc

htp %>% ggplot(aes(x = color)) +
    geom_bar(fill='navy') +
    labs(x = 'Loại ', y = 'Số lượng' )

  • Giải Thích Kết Quả:

-Trục X (“Màu Sắc”): Trục này biểu diễn các mức độ màu sắc của kim cương (D, E, F, G, H, I, J).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi mức độ màu sắc.

Biểu đồ giúp thấy rõ sự phân bố của kim cương dựa trên mức độ màu sắc của chúng. Mỗi cột trên biểu đồ biểu thị số lượng kim cương tương ứng với mỗi mức độ màu sắc. Màu navy được chọn để tô màu cho tất cả các cột, không phân biệt giữa các mức độ màu sắc. Biểu đồ này không phân loại chi tiết hơn về mối quan hệ giữa màu sắc và số lượng kim cương, nó chỉ thể hiện phân bố tổng quan.

1.2 ĐỒ THỊ 2 - Biểu đồ Cột Ngang với Số Lượng Kim Cương theo Clarity

htp %>% ggplot(aes(x = clarity)) +
    geom_bar(fill='gold') +
    labs(x = 'Loại', y = 'Số lượng') +
    coord_flip()

  • Giải Thích Kết Quả:

-Trục Y (“Loại”): Trục này biểu diễn các loại clarity (SI1, VS2, VS1, SI2, VVS2, VVS1, IF).

-Trục X (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại clarity.

Biểu đồ giúp thấy rõ sự phân bố của kim cương dựa trên loại clarity của chúng. Mỗi cột trên biểu đồ biểu thị số lượng kim cương tương ứng với từng loại clarity. Hoán đổi trục giúp làm cho biểu đồ trở nên dễ đọc hơn khi so sánh số lượng kim cương giữa các loại clarity.

Biểu đồ này cung cấp một cái nhìn tổng quan về sự phân phối của kim cương dựa trên clarity và làm cho so sánh giữa các loại clarity trở nên trực quan hơn.

1.3 ĐỒ THỊ 3 - Biểu đồ Cột với Số Lượng Kim Cương theo Loại Cắt

htp %>% ggplot(aes(x = cut)) +
    geom_bar(fill='navy') +
    labs(x = 'Loại', y = 'Số lượng')

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương (Fair, Good, Very Good, Premium, Ideal).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại cắt.

Biểu đồ cung cấp cái nhìn tổng quan về sự phân phối của kim cương theo loại cắt. Nó giúp dễ dàng so sánh số lượng kim cương giữa các loại cắt khác nhau.

1.4 ĐỒ THỊ 4 - Biểu đồ Cột với Số Lượng Kim Cương theo Clarity

htp %>% group_by(clarity ) %>% summarise(n = n()) %>%
  ggplot(aes(clarity,n)) +
    geom_col(fill='gold') +
    geom_text(aes(label = n),vjust = 2, color = 'navy') +
    labs(x = 'Loại ', y = 'Số lượng')

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các loại clarity (SI1, VS2, VS1, SI2, VVS2, VVS1, IF).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại clarity.

Biểu đồ này thể hiện sự phân bố số lượng kim cương cho từng loại clarity. Mỗi cột biểu thị số lượng kim cương tương ứng với loại clarity.

Biểu đồ này giúp dễ dàng so sánh số lượng kim cương giữa các loại clarity và cung cấp cái nhìn tổng quan về phân phối của chúng trong bộ dữ liệu.

1.5 ĐỒ THỊ 5 - Biểu đồ Cột với Số Lượng Kim Cương theo Loại Cắt

htp %>% group_by(cut ) %>% summarise(n = n()) %>%
  ggplot(aes(cut,n)) +
    geom_col(fill='gold') +
    geom_text(aes(label = n),vjust = 2, color = 'navy') +
    labs(x = 'loại ', y = 'Số lượng')

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương (Fair, Good, Very Good, Premium, Ideal).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại cắt.

Biểu đồ này thể hiện sự phân bố số lượng kim cương cho từng loại cắt. Mỗi cột biểu thị số lượng kim cương tương ứng với loại cắt.

Biểu đồ này giúp dễ dàng so sánh số lượng kim cương giữa các loại cắt và cung cấp cái nhìn tổng quan về phân phối của chúng trong bộ dữ liệu.

1.6 ĐỒ THỊ 6 - Biểu đồ Cột với Số Lượng Kim Cương theo Màu Sắc

htp %>% group_by(color) %>% summarise(n = n()) %>%
  ggplot(aes(color,n)) +
    geom_col(fill='gold') +
    geom_text(aes(label = n),vjust = 2, color = 'navy') +
    labs(x = 'loại  ', y = 'Số lượng')

  • Giải Thích Kết Quả:

-Trục X (“Màu Sắc”): Trục này biểu diễn các mức độ màu sắc của kim cương (D, E, F, G, H, I, J).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi mức độ màu sắc.

Biểu đồ này thể hiện sự phân bố số lượng kim cương cho từng mức độ màu sắc. Mỗi cột biểu thị số lượng kim cương tương ứng với mỗi mức độ màu sắc.

Biểu đồ này giúp dễ dàng so sánh số lượng kim cương giữa các mức độ màu sắc và cung cấp cái nhìn tổng quan về phân phối của chúng trong bộ dữ liệu.

1.7 ĐỒ THỊ 7 - Biểu đồ Cột với Số Lượng Kim Cương theo Clarity

htp %>% group_by(clarity) %>% summarise(n = n()) %>%
  ggplot(aes(clarity,n)) +
    geom_col(fill='navy') +
    geom_text(aes(label = percent(n/length(htp$carat))),vjust = 2, color = 'gold') +
    labs(x = 'Loại', y = 'Số lượng')

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các loại clarity (SI1, VS2, VS1, SI2, VVS2, VVS1, IF).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại clarity.

Biểu đồ này thể hiện sự phân bố của số lượng kim cương cho từng loại clarity. Mỗi cột biểu thị số lượng kim cương tương ứng với loại clarity.

Biểu đồ này giúp thấy rõ sự phân bố của kim cương dựa trên clarity và cung cấp thông tin về tỷ lệ phần trăm của từng loại clarity trong toàn bộ bộ dữ liệu.

1.8 ĐỒ THỊ 8 - Biểu đồ Cột với Số Lượng Kim Cương theo Loại Cắt

htp %>% group_by(cut) %>% summarise(n = n()) %>%
  ggplot(aes(cut,n)) +
    geom_col(fill='navy') +
    geom_text(aes(label = percent(n/length(htp$carat))),vjust = 2, color = 'gold') +
    labs(x = 'Loại', y = 'Số lượng')

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương (Fair, Good, Very Good, Premium, Ideal).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại cắt.

Biểu đồ này thể hiện sự phân bố của số lượng kim cương cho từng loại cắt. Mỗi cột biểu thị số lượng kim cương tương ứng với loại cắt.

Biểu đồ này giúp thấy rõ sự phân bố của kim cương dựa trên loại cắt và cung cấp thông tin về tỷ lệ phần trăm của từng loại cắt trong toàn bộ bộ dữ liệu.

1.9 ĐỒ THỊ 9 - Biểu đồ Cột với Số Lượng Kim Cương theo Màu Sắc

htp %>% group_by(color) %>% summarise(n = n()) %>%
  ggplot(aes(color,n)) +
    geom_col(fill='navy') +
    geom_text(aes(label = percent(n/length(htp$carat))),vjust = 2, color = 'gold') +
    labs(x = 'Loại', y = 'Số lượng')

  • Giải Thích Kết Quả:

-Trục X (“Màu Sắc”): Trục này biểu diễn các mức độ màu sắc của kim cương (D, E, F, G, H, I, J).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi mức độ màu sắc.

Biểu đồ này thể hiện sự phân bố của số lượng kim cương cho từng mức độ màu sắc. Mỗi cột biểu thị số lượng kim cương tương ứng với mỗi mức độ màu sắc.

Biểu đồ này giúp thấy rõ sự phân bố của kim cương dựa trên mức độ màu sắc và cung cấp thông tin về tỷ lệ phần trăm của từng mức độ màu sắc trong toàn bộ bộ dữ liệu.

1.10 ĐỒ THỊ 10 - Biểu đồ Cột Dạng “Facet” với Số Lượng Kim Cương theo Màu Sắc và Clarity

htp %>% group_by(clarity,color) %>% summarise(n=n()) %>%
  ggplot(aes(x = color,y = n)) +
    geom_col(fill="gold") +
    facet_wrap(~clarity) +
    labs(x = 'Loại', y = 'Số lượng')
## `summarise()` has grouped output by 'clarity'. You can override using the
## `.groups` argument.

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các mức độ màu sắc của kim cương (D, E, F, G, H, I, J).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi mức độ màu sắc.

Biểu đồ này thể hiện sự phân bố của số lượng kim cương cho từng mức độ màu sắc, được phân loại theo clarity. Thông qua các facets, bạn có thể thấy sự biến động của số lượng kim cương dựa trên clarity và màu sắc tương ứng.

Biểu đồ này mang lại cái nhìn tổng quan về mối quan hệ giữa màu sắc, clarity và số lượng kim cương trong bộ dữ liệu.

1.11 ĐỒ THỊ 11 - Biểu đồ Cột Dạng “Facet” với Số Lượng Kim Cương theo Clarity và Loại Cắt

htp %>% group_by(cut,clarity) %>% summarise(n=n()) %>%
  ggplot(aes(x = clarity,y = n)) +
    geom_col(fill="gold") +
    facet_wrap(~cut) +
    labs(x = 'Loại', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các loại clarity (SI1, VS2, VS1, SI2, VVS2, VVS1, IF).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại clarity.

Biểu đồ này thể hiện sự phân bố của số lượng kim cương cho từng loại clarity, được phân loại theo loại cắt. Thông qua các facets, bạn có thể thấy sự biến động của số lượng kim cương dựa trên loại cắt và clarity tương ứng.

Biểu đồ này mang lại cái nhìn tổng quan về mối quan hệ giữa loại cắt, clarity và số lượng kim cương trong bộ dữ liệu.

1.12 ĐỒ THỊ 12 - Biểu đồ Cột Dạng “Facet” với Số Lượng Kim Cương theo Màu Sắc và Loại Cắt

htp %>% group_by(cut,color) %>% summarise(n=n()) %>%
  ggplot(aes(x = color,y = n)) +
    geom_col(fill="gold") +
    facet_wrap(~cut) +
    labs(x = 'Loại', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các mức độ màu sắc của kim cương (D, E, F, G, H, I, J).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi mức độ màu sắc.

Biểu đồ này thể hiện sự phân bố của số lượng kim cương cho từng mức độ màu sắc, được phân loại theo loại cắt. Thông qua các facets, bạn có thể thấy sự biến động của số lượng kim cương dựa trên loại cắt và màu sắc tương ứng.

Biểu đồ này mang lại cái nhìn tổng quan về mối quan hệ giữa màu sắc, loại cắt và số lượng kim cương trong bộ dữ liệu.

1.13 ĐỒ THỊ 13 - Biểu đồ Cột Dạng “Facet” với Số Lượng Kim Cương theo Clarity và Loại Cắt

htp %>% group_by(clarity,cut) %>% summarise(n=n()) %>%
  ggplot(aes(x = clarity,y = n)) +
    geom_col( fill= 'navy') +
    facet_wrap(~ cut) +
    geom_text(aes(label = n),vjust = 2, color = 'gold') +
    labs(x = 'Loại', y = 'Số lượng')
## `summarise()` has grouped output by 'clarity'. You can override using the
## `.groups` argument.

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các loại clarity (SI1, VS2, VS1, SI2, VVS2, VVS1, IF).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại clarity.

Biểu đồ này thể hiện mối quan hệ giữa số lượng kim cương, clarity và loại cắt. Mỗi cột biểu thị số lượng kim cương tương ứng với mỗi loại clarity, và các cột này được nhóm lại theo loại cắt.

Biểu đồ này giúp thấy rõ mối quan hệ giữa clarity, loại cắt và số lượng kim cương. Các facets cho phép bạn so sánh sự phân phối của kim cương theo clarity trong từng loại cắt khác nhau.

1.14 ĐỒ THỊ 14 - Biểu đồ Cột Dạng “Facet” với Số Lượng Kim Cương theo Màu Sắc và Clarity

htp %>% group_by(clarity,color) %>% summarise(n=n()) %>%
  ggplot(aes(x = color,y = n)) +
    geom_col( fill= 'navy') +
    facet_wrap(~clarity) +
    geom_text(aes(label = n),vjust = 2, color = 'gold') +
    labs(x = 'Loại', y = 'Số lượng')
## `summarise()` has grouped output by 'clarity'. You can override using the
## `.groups` argument.

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các mức độ màu sắc của kim cương (D, E, F, G, H, I, J).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi mức độ màu sắc.

Biểu đồ này thể hiện mối quan hệ giữa số lượng kim cương, màu sắc và clarity. Mỗi cột biểu thị số lượng kim cương tương ứng với mỗi mức độ màu sắc, và các cột này được nhóm lại theo clarity.

Biểu đồ này giúp thấy rõ mối quan hệ giữa màu sắc, clarity và số lượng kim cương. Các facets cho phép bạn so sánh sự phân phối của kim cương theo màu sắc trong từng loại clarity khác nhau.

1.15 ĐỒ THỊ 15 - Biểu đồ Cột Dạng “Facet” với Số Lượng Kim Cương theo Màu Sắc và Loại Cắt

htp %>% group_by(cut,color) %>% summarise(n=n()) %>%
  ggplot(aes(x = color,y = n)) +
    geom_col( fill= 'navy') +
    facet_wrap(~cut) +
    geom_text(aes(label = n),vjust = 2, color = 'gold') +
    labs(x = 'Loại', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các mức độ màu sắc của kim cương (D, E, F, G, H, I, J).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi mức độ màu sắc.

Biểu đồ này thể hiện mối quan hệ giữa số lượng kim cương, màu sắc và loại cắt. Mỗi cột biểu thị số lượng kim cương tương ứng với mỗi mức độ màu sắc, và các cột này được nhóm lại theo loại cắt.

Biểu đồ này giúp thấy rõ mối quan hệ giữa màu sắc, loại cắt và số lượng kim cương. Các facets cho phép bạn so sánh sự phân phối của kim cương theo màu sắc trong từng loại cắt khác nhau.

1.16 ĐỒ THỊ 16 - Biểu đồ Cột Dạng “Facet” với Giá Trị Trung Bình của Kim Cương theo Màu Sắc và Clarity

htp %>% group_by(clarity,color) %>% summarise(m = mean(price)) %>%
  ggplot(aes(x = color,y = m)) +
    geom_col(position = 'dodge', fill= 'gold') +
    facet_wrap(~clarity) +
    geom_text(aes(label = round(m))) +
    labs(x = 'Color ', y = 'Số lượng')
## `summarise()` has grouped output by 'clarity'. You can override using the
## `.groups` argument.

  • Giải Thích Kết Quả:

-Trục X (“Color”): Trục này biểu diễn các mức độ màu sắc của kim cương (D, E, F, G, H, I, J).

-Trục Y (“Giá Trị Trung Bình”): Trục này thể hiện giá trị trung bình của kim cương cho mỗi mức độ màu sắc.

Biểu đồ này thể hiện giá trị trung bình của kim cương dựa trên mức độ màu sắc và clarity. Mỗi cột biểu thị giá trị trung bình tương ứng với mỗi mức độ màu sắc, và các cột này được nhóm lại theo clarity.

Biểu đồ này giúp thấy rõ mối quan hệ giữa giá trị trung bình của kim cương, màu sắc và clarity. Các facets cho phép bạn so sánh giá trị trung bình của kim cương theo màu sắc trong từng loại clarity khác nhau.

1.17 ĐỒ THỊ 17 - Biểu đồ Cột Dạng “Facet” với Giá Trị Trung Bình của Kim Cương theo Clarity và Loại Cắt

htp %>% group_by(cut,clarity) %>% summarise(m = mean(price)) %>%
  ggplot(aes(x = clarity,y = m)) +
    geom_col(position = 'dodge', fill= 'gold') +
    facet_wrap(~cut ) +
    geom_text(aes(label = round(m))) +
    labs(x = 'clarity ', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.

  • Giải Thích Kết Quả:

-Trục X (“Clarity”): Trục này biểu diễn các loại clarity (SI1, VS2, VS1, SI2, VVS2, VVS1, IF).

-Trục Y (“Giá Trị Trung Bình”): Trục này thể hiện giá trị trung bình của kim cương cho mỗi loại clarity.

Biểu đồ này thể hiện giá trị trung bình của kim cương dựa trên loại clarity và loại cắt. Mỗi cột biểu thị giá trị trung bình tương ứng với mỗi loại clarity, và các cột này được nhóm lại theo loại cắt.

Biểu đồ này giúp thấy rõ mối quan hệ giữa giá trị trung bình của kim cương, clarity và loại cắt. Các facets cho phép bạn so sánh giá trị trung bình của kim cương theo clarity trong từng loại cắt khác nhau.

1.18 ĐỒ THỊ 18 - Biểu đồ Cột Dạng “Facet” với Giá Trị Trung Bình của Kim Cương theo Màu Sắc và Loại Cắt

htp %>% group_by(cut,color) %>% summarise(m = mean(price)) %>%
  ggplot(aes(x = color,y = m)) +
    geom_col(position = 'dodge',fill= 'gold') +
    facet_wrap(~cut ) +
    geom_text(aes(label = round(m))) +
    labs(x = 'Color ', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.

  • Giải Thích Kết Quả:

-Trục X (“Color”): Trục này biểu diễn các mức độ màu sắc của kim cương (D, E, F, G, H, I, J).

-Trục Y (“Giá Trị Trung Bình”): Trục này thể hiện giá trị trung bình của kim cương cho mỗi mức độ màu sắc.

Biểu đồ này thể hiện giá trị trung bình của kim cương dựa trên mức độ màu sắc và loại cắt. Mỗi cột biểu thị giá trị trung bình tương ứng với mỗi mức độ màu sắc, và các cột này được nhóm lại theo loại cắt.

Biểu đồ này giúp thấy rõ mối quan hệ giữa giá trị trung bình của kim cương, màu sắc và loại cắt. Các facets cho phép bạn so sánh giá trị trung bình của kim cương theo màu sắc trong từng loại cắt khác nhau.

1.19 ĐỒ THỊ 19 - Biểu Đồ Cột với Phân Phối Giá Trị của Kim Cương theo Phân Khúc Giá

tp1 <- htp %>% mutate(Price = cut(price,5, label = c('rất thấp ', 'thấp','tb','cao','rất cao')))
tp1 %>% ggplot(aes(x = Price)) +
  geom_bar(fill = 'red')

  • Giải Thích Kết Quả:

-Trục X (“Giá Trị”): Trục này biểu diễn các phân khúc giá của kim cương (rất thấp, thấp, trung bình, cao, rất cao).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương trong mỗi phân khúc giá.

Biểu đồ này thể hiện phân phối của kim cương dựa trên phân khúc giá. Mỗi cột biểu thị số lượng kim cương tương ứng với mỗi phân khúc giá.

Biểu đồ này giúp trực quan hóa cách kim cương phân phối trong các phân khúc giá khác nhau, giúp nhìn nhận mức độ phổ biến của kim cương trong mỗi khoảng giá.

1.20 ĐỒ THỊ 20 - Biểu Đồ Cột với Phân Phối Trọng Lượng Carat của Kim Cương

tp2 <-htp %>% mutate(Carat = cut(carat,5, label = c('rất nhỏ', 'nhỏ','vừa','lớn','rất lớn')))
tp2 %>% ggplot(aes(x = Carat)) +
  geom_bar(fill = 'red')

  • Giải Thích Kết Quả:

-Trục X (“Carat”): Trục này biểu diễn các phân khúc trọng lượng carat của kim cương (rất nhỏ, nhỏ, vừa, lớn, rất lớn).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương trong mỗi phân khúc trọng lượng carat.

Biểu đồ này thể hiện phân phối của kim cương dựa trên trọng lượng carat. Mỗi cột biểu thị số lượng kim cương tương ứng với mỗi phân khúc trọng lượng carat.

Biểu đồ này giúp trực quan hóa cách kim cương phân phối trong các phân khúc trọng lượng carat khác nhau, giúp nhìn nhận mức độ phổ biến của kim cương dựa trên kích thước.

1.21 ĐỒ THỊ 21 - Biểu đồ Số lượng Kim cương theo Loại Cắt

htp <- diamonds
htp %>% ggplot(aes(x = cut)) +
    geom_bar(fill='navy') +
    labs(x = 'Loại', y = 'Số lượng')

  • Giải Thích Kết Quả:

Đồ thị này thể hiện số lượng kim cương cho mỗi loại cắt.

-Trục X (“Loại”): Trục này thể hiện các loại cắt khác nhau của kim cương. Các loại cắt có thể là “Fair”, “Good”, “Very Good”, “Premium”, và “Ideal”.

-Trục Y (“Số lượng”): Trục này biểu diễn số lượng kim cương tương ứng với từng loại cắt trên trục X.

Các thanh cột trên biểu đồ biểu thị số lượng kim cương thuộc mỗi loại cắt. Nếu thanh cột của một loại cắt càng cao, điều này có nghĩa là có nhiều kim cương thuộc loại cắt đó trong bộ dữ liệu.

1.22 ĐỒ THỊ 22 - Biểu đồ Cột Ngang với số lượng Kim cương theo Loại Cắt

htp <- diamonds
htp %>% ggplot(aes(x = cut)) +
    geom_bar(fill='gold') +
    labs(x = 'Loại', y = 'Số lượng') +
    coord_flip()

  • Giải Thích Kết Quả:

-Trục X (“Số lượng”): Trục này biểu diễn số lượng kim cương.

-Trục Y (“Loại”): Trục này thể hiện các loại cắt khác nhau của kim cương.

Biểu đồ này đã sử dụng coord_flip() để đảo ngược trục X và Y, biến nó từ một biểu đồ cột truyền thống thành một biểu đồ cột ngang. Các thanh cột ngang trên biểu đồ biểu thị số lượng kim cương cho mỗi loại cắt. Nếu thanh cột của một loại cắt càng dài, điều này chỉ ra rằng có nhiều kim cương thuộc loại cắt đó trong bộ dữ liệu.

1.23 ĐỒ THỊ 23 - Biểu đồ Cột với Số lượng Kim cương theo Loại Cắt

htp %>% group_by(cut) %>% summarise(n = n()) %>%
  ggplot(aes(cut,n)) +
    geom_col(fill='navy') +
    geom_text(aes(label = n),vjust = 2, color = 'gold') +
    labs(x = 'Loại', y = 'Số lượng')

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương.

-Trục Y (“Số lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại cắt.

Biểu đồ này giúp hiểu rõ hơn về phân phối của số lượng kim cương trong từng loại cắt và cung cấp thông tin chi tiết về giá trị cụ thể của mỗi cột.

1.24 ĐỒ THỊ 24 - Biểu đồ Cột với Tỉ lệ phần trăm Kim cương theo Loại Cắt

htp %>% group_by(cut) %>% summarise(n = n()) %>%
  ggplot(aes(cut,n)) +
    geom_col(fill='gold') +
    geom_text(aes(label = percent(n/length(htp$carat))),vjust = 2, color = 'navy') +
    labs(x = 'Loại', y = 'Số lượng')

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương.

-Trục Y (“Số lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại cắt.

Đồ thị này giúp thấy rõ tỉ lệ phần trăm của mỗi loại cắt so với tổng số lượng kim cương trong dữ liệu. Tính theo tỉ lệ phần trăm, bạn có thể thấy được sự phân phối của kim cương theo loại cắt một cách trực quan.

1.25 ĐỒ THỊ 25 - Biểu đồ Cột Dạng Đối xứng theo Màu Sắc và Loại Cắt của Kim Cương

htp %>% group_by(cut,color) %>% summarise(n=n()) %>%
  ggplot(aes(x = cut,y = n)) +
    geom_col(position = 'dodge', fill='navy') +
    facet_wrap(~color) +
    labs(x = 'Loại', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương.

-Trục Y (“Số lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại cắt.

Các cột trên biểu đồ được nhóm dựa trên loại cắt và tô màu theo màu sắc của kim cương. Hàm facet_wrap(~color) được sử dụng để tạo các phân khúc riêng biệt cho từng màu sắc trên biểu đồ.

Đồ thị này giúp hiểu rõ hơn về sự phân bố của kim cương theo cả loại cắt và màu sắc. Các phân khúc riêng biệt cho mỗi màu sắc giúp so sánh hiệu quả số lượng kim cương theo loại cắt trong từng nhóm màu sắc khác nhau.

1.26 ĐỒ THỊ 26 - Biểu đồ Cột Dạng Đối xứng với Số lượng Kim Cương theo Loại Cắt và Màu Sắc

htp %>% group_by(cut,color) %>% summarise(n=n()) %>%
  ggplot(aes(x = cut,y = n)) +
    geom_col(position = 'dodge', fill='gold') +
    facet_wrap(~color) +
    geom_text(aes(label = n),vjust = 2, color = 'navy') +
    labs(x = 'Loại', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương.

-Trục Y (“Số lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại cắt.

Biểu đồ này giúp so sánh số lượng kim cương trong từng loại cắt, được phân loại theo màu sắc, và cung cấp cái nhìn tổng quan về phân phối của chúng trong bộ dữ liệu.

1.27 ĐỒ THỊ 27 - Biểu đồ Cột với Trung bình Trọng Lượng Carat của Kim Cương theo Loại Cắt

htp <- diamonds
htp %>% group_by(cut) %>% summarise(m= mean(carat)) %>%
  ggplot(aes(x = cut,y = m)) +
    geom_col(position = 'dodge', fill='navy') +
    geom_text(aes(label = round(m,2)), vjust = 2, color = 'gold') +
    labs(x = 'Màu', y = 'Mean')

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương.

-Trục Y (“Trung bình Trọng Lượng Carat”): Trục này thể hiện giá trị trung bình của trọng lượng carat cho mỗi loại cắt.

Các cột trên biểu đồ biểu thị giá trị trung bình của trọng lượng carat cho từng loại cắt. Chú thích giá trị trên đỉnh mỗi cột giúp hiển thị số liệu chính xác và chi tiết hơn về giá trị trung bình của từng loại cắt.

Biểu đồ này giúp so sánh giá trị trung bình của trọng lượng carat trong từng loại cắt và cung cấp cái nhìn tổng quan về phân phối của chúng trong bộ dữ liệu.

1.28 ĐỒ THỊ 28 - Biểu đồ Cột Dạng Đối xứng với Giá Trung bình của Kim Cương theo Loại Cắt và Màu Sắc

htp <- diamonds
htp %>% group_by(cut,color) %>% summarise(m = mean(price)) %>%
  ggplot(aes(x = cut,y = m)) +
    geom_col(position = 'dodge', fill='gold') +
    facet_wrap(~color) +
    geom_text(aes(label = round(m))) +
    labs(x = 'cut', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương.

-Trục Y (“Giá Trung bình”): Trục này thể hiện giá trung bình của kim cương cho mỗi loại cắt.

Các cột trên biểu đồ biểu thị giá trung bình của kim cương cho từng loại cắt và màu sắc. Phân khúc màu sắc và chú thích giá trung bình trên đỉnh mỗi cột giúp hiển thị sự phân phối của giá theo loại cắt và màu sắc.

Biểu đồ này giúp so sánh giá trung bình của kim cương trong từng loại cắt, được phân loại theo màu sắc, và cung cấp cái nhìn tổng quan về sự biến động giá theo các yếu tố này trong bộ dữ liệu.

1.29 ĐỒ THỊ 29 - So sánh Số lượng Kim Cương theo Loại Cắt và Màu Sắc (D và J)

htp <- diamonds
htp <- htp %>% group_by(cut, color) %>% summarise(n = n())
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.
htp %>% ggplot(aes(x = cut, y = n)) +
  geom_col(data = htp %>% filter(color == 'D'), fill = 'gold') +
  geom_col(data = htp %>% filter(color == 'J'), fill = 'navy')

  • Giải Thích Kết Quả:

-Trục X (“Loại”): Trục này biểu diễn các loại cắt khác nhau của kim cương.

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương cho mỗi loại cắt.

Các cột trên biểu đồ biểu thị số lượng kim cương cho mỗi loại cắt, nhưng chỉ giữ lại các dữ liệu liên quan đến màu sắc ‘D’ (vàng) và ‘J’ (navy). Mỗi màu sắc có một cột tương ứng trên biểu đồ, giúp so sánh số lượng kim cương của từng loại cắt giữa hai màu sắc khác nhau.

Biểu đồ này giúp thấy rõ sự chênh lệch trong số lượng kim cương giữa các loại cắt khi so sánh giữa màu sắc ‘D’ và ‘J’. Màu vàng biểu thị một mức độ và màu xanh navy biểu thị mức độ khác, giúp đánh bại sự chênh lệch giữa các nhóm.

1.30 ĐỒ THỊ 30 - Biểu đồ Cột với Số Lượng Kim Cương theo Phân loại Trọng Lượng Carat

htp <- diamonds 
htp <- htp %>% mutate(caratC = cut(carat,5, label = c('rất nhỏ', 'nhỏ','vừa','lớn','rất lớn')))
htp %>% ggplot(aes(x = caratC)) +
  geom_bar(fill = 'navy')

  • Giải Thích Kết Quả:

-Trục X (“Phân loại Trọng Lượng Carat”): Trục này biểu diễn các phân loại của trọng lượng carat, được xác định bằng hàm cut() từ thư viện dplyr.

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương thuộc từng phân loại.

Biểu đồ này giúp thấy rõ sự phân bố của kim cương theo trọng lượng carat, được chia thành các nhóm rất nhỏ, nhỏ, vừa, lớn và rất lớn.

1.31 ĐỒ THỊ 31 - Biểu Đồ Cột So Sánh Số Lượng Kim Cương Theo Màu Sắc và Clarity

htp2 <- htp %>% group_by(clarity, color) %>% summarise(n = n())
## `summarise()` has grouped output by 'clarity'. You can override using the
## `.groups` argument.
htp2 %>% ggplot(aes(x = color, y = n)) +
  geom_col(data = htp2 %>% filter(clarity == 'VS2'), fill = 'gold') +
  geom_col(data = htp2 %>% filter(clarity == 'VS1'), fill = 'navy')

  • Giải Thích Kết Quả:

-Trục X (“Màu Sắc”): Trục này biểu diễn các mức độ màu sắc của kim cương (D, E, F, G, H, I, J).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương tương ứng với mỗi mức độ màu sắc.

Biểu đồ này so sánh số lượng kim cương theo màu sắc và clarity. Có hai cột tương ứng với clarity ‘VS2’ và ‘VS1’, mỗi cột biểu thị số lượng kim cương tương ứng với mỗi mức độ màu sắc.

Biểu đồ này giúp thấy rõ sự phân phối của kim cương theo màu sắc và clarity, đồng thời làm nổi bật sự so sánh giữa clarity ‘VS2’ và ‘VS1’ cho mỗi mức độ màu sắc.

1.32 ĐỒ THỊ 32 - Biểu Đồ Cột So Sánh Số Lượng Kim Cương Theo Loại Cắt và Clarity

htp1 <- htp %>% group_by(cut, clarity) %>% summarise(n = n())
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.
htp1 %>% ggplot(aes(x = cut, y = n)) +
  geom_col(data = htp1 %>% filter(clarity == 'VS2'), fill = 'gold') +
  geom_col(data = htp1 %>% filter(clarity == 'IF'), fill = 'navy')

  • Giải Thích Kết Quả:

-Trục X (“Loại Cắt”): Trục này biểu diễn các loại cắt của kim cương (Fair, Good, Very Good, Premium, Ideal).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương tương ứng với mỗi loại cắt.

Biểu đồ này so sánh số lượng kim cương theo loại cắt và clarity. Có hai cột tương ứng với clarity ‘VS2’ và ‘IF’, mỗi cột biểu thị số lượng kim cương tương ứng với mỗi loại cắt.

Biểu đồ này giúp thấy rõ sự phân phối của kim cương theo loại cắt và clarity, đồng thời làm nổi bật sự so sánh giữa clarity ‘VS2’ và ‘IF’ cho mỗi loại cắt.

1.33 ĐỒ THỊ 33 - Biểu Đồ Cột So Sánh Số Lượng Kim Cương Theo Loại Cắt và Màu Sắc

htp3 <- htp %>% group_by(cut, color) %>% summarise(n = n())
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.
htp3 %>% ggplot(aes(x = cut, y = n)) + 
  geom_col(data = htp3 %>% filter(color == 'D'), fill = 'gold') +
  geom_col(data = htp3 %>% filter(color == 'J'), fill = 'navy')

  • Giải Thích Kết Quả:

-Trục X (“Loại Cắt”): Trục này biểu diễn các loại cắt của kim cương (Fair, Good, Very Good, Premium, Ideal).

-Trục Y (“Số Lượng”): Trục này thể hiện số lượng kim cương tương ứng với mỗi loại cắt.

Biểu đồ này so sánh số lượng kim cương theo loại cắt và màu sắc. Có hai cột tương ứng với màu sắc ‘D’ và ‘J’, mỗi cột biểu thị số lượng kim cương tương ứng với mỗi loại cắt.

Biểu đồ này giúp thấy rõ sự phân phối của kim cương theo loại cắt và màu sắc, đồng thời làm nổi bật sự so sánh giữa màu sắc ‘D’ và ‘J’ cho mỗi loại cắt.

