Vẽ Đồ Thị Dạng
Bar Chart
Đồ Thị 1: Đồ thị thể
hiện số lượng kim cương theo từng biến cut, color, clarity
a %>% ggplot(aes(x = cut)) +
geom_bar() +
labs(x = 'Loại', y = 'Số lượng')

Giải Thích Câu Lệnh: - a %>% ggplot(aes(x
= cut)): Dòng này sử dụng toán tử %>% từ gói dplyr để chuyển
đổi dữ liệu trong a thành một luồng dữ liệu và đưa vào ggplot2. Trong
hàm ggplot(), aes(x = cut) thiết lập một mối quan hệ giữa dữ liệu và các
tham số trên trục x, trong trường hợp này là cut, là một biến trong
diamonds chứa thông tin về các loại kim cương. - Hàm
geom_bar() được sử dụng để tạo ra các cột dựa trên số lần xuất
hiện của mỗi giá trị của biến cut - labs(x = ‘Loại’, y = ‘Số
lượng’): Dòng này sử dụng hàm labs() để đặt
tên cho trục x và trục y của biểu đồ. Trong trường hợp này, trục x được
gán nhãn là “Loại” và trục y được gán nhãn là
“Số lượng”
Đồ Thị 2: Đồ thị biểu
thị số lượng các quan sát cho từng màu sắc của kim cương
a %>% ggplot(aes(x = color)) +
geom_bar() +
labs(x = 'Màu', y = 'Số lượng')

Giải Thích Câu Lệnh: - a %>% ggplot(aes(x
= color)): Dòng này sử dụng toán tử %>% từ gói dplyr để
chuyển đổi dữ liệu trong a thành một luồng dữ liệu và đưa vào ggplot2.
Trong hàm ggplot(), aes(x = color) thiết lập một mối quan hệ giữa dữ
liệu và các tham số trên trục x, trong trường hợp này là color, là một
biến trong diamonds chứa thông tin về các màu sắc của kim cương. -
Hàm geom_bar() được sử dụng để tạo ra các cột dựa trên
số lần xuất hiện của mỗi giá trị của biến color - labs(x =
‘Màu’, y = ‘Số lượng’): Dòng này sử dụng hàm
labs() để đặt tên cho trục x và trục y của biểu đồ.
Trong trường hợp này, trục x được gán nhãn là “Màu” và
trục y được gán nhãn là “Số lượng”
Đồ Thị 3: Đồ thị thể
hiện mối quan hệ giữa độ trong của viên kim cương (clarity) và số lượng
các viên kim cương
a %>% ggplot(aes(x = clarity)) +
geom_bar() +
labs(x = 'Mức độ tinh khiết', y = 'Số lượng')

Giải Thích Câu Lệnh: - a %>% ggplot(aes(x
= clarity)): Dòng này sử dụng toán tử %>% từ gói dplyr để
chuyển đổi dữ liệu trong a thành một luồng dữ liệu và đưa vào ggplot2.
Trong hàm ggplot(), aes(x = clarity) thiết lập một mối quan hệ giữa dữ
liệu và các tham số trên trục x, trong trường hợp này là clarity, là một
biến trong diamonds chứa thông tin về mức độ tinh khiết của kim cương. -
Hàm geom_bar() được sử dụng để tạo ra các cột dựa trên
số lần xuất hiện của mỗi giá trị của biến clarity - labs(x =
‘Mức độ tinh khiết’, y = ‘Số lượng’): Dòng này sử dụng hàm
labs() để đặt tên cho trục x và trục y của biểu đồ.
Trong trường hợp này, trục x được gán nhãn là “Mức độ tinh
khiết” và trục y được gán nhãn là “Số
lượng”
Đồ Thị 4: Biểu đồ cột
với chú thích số lượng theo từng biến: cut, color, clarity
a %>% group_by(cut) %>% summarise(n = n()) %>%
ggplot(aes(cut,n)) +
geom_col(fill='red') +
geom_text(aes(label = n),vjust = 2, color = 'black') +
labs(x = 'Loại', y = 'Số lượng')

Giải thích câu lệnh - a %>% group_by(cut)
%>% summarise(n = n()): Nhóm dữ liệu trong a theo giá trị
của biến cut, sau đó tính tổng số lượng các mẫu trong mỗi nhóm.
ggplot(aes(cut,n)): Tạo một khung biểu đồ mới,
thiết lập mối quan hệ giữa biến cut trên trục x và số lượng trên trục
y.
geom_col(fill=‘red’): Thêm một layer biểu đồ cột
vào khung biểu đồ với màu nền đỏ.
geom_text(aes(label = n),vjust = 2, color =
‘black’): Thêm các nhãn số lượng lên trên các cột. Các nhãn này
được lấy từ giá trị của biến n và được căn chỉnh dọc (vjust = 2) và màu
chữ là đen (color = ‘black’).
labs(x = ‘Loại’, y = ‘Số lượng’): Đặt nhãn cho
trục x là “Loại” và trục y là “Số
lượng”.
Đồ Thị 5: Đồ thị thể
hiện mối quan hệ giữa màu sắc của viên kim cương (color) và số lượng các
viên kim cương(chú thích số lượng)
a %>% group_by(color) %>% summarise(n = n()) %>%
ggplot(aes(color,n)) +
geom_col(fill='green') +
geom_text(aes(label = n),vjust = 2, color = 'red') +
labs(x = 'Màu', y = 'Số lượng')
Giải thích câu lệnh - a %>% group_by(color)
%>% summarise(n = n()): Nhóm dữ liệu trong a theo giá trị
của biến color, sau đó tính tổng số lượng các mẫu trong mỗi nhóm.
ggplot(aes(color,n)): Tạo một khung biểu đồ mới,
thiết lập mối quan hệ giữa biến color trên trục x và số lượng trên trục
y.
geom_col(fill=‘green’): Thêm một layer biểu đồ
cột vào khung biểu đồ với màu nền xanh lá cây.
geom_text(aes(label = n),vjust = 2, color =
‘red’): Thêm các nhãn số lượng lên trên các cột. Các nhãn này
được lấy từ giá trị của biến n và được căn chỉnh dọc (vjust = 2) và màu
chữ là đỏ (color = ‘red’).
labs(x = ‘Màu’, y = ‘Số lượng’): Đặt nhãn cho
trục x là “Màu” và trục y là “Số
lượng”.
Đồ Thị 6: Đồ thị thể
hiện mối quan hệ giữa độ trong của viên kim cương (clarity) và số lượng
các viên kim cương(chú thích số lượng)
a %>% group_by(clarity) %>% summarise(n = n()) %>%
ggplot(aes(clarity,n)) +
geom_col(fill='yellow') +
geom_text(aes(label = n),vjust = 1, color = 'red') +
labs(x = 'Mức độ tinh khiết', y = 'Số lượng')

Giải thích câu lệnh - a %>%
group_by(clarity) %>% summarise(n = n()): Nhóm dữ liệu trong
a theo giá trị của biến clarity, sau đó tính tổng số lượng các mẫu trong
mỗi nhóm.
ggplot(aes(clarity,n)): Tạo một khung biểu đồ
mới, thiết lập mối quan hệ giữa biến clarity trên trục x và số lượng
trên trục y.
geom_col(fill=‘yellow’): Thêm một layer biểu đồ
cột vào khung biểu đồ với màu nền vàng.
geom_text(aes(label = n),vjust = 1, color =
‘red’): Thêm các nhãn số lượng lên trên các cột. Các nhãn này
được lấy từ giá trị của biến n và được căn chỉnh dọc (vjust = 1) và màu
chữ là đổ (color = ‘red’).
labs(x = ‘Mức độ tinh khiết’, y = ‘Số lượng’)
Đặt nhãn cho trục x là “Mức độ tinh khiết” và trục y là
“Số lượng”.
Đồ Thị 7: Đồ thị thể
hiện số lượng kim cương theo từng biến: color, cut, clarity và thể hiện
tỷ lệ phần trăm trên tổng số viên kim cương
a %>% group_by(cut) %>% summarise(n = n()) %>%
ggplot(aes(cut,n)) +
geom_col(fill='green') +
geom_text(aes(label = scales::percent(n/length(a$carat))),vjust = 1, color = 'red') +
labs(x = 'Loại', y = 'Số lượng')

Giải thích câu lệnh: - a %>%
group_by(cut) %>% summarise(n = n()): Nhóm dữ liệu trong a
theo giá trị của biến cut, sau đó tính tổng số lượng các mẫu trong mỗi
nhóm và lưu vào biến n.
ggplot(aes(cut,n)): Tạo một khung biểu đồ mới,
thiết lập mối quan hệ giữa biến cut trên trục x và số lượng trên trục
y.
geom_col(fill=‘green’): Thêm một layer biểu đồ
cột vào khung biểu đồ với màu nền là màu xanh lá cây.
**geom_text(aes(label = scales::percent(n/length(a\(carat))),vjust = 1, color = 'red'):** Thêm
các nhãn số liệu lên trên đỉnh của mỗi cột. Các nhãn này là tỉ lệ phần
trăm của số lượng mẫu trong mỗi nhóm so với tổng số lượng mẫu (được tính
bằng n/length(d\)carat)). Các nhãn được căn chỉnh dọc (vjust = 1)
và được định dạng màu đỏ.
labs(x = ‘Loại’, y = ‘Số lượng’): Đặt nhãn cho
trục x là “Loại” và trục y là “Số
lượng”.
Đồ Thị 8: Đồ thị thể
hiện mối quan hệ giữa màu sắc của viên kim cương (color) và số lượng các
viên kim cương đồng thời thể hiện tỷ lệ phần trăm của các viên kim cương
trên tổng số viên kim cương
a %>% group_by(color) %>% summarise(n = n()) %>%
ggplot(aes(color,n)) +
geom_col(fill='black') +
geom_text(aes(label = scales::percent(n/length(a$depth))),vjust = 1, color = 'white') +
labs(x = 'Màu', y = 'Số lượng')

Giải thích câu lệnh: - a %>%
group_by(color) %>% summarise(n = n()): Nhóm dữ liệu trong a
theo giá trị của biến color, sau đó tính tổng số lượng các mẫu trong mỗi
nhóm và lưu vào biến n.
ggplot(aes(color,n)): Tạo một khung biểu đồ mới,
thiết lập mối quan hệ giữa biến color trên trục x và số lượng trên trục
y.
geom_col(fill=‘black’): Thêm một layer biểu đồ
cột vào khung biểu đồ với màu nền là màu đen.
**geom_text(aes(label = scales::percent(n/length(a\(depth))),vjust = 1, color = 'white'):**
Thêm các nhãn số liệu lên trên đỉnh của mỗi cột. Các nhãn này là tỉ lệ
phần trăm của số lượng mẫu trong mỗi nhóm so với tổng số lượng mẫu (được
tính bằng n/length(a\)depth)). Các nhãn được căn chỉnh dọc (vjust
= 1) và được định dạng màu trắng.
labs(x = ‘Màu’, y = ‘Số lượng’): Đặt nhãn cho
trục x là “Màu” và trục y là “Số
lượng”.
Đồ Thị 9: Đồ thị thể
hiện mối quan hệ giữa độ trong của viên kim cương (clarity) và số lượng
các viên kim cương đồng thời thể hiện tỷ lệ phần trăm của các viên kim
cương trên tổng số viên kim cương
a %>% group_by(clarity) %>% summarise(n = n()) %>%
ggplot(aes(clarity,n)) +
geom_col(fill='violet') +
geom_text(aes(label = scales::percent(n/length(a$price))),vjust = 1, color = 'black') +
labs(x = 'Mức độ tinh khiết', y = 'Số lượng')

Giải thích câu lệnh: - a %>%
group_by(clarity) %>% summarise(n = n()): Nhóm dữ liệu trong
a theo giá trị của biến clarity, sau đó tính tổng số lượng các mẫu trong
mỗi nhóm và lưu vào biến n.
ggplot(aes(clarity,n)): Tạo một khung biểu đồ
mới, thiết lập mối quan hệ giữa biến clarity trên trục x và số lượng
trên trục y.
geom_col(fill=‘violet’): Thêm một layer biểu đồ
cột vào khung biểu đồ với màu nền là màu tím.
**geom_text(aes(label = scales::percent(n/length(a\(price))),vjust = 1, color = 'black'):**
Thêm các nhãn số liệu lên trên đỉnh của mỗi cột. Các nhãn này là tỉ lệ
phần trăm của số lượng mẫu trong mỗi nhóm so với tổng số lượng mẫu (được
tính bằng n/length(a\)price)). Các nhãn được căn chỉnh dọc (vjust
= 1) và được định dạng màu đen.
labs(x = ‘Mức độ tinh khiết’, y = ‘Số lượng’):
Đặt nhãn cho trục x là “Mức độ tinh khiết” và trục y là
“Số lượng”.
Đồ Thị 10: Biểu đồ
cột kép theo mặt cắt (cut) phân tách theo màu sắc (color)
a %>% group_by(cut,color) %>% summarise(n=n()) %>%
ggplot(aes(x = cut,y = n)) +
geom_col(position = 'dodge') +
facet_wrap(~color) +
geom_text(aes(label = n),vjust = 1, color = 'green') +
labs(x = 'Loại', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.

Giải thích câu lệnh : - a %>%
group_by(cut, color) %>% summarise(n = n()): Nhóm dữ liệu
trong a theo giá trị của biến cut và color, sau đó tính tổng số lượng
các mẫu trong mỗi nhóm và lưu vào biến n.
ggplot(aes(x = cut, y = n)): Tạo một khung biểu
đồ mới, thiết lập mối quan hệ giữa biến cut trên trục x và số lượng trên
trục y.
geom_col(position = ‘dodge’): Thêm một layer
biểu đồ cột vào khung biểu đồ. Với tham số position = ‘dodge’, các cột
được vẽ cách xa nhau, mỗi nhóm cột tương ứng với một giá trị của biến
color.
facet_wrap(~color): Chia biểu đồ thành nhiều
“panes” (phần nhỏ) dựa trên giá trị của biến color, tức là tạo ra nhiều
biểu đồ con, mỗi biểu đồ con cho một giá trị riêng của biến
color.
geom_text(aes(label = n), vjust = 1, color =
‘green’): Thêm các nhãn số liệu lên trên đỉnh của mỗi cột. Các
nhãn này được lấy từ biến n và được căn chỉnh dọc (vjust = 1) và định
dạng màu chữ là màu xanh lá cây.
labs(x = ‘Loại’, y = ‘Số lượng’): Đặt nhãn cho
trục x là “Loại” và trục y là “Số
lượng”.
Đồ Thị 11: Biểu đồ
cột kép theo mặt cắt (cut) phân tách theo độ trong(clarity)
a %>% group_by(cut,clarity) %>% summarise(n=n()) %>%
ggplot(aes(x = cut,y = n)) +
geom_col(position = 'dodge') +
facet_wrap(~clarity) +
geom_text(aes(label = n),vjust = 1, color = 'red') +
labs(x = 'Loại', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.

Giải thích câu lệnh : - a %>%
group_by(cut, clarity) %>% summarise(n = n()): Nhóm dữ liệu
trong a theo giá trị của biến cut và clarity, sau đó tính tổng số lượng
các mẫu trong mỗi nhóm và lưu vào biến n.
ggplot(aes(x = cut, y = n)): Tạo một khung biểu
đồ mới, thiết lập mối quan hệ giữa biến cut trên trục x và số lượng trên
trục y.
geom_col(position = ‘dodge’): Thêm một layer
biểu đồ cột vào khung biểu đồ. Với tham số position = ‘dodge’, các cột
được vẽ cách xa nhau, mỗi nhóm cột tương ứng với một giá trị của biến
clarity.
facet_wrap(~clarity): Chia biểu đồ thành nhiều
“panes” (phần nhỏ) dựa trên giá trị của biến clarity, tức là tạo ra
nhiều biểu đồ con, mỗi biểu đồ con cho một giá trị riêng của biến
clarity.
geom_text(aes(label = n), vjust = 1, color =
‘red’): Thêm các nhãn số liệu lên trên đỉnh của mỗi cột. Các
nhãn này được lấy từ biến n và được căn chỉnh dọc (vjust = 1) và định
dạng màu chữ là màu đỏ.
labs(x = ‘Loại’, y = ‘Số lượng’): Đặt nhãn cho
trục x là “Loại” và trục y là “Số
lượng”.
Đồ Thị 12: Biểu đồ
cột kép theo màu sắc (color) và phân tách theo độ trong (clarity)
a %>% group_by(color,clarity) %>% summarise(n=n()) %>%
ggplot(aes(x = color,y = n)) +
geom_col(position = 'dodge') +
facet_wrap(~clarity) +
geom_text(aes(label = n),vjust = 1, color = 'white') +
labs(x = 'Màu', y = 'Số lượng')
## `summarise()` has grouped output by 'color'. You can override using the
## `.groups` argument.

Giải thích câu lệnh : - a %>%
group_by(color, clarity) %>% summarise(n = n()): Nhóm dữ
liệu trong a theo giá trị của biến color và clarity, sau đó tính tổng số
lượng các mẫu trong mỗi nhóm và lưu vào biến n.
ggplot(aes(x = color, y = n)): Tạo một khung
biểu đồ mới, thiết lập mối quan hệ giữa biến color trên trục x và số
lượng trên trục y.
geom_col(position = ‘dodge’): Thêm một layer
biểu đồ cột vào khung biểu đồ. Với tham số position = ‘dodge’, các cột
được vẽ cách xa nhau, mỗi nhóm cột tương ứng với một giá trị của biến
clarity.
facet_wrap(~clarity): Chia biểu đồ thành nhiều
“panes” (phần nhỏ) dựa trên giá trị của biến clarity, tức là tạo ra
nhiều biểu đồ con, mỗi biểu đồ con cho một giá trị riêng của biến
clarity.
geom_text(aes(label = n), vjust = 1, color =
‘white’): Thêm các nhãn số liệu lên trên đỉnh của mỗi cột. Các
nhãn này được lấy từ biến n và được căn chỉnh dọc (vjust = 1) và định
dạng màu chữ là màu trắng.
labs(x = ‘Màu’, y = ‘Số lượng’): Đặt nhãn cho
trục x là “Màu” và trục y là “Số
lượng”.
Đồ Thị 13: Biểu đồ
cột kép theo theo độ trong (clarity) và phân tách theo màu sắc
(color)
a %>% group_by(color,clarity) %>% summarise(n=n()) %>%
ggplot(aes(x = clarity,y = n)) +
geom_col(position = 'dodge') +
facet_wrap(~color) +
geom_text(aes(label = n),vjust = 1, color = 'black') +
labs(x = 'Mức độ tinh khiết', y = 'Số lượng')
## `summarise()` has grouped output by 'color'. You can override using the
## `.groups` argument.

Giải thích câu lệnh : - a %>%
group_by(color, clarity) %>% summarise(n = n()): Nhóm dữ
liệu trong a theo giá trị của biến color và clarity, sau đó tính tổng số
lượng các mẫu trong mỗi nhóm và lưu vào biến n.
ggplot(aes(x = clarity, y = n)): Tạo một khung
biểu đồ mới, thiết lập mối quan hệ giữa biến clarity trên trục x và số
lượng trên trục y.
geom_col(position = ‘dodge’): Thêm một layer
biểu đồ cột vào khung biểu đồ. Với tham số position = ‘dodge’, các cột
được vẽ cách xa nhau, mỗi nhóm cột tương ứng với một giá trị của biến
color.
facet_wrap(~color): Chia biểu đồ thành nhiều
“panes” (phần nhỏ) dựa trên giá trị của biến color, tức là tạo ra nhiều
biểu đồ con, mỗi biểu đồ con cho một giá trị riêng của biến
color.
geom_text(aes(label = n), vjust = 1, color =
‘black’): Thêm các nhãn số liệu lên trên đỉnh của mỗi cột. Các
nhãn này được lấy từ biến n và được căn chỉnh dọc (vjust = 1) và định
dạng màu chữ là màu đen.
labs(x = ‘Mức độ tinh khiết’, y = ‘Số lượng’):
Đặt nhãn cho trục x là “Mức độ tinh khiết” và trục y là
“Số lượng”.
Đồ Thị 14: Biểu đồ
cột kép theo màu sắc (color) và phân tách theo mặt cắt (cut)
a %>% group_by(cut,color) %>% summarise(n=n()) %>%
ggplot(aes(x = color,y = n)) +
geom_col(position = 'dodge') +
facet_wrap(~cut) +
geom_text(aes(label = n),vjust = 1, color = 'violet') +
labs(x = 'Màu', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.

Giải thích câu lệnh : - a %>%
group_by(cut, color) %>% summarise(n = n()): Nhóm dữ liệu
trong a theo giá trị của biến cut và color, sau đó tính tổng số lượng
các mẫu trong mỗi nhóm và lưu vào biến n.
ggplot(aes(x = color, y = n)): Tạo một khung
biểu đồ mới, thiết lập mối quan hệ giữa biến color trên trục x và số
lượng trên trục y.
geom_col(position = ‘dodge’): Thêm một layer
biểu đồ cột vào khung biểu đồ. Với tham số position = ‘dodge’, các cột
được vẽ cách xa nhau, mỗi nhóm cột tương ứng với một giá trị của biến
cut.
facet_wrap(~cut): Chia biểu đồ thành nhiều
“panes” (phần nhỏ) dựa trên giá trị của biến color, tức là tạo ra nhiều
biểu đồ con, mỗi biểu đồ con cho một giá trị riêng của biến
cut.
geom_text(aes(label = n), vjust = 1, color =
‘violet’): Thêm các nhãn số liệu lên trên đỉnh của mỗi cột. Các
nhãn này được lấy từ biến n và được căn chỉnh dọc (vjust = 1) và định
dạng màu chữ là màu tím.
labs(x = ‘Màu’, y = ‘Số lượng’): Đặt nhãn cho
trục x là “Màu” và trục y là “Số
lượng”.
Đồ Thị 15: Biểu đồ
cột kép theo theo độ trong (clarity) và phân tách theo mặt cắt
(cut)
a %>% group_by(cut,clarity) %>% summarise(n=n()) %>%
ggplot(aes(x = clarity,y = n)) +
geom_col(position = 'dodge') +
facet_wrap(~cut) +
geom_text(aes(label = n),vjust = 1, color = 'red') +
labs(x = 'Loại', y = 'Số lượng')
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.

Giải thích câu lệnh : - a %>%
group_by(cut, clarity) %>% summarise(n = n()): Nhóm dữ liệu
trong a theo giá trị của biến cut và clarity, sau đó tính tổng số lượng
các mẫu trong mỗi nhóm và lưu vào biến n.
ggplot(aes(x = clarity, y = n)): Tạo một khung
biểu đồ mới, thiết lập mối quan hệ giữa biến clarity trên trục x và số
lượng trên trục y.
geom_col(position = ‘dodge’): Thêm một layer
biểu đồ cột vào khung biểu đồ. Với tham số position = ‘dodge’, các cột
được vẽ cách xa nhau, mỗi nhóm cột tương ứng với một giá trị của biến
cut.
facet_wrap(~cut): Chia biểu đồ thành nhiều
“panes” (phần nhỏ) dựa trên giá trị của biến cut, tức là tạo ra nhiều
biểu đồ con, mỗi biểu đồ con cho một giá trị riêng của biến
cut.
geom_text(aes(label = n), vjust = 1, color =
‘red’): Thêm các nhãn số liệu lên trên đỉnh của mỗi cột. Các
nhãn này được lấy từ biến n và được căn chỉnh dọc (vjust = 1) và định
dạng màu chữ là màu đỏ.
labs(x = ‘Loại’, y = ‘Số lượng’): Đặt nhãn cho
trục x là “Loại” và trục y là “Số
lượng”.
Đồ Thị 16: Biểu đồ
cột thể hiện trung bình trọng lượng carat theo chất lượng cắt (cut)
a %>% group_by(cut) %>% summarise(m= mean(carat)) %>%
ggplot(aes(x = cut,y = m)) +
geom_col(position = 'dodge') +
geom_text(aes(label = round(m,2)), vjust = 2, color = 'white') +
labs(x = 'Loại', y = 'Mean')

Giải thích câu lệnh : - a %>%
group_by(cut) %>% summarise(m= mean(carat)): Nhóm dữ liệu
trong a theo các giá trị của biến cut, sau đó tính trung bình (mean())
của trọng lượng kim cương (carat) trong mỗi nhóm và lưu vào biến m.
ggplot(aes(x = cut, y = m)): Tạo một khung biểu
đồ mới, thiết lập mối quan hệ giữa biến cut trên trục x và giá trị trung
bình (m) trên trục y.
geom_col(position = ‘dodge’): Thêm một layer
biểu đồ cột vào khung biểu đồ, với các cột được sắp xếp cạnh nhau theo
giá trị của biến cut. Tham số position = ‘dodge’ được sử dụng để sắp xếp
các cột cạnh nhau.
geom_text(aes(label = round(m,2)), vjust = 2, color =
‘white’): Thêm các nhãn số liệu lên trên đỉnh của mỗi cột. Giá
trị của các nhãn là giá trị trung bình của trọng lượng kim cương được
làm tròn với hai chữ số sau dấu thập phân (round(m,2)). Các nhãn này
được căn chỉnh dọc (vjust = 2) và được màu chữ là màu trắng để phản ánh
trên nền cột.
labs(x = ‘Loại’, y = ‘Mean’): Đặt nhãn cho trục
x là “Loại” và trục y là “Mean” (Trung
bình).
Đồ Thị 17: Biểu đồ
cột thể hiện trung bình trọng lượng carat theo màu sắc (color)
a %>% group_by(color) %>% summarise(m= mean(carat)) %>%
ggplot(aes(x = color,y = m)) +
geom_col(position = 'dodge') +
geom_text(aes(label = round(m,2)), vjust = 2, color = 'red') +
labs(x = 'Màu', y = 'Mean')

Giải thích câu lệnh : - a %>%
group_by(color) %>% summarise(m= mean(carat)): Nhóm dữ liệu
trong a theo các giá trị của biến color, sau đó tính trung bình (mean())
của trọng lượng kim cương (carat) trong mỗi nhóm và lưu vào biến m.
ggplot(aes(x = color, y = m)): Tạo một khung
biểu đồ mới, thiết lập mối quan hệ giữa biến color trên trục x và giá
trị trung bình (m) trên trục y.
geom_col(position = ‘dodge’): Thêm một layer
biểu đồ cột vào khung biểu đồ, với các cột được sắp xếp cạnh nhau theo
giá trị của biến color. Tham số position = ‘dodge’ được sử dụng để sắp
xếp các cột cạnh nhau.
geom_text(aes(label = round(m,2)), vjust = 2, color =
‘red’): Thêm các nhãn số liệu lên trên đỉnh của mỗi cột. Giá
trị của các nhãn là giá trị trung bình của trọng lượng kim cương được
làm tròn với hai chữ số sau dấu thập phân (round(m,2)). Các nhãn này
được căn chỉnh dọc (vjust = 2) và được màu chữ là màu đỏ để phản ánh
trên nền cột.
labs(x = ‘Màu’, y = ‘Mean’): Đặt nhãn cho trục x
là “Màu” và trục y là “Mean” (Trung
bình).
Đồ Thị 18: Biểu đồ
cột thể hiện trung bình trọng lượng carat theo độ tinh khiết
(color)
a %>% group_by(clarity) %>% summarise(m= mean(carat)) %>%
ggplot(aes(x = clarity,y = m)) +
geom_col(position = 'dodge') +
geom_text(aes(label = round(m,2)), vjust = 2, color = 'blue') +
labs(x = 'Mức Độ Tinh Khiết', y = 'Mean')

Đồ Thị 19: Biểu đồ
cột thể hiện trung bình giá thành theo chất lượng cắt (cut)
a %>% group_by(cut) %>% summarise(mp= mean(price)) %>%
ggplot(aes(x = cut,y = mp)) +
geom_col(position = 'dodge') +
geom_text(aes(label = round(mp,2)), vjust = 2, color = 'white') +
labs(x = 'Loại', y = 'Mean Price')

Giải thích câu lệnh : - a %>%
group_by(cut) %>% summarise(mp= mean(price)): Nhóm dữ liệu
trong a theo các giá trị của biến cut, sau đó tính trung bình (mean())
của giá kim cương (price) trong mỗi nhóm và lưu vào biến mp.
ggplot(aes(x = cut, y = mp)): Tạo một khung biểu
đồ mới, thiết lập mối quan hệ giữa biến cut trên trục x và giá trị trung
bình (mp) trên trục y.
geom_col(position = ‘dodge’): Thêm một layer
biểu đồ cột vào khung biểu đồ, với các cột được sắp xếp cạnh nhau theo
giá trị của biến cut. Tham số position = ‘dodge’ được sử dụng để sắp xếp
các cột cạnh nhau.
geom_text(aes(label = round(mp,2)), vjust = 2, color =
‘white’): Thêm các nhãn số liệu lên trên đỉnh của mỗi cột. Giá
trị của các nhãn là giá trị trung bình của giá kim cương được làm tròn
với hai chữ số sau dấu thập phân (round(mp,2)). Các nhãn này được căn
chỉnh dọc (vjust = 2) và được màu chữ là màu trắng để phản ánh trên nền
cột.
labs(x = ‘Loại’, y = ‘Mean Price’): Đặt nhãn cho
trục x là “Loại” và trục y là “Mean
Price” (Giá Trung bình).
Đồ Thị 20: Biểu đồ
cột thể hiện trung bình giá thành theo màu sắc (color)
a %>% group_by(color) %>% summarise(mp= mean(price)) %>%
ggplot(aes(x = color,y = mp)) +
geom_col(position = 'dodge') +
geom_text(aes(label = round(mp,2)), vjust = 2, color = 'red') +
labs(x = 'Màu', y = 'Mean Price')

Giải thích câu lệnh : - a %>%
group_by(color) %>% summarise(mp= mean(price)): Nhóm dữ liệu
trong a theo các giá trị của biến color, sau đó tính trung bình (mean())
của giá kim cương (price) trong mỗi nhóm và lưu vào biến mp.
ggplot(aes(x = color, y = mp)): Tạo một khung
biểu đồ mới, thiết lập mối quan hệ giữa biến color trên trục x và giá
trị trung bình (mp) trên trục y.
geom_col(position = ‘dodge’): Thêm một layer
biểu đồ cột vào khung biểu đồ, với các cột được sắp xếp cạnh nhau theo
giá trị của biến color. Tham số position = ‘dodge’ được sử dụng để sắp
xếp các cột cạnh nhau.
geom_text(aes(label = round(mp,2)), vjust = 2, color =
‘red’): Thêm các nhãn số liệu lên trên đỉnh của mỗi cột. Giá
trị của các nhãn là giá trị trung bình của giá kim cương được làm tròn
với hai chữ số sau dấu thập phân (round(mp,2)). Các nhãn này được căn
chỉnh dọc (vjust = 2) và được màu chữ là màu đỏ để phản ánh trên nền
cột.
labs(x = ‘Màu’, y = ‘Mean Price’): Đặt nhãn cho
trục x là “Màu” và trục y là “Mean
Price” (Giá Trung bình).
Đồ Thị 21: Biểu đồ
cột thể hiện trung bình giá thành theo độ trong (clarity)
a %>% group_by(clarity) %>% summarise(mp= mean(price)) %>%
ggplot(aes(x = clarity,y = mp)) +
geom_col(position = 'dodge') +
geom_text(aes(label = round(mp,2)), vjust = 2, color = 'blue') +
labs(x = 'Mức Độ Tinh Khiết', y = 'Mean')

Giải thích câu lệnh : - a %>%
group_by(clarity) %>% summarise(mp= mean(price)): Nhóm dữ
liệu trong a theo các giá trị của biến clarity, sau đó tính trung bình
(mean()) của giá kim cương (price) trong mỗi nhóm và lưu vào biến
mp.
ggplot(aes(x = clarrity, y = mp)): Tạo một khung
biểu đồ mới, thiết lập mối quan hệ giữa biến clarity trên trục x và giá
trị trung bình (mp) trên trục y.
geom_col(position = ‘dodge’): Thêm một layer
biểu đồ cột vào khung biểu đồ, với các cột được sắp xếp cạnh nhau theo
giá trị của biến clarity. Tham số position = ‘dodge’ được sử dụng để sắp
xếp các cột cạnh nhau.
geom_text(aes(label = round(mp,2)), vjust = 2, color =
‘blue’): Thêm các nhãn số liệu lên trên đỉnh của mỗi cột. Giá
trị của các nhãn là giá trị trung bình của giá kim cương được làm tròn
với hai chữ số sau dấu thập phân (round(mp,2)). Các nhãn này được căn
chỉnh dọc (vjust = 2) và được màu chữ là màu xanh dương để phản ánh trên
nền cột.
labs(x = ‘Mức độ tinh khiết’, y = ‘Mean Price’):
Đặt nhãn cho trục x là “Mức độ tinh khiết” và trục y là
“Mean Price” (Giá Trung bình).
Đồ Thị 22: Biểu đồ
cột thể hiện trung bình độ sâu của vết cắt (depth) theo độ
trong(clarity)
a %>% group_by(clarity) %>% summarise(md= mean(depth)) %>%
ggplot(aes(x = clarity,y = md)) +
geom_col(position = 'dodge') +
geom_text(aes(label = round(md,2)), vjust = 2, color = 'blue') +
labs(x = 'Mức Độ Tinh Khiết', y = 'Mean')

Giải thích câu lệnh: - a %>%
group_by(clarity) %>% summarise(md= mean(depth)): Nhóm dữ
liệu trong a theo các giá trị của biến clarity, sau đó tính trung bình
(mean()) của chiều cao (depth) trong mỗi nhóm và lưu vào biến md.
ggplot(aes(x = clarity, y = md)): Tạo một khung
biểu đồ mới, thiết lập mối quan hệ giữa biến clarity trên trục x và giá
trị trung bình (md) trên trục y.
geom_col(position = ‘dodge’): Thêm một layer
biểu đồ cột vào khung biểu đồ, với các cột được sắp xếp cạnh nhau theo
giá trị của biến clarity. Tham số position = ‘dodge’ được sử dụng để sắp
xếp các cột cạnh nhau.
geom_text(aes(label = round(md,2)), vjust = 2, color =
‘blue’): Thêm các nhãn số liệu lên trên đỉnh của mỗi cột. Giá
trị của các nhãn là giá trị trung bình của chiều cao được làm tròn với
hai chữ số sau dấu thập phân (round(md,2)). Các nhãn này được căn chỉnh
dọc (vjust = 2) và được màu chữ là màu xanh dương để phản ánh trên nền
cột.
labs(x = ‘Mức độ tinh khiết’, y = ‘Mean Depth’):
Đặt nhãn cho trục x là “Mức độ tinh khiết” và trục y là
“Mean Depth” (Trung bình chiều cao).
Đồ Thị 23: Đồ thị so
sánh số lượng viên kim cương giữa 2 màu theo chất lượng cắt (cut)
a1 <- a %>% group_by(cut, color) %>% summarise(n = n())
## `summarise()` has grouped output by 'cut'. You can override using the `.groups`
## argument.
a %>% ggplot(aes(x = cut, y = n)) +
geom_col(data = a1 %>% filter(color == 'I'), fill = 'black') +
geom_col(data = a1 %>% filter(color == 'J'), fill = 'red')

Giải thích câu lệnh: - a1 <- a %>%
group_by(cut, color) %>% summarise(n = n()): Tạo một bộ dữ
liệu mới a1 bằng cách nhóm dữ liệu trong a theo các giá trị của biến cut
và color, sau đó tính số lượng mẫu trong mỗi nhóm và lưu vào biến n.
a %>% ggplot(aes(x = cut, y = n)): Tạo một
khung biểu đồ mới, thiết lập mối quan hệ giữa biến cut trên trục x và số
lượng (n) trên trục y.
(data = a1 %>% filter(color == ‘I’), fill =
‘black’): Thêm một layer biểu đồ cột vào khung biểu đồ, với dữ
liệu được lấy từ a1 sau khi lọc ra những dòng có giá trị của biến color
là ‘I’. Các cột này sẽ được tô màu đen.
geom_col(data = a1 %>% filter(color == ‘J’), fill =
‘red’): Thêm một layer biểu đồ cột vào khung biểu đồ, với dữ
liệu được lấy từ a1 sau khi lọc ra những dòng có giá trị của biến color
là ‘J’. Các cột này sẽ được tô màu đỏ.
Đồ Thị 24: Đồ thị
thể hiện mối quan hệ giữa trọng lượng và số lượng của các viên kim
cương
a2 <- a %>% mutate(caratC = cut(carat,5, label = c('rất nhỏ', 'nhỏ','vừa','lớn','rất lớn')))
a2 %>% ggplot(aes(x = caratC)) +
geom_bar(fill = 'red')

Giải thích câu lệnh : - a2 <- a %>%
mutate(caratC = cut(carat,5, label = c(‘rất nhỏ’, ‘nhỏ’,‘vừa’,‘lớn’,‘rất
lớn’))): Tạo một bộ dữ liệu mới a2 từ bộ dữ liệu a. Trong bộ dữ
liệu này, một biến mới được thêm vào là caratC. Biến này được tạo ra
bằng cách chia biến carat thành 5 nhóm sử dụng hàm cut(). Nhãn của các
nhóm được đặt lần lượt là ‘rất nhỏ’, ‘nhỏ’, ‘vừa’, ‘lớn’, ‘rất lớn’.
a2 %>% ggplot(aes(x = caratC)): Tạo một khung
biểu đồ mới, thiết lập mối quan hệ giữa biến caratC trên trục
x.
geom_bar(fill = ‘red’): Thêm một layer biểu đồ
cột vào khung biểu đồ với màu nền là màu đỏ. Mỗi cột trong biểu đồ này
đại diện cho số lượng mẫu trong mỗi nhóm của biến caratC.
Đồ Thị 25:
a3 <- a %>% group_by(color, clarity) %>% summarise(n = n())
## `summarise()` has grouped output by 'color'. You can override using the
## `.groups` argument.
a %>% ggplot(aes(x = clarity, y = n)) +
geom_col(data = a3 %>% filter(clarity == 'VS1'), fill = 'blue') +
geom_col(data = a3 %>% filter(clarity == 'VS2'), fill = 'red')

Giải thích dữ liệu: - a3 <- a %>%
group_by(color, clarity) %>% summarise(n = n()): Tạo một bộ
dữ liệu mới a3 bằng cách nhóm dữ liệu trong a theo các giá trị của biến
color và clarity, sau đó tính số lượng mẫu trong mỗi nhóm và lưu vào
biến n.
a %>% ggplot(aes(x = color, y = n)): Tạo một
khung biểu đồ mới, thiết lập mối quan hệ giữa biến color trên trục x và
số lượng (n) trên trục y.
geom_col(data = a3 %>% filter(clarity == ‘I1’), fill =
‘blue’): Thêm một layer biểu đồ cột vào khung biểu đồ, với dữ
liệu được lấy từ a3 sau khi lọc ra những dòng có giá trị của biến
clarity là ‘I1’. Các cột này sẽ được tô màu xanh lam.
geom_col(data = a3 %>% filter(clarity == ‘VS2’), fill
= ‘red’): Thêm một layer biểu đồ cột vào khung biểu đồ, với dữ
liệu được lấy từ a3 sau khi lọc ra những dòng có giá trị của biến
clarity là ‘VS2’. Các cột này sẽ được tô màu đỏ.
Đồ Thị 26: Đồ thị
thể hiện Giá của các viên Kim cương
a %>% ggplot(aes(x = price)) +
geom_histogram(binwidth = 500, fill = 'green', color = 'red')

Giải thích câu lệnh: - a %>% ggplot(aes(x
= price)): Tạo một khung biểu đồ mới, thiết lập mối quan hệ
giữa biến price trên trục x.
- geom_histogram(binwidth = 500, fill = ‘green’, color =
‘red’): Thêm một layer biểu đồ histogram vào khung biểu đồ. Các
thanh histogram được tạo ra với chiều rộng của mỗi biến là 500 (đơn vị
giá). Màu nền của histogram được tô màu xanh lá cây (fill = ‘green’) và
màu viền của histogram được tô màu đỏ (color = ‘red’).
Đồ Thị 27: Đồ thị
thể hiện độ sâu của vết cắt của các viên kim cương
a %>% ggplot(aes(x = depth)) +
geom_histogram(binwidth = 1, fill = 'violet', color = 'black')

Giải thích câu lệnh: - a %>% ggplot(aes(x
= depth)): Tạo một khung biểu đồ mới, thiết lập mối quan hệ
giữa biến depth trên trục x.
- geom_histogram(binwidth = 1, fill = ‘violet’, color =
‘black’): Thêm một layer biểu đồ histogram vào khung biểu đồ.
Các thanh histogram được tạo ra với chiều rộng của mỗi biến là 1 đơn vị.
Màu nền của histogram được tô màu tím (fill = ‘violet’) và màu viền của
histogram được tô màu đen (color = ‘black’).
Đồ Thị 28: Đồ Thị
thể hiện giá của các viên kim cương có phân loại theo màu sắc
a %>% ggplot(aes(x = price, fill = color)) +
geom_histogram(binwidth = 2000)

Giải thích câu lệnh: - a %>% ggplot(aes(x
= price, fill = color)): Tạo một khung biểu đồ mới, thiết lập
mối quan hệ giữa biến price trên trục x và sử dụng biến color để tạo các
nhóm màu sắc.
- geom_histogram(binwidth = 2000): Thêm một layer
biểu đồ histogram vào khung biểu đồ. Các thanh histogram được tạo ra với
chiều rộng của mỗi biến là 2000 đơn vị giá. Các nhóm màu sắc sẽ phân
biệt các thanh histogram dựa trên giá trị của biến color.
Đồ Thị 29: so sánh
phân phối độ sâu của kim cương cho từng màu sắc khác nhau.
a %>% ggplot(aes(x = depth, fill = color)) +
geom_histogram(binwidth = 2)

Giải thích câu lệnh: - a %>% ggplot(aes(x
= depth, fill = color)): Tạo một khung biểu đồ mới, thiết lập
mối quan hệ giữa biến depth trên trục x và sử dụng biến color để tạo các
nhóm màu sắc.
- geom_histogram(binwidth = 2): Thêm một layer biểu
đồ histogram vào khung biểu đồ. Các thanh histogram được tạo ra với
chiều rộng của mỗi biến là 2 đơn vị độ sâu. Các nhóm màu sắc sẽ phân
biệt các thanh histogram dựa trên giá trị của biến color.
Đồ Thị 30: phân phối
của giá kim cương (biến “price”) dựa trên màu sắc của chúng (biến
“color”).
a %>% ggplot(aes(x = price)) +
geom_histogram(binwidth = 500, fill = 'black', color = 'white') +
facet_wrap(~color)

Giải thích câu lệnh: - a %>% ggplot(aes(x
= price)): Tạo một khung biểu đồ mới, thiết lập mối quan hệ
giữa biến price trên trục x.
geom_histogram(binwidth = 500, fill = ‘black’, color =
‘white’): Thêm một layer biểu đồ histogram vào khung biểu đồ.
Các thanh histogram được tạo ra với chiều rộng của mỗi biến là 500 đơn
vị giá. Màu nền của histogram được tô màu đen (fill = ‘black’) và màu
viền của histogram được tô màu trắng (color = ‘white’).
facet_wrap(~color): Tạo các biểu đồ con (facets)
dựa trên biến color, tức là mỗi biểu đồ con sẽ hiển thị dữ liệu cho một
mức của biến color.
