Là một bộ dữ liệu mẫu được tích hợp sẵn trong R và chứa thông tin về 32 mẫu xe hơi từ năm 1973. Bộ dữ liệu này chứa 11 biến (cột) và 32 quan sát (dòng)
Dưới đây là các biến có trong bộ dữ liệu “mtcars” và mô tả của chúng:
mpg: Mức tiêu thụ nhiên liệu trong đơn vị miles per gallon.
cyl: Số xi-lanh của động cơ.
sp: Dung tích động cơ (in^3).
hp: Công suất động cơ (horsepower).
drat: Tỷ số truyền số hành trình sau.
wt: Trọng lượng xe (1 lbs = 0.453592 kg).
qsec: Thời gian chạy đo đạc từ đứng im đến vượt qua đoạn 1/4 dặm (giây).
vs: Loại động cơ (0 = V-motor, 1 = straight engine).
am: Loại hộp số (0 = tự động, 1 = thủ công).
gear: Số lượng hạt truyền số.
carb: Số lượng bộ phận carburator.
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.3
ggplot(mtcars, aes(x = mpg, y = hp)) +
labs(title = "Biểu đồ thể hiện mối quan hệ giữa mức tiêu thụ nhiên liệu và công suất của các mẫu xe ", x= "Mức tiêu thụ nhiên liệu", y = "Công suất") +
geom_point()
ggplot(mtcars, aes(x = factor(cyl), y = mpg)) +
labs(title = "Biểu đồ so sánh mức tiêu thụ nhiên liệu giữa các nhóm xe có số lượng xi-lanh khác nhau ", x= "Số lượng xi-lanh", y = "mức tiêu thụ nhiên liệu") +
geom_boxplot()
ggplot(mtcars, aes(mpg, hp, color = mpg)) +
geom_point() +
labs(x = "Mức tiêu hao nhiên liệu (mpg)", y = "Mã lực (hp)")
- Có mối tương quan âm giữa mpg và mã lực.
Khi mã lực tăng, mpg có xu hướng giảm.
Mối tương quan này tương đối mạnh (R^2 = 0.69).
ggplot(mtcars, aes(x = rownames(mtcars), y = wt)) +
geom_boxplot() +
labs(title = "Biểu đồ thể hiện trọng lượng của từng dòng xe") +
xlab("Dòng xe") +
ylab("Trọng lượng") +
coord_flip()
- Trọng lượng của các dòng xe có sự biến động lớn, được phản ánh qua
phạm vi của các hộp và sự xuất hiện của nhiều điểm ngoại lai.
ggplot(mtcars, aes(x = rownames(mtcars), y = wt)) +
geom_col(stat = "identity") +
xlab("Dòng xe") +
ylab("Tấn") +
labs(title = "Biểu đồ thể hiện trọng lượng của từng dòng xe") +
coord_flip()
## Warning in geom_col(stat = "identity"): Ignoring unknown parameters: `stat`
ggplot(mtcars, aes(mpg, factor(gear))) +
geom_boxplot() +
facet_wrap(~am) +
labs(x = "Mức tiêu thụ nhiên liệu (mpg)", y = "Số lượng bánh răng")
ggplot(mtcars, aes(am, mpg)) +
geom_violin() +
labs(x = "Số lượng hộp số (am)", y = "Mức tiêu hao nhiên liệu (mpg)")
ggplot(mtcars, aes(mpg)) +
geom_density() +
labs(x = "Mức tiêu hao nhiên liệu (mpg)")
ggplot(mtcars, aes(mpg, fill = am)) +
geom_bar() +
labs(title = "Phân bố mpg theo kiểu truyền động",
x = "Mức tiêu hao nhiên liệu (mpg)",
y = "Số lượng xe")
## Warning: The following aesthetics were dropped during statistical transformation: fill.
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
Xe số sàn có mức tiêu hao nhiên liệu trung bình cao hơn xe số tự động (khoảng 23 mpg so với 20 mpg).
Có sự khác biệt đáng kể về mức tiêu hao nhiên liệu giữa hai kiểu truyền động.
ggplot(mtcars, aes(x = factor(cyl), fill = factor(carb))) +
geom_bar() +
labs(x = "Số xi-lanh", y = "Tần suất") +
ggtitle("Biểu đồ cột số lượng xi-lanh và bộ phận carburator") +
theme_minimal()
library(ggplot2)
ggplot(mtcars, aes(x = factor(cyl), y = mpg, fill = factor(am))) +
geom_boxplot() +
labs(x = "Cylinders", y = "Miles per gallon", fill = "Transmission") +
ggtitle("Boxplot")
ggplot(mtcars, aes(x = mpg, y = disp, color = cyl)) +
geom_point() +
facet_wrap(~am) +
labs(x = "Mức tiêu hao nhiên liệu", y = "Dung tích động cơ", color = "Cylinders") +
ggtitle("Multivariate Distribution Plot")