1. Tóm tắt bộ dữ liệu

2. Biểu đồ

2.1 Biểu đồ thể hiện mối quan hệ giữa mức tiêu thụ nhiên liệu và công suất của các mẫu xe

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.3
ggplot(mtcars, aes(x = mpg, y = hp)) +
  labs(title = "Biểu đồ thể hiện mối quan hệ giữa mức tiêu thụ nhiên liệu và công suất của các mẫu xe ", x= "Mức tiêu thụ nhiên liệu", y = "Công suất") +
  geom_point()

2.2 Biểu đồ so sánh mức tiêu thụ nhiên liệu giữa các nhóm xe có số lượng xi-lanh khác nhau

ggplot(mtcars, aes(x = factor(cyl), y = mpg)) +
  labs(title = "Biểu đồ so sánh mức tiêu thụ nhiên liệu giữa các nhóm xe có số lượng xi-lanh khác nhau ", x= "Số lượng xi-lanh", y = "mức tiêu thụ nhiên liệu") +
  geom_boxplot()

2.3 Biểu đồ cho thấy mối tương quan giữa mức tiêu hao nhiên liệu và mã lực

ggplot(mtcars, aes(mpg, hp, color = mpg)) +
  geom_point() +
  labs(x = "Mức tiêu hao nhiên liệu (mpg)", y = "Mã lực (hp)")

- Có mối tương quan âm giữa mpg và mã lực.

  • Khi mã lực tăng, mpg có xu hướng giảm.

  • Mối tương quan này tương đối mạnh (R^2 = 0.69).

2.4 Biểu đồ thể hiện trọng lượng của từng dòng xe

ggplot(mtcars, aes(x = rownames(mtcars), y = wt)) +
  geom_boxplot() +
  labs(title = "Biểu đồ thể hiện trọng lượng của từng dòng xe") +
  xlab("Dòng xe") +
  ylab("Trọng lượng") +
  coord_flip()

- Trọng lượng của các dòng xe có sự biến động lớn, được phản ánh qua phạm vi của các hộp và sự xuất hiện của nhiều điểm ngoại lai.

  • Có một số dòng xe có trọng lượng cao hơn so với các dòng xe khác, lớn nhất là Lincoln Continental

2.5 Biểu đồ thể hiện trọng lượng của từng dòng xe

ggplot(mtcars, aes(x = rownames(mtcars), y = wt)) +
  geom_col(stat = "identity") +
  xlab("Dòng xe") +
  ylab("Tấn") +
  labs(title = "Biểu đồ thể hiện trọng lượng của từng dòng xe") +
  coord_flip()
## Warning in geom_col(stat = "identity"): Ignoring unknown parameters: `stat`

2.6 Biểu đồ so sánh mpg giữa các nhóm xe được phân loại theo am và gear.

ggplot(mtcars, aes(mpg, factor(gear))) +
  geom_boxplot() +
  facet_wrap(~am) +
  labs(x = "Mức tiêu thụ nhiên liệu (mpg)", y = "Số lượng bánh răng")

2.7 Biểu đồ thể hiện sự phân phối mpg cho các xe có số lượng hộp số khác nhau.

ggplot(mtcars, aes(am, mpg)) +
  geom_violin() +
  labs(x = "Số lượng hộp số (am)", y = "Mức tiêu hao nhiên liệu (mpg)")

2.8 Biểu đồ mật độ cho thấy hình dạng phân phối của mpg

ggplot(mtcars, aes(mpg)) +
  geom_density() +
  labs(x = "Mức tiêu hao nhiên liệu (mpg)")

2.9 Biểu đồ thể hiện mức tiêu hao nhiên liệu (mpg) trung bình của các xe được phân loại theo kiểu truyền động

ggplot(mtcars, aes(mpg, fill = am)) +
  geom_bar() +
  labs(title = "Phân bố mpg theo kiểu truyền động",
       x = "Mức tiêu hao nhiên liệu (mpg)",
       y = "Số lượng xe")
## Warning: The following aesthetics were dropped during statistical transformation: fill.
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
##   the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
##   variable into a factor?

  • Xe số sàn có mức tiêu hao nhiên liệu trung bình cao hơn xe số tự động (khoảng 23 mpg so với 20 mpg).

  • Có sự khác biệt đáng kể về mức tiêu hao nhiên liệu giữa hai kiểu truyền động.

2.10 Biểu đồ cột với phân loại theo số lượng bộ phận carburator và nhóm theo số xi-lanh

ggplot(mtcars, aes(x = factor(cyl), fill = factor(carb))) +
  geom_bar() +
  labs(x = "Số xi-lanh", y = "Tần suất") +
  ggtitle("Biểu đồ cột số lượng xi-lanh và bộ phận carburator") +
  theme_minimal()

2.11

library(ggplot2)
ggplot(mtcars, aes(x = factor(cyl), y = mpg, fill = factor(am))) +
  geom_boxplot() +
  labs(x = "Cylinders", y = "Miles per gallon", fill = "Transmission") +
  ggtitle("Boxplot")

2.12

ggplot(mtcars, aes(x = mpg, y = disp, color = cyl)) +
  geom_point() +
  facet_wrap(~am) +
  labs(x = "Mức tiêu hao nhiên liệu", y = "Dung tích động cơ", color = "Cylinders") +
  ggtitle("Multivariate Distribution Plot")