Giới thiệu

Bài này sử dụng thư viện dplyr trong R để: - Lấy dữ liệu iris có sẵn - Nhóm dữ liệu theo loài (Species) - Tính tổng các cột số - Xuất kết quả ra file CSV


Cài đặt và nạp thư viện

# Chỉ cần cài 1 lần nếu chưa có
# install.packages("dplyr")

library(dplyr)

Lấy dữ liệu iris

iris_data <- iris
head(iris_data)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa

Tính tổng các biến số theo Species

result <- iris_data %>%
  group_by(Species) %>%
  summarise(across(where(is.numeric), sum))

result
## # A tibble: 3 × 5
##   Species    Sepal.Length Sepal.Width Petal.Length Petal.Width
##   <fct>             <dbl>       <dbl>        <dbl>       <dbl>
## 1 setosa             250.        171.         73.1        12.3
## 2 versicolor         297.        138.        213          66.3
## 3 virginica          329.        149.        278.        101.

Ghi kết quả ra file CSV

write.csv(
  result,
  "total_values_by_species.csv",
  row.names = FALSE
)

cat("Đã lưu file total_values_by_species.csv\n")
## Đã lưu file total_values_by_species.csv

Kết luận

Kết quả cho thấy tổng các biến số (Sepal.Length, Sepal.Width, Petal.Length, Petal.Width) được tính riêng cho từng loài hoa trong bộ dữ liệu iris.