Bài này sử dụng thư viện dplyr trong R để: - Lấy dữ
liệu iris có sẵn - Nhóm dữ liệu theo loài
(Species) - Tính tổng các cột số - Xuất kết quả ra file CSV
# Chỉ cần cài 1 lần nếu chưa có
# install.packages("dplyr")
library(dplyr)
iris_data <- iris
head(iris_data)
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3.0 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5.0 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
result <- iris_data %>%
group_by(Species) %>%
summarise(across(where(is.numeric), sum))
result
## # A tibble: 3 × 5
## Species Sepal.Length Sepal.Width Petal.Length Petal.Width
## <fct> <dbl> <dbl> <dbl> <dbl>
## 1 setosa 250. 171. 73.1 12.3
## 2 versicolor 297. 138. 213 66.3
## 3 virginica 329. 149. 278. 101.
write.csv(
result,
"total_values_by_species.csv",
row.names = FALSE
)
cat("Đã lưu file total_values_by_species.csv\n")
## Đã lưu file total_values_by_species.csv
Kết quả cho thấy tổng các biến số (Sepal.Length, Sepal.Width, Petal.Length, Petal.Width) được tính riêng cho từng loài hoa trong bộ dữ liệu iris.