- Câu 1 (5 điểm):

- Dùng R để:

- Tính độ lệch chuẩn của Sepal.Length theo từng nhóm Species.

- Vẽ biểu đồ violin của Petal.Width theo từng nhóm Species bằng thư viện ggplot2.

aggregate(Sepal.Length ~ Species, data = iris, sd)

library(ggplot2) ggplot(iris, aes(x = Species, y = Petal.Width)) + geom_violin()

Câu 2

Dùng Pandas để:

- Đọc file iris.csv

- Lọc các dòng Sepal.Width < 3.0

- Xuất kết quả ra file filtered_width.csv

library(reticulate)

use_condaenv(“r-reticulate”, required = TRUE)

pd <- import(“pandas”)

Tạo file iris.csv

write.csv(iris, “iris.csv”, row.names = FALSE)

Đọc dữ liệu bằng pandas

df <- pd$read_csv(“iris.csv”)

Lọc dữ liệu

filtered_df <- df\(loc[df\)Sepal.Width < 3.0, ]

chuyển sang data.frame R

filtered_r <- py_to_r(filtered_df)

Xuất file CSV

write.csv(filtered_r, “filtered_width.csv”, row.names = FALSE)

Kiểm tra

file.exists(“filtered_width.csv”)