Câu 1:

data(iris)
write.csv(iris, "iris.csv", row.names = FALSE)


#1.Sinh ngẫu nhiên 500 giá trị từ phân phối chuẩn N(50, 225
set.seed(123)              # để kết quả có thể lặp lại
x <- rnorm(500, mean = 50, sd = 15)
#2.sử dụng Kiểm định Shapiro–Wilk kiểm tra tính chuẩncủa tập dữ liệu
shapiro.test(x)
## 
##  Shapiro-Wilk normality test
## 
## data:  x
## W = 0.99812, p-value = 0.8639

Vẽ biểu đồ scatter

# Tải thư viện
import pandas as pd
import matplotlib.pyplot as plt

# Đọc dữ liệu Iris
df = pd.read_csv("iris.csv")

# Tinh phuong sai
variance = df.var(numeric_only=True)

print(variance)
## Sepal.Length    0.685694
## Sepal.Width     0.189979
## Petal.Length    3.116278
## Petal.Width     0.581006
## dtype: float64
# Vẽ scatter Sepal.Length vs Sepal.Width
plt.scatter(df["Sepal.Length"], df["Sepal.Width"])
plt.xlabel("Sepal.Length")
plt.ylabel("Sepal.Width")
plt.title("Scatter plot Sepal.Length vs Sepal.Width")

plt.show()