Câu 1:
data(iris)
write.csv(iris, "iris.csv", row.names = FALSE)
#1.Sinh ngẫu nhiên 500 giá trị từ phân phối chuẩn N(50, 225
set.seed(123) # để kết quả có thể lặp lại
x <- rnorm(500, mean = 50, sd = 15)
#2.sử dụng Kiểm định Shapiro–Wilk kiểm tra tính chuẩncủa tập dữ liệu
shapiro.test(x)
##
## Shapiro-Wilk normality test
##
## data: x
## W = 0.99812, p-value = 0.8639
Vẽ biểu đồ scatter
# Tải thư viện
import pandas as pd
import matplotlib.pyplot as plt
# Đọc dữ liệu Iris
df = pd.read_csv("iris.csv")
# Tinh phuong sai
variance = df.var(numeric_only=True)
print(variance)
## Sepal.Length 0.685694
## Sepal.Width 0.189979
## Petal.Length 3.116278
## Petal.Width 0.581006
## dtype: float64
# Vẽ scatter Sepal.Length vs Sepal.Width
plt.scatter(df["Sepal.Length"], df["Sepal.Width"])
plt.xlabel("Sepal.Length")
plt.ylabel("Sepal.Width")
plt.title("Scatter plot Sepal.Length vs Sepal.Width")
plt.show()
