Câu 1:
1. Sinh ngẫu nhiên 350 giá trị từ phân phối chuẩn N(30, 100)
2. Dùng kiểm định Shapiro–Wilk để kiểm tra tính chuẩn
câu 2:
1. Đọc tập dữ liệu Iris bằng Pandas
2. Tính giá trị tối thiểu và tối đa của từng đặc trưng
3. Vẽ biểu đồ histogram của chiều dài hoa (Sepal.Length)
set.seed(42)
# N(30, 100) => mean = 30, sd = 10
data <- rnorm(350, mean = 30, sd = 10)
shapiro.test(data)
##
## Shapiro-Wilk normality test
##
## data: data
## W = 0.99773, p-value = 0.9187
iris_data <- datasets::iris
head(iris_data)
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3.0 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5.0 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
min_values <- apply(iris_data[, 1:4], 2, min)
max_values <- apply(iris_data[, 1:4], 2, max)
min_values
## Sepal.Length Sepal.Width Petal.Length Petal.Width
## 4.3 2.0 1.0 0.1
max_values
## Sepal.Length Sepal.Width Petal.Length Petal.Width
## 7.9 4.4 6.9 2.5
hist(iris_data$Sepal.Length,
breaks = 15,
main = "Histogram of Sepal Length",
xlab = "Sepal Length")
