Câu 1:

1. Sinh ngẫu nhiên 350 giá trị từ phân phối chuẩn N(30, 100)

2. Dùng kiểm định Shapiro–Wilk để kiểm tra tính chuẩn

câu 2:

1. Đọc tập dữ liệu Iris bằng Pandas

2. Tính giá trị tối thiểu và tối đa của từng đặc trưng

3. Vẽ biểu đồ histogram của chiều dài hoa (Sepal.Length)

set.seed(42)

# N(30, 100) => mean = 30, sd = 10
data <- rnorm(350, mean = 30, sd = 10)

shapiro.test(data)
## 
##  Shapiro-Wilk normality test
## 
## data:  data
## W = 0.99773, p-value = 0.9187
iris_data <- datasets::iris
head(iris_data)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa
min_values <- apply(iris_data[, 1:4], 2, min)
max_values <- apply(iris_data[, 1:4], 2, max)

min_values
## Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
##          4.3          2.0          1.0          0.1
max_values
## Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
##          7.9          4.4          6.9          2.5
hist(iris_data$Sepal.Length,
     breaks = 15,
     main = "Histogram of Sepal Length",
     xlab = "Sepal Length")