Bài KT2

Câu 1:

1. Sinh ngẫu nhiên 350 giá trị từ phân phối chuẩn N(30, 100)

2. Dùng kiểm định Shapiro–Wilk để kiểm tra tính chuẩn

câu 2:

1. Đọc tập dữ liệu Iris bằng Pandas

2. Tính giá trị tối thiểu và tối đa của từng đặc trưng

3. Vẽ biểu đồ histogram của chiều dài hoa (Sepal.Length)

set.seed(42)

# N(30, 100) => mean = 30, sd = 10
data <- rnorm(350, mean = 30, sd = 10)

shapiro.test(data)

## 
##  Shapiro-Wilk normality test
## 
## data:  data
## W = 0.99773, p-value = 0.9187

iris_data <- datasets::iris
head(iris_data)

##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa

min_values <- apply(iris_data[, 1:4], 2, min)
max_values <- apply(iris_data[, 1:4], 2, max)

min_values

## Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
##          4.3          2.0          1.0          0.1

max_values

## Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
##          7.9          4.4          6.9          2.5

hist(iris_data$Sepal.Length,
     breaks = 15,
     main = "Histogram of Sepal Length",
     xlab = "Sepal Length")

Bài KT2

Dương

2026-02-05

Câu 1:

1. Sinh ngẫu nhiên 350 giá trị từ phân phối chuẩn N(30, 100)

2. Dùng kiểm định Shapiro–Wilk để kiểm tra tính chuẩn

câu 2:

1. Đọc tập dữ liệu Iris bằng Pandas

2. Tính giá trị tối thiểu và tối đa của từng đặc trưng

3. Vẽ biểu đồ histogram của chiều dài hoa (Sepal.Length)