set.seed(123)  
x <- runif(500, min = 1, max = 7)
# Kỳ vọng (trung bình mẫu)
mean_x <- mean(x)

# Phương sai mẫu
var_x <- var(x)

mean_x
## [1] 3.971702
var_x
## [1] 2.91225
hist(
  x,
  breaks = 20,
  col = "lightblue",
  border = "black",
  main = "Histogram của 500 giá trị phân phối đều U(1,7)",
  xlab = "Giá trị",
  ylab = "Tần suất"
)

data(iris)
head(iris)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa
#Tính hệ số tương quan giữa Sepal.Length và Sepal.Width
cor_value <- cor(iris$Sepal.Length, iris$Sepal.Width)
cor_value
## [1] -0.1175698
#Vẽ biểu đồ Scatter giữa hai đặc trưng
plot(
  iris$Sepal.Length,
  iris$Sepal.Width,
  col = c("red", "blue", "darkgreen")[iris$Species],
  pch = 19,
  cex = 1.2,
  main = "Sepal Length vs Sepal Width (theo loài)",
  xlab = "Sepal Length",
  ylab = "Sepal Width"
)

legend(
  "topright",
  legend = levels(iris$Species),
  col = c("red", "blue", "darkgreen"),
  pch = 19,
  bty = "n"
)

grid()