# Tạo mẫu
lambda <- 7
n <- 150
sample <- rpois(n, lambda)
# Tính trung bình và phương sai
mean_sample <- mean(sample)
var_sample <- var(sample)  # Lưu ý: var() trong R tính "sample variance" (ddof = 1)

# Nếu muốn tính phương sai theo ddof = 0 (dân số), bạn có thể làm:
var_sample_pop <- sum((sample - mean_sample)^2) / length(sample)

# Hiển thị kết quả
cat("Giá trị trung bình của mẫu:", mean_sample, "\n")
## Giá trị trung bình của mẫu: 6.62
cat("Phương sai mẫu (ddof=1):", var_sample, "\n")
## Phương sai mẫu (ddof=1): 5.955302
cat("Phương sai dân số (ddof=0):", var_sample_pop, "\n")
## Phương sai dân số (ddof=0): 5.9156
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# Đọc dữ liệu Iris
df = sns.load_dataset('iris')
print(df.head())
##    sepal_length  sepal_width  petal_length  petal_width species
## 0           5.1          3.5           1.4          0.2  setosa
## 1           4.9          3.0           1.4          0.2  setosa
## 2           4.7          3.2           1.3          0.2  setosa
## 3           4.6          3.1           1.5          0.2  setosa
## 4           5.0          3.6           1.4          0.2  setosa
# Tính hệ số tương quan
correlation = df['petal_length'].corr(df['petal_width'])
print("Hệ số tương quan:", round(correlation, 4))
## Hệ số tương quan: 0.9629
# Vẽ biểu đồ scatter
plt.figure(figsize=(8,6))
plt.scatter(df['petal_length'], df['petal_width'], color='blue', alpha=0.6)
plt.title('Scatter Plot: Petal Length vs Petal Width')
plt.xlabel('Petal Length')
plt.ylabel('Petal Width')
plt.grid(True)
plt.show()