# Tạo mẫu
lambda <- 7
n <- 150
sample <- rpois(n, lambda)
# Tính trung bình và phương sai
mean_sample <- mean(sample)
var_sample <- var(sample) # Lưu ý: var() trong R tính "sample variance" (ddof = 1)
# Nếu muốn tính phương sai theo ddof = 0 (dân số), bạn có thể làm:
var_sample_pop <- sum((sample - mean_sample)^2) / length(sample)
# Hiển thị kết quả
cat("Giá trị trung bình của mẫu:", mean_sample, "\n")
## Giá trị trung bình của mẫu: 6.62
cat("Phương sai mẫu (ddof=1):", var_sample, "\n")
## Phương sai mẫu (ddof=1): 5.955302
cat("Phương sai dân số (ddof=0):", var_sample_pop, "\n")
## Phương sai dân số (ddof=0): 5.9156
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# Đọc dữ liệu Iris
df = sns.load_dataset('iris')
print(df.head())
## sepal_length sepal_width petal_length petal_width species
## 0 5.1 3.5 1.4 0.2 setosa
## 1 4.9 3.0 1.4 0.2 setosa
## 2 4.7 3.2 1.3 0.2 setosa
## 3 4.6 3.1 1.5 0.2 setosa
## 4 5.0 3.6 1.4 0.2 setosa
# Tính hệ số tương quan
correlation = df['petal_length'].corr(df['petal_width'])
print("Hệ số tương quan:", round(correlation, 4))
## Hệ số tương quan: 0.9629
# Vẽ biểu đồ scatter
plt.figure(figsize=(8,6))
plt.scatter(df['petal_length'], df['petal_width'], color='blue', alpha=0.6)
plt.title('Scatter Plot: Petal Length vs Petal Width')
plt.xlabel('Petal Length')
plt.ylabel('Petal Width')
plt.grid(True)
plt.show()
