#cau 1
#Sinh ngẫu nhiên 500 giá trị từ phân phối đều liên tục trên khoảng [1,7]
set.seed(123)
mau <- runif(500, min = 1, max = 7)
#Tính kỳ vọng (mean) và phương sai (variance) của mẫu
ky_vong <- mean(mau)
phuong_sai <- var(mau)
cat("Kỳ vọng của mẫu:", ky_vong, "\n")
## Kỳ vọng của mẫu: 3.971702
cat("Phương sai của mẫu:", phuong_sai, "\n")
## Phương sai của mẫu: 2.91225
#Vẽ biểu đồ histogram
hist(mau, main = "Biểu đồ Histogram của mẫu",
xlab = "Giá trị", ylab = "Tần suất",
col = "skyblue", border = "black")

library(reticulate)
py_config()
## python: C:/Users/admin/Documents/.virtualenvs/r-reticulate/Scripts/python.exe
## libpython: C:/Users/admin/anaconda3/python312.dll
## pythonhome: C:/Users/admin/Documents/.virtualenvs/r-reticulate
## version: 3.12.4 | packaged by Anaconda, Inc. | (main, Jun 18 2024, 15:03:56) [MSC v.1929 64 bit (AMD64)]
## Architecture: 64bit
## numpy: C:/Users/admin/Documents/.virtualenvs/r-reticulate/Lib/site-packages/numpy
## numpy_version: 2.2.3
##
## NOTE: Python version was forced by VIRTUAL_ENV
py_install("pandas")
## Using virtual environment "C:/Users/admin/Documents/.virtualenvs/r-reticulate" ...
## + "C:/Users/admin/Documents/.virtualenvs/r-reticulate/Scripts/python.exe" -m pip install --upgrade --no-user pandas
import pandas as pd
print(pd.__version__)
## 2.2.3
library(reticulate)
py_config()
## python: C:/Users/admin/Documents/.virtualenvs/r-reticulate/Scripts/python.exe
## libpython: C:/Users/admin/anaconda3/python312.dll
## pythonhome: C:/Users/admin/Documents/.virtualenvs/r-reticulate
## version: 3.12.4 | packaged by Anaconda, Inc. | (main, Jun 18 2024, 15:03:56) [MSC v.1929 64 bit (AMD64)]
## Architecture: 64bit
## numpy: C:/Users/admin/Documents/.virtualenvs/r-reticulate/Lib/site-packages/numpy
## numpy_version: 2.2.3
##
## NOTE: Python version was forced by VIRTUAL_ENV
library(reticulate)
py_install(c("matplotlib", "seaborn", "pandas"))
## Using virtual environment "C:/Users/admin/Documents/.virtualenvs/r-reticulate" ...
## + "C:/Users/admin/Documents/.virtualenvs/r-reticulate/Scripts/python.exe" -m pip install --upgrade --no-user matplotlib seaborn pandas
py_available(initialize = TRUE)
## [1] TRUE
#cau2
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# Đọc tập dữ liệu Iris
url = "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/iris.csv"
data = pd.read_csv(url)
# Tính hệ số tương quan giữa Sepal.Length và Sepal.Width
correlation = data['sepal_length'].corr(data['sepal_width'])
print(f"Hệ số tương quan giữa Sepal.Length và Sepal.Width: {correlation}")
## Hệ số tương quan giữa Sepal.Length và Sepal.Width: -0.11756978413300198
# Vẽ biểu đồ scatter
plt.figure(figsize=(8, 6))
sns.scatterplot(x=data['sepal_length'], y=data['sepal_width'])
plt.xlabel("Chiều dài đài hoa (Sepal Length)")
plt.ylabel("Chiều rộng đài hoa (Sepal Width)")
plt.title("Biểu đồ Scatter giữa Sepal Length và Sepal Width")
plt.show()
