0.1 Nhập dữ liệu

library(readxl)
For_EDA_dataset_1 <- read_excel("D:/For_EDA_dataset 1.xlsx")
## Warning: Expecting numeric in G3081 / R3081C7: got a date
## New names:
## • `` -> `...1`
View(For_EDA_dataset_1)

0.2 Thống kê mô tả

1 Thống kê mô tả biến purpose

summary(For_EDA_dataset_1$purpose)
##    Length     Class      Mode 
##    153430 character character
table(For_EDA_dataset_1$purpose)
## 
## For Rent For Sale 
##    43183   110247
table(For_EDA_dataset_1$purpose)/sum(table(For_EDA_dataset_1$purpose))
## 
##  For Rent  For Sale 
## 0.2814508 0.7185492

Dựa vào kết quả ta thấy 153430 căn nhà được tiến hành khảo sát và có 43183 Rent chiếm 2.81% trên tổng số căn nhà khảo sát

library('ggplot2')
## Warning: package 'ggplot2' was built under R version 4.3.1
For_EDA_dataset_1 |>ggplot(aes(property_type)) + geom_bar(olor = 'yellow', fill = 'yellow') + theme_classic() + labs(x = 'purpose', y = 'property_type')
## Warning in geom_bar(olor = "yellow", fill = "yellow"): Ignoring unknown
## parameters: `olor`