library(readxl)
For_EDA_dataset_1 <- read_excel("D:/For_EDA_dataset 1.xlsx")
## Warning: Expecting numeric in G3081 / R3081C7: got a date
## New names:
## • `` -> `...1`
View(For_EDA_dataset_1)
summary(For_EDA_dataset_1$purpose)
## Length Class Mode
## 153430 character character
table(For_EDA_dataset_1$purpose)
##
## For Rent For Sale
## 43183 110247
table(For_EDA_dataset_1$purpose)/sum(table(For_EDA_dataset_1$purpose))
##
## For Rent For Sale
## 0.2814508 0.7185492
Dựa vào kết quả ta thấy 153430 căn nhà được tiến hành khảo sát và có 43183 Rent chiếm 2.81% trên tổng số căn nhà khảo sát
library('ggplot2')
## Warning: package 'ggplot2' was built under R version 4.3.1
For_EDA_dataset_1 |>ggplot(aes(property_type)) + geom_bar(olor = 'yellow', fill = 'yellow') + theme_classic() + labs(x = 'purpose', y = 'property_type')
## Warning in geom_bar(olor = "yellow", fill = "yellow"): Ignoring unknown
## parameters: `olor`