library(readr)
house_selling_price <- read_csv("C:/Users/Rodolfo/Desktop/Base_de_dados-master/house-selling-price.csv")
head(house_selling_price)
# A tibble: 6 x 7
case Taxes Beds Baths New Price Size
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1 3104 4 2 0 279900 2048
2 2 1173 2 1 0 146500 912
3 3 3076 4 2 0 237700 1654
4 4 1608 3 2 0 200000 2068
5 5 1454 3 3 0 159900 1477
6 6 2997 3 2 1 499900 3153
str(house_selling_price)
spec_tbl_df [100 x 7] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
$ case : num [1:100] 1 2 3 4 5 6 7 8 9 10 ...
$ Taxes: num [1:100] 3104 1173 3076 1608 1454 ...
$ Beds : num [1:100] 4 2 4 3 3 3 3 3 5 3 ...
$ Baths: num [1:100] 2 1 2 2 3 2 2 2 4 2 ...
$ New : num [1:100] 0 0 0 0 0 1 0 1 0 0 ...
$ Price: num [1:100] 279900 146500 237700 200000 159900 ...
$ Size : num [1:100] 2048 912 1654 2068 1477 ...
- attr(*, "spec")=
.. cols(
.. case = col_double(),
.. Taxes = col_double(),
.. Beds = col_double(),
.. Baths = col_double(),
.. New = col_double(),
.. Price = col_double(),
.. Size = col_double()
.. )
- attr(*, "problems")=<externalptr>
tabela_banheiros=table(house_selling_price$Baths)
tabela_banheiros
1 2 3 4
17 71 11 1
tabela_prop <- prop.table(tabela_banheiros)*100
tabela_prop
1 2 3 4
17 71 11 1
tabela_prop <- data.frame(tabela_prop)
names(tabela_prop)
[1] "Var1" "Freq"
names(tabela_prop)[1] <- "Quantidade de banheiros"
names(tabela_prop)[2] <- "Proporção"
names(tabela_prop)
[1] "Quantidade de banheiros" "Proporção"
library(flextable)
flextable(tabela_prop)
Quantidade de banheiros | Proporção |
1 | 17 |
2 | 71 |
3 | 11 |
4 | 1 |
Observou-se os valores muito próximos da média e mediana
names(house_selling_price)
[1] "case" "Taxes" "Beds" "Baths" "New" "Price" "Size"
mean(house_selling_price$Baths)
[1] 1.96
median(house_selling_price$Baths)
[1] 2
hist(house_selling_price$Baths)
quebras <- seq(0,4,1)
quebras
[1] 0 1 2 3 4
hist(house_selling_price$Baths,main ="Histograma de banheiros nas casas a venda",
xlab = "banheiros", ylab = "Frequência de casas",col="green",
xlim = c(0,4), ylim = c(0,80),labels = TRUE, breaks = quebras)
Para o histograma podemos observar que, não temos casa a venda sem banheiros e também casas a venda, com número de banheiros acima de quatro.Trata-se de um histograma assimétrico com um alto ponto em detaque (71 casas com 2 banheiros), sem outliers. Para os dados obtidos temos, 17 casas a venda com um banheiro, 71 casas a venda com 2 banheiros, 11 casas a venda com 3 banheiros e 1 única casa a venda com 4 banheiros.