Grafico para variaveis quantitativas

Trabalho com a base de dados “House Selling Price”

Importação dos dados

library(readr)
house_selling_price <- read_csv("C:/Users/Rodolfo/Desktop/Base_de_dados-master/house-selling-price.csv")
head(house_selling_price)
# A tibble: 6 x 7
   case Taxes  Beds Baths   New  Price  Size
  <dbl> <dbl> <dbl> <dbl> <dbl>  <dbl> <dbl>
1     1  3104     4     2     0 279900  2048
2     2  1173     2     1     0 146500   912
3     3  3076     4     2     0 237700  1654
4     4  1608     3     2     0 200000  2068
5     5  1454     3     3     0 159900  1477
6     6  2997     3     2     1 499900  3153

Estrutura de dados

str(house_selling_price)
spec_tbl_df [100 x 7] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
 $ case : num [1:100] 1 2 3 4 5 6 7 8 9 10 ...
 $ Taxes: num [1:100] 3104 1173 3076 1608 1454 ...
 $ Beds : num [1:100] 4 2 4 3 3 3 3 3 5 3 ...
 $ Baths: num [1:100] 2 1 2 2 3 2 2 2 4 2 ...
 $ New  : num [1:100] 0 0 0 0 0 1 0 1 0 0 ...
 $ Price: num [1:100] 279900 146500 237700 200000 159900 ...
 $ Size : num [1:100] 2048 912 1654 2068 1477 ...
 - attr(*, "spec")=
  .. cols(
  ..   case = col_double(),
  ..   Taxes = col_double(),
  ..   Beds = col_double(),
  ..   Baths = col_double(),
  ..   New = col_double(),
  ..   Price = col_double(),
  ..   Size = col_double()
  .. )
 - attr(*, "problems")=<externalptr> 

Tabela de quantidade de banheiros

tabela_banheiros=table(house_selling_price$Baths)
tabela_banheiros

 1  2  3  4 
17 71 11  1 
tabela_prop <- prop.table(tabela_banheiros)*100
tabela_prop

 1  2  3  4 
17 71 11  1 

Visualização de dados

Tabela de proporção

tabela_prop <- data.frame(tabela_prop)
names(tabela_prop)
[1] "Var1" "Freq"
names(tabela_prop)[1] <- "Quantidade de banheiros"
names(tabela_prop)[2] <- "Proporção"
names(tabela_prop)
[1] "Quantidade de banheiros" "Proporção"              
library(flextable)
flextable(tabela_prop)

Média e mediana da variável Baths

Observou-se os valores muito próximos da média e mediana

names(house_selling_price)
[1] "case"  "Taxes" "Beds"  "Baths" "New"   "Price" "Size" 
mean(house_selling_price$Baths)
[1] 1.96
median(house_selling_price$Baths)
[1] 2

Histograma inicial

hist(house_selling_price$Baths)

Histograma de banheiros nas casas a venda

quebras <- seq(0,4,1)
quebras
[1] 0 1 2 3 4
hist(house_selling_price$Baths,main ="Histograma de banheiros nas casas a venda",
     xlab = "banheiros", ylab = "Frequência de casas",col="green",
     xlim = c(0,4), ylim = c(0,80),labels = TRUE, breaks = quebras)

Conclusão

Para o histograma podemos observar que, não temos casa a venda sem banheiros e também casas a venda, com número de banheiros acima de quatro.Trata-se de um histograma assimétrico com um alto ponto em detaque (71 casas com 2 banheiros), sem outliers. Para os dados obtidos temos, 17 casas a venda com um banheiro, 71 casas a venda com 2 banheiros, 11 casas a venda com 3 banheiros e 1 única casa a venda com 4 banheiros.