Gráfico para variáveis quantitativas

Fazer uma publicação no RPUBS com o estudo da estrutura das variáveis [str(data.frame)], de um histograma e uma análise descritiva [média, mediana, etc] em uma variável quantitativa da base de dados chamada “house-selling-price.csv”.

Importação do banco de dados

library(readr)
house_selling_price <- read_csv("C:/Users/Alexandra/Desktop/estatistica/pasta 2/house-selling-price.csv")
View(house_selling_price)

O banco de dados é composto por 100 linhas e 07 colunas, possui os seguintes dados : casas que estão a venda.

Estrutura do banco de dados

str(house_selling_price)
## spec_tbl_df [100 x 7] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ case : num [1:100] 1 2 3 4 5 6 7 8 9 10 ...
##  $ Taxes: num [1:100] 3104 1173 3076 1608 1454 ...
##  $ Beds : num [1:100] 4 2 4 3 3 3 3 3 5 3 ...
##  $ Baths: num [1:100] 2 1 2 2 3 2 2 2 4 2 ...
##  $ New  : num [1:100] 0 0 0 0 0 1 0 1 0 0 ...
##  $ Price: num [1:100] 279900 146500 237700 200000 159900 ...
##  $ Size : num [1:100] 2048 912 1654 2068 1477 ...
##  - attr(*, "spec")=
##   .. cols(
##   ..   case = col_double(),
##   ..   Taxes = col_double(),
##   ..   Beds = col_double(),
##   ..   Baths = col_double(),
##   ..   New = col_double(),
##   ..   Price = col_double(),
##   ..   Size = col_double()
##   .. )
##  - attr(*, "problems")=<externalptr>

Tabela de quantidade de banheiros

tabela_banheiros=table(house_selling_price$Baths)
tabela_banheiros
## 
##  1  2  3  4 
## 17 71 11  1
tabela_prop <- prop.table(tabela_banheiros)*100
tabela_prop
## 
##  1  2  3  4 
## 17 71 11  1

Visualização de dados

Tabela de proporção

tabela_prop <- data.frame(tabela_prop)
names(tabela_prop)
## [1] "Var1" "Freq"
names(tabela_prop)[1] <- "Quantidade de banheiros"
names(tabela_prop)[2] <- "Proporção"
names(tabela_prop)
## [1] "Quantidade de banheiros" "Proporção"

Quantidade de banheiros” “Proporção”

library(flextable)
flextable(tabela_prop)

Média e mediana da variável Baths

Observou-se os valores muito próximos da média e mediana

names(house_selling_price)
## [1] "case"  "Taxes" "Beds"  "Baths" "New"   "Price" "Size"
mean(house_selling_price$Baths)
## [1] 1.96
median(house_selling_price$Baths)
## [1] 2
#### Histograma inicial

Histograma de banheiros nas casas a venda

quebras <- seq(0,4,1)
quebras
## [1] 0 1 2 3 4
hist(house_selling_price$Baths,main ="Histograma de banheiros nas casas a venda",
     xlab = "banheiros", ylab = "Frequência de casas",col="YELLOW",
     xlim = c(0,4), ylim = c(0,80),labels = TRUE, breaks = quebras)

Conclusão

Para o histograma objeto do presente estudo, podemos concluir que, não temos casa a venda sem banheiros e também casas a venda com número de banheiros acima de quatro. Logo temos um histograma assimétrico com um alto ponto em detaque (71 casas com 2 banheiros), sem outliers (observação fora da curva). Temos, 17 casas a venda com um banheiro, 71 casas a venda com 2 banheiros, 11 casas a venda com 3 banheiros e 1 única casa a venda com 4 banheiros.