Fazer uma publicação no RPUBS com o estudo da estrutura das variáveis [str(data.frame)], de um histograma e uma análise descritiva [média, mediana, etc] em uma variável quantitativa da base de dados chamada “house-selling-price.csv”.
library(readr)
house_selling_price <- read_csv("C:/Users/Alexandra/Desktop/estatistica/pasta 2/house-selling-price.csv")
View(house_selling_price)
O banco de dados é composto por 100 linhas e 07 colunas, possui os seguintes dados : casas que estão a venda.
str(house_selling_price)
## spec_tbl_df [100 x 7] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ case : num [1:100] 1 2 3 4 5 6 7 8 9 10 ...
## $ Taxes: num [1:100] 3104 1173 3076 1608 1454 ...
## $ Beds : num [1:100] 4 2 4 3 3 3 3 3 5 3 ...
## $ Baths: num [1:100] 2 1 2 2 3 2 2 2 4 2 ...
## $ New : num [1:100] 0 0 0 0 0 1 0 1 0 0 ...
## $ Price: num [1:100] 279900 146500 237700 200000 159900 ...
## $ Size : num [1:100] 2048 912 1654 2068 1477 ...
## - attr(*, "spec")=
## .. cols(
## .. case = col_double(),
## .. Taxes = col_double(),
## .. Beds = col_double(),
## .. Baths = col_double(),
## .. New = col_double(),
## .. Price = col_double(),
## .. Size = col_double()
## .. )
## - attr(*, "problems")=<externalptr>
Tabela de quantidade de banheiros
tabela_banheiros=table(house_selling_price$Baths)
tabela_banheiros
##
## 1 2 3 4
## 17 71 11 1
tabela_prop <- prop.table(tabela_banheiros)*100
tabela_prop
##
## 1 2 3 4
## 17 71 11 1
tabela_prop <- data.frame(tabela_prop)
names(tabela_prop)
## [1] "Var1" "Freq"
names(tabela_prop)[1] <- "Quantidade de banheiros"
names(tabela_prop)[2] <- "Proporção"
names(tabela_prop)
## [1] "Quantidade de banheiros" "Proporção"
library(flextable)
flextable(tabela_prop)
Quantidade de banheiros | Proporção |
1 | 17 |
2 | 71 |
3 | 11 |
4 | 1 |
names(house_selling_price)
## [1] "case" "Taxes" "Beds" "Baths" "New" "Price" "Size"
mean(house_selling_price$Baths)
## [1] 1.96
median(house_selling_price$Baths)
## [1] 2
#### Histograma inicial
quebras <- seq(0,4,1)
quebras
## [1] 0 1 2 3 4
hist(house_selling_price$Baths,main ="Histograma de banheiros nas casas a venda",
xlab = "banheiros", ylab = "Frequência de casas",col="YELLOW",
xlim = c(0,4), ylim = c(0,80),labels = TRUE, breaks = quebras)
Para o histograma objeto do presente estudo, podemos concluir que, não temos casa a venda sem banheiros e também casas a venda com número de banheiros acima de quatro. Logo temos um histograma assimétrico com um alto ponto em detaque (71 casas com 2 banheiros), sem outliers (observação fora da curva). Temos, 17 casas a venda com um banheiro, 71 casas a venda com 2 banheiros, 11 casas a venda com 3 banheiros e 1 única casa a venda com 4 banheiros.