load("C:/Users/dessa/Documents/R/Base_de_dados-master/diamante.RData")
diamante$profundidade <- ifelse(diamante$profundidade==0,"profundidade","porcentagem da profundidade total")
prop.table(table(diamante$profundidade))
##
## porcentagem da profundidade total
## 1
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
diamante %>%
pull(profundidade) %>%
table() %>%
prop.table()
## .
## porcentagem da profundidade total
## 1
diamante %>%
group_by(corte) %>%
summarize(media=mean(preco),median(preco),desvio_padrão=sd(preco),tamanho=n())
## # A tibble: 5 x 5
## corte media `median(preco)` desvio_padrão tamanho
## <ord> <dbl> <dbl> <dbl> <int>
## 1 Justo 4359. 3282 3560. 1610
## 2 Bom 3929. 3050. 3682. 4906
## 3 Muito Bom 3982. 2648 3936. 12082
## 4 Premium 4584. 3185 4349. 13791
## 5 Ideal 3458. 1810 3808. 21551
boxplot(diamante$preco~diamante$corte, col=c("pink","green","blue","red","yellow"))
Através do gráfico, podemos avaliar que a mediana do corte premium é maior que todos os outros cortes,ou seja, o preço desse corte é maior que os outros. Todos eles apresentam assimetria, um alto número de outliers e o desvio padrão do corte premium é maior que todos os outros, enquanto o corte justo. possui um desvio padrão menor.