BASE DE DADOS

load("C:/Users/dessa/Documents/R/Base_de_dados-master/diamante.RData")

TRANSFORMANDO VARIÁVEIS

diamante$profundidade <- ifelse(diamante$profundidade==0,"profundidade","porcentagem da profundidade total")

OPERADOR PIPE

prop.table(table(diamante$profundidade))
## 
## porcentagem da profundidade total 
##                                 1
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
diamante %>%
  pull(profundidade) %>%
  table() %>%
  prop.table()
## .
## porcentagem da profundidade total 
##                                 1

ANÁLISE DA BASE DIAMANTE

diamante %>%
  group_by(corte) %>%
summarize(media=mean(preco),median(preco),desvio_padrão=sd(preco),tamanho=n())
## # A tibble: 5 x 5
##   corte     media `median(preco)` desvio_padrão tamanho
##   <ord>     <dbl>           <dbl>         <dbl>   <int>
## 1 Justo     4359.           3282          3560.    1610
## 2 Bom       3929.           3050.         3682.    4906
## 3 Muito Bom 3982.           2648          3936.   12082
## 4 Premium   4584.           3185          4349.   13791
## 5 Ideal     3458.           1810          3808.   21551

BOXPLOT

boxplot(diamante$preco~diamante$corte, col=c("pink","green","blue","red","yellow"))

ANÁLISE DO BOXPLOT

Através do gráfico, podemos avaliar que a mediana do corte premium é maior que todos os outros cortes,ou seja, o preço desse corte é maior que os outros. Todos eles apresentam assimetria, um alto número de outliers e o desvio padrão do corte premium é maior que todos os outros, enquanto o corte justo. possui um desvio padrão menor.