Carregamento da base de dados

load("~/Base_de_dados-master/diamante.RData")

Análise da variável qualitativa “Corte” em relação a variável quantitativa “Quilate”. Qual a média e o desvio-padrão de quilates por tipo de corte?

library(DT)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
tabela_diamante1<-diamante%>%
  group_by(corte)%>%
  summarize(media=mean (quilate), mediana=median(quilate), desvio_padrao=sd(quilate))%>%
  arrange(desc(media))
## `summarise()` ungrouping output (override with `.groups` argument)
tabela_diamante1$media<-round(tabela_diamante1$media,2)

tabela_diamante1$desvio_padrao<-round(tabela_diamante1$desvio_padrao,2)

datatable(tabela_diamante1)

Construção do gráfico boxplot

par(cex=0.8)
boxplot(diamante$quilate~diamante$corte,col="#727682")

Conclusão

A média de quilates do corte Justo é a maior dentre as cinco categorias (1.02), o desvio-padrão é o mesmo entre os cortes Justo e Premium (0.52). Através do boxplot, pode-se verificar que o tipo de corte Ideal é o menor em quilates, com mediana mais próxima de zero, o tipo de corte Justo é o que tem maior variância por ser o mais simétrico e tem também o outlier mais alto de todos os tipos de corte.