Carregamento da base de dados
load("~/Base_de_dados-master/diamante.RData")
Análise da variável qualitativa “Corte” em relação a variável quantitativa “Quilate”. Qual a média e o desvio-padrão de quilates por tipo de corte?
library(DT)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
tabela_diamante1<-diamante%>%
group_by(corte)%>%
summarize(media=mean (quilate), mediana=median(quilate), desvio_padrao=sd(quilate))%>%
arrange(desc(media))
## `summarise()` ungrouping output (override with `.groups` argument)
tabela_diamante1$media<-round(tabela_diamante1$media,2)
tabela_diamante1$desvio_padrao<-round(tabela_diamante1$desvio_padrao,2)
datatable(tabela_diamante1)
Construção do gráfico boxplot
par(cex=0.8)
boxplot(diamante$quilate~diamante$corte,col="#727682")

Conclusão
A média de quilates do corte Justo é a maior dentre as cinco categorias (1.02), o desvio-padrão é o mesmo entre os cortes Justo e Premium (0.52). Através do boxplot, pode-se verificar que o tipo de corte Ideal é o menor em quilates, com mediana mais próxima de zero, o tipo de corte Justo é o que tem maior variância por ser o mais simétrico e tem também o outlier mais alto de todos os tipos de corte.