Base de dados

library(dplyr)
load("C:/Users/PCY/Documents/Estatistica R/BASE DE DADOS ESTATISTICA/diamante.RData")

Estatísticas por grupo (quilate por corte)

diamante %>%
  group_by(corte) %>%
  summarize(media=mean(quilate),desvio_padrao=sd(quilate)) 
## # A tibble: 5 x 3
##   corte     media desvio_padrao
##   <ord>     <dbl>         <dbl>
## 1 Justo     1.05          0.516
## 2 Bom       0.849         0.454
## 3 Muito Bom 0.806         0.459
## 4 Premium   0.892         0.515
## 5 Ideal     0.703         0.433

Em média, os diamantes que apresentam um quilate(peso) maior tem uma qualidade de corte justo. Por outro lado, os diamantes mais leves, em média, tem um corte ideal. Com relação ao desvio padrão nota-se que a maior dispersão ocorre nos diamantes de corte justo e premium.

Boxplot

boxplot(diamante$quilate~diamante$corte, col=(c("#05eaff")))

A partir da visualização do gráfico é possível perceber que a maior mediana está nos diamantes de corte justo, o que demonstra a presença de diamantes de maior quilate nesta categoria de corte. O conjunto de valores que visualmente é mais simétrico corresponde aos diamantes de corte justo. Com relação aos outliers todos os conjuntos de valores estão com uma presença considerável dos mesmos, com destaque aos diamantes de corte justo, que tem o outlier extremo deste banco de dados, ou seja, o diamante mais pesado. Por fim, os diamantes de corte premium apresentam o maior desvio padrão, resultado da grande diversidade de pesos dos diamantes desta categoria de corte.