load("/cloud/project/diamante.RData")

Variáveis Qualitativa e Quantitativa

Introdução

O presente trabalho pretende realizar uma análise estatística e de gráfico, do cruzamento de uma variável qualitativa nominal com uma quantitativa contínua, da base de dados diamante. Para tanto, utilizar-se-á o gráfico boxplot, na análise das variáveis tipo de corte e preço.

Exposição dos dados

Tabela

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
Tab_Diamante_por_preco <-diamante %>% group_by(corte) %>% summarize (media=mean(preco), mediana=median(preco), desvio_padrao=sd(preco)) %>% arrange(desc(media))
## `summarise()` ungrouping output (override with `.groups` argument)
Tab_Diamante_por_preco$media <- round(Tab_Diamante_por_preco$media,2)


Tab_Diamante_por_preco$desvio_padrao <- round(Tab_Diamante_por_preco$desvio_padrao,2)

library(DT)

datatable(Tab_Diamante_por_preco)

Gráfico Boxplot

boxplot(diamante$preco~diamante$corte, col=c("red","white","skyblue","yellow","green"), main= "Preço por corte", ylab = "Preço", xlab = "Corte")

Análise dos dados

Com base nos valores da média e do desvio padrão da tabela, o corte de diamantes Premium é o que tem preços mais elevados. Na representação pelo gráfico boxplot, em que todos os valores desmonstram assimetria, atesta-se que o maior desvio padrão é, de fato, no preço do corte Premium, quando se observa a distância entre os pontos mínimos e máximos das variáveis, no gráfico. Já o maior valor pela mediana, é do corte Justo, sendo um valor bem próximo do corte Premium, que tem a segunda maior mediana do gráfico. Na ilustração, é possível perceber que os valores de todos os cortes possuem inúmeros outliers. Isso certamente ocorre porque outras características do diamante, que não se encontram na tabela nem no gráfico, tais como quilate, cor e transparência, também devem agregar valores.

Considerações finais

Assim sendo, a partir da média, da mediana e do desvio padrão das variáveis tipo de corte e preço dos diamantes, afere-se que os diamantes mais caros costumam ser os de corte Premium.