Atividade 7 - Análise de duas variáveis: uma quantitativa e uma qualitativa

load("C:/Users/Che Guevara Jr/Documents/Bernardo/Estatistica/Base_de_dados-master/diamante.RData")

Construindo a Tabela

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.0.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(DT)
## Warning: package 'DT' was built under R version 4.0.3
Tabela_preçoxcorte <- diamante %>%
  group_by(corte) %>%
  summarize(media=mean(preco), mediana=median(preco), desvio_padrao=sd(preco))
## `summarise()` ungrouping output (override with `.groups` argument)
Tabela_preçoxcorte$media <- round(Tabela_preçoxcorte$media, 2)
Tabela_preçoxcorte$mediana <- round(Tabela_preçoxcorte$mediana, 2)
Tabela_preçoxcorte$desvio_padrao <- round(Tabela_preçoxcorte$desvio_padrao, 2)
  
datatable(Tabela_preçoxcorte)

Construindo o Boxplot

boxplot(diamante$preco~diamante$corte, main= "Preço X Corte", par(cex=0.75),  col=c("#bd0808", "#de8407", "#e0bf04", "#d8db91", "#8fc4db"), ylab = "Preço", xlab = "Tipo de Corte")
grid(nx=1, ny=NULL)

O gráfico boxplot e a tabela nos mostram que o tipo de corte com o preço mediano mais alto é o Justo (que também tem o menor desvio padrão), enquanto o com menor preço mediano é o Ideal. O tipo de corte com maior dispersão é o Premium, que também apresenta a maior média e maior preço máximo, enquanto o menor preço máximo é do tipo de corte Justo.