Atividade 7 - Análise de duas variáveis: uma quantitativa e uma qualitativa

Carregando base de Dados Diamante

load("C:/Users/carol/OneDrive/Documentos/Estatistica/Base_de_dados-master/diamante.RData")

Análise da base de dados

Tipo de Corte por Preço em dólares

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.0.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(DT)
## Warning: package 'DT' was built under R version 4.0.3
tabela_preco <- diamante %>%
  group_by(corte) %>%
  summarize(media=mean(preco),mediana=median(preco),desvio_padrao=sd(preco)) %>%
arrange(desc(media))
## `summarise()` ungrouping output (override with `.groups` argument)
tabela_preco$media <- round(tabela_preco$media,2)
tabela_preco$desvio_padrao <- round(tabela_preco$desvio_padrao,2)

datatable(tabela_preco)

Boxplot

boxplot(diamante$preco~diamante$corte, col="#f27cc3")

Interpretação

O preço mediana de cortes justo é maior em relação aos outros;

Todos os cortes são assimetricos. Mínino muito próximo do primeiro quartil;

Há uma grande presença de outliers em todos os cortes;

Há uma maior variabilidade do corte Premium por ter o desvio padrão maior;

O desvio padrão do corte justo é o menor.