Atividade 7 - Análise de duas variáveis: uma quantitativa e uma qualitativa
Carregando base de Dados Diamante
load("C:/Users/carol/OneDrive/Documentos/Estatistica/Base_de_dados-master/diamante.RData")
Análise da base de dados
Tipo de Corte por Preço em dólares
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.0.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(DT)
## Warning: package 'DT' was built under R version 4.0.3
tabela_preco <- diamante %>%
group_by(corte) %>%
summarize(media=mean(preco),mediana=median(preco),desvio_padrao=sd(preco)) %>%
arrange(desc(media))
## `summarise()` ungrouping output (override with `.groups` argument)
tabela_preco$media <- round(tabela_preco$media,2)
tabela_preco$desvio_padrao <- round(tabela_preco$desvio_padrao,2)
datatable(tabela_preco)
Boxplot
boxplot(diamante$preco~diamante$corte, col="#f27cc3")

Interpretação
O preço mediana de cortes justo é maior em relação aos outros;
Todos os cortes são assimetricos. Mínino muito próximo do primeiro quartil;
Há uma grande presença de outliers em todos os cortes;
Há uma maior variabilidade do corte Premium por ter o desvio padrão maior;
O desvio padrão do corte justo é o menor.