HOME

Column

SOBRE OS DADOS

O conjunto de dados contém informaçÔes de vendas de café ao longo de 2 anos na Aråbia Saudita, abrangendo compras de 100 clientes de 5 tipos diferentes de grãos de café. Inclui detalhes sobre quantidade, preços, descontos e vendas totais.

Colunas do Dataset:

  • Purchase_date: Data da compra realizada pelo cliente (Tipo: Date)
  • Customer_ID: Identificador Ășnico de cada cliente (Tipo: Character/Numeric)
  • Category: Categoria do produto (Exemplo: Coffee Beans)
  • Product: Tipo de cafĂ© comprado (Brazilian, Ethiopian, Colombian, Costa Rica, Guatemala)
  • Unit_Price: Preço unitĂĄrio de cada produto (Tipo: Numeric)
  • Quantity: Quantidade de unidades compradas (Tipo: Integer)
  • Sales_Amount: Valor total das vendas (Quantity × Unit Price)
  • Used_Discount: Indica se um desconto foi aplicado (TRUE/FALSE)
  • Discount_Amount: Valor do desconto aplicado (normalmente 20%)
  • Final_Sales: Valor final das vendas apĂłs o desconto

Fonte dos dados: Kaggle - Coffee Bean Sales Dataset

Column

ESTATÍSTICAS GERAIS

Métrica Valor
Total de Vendas 730 vendas
Receita Total $ 629,648
Ticket Médio $ 863
Clientes Únicos 100 clientes

VARIÁVEIS QUALITATIVAS ORDINAIS

Column

CONCEITO

Variåveis Qualitativas Ordinais são características que podem ser categorizadas e ordenadas, mas cuja diferença entre as categorias não é uniforme.

Existe uma relação de ordem entre as categorias, mas a distùncia entre elas não é quantificåvel de maneira precisa.

Exemplos: - Grau de escolaridade - Classificação de qualidade - NĂ­veis de satisfação - No nosso dataset: Tipos de cafĂ© por origem (ordenados por frequĂȘncia)

Column

GRÁFICO: FREQUÊNCIA DE VENDAS POR ORIGEM DO CAFÉ

Interpretação: Este grĂĄfico mostra a distribuição ordenada das vendas por origem do cafĂ©, permitindo identificar quais paĂ­ses tĂȘm maior participação no mercado.

VARIÁVEIS QUALITATIVAS NOMINAIS

Column

CONCEITO

VariĂĄveis Qualitativas Nominais representam categorias que nĂŁo possuem uma ordem intrĂ­nseca. Cada categoria Ă© Ășnica e independente das outras.

CaracterĂ­sticas: - NĂŁo hĂĄ hierarquia entre as categorias - NĂŁo podem ser ordenadas logicamente - Representam diferentes tipos ou classes

Exemplos: - Cores - Estados civis - Tipos de animais - No nosso dataset: Uso de desconto (Sim/NĂŁo)

Column

GRÁFICO: USO DE DESCONTO PELOS CLIENTES

Interpretação: Este gråfico de pizza mostra a proporção de clientes que utilizaram ou não desconto em suas compras, evidenciando o comportamento de compra dos consumidores.

VARIÁVEIS QUANTITATIVAS DISCRETAS

Column

CONCEITO

VariĂĄveis Quantitativas Discretas representam contagens ou valores distintos e separados por unidades fixas.

Características: - Assumem valores inteiros específicos - Representam contagens - Hå espaços definidos entre os valores possíveis

Exemplos: - NĂșmero de alunos em uma sala - Quantidade de carros em um estacionamento - NĂșmero de filhos - No nosso dataset: Quantidade de grĂŁos vendidos por cidade

Column

GRÁFICO: QUANTIDADE DE GRÃOS VENDIDOS POR CIDADE

Interpretação: Este gråfico apresenta a distribuição discreta da quantidade de grãos vendidos em cada cidade, mostrando claramente as diferenças de volume de vendas entre as localidades.

VARIÁVEIS QUANTITATIVAS CONTÍNUAS

Column

CONCEITO

VariĂĄveis Quantitativas ContĂ­nuas assumem valores em um intervalo contĂ­nuo e podem assumir qualquer valor dentro desse intervalo.

Características: - Podem assumir infinitos valores - Não hå espaços entre os valores possíveis - Geralmente envolvem mediçÔes

Exemplos: - Altura, peso, temperatura - Tempo, velocidade - Valores monetĂĄrios - No nosso dataset: Valor final das vendas

Column

GRÁFICO: DISTRIBUIÇÃO DE VENDAS FINAIS POR CIDADE

Interpretação: Este gråfico mostra a distribuição contínua dos valores de vendas finais, revelando padrÔes de concentração de vendas e variabilidade entre as diferentes cidades.

MÉDIA ARITMÉTICA

Column

CONCEITO

MĂ©dia AritmĂ©tica Ă© uma medida de tendĂȘncia central que representa a soma dos valores de um conjunto dividida pelo nĂșmero de elementos.

FĂłrmula: \[\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n}\]

CaracterĂ­sticas: - SensĂ­vel a valores extremos (outliers) - Representa o “centro de massa” dos dados - Útil para dados simĂ©tricos

Aplicação: Identificar o valor típico de cada variåvel no dataset.

Column

GRÁFICO: BOXPLOT COM MÉDIAS DAS VARIÁVEIS

Interpretação: Os losangos vermelhos indicam a média aritmética de cada variåvel, mostrando o valor central típico para preços, quantidades, vendas e descontos.

MEDIANA

Column

CONCEITO

Mediana Ă© uma medida de tendĂȘncia central que representa o valor que separa a metade inferior da metade superior de um conjunto de dados ordenado.

CaracterĂ­sticas: - Menos sensĂ­vel a outliers que a mĂ©dia - Divide os dados em duas partes iguais - Útil para dados assimĂ©tricos - Corresponde ao 2Âș quartil (Q2)

Cålculo: Organizar os dados em ordem e encontrar o valor do meio (ou média dos dois valores centrais).

Column

GRÁFICO: BOXPLOT COM MEDIANAS DAS VARIÁVEIS

Interpretação: Os quadrados azuis mostram a mediana de cada variåvel. Note que a mediana pode diferir da média, especialmente quando hå outliers ou distribuiçÔes assimétricas.

DESVIO PADRÃO

Column

CONCEITO

Desvio Padrão é uma medida de dispersão que representa a média das distùncias entre cada ponto de dados e a média do conjunto.

FĂłrmula: \[s = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n}}\]

CaracterĂ­sticas: - Mede a variabilidade dos dados - Valores baixos = dados concentrados - Valores altos = dados dispersos - Mesma unidade dos dados originais

Column

GRÁFICO: BOXPLOT COM INTERVALOS DE DESVIO PADRÃO

Interpretação: As barras verdes mostram o intervalo de um desvio padrão ao redor da média. Aproximadamente 68% dos dados estão dentro deste intervalo em distribuiçÔes normais.

VARIÂNCIA

Column

CONCEITO

Variùncia é uma medida de dispersão que quantifica a extensão na qual cada ponto de dados se desvia da média do conjunto.

FĂłrmula: \[s^2 = \frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n-1}\]

CaracterĂ­sticas: - Quadrado do desvio padrĂŁo - Unidade Ă© o quadrado da unidade original - Sempre nĂŁo-negativa - Maior sensibilidade a outliers

Relação: VariĂąncia = (Desvio PadrĂŁo)ÂČ

Column

GRÁFICO: BOXPLOT COM INTERVALOS DE VARIÂNCIA

Interpretação: As barras roxas tracejadas representam intervalos baseados na raiz quadrada da variùncia (equivalente ao desvio padrão). A variùncia mede o espalhamento dos dados ao redor da média.