Instituto Federal de Rondônia - IFRO
Campus Ji-Paraná
Curso de Análise e Desenvolvimento de Sistemas - ADS

Sobre o Autor:

Olá! Meu nome é Victor Daniel, sou estudante de Análise e Desenvolvimento de Sistemas no Instituto Federal de Rondônia (IFRO). Este dashboard foi desenvolvido como parte de um projeto acadêmico da matéria de Probabilidade e Estatística afim de aprendermos sobre Frequências e Medidas.

Objetivo do Projeto: Demonstrar diferentes tipos de variáveis estatísticas e medidas de tendência central através de visualizações interativas e informativas.

Seja bem-vindo(a) ao meu projeto! Fique à vontade para explorar os resultados e acompanhar essa jornada de aprendizado. 📊☕

HOME

Column

SOBRE OS DADOS

O conjunto de dados contém informações de vendas de café ao longo de 2 anos na Arábia Saudita, abrangendo compras de 100 clientes de 5 tipos diferentes de grãos de café. Inclui detalhes sobre quantidade, preços, descontos e vendas totais.

Colunas do Dataset:

Purchase_date: Data da compra realizada pelo cliente (Tipo: Date)
Customer_ID: Identificador único de cada cliente (Tipo: Character/Numeric)
Category: Categoria do produto (Exemplo: Coffee Beans)
Product: Tipo de café comprado (Brazilian, Ethiopian, Colombian, Costa Rica, Guatemala)
Unit_Price: Preço unitário de cada produto (Tipo: Numeric)
Quantity: Quantidade de unidades compradas (Tipo: Integer)
Sales_Amount: Valor total das vendas (Quantity × Unit Price)
Used_Discount: Indica se um desconto foi aplicado (TRUE/FALSE)
Discount_Amount: Valor do desconto aplicado (normalmente 20%)
Final_Sales: Valor final das vendas após o desconto

Fonte dos dados: Kaggle - Coffee Bean Sales Dataset

Column

ESTATÍSTICAS GERAIS

Métrica	Valor
Total de Vendas	730 vendas
Receita Total	$ 629,648
Ticket Médio	$ 863
Clientes Únicos	100 clientes

VARIÁVEIS QUALITATIVAS ORDINAIS

Column

CONCEITO

Variáveis Qualitativas Ordinais são características que podem ser categorizadas e ordenadas, mas cuja diferença entre as categorias não é uniforme.

Existe uma relação de ordem entre as categorias, mas a distância entre elas não é quantificável de maneira precisa.

Exemplos: - Grau de escolaridade - Classificação de qualidade - Níveis de satisfação - No nosso dataset: Tipos de café por origem (ordenados por frequência)

Column

GRÁFICO: FREQUÊNCIA DE VENDAS POR ORIGEM DO CAFÉ

Interpretação: Este gráfico mostra a distribuição ordenada das vendas por origem do café, permitindo identificar quais países têm maior participação no mercado.

VARIÁVEIS QUALITATIVAS NOMINAIS

Column

CONCEITO

Variáveis Qualitativas Nominais representam categorias que não possuem uma ordem intrínseca. Cada categoria é única e independente das outras.

Características: - Não há hierarquia entre as categorias - Não podem ser ordenadas logicamente - Representam diferentes tipos ou classes

Exemplos: - Cores - Estados civis - Tipos de animais - No nosso dataset: Uso de desconto (Sim/Não)

Column

GRÁFICO: USO DE DESCONTO PELOS CLIENTES

Interpretação: Este gráfico de pizza mostra a proporção de clientes que utilizaram ou não desconto em suas compras, evidenciando o comportamento de compra dos consumidores.

VARIÁVEIS QUANTITATIVAS DISCRETAS

Column

CONCEITO

Variáveis Quantitativas Discretas representam contagens ou valores distintos e separados por unidades fixas.

Características: - Assumem valores inteiros específicos - Representam contagens - Há espaços definidos entre os valores possíveis

Exemplos: - Número de alunos em uma sala - Quantidade de carros em um estacionamento - Número de filhos - No nosso dataset: Quantidade de grãos vendidos por cidade

Column

GRÁFICO: QUANTIDADE DE GRÃOS VENDIDOS POR CIDADE

Interpretação: Este gráfico apresenta a distribuição discreta da quantidade de grãos vendidos em cada cidade, mostrando claramente as diferenças de volume de vendas entre as localidades.

VARIÁVEIS QUANTITATIVAS CONTÍNUAS

Column

CONCEITO

Variáveis Quantitativas Contínuas assumem valores em um intervalo contínuo e podem assumir qualquer valor dentro desse intervalo.

Características: - Podem assumir infinitos valores - Não há espaços entre os valores possíveis - Geralmente envolvem medições

Exemplos: - Altura, peso, temperatura - Tempo, velocidade - Valores monetários - No nosso dataset: Valor final das vendas

Column

GRÁFICO: DISTRIBUIÇÃO DE VENDAS FINAIS POR CIDADE

Interpretação: Este gráfico mostra a distribuição contínua dos valores de vendas finais, revelando padrões de concentração de vendas e variabilidade entre as diferentes cidades.

MÉDIA ARITMÉTICA

Column

CONCEITO

Média Aritmética é uma medida de tendência central que representa a soma dos valores de um conjunto dividida pelo número de elementos.

Fórmula: \[\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n}\]

Características: - Sensível a valores extremos (outliers) - Representa o “centro de massa” dos dados - Útil para dados simétricos

Aplicação: Identificar o valor típico de cada variável no dataset.

Column

GRÁFICO: BOXPLOT COM MÉDIAS DAS VARIÁVEIS

Interpretação: Os losangos vermelhos indicam a média aritmética de cada variável, mostrando o valor central típico para preços, quantidades, vendas e descontos.

MEDIANA

Column

CONCEITO

Mediana é uma medida de tendência central que representa o valor que separa a metade inferior da metade superior de um conjunto de dados ordenado.

Características: - Menos sensível a outliers que a média - Divide os dados em duas partes iguais - Útil para dados assimétricos - Corresponde ao 2º quartil (Q2)

Cálculo: Organizar os dados em ordem e encontrar o valor do meio (ou média dos dois valores centrais).

Column

GRÁFICO: BOXPLOT COM MEDIANAS DAS VARIÁVEIS

Interpretação: Os quadrados azuis mostram a mediana de cada variável. Note que a mediana pode diferir da média, especialmente quando há outliers ou distribuições assimétricas.

DESVIO PADRÃO

Column

CONCEITO

Desvio Padrão é uma medida de dispersão que representa a média das distâncias entre cada ponto de dados e a média do conjunto.

Fórmula: \[s = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n}}\]

Características: - Mede a variabilidade dos dados - Valores baixos = dados concentrados - Valores altos = dados dispersos - Mesma unidade dos dados originais

Column

GRÁFICO: BOXPLOT COM INTERVALOS DE DESVIO PADRÃO

Interpretação: As barras verdes mostram o intervalo de um desvio padrão ao redor da média. Aproximadamente 68% dos dados estão dentro deste intervalo em distribuições normais.

VARIÂNCIA

Column

CONCEITO

Variância é uma medida de dispersão que quantifica a extensão na qual cada ponto de dados se desvia da média do conjunto.

Fórmula: \[s^2 = \frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n-1}\]

Características: - Quadrado do desvio padrão - Unidade é o quadrado da unidade original - Sempre não-negativa - Maior sensibilidade a outliers

Relação: Variância = (Desvio Padrão)²

Column

GRÁFICO: BOXPLOT COM INTERVALOS DE VARIÂNCIA

Interpretação: As barras roxas tracejadas representam intervalos baseados na raiz quadrada da variância (equivalente ao desvio padrão). A variância mede o espalhamento dos dados ao redor da média.

Sidebar

HOME

Column

SOBRE OS DADOS

Column

ESTATÍSTICAS GERAIS

VARIÁVEIS QUALITATIVAS ORDINAIS

Column

CONCEITO

Column

GRÁFICO: FREQUÊNCIA DE VENDAS POR ORIGEM DO CAFÉ

VARIÁVEIS QUALITATIVAS NOMINAIS

Column

CONCEITO

Column

GRÁFICO: USO DE DESCONTO PELOS CLIENTES

VARIÁVEIS QUANTITATIVAS DISCRETAS

Column

CONCEITO

Column

GRÁFICO: QUANTIDADE DE GRÃOS VENDIDOS POR CIDADE

VARIÁVEIS QUANTITATIVAS CONTÍNUAS

Column

CONCEITO

Column

GRÁFICO: DISTRIBUIÇÃO DE VENDAS FINAIS POR CIDADE

MÉDIA ARITMÉTICA

Column

CONCEITO

Column

GRÁFICO: BOXPLOT COM MÉDIAS DAS VARIÁVEIS

MEDIANA

Column

CONCEITO

Column

GRÁFICO: BOXPLOT COM MEDIANAS DAS VARIÁVEIS

DESVIO PADRÃO

Column

CONCEITO

Column

GRÁFICO: BOXPLOT COM INTERVALOS DE DESVIO PADRÃO

VARIÂNCIA

Column

CONCEITO

Column

GRÁFICO: BOXPLOT COM INTERVALOS DE VARIÂNCIA