01/07/2020

O dataset

O dataset escolhido contém registros de anúncios de produtos em diferentes lojas digitais que compartilham o mesmo espaço de compra e venda. Os nomes das empresas foram ocultados para evitar qualquer problema. A tabela possui um milhão de linhas e a fonte garante que os dados foram obtidos de forma aleatória por meio de rotinas de scraping.

Campos

  • Data
  • Loja
  • ID
  • Departamento
  • Linha do produto
  • UF
  • Prazo de entrega
  • Valor do frete
  • Preço
  • parcelas
  • juros

Olhando a tabela

data Loja ID DPTO
03/06/2020 D 55348117 ELETRONICOS (23)
19/06/2020 A 132165827 PCS (9068)
11/06/2020 A 1694349177 PC GAMER (9094)
17/06/2020 B 134240683 ELETRONICOS (23)
15/06/2020 B 134498166 ELETROPORTÁTEIS (9105)
18/06/2020 C 1256176077 ELETRONICOS (23)

Olhando a tabela

LINHA UF Prazo Frete parcelas Preco Juros
50’’ a 55’’ PR 21 9,9 11 205,69 com juros
CHROMEBOOK BA 25 67 1 1477 sem juros
ARMAZENAMENTO RJ 28 38,52 4 649,97 sem juros
44" a 49" ULTRA HD 4K BA 23 149,9 1 3999,9 sem juros
FORNOS ELETRICOS PR 23 72,94 1 1042,79 sem juros
44’’ a 49’’ RJ 34 162,57 12 400,69 sem juros

Explorando os dados

  • Quais empresas são mais competitivas em cada estado? (Usando uma métrica própria)

  • Em que departamentos as empresas têm um melhor preço? (Podem ocorrer outliers)

  • Avaliar o preço do frete por departamento.

  • Fazer um mapa interativo com os registros.