Análise Pharmax

1 Analise univariada e bivariada do projeto Pharmax

2 Conectando ao banco de dados

# Carregando bibliotecas e banco de dados
library(DBI)
library(RSQLite)
# Caminho do banco SQLite farmacia.SQLite
data <- "farmacia.db"
# Conectando ao banco farmacia.db
conn <- dbConnect(RSQLite::SQLite(), dbname = data)
# Listando as tabelas
dbListTables(conn)
## [1] "calendario"   "canal"        "fornecedores" "produto"      "vendas"
# definenindo as variaveis das tabelas
df_calendario <- dbReadTable(conn, "calendario")
df_canal <- dbReadTable(conn, "canal")
df_fornecedores <- dbReadTable(conn, "fornecedores")
df_vendas <- dbReadTable(conn, "vendas")
df_produto <- dbReadTable(conn, "produto")

3 Analise Univariada

3.1 Discutindo a ação

O primeiro passo é sempre interessante entender um pouco mais sobre os dados começando a cronstruir o “mapa astral” dos dados. Vou descrevê-los e pensar no que preciso preocupar em relação a cada variável? identificamos que se trata de um esquema estrela ( Star Schema ) com tabelos dimenoes: canal, produto, fornecedores, calendario e tabela fato vendas. foi possivel identificar e ja alinhar com o cliente a remoção de valores ” não cadastrado” na tabela produtos.

3.1.1 Tabela canal - df_canal

Variavel Descrição Pensamento
ID identificador unico, e tambem chave primaria , seu tipo e quantitativo, variavel numerica usaremos em um esquema estrela de tabela fato e dimensão para que a tabela canal se conecte a tabela vendas.
Canal identificador do tipo de canal, seu tipo e qualitativo, variavel texto

não ha muito o que fazer em relação a essa variavel, a não ser identifcar de qual canal de vendas o registro esta atribuido seja: Loja ou Web. concluindo que a Pharmax opera com vendas tanto fisicas como em canal de venda digitais. o que reperesenta uma oportunidade maior de ganhos.

  • existe valores missing?

  • e possivel alguma correlação?

  • como e a distribuição dessa variavel?

3.1.2 Tabela fornecedores - df_fornecedores

Variavel Descrição Pensamento
sku Se trata de um identificador unico dos fornecedores do tipo qualitativo usaremos unicamente como chave primaria e se conecta com a tabela fato vendas por meio de chave estrangeira
forn variavel do tipo qualitativa, contem os nomes de cada um dos fornecedores. os fornecedores vendem os produtos a Pharmax.

Essa variavel contem os nomes dos fornecedores, o fornecedor 887 Global Pharma foi removido pois ele esta unicamente ligado a uma das variaveis da tabela produto que esta identificada com o nome não cadastrado.

  • qual fornecedor representa maior lucratividade a empresa?

3.1.3 Tabela produto df_produto

Variavel Descrição Pensamento
sku Se trata de um identificador unico do produto, do tipo quantitativo e chave primaria Unicamente para identificar o produto e se conectar com a tabela fato vendas como chave estrangeira

nome_

medicamento

O nome do medicamento, do tipo texto , qualitativa

Identifica o nome dos medicamento, ao qual pode ser util para analisarmos que medicamento vende mais? qual medicamento vende mais em periodo sazonal?

  • como se comporta a curva ABC do produto
categoria A categoria ao qual pertence o medicamento, qualitativa do tipo texto

A categoria do medicamento e importante para termos uma visão de quais categorias representa maior numero de vendas, quais categorias representa um menor numero de vendas?

  • valores missing?
  • qual categoria vende mais?

valor_

do_produto

Representa o valor do produto,do tipo quantitativa numerica Esta variavel e importante, deduzimos que o valor e do preço de fornecedor e não do preço final, não foi definida a margem de lucro para encontrarmos o lucro real e nem foi definido o estoque para mensurarmos o lucro

3.1.4 Tabela vendas df_vendas

Variavel Descrição Pensamento
DATA Variavel que representa a data da venda do tipo date, ele se conecta a tabela calendario por chave estrangeira na coluna data_venda

A coluna DATA e primordial para analisarmos os dados de venda, inclusive analise de serie temporal

  • houve aumento de vendas em periodo sazonal?

  • que medicamento e mais vendido em determinado dia da semana?

ID_Medicamento Do tipo quantitativo numerico e faz conexaão com a tabela produto coluna SKU por meio de chave estrangeira esaa variavel permite identificar os nomes dos medicamentos
FILIAL A variavel FILIAL possui dois niveis : justino e juquitiba. do tipo qualitativa

Essa variavel representa as duas filiais da empresa: justino e Juquitiba

  • Qual filial lucra mais?
FORMA_PGTO a forma de pagamento se identifica por variavel do tipo qualitativa , essa variavel assume os valores pix, qrcode/maquina , cartao debito e cartão credito

Identificamos que a variavel qrcode/maquina pode ser assemelhada a pix

  • Qual modalidade de pagamento vende mais?

  • identificar se existe a oportunidade de alavancar as vendas por pix

  • identificar oportunidade de oferecer descontos nas vendas por pix relacionando com medicamentos de alto volume de vendas, para atrair essa modalidade de vendas visto que não ha cobrança de taxas

ID_Fornecedor essa variavel faz chave estrangeira com a tabela fornecedor coluna sku, do tipo quantitativa primaria essa variavel nos permite avaliar os forncedores que mais representam lucro atraves da curva ABC, analise de pareto
Quantidade_CaixaFechada variavel que representa a quantidade de caixa fechada segundo informação do cliente essa variavel indica que os produtos são comercializados por caixas fechadas, volumes de caixas de grandes quantidades, mas nao temos especificados o tipo de embalagem
REGIAO representa a região em que o produto sera enviado, do tipo qualitativa textual apresenta varios niveis representando estados brasileiros a empresa tem em sua operação de vendas a região norte do Brasil.
ID_Canal variavel que faz chave estrangeira com a tabela canal coluna id_canal

essa variavel representa os canais de vendas da empresa em dois niveis: Web ou loja

  • identificar oportunidade de alavancar as vendas web
CUSTO_ATENDIMENTO variavel que representa o custo por atendimento ao cliente, um passivel dedutivel do valor de lucro, do tipo quantitativo, decimal

o custo de atendimento se torna um passivel dedutivo do lucro da empresa,

  • mensurar e detectar oportunidades de reduzir os valores de custo de atendimento

3.1.5 Detectando valores nulos tabela df_canal

colSums(is.na(df_canal))
##    ID CANAL 
##     0     0
# Calcular percentual de valores ausentes por coluna
colSums(is.na(df_canal) / nrow(df_canal) * 100)
##    ID CANAL 
##     0     0
# Fechando a conexão para liberar o arquivo
dbDisconnect(conn, shutdown = TRUE)