Projeto de Análise de Dados

Aluno: Robson Correia
Curso: Engenharia Civil
Instituição: Celso Lisboa
Disciplina: Análise de Dados
Local: Rio de Janeiro - RJ

Introdução

Este trabalho apresenta uma análise estatística de uma base de dados de movimentação comercial utilizando a linguagem RMarkdown no RStudio. A planilha utilizada contém informações sobre pedidos, categorias de produtos, consultores, regiões de venda, canais de atendimento, quantidades vendidas e valores financeiros.

O objetivo do projeto é aplicar técnicas de tratamento e análise de dados utilizando o R, permitindo interpretar o comportamento das vendas, identificar os produtos mais vendidos, avaliar os consultores com maior faturamento e analisar os canais de venda com melhor desempenho.

Carregamento da Base de Dados

movimentacao <- read_excel("Planilha_Movimentacao_Comercial_Original.xlsx")

Visualização Inicial

## # A tibble: 6 × 10
##   ID_Pedido Data_Venda          Consultor      Categoria   Produto    Quantidade
##   <chr>     <dttm>              <chr>          <chr>       <chr>           <dbl>
## 1 PED-1002  2024-09-18 00:00:00 Patricia Gomes Tecnologia  Monitor            12
## 2 PED-1003  2024-10-06 00:00:00 Rafael Lima    Ferramentas Furadeira          17
## 3 PED-1004  2024-05-08 00:00:00 Rafael Lima    Tecnologia  Notebook           24
## 4 PED-1005  2025-04-25 00:00:00 Carlos Almeida Escritório  Impressora          2
## 5 PED-1006  2024-03-04 00:00:00 Patricia Gomes Escritório  Papel A4           10
## 6 PED-1007  2024-07-03 00:00:00 Juliana Souza  Escritório  Mesa               14
## # ℹ 4 more variables: Valor_Unitario <dbl>, Valor_Total <dbl>, Regiao <chr>,
## #   Canal_Venda <chr>

Preparação e Tratamento dos Dados

names(movimentacao) <- c(
  "id_pedido",
  "data_venda",
  "consultor",
  "categoria",
  "produto",
  "quantidade",
  "valor_unitario",
  "valor_total",
  "regiao",
  "canal_venda"
)

movimentacao <- movimentacao %>%
  mutate(
    data_venda = as.Date(data_venda),
    quantidade = as.numeric(quantidade),
    valor_unitario = as.numeric(valor_unitario),
    valor_total = as.numeric(valor_total)
  )

str(movimentacao)
## tibble [1,200 × 10] (S3: tbl_df/tbl/data.frame)
##  $ id_pedido     : chr [1:1200] "PED-1002" "PED-1003" "PED-1004" "PED-1005" ...
##  $ data_venda    : Date[1:1200], format: "2024-09-18" "2024-10-06" ...
##  $ consultor     : chr [1:1200] "Patricia Gomes" "Rafael Lima" "Rafael Lima" "Carlos Almeida" ...
##  $ categoria     : chr [1:1200] "Tecnologia" "Ferramentas" "Tecnologia" "Escritório" ...
##  $ produto       : chr [1:1200] "Monitor" "Furadeira" "Notebook" "Impressora" ...
##  $ quantidade    : num [1:1200] 12 17 24 2 10 14 8 15 11 19 ...
##  $ valor_unitario: num [1:1200] 2352 556 1288 1945 1193 ...
##  $ valor_total   : num [1:1200] 28219 9447 30915 3890 11926 ...
##  $ regiao        : chr [1:1200] "RJ" "MG" "ES" "RJ" ...
##  $ canal_venda   : chr [1:1200] "Site" "WhatsApp" "Site" "Site" ...
summary(movimentacao)
##      id_pedido      data_venda             consultor        categoria   
##  Length   :1200   Min.   :2024-01-01   Length   :1200   Length   :1200  
##  N.unique :1200   1st Qu.:2024-05-12   N.unique :   6   N.unique :   4  
##  N.blank  :   0   Median :2024-09-06   N.blank  :   0   N.blank  :   0  
##  Min.nchar:   8   Mean   :2024-09-09   Min.nchar:  11   Min.nchar:  10  
##  Max.nchar:   8   3rd Qu.:2025-01-10   Max.nchar:  15   Max.nchar:  11  
##                   Max.   :2025-05-14                                    
##       produto       quantidade    valor_unitario     valor_total      
##  Length   :1200   Min.   : 1.00   Min.   :  26.23   Min.   :   27.24  
##  N.unique :  16   1st Qu.: 7.00   1st Qu.: 684.11   1st Qu.: 5112.98  
##  N.blank  :   0   Median :13.00   Median :1252.98   Median :12476.67  
##  Min.nchar:   4   Mean   :13.15   Mean   :1277.59   Mean   :16787.18  
##  Max.nchar:  16   3rd Qu.:19.25   3rd Qu.:1908.96   3rd Qu.:25420.55  
##                   Max.   :25.00   Max.   :2498.83   Max.   :61167.50  
##        regiao        canal_venda  
##  Length   :1200   Length   :1200  
##  N.unique :   4   N.unique :   4  
##  N.blank  :   0   N.blank  :   0  
##  Min.nchar:   2   Min.nchar:   4  
##  Max.nchar:   2   Max.nchar:  11  
## 

Valores Ausentes

Coluna Valores_Ausentes
id_pedido id_pedido 0
data_venda data_venda 0
consultor consultor 0
categoria categoria 0
produto produto 0
quantidade quantidade 0
valor_unitario valor_unitario 0
valor_total valor_total 0
regiao regiao 0
canal_venda canal_venda 0

Estatística Básica

Variavel Media Mediana Desvio_Padrao Variancia Maximo Minimo
Quantidade 13.15 13.00 7.24 52.41 25.00 1.00
Valor Unitário 1277.59 1252.99 712.89 508206.60 2498.83 26.23
Valor Total 16787.18 12476.67 14082.78 198324788.33 61167.50 27.24

Valor Total por Categoria

categoria faturamento quantidade_total
Construção 4362592 3623
Escritório 5249644 4208
Ferramentas 5144266 3940
Tecnologia 5388110 4012

Gráfico de Colunas

Gráfico de Linha

Histograma

Boxplot

Gráfico de Pizza

Conclusão

A análise da base de movimentação comercial permitiu compreender o comportamento das vendas, identificar os consultores com maior faturamento e analisar os produtos e categorias mais relevantes da empresa.

Os indicadores estatísticos e os gráficos facilitaram a interpretação visual dos dados, permitindo observar padrões importantes relacionados às vendas e ao faturamento.

Conclui-se que o uso do RStudio e do RMarkdown foi eficiente para organização, tratamento e análise da base de dados, atendendo aos objetivos propostos pela atividade acadêmica.