Projeto de Análise de Dados

Aluno: Yasmin Pires
Curso: Engenharia Civil
Instituição: Faculdade Celso Lisboa
Disciplina: Programação em Rmd
Local: Rio de Janeiro - RJ

Introdução

Este trabalho apresenta uma análise estatística de uma base de dados referente à Empresa Y A Atelier. A proposta é utilizar a linguagem R, no ambiente RStudio, para carregar, organizar, tratar e interpretar os dados presentes em uma planilha no formato .xlsx.

A análise permite compreender melhor os investimentos realizados, os valores pagos em diárias e os registros financeiros relacionados aos fornecedores. Dessa forma, o projeto demonstra como a análise de dados pode auxiliar no controle financeiro, organização administrativa e tomada de decisão.

O relatório está organizado em etapas: carregamento dos pacotes, carregamento da base de dados, preparação dos dados, estatística básica, análises por agrupamento, construção de gráficos e conclusão final.

Carregamento dos Pacotes

Os pacotes abaixo foram utilizados para leitura da planilha, manipulação dos dados, elaboração de tabelas e criação dos gráficos estatísticos.

library(readxl)
library(dplyr)
library(ggplot2)
library(knitr)
library(scales)
library(tidyr)

Explicação dos Pacotes

  • readxl: utilizado para carregar a planilha Excel.
  • dplyr: utilizado para tratamento e organização dos dados.
  • ggplot2: utilizado para criação dos gráficos estatísticos.
  • knitr: utilizado para construção das tabelas com kable.
  • scales: utilizado para formatação monetária.
  • tidyr: utilizado para reorganização dos dados.

Carregamento da Base de Dados

A base utilizada neste trabalho foi obtida a partir da planilha PLANILHA DA EMPRESA Y A ATELIER(2).xlsx, disponibilizada para desenvolvimento da atividade acadêmica.

arquivo <- "PLANILHA DA EMPRESA Y A ATELIER(2).xlsx"

investimento_bruto <- read_excel(
  arquivo,
  sheet = "INVESTIMENTO",
  col_names = FALSE
)

diaria_bruto <- read_excel(
  arquivo,
  sheet = "DIARIA ",
  col_names = FALSE
)

fornecedores_bruto <- read_excel(
  arquivo,
  sheet = "FORNECEDORES ",
  col_names = FALSE
)

Visualização Inicial

Investimentos

## # A tibble: 6 × 4
##   ...1                  ...2 ...3  ...4 
##   <chr>                <dbl> <lgl> <chr>
## 1 APARELHO DE OVERLOCK 185   NA    <NA> 
## 2 FIO E LINHA          124.  NA    <NA> 
## 3 AGULIAS               55.4 NA    <NA> 
## 4 COMBUSTIVÉL           40   NA    <NA> 
## 5 CORRENTE DA MAQUINA   12   NA    <NA> 
## 6 OLEO                  10   NA    <NA>

Diárias

## # A tibble: 3 × 5
##   ...1        ...2  ...3           ...4  ...5  
##   <chr>       <chr> <chr>          <chr> <chr> 
## 1 FUNCIONARIO DATA  HORARIO        VALOR SEMANA
## 2 <NA>        <NA>  <NA>           <NA>  <NA>  
## 3 Eliete      46147 14:43h / 22:45 140   980

Fornecedores

## # A tibble: 3 × 11
##   ...1         ...2    ...3      ...4  ...5  ...6  ...7  ...8  ...9  ...10 ...11
##   <chr>        <chr>   <chr>     <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 EMPRESA      NOME    QUANTIDA… VALOR TOTA… AVIS… OBJE… STAT… RECE… ENTR… PAGA…
## 2 FORCENECEDOR AMANDA  <NA>      3     <NA>  Sem … <NA>  <NA>  <NA>  <NA>  <NA> 
## 3 FORNECEDOR   BARBARA 852       1.3   1107… Com … baby… Paga… 46147 45790 46097

Preparação e Tratamento dos Dados

Nesta etapa foram realizadas correções de tipos de dados, remoção de valores ausentes, organização das colunas e padronização das variáveis.

Tratamento da Base de Investimentos

investimento <- investimento_bruto %>%
  select(item = 1, valor = 2) %>%
  filter(!is.na(item), !is.na(valor)) %>%
  mutate(
    item = as.character(item),
    valor = as.numeric(valor)
  ) %>%
  filter(!grepl("TOTAL", item, ignore.case = TRUE)) %>%
  mutate(
    grupo = ifelse(valor >= 1000,
                   "Investimento Principal",
                   "Despesas e Materiais")
  )

kable(investimento, digits = 2)
item valor grupo
APARELHO DE OVERLOCK 185.00 Despesas e Materiais
FIO E LINHA 123.60 Despesas e Materiais
AGULIAS 55.40 Despesas e Materiais
COMBUSTIVÉL 40.00 Despesas e Materiais
CORRENTE DA MAQUINA 12.00 Despesas e Materiais
OLEO 10.00 Despesas e Materiais
TESOURA 8.50 Despesas e Materiais
PARAFUSOS DA MAQUINA 7.80 Despesas e Materiais
ESTACIONAMENTO 7.00 Despesas e Materiais
UBER DO APARELHO 6.00 Despesas e Materiais
TESOUURINHAS, ALFINETE 23.47 Despesas e Materiais
MAQUINA OVERLOCK 1200.00 Investimento Principal
MAQUINA COLARETE 1800.00 Investimento Principal
MAQUINA RETA 1000.00 Investimento Principal

Tratamento da Base de Diárias

diaria <- diaria_bruto %>%
  slice(3:n()) %>%
  select(1:5) %>%
  setNames(c(
    "funcionario",
    "data",
    "horario",
    "valor",
    "semana"
  )) %>%
  filter(!is.na(funcionario)) %>%
  mutate(
    funcionario = as.character(funcionario),
    data = as.Date(as.numeric(data), origin = "1899-12-30"),
    horario = as.character(horario),
    valor = as.numeric(valor),
    semana = as.numeric(semana)
  )

kable(diaria, digits = 2)
funcionario data horario valor semana
Eliete 2026-05-05 14:43h / 22:45 140 980

Tratamento da Base de Fornecedores

fornecedores <- fornecedores_bruto %>%
  slice(6:n()) %>%
  select(1:11) %>%
  setNames(c(
    "empresa",
    "nome",
    "quantidade",
    "valor_unitario",
    "total_semana",
    "avisamentos",
    "objeto",
    "status",
    "recebido",
    "entregue",
    "pagamento"
  )) %>%
  filter(!is.na(nome)) %>%
  mutate(
    empresa = as.character(empresa),
    nome = as.character(nome),
    quantidade = as.numeric(quantidade),
    valor_unitario = as.numeric(valor_unitario),
    total_semana = as.numeric(total_semana),
    recebido = as.Date(as.numeric(recebido), origin = "1899-12-30"),
    entregue = as.Date(as.numeric(entregue), origin = "1899-12-30"),
    pagamento = as.Date(as.numeric(pagamento), origin = "1899-12-30")
  )

kable(fornecedores, digits = 2)
empresa nome quantidade valor_unitario total_semana avisamentos objeto status recebido entregue pagamento
FORNECEDOR BARBARA 852 1.3 1107.6 Com aviamento baby look (blusa) Pagamento 3 dias ulteis depois da entrega 2026-05-05 2025-05-13 2026-03-16

Estrutura das Bases

## tibble [14 × 3] (S3: tbl_df/tbl/data.frame)
##  $ item : chr [1:14] "APARELHO DE OVERLOCK" "FIO E LINHA" "AGULIAS" "COMBUSTIVÉL" ...
##  $ valor: num [1:14] 185 123.6 55.4 40 12 ...
##  $ grupo: chr [1:14] "Despesas e Materiais" "Despesas e Materiais" "Despesas e Materiais" "Despesas e Materiais" ...
## tibble [1 × 5] (S3: tbl_df/tbl/data.frame)
##  $ funcionario: chr "Eliete"
##  $ data       : Date[1:1], format: "2026-05-05"
##  $ horario    : chr "14:43h / 22:45"
##  $ valor      : num 140
##  $ semana     : num 980
## tibble [1 × 11] (S3: tbl_df/tbl/data.frame)
##  $ empresa       : chr "FORNECEDOR"
##  $ nome          : chr "BARBARA"
##  $ quantidade    : num 852
##  $ valor_unitario: num 1.3
##  $ total_semana  : num 1108
##  $ avisamentos   : chr "Com aviamento"
##  $ objeto        : chr "baby look (blusa)"
##  $ status        : chr "Pagamento 3 dias ulteis depois da entrega"
##  $ recebido      : Date[1:1], format: "2026-05-05"
##  $ entregue      : Date[1:1], format: "2025-05-13"
##  $ pagamento     : Date[1:1], format: "2026-03-16"

Verificação de Valores Ausentes

ausentes <- data.frame(
  Base = c(
    rep("Investimento", length(names(investimento))),
    rep("Diária", length(names(diaria))),
    rep("Fornecedores", length(names(fornecedores)))
  ),
  Coluna = c(
    names(investimento),
    names(diaria),
    names(fornecedores)
  ),
  Valores_Ausentes = c(
    colSums(is.na(investimento)),
    colSums(is.na(diaria)),
    colSums(is.na(fornecedores))
  )
)

kable(ausentes)
Base Coluna Valores_Ausentes
Investimento item 0
Investimento valor 0
Investimento grupo 0
Diária funcionario 0
Diária data 0
Diária horario 0
Diária valor 0
Diária semana 0
Fornecedores empresa 0
Fornecedores nome 0
Fornecedores quantidade 0
Fornecedores valor_unitario 0
Fornecedores total_semana 0
Fornecedores avisamentos 0
Fornecedores objeto 0
Fornecedores status 0
Fornecedores recebido 0
Fornecedores entregue 0
Fornecedores pagamento 0

Estatística Básica

A tabela abaixo apresenta média, mediana, desvio padrão, variância, máximo e mínimo das principais variáveis numéricas.

Variavel Media Mediana Desvio_Padrao Variancia Maximo Minimo
Investimentos 319.91 31.74 575.28 330951.6 1800.0 6.0
Diárias 140.00 140.00 NA NA 140.0 140.0
Fornecedores 1107.60 1107.60 NA NA 1107.6 1107.6

Análises por Agrupamento

Valor Total por Categoria Financeira

Categoria Valor_Total
Investimentos 4478.77
Diárias 140.00
Fornecedores 1107.60

Valor Total por Fornecedor

nome quantidade_total valor_total
BARBARA 852 1107.6

Gráficos

Gráfico de Linha

Boxplot

Histograma

Gráfico de Colunas

Gráfico de Pizza

Conclusão

A análise estatística da planilha da Empresa Y A Atelier permitiu compreender melhor os valores relacionados aos investimentos, diárias e fornecedores da empresa.

Os indicadores estatísticos auxiliaram na interpretação dos dados numéricos, enquanto os gráficos facilitaram a visualização da distribuição dos valores financeiros e das categorias analisadas.

Conclui-se que o uso do RStudio e da linguagem R foi adequado para organização, tratamento e análise da base de dados, permitindo transformar a planilha em informações estatísticas úteis para apoio administrativo e tomada de decisão.