Aluno: Yasmin Pires
Curso: Engenharia Civil
Instituição: Faculdade Celso Lisboa
Disciplina: Programação em Rmd
Local: Rio de Janeiro - RJ
Este trabalho apresenta uma análise estatística de uma base de dados
referente à Empresa Y A Atelier. A proposta é utilizar a linguagem R, no
ambiente RStudio, para carregar, organizar, tratar e interpretar os
dados presentes em uma planilha no formato .xlsx.
A análise permite compreender melhor os investimentos realizados, os valores pagos em diárias e os registros financeiros relacionados aos fornecedores. Dessa forma, o projeto demonstra como a análise de dados pode auxiliar no controle financeiro, organização administrativa e tomada de decisão.
O relatório está organizado em etapas: carregamento dos pacotes, carregamento da base de dados, preparação dos dados, estatística básica, análises por agrupamento, construção de gráficos e conclusão final.
Os pacotes abaixo foram utilizados para leitura da planilha, manipulação dos dados, elaboração de tabelas e criação dos gráficos estatísticos.
library(readxl)
library(dplyr)
library(ggplot2)
library(knitr)
library(scales)
library(tidyr)
readxl: utilizado para carregar a planilha Excel.dplyr: utilizado para tratamento e organização dos
dados.ggplot2: utilizado para criação dos gráficos
estatísticos.knitr: utilizado para construção das tabelas com
kable.scales: utilizado para formatação monetária.tidyr: utilizado para reorganização dos dados.A base utilizada neste trabalho foi obtida a partir da planilha
PLANILHA DA EMPRESA Y A ATELIER(2).xlsx, disponibilizada
para desenvolvimento da atividade acadêmica.
arquivo <- "PLANILHA DA EMPRESA Y A ATELIER(2).xlsx"
investimento_bruto <- read_excel(
arquivo,
sheet = "INVESTIMENTO",
col_names = FALSE
)
diaria_bruto <- read_excel(
arquivo,
sheet = "DIARIA ",
col_names = FALSE
)
fornecedores_bruto <- read_excel(
arquivo,
sheet = "FORNECEDORES ",
col_names = FALSE
)
## # A tibble: 6 × 4
## ...1 ...2 ...3 ...4
## <chr> <dbl> <lgl> <chr>
## 1 APARELHO DE OVERLOCK 185 NA <NA>
## 2 FIO E LINHA 124. NA <NA>
## 3 AGULIAS 55.4 NA <NA>
## 4 COMBUSTIVÉL 40 NA <NA>
## 5 CORRENTE DA MAQUINA 12 NA <NA>
## 6 OLEO 10 NA <NA>
## # A tibble: 3 × 5
## ...1 ...2 ...3 ...4 ...5
## <chr> <chr> <chr> <chr> <chr>
## 1 FUNCIONARIO DATA HORARIO VALOR SEMANA
## 2 <NA> <NA> <NA> <NA> <NA>
## 3 Eliete 46147 14:43h / 22:45 140 980
## # A tibble: 3 × 11
## ...1 ...2 ...3 ...4 ...5 ...6 ...7 ...8 ...9 ...10 ...11
## <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 EMPRESA NOME QUANTIDA… VALOR TOTA… AVIS… OBJE… STAT… RECE… ENTR… PAGA…
## 2 FORCENECEDOR AMANDA <NA> 3 <NA> Sem … <NA> <NA> <NA> <NA> <NA>
## 3 FORNECEDOR BARBARA 852 1.3 1107… Com … baby… Paga… 46147 45790 46097
Nesta etapa foram realizadas correções de tipos de dados, remoção de valores ausentes, organização das colunas e padronização das variáveis.
investimento <- investimento_bruto %>%
select(item = 1, valor = 2) %>%
filter(!is.na(item), !is.na(valor)) %>%
mutate(
item = as.character(item),
valor = as.numeric(valor)
) %>%
filter(!grepl("TOTAL", item, ignore.case = TRUE)) %>%
mutate(
grupo = ifelse(valor >= 1000,
"Investimento Principal",
"Despesas e Materiais")
)
kable(investimento, digits = 2)
| item | valor | grupo |
|---|---|---|
| APARELHO DE OVERLOCK | 185.00 | Despesas e Materiais |
| FIO E LINHA | 123.60 | Despesas e Materiais |
| AGULIAS | 55.40 | Despesas e Materiais |
| COMBUSTIVÉL | 40.00 | Despesas e Materiais |
| CORRENTE DA MAQUINA | 12.00 | Despesas e Materiais |
| OLEO | 10.00 | Despesas e Materiais |
| TESOURA | 8.50 | Despesas e Materiais |
| PARAFUSOS DA MAQUINA | 7.80 | Despesas e Materiais |
| ESTACIONAMENTO | 7.00 | Despesas e Materiais |
| UBER DO APARELHO | 6.00 | Despesas e Materiais |
| TESOUURINHAS, ALFINETE | 23.47 | Despesas e Materiais |
| MAQUINA OVERLOCK | 1200.00 | Investimento Principal |
| MAQUINA COLARETE | 1800.00 | Investimento Principal |
| MAQUINA RETA | 1000.00 | Investimento Principal |
diaria <- diaria_bruto %>%
slice(3:n()) %>%
select(1:5) %>%
setNames(c(
"funcionario",
"data",
"horario",
"valor",
"semana"
)) %>%
filter(!is.na(funcionario)) %>%
mutate(
funcionario = as.character(funcionario),
data = as.Date(as.numeric(data), origin = "1899-12-30"),
horario = as.character(horario),
valor = as.numeric(valor),
semana = as.numeric(semana)
)
kable(diaria, digits = 2)
| funcionario | data | horario | valor | semana |
|---|---|---|---|---|
| Eliete | 2026-05-05 | 14:43h / 22:45 | 140 | 980 |
fornecedores <- fornecedores_bruto %>%
slice(6:n()) %>%
select(1:11) %>%
setNames(c(
"empresa",
"nome",
"quantidade",
"valor_unitario",
"total_semana",
"avisamentos",
"objeto",
"status",
"recebido",
"entregue",
"pagamento"
)) %>%
filter(!is.na(nome)) %>%
mutate(
empresa = as.character(empresa),
nome = as.character(nome),
quantidade = as.numeric(quantidade),
valor_unitario = as.numeric(valor_unitario),
total_semana = as.numeric(total_semana),
recebido = as.Date(as.numeric(recebido), origin = "1899-12-30"),
entregue = as.Date(as.numeric(entregue), origin = "1899-12-30"),
pagamento = as.Date(as.numeric(pagamento), origin = "1899-12-30")
)
kable(fornecedores, digits = 2)
| empresa | nome | quantidade | valor_unitario | total_semana | avisamentos | objeto | status | recebido | entregue | pagamento |
|---|---|---|---|---|---|---|---|---|---|---|
| FORNECEDOR | BARBARA | 852 | 1.3 | 1107.6 | Com aviamento | baby look (blusa) | Pagamento 3 dias ulteis depois da entrega | 2026-05-05 | 2025-05-13 | 2026-03-16 |
## tibble [14 × 3] (S3: tbl_df/tbl/data.frame)
## $ item : chr [1:14] "APARELHO DE OVERLOCK" "FIO E LINHA" "AGULIAS" "COMBUSTIVÉL" ...
## $ valor: num [1:14] 185 123.6 55.4 40 12 ...
## $ grupo: chr [1:14] "Despesas e Materiais" "Despesas e Materiais" "Despesas e Materiais" "Despesas e Materiais" ...
## tibble [1 × 5] (S3: tbl_df/tbl/data.frame)
## $ funcionario: chr "Eliete"
## $ data : Date[1:1], format: "2026-05-05"
## $ horario : chr "14:43h / 22:45"
## $ valor : num 140
## $ semana : num 980
## tibble [1 × 11] (S3: tbl_df/tbl/data.frame)
## $ empresa : chr "FORNECEDOR"
## $ nome : chr "BARBARA"
## $ quantidade : num 852
## $ valor_unitario: num 1.3
## $ total_semana : num 1108
## $ avisamentos : chr "Com aviamento"
## $ objeto : chr "baby look (blusa)"
## $ status : chr "Pagamento 3 dias ulteis depois da entrega"
## $ recebido : Date[1:1], format: "2026-05-05"
## $ entregue : Date[1:1], format: "2025-05-13"
## $ pagamento : Date[1:1], format: "2026-03-16"
ausentes <- data.frame(
Base = c(
rep("Investimento", length(names(investimento))),
rep("Diária", length(names(diaria))),
rep("Fornecedores", length(names(fornecedores)))
),
Coluna = c(
names(investimento),
names(diaria),
names(fornecedores)
),
Valores_Ausentes = c(
colSums(is.na(investimento)),
colSums(is.na(diaria)),
colSums(is.na(fornecedores))
)
)
kable(ausentes)
| Base | Coluna | Valores_Ausentes |
|---|---|---|
| Investimento | item | 0 |
| Investimento | valor | 0 |
| Investimento | grupo | 0 |
| Diária | funcionario | 0 |
| Diária | data | 0 |
| Diária | horario | 0 |
| Diária | valor | 0 |
| Diária | semana | 0 |
| Fornecedores | empresa | 0 |
| Fornecedores | nome | 0 |
| Fornecedores | quantidade | 0 |
| Fornecedores | valor_unitario | 0 |
| Fornecedores | total_semana | 0 |
| Fornecedores | avisamentos | 0 |
| Fornecedores | objeto | 0 |
| Fornecedores | status | 0 |
| Fornecedores | recebido | 0 |
| Fornecedores | entregue | 0 |
| Fornecedores | pagamento | 0 |
A tabela abaixo apresenta média, mediana, desvio padrão, variância, máximo e mínimo das principais variáveis numéricas.
| Variavel | Media | Mediana | Desvio_Padrao | Variancia | Maximo | Minimo |
|---|---|---|---|---|---|---|
| Investimentos | 319.91 | 31.74 | 575.28 | 330951.6 | 1800.0 | 6.0 |
| Diárias | 140.00 | 140.00 | NA | NA | 140.0 | 140.0 |
| Fornecedores | 1107.60 | 1107.60 | NA | NA | 1107.6 | 1107.6 |
| Categoria | Valor_Total |
|---|---|
| Investimentos | 4478.77 |
| Diárias | 140.00 |
| Fornecedores | 1107.60 |
| nome | quantidade_total | valor_total |
|---|---|---|
| BARBARA | 852 | 1107.6 |
A análise estatística da planilha da Empresa Y A Atelier permitiu compreender melhor os valores relacionados aos investimentos, diárias e fornecedores da empresa.
Os indicadores estatísticos auxiliaram na interpretação dos dados numéricos, enquanto os gráficos facilitaram a visualização da distribuição dos valores financeiros e das categorias analisadas.
Conclui-se que o uso do RStudio e da linguagem R foi adequado para organização, tratamento e análise da base de dados, permitindo transformar a planilha em informações estatísticas úteis para apoio administrativo e tomada de decisão.