Centro Universitário Celso Lisboa

Professor: Adriano Lauro

Alunos: Arthur - Jocelio

Disciplina: Análise de Dados

Aula de Programação fase 2 - Celso Lisboa

Folha de Pagamento e Projeções

Aprenda programação básica a partir do link https://rpubs.com/adlauro/881802.

library(readr)
library(readxl) 
library(writexl)
library(openxlsx)
library(ggplot2)
library(readxl)
library(dplyr)
## 
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     filter, lag
## Os seguintes objetos são mascarados por 'package:base':
## 
##     intersect, setdiff, setequal, union

Carregando Planilhas

getwd()
## [1] "C:/Users/Jocel/OneDrive/Documentos/Rstudio"
dir()
##  [1] "Adriano-R.html"                  "Adriano R.Rmd"                  
##  [3] "Arthur Jocelio.Rmd"              "Aula 2025 continuação jocelio.R"
##  [5] "Aula.html"                       "Folha-de-Pagamento.html"        
##  [7] "Folha-de-Pagamento.Rmd"          "Folha-de-Pagamento_files"       
##  [9] "Folha de Pagamento.Rmd"          "Jocelio-arthur.html"            
## [11] "Jocelio arthur.Rmd"              "Programação R"                  
## [13] "Projeto-Fase-2.html"             "Projeto-Fase-2_files"           
## [15] "Projeto Fase 2.Rmd"              "Salario_base2024.xlsx"          
## [17] "Vendas2024.xlsx"
setwd("C:/Users/Jocel/OneDrive/Documentos/Rstudio")

Importação dos Dados

salarios <- read_excel("Salario_base2024.xlsx")
vendas <- read_excel("Vendas2024.xlsx")

Estatísticas Descritivas

summary(salarios)
##  Número de Inscrição     Nome            Sobrenome            Setor          
##  Min.   :101101      Length:22          Length:22          Length:22         
##  1st Qu.:101106      Class :character   Class :character   Class :character  
##  Median :102112      Mode  :character   Mode  :character   Mode  :character  
##  Mean   :165105                                                              
##  3rd Qu.:201854                                                              
##  Max.   :303105                                                              
##     Cargo              Contrato                    Salario_base 
##  Length:22          Min.   :2018-01-01 00:00:00   Min.   :2000  
##  Class :character   1st Qu.:2019-10-01 00:00:00   1st Qu.:2000  
##  Mode  :character   Median :2019-10-01 00:00:00   Median :2000  
##                     Mean   :2019-12-11 22:54:32   Mean   :2295  
##                     3rd Qu.:2020-03-01 00:00:00   3rd Qu.:2375  
##                     Max.   :2022-05-01 00:00:00   Max.   :4000
summary(vendas)
##     vendedor           dias                      venda_diaria         ano      
##  Min.   :101101   Min.   :2018-01-01 00:00:00   Min.   :  9.79   Min.   :2018  
##  1st Qu.:101102   1st Qu.:2020-09-19 00:00:00   1st Qu.:133.27   1st Qu.:2020  
##  Median :101105   Median :2022-02-03 00:00:00   Median :254.06   Median :2022  
##  Mean   :101234   Mean   :2021-11-21 03:43:43   Mean   :260.38   Mean   :2021  
##  3rd Qu.:101108   3rd Qu.:2023-03-15 00:00:00   3rd Qu.:373.85   3rd Qu.:2023  
##  Max.   :102112   Max.   :2024-03-30 00:00:00   Max.   :838.42   Max.   :2024  
##       mes        
##  Min.   : 1.000  
##  1st Qu.: 3.000  
##  Median : 7.000  
##  Mean   : 6.548  
##  3rd Qu.:10.000  
##  Max.   :12.000
media_salario <- mean(salarios$Salario_base)
mediana_salario <- median(salarios$Salario_base)
desvio_padrao_salario <- sd(salarios$Salario_base)

cat("Média Salarial:", media_salario, "\n")
## Média Salarial: 2295.455
cat("Mediana Salarial:", mediana_salario, "\n")
## Mediana Salarial: 2000
cat("Desvio Padrão Salarial:", desvio_padrao_salario, "\n")
## Desvio Padrão Salarial: 610.6026

Distribuição de Salários por Cargo

ggplot(salarios, aes(x = Cargo, y = Salario_base)) +
  geom_boxplot(fill = "skyblue") +
  labs(title = "Distribuição de Salários por Cargo", x = "Cargo", y = "Salário Base")

Média Salarial por Setor

salarios %>%
  group_by(Setor) %>%
  summarise(Media_Salarial = mean(Salario_base)) %>%
  ggplot(aes(x = Setor, y = Media_Salarial, fill = Setor)) +
  geom_bar(stat = "identity") +
  labs(title = "Média Salarial por Setor", y = "Média Salarial")

Quantidade de Funcionários por Cargo

salarios %>%
  count(Cargo) %>%
  ggplot(aes(x = Cargo, y = n, fill = Cargo)) +
  geom_bar(stat = "identity") +
  labs(title = "Quantidade de Funcionários por Cargo", y = "Número de Funcionários")

Exercícios

Qual o salário médio dos funcionários da operação?

salarios %>%
  filter(Setor == "Operação") %>%
  summarise(Media_Operacao = mean(Salario_base))
## # A tibble: 1 × 1
##   Media_Operacao
##            <dbl>
## 1          2231.

Quantos supervisores existem na empresa?

salarios %>%
  filter(Cargo == "Supervisor") %>%
  count()
## # A tibble: 1 × 1
##       n
##   <int>
## 1     4

Qual o maior salário base registrado?

max(salarios$Salario_base)
## [1] 4000