Este relatório apresenta uma análise estatística de um conjunto de dados contendo informações sobre funcionários de uma empresa. A análise inclui tabelas de frequência, gráficos e estatísticas descritivas.
Importando a Base de Dados
library(knitr)
library(ggplot2)
funcionarios <- read.csv("Dados_Funcionarios.csv", sep=",", header=TRUE)
O estado civil dos funcionários foi analisado por meio de tabelas de frequência e gráficos. Os dados revelam quais estados civis são mais comuns na empresa, permitindo uma melhor compreensão do perfil dos funcionários. Essa análise pode fornecer caracteristica importantes sobre a composição dos funcionários e possíveis tendências relacionadas ao estado civil.
Tabela de Frequência Absoluta
table(funcionarios$Est.civil)
##
## casado solteiro
## 20 16Tabela de Frequência Relativa
prop.table(table(funcionarios$Est.civil))
##
## casado solteiro
## 0.5555556 0.4444444Gráfico de Barras
barplot(table(funcionarios$Est.civil), main="Gráfico de Barras - Estado Civil")
Gráfico de Setores
pie(table(funcionarios$Est.civil), main="Gráfico de Setores - Estado Civil")
A distribuição do grau de instrução dos funcionários esta representada por tabelas e gráficos. Nota-se uma concentração maior nos níveis de 1° e 2° grau.
Frequência Absoluta
table(funcionarios$Inst)
##
## 1o Grau 2o Grau Superior
## 12 18 6Frequência Relativa
prop.table(table(funcionarios$Inst))
##
## 1o Grau 2o Grau Superior
## 0.3333333 0.5000000 0.1666667Gráfico de Barras
barplot(table(funcionarios$Inst), main="Gráfico de Barras - Grau de Instrução")
Gráfico de Setores
pie(table(funcionarios$Inst), main="Gráfico de Setores - Grau de Instrução")
Foi analisada a distribuição do número de filhos entre todos os funcionários. A frequência relativa acumulada demonstra a progressão da distribuição ao longo de todos os valores possíveis.
Frequência Absoluta
table(funcionarios$Filhos)
##
## 0 1 2 3 5
## 4 5 7 3 1Frequência Relativa
prop.table(table(funcionarios$Filhos))
##
## 0 1 2 3 5
## 0.20 0.25 0.35 0.15 0.05Frequência Relativa Acumulada
cumsum(prop.table(table(funcionarios$Filhos)))
## 0 1 2 3 5
## 0.20 0.45 0.80 0.95 1.00Gráfico de Frequência Relativa
barplot(prop.table(table(funcionarios$Filhos)), main="Frequência Relativa - Filhos")
Gráfico de Frequência Relativa Acumulada
plot(cumsum(prop.table(table(funcionarios$Filhos))), type='o', main="Frequência
Relativa Acumulada - Filhos", ylab="", xlab="Número de Filhos")
A análise do salário permite identificar a distribuição da renda entre todos os funcionários da empresa. É possivelverificar os valores máximo e mínimo do salário e determinamos o número adequado de classes para a construção de uma tabela de frequência.
``` r
max_salario <- max(funcionarios$Salario)
min_salario <- min(funcionarios$Salario)
n <- length(funcionarios$Salario) # Número de funcionários
num_classes <- round(1 + 3.3 * log10(n))
```
``` r
salario_breaks <- seq(min_salario, max_salario, length.out = num_classes + 1)
tabela_frequencia <- table(cut(funcionarios$Salario, breaks = salario_breaks,
include.lowest = TRUE))
```
-Valores de Máximo e Mínimo e Tabela de Frequência
``` r
cat("Valor Máximo do Salário:", max_salario, "\n")
```
```
## Valor Máximo do Salário: 23.3
```
``` r
cat("Valor Mínimo do Salário:", min_salario, "\n")
```
```
## Valor Mínimo do Salário: 4
```
``` r
cat("Número de Classes:", num_classes, "\n")
```
```
## Número de Classes: 6
```
``` r
kable(as.data.frame(tabela_frequencia), caption = "Tabela de Frequência do Salário")
```
Table: Tabela de Frequência do Salário
|Var1 | Freq|
|:-----------|----:|
|[4,7.22] | 7|
|(7.22,10.4] | 11|
|(10.4,13.6] | 8|
|(13.6,16.9] | 6|
|(16.9,20.1] | 3|
|(20.1,23.3] | 1|
Histograma
hist(funcionarios$Salario, main="Histograma - Salário", xlab="Salário",
breaks=num_classes,
col="lightblue", border="black", freq=TRUE)
Com o Histograma é possível vizualizarmos a concentração dos valores de salário dos funcionários.
A relação entre estado civil e grau de instrução é apresentada por uma tabela de contingência e um gráfico de barras comparativo.
Tabela
table(funcionarios$Est.civil, funcionarios$Inst)
##
## 1o Grau 2o Grau Superior
## casado 5 12 3
## solteiro 7 6 3Gráfico de barras
barplot(table(funcionarios$Est.civil, funcionarios$Inst), beside=TRUE, legend=TRUE)
O box-plot permite visualizar a distrivuição dos salários dentro de cada nível de instrução, além da média e do desvio padrão.
BoxPlot
boxplot(Salario ~ Inst, data=funcionarios, main="Box-Plot - Salário por Grau de
Instrução")
Média
tapply(funcionarios$Salario, funcionarios$Inst, mean)
## 1o Grau 2o Grau Superior
## 7.836667 11.528333 16.475000Desvio padrão
tapply(funcionarios$Salario, funcionarios$Inst, sd)
## 1o Grau 2o Grau Superior
## 2.956464 3.715144 4.502438
Foi criada uma nova variável chamada Idade, combinando as colunas Anos e Meses. Ela servirá também como uma nova “coluna”.
Criando a Coluna Idade
funcionarios$Idade <- funcionarios$Anos + funcionarios$Meses / 12
kable(head(funcionarios[, c("Anos", "Meses", "Idade")]), caption = "Idade dos
funcionários")
| Anos | Meses | Idade |
|---|---|---|
| 26 | 3 | 26.25000 |
| 32 | 10 | 32.83333 |
| 36 | 5 | 36.41667 |
| 20 | 10 | 20.83333 |
| 40 | 7 | 40.58333 |
| 28 | 0 | 28.00000 |
A relação entre salário e idade foi explorada por meio de um gráfico de dispersão e um cálculo de correlação. Esta análise pode revelar se há uma progressão salarial conforme a idade.
Gráfico de Dispersão
plot(funcionarios$Idade, funcionarios$Salario, main="Relação Idade x Salário",
xlab="Idade", ylab="Salário")
Calculo de Correlação
cor(funcionarios$Idade, funcionarios$Salario)
## [1] 0.3651397Diante do resultado da correlação é indicado que há uma correlação positiva fraca entre o salário e idade. Tal valor significa que, em geral, à medida que a idade aumenta, o salário tende a aumentar, mas essa relação não é muito forte. Como está próximo de 0 ela é considerada fraca.
``` r
dados_estatisticos <- data.frame(
Dados = c("Média", "Variância", "Desvio Padrão", "Mediana"),
Salário = c(mean(funcionarios$Salario), var(funcionarios$Salario),
sd(funcionarios$Salario), median(funcionarios$Salario)),
Idade = c(mean(funcionarios$Idade), var(funcionarios$Idade), sd(funcionarios$Idade),
median(funcionarios$Idade)),
Filhos = c(mean(funcionarios$Filhos, na.rm=TRUE), var(funcionarios$Filhos, na.rm=TRUE),
sd(funcionarios$Filhos, na.rm=TRUE), median(funcionarios$Filhos, na.rm=TRUE))
)
kable(dados_estatisticos, caption = "Estatísticas Descritivas das Variáveis")
```
Table: Estatísticas Descritivas das Variáveis
|Dados | Salário| Idade| Filhos|
|:-------------|---------:|---------:|--------:|
|Média | 11.122222| 35.050926| 1.650000|
|Variância | 21.044766| 44.959237| 1.607895|
|Desvio Padrão | 4.587458| 6.705165| 1.268028|
|Mediana | 10.165000| 34.916667| 2.000000|
Análise dos Dados
Salário: A média e mediana dos salários indicam o valor central dos rendimentos da empresa, enquanto o desvio padrão mostra a dispersão dos valores de salários.
Idade: A média de idade permite entender o faixa etária dos funcionários, sendo útil para desenvolver algumas estratégias dentro da empresa.
Número de Filhos: A análise deste dado mostra a média de filhos por funcionário, ajudando na formulação de benefícios.
Essas estatísticas são fundamentais para compreender a diversidade e o perfil dos funcionários, auxiliando na tomada de decisões estratégicas qeu podem ser tomadas dentro da empresa.
Este relatório apresentou uma análise estatística onde foi explorado os funcionários de uma empresa. Foi possível identificar padrões e tendências, como a relação entre salário, idade e número de filhos, bem como a distribuição dos estados civis e grau de instrução. Essas análises podem auxiliar na formulação de políticas de gestão da empresa e estratégias para melhoria da questão salarial e da qualificação profissional.