Este documento apresenta a análise dos dados de 36 funcionários, incluindo tabelas de frequência, gráficos e estatísticas descritivas.
Os dados são criados diretamente no R como um dataframe.
dados <- data.frame(
Funcionario = 1:36,
Est.civil = c("solteiro", "casado", "casado", "solteiro", "solteiro", "casado", "solteiro", "solteiro", "casado", "solteiro", "casado", "solteiro", "solteiro", "casado", "casado", "solteiro", "casado", "casado", "solteiro", "solteiro", "casado", "solteiro", "solteiro", "casado", "casado", "casado", "solteiro", "casado", "casado", "casado", "solteiro", "casado", "casado", "solteiro", "casado", "casado"),
Inst = c("1o Grau", "1o Grau", "1o Grau", "2o Grau", "1o Grau", "1o Grau", "1o Grau", "1o Grau", "2o Grau", "2o Grau", "2o Grau", "1o Grau", "2o Grau", "1o Grau", "2o Grau", "2o Grau", "2o Grau", "1o Grau", "Superior", "2o Grau", "2o Grau", "2o Grau", "1o Grau", "Superior", "2o Grau", "2o Grau", "1o Grau", "2o Grau", "2o Grau", "2o Grau", "Superior", "2o Grau", "Superior", "Superior", "2o Grau", "Superior"),
Filhos = c(NA, 1, 2, NA, NA, 0, NA, NA, 1, NA, 2, NA, NA, 3, 0, NA, 1, 2, NA, NA, 1, NA, NA, 0, 2, 2, NA, 0, 5, 2, NA, 1, 3, NA, 2, 3),
Salario = c(4, 4.56, 5.25, 5.73, 6.26, 6.66, 6.86, 7.39, 7.59, 7.44, 8.12, 8.46, 8.74, 8.95, 9.13, 9.35, 9.77, 9.8, 10.53, 10.76, 11.06, 11.59, 12, 12.79, 13.23, 13.6, 13.85, 14.69, 14.71, 15.99, 16.22, 16.61, 17.26, 18.75, 19.4, 23.3),
Anos = c(26, 32, 36, 20, 40, 28, 41, 43, 34, 23, 33, 27, 37, 44, 30, 38, 31, 39, 25, 37, 30, 34, 41, 26, 32, 35, 46, 29, 40, 35, 31, 36, 43, 33, 48, 42),
Meses = c(3, 10, 5, 10, 7, 0, 0, 4, 10, 6, 6, 11, 5, 2, 5, 8, 7, 7, 8, 4, 9, 2, 0, 1, 5, 0, 7, 8, 6, 10, 5, 4, 7, 7, 11, 2),
Regiao = c("interior", "capital", "capital", "outro", "outro", "interior", "interior", "capital", "capital", "outro", "interior", "capital", "outro", "outro", "interior", "outro", "capital", "outro", "interior", "interior", "outro", "capital", "outro", "outro", "interior", "outro", "outro", "interior", "interior", "capital", "outro", "interior", "capital", "capital", "capital", "interior")
)
freq_abs_estcivil <- table(dados$Est.civil)
print("Frequência absoluta - Estado Civil:")
## [1] "Frequência absoluta - Estado Civil:"
print(freq_abs_estcivil)
##
## casado solteiro
## 20 16
freq_rel_estcivil <- prop.table(freq_abs_estcivil)
print("Frequência relativa - Estado Civil:")
## [1] "Frequência relativa - Estado Civil:"
print(freq_rel_estcivil)
##
## casado solteiro
## 0.5555556 0.4444444
barplot(freq_abs_estcivil, main = "Frequência Absoluta - Estado Civil", xlab = "Estado Civil", ylab = "Frequência")
pie(freq_abs_estcivil, main = "Distribuição - Estado Civil")
freq_abs_inst <- table(dados$Inst)
print("Frequência absoluta - Grau de Instrução:")
## [1] "Frequência absoluta - Grau de Instrução:"
print(freq_abs_inst)
##
## 1o Grau 2o Grau Superior
## 12 18 6
freq_rel_inst <- prop.table(freq_abs_inst)
print("Frequência relativa - Grau de Instrução:")
## [1] "Frequência relativa - Grau de Instrução:"
print(freq_rel_inst)
##
## 1o Grau 2o Grau Superior
## 0.3333333 0.5000000 0.1666667
barplot(freq_abs_inst, main = "Frequência Absoluta - Grau de Instrução", xlab = "Grau de Instrução", ylab = "Frequência")
pie(freq_abs_inst, main = "Distribuição - Grau de Instrução")
dados_filhos <- dados[!is.na(dados$Filhos), ]
freq_abs_filhos <- table(dados_filhos$Filhos)
print("Frequência absoluta - Número de Filhos:")
## [1] "Frequência absoluta - Número de Filhos:"
print(freq_abs_filhos)
##
## 0 1 2 3 5
## 4 5 7 3 1
freq_rel_filhos <- prop.table(freq_abs_filhos)
print("Frequência relativa - Número de Filhos:")
## [1] "Frequência relativa - Número de Filhos:"
print(freq_rel_filhos)
##
## 0 1 2 3 5
## 0.20 0.25 0.35 0.15 0.05
freq_acum_filhos <- cumsum(freq_rel_filhos)
print("Frequência acumulada - Número de Filhos:")
## [1] "Frequência acumulada - Número de Filhos:"
print(freq_acum_filhos)
## 0 1 2 3 5
## 0.20 0.45 0.80 0.95 1.00
barplot(freq_rel_filhos, main = "Frequência Relativa - Número de Filhos", xlab = "Número de Filhos", ylab = "Frequência Relativa")
plot(freq_acum_filhos, type = "b", main = "Frequência Relativa Acumulada - Número de Filhos", xlab = "Número de Filhos", ylab = "Frequência Relativa Acumulada")
# Com relação ao salário
min_salario <- min(dados$Salario)
max_salario <- max(dados$Salario)
print(paste("Mínimo:", min_salario, "Máximo:", max_salario))
## [1] "Mínimo: 4 Máximo: 23.3"
n <- length(dados$Salario)
k <- ceiling(1 + log2(n))
print(paste("Número de classes:", k))
## [1] "Número de classes: 7"
hist(dados$Salario, breaks = k, main = "Histograma - Salário", xlab = "Salário", ylab = "Frequência")
## Análise cruzada: "estado civil" (Est.civil) e "grau de instrução" (Inst)
tabela_contingencia <- table(dados$Est.civil, dados$Inst)
print("Tabela de contingência - Estado Civil x Grau de Instrução:")
## [1] "Tabela de contingência - Estado Civil x Grau de Instrução:"
print(tabela_contingencia)
##
## 1o Grau 2o Grau Superior
## casado 5 12 3
## solteiro 7 6 3
barplot(tabela_contingencia, beside = TRUE, legend = TRUE, main = "Gráfico de Barras - Estado Civil e Grau de Instrução", xlab = "Grau de Instrução", ylab = "Frequência")
barplot(tabela_contingencia, legend = TRUE, main = "Gráfico de Barras Sobrepostas - Estado Civil e Grau de Instrução", xlab = "Grau de Instrução", ylab = "Frequência")
boxplot(Salario ~ Inst, data = dados, main = "Box-plot - Salário por Grau de Instrução", xlab = "Grau de Instrução", ylab = "Salário")
media_salario_inst <- aggregate(Salario ~ Inst, data = dados, mean)
print("Média do Salário por Grau de Instrução:")
## [1] "Média do Salário por Grau de Instrução:"
print(media_salario_inst)
## Inst Salario
## 1 1o Grau 7.836667
## 2 2o Grau 11.528333
## 3 Superior 16.475000
dp_salario_inst <- aggregate(Salario ~ Inst, data = dados, sd)
print("Desvio Padrão do Salário por Grau de Instrução:")
## [1] "Desvio Padrão do Salário por Grau de Instrução:"
print(dp_salario_inst)
## Inst Salario
## 1 1o Grau 2.956464
## 2 2o Grau 3.715144
## 3 Superior 4.502438
dados$Idade <- dados$Anos + dados$Meses / 12
plot(dados$Idade, dados$Salario, main = "Gráfico de Dispersão - Idade vs Salário", xlab = "Idade", ylab = "Salário")
correlacao <- cor(dados$Idade, dados$Salario)
print(paste("Correlação entre Idade e Salário:", correlacao))
## [1] "Correlação entre Idade e Salário: 0.365139742017794"
media_salario <- mean(dados$Salario)
print(paste("Média do Salário:", media_salario))
## [1] "Média do Salário: 11.1222222222222"
var_salario <- var(dados$Salario)
print(paste("Variância do Salário:", var_salario))
## [1] "Variância do Salário: 21.0447663492063"
sd_salario <- sd(dados$Salario)
print(paste("Desvio Padrão do Salário:", sd_salario))
## [1] "Desvio Padrão do Salário: 4.58745750380386"
mediana_salario <- median(dados$Salario)
print(paste("Mediana do Salário:", mediana_salario))
## [1] "Mediana do Salário: 10.165"
quantis_salario <- quantile(dados$Salario, probs = c(0.25, 0.5, 0.75))
print("Quantis do Salário (25%, 50%, 75%):")
## [1] "Quantis do Salário (25%, 50%, 75%):"
print(quantis_salario)
## 25% 50% 75%
## 7.5525 10.1650 14.0600