# ===========================================================
# 1 Resumo estatístico por raça
# ===========================================================
resumo_raca <- dados2 %>%
group_by(raca) %>%
summarise(
media_salario = mean(salario, na.rm = TRUE),
media_desempenho = mean(desempenho, na.rm = TRUE),
media_grau = mean(as.numeric(grau_pagamento), na.rm = TRUE),
media_idade = mean(idade, na.rm = TRUE),
media_anos_trabalho = mean(anos_trabalho, na.rm = TRUE),
n = n()
)
print(resumo_raca)
## # A tibble: 2 × 7
## raca media_salario media_desempenho media_grau media_idade
## <fct> <dbl> <dbl> <dbl> <dbl>
## 1 Branco 1661. 6.96 2.17 26.7
## 2 Nao Branco 1410. 5.03 1.52 28.0
## # ℹ 2 more variables: media_anos_trabalho <dbl>, n <int>
# ===========================================================
# 2 Resumo estatístico por sexo
# ===========================================================
resumo_sexo <- dados2 %>%
group_by(sexo) %>%
summarise(
media_salario = mean(salario, na.rm = TRUE),
media_desempenho = mean(desempenho, na.rm = TRUE),
media_grau = mean(as.numeric(grau_pagamento), na.rm = TRUE),
media_idade = mean(idade, na.rm = TRUE),
media_anos_trabalho = mean(anos_trabalho, na.rm = TRUE),
n = n()
)
print(resumo_sexo)
## # A tibble: 2 × 7
## sexo media_salario media_desempenho media_grau media_idade
## <fct> <dbl> <dbl> <dbl> <dbl>
## 1 Feminino 1546. 6.11 1.85 27.9
## 2 Masculino 1550. 6.08 1.90 26.7
## # ℹ 2 more variables: media_anos_trabalho <dbl>, n <int>
# ===========================================================
#⃣ 3 Gráficos comparativos
# ===========================================================
# Salário por raça
ggplot(dados2, aes(x=raca, y=salario, fill=raca)) +
geom_boxplot() +
labs(title="Distribuição de Salário por Raça", y="Salário", x="Raça") +
theme_minimal()

# Salário por sexo
ggplot(dados2, aes(x=(sexo), y=salario, fill=(sexo))) +
geom_boxplot() +
labs(title="Distribuição de Salário por Sexo", y="Salário", x="Sexo") +
theme_minimal()

# Salário por raça e sexo
ggplot(dados2, aes(x=raca, y=salario, fill=sexo)) +
geom_boxplot(position=position_dodge(0.8)) +
labs(title="Salário por Raça e Sexo", y="Salário", x="Raça") +
theme_minimal()

# ===========================================================
# 4 Teste estatístico: diferença de salário entre raças
# ===========================================================
# Teste t
t_raca <- t.test(salario ~ raca, data=dados2)
print(t_raca)
##
## Welch Two Sample t-test
##
## data: salario by raca
## t = 6.0002, df = 417.79, p-value = 4.275e-09
## alternative hypothesis: true difference in means between group Branco and group Nao Branco is not equal to 0
## 95 percent confidence interval:
## 168.6443 332.9718
## sample estimates:
## mean in group Branco mean in group Nao Branco
## 1661.126 1410.317
# Teste t por sexo
t_sexo <- t.test(salario ~ sexo, data=dados2)
print(t_sexo)
##
## Welch Two Sample t-test
##
## data: salario by sexo
## t = -0.082502, df = 410.1, p-value = 0.9343
## alternative hypothesis: true difference in means between group Feminino and group Masculino is not equal to 0
## 95 percent confidence interval:
## -90.25158 82.98111
## sample estimates:
## mean in group Feminino mean in group Masculino
## 1546.237 1549.872
===========================================================
5 Conclusão
===========================================================
- Por raça: Existe diferença significativa no salário
entre Brancos e Não Brancos (p < 0,001). Brancos têm média salarial
maior (~1661) do que Não Brancos (~1410).
- Por sexo: Não há diferença significativa de salário
entre Masculino e Feminino (p ≈ 0,93), indicando que gênero não é fator
determinante nos salários deste conjunto de dados.
- Resumo geral: Raça parece ter efeito sobre salário
e desempenho, enquanto sexo não apresenta impacto estatístico
relevante.