# ===========================================================
# 1 Resumo estatístico por raça
# ===========================================================

resumo_raca <- dados2 %>%
  group_by(raca) %>%
  summarise(
    media_salario = mean(salario, na.rm = TRUE),
    media_desempenho = mean(desempenho, na.rm = TRUE),
    media_grau = mean(as.numeric(grau_pagamento), na.rm = TRUE),
    media_idade = mean(idade, na.rm = TRUE),
    media_anos_trabalho = mean(anos_trabalho, na.rm = TRUE),
    n = n()
  )

print(resumo_raca)
## # A tibble: 2 × 7
##   raca       media_salario media_desempenho media_grau media_idade
##   <fct>              <dbl>            <dbl>      <dbl>       <dbl>
## 1 Branco             1661.             6.96       2.17        26.7
## 2 Nao Branco         1410.             5.03       1.52        28.0
## # ℹ 2 more variables: media_anos_trabalho <dbl>, n <int>
# ===========================================================
# 2 Resumo estatístico por sexo
# ===========================================================

resumo_sexo <- dados2 %>%
  group_by(sexo) %>%
  summarise(
    media_salario = mean(salario, na.rm = TRUE),
    media_desempenho = mean(desempenho, na.rm = TRUE),
    media_grau = mean(as.numeric(grau_pagamento), na.rm = TRUE),
    media_idade = mean(idade, na.rm = TRUE),
    media_anos_trabalho = mean(anos_trabalho, na.rm = TRUE),
    n = n()
  )

print(resumo_sexo)
## # A tibble: 2 × 7
##   sexo      media_salario media_desempenho media_grau media_idade
##   <fct>             <dbl>            <dbl>      <dbl>       <dbl>
## 1 Feminino          1546.             6.11       1.85        27.9
## 2 Masculino         1550.             6.08       1.90        26.7
## # ℹ 2 more variables: media_anos_trabalho <dbl>, n <int>
# ===========================================================
#⃣ 3 Gráficos comparativos
# ===========================================================

# Salário por raça
ggplot(dados2, aes(x=raca, y=salario, fill=raca)) +
  geom_boxplot() +
  labs(title="Distribuição de Salário por Raça", y="Salário", x="Raça") +
  theme_minimal()

# Salário por sexo
ggplot(dados2, aes(x=(sexo), y=salario, fill=(sexo))) +
  geom_boxplot() +
  labs(title="Distribuição de Salário por Sexo", y="Salário", x="Sexo") +
  theme_minimal()

# Salário por raça e sexo
ggplot(dados2, aes(x=raca, y=salario, fill=sexo)) +
  geom_boxplot(position=position_dodge(0.8)) +
  labs(title="Salário por Raça e Sexo", y="Salário", x="Raça") +
  theme_minimal()

# ===========================================================
# 4 Teste estatístico: diferença de salário entre raças
# ===========================================================

# Teste t
t_raca <- t.test(salario ~ raca, data=dados2)
print(t_raca)
## 
##  Welch Two Sample t-test
## 
## data:  salario by raca
## t = 6.0002, df = 417.79, p-value = 4.275e-09
## alternative hypothesis: true difference in means between group Branco and group Nao Branco is not equal to 0
## 95 percent confidence interval:
##  168.6443 332.9718
## sample estimates:
##     mean in group Branco mean in group Nao Branco 
##                 1661.126                 1410.317
# Teste t por sexo
t_sexo <- t.test(salario ~ sexo, data=dados2)
print(t_sexo)
## 
##  Welch Two Sample t-test
## 
## data:  salario by sexo
## t = -0.082502, df = 410.1, p-value = 0.9343
## alternative hypothesis: true difference in means between group Feminino and group Masculino is not equal to 0
## 95 percent confidence interval:
##  -90.25158  82.98111
## sample estimates:
##  mean in group Feminino mean in group Masculino 
##                1546.237                1549.872

===========================================================

5 Conclusão

===========================================================