Queremos entender, se no Brasil, existe diferença nos rendimentos de acordo com o gênero. Para tanto, puxaremos os dados da PNAD contínua, no primeiro trimestre de 2024 para esta comparação.

Utilizaremos os pacotes PNADcIBGE para extração dos dados e o survey para análises rápidas.

Pacote PNADcIBGE

citation("PNADcIBGE")
## Para citar o pacote 'PNADcIBGE' em publicações use:
## 
##   Braga D, Assuncao G (2024). _PNADcIBGE: Downloading, Reading and
##   Analyzing PNADC Microdata_. R package version 0.7.5,
##   <https://CRAN.R-project.org/package=PNADcIBGE>.
## 
## Uma entrada BibTeX para usuários(as) de LaTeX é
## 
##   @Manual{,
##     title = {PNADcIBGE: Downloading, Reading and Analyzing PNADC Microdata},
##     author = {Douglas Braga and Gabriel Assuncao},
##     year = {2024},
##     note = {R package version 0.7.5},
##     url = {https://CRAN.R-project.org/package=PNADcIBGE},
##   }

Seleção das variáveis de interesse:

UF: Unidade da Federação

V2007: Gênero

VD4020: Rendimento mensal efetivo de todos os trabalhos para pessoas de 14 anos ou mais de idade (apenas para pessoas que receberam em dinheiro, produtos ou mercadorias em qualquer trabalho)

variaveis <- c("UF","V2007","VD4020")

Puxando as variáveis selecionadas da PNAD no primeiro trimestre de 2024

Função get_pnadc:

Extrai os dados do FTP do IBGE para o ano e trimestre desejados
Você pode selecionar o ano, o trimestre e as suas variáveis de interesse

dadosPNADc <- get_pnadc(year=2024, quarter=1, vars=variaveis)

Pacote survey

citation("survey")
## To cite the survey package in publications use one or more of:
## 
##   T. Lumley (2024) "survey: analysis of complex survey samples". R
##   package version 4.4.
## 
##   T. Lumley (2004) Analysis of complex survey samples. Journal of
##   Statistical Software 9(1): 1-19
## 
##   T. Lumley (2010) Complex Surveys: A Guide to Analysis Using R. John
##   Wiley and Sons.
## 
## To see these entries in BibTeX format, use 'print(<citation>,
## bibtex=TRUE)', 'toBibtex(.)', or set
## 'options(citation.bibtex.max=999)'.

Análise de alguns dados de interesse:

Média de rendimento por gênero

renda_genero <- svyby(formula=~VD4020, by=~V2007, design=dadosPNADc, FUN=svymean, na.rm=TRUE)
print(renda_genero)
##         V2007   VD4020       se
## Homem   Homem 3704.642 39.38043
## Mulher Mulher 2977.267 29.10057

Como era de se esperar, no Brasil como um todo, vemos que o rendimento médio é maior para homens, com 3705 reais mensais, do que para mulheres, com 2978 reais mensais.

Teste t de student para comparação das duas médias

svyttest(formula=VD4020~V2007, design=dadosPNADc)
## 
##  Design-based t-test
## 
## data:  VD4020 ~ V2007
## t = -25.924, df = 198, p-value < 2.2e-16
## alternative hypothesis: true difference in mean is not equal to 0
## 95 percent confidence interval:
##  -782.7062 -672.0431
## sample estimates:
## difference in mean 
##          -727.3746

A diferença estimada pontual encontrada foi de -727 reais para as mulheres, sendo, no mínimo, de -672 reais.

Gráfico

renda_genero$V2007 <- factor(renda_genero$V2007, labels = c("Homem", "Mulher"))
ggplot(renda_genero, aes(x = V2007, y = VD4020)) +
  geom_bar(stat = "identity", fill = c("blue", "pink")) +
  geom_text(aes(label = round(VD4020, 2)), vjust = -0.5) +
  labs(title = "Média de Redimento por Gênero", x = "Gênero", y = "Média de Rendimento") +
  theme_minimal()

Média de rendimento por UF

renda_uf <- svyby(formula=~VD4020, by=~UF, design=dadosPNADc, FUN=svymean, na.rm=TRUE)
print(renda_uf)
##                                      UF   VD4020        se
## Rondônia                       Rondônia 2808.294  97.42839
## Acre                               Acre 2615.672 101.36287
## Amazonas                       Amazonas 2444.831 134.06138
## Roraima                         Roraima 2864.398 199.11480
## Pará                               Pará 2535.126 102.01893
## Amapá                             Amapá 2753.699 135.90293
## Tocantins                     Tocantins 2860.244 114.48413
## Maranhão                       Maranhão 1915.668  64.60470
## Piauí                             Piauí 2423.287 237.49868
## Ceará                             Ceará 2101.949  70.30131
## Rio Grande do Norte Rio Grande do Norte 2692.160 158.17328
## Paraíba                         Paraíba 2462.221 140.29604
## Pernambuco                   Pernambuco 2234.423  82.79857
## Alagoas                         Alagoas 2326.867 153.54748
## Sergipe                         Sergipe 2438.318 138.90654
## Bahia                             Bahia 2255.585 101.39516
## Minas Gerais               Minas Gerais 3207.446  88.99081
## Espírito Santo           Espírito Santo 3363.993 112.90296
## Rio de Janeiro           Rio de Janeiro 4034.424  96.20719
## São Paulo                     São Paulo 4165.757 116.95937
## Paraná                           Paraná 3687.395  76.86375
## Santa Catarina           Santa Catarina 3696.488  66.41537
## Rio Grande do Sul     Rio Grande do Sul 3767.567  73.04560
## Mato Grosso do Sul   Mato Grosso do Sul 3646.952 135.70951
## Mato Grosso                 Mato Grosso 3737.640 112.95544
## Goiás                             Goiás 3345.459 106.56724
## Distrito Federal       Distrito Federal 5613.150 251.14513

Mapa do Brasil com a média de rendimento por UF

ggplot(data = mapa_brasil) +
  geom_sf(aes(fill = VD4020), color = "black") +
  scale_fill_viridis_c(option = "viridis", na.value = "white") +
  labs(title = "Média de Renda por Estado no Brasil - 1º Trimestre de 2024",
       fill = "Média de Renda") +
  theme_minimal() +
  geom_text(aes(x = longitude, y = latitude, label = round(VD4020)), 
            size = 2.5, 
            color = "white")

Quando analisamos os rendimentos médios por estado, verificamos que o estado com menor rendimento, independente do gênero, é Maranhão, com 1916,00, enquanto o estado com maior rendimento é o Distrito Federal, com 5613,00, com uma diferença média de 3697 entre eles.