Queremos entender, se no Brasil, existe diferença nos rendimentos de acordo com o gênero. Para tanto, puxaremos os dados da PNAD contínua, no primeiro trimestre de 2024 para esta comparação.
Utilizaremos os pacotes PNADcIBGE para extração dos dados e o survey para análises rápidas.
citation("PNADcIBGE")
## Para citar o pacote 'PNADcIBGE' em publicações use:
##
## Braga D, Assuncao G (2024). _PNADcIBGE: Downloading, Reading and
## Analyzing PNADC Microdata_. R package version 0.7.5,
## <https://CRAN.R-project.org/package=PNADcIBGE>.
##
## Uma entrada BibTeX para usuários(as) de LaTeX é
##
## @Manual{,
## title = {PNADcIBGE: Downloading, Reading and Analyzing PNADC Microdata},
## author = {Douglas Braga and Gabriel Assuncao},
## year = {2024},
## note = {R package version 0.7.5},
## url = {https://CRAN.R-project.org/package=PNADcIBGE},
## }
UF: Unidade da Federação
V2007: Gênero
VD4020: Rendimento mensal efetivo de todos os trabalhos para pessoas de 14 anos ou mais de idade (apenas para pessoas que receberam em dinheiro, produtos ou mercadorias em qualquer trabalho)
variaveis <- c("UF","V2007","VD4020")
Função get_pnadc:
Extrai os dados do FTP do IBGE para o ano e trimestre desejados
Você pode selecionar o ano, o trimestre e as suas variáveis de
interesse
dadosPNADc <- get_pnadc(year=2024, quarter=1, vars=variaveis)
citation("survey")
## To cite the survey package in publications use one or more of:
##
## T. Lumley (2024) "survey: analysis of complex survey samples". R
## package version 4.4.
##
## T. Lumley (2004) Analysis of complex survey samples. Journal of
## Statistical Software 9(1): 1-19
##
## T. Lumley (2010) Complex Surveys: A Guide to Analysis Using R. John
## Wiley and Sons.
##
## To see these entries in BibTeX format, use 'print(<citation>,
## bibtex=TRUE)', 'toBibtex(.)', or set
## 'options(citation.bibtex.max=999)'.
Média de rendimento por gênero
renda_genero <- svyby(formula=~VD4020, by=~V2007, design=dadosPNADc, FUN=svymean, na.rm=TRUE)
print(renda_genero)
## V2007 VD4020 se
## Homem Homem 3704.642 39.38043
## Mulher Mulher 2977.267 29.10057
Como era de se esperar, no Brasil como um todo, vemos que o rendimento médio é maior para homens, com 3705 reais mensais, do que para mulheres, com 2978 reais mensais.
Teste t de student para comparação das duas médias
svyttest(formula=VD4020~V2007, design=dadosPNADc)
##
## Design-based t-test
##
## data: VD4020 ~ V2007
## t = -25.924, df = 198, p-value < 2.2e-16
## alternative hypothesis: true difference in mean is not equal to 0
## 95 percent confidence interval:
## -782.7062 -672.0431
## sample estimates:
## difference in mean
## -727.3746
A diferença estimada pontual encontrada foi de -727 reais para as mulheres, sendo, no mínimo, de -672 reais.
Gráfico
renda_genero$V2007 <- factor(renda_genero$V2007, labels = c("Homem", "Mulher"))
ggplot(renda_genero, aes(x = V2007, y = VD4020)) +
geom_bar(stat = "identity", fill = c("blue", "pink")) +
geom_text(aes(label = round(VD4020, 2)), vjust = -0.5) +
labs(title = "Média de Redimento por Gênero", x = "Gênero", y = "Média de Rendimento") +
theme_minimal()
Média de rendimento por UF
renda_uf <- svyby(formula=~VD4020, by=~UF, design=dadosPNADc, FUN=svymean, na.rm=TRUE)
print(renda_uf)
## UF VD4020 se
## Rondônia Rondônia 2808.294 97.42839
## Acre Acre 2615.672 101.36287
## Amazonas Amazonas 2444.831 134.06138
## Roraima Roraima 2864.398 199.11480
## Pará Pará 2535.126 102.01893
## Amapá Amapá 2753.699 135.90293
## Tocantins Tocantins 2860.244 114.48413
## Maranhão Maranhão 1915.668 64.60470
## Piauí Piauí 2423.287 237.49868
## Ceará Ceará 2101.949 70.30131
## Rio Grande do Norte Rio Grande do Norte 2692.160 158.17328
## Paraíba Paraíba 2462.221 140.29604
## Pernambuco Pernambuco 2234.423 82.79857
## Alagoas Alagoas 2326.867 153.54748
## Sergipe Sergipe 2438.318 138.90654
## Bahia Bahia 2255.585 101.39516
## Minas Gerais Minas Gerais 3207.446 88.99081
## Espírito Santo Espírito Santo 3363.993 112.90296
## Rio de Janeiro Rio de Janeiro 4034.424 96.20719
## São Paulo São Paulo 4165.757 116.95937
## Paraná Paraná 3687.395 76.86375
## Santa Catarina Santa Catarina 3696.488 66.41537
## Rio Grande do Sul Rio Grande do Sul 3767.567 73.04560
## Mato Grosso do Sul Mato Grosso do Sul 3646.952 135.70951
## Mato Grosso Mato Grosso 3737.640 112.95544
## Goiás Goiás 3345.459 106.56724
## Distrito Federal Distrito Federal 5613.150 251.14513
Mapa do Brasil com a média de rendimento por UF
ggplot(data = mapa_brasil) +
geom_sf(aes(fill = VD4020), color = "black") +
scale_fill_viridis_c(option = "viridis", na.value = "white") +
labs(title = "Média de Renda por Estado no Brasil - 1º Trimestre de 2024",
fill = "Média de Renda") +
theme_minimal() +
geom_text(aes(x = longitude, y = latitude, label = round(VD4020)),
size = 2.5,
color = "white")
Quando analisamos os rendimentos médios por estado, verificamos que o estado com menor rendimento, independente do gênero, é Maranhão, com 1916,00, enquanto o estado com maior rendimento é o Distrito Federal, com 5613,00, com uma diferença média de 3697 entre eles.