O Brasil é caracterizado pelas suas desigualdades que, embora tenham sido reduzidas nos últimos anos, ainda tem muito o que avançar. Em 2018 o Índice de Gini, que mede a desigualdade na distribuição de renda dos países; no Brasil, saiu de 0,501 para 0,509, ou seja, a desigualdade de renda subiu. O índice varia de 0 a 1 sendo que quanto mais próximo ao 0 menor a desigualdade na distribuição de renda e quanto mais próximo a 1 maior a desigualdade na distribuição de renda.
Diante disso, Ferreira (1999) elencou que características individuais - inteligência, habilidades adquiridas, riqueza inicial e etc. - nível de educação, experiência profissional, fatores demográficos e a formação dos salários no mercado de trabalho são alguns fatores que podem corroborar para a desigualdade de renda. Além disso, segundo o autor, a desigualdade de renda também pode ser gerada por três formas diferentes, que são elas: discriminação, segmentação e projeção.
O mecanismo de discriminação ocorre quando trabalhadores ocupam o mesmo tipo de trabalho e possuem produtividade idênticas, mas os salários são diferentes. Já a segmentação com veículo da desigualdade de renda ocorre quando trabalhadores idênticos ocupam postos de trabalhos idênticos, mas estão em regiões ou setores diferentes e, consequentemente, recebem salários diferentes. Por fim temos a projeção que aplica diferentes níveis de salários levando em consideração as características de cada trabalhador, como por exemplo a idade e o nível de educação, no momento da entrada no mercado de trabalho.
Diante desse contexto, este trabalhado tem por objetivo analisar a renda dos nordestinos levando em conta as as características físicas, fatores geográficos e sociais.
Para analisar o panorama da renda no nordeste, foi utilizado as variáveis: idade, sexo, cor, região, nível de instrução renda e horas trabalhadas semanalmente.As variáveis foram coletadas da Pesquisa Nacional de Saúde (PNS) do ano de 2013.
Iniciamente foi feito um tratamento no banco de dados. A variável idade foi limitada entre as pessoas com idade entre 14 e 65 anos. A escolha desse horizonte de tempo se deu pelo fato que, segundo o Tribunal Superior do Trabalho (TST), a idade mínima para trabalhar no Brasil é de 14 anos por meio do jovem aprendiz. Por outra via, segundo o Instituto Nacional de Seguridade Social (INSS) a idade mínima para se aposentar por idade é de 65 anos para os homens, o que justifica estabelecer o limite de idade até 65 anos, ou seja, neste intervalo se encontram as pessoas que ainda estão trabalhando.
Para variável renda, foi utilizado o resultado da divisão do rendimento bruto mensal principal dividido pela quantidade de horas trabalhadas semanalmente. A definição da variável salário em termos de rendimento por hora de trabalho gera uma observação mais precisa da diferença entre salários. Duas pessoas podem ganhar salários iguais, mas trabalhando quantidade de horas diferente, ou seja, há uma diferença salarial entre essas duas pessoas. Além disso, foi limitado a renda até cinquenta mil reais.
A variváel cor é estratificada em branca, preta, amarela, parda e indígena. Bem como a variável nível de instruçao é classificada em analfabeto, fundamental completo ou incompleto, médio completo ou incompleto, superior completo ou incompleto. Além disso, as variáveis analisadas são dos indivíduos residentes nos 9 estados do nordeste brasileiro.
Os pacotes utilizados para as análises foram:
library(dplyr)
library(readr)
library(readxl)
library(tidyverse)
library(stringr)
Abertura e manipulação dos dados:
pns1 <- read_csv("C:/Users/vitor/Desktop/Economia/Economia P4/Introdução a econometria/R/pns1.csv") %>%
rename(sexo = c006, idade = c008, horas_trab_sem = e017, renda_bruta_men = e01602, cor = c009, estados = v0001, nivel_insr = vdd004) %>%
filter(idade >= 14 & idade <= 65 & renda_bruta_men <= 50000 & estados >= 21 & estados <= 29)
pns1["renda_hora"] <- pns1$renda_bruta_men/ pns1$horas_trab_sem
Reclassificando as observações de algumas variáveis de acordo com o dicionário:
pns1 <- pns1 %>%
select_all() %>%
mutate(sexo = ifelse(sexo ==1, "H", "M"), cor = ifelse(cor ==1, "Branca",
ifelse(cor == 2,"Preta", ifelse(cor == 3, "Amarela",
ifelse(cor == 4,"Parda", "Indigena")))),
estados = ifelse(estados == 21, "Maranhao",
ifelse(estados == 22,"Piaui", ifelse(estados == 23, "Ceara",
ifelse(estados == 24,"Rio Grande do Norte", ifelse(estados == 25, "Paraiba",
ifelse(estados == 26, "Pernambuco", ifelse(estados == 27, "Alagoas",
ifelse(estados == 28, "Sergipe", "Bahia")))))))))
pns1 <- as_tibble(pns1)
pns1 <- pns1 %>%
select_all() %>%
mutate( nivel_insr = ifelse(nivel_insr ==1, "Sem Instrução",
ifelse(nivel_insr == 2, "Fundamental Incompleto",
ifelse(nivel_insr ==3, "Fundamental Completo",
ifelse(nivel_insr ==4, "Médio Incompleto",
ifelse(nivel_insr == 5, "Médio Completo",
ifelse(nivel_insr ==6, "Superior Incompleto", "Superior Completo")))))),
ifelse(cor ==1, "Branca", ifelse(cor == 2,"Preta",
ifelse(cor == 3, "Amarela", ifelse(cor == 4,"Parda", "Indigena")))))
Visando entender sobre o estado dos dados, foi realizado uma análise descritiva das variáveis analisadas.
summary(pns1$renda_bruta_men)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5 500 680 1179 1200 50000
sd(pns1$renda_bruta_men)
## [1] 1696.316
Observa-se que na amostra a renda mensal mínima foi de 5 e uma renda máxima de 50 mil reais mensal (limite superior estebelecido na metodologia) com uma variabilidade de 1696,32 reais, ou seja, a maior parte das pessoas que compõe a amostra possui uma renda na faixa de 1000 a 2000 reais. A renda média para os estados do nordeste é de 1179 reais por mês, que consiste num valor acima do salário mínimo atual.
summary(pns1$horas_trab_sem)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.00 32.00 40.00 38.79 44.00 120.00
summary(pns1$renda_hora)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.059 14.125 18.500 35.509 33.333 10000.000
Em se tratando de horas trabalhadas semanalmente, tem-se que há pessoas que trabalham apenas um hora por semana e pessoas que trabalham 120 horas por semana. Entretanto , no geral, a maioria trabalha algo em volta de 40 horas semanais. Analisando a renda por hora trabalhada, há pessoas que recebem 59 centavos por hora trabalhada e pessoas que recebem 10 mil reais por hora trabalhada, sendo a remuneração média por hora trabalhada de 35 reais.
pns1 %>%
ggplot() +
geom_point(aes(x = horas_trab_sem, y = renda_bruta_men, size = ),
color = "darkblue") +
labs(x = "Horas Trabalhadas Semanalmente", y = "Renda Mensal (Reais") +
ggtitle(" Gráfico de Disperssão da Renda Mensal por Horas Trabalhadas")
No gráfico de dispersão é possível observar que não há uma relação linear entre a quantidade de horas trabalhadas e a renda mensal. Há alguns outliers de pessoas que trabalham pouco e ganham muito e há um número considerável de pessoas que trabalham muito e ganham pouco.
pns1 %>%
ggplot() +
geom_bar(aes(x = idade), color = "black", fill = "skyblue") +
geom_vline(xintercept = mean(pns1$idade, na.rm = T), color = "orange", lwd = 1.5) +
labs(x = "Idade", y = "Frequência") +
ggtitle("Número de Indivíduos por Idade")
sd(pns1$idade)
## [1] 12.04306
Observa-se que, em média, a idade dos indívduos é de 37 anos como é possível compreender pelo gráfico a concentração maior de pessoas com idade entre 20 e 35 anos. Além disso, há um desvio padrão baixo de aproximadamente 12 anos. Em relação a idade mínima e máxima, como foi dito anteriormente, ficou limitada de pessoa com 14 anos ou mais a pessoas com 65 anos ou menos.
pns1 %>%
select(sexo, horas_trab_sem) %>%
group_by(sexo) %>%
summarise(media_hora_trab = mean(horas_trab_sem)) %>%
ggplot() +
geom_col(aes(x = sexo, y = media_hora_trab, fill = c("Homem", "Mulher")), alpha = 1) +
scale_fill_manual(name = "Sexo:", values = c(Homem = "black", Mulher = "darkred"),
label = c("M", "F")) +
labs(x = "Sexo", y = "Horas") +
ggtitle("Média de Horas Semanais trabalhadas separadas por sexo") +
theme(plot.title = element_text(hjust = 0.5), axis.text.x=element_blank())
#Sexo
summary(as.factor(pns1$sexo))
## H M
## 14579 10536
Verificando que há mais homens que mulheres na amostra e apartir da anáise gráfica de média de horas semanais trabalhadas por sexo, é possível inferir que enquanto os homens trabalham 40 horas semanais em média, as mulheres trabalham 35 horas. Ou seja, as mulheres trabalham por dia útil, em média, 1 hora a menos que os homens.
pns1 %>%
select(idade, horas_trab_sem) %>%
group_by(idade) %>%
summarise(media_hora_trab = mean(horas_trab_sem)) %>%
ggplot() +
geom_col(aes(x = idade, y = media_hora_trab, fill = idade), alpha = 1) +
labs(x = "Idade", y = "Horas") +
ggtitle("Média de Horas Semanais Trabalhadas por Idade") +
theme(plot.title = element_text(hjust = 0.5), axis.text.x=element_blank())
O gráfico de média de horas semanais separados por idade mostra que a quantidade de horas trabalhadas tende a aumentar conforme a idade, porém não é um aumento linear. No período entre 14 e 30 anos se observa que há uma aumento na quantidade de horas trabalhadas porque compreende os indivíduos que estão saindo da condição de jovem aprendiz para um regime de trabalho comum que incorre em mais horas quando comparado a quantidade de horas trabalhadas quando jovem aprendiz. Mas a quantidade de horas trabalhadas semanalmente, em média, não tá tanta variação.
pns1 %>%
select(estados, renda_bruta_men) %>%
group_by(estados) %>%
summarise(renda_media = mean(renda_bruta_men)) %>%
ggplot() +
geom_bar(aes(x = estados, y = renda_media, fill = estados),
stat="identity", position = "dodge") +
labs(x = "Estados Nordestinos", y = "Renda Média",
title = "Renda Média por Estado") +
theme(plot.title = element_text(hjust = 0.5), axis.text.x=element_blank())
Foi analisada também a renda média (bruta) por estados nordestinos. A Paraíba ficou na posição de maior renda média, sendo seguido com uma pequena diferença por Pernambuco. O Piauí ficou com a última colocação entre os 9 estados. Vale salientar que todos os estados possuem um renda média superior a 1000 reais, mas inferior a 2000 reais, ou seja, é renda média próximo ao salário mínimo atual.
pns1 %>%
select(cor, renda_bruta_men) %>%
group_by(cor) %>%
summarise(renda_media = mean(renda_bruta_men)) %>%
ggplot() +
geom_bar(aes(x = cor, y = renda_media, fill = cor),
stat="identity", position = "dodge") +
labs(x = "Cor", y = "Renda Média",
title = "Renda Média por Cor") +
theme(plot.title = element_text(hjust = 0.5), axis.text.x=element_blank())
summary(as.factor(pns1$cor))
## Amarela Branca Indigena Parda Preta
## 192 6950 157 14857 2959
Um fator relevante para a análise foi também a renda média por cor. Percebe-se que há uma discrepância entre a cor branca e o restante das outras cores. Em média, trabalhadores nordestinos de cor branca tem renda acima de 1500, enquanto trabalhadores de outras cores recebem média de 1000. Pretos e pardos, que juntos representam a maioria da amostra, possuem quase o mesmo nível médio de renda próximo aos 1000 reais.
pns1 %>%
select_all() %>%
group_by(nivel_insr) %>%
summarise(renda_h_media = mean(renda_hora)) %>%
ggplot() +
geom_bar(aes(x = nivel_insr, y = renda_h_media, fill = nivel_insr),
stat = "identity", position = "dodge") +
scale_x_discrete(
limits = c("Sem Instrução", "Fundamental Incompleto", "Fundamental Completo", "Médio Incompleto", "Médio Completo", "Superior Incompleto", "Superior Completo"))+
labs (x = "Nível de Instrução", y = "Média da Renda por Hora", fill = "Nível de Instrução", title = "Renda por Hora Trabalhada por Nivel de Instrução") +
theme(plot.title = element_text(hjust = 0.5), axis.text.x=element_blank())
No que tange ao nível de instrução, observa-se que quanto maior o nível de instrução maior o nível de renda, como é de se esperar. Além disso, o que chama a atenção é a discrepância entre quem tem ensino superior com quem não tem no que tange a remuneração por hora trabalhadas.
Em consonância com o objetivo proposto, observa-se que há uma grande diferença salarial no quesito cor ou raça e no quesito relacionado ao nível de instrução. Além disso, a renda média dos estados nordestinos não variam muito e a Paraíba lidera com a maior renda média quando comparada aos demais estados. Por fim, tem-se que a quantidade média de horas trabalhadas semanalmente não varia ao longos dos anos. Dessa forma, a renda nordestina possui características distintas no que compete as diferenças sociais, geográficas e físicas.
G1. (23 de 02 de 2020). g1.com.br. Fonte: G1 Notícias: https://g1.globo.com/economia/noticia/2019/10/16/concentracao-de-rendavoltaa-crescer-no-brasil-em-2018-diz-ibge.ghtml
Ferreira, F. H. (12 de Agosto de 1999). Os determiantes para a desigualdade de renda no Brasil: Luta de classes ou heterogeneidade educacional? Seminário sobre Desigualdade e Pobreza.
UOL. (27 de Dezembro de 2019). economia.uol.com.br. Fonte: UOL: https://economia.uol.com.br/noticias/redacao/2019/12/27/aposentadoriaregrasinss-e-previdencia-social.htm