Introdução

Neste relatório pretende-se analisar a relação entre a desigualdade de renda e índices educacionais nos municípios brasileiros.

Para isso, o índice GINI foi selecionado para a medição de desigualdade. Segundo o Atlas Brasil, o índice GINI mede o grau de desigualdade existente na distribuição de indivíduos segundo a renda domiciliar per capita. Seu valor varia de 0, quando não há desigualdade (a renda domiciliar per capita de todos os indivíduos tem o mesmo valor), a 1, quando a desigualdade é máxima (apenas um indivíduo detém toda a renda).O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes.

Já os índices educacionais selecionados foram o IDEB dos anos finais e o IDHM Educação.

#1. carregar pacotes e dados

library(tidyverse) 
## -- Attaching packages --------------------------------------- tidyverse 1.3.2 --
## v ggplot2 3.4.0     v purrr   1.0.1
## v tibble  3.1.8     v dplyr   1.1.0
## v tidyr   1.3.0     v stringr 1.5.0
## v readr   2.1.3     v forcats 1.0.0
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library (readxl) 
library(esquisse)

#2. importar dados

registro_mun <- read_excel("../dados/DOWNLOAD REGISTRO ADMINISTRATIVO TOTAL 2012 A 2017.xlsx", 
                           sheet = "MUNICÍPIO")
censo_mun <- read_excel("../dados/Atlas 2013_municipal, estadual e Brasil.xlsx", 
                        sheet = "MUN 91-00-10")
# 3. Selecionar e modificar variáveis em censo_mun
# Criar uma variável com o município por 
# classe de tamanho de população
# classe de tamanho da população Total IBGE
# 
# Até 5.000 
# 5.001 a 20.000 
# 20.001 a 100.000 
# 100.001 a 500.000 
# Mais de 500.000
#
# Classificação ONU para IDH e IDHM
# Muito baixo: 0 a 04,99. 
# Baixo: 0,500 a 0,599. 
# Médio: 0,600 a 0,699. 
# Alto: 0,700 a 0,799. 
# Muito alto: 0,800 a 1.
#
# Criar a variávei Taxa de Urbanização

censo_mun |>
  select(ANO, UF, GINI , T_CRIFUNDIN_TODOS , Codmun7, Município, IDHM, IDHM_E, IDHM_L, IDHM_R, POP, pesotot, pesourb, pesoRUR) %>%
  mutate(classe_pop = case_when(
    (POP < 5001) ~ "1) Até 5.000",
    (POP > 5000 & POP < 20001) ~ "2) 5.001 a 20.000",
    (POP > 20000 & POP < 100000) ~ "3) 20.001 a 100.000",
    (POP > 100000 & POP < 500000) ~ "4) 100.001 a 500.000",
    (POP > 500000) ~ "5) Mais de 500.000",
  )) |>
  mutate(classe_idhm = case_when(
    (IDHM < 0.5) ~ "Muito baixo",
    (IDHM >= 0.5 & IDHM < 0.6) ~ "Baixo",
    (IDHM >= 0.6 & IDHM < 0.7) ~ "Médio",
    (IDHM >= 0.7 & IDHM < 0.8) ~ "Alto",
    (IDHM >= 0.8) ~ "Muito Alto",
  )) |>
  mutate(taxa_urbanizacao = (pesourb / pesotot) * 100) |>
  mutate(urbano_rural = case_when(
    (taxa_urbanizacao >= 50) ~ "Urbano",
    (taxa_urbanizacao < 50) ~ "Rural")) -> m1_censo_mun

# Selecionar as variáveis em registro_mun
m1_regist_mun <- registro_mun |>
  select(ANO, NOME, IBGE7, IDEB_AI, IDEB_AF)

# filtrar anos em m1_censo_mun e m1_regist_mun
m1_censo_mun |>
  filter(ANO == 2010) -> c2_2010
m1_regist_mun |>
  filter(ANO == 2013) -> r2_2013

# juntar tabelas pela chave do código do município de sete # dígitos do IBGE
c2_2010 |>
  full_join(r2_2013, by = c("Codmun7"="IBGE7")) |>
  na.omit() -> j1_censo_reg    # elimina os casos omissos

Análise dos indicadores

O gráfico de dispersão abaixo mostra a relação entre o IDHM-E (eixo X), o IDEB-AF (eixo), o índice GINI (cor) e a população dos municípios brasileiros (tamanho dos pontos), divididos entre aqueles predominantemente urbanos ou rurais.

library(ggplot2)
ggplot(j1_censo_reg) + aes(x = IDHM_E, y = IDEB_AF, colour = GINI, size = POP) + geom_point(shape = "circle") + scale_color_distiller(palette = "Paired", direction = 1) + theme_minimal() + facet_wrap(vars(urbano_rural))

Pode-se verificar que, em relação ao índice GINI, a maioria dos municípios se encontra próximo ao valor de 0.5, de cor verde, no gráfico.

Quanto à relação entre o índice GINI e os índices de educação, pode-se observar que os municípios com GINI mais próximo à 1, ou seja, mais desiguais, tendem a ter menores índices de IDEB-AF.

Nos municípios rurais isto se reflete também em menores índices de IDHM-E. Já nos municípios urbanos, verifica-se que há mais municípios mais populosos que possuem alto índice GINI alto e IDHM-E também alto.

Conclusão

Pode-se concluir que o índice GINI, de desigualdade de renda, tem maior relação com o índice IDEB-AF nos municípios rurais.

Nos municípios urbanos, observou-se que o tamanho da população pode ser uma influência maior no índice IDHM-E do que o índice GINI.

Uma possibilidade de aprofundamento seria a investigação de quais fatores fazem com que os municípios rurais com mais desigualdade tenham um pior desempenho no ìndice de IDEB-AF.