ANALFABETISMO E VOTO

Author

Renato Barreira

PROBLEMA DE PESQUISA:

POSSÍVEIS PERGUNTAS DE PESQUISA:

Há correlação entre % de analfabetos e voto no Lula por município?

Há correlação entre % de analfabetos e abstenções por município?

Há correlação entre % de analfabetos e votos nulos e brancos por município?

Há correlação entre % de analfabetos e votos no Bolsonaro por município?

Como as regiões com maior % de analfabetos votam

Possível hipótese:

Há correlações significativa entre % de analfabetismo e % de votos no Lula. fazendo com que o “analfabeto” seja usado de maneira pejorativa para descredenciar opositores e incitar a militância.

FONTES DOS BANCOS DE DADOS:

SIG(TSE) e SIDRA (IBGE)

PRÉ-PROCESSAMENTO DE DADOS

## MUNICÍPIOS E AFALBETIZAÇÃO
alfabetizacaomunicipio = read.csv("alfabetizacaomunicipio.csv", sep=";")

alfabetizacaomunicipio2 = alfabetizacaomunicipio |>
  mutate(
    UF = str_replace_all(str_extract(Município, "\\(([^)]+)\\)"), "[()]", ""),
    Município = tolower(Município),
    Município = gsub(" \\(.*\\)", "", Município),
    Município = paste0(Município, " (", UF, ")"),
    perc_alfa = round(100 * Alfa / Pop, 2),
    perc_analfa = round(100 * Analfa / Pop, 2)) |>
  select(Cod, UF, everything())
#### ABSTENCOES, NULOS E BRANCOS
Presidente.2022.NuloBrancos = read.csv2("Presidente 2022 NuloBrancos.csv")

nulos = Presidente.2022.NuloBrancos |>
  mutate(
    Município = tolower(Município),
    Município = paste0(Município, " (", UF, ")"),
    nulosbrancos = Votos.nulos + Votos.em.branco,
    pc_nulosbrancos = round(100 * nulosbrancos / Comparecimento, 2)) |>
  select(UF, Município, Comparecimento, pc_comparecimento, Abstenções, pc_abstencoes, Quantitativo.de.votos, Votos.a.concorrentes, pc_votos_concorrentes, pc_votos_nominais, Votos.nulos, pc_votos_nulos, Votos.em.branco, pc_votos_brancos, nulosbrancos, pc_nulosbrancos)
### VOTOS NOMINAIS
votacao_candidato.municipio_2022 = read.csv2("votacao_candidato-municipio_2022.csv")

nominais = votacao_candidato.municipio_2022 |>
  mutate(
    Município = tolower(nm_municipio),
    Município = paste0(Município, " (", sg_uf, ")"),
    UF = sg_uf) |>
  select(UF, Município, nm_urna_candidato, pc_votos_validos, qt_votos_nom_validos)
#### JUNTANDO BD1 E BDLULA

bd1 = left_join(alfabetizacaomunicipio2, nulos, by = c("Município", "UF"))
bd1 = drop_na(bd1)

bdlula = left_join(bd1, nominais, by = c("Município", "UF"))
bdlula = filter(bdlula, nm_urna_candidato == "LULA")
bdlula = drop_na(bdlula)

head(bdlula)
      Cod UF                Município    Pop   Alfa Analfa perc_alfa
1 5200050 GO     abadia de goiás (GO)  14318  13498    820     94.27
2 3100104 MG abadia dos dourados (MG)   5324   4979    345     93.52
3 5200100 GO           abadiânia (GO)  13635  12648    987     92.76
4 3100203 MG              abaeté (MG)  19197  17989   1208     93.71
5 1500107 PA          abaetetuba (PA) 120262 108128  12134     89.91
6 2300101 CE             abaiara (CE)   7810   6001   1809     76.84
  perc_analfa Comparecimento pc_comparecimento Abstenções pc_abstencoes
1        5.73           9258            0.7577       2960        0.2423
2        6.48           4606            0.8072       1100        0.1928
3        7.24           8672            0.8020       2141        0.1980
4        6.29          14188            0.7496       4739        0.2504
5       10.09         100015            0.8359      19640        0.1641
6       23.16           5918            0.8213       1288        0.1787
  Quantitativo.de.votos Votos.a.concorrentes pc_votos_concorrentes
1                  9258                 9011                0.9733
2                  4606                 4378                0.9505
3                  8672                 8380                0.9663
4                 14188                13580                0.9571
5                100015                98299                0.9828
6                  5918                 5693                0.9620
  pc_votos_nominais Votos.nulos pc_votos_nulos Votos.em.branco pc_votos_brancos
1                 1         150              1              97           0.0105
2                 1         156              1              72           0.0156
3                 1         174              1             118           0.0136
4                 1         334              1             274           0.0193
5                 1        1111              1             605           0.0060
6                 1         152              1              73           0.0123
  nulosbrancos pc_nulosbrancos nm_urna_candidato pc_votos_validos
1          247            2.67              LULA           0.4049
2          228            4.95              LULA           0.5089
3          292            3.37              LULA           0.3095
4          608            4.29              LULA           0.4506
5         1716            1.72              LULA           0.7199
6          225            3.80              LULA           0.8554
  qt_votos_nom_validos
1                 3649
2                 2228
3                 2594
4                 6119
5                70766
6                 4870

ANÁLISES

Histograma %Analfabetismo

Histograma % de Abstenções

`geom_smooth()` using formula = 'y ~ x'

Histograma + curva de normaliade (pra availiar o pressuposto de normalidade, portanto não é um teste paramétrico;

Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
ℹ Please use `linewidth` instead.
Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
ℹ Please use `after_stat(density)` instead.

Teste de correlação não paramétrico Spearman.

Warning in cor.test.default(bd1$perc_analfa, bd1$pc_abstencoes, method =
"spearman"): Cannot compute exact p-value with ties

    Spearman's rank correlation rho

data:  bd1$perc_analfa and bd1$pc_abstencoes
S = 2.3342e+10, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho 
0.1790039 

Coeficiente rho (ρ) = 0.179:

Indica uma correlação positiva fraca entre % de analfabetismo e % de abstenções.

Ou seja, à medida que o analfabetismo aumenta, a abstenção tende a aumentar ligeiramente.

Existe uma associação estatisticamente significativa entre as duas variáveis, mas ela não é forte.

Há outros fatores mais determinantes para a abstenção além do analfabetismo.

Visualização com densidade para enfatizar ainda mais a análise

ROBUST LINEAR MODEL - OUTRO TESTE NÃO PARAMÉTRICO


Attaching package: 'MASS'
The following object is masked from 'package:dplyr':

    select

Call: rlm(formula = pc_abstencoes ~ perc_analfa, data = bd1)
Residuals:
       Min         1Q     Median         3Q        Max 
-0.1370710 -0.0315673  0.0004071  0.0308762  0.1889440 

Coefficients:
            Value    Std. Error t value 
(Intercept)   0.1998   0.0012   169.1907
perc_analfa   0.0010   0.0001    11.4779

Residual standard error: 0.0462 on 5544 degrees of freedom

Há uma relação positiva e estatisticamente significativa entre o percentual de analfabetismo e a taxa de abstenção eleitoral.

No entanto, o efeito não é muito forte: um aumento de 10 pontos percentuais em analfabetismo resulta, em média, em apenas 1 ponto percentual a mais de abstenção.

% ANALFABETISMO % NULOS E BRANCOS

`geom_smooth()` using formula = 'y ~ x'

Warning in cor.test.default(bd1$perc_analfa, bd1$pc_nulosbrancos, method =
"spearman"): Cannot compute exact p-value with ties

    Spearman's rank correlation rho

data:  bd1$perc_analfa and bd1$pc_nulosbrancos
S = 2.6975e+10, p-value = 0.0001366
alternative hypothesis: true rho is not equal to 0
sample estimates:
       rho 
0.05119652 

Força da correlação:

ρ (rho) ≈ 0.05 indica quase nenhuma correlação prática.

Existe uma leve tendência de que municípios com maior % de analfabetismo tenham maior % de votos nulos/brancos. Mas a relação é muito fraca — pode ser negligenciada em análises mais interpretativas.

Robust Linear Model


Call: rlm(formula = pc_nulosbrancos ~ perc_analfa, data = bd1)
Residuals:
     Min       1Q   Median       3Q      Max 
-3.12187 -0.92987 -0.05534  0.93329  6.54092 

Coefficients:
            Value    Std. Error t value 
(Intercept)   3.8076   0.0336   113.3004
perc_analfa   0.0167   0.0024     6.9774

Residual standard error: 1.382 on 5544 degrees of freedom

ANÁLISE VOTOS NOMINAIS

Histograma % Votação Lula

Gráfico de Dispersão % Analfabetismo e % Voto Lula

`geom_smooth()` using formula = 'y ~ x'

Teste de Correlação de Spearman


    Spearman's rank correlation rho

data:  bdlula$perc_analfa and bdlula$pc_votos_validos
S = 5277582834, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho 
0.8143706 

Correlação positiva forte: Um valor de rho = 0.81 sugere que quanto maior o percentual de analfabetismo em uma região, maior tende a ser o percentual de votos no Lula.

Significativo: O p-valor muito pequeno indica que essa associação é estatisticamente significativa, ou seja, não é fruto do acaso.

Regressão Linear Robusta


Call: rlm(formula = pc_votos_validos ~ perc_analfa, data = bdlula)
Residuals:
      Min        1Q    Median        3Q       Max 
-0.782116 -0.068112 -0.002054  0.070311  0.469801 

Coefficients:
            Value    Std. Error t value 
(Intercept)   0.3073   0.0026   117.1656
perc_analfa   0.0200   0.0002   106.7124

Residual standard error: 0.1023 on 5544 degrees of freedom

Intercepto (0.3073): Quando o percentual de analfabetismo é zero, o modelo prevê cerca de 30,7% dos votos no Lula.

Coeficiente de perc_analfa (0.0200): Para cada aumento de 1 ponto percentual no analfabetismo, o percentual de votos válidos no Lula aumenta em 2 pontos percentuais, em média, segundo o modelo.

t-valor muito alto (106.71): Forte evidência de que perc_analfa tem efeito estatisticamente significativo no voto no Lula.

Erro padrão pequeno (0.0002): A estimativa do coeficiente é muito precisa.

O modelo robusto confirma e quantifica a forte relação positiva entre analfabetismo e votação no Lula.

Cada aumento de 1% em analfabetismo está associado a um aumento de 2 pontos percentuais nos votos no Lula.

Essa associação permanece mesmo controlando para outliers e influências extremas, o que reforça a robustez do achado.