## MUNICÍPIOS E AFALBETIZAÇÃO
= read.csv("alfabetizacaomunicipio.csv", sep=";")
alfabetizacaomunicipio
= alfabetizacaomunicipio |>
alfabetizacaomunicipio2 mutate(
UF = str_replace_all(str_extract(Município, "\\(([^)]+)\\)"), "[()]", ""),
= tolower(Município),
Município = gsub(" \\(.*\\)", "", Município),
Município = paste0(Município, " (", UF, ")"),
Município perc_alfa = round(100 * Alfa / Pop, 2),
perc_analfa = round(100 * Analfa / Pop, 2)) |>
select(Cod, UF, everything())
ANALFABETISMO E VOTO
PROBLEMA DE PESQUISA:
POSSÍVEIS PERGUNTAS DE PESQUISA:
Há correlação entre % de analfabetos e voto no Lula por município?
Há correlação entre % de analfabetos e abstenções por município?
Há correlação entre % de analfabetos e votos nulos e brancos por município?
Há correlação entre % de analfabetos e votos no Bolsonaro por município?
Como as regiões com maior % de analfabetos votam
Possível hipótese:
Há correlações significativa entre % de analfabetismo e % de votos no Lula. fazendo com que o “analfabeto” seja usado de maneira pejorativa para descredenciar opositores e incitar a militância.
FONTES DOS BANCOS DE DADOS:
SIG(TSE) e SIDRA (IBGE)
PRÉ-PROCESSAMENTO DE DADOS
#### ABSTENCOES, NULOS E BRANCOS
2022.NuloBrancos = read.csv2("Presidente 2022 NuloBrancos.csv")
Presidente.
= Presidente.2022.NuloBrancos |>
nulos mutate(
= tolower(Município),
Município = paste0(Município, " (", UF, ")"),
Município nulosbrancos = Votos.nulos + Votos.em.branco,
pc_nulosbrancos = round(100 * nulosbrancos / Comparecimento, 2)) |>
select(UF, Município, Comparecimento, pc_comparecimento, Abstenções, pc_abstencoes, Quantitativo.de.votos, Votos.a.concorrentes, pc_votos_concorrentes, pc_votos_nominais, Votos.nulos, pc_votos_nulos, Votos.em.branco, pc_votos_brancos, nulosbrancos, pc_nulosbrancos)
### VOTOS NOMINAIS
= read.csv2("votacao_candidato-municipio_2022.csv")
votacao_candidato.municipio_2022
= votacao_candidato.municipio_2022 |>
nominais mutate(
= tolower(nm_municipio),
Município = paste0(Município, " (", sg_uf, ")"),
Município UF = sg_uf) |>
select(UF, Município, nm_urna_candidato, pc_votos_validos, qt_votos_nom_validos)
#### JUNTANDO BD1 E BDLULA
= left_join(alfabetizacaomunicipio2, nulos, by = c("Município", "UF"))
bd1 = drop_na(bd1)
bd1
= left_join(bd1, nominais, by = c("Município", "UF"))
bdlula = filter(bdlula, nm_urna_candidato == "LULA")
bdlula = drop_na(bdlula)
bdlula
head(bdlula)
Cod UF Município Pop Alfa Analfa perc_alfa
1 5200050 GO abadia de goiás (GO) 14318 13498 820 94.27
2 3100104 MG abadia dos dourados (MG) 5324 4979 345 93.52
3 5200100 GO abadiânia (GO) 13635 12648 987 92.76
4 3100203 MG abaeté (MG) 19197 17989 1208 93.71
5 1500107 PA abaetetuba (PA) 120262 108128 12134 89.91
6 2300101 CE abaiara (CE) 7810 6001 1809 76.84
perc_analfa Comparecimento pc_comparecimento Abstenções pc_abstencoes
1 5.73 9258 0.7577 2960 0.2423
2 6.48 4606 0.8072 1100 0.1928
3 7.24 8672 0.8020 2141 0.1980
4 6.29 14188 0.7496 4739 0.2504
5 10.09 100015 0.8359 19640 0.1641
6 23.16 5918 0.8213 1288 0.1787
Quantitativo.de.votos Votos.a.concorrentes pc_votos_concorrentes
1 9258 9011 0.9733
2 4606 4378 0.9505
3 8672 8380 0.9663
4 14188 13580 0.9571
5 100015 98299 0.9828
6 5918 5693 0.9620
pc_votos_nominais Votos.nulos pc_votos_nulos Votos.em.branco pc_votos_brancos
1 1 150 1 97 0.0105
2 1 156 1 72 0.0156
3 1 174 1 118 0.0136
4 1 334 1 274 0.0193
5 1 1111 1 605 0.0060
6 1 152 1 73 0.0123
nulosbrancos pc_nulosbrancos nm_urna_candidato pc_votos_validos
1 247 2.67 LULA 0.4049
2 228 4.95 LULA 0.5089
3 292 3.37 LULA 0.3095
4 608 4.29 LULA 0.4506
5 1716 1.72 LULA 0.7199
6 225 3.80 LULA 0.8554
qt_votos_nom_validos
1 3649
2 2228
3 2594
4 6119
5 70766
6 4870
ANÁLISES
Histograma %Analfabetismo
Histograma % de Abstenções
`geom_smooth()` using formula = 'y ~ x'
Histograma + curva de normaliade (pra availiar o pressuposto de normalidade, portanto não é um teste paramétrico;
Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
ℹ Please use `linewidth` instead.
Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
ℹ Please use `after_stat(density)` instead.
Teste de correlação não paramétrico Spearman.
Warning in cor.test.default(bd1$perc_analfa, bd1$pc_abstencoes, method =
"spearman"): Cannot compute exact p-value with ties
Spearman's rank correlation rho
data: bd1$perc_analfa and bd1$pc_abstencoes
S = 2.3342e+10, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.1790039
Coeficiente rho (ρ) = 0.179:
Indica uma correlação positiva fraca entre % de analfabetismo e % de abstenções.
Ou seja, à medida que o analfabetismo aumenta, a abstenção tende a aumentar ligeiramente.
Existe uma associação estatisticamente significativa entre as duas variáveis, mas ela não é forte.
Há outros fatores mais determinantes para a abstenção além do analfabetismo.
Visualização com densidade para enfatizar ainda mais a análise
ROBUST LINEAR MODEL - OUTRO TESTE NÃO PARAMÉTRICO
Attaching package: 'MASS'
The following object is masked from 'package:dplyr':
select
Call: rlm(formula = pc_abstencoes ~ perc_analfa, data = bd1)
Residuals:
Min 1Q Median 3Q Max
-0.1370710 -0.0315673 0.0004071 0.0308762 0.1889440
Coefficients:
Value Std. Error t value
(Intercept) 0.1998 0.0012 169.1907
perc_analfa 0.0010 0.0001 11.4779
Residual standard error: 0.0462 on 5544 degrees of freedom
Há uma relação positiva e estatisticamente significativa entre o percentual de analfabetismo e a taxa de abstenção eleitoral.
No entanto, o efeito não é muito forte: um aumento de 10 pontos percentuais em analfabetismo resulta, em média, em apenas 1 ponto percentual a mais de abstenção.
% ANALFABETISMO % NULOS E BRANCOS
`geom_smooth()` using formula = 'y ~ x'
Warning in cor.test.default(bd1$perc_analfa, bd1$pc_nulosbrancos, method =
"spearman"): Cannot compute exact p-value with ties
Spearman's rank correlation rho
data: bd1$perc_analfa and bd1$pc_nulosbrancos
S = 2.6975e+10, p-value = 0.0001366
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.05119652
Força da correlação:
ρ (rho) ≈ 0.05 indica quase nenhuma correlação prática.
Existe uma leve tendência de que municípios com maior % de analfabetismo tenham maior % de votos nulos/brancos. Mas a relação é muito fraca — pode ser negligenciada em análises mais interpretativas.
Robust Linear Model
Call: rlm(formula = pc_nulosbrancos ~ perc_analfa, data = bd1)
Residuals:
Min 1Q Median 3Q Max
-3.12187 -0.92987 -0.05534 0.93329 6.54092
Coefficients:
Value Std. Error t value
(Intercept) 3.8076 0.0336 113.3004
perc_analfa 0.0167 0.0024 6.9774
Residual standard error: 1.382 on 5544 degrees of freedom
ANÁLISE VOTOS NOMINAIS
Histograma % Votação Lula
Gráfico de Dispersão % Analfabetismo e % Voto Lula
`geom_smooth()` using formula = 'y ~ x'
Teste de Correlação de Spearman
Spearman's rank correlation rho
data: bdlula$perc_analfa and bdlula$pc_votos_validos
S = 5277582834, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.8143706
Correlação positiva forte: Um valor de rho = 0.81 sugere que quanto maior o percentual de analfabetismo em uma região, maior tende a ser o percentual de votos no Lula.
Significativo: O p-valor muito pequeno indica que essa associação é estatisticamente significativa, ou seja, não é fruto do acaso.
Regressão Linear Robusta
Call: rlm(formula = pc_votos_validos ~ perc_analfa, data = bdlula)
Residuals:
Min 1Q Median 3Q Max
-0.782116 -0.068112 -0.002054 0.070311 0.469801
Coefficients:
Value Std. Error t value
(Intercept) 0.3073 0.0026 117.1656
perc_analfa 0.0200 0.0002 106.7124
Residual standard error: 0.1023 on 5544 degrees of freedom
Intercepto (0.3073): Quando o percentual de analfabetismo é zero, o modelo prevê cerca de 30,7% dos votos no Lula.
Coeficiente de perc_analfa (0.0200): Para cada aumento de 1 ponto percentual no analfabetismo, o percentual de votos válidos no Lula aumenta em 2 pontos percentuais, em média, segundo o modelo.
t-valor muito alto (106.71): Forte evidência de que perc_analfa tem efeito estatisticamente significativo no voto no Lula.
Erro padrão pequeno (0.0002): A estimativa do coeficiente é muito precisa.
O modelo robusto confirma e quantifica a forte relação positiva entre analfabetismo e votação no Lula.
Cada aumento de 1% em analfabetismo está associado a um aumento de 2 pontos percentuais nos votos no Lula.
Essa associação permanece mesmo controlando para outliers e influências extremas, o que reforça a robustez do achado.