Dados descritivos da matéria

Análise de dados

Professor Adriano Lauro

Centro Universitário Celso Lisboa

Trabalho feito com base nos dados das eleições de 2024, Rio de Janeiro

planilha adquirida pelo site do STJ

##Carregamento de Planilha ###Planilha montada através dos dados disponibilizados no site do STJ ### Trabalho feito sobre as eleições municipais do Rio de Janeiro 2024 ###foco nas vagas para Vereadores no município do Rio de Janeiro

library(readxl)
Planilha_eleicoes <- read_excel("Planilha_eleicoes.xlsx")

##Carregamento de Pacotes

library(readxl)
library(readr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(kableExtra)
## 
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
## 
##     group_rows
library(knitr)

##tratando Dados

votacao <- Planilha_eleicoes

glimpse(votacao)
## Rows: 984
## Columns: 4
## $ candidato  <chr> "*22222 - CARLOS NANTES BOLSONARO", "*55005 - MARCIO CESAR …
## $ Votos      <chr> "130480", "56770", "49986", "47671", "40892", "39967", "398…
## $ Destinacao <chr> "Válido", "Válido", "Válido", "Válido", "Válido", "Válido",…
## $ Situacao   <chr> "Eleito por QP", "Eleito por QP", "Eleito por QP", "Eleito …
class(votacao$`Votos`)
## [1] "character"
votacao$`Votos` <- as.numeric(as.character(votacao$`Votos`))

Agrupando Dados

 x<- votacao %>%
  group_by(Situacao) %>%
  summarise(maxino_votos = max(Votos),
            minimo_votos = min(Votos),
            media_votos = mean(Votos),
            mediana_votos = median(Votos),
            S_votos = sd(Votos))

Colocando numa tabela para apresnetçaõ usando a função kable ##Estatística Básica

Média

Mediana

Desvio Padrão

kable(head(x, 15))
Situacao maxino_votos minimo_votos media_votos mediana_votos S_votos
10º Suplente 8000 613 2685.4375 1888.0 2074.4609
11º Suplente 7393 544 2458.2500 1724.5 1926.9452
12º Suplente 7026 505 2259.2500 1489.0 1814.9360
13º Suplente 6190 501 1956.3125 1316.0 1610.4063
14º Suplente 6134 492 1735.5000 971.5 1573.8933
15º Suplente 6083 456 1651.6000 851.0 1558.2728
16º Suplente 6066 380 1514.6875 749.0 1524.5282
17º Suplente 5921 344 1373.8750 696.5 1476.8236
18º Suplente 5624 342 1298.0000 694.5 1407.7623
19º Suplente 5056 269 1176.0000 627.5 1293.9006
1º Suplente 25844 3889 12593.0000 12006.0 5347.0528
20º Suplente 4779 266 1106.1250 613.0 1226.1614
21º Suplente 4406 263 1031.5000 561.5 1141.0167
22º Suplente 4350 241 921.3125 556.5 1061.8278
23º Suplente 3631 231 781.3750 498.0 859.6917

Histograma

###Histograma feito com as colunas “Votos” e ” Destinacao”

###nesse Histograma podemos ver a quantidade de votos válidos, Anulados e NA

ggplot(votacao) +
  aes(Votos) +
  geom_histogram(bins = 15, color = "blue", fill = "yellow") +
  facet_grid(~Destinacao)
## Warning: Removed 2 rows containing non-finite outside the scale range
## (`stat_bin()`).

##Gráfico de Barras

##Gráfico feito com a coluna “situacao”

##Nesse gráfico podemos observar a quantidade detalhada e de forma decrescente a quantidade de votos em cada situação de voto(Não eleito, suplentes e eleito por legenda)

situacao_freq <- table(votacao$Situacao)
situacao_freq <- situacao_freq[order(situacao_freq, decreasing = TRUE)]
cores <- terrain.colors(length(situacao_freq))
par(mar = c(9, 5, 4, 2)) 
bp <- barplot(situacao_freq,
        main = "Distribuição da Situação dos Votos(base votacao)",
        ylab ="Frequencia Absoluta ",
        cex.axis = 0.7,
        col = cores,
        border = "darkgray",
        las = 2,
        cex.names = 0.8,
        ylim = c(0, max(situacao_freq) * 1.2))
grid(nx = NA, ny = NULL, col = "gray", lty = "dotted")
text(x = bp , 
     y = situacao_freq, 
     label = situacao_freq, 
     pos = 3, 
     cex = 0.7, 
     col = "darkblue", 
     font = 2)