vamos fazer uma analise de variavel qualitativa.
para isso, vamos importar os dados, fazer um tratamento dos dados, fazer as tabelas, as proporções e os gráficos.
load("C:/Users/14086606798/Desktop/Base_de_dados-master/Eleicoes/prefeito_1Turno.Rdata")
View(prefeito_1Turno)
summary(prefeito_1Turno)
## DATA_GERACAO HORA_GERACAO ANO_ELEICAO COD_TIPO_ELEICAO
## Length:19581 Length:19581 Min. :2020 Min. :1.00
## Class :character Class1:hms 1st Qu.:2020 1st Qu.:2.00
## Mode :character Class2:difftime Median :2020 Median :2.00
## Mode :numeric Mean :2020 Mean :1.99
## 3rd Qu.:2020 3rd Qu.:2.00
## Max. :2020 Max. :2.00
##
## NOME_TIPO_ELEICAO NUM_TURNO COD_ELEICAO DESCRICAO_ELEICAO
## Length:19581 Min. :1 Min. :426.0 Length:19581
## Class :character 1st Qu.:1 1st Qu.:426.0 Class :character
## Mode :character Median :1 Median :426.0 Mode :character
## Mean :1 Mean :426.9
## 3rd Qu.:1 3rd Qu.:426.0
## Max. :1 Max. :558.0
##
## DATA_ELEICAO ABRANGENCIA SIGLA_UF SIGLA_UE
## Length:19581 Length:19581 Length:19581 Length:19581
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## DESCRICAO_UE CODIGO_CARGO DESCRICAO_CARGO SQ_CANDIDATO
## Length:19581 Min. :11 Length:19581 Min. :1.000e+10
## Class :character 1st Qu.:11 Class :character 1st Qu.:1.100e+11
## Mode :character Median :11 Mode :character Median :1.600e+11
## Mean :11 Mean :1.568e+11
## 3rd Qu.:11 3rd Qu.:2.100e+11
## Max. :11 Max. :2.700e+11
##
## NUMERO_CANDIDATO NOME_CANDIDATO NOME_URNA_CANDIDATO NOME_SOCIAL_CANDIDATO
## Min. :10.0 Length:19581 Length:19581 Length:19581
## 1st Qu.:14.0 Class :character Class :character Class :character
## Median :22.0 Mode :character Mode :character Mode :character
## Mean :29.7
## 3rd Qu.:45.0
## Max. :90.0
##
## CPF_CANDIDATO NOME_EMAIL COD_SITUACAO_CANDIDATURA
## Length:19581 Length:19581 Min. : 1.0
## Class :character Class :character 1st Qu.:12.0
## Mode :character Mode :character Median :12.0
## Mean :11.5
## 3rd Qu.:12.0
## Max. :12.0
##
## DES_SITUACAO_CANDIDATURA COD_DETALHE_SITUACAO_CAND DES_DETALHE_SITUACAO_CAND
## Length:19581 Min. : 2.000 Length:19581
## Class :character 1st Qu.: 2.000 Class :character
## Mode :character Median : 2.000 Mode :character
## Mean : 2.683
## 3rd Qu.: 2.000
## Max. :18.000
##
## TIPO_AGREMIACAO NUMERO_PARTIDO SIGLA_PARTIDO NOME_PARTIDO
## Length:19581 Min. :10.00 Length:19581 Length:19581
## Class :character 1st Qu.:14.00 Class :character Class :character
## Mode :character Median :22.00 Mode :character Mode :character
## Mean :29.71
## 3rd Qu.:45.00
## Max. :90.00
##
## SQ_COLIGACAO NOME_COLIGACAO COMPOSICAO_COLIGACAO COD_NACIONALIDADE
## Min. :1.000e+10 Length:19581 Length:19581 Min. :-4.0000
## 1st Qu.:1.100e+11 Class :character Class :character 1st Qu.: 1.0000
## Median :1.600e+11 Mode :character Mode :character Median : 1.0000
## Mean :1.568e+11 Mean : 0.9977
## 3rd Qu.:2.100e+11 3rd Qu.: 1.0000
## Max. :2.700e+11 Max. : 4.0000
##
## DES_NACIONALIDADE SIGLA_UF_NASCIMENTO COD_MUNICIPIO_NASCIMENTO
## Length:19581 Length:19581 Min. :-3
## Class :character Class :character 1st Qu.:-3
## Mode :character Mode :character Median :-3
## Mean :-3
## 3rd Qu.:-3
## Max. :-3
##
## NOME_MUNICIPIO_NASCIMENTO DATA_NASCIMENTO IDADE_DATA_POSSE
## Length:19581 Length:19581 Min. :21.00
## Class :character Class :character 1st Qu.:42.00
## Mode :character Mode :character Median :50.00
## Mean :49.89
## 3rd Qu.:58.00
## Max. :95.00
## NA's :28
## NUM_TITULO_ELEITORAL_CANDIDATO CODIGO_SEXO DESCRICAO_SEXO
## Length:19581 Min. :-4.00 Length:19581
## Class :character 1st Qu.: 2.00 Class :character
## Mode :character Median : 2.00 Mode :character
## Mean : 2.26
## 3rd Qu.: 2.00
## Max. : 4.00
##
## COD_GRAU_INSTRUCAO DESCRICAO_GRAU_INSTRUCAO CODIGO_ESTADO_CIVIL
## Min. :-4.000 Length:19581 Min. :-4.000
## 1st Qu.: 6.000 Class :character 1st Qu.: 3.000
## Median : 8.000 Mode :character Median : 3.000
## Mean : 6.825 Mean : 3.251
## 3rd Qu.: 8.000 3rd Qu.: 3.000
## Max. : 8.000 Max. : 9.000
##
## DESCRICAO_ESTADO_CIVIL CODIGO_COR_RACA DESCRICAO_COR_RACA CODIGO_OCUPACAO
## Length:19581 Length:19581 Length:19581 Min. : -4.0
## Class :character Class :character Class :character 1st Qu.:169.0
## Mode :character Mode :character Mode :character Median :265.0
## Mean :334.6
## 3rd Qu.:298.0
## Max. :999.0
##
## DESCRICAO_OCUPACAO VALOR_DESPESA_MAX_CAMPANHA CODIGO_SIT_TOT_TURNO
## Length:19581 Min. : -4 Min. :-1.000
## Class :character 1st Qu.: 123077 1st Qu.: 1.000
## Mode :character Median : 123077 Median : 4.000
## Mean : 502657 Mean : 3.009
## 3rd Qu.: 291757 3rd Qu.: 4.000
## Max. :51799384 Max. : 6.000
##
## DESCRICAO__SIT_TOT_TURNO SIT_REELEICAO SIT_DECLARAR_BENS
## Length:19581 Length:19581 Length:19581
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
##
##
##
##
## NUM_PROTOCOLO_CANDIDATURA NUM_PROCESSO CODIGO_SITUACAO_CANDIDATO_PLEITO
## Min. :-1 Length:19581 Min. :-1.000
## 1st Qu.:-1 Class :character 1st Qu.: 2.000
## Median :-1 Mode :character Median : 2.000
## Mean :-1 Mean : 2.467
## 3rd Qu.:-1 3rd Qu.: 2.000
## Max. :-1 Max. :18.000
##
## DS_SITUACAO_CANDIDATO_PLEITO CODIGO_SITUACAO_CANDIDATO_URNA
## Length:19581 Min. :-1.000
## Class :character 1st Qu.: 2.000
## Mode :character Median : 2.000
## Mean : 2.733
## 3rd Qu.: 2.000
## Max. :20.000
##
## DESCRICAO__SITUACAO_CANDIDATO_URNA SIT_CANDIDATO_INSERIDO_URNA
## Length:19581 Length:19581
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
tiponome = table(prefeito_1Turno$SIGLA_PARTIDO)
prop.table(tiponome)
##
## AVANTE CIDADANIA DC DEM MDB
## 2.221541e-02 2.716919e-02 7.456208e-03 5.995608e-02 1.016291e-01
## NOVO PATRIOTA PC do B PCB PCO
## 1.532097e-03 2.257290e-02 1.435065e-02 3.064195e-04 1.940657e-03
## PDT PL PMB PMN PODE
## 5.020173e-02 5.030387e-02 3.268475e-03 6.485879e-03 2.982483e-02
## PP PROS PRTB PSB PSC
## 7.742199e-02 1.583167e-02 1.680200e-02 4.560543e-02 2.722026e-02
## PSD PSDB PSL PSOL PSTU
## 8.498034e-02 6.828048e-02 3.733211e-02 1.818089e-02 2.553496e-03
## PT PTB PTC PV REDE
## 6.480772e-02 3.932383e-02 8.630816e-03 1.557632e-02 7.251928e-03
## REPUBLICANOS SOLIDARIEDADE UNIÃO UP
## 4.346050e-02 2.670957e-02 5.106991e-05 7.660487e-04
round(prop.table((tiponome)*100,1))
##
## AVANTE CIDADANIA DC DEM MDB
## 1 1 1 1 1
## NOVO PATRIOTA PC do B PCB PCO
## 1 1 1 1 1
## PDT PL PMB PMN PODE
## 1 1 1 1 1
## PP PROS PRTB PSB PSC
## 1 1 1 1 1
## PSD PSDB PSL PSOL PSTU
## 1 1 1 1 1
## PT PTB PTC PV REDE
## 1 1 1 1 1
## REPUBLICANOS SOLIDARIEDADE UNIÃO UP
## 1 1 1 1
##passo 3 - gráficos
Aqui vemos as variaveis qualitativas em formato de grafico barras
as.numeric(tiponome) #transformar em float
## [1] 435 532 146 1174 1990 30 442 281 6 38 983 985 64 127 584
## [16] 1516 310 329 893 533 1664 1337 731 356 50 1269 770 169 305 142
## [31] 851 523 1 15
#numeros de partidos = 37 partidos
par(cex=0.5)
barplot(tiponome, col=c("#D400FF","blue","wheat1","violetred4","slategrey",
"pink4","palegreen4","aliceblue", "beige", "beige",
"bisque" ,"cadetblue1","chocolate1","orangered","oldlace",
"palegoldenrod","lavenderblush","honeydew","ivory2","ivory1",
"powderblue","purple" ,"purple1","purple2","purple3","red1",
"tan3","firebrick3","gray1","gold4","dodgerblue4","floralwhite",
"gray21","gray12","olivedrab4", "gold2"),
main= "Número de integrantes por partido")
#saber as cores
#colors()
Aqui vemos as variaveis qualitativas em formato de grafico pizza
as.numeric(tiponome) #transformar em float
## [1] 435 532 146 1174 1990 30 442 281 6 38 983 985 64 127 584
## [16] 1516 310 329 893 533 1664 1337 731 356 50 1269 770 169 305 142
## [31] 851 523 1 15
#numeros de partidos = 37 partidos
par(cex=0.5) # para diminuir a fonte
pie(tiponome, col=c("#D400FF","blue","wheat1","violetred4","slategrey",
"pink4","palegreen4","aliceblue", "beige", "beige",
"bisque" ,"cadetblue1","chocolate1","orangered","oldlace",
"palegoldenrod","lavenderblush","honeydew","ivory2","ivory1",
"powderblue","purple" ,"purple1","purple2","purple3","red1",
"tan3","firebrick3","gray1","gold4","dodgerblue4","floralwhite",
"gray21","gray12","olivedrab4", "gold2"),
main= "Número de integrantes por partido")
Foi necessario transformar o object em float para que fosse utilizados os dados.
os graficos possuem 37 partidos
O partido MDB apareceu nos dois gráficos como o o numeros de integrantes por partidos.
o grafico de estilo pizza aparenta estar poluído visualmente.
Segundo o ibpad, esta poluição visual seria um erro em introduzir muitas categorias.
Utilizar pizzas para dados dicotômicos. é o único dado que faz realmente sentido utilizar pizza. Serve para você dar a dimensão de contraposição muito bem. O ideal é seguir as outras dicas: coloque cor apenas na modalidade que você está analisando, agrupe as demais e ela deveria ficar em primeiro na pizza. Mesmo se ela não for a modalidade maior, vai te ajudar a interpretar melhor o seu gráfico.
```