Bibliotecas

Primeiramente, serão carregadas todas as bibliotecas usadas nas atividades 3, 4, 5 e 6.

library (electionsBR)
library(dplyr)
library(flextable)
library(ggplot2)
library(ggthemes)
library(ggridges)
library(corrplot)
library(readr)

Atividade 03

Carregando Base de Dados

Para esta atividade, utilizaremos a base de dados “df_pokemon.RData” e foi escolhida a variável altura para realizar as análises.

load("C:\\Users\\nanda\\OneDrive\\Base_de_dados-master\\df_pokemon.RData")

Média

mean(df$height)
## [1] 11.40669

Mediana

median(df$height)
## [1] 10

Desvio Padrão

sd(df$height)
## [1] 10.31993

A média observada foi de 11,40, já a mediana foi de 10, enquanto o desvio padrão foi algo em torno de 10,31.

Histograma

hist(df$height, col = c("pink"), xlab = "Altura", ylab = "Frequência", main = "Histograma")

No Histograma criado, a variável utilizada foi a da altura. Com ela pretendia analisar qual seria o desempenho do Pokemon, por meio da mediana, da média e do desvio padrão. Pelo histograma observamos que os Pokémons tem uma frequência de altura muito próxima uns dos outros. Com isso fica difícil precisar se a altura influencia ou não em seu desempenho.


Atividade 04

Será analisado neste relatório se a cota de 30% para candidaturas femininas,por partido, a deputado federal do estado de Goiás está sendo respeitada para as eleições proporcionais de 2018.

Observação: Lei da Eleições n 9.504/1997 estabeleceu que cada partido deve preencher 30% de candidaturas femininas em eleições proporcionais.

Carregando Base de Dados

electionsBR::parties_br()
##  [1] "AVANTE"         "CIDADANIA"      "DC"             "DEM"           
##  [5] "MDB"            "NOVO"           "PATRIOTA"       "PC do B"       
##  [9] "PCB"            "PCO"            "PDT"            "PEN"           
## [13] "PHS"            "PMB"            "PMN"            "PODE"          
## [17] "PP"             "PPL"            "PPS"            "PR"            
## [21] "PRB"            "PROS"           "PRP"            "PRTB"          
## [25] "PSB"            "PSC"            "PSD"            "PSDB"          
## [29] "PSDC"           "PSL"            "PSOL"           "PSTU"          
## [33] "PT"             "PT do B"        "PTB"            "PTC"           
## [37] "PTN"            "PV"             "REDE"           "REPUBLICANOS"  
## [41] "SD"             "SOLIEDARIEDADE" "UP"

Limpeza do Banco de Dados

Agora, selecionaremos os candiadtos a Deputado Federal do Estado de Goiás nas eleições gerais de 2018.

banco=candidate_fed(year = 2018, uf= "GO")
banco2= banco%>% filter(DS_CARGO=="DEPUTADO FEDERAL")

Tabela Partido x Gênero

tabela_deputada_fed = table(banco2$DS_GENERO,banco2$SG_PARTIDO)
tabela_deputada_fed
##            
##             AVANTE DC DEM MDB NOVO PATRIOTA PC do B PCB PCO PDT PHS PMB PMN
##   FEMININO       1  5   3   7    2        2       4   1   1   1   9   0   3
##   MASCULINO      5  8   4  12    4        8       3   0   0   1  16   1   2
##            
##             PODE PP PPS PR PRB PROS PRP PRTB PSB PSC PSD PSDB PSL PSOL PT PTB
##   FEMININO     0  1   0  1   0    1   2    3   0   2   3    3   2    6  5   0
##   MASCULINO    5  5   1  0   1    0   3    7   3   5   2    6   7   13 12   3
##            
##             PTC PV REDE SOLIDARIEDADE
##   FEMININO    3  2    3             0
##   MASCULINO   8  3    4             1

Tabela Proporcional Partido x Gênero

proporção_depfed_go = round(prop.table(tabela_deputada_fed,2)*100,1)
proporção_depfed_go
##            
##             AVANTE    DC   DEM   MDB  NOVO PATRIOTA PC do B   PCB   PCO   PDT
##   FEMININO    16.7  38.5  42.9  36.8  33.3     20.0    57.1 100.0 100.0  50.0
##   MASCULINO   83.3  61.5  57.1  63.2  66.7     80.0    42.9   0.0   0.0  50.0
##            
##               PHS   PMB   PMN  PODE    PP   PPS    PR   PRB  PROS   PRP  PRTB
##   FEMININO   36.0   0.0  60.0   0.0  16.7   0.0 100.0   0.0 100.0  40.0  30.0
##   MASCULINO  64.0 100.0  40.0 100.0  83.3 100.0   0.0 100.0   0.0  60.0  70.0
##            
##               PSB   PSC   PSD  PSDB   PSL  PSOL    PT   PTB   PTC    PV  REDE
##   FEMININO    0.0  28.6  60.0  33.3  22.2  31.6  29.4   0.0  27.3  40.0  42.9
##   MASCULINO 100.0  71.4  40.0  66.7  77.8  68.4  70.6 100.0  72.7  60.0  57.1
##            
##             SOLIDARIEDADE
##   FEMININO            0.0
##   MASCULINO         100.0

Para saber se a cota de gênero foi obedecida, temos um total de 33 partidos em 2018. Desse total, apenas 15 partidos preenchem os 30% de candidaturas femininas. Dos 18 partidos que não cumpreem esse quorum, 7 partidos estão abaixo da cota e 11 partidos que só tem candidatos do mesmo sexo.

Gráfico das Proporções

par(cex=0.8)
Graficogenero = barplot(proporção_depfed_go, 
                                 col = c("pink", "violet"), 
                                 legend.text = c("Feminino", "Masculino"),
                                 ylab = "Porcentagem", xlab = "Sigla Partidos", 
                                 main = 'Porcentagem de candidatos de cada gênero por partido', 
                                 las=2, cex.axis = 1, cex.names = 0.5)

Dessa forma, percebemos que no total de partidos que tinham representantes no estado de Goiás, apenas 45,45% cumpriram a cota enquanto mais da metade não cumpriram o quorum representando 54,54%.

Partidos que respeitam a cota: DC, MDB, NOVO PC do B, PDT, PHS, PMN, PRP, PRTB, PSD, PSDB, PSOL PV e REDE.

Partidos que não cumpriram: AVANTE, PATRIOTA, PCB,PCO, PMDB, PODE, PP, PPS,PR, PRB, PROS, PSB, PSC, PSL, PT, PTB, PTC e SOLIDARIEDADE.

Ainda é possível observar que o PDT foi o partido que obteve 50% dos candidatos homens e 50% de candidatas mulheres, PMN e PSD tiveram 60% de candidaturas femininas, sendo esses dois no estado com o maior índice de candidatas mulheres. Já o PP e o AVANTE, tiveram os menores índices da cota feminina com apenas 16,7% de candidatas mulheres.


Atividade 05

A base de dados utilizada foi “Chile.RData” e as variáveis escolhidas foram sexo e idade.

OBS:.Foram excluídos os chamados NA´s que são pessoas que não responderam. Com isso as variáveis foram reduzidas.

Carregando Base de Dados

load("C:\\Users\\nanda\\OneDrive\\Base_de_dados-master\\chile\\Chile.RData")

Limpeza da Base de Dados

chile2=na.omit(Chile)

Tabela Sexo por Idade

chile2%>%group_by(sex)%>%summarise(media=round(mean(age),1), desviopadrao=round(sd(age),1),
                                   minimo=min(age),mediana=median(age), maximo=max(age))%>%
  flextable() %>% theme_booktabs()

sex

media

desviopadrao

minimo

mediana

maximo

F

38.0

14.0

18

36

70

M

38.6

15.3

18

36

70

Nas variáveis utilizadas, percebo que pontos como média, desvio padrão, mínimo, mediana e máximo são valores extremamente próximos. Sendo assim, não percebemos uma discrepância entre pessoas do sexo feminino nem do sexo masculino.

Boxplot Sexo por Idade

chile2%>%select(sex,age)%>%
  ggplot(aes(x=sex,y= age)) +geom_boxplot(fill= c("pink","violet"))+ 
  labs(x = " Sexo",y = "Idade", 
       title = "Sexo por Idade", 
       caption = "Fonte: Chile.RData. Processado por Isabelle Coutinho.")+ 
  coord_flip() +
  theme_fivethirtyeight()

A média observada entre as variáveis analisadas mostrou que a média tanto das mulheres quanto dos homens é em torno dos 38 anos.


Atividade 06

Carregando Base de Dados

Vamos carregar a base de dados FifaData para essa atividade.

fifa = read_csv("C:\\Users\\nanda\\OneDrive\\Base_de_dados-master\\FifaData.csv")

Limpeza Base de Dados

Nessa fase, limpamos a base de dados e selecionamos apenas os jogadores brasileiros para fazer a análise.

fifa2 = fifa %>% filter(Nationality == "Brazil")

Diagrama de Dispersão

fifa2 %>%ggplot(aes(x= Long_Pass, y= Vision)) + 
  geom_point() + 
  geom_smooth(method = 'lm') +  labs(x = " Passo Longo ",y = "Visão", 
                                     title = "Relação entre Passos Longos e Visão de Jogo", 
                                     caption = "Fonte: FifaData.csv. Processado por Isabelle Coutinho.") + theme_clean()

No diagrama, os jogadores brasileiros foram analisados, no qual a relação observada foi passe longo e visão. A conclusão que se faz é que quanto melhor a visão do jogador, maior e com mais qualidade é dado o passe longo.

Matriz de Correlação

fifa2 %>% select(Long_Pass, Vision) %>% cor() %>% corrplot(method = "color")

Na matriz apresentada percebemos que a relação entre essas duas variáveis escolhidas apresentam uma relação forte e positiva.