O pacote usado foi rtweet e uma lista de perfis de parlamentares. No total os dados são compostos por 72.316 tweets cuja data de criação é em 2019. As informações contidas no arquivo usado (atividade-por-perfil-20190322.csv) são em sua maioria, números relacionados a atividade de cada parlamentar na rede esse ano, como por exemplo o número de seguidores, número de tweets etc.
atividade = read_csv(here::here("data/atividade-por-perfil-20190322.csv"),
col_types = ("dcccccddddddddddddd"))
ativos_2019_seguidores <- atividade %>%
filter(!is.na(twitter), seguidores != 0, segue != 0, seguidores >= 200914)
ativos_2019_seguidores %>%
ggplot(aes(x = nome_eleitoral, y = seguidores)) + coord_flip() +
geom_col()
Usaremos apenas os parlamentares ativos em 2019 e para facilitar a visualização foram selecionados apenas aqueles que possuem mais de 200914 seguidores (os 15 mais seguidos). Observando o gráfico é possível saber facilmente qual o parlmentar mais popular, Romário, com mais de 2500000 seguidores. Logo após vem José Serra e em seguida Flávio Bolsonaro.
ativos_2019 <- atividade %>%
filter(!is.na(twitter), seguidores != 0, segue != 0, engaj_mediano > 20, engaj_mediano_proprio > 20, engaj_total_retweet > 0)
ativos_2019 %>%
ggplot(aes(x = engaj_total, y = seguidores, colour=nome_eleitoral)) +
geom_point(aes(size = seguidores), alpha =.5, color="red")
Segundo o gráfico apresentado, o parlamentar que mais possui seguidores é também um dos que menos tem engage dentro da rede, contudo o comportamento mais comum é um equilíbrio entre quantidade de seguidores e engajamento.
ativos_2019 %>%
ggplot(aes(x = seguidores, y = n_proprio, group=engaj_total_proprio)) +geom_point(aes(size = engaj_total_proprio), alpha =.5, color="blue")
Existem alguns poucos casos de parlamentares que, segundo o gráfico, produzem pouco conteúdo próprio e tem muitos seguidores, três pontos distintitos estão de acordo com essa afirmação. A maioria segue um padrão bem próximo de quantidade de seguidores, mas a minoria produz algum conteúdo autoral.
ativos_2019 <- atividade %>%
filter(!is.na(twitter), seguidores != 0, segue != 0, engaj_mediano > 20, engaj_mediano_proprio > 20)
agrupados_partido <- ativos_2019 %>%
group_by(partido) %>% summarise(media = mean(engaj_total))
agrupados_partido %>%
ggplot(aes(x = partido, y = media)) +
geom_col()
Os três partidos mais assíduos do Twitter, mostrados no gráfico, são PSOL, PSL e PCdoB. A assíduidade nesse caso foi calculada como a média do engajamento total do partido, ou seja (soma do engajamento_total de cada parlamentar/quantidade de parlamentares).
partidos_assiduos <- ativos_2019 %>%
group_by(partido) %>% summarise(count=n()) %>% inner_join(ativos_2019, by='partido')
ggplot(partidos_assiduos, aes(x = partido, y = count)) +
geom_jitter(width = 1, size = 4, alpha = .7, height = 1, aes(colour = partido))
De acordo com a resposta anterior, dos partidos mais ativos na rede, o PSL é o segundo mais assíduo e possui um dos maiores números de parlamentares ativos. Enquanto o PCdoB tem um número de participantes do twitter muito inferior ao PSL, contudo tem uma das maiores assiduidades.
partidos_assiduos %>%
group_by(partido, seguidores) %>% summarise(count=n()) %>% inner_join(ativos_2019, by='partido') %>%
ggplot( aes(x = partido, y = seguidores.y)) + geom_col()
O número de seguidores, nos dois casos em destaque (PSL e PT), realmente é proporcional a assíduidade do partido no Twitter, contudo, na maioria dos casos isso não ocorre. Alguns exemplos que podemos visualizar facilmente: PODE, que é o terceiro partido mais seguido e possui 4 parlamentares ativos, enquanto o PSDB possui o mesmo número, mas está muito atrás do PODE.