class: center, middle, inverse, title-slide # Uma análise do twitter da UNIRIO ## Uma avaliação informal da estratégia de comunicação da UNIRIO ### Esse é um projeto DATAUNIRIO --- <style type="text/css"> #@import url('https://fonts.googleapis.com/css?family=Lobster&display=swap'); #@import url('https://fonts.googleapis.com/css?family=Chilanka&display=swap'); @import url('https://fonts.googleapis.com/css?family=Roboto&display=swap'); body { font-family: 'Roboto', sans-serif; font-family: 'Roboto Condensed', # font-family: 'Chilanka', cursive; font-size: 22px; color: #116155; } h1,h2,h3,h4,h5,h6 { color: #116155; #font-family: 'Great Vibes', cursive; font-family: 'Roboto', sans-serif; font-family: 'Roboto Condensed', sans-serif; } </style> ## Introdução O twitter é uma rede social que consiste no compartilhamento de mensagens. Os textos ou tuítes devem possuir no máximo 140 caracteres. [@comunicaUNIRIO](https://twitter.com/comunicaUNIRIO) é a conta oficial da **UNIRIO** no twitter. De forma semelhante, a [@uerj_oficial](https://twitter.com/uerj_oficial) é a conta da **UERJ**. Já a [@uff_br](https://twitter.com/uff_br) é a conta da **UFF**, e [@ufrj](https://twitter.com/ufrj) é a conta da **UFRJ**. No final de 2019, de acordo com o twitter, essas contas fizeram juntas mais de trinta e quatro mil publicações. A distribuição entre as universidades foi: 1. **a UNIRIO** fez 4.768 publicações. 2. **a UERJ** fez 4.137 publicações. 3. **a UFF** fez 16,4 mil publicações. 4. **a UFRJ** fez 9,027 publicações. --- ## Origem dos dados Buscamos os últimos 3.000 textos das quatro universidades. Foram excluídos os retweets e os replies. Para isso foram utilizados os pacotes *twitteR* e *rtweet*. Esses textos foram salvos no formato .txt e podem ser baixados **aqui**. Tamanho de cada arquivo: ``` ## [1] "Tamanho UNIRIO: 525155" ``` ``` ## [1] "Tamanho UERJ: 541974" ``` ``` ## [1] "Tamanho UFF: 699264" ``` ``` ## [1] "Tamanho UFRJ: 495415" ``` --- <img src="analise_do_twitter_da_UNIRIO_files/figure-html/funcoes-1.png" width="864" /> --- ## Palavras mais utilizadas pela UNIRIO Aqui podemos ver que o **twitter da Unirio usou 8.984 palavras** diferentes nas últimas 3.000 postagens. Todavia, temos muitas palavras. por exemplo, "de", "da", "que" são palavras de conexão com pouco significado. Também temos palavras da *web* com nenhum significado. Exemplos: "https", "http", "www". <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> word </th> <th style="text-align:right;"> n </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> t.co </td> <td style="text-align:right;"> 2515 </td> </tr> <tr> <td style="text-align:left;"> https </td> <td style="text-align:right;"> 2466 </td> </tr> <tr> <td style="text-align:left;"> de </td> <td style="text-align:right;"> 2295 </td> </tr> <tr> <td style="text-align:left;"> e </td> <td style="text-align:right;"> 1593 </td> </tr> <tr> <td style="text-align:left;"> a </td> <td style="text-align:right;"> 1130 </td> </tr> <tr> <td style="text-align:left;"> da </td> <td style="text-align:right;"> 1051 </td> </tr> <tr> <td style="text-align:left;"> o </td> <td style="text-align:right;"> 1006 </td> </tr> <tr> <td style="text-align:left;"> dia </td> <td style="text-align:right;"> 985 </td> </tr> <tr> <td style="text-align:left;"> do </td> <td style="text-align:right;"> 880 </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:right;"> 819 </td> </tr> </tbody> </table> Vamos retirar essas palavras para construir uma análise mais rica. A lista de palavras banidas pode ser encontrada aqui. --- ## Palavras mais utilizadas pela UNIRIO <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> word </th> <th style="text-align:right;"> n </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:right;"> 819 </td> </tr> <tr> <td style="text-align:left;"> confira </td> <td style="text-align:right;"> 301 </td> </tr> <tr> <td style="text-align:left;"> saiba </td> <td style="text-align:right;"> 264 </td> </tr> <tr> <td style="text-align:left;"> inscrições </td> <td style="text-align:right;"> 249 </td> </tr> <tr> <td style="text-align:left;"> vai </td> <td style="text-align:right;"> 221 </td> </tr> <tr> <td style="text-align:left;"> escola </td> <td style="text-align:right;"> 166 </td> </tr> <tr> <td style="text-align:left;"> palestra </td> <td style="text-align:right;"> 158 </td> </tr> <tr> <td style="text-align:left;"> semana </td> <td style="text-align:right;"> 150 </td> </tr> <tr> <td style="text-align:left;"> tema </td> <td style="text-align:right;"> 147 </td> </tr> <tr> <td style="text-align:left;"> edital </td> <td style="text-align:right;"> 138 </td> </tr> <tr> <td style="text-align:left;"> nesta </td> <td style="text-align:right;"> 127 </td> </tr> <tr> <td style="text-align:left;"> mestrado </td> <td style="text-align:right;"> 119 </td> </tr> <tr> <td style="text-align:left;"> siga </td> <td style="text-align:right;"> 117 </td> </tr> <tr> <td style="text-align:left;"> graduação </td> <td style="text-align:right;"> 108 </td> </tr> <tr> <td style="text-align:left;"> curta </td> <td style="text-align:right;"> 106 </td> </tr> <tr> <td style="text-align:left;"> lista </td> <td style="text-align:right;"> 93 </td> </tr> <tr> <td style="text-align:left;"> programa </td> <td style="text-align:right;"> 88 </td> </tr> <tr> <td style="text-align:left;"> teatro </td> <td style="text-align:right;"> 87 </td> </tr> <tr> <td style="text-align:left;"> veja </td> <td style="text-align:right;"> 86 </td> </tr> <tr> <td style="text-align:left;"> fique </td> <td style="text-align:right;"> 85 </td> </tr> </tbody> </table> --- ## Análise Aqui podemos ver que a palavra **UNIRIO** é a mais utilizada pela twitter da comunicação da UNIRIO. Isso faz todo sentido! Além disso, o grande uso das palavras "confira", "saiba", "inscrições", "palestra" e "edital" sugere que o twitter da Universidade é utilizado para uma agenda de divulgação da UNIRIO. Possivelmente, o grande uso (150 vezes) da palavra "semana" tem a ver com a **Semana de Integração Acadêmica - SIA** (um grande evento da universidade). Interessante notar que as palavras associadas a **Jornada de Iniciação Científica - JIC** (outro grande evento da Instituição) não estão entre as dez primeiras. A primeira palavra associada a alguma escola a aparecer na lista é **teatro**. Acredito que isso tem a ver com a importância da divulgação de espetáculos. Outras escolas da Universidade como a Matemática ou a Filosofia não tem uma necessidade tão grande quanto o Teatro de "buscar o público". --- ## Nuvem de Palavras Uma nuvem de palavras é uma representação visual da frequência das palavras. Ela é usado para destacar com que frequência um termo ou categoria específica aparece em uma fonte de dados. Quanto mais vezes uma palavra estiver presente em um conjunto de dados, maior será a palavra. --- <img src="analise_do_twitter_da_UNIRIO_files/figure-html/UNIRIOTIDY9-1.png" width="864" /> --- ## Bigrama Um bigrama é uma sequência de **dois elementos adjacentes** de uma sequência de simbolos (tokens). Um bigrama é um n-grama para n = 2. Com o Bigrama procuramos responder a seguinte pergunta: Que palavras ficam mais vezes juntas?  --- ## Construção do Bigrama Buscamos ver a associação de palavras e a frequência dessa associação. Por exemplo, os três primeiros bigramas da publicação anterior são: "hoje tem", "tem filézin", e "filézin de". Precisamos construir todos os bigramas possíveis. <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> </th> <th style="text-align:right;"> sent_id </th> <th style="text-align:left;"> bigram </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> 2 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> vem comigo </td> </tr> <tr> <td style="text-align:left;"> 3 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> comigo hoje </td> </tr> <tr> <td style="text-align:left;"> 4 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> hoje tem </td> </tr> <tr> <td style="text-align:left;"> 5 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> tem filézin </td> </tr> <tr> <td style="text-align:left;"> 6 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> filézin de </td> </tr> <tr> <td style="text-align:left;"> 7 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> de frango </td> </tr> <tr> <td style="text-align:left;"> 8 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> frango com </td> </tr> <tr> <td style="text-align:left;"> 9 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> com purê </td> </tr> <tr> <td style="text-align:left;"> 10 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> purê de </td> </tr> <tr> <td style="text-align:left;"> 11 </td> <td style="text-align:right;"> 1 </td> <td style="text-align:left;"> de batata </td> </tr> </tbody> </table> --- ## Frequência do Bigrama Depois de criar os bigramas, precisamos contar a frequência de cada um. <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> word1 </th> <th style="text-align:left;"> word2 </th> <th style="text-align:right;"> n </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> restaurante </td> <td style="text-align:left;"> escola </td> <td style="text-align:right;"> 52 </td> </tr> <tr> <td style="text-align:left;"> pós </td> <td style="text-align:left;"> graduação </td> <td style="text-align:right;"> 46 </td> </tr> <tr> <td style="text-align:left;"> villa </td> <td style="text-align:left;"> lobos </td> <td style="text-align:right;"> 45 </td> </tr> <tr> <td style="text-align:left;"> mestrado </td> <td style="text-align:left;"> profissional </td> <td style="text-align:right;"> 42 </td> </tr> <tr> <td style="text-align:left;"> fique </td> <td style="text-align:left;"> ligado </td> <td style="text-align:right;"> 38 </td> </tr> <tr> <td style="text-align:left;"> inscrições </td> <td style="text-align:left;"> abertas </td> <td style="text-align:right;"> 37 </td> </tr> <tr> <td style="text-align:left;"> vai </td> <td style="text-align:left;"> ser </td> <td style="text-align:right;"> 26 </td> </tr> <tr> <td style="text-align:left;"> mesa </td> <td style="text-align:left;"> redonda </td> <td style="text-align:right;"> 24 </td> </tr> <tr> <td style="text-align:left;"> iniciação </td> <td style="text-align:left;"> científica </td> <td style="text-align:right;"> 23 </td> </tr> <tr> <td style="text-align:left;"> quintas </td> <td style="text-align:left;"> culturais </td> <td style="text-align:right;"> 22 </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> musical </td> <td style="text-align:right;"> 22 </td> </tr> <tr> <td style="text-align:left;"> auditório </td> <td style="text-align:left;"> vera </td> <td style="text-align:right;"> 21 </td> </tr> <tr> <td style="text-align:left;"> aula </td> <td style="text-align:left;"> inaugural </td> <td style="text-align:right;"> 21 </td> </tr> <tr> <td style="text-align:left;"> sala </td> <td style="text-align:left;"> villa </td> <td style="text-align:right;"> 21 </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> promove </td> <td style="text-align:right;"> 21 </td> </tr> <tr> <td style="text-align:left;"> artes </td> <td style="text-align:left;"> cênicas </td> <td style="text-align:right;"> 19 </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> recebe </td> <td style="text-align:right;"> 19 </td> </tr> <tr> <td style="text-align:left;"> série </td> <td style="text-align:left;"> unirio </td> <td style="text-align:right;"> 18 </td> </tr> </tbody> </table> --- ## Análise dos bigramas Interessante notar que a divulgação do **restaurante escola** é a atividade mais comum da UNIRIO. Depois da **apresentação do Cardápio**, podemos ver uma Universidade preocupada com uma **agenda de pesquisa** com uma grande frequência das palavras "pós-graduação", "mestrado profissional", "mesa redonda" e "iniciação científica". Em seguida, percebe-se uma agenda de **divulgação dos eventos da UNIRIO* com as palavras "fique ligado","inscrições abertas","auditório vera", "aula inaugural", "unirio promove", "unirio recebe", "série unirio". Finalmente, podemos ver também uma **agenda cultural** com as palavras "quintas culturais","unirio musical" e "artes cênicas" a associação de três palavras simultaneamente pode ser vista no próximo *slide*. --- <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> word1 </th> <th style="text-align:left;"> word2 </th> <th style="text-align:left;"> word3 </th> <th style="text-align:right;"> n </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> sala </td> <td style="text-align:left;"> villa </td> <td style="text-align:left;"> lobos </td> <td style="text-align:right;"> 21 </td> </tr> <tr> <td style="text-align:left;"> série </td> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> musical </td> <td style="text-align:right;"> 18 </td> </tr> <tr> <td style="text-align:left;"> auditório </td> <td style="text-align:left;"> vera </td> <td style="text-align:left;"> janacopulos </td> <td style="text-align:right;"> 14 </td> </tr> <tr> <td style="text-align:left;"> projeto </td> <td style="text-align:left;"> quintas </td> <td style="text-align:left;"> culturais </td> <td style="text-align:right;"> 13 </td> </tr> <tr> <td style="text-align:left;"> auditório </td> <td style="text-align:left;"> tércio </td> <td style="text-align:left;"> pacitti </td> <td style="text-align:right;"> 10 </td> </tr> <tr> <td style="text-align:left;"> infecção </td> <td style="text-align:left;"> hiv </td> <td style="text-align:left;"> aids </td> <td style="text-align:right;"> 9 </td> </tr> <tr> <td style="text-align:left;"> série </td> <td style="text-align:left;"> villa </td> <td style="text-align:left;"> lobos </td> <td style="text-align:right;"> 9 </td> </tr> <tr> <td style="text-align:left;"> villa </td> <td style="text-align:left;"> lobos </td> <td style="text-align:left;"> aplaude </td> <td style="text-align:right;"> 9 </td> </tr> <tr> <td style="text-align:left;"> instituto </td> <td style="text-align:left;"> villa </td> <td style="text-align:left;"> lobos </td> <td style="text-align:right;"> 8 </td> </tr> <tr> <td style="text-align:left;"> ter </td> <td style="text-align:left;"> vcs </td> <td style="text-align:left;"> aqui </td> <td style="text-align:right;"> 8 </td> </tr> <tr> <td style="text-align:left;"> auditório </td> <td style="text-align:left;"> vera </td> <td style="text-align:left;"> janacópulos </td> <td style="text-align:right;"> 7 </td> </tr> <tr> <td style="text-align:left;"> série </td> <td style="text-align:left;"> vitrine </td> <td style="text-align:left;"> musical </td> <td style="text-align:right;"> 7 </td> </tr> <tr> <td style="text-align:left;"> siga </td> <td style="text-align:left;"> curta </td> <td style="text-align:left;"> confira </td> <td style="text-align:right;"> 7 </td> </tr> <tr> <td style="text-align:left;"> vai </td> <td style="text-align:left;"> rolar </td> <td style="text-align:left;"> palestra </td> <td style="text-align:right;"> 7 </td> </tr> <tr> <td style="text-align:left;"> continue </td> <td style="text-align:left;"> acompanhando </td> <td style="text-align:left;"> aqui </td> <td style="text-align:right;"> 6 </td> </tr> <tr> <td style="text-align:left;"> enfermagem </td> <td style="text-align:left;"> alfredo </td> <td style="text-align:left;"> pinto </td> <td style="text-align:right;"> 6 </td> </tr> <tr> <td style="text-align:left;"> alfredo </td> <td style="text-align:left;"> pinto </td> <td style="text-align:left;"> eeap </td> <td style="text-align:right;"> 5 </td> </tr> <tr> <td style="text-align:left;"> hospital </td> <td style="text-align:left;"> universitário </td> <td style="text-align:left;"> gaffrée </td> <td style="text-align:right;"> 5 </td> </tr> <tr> <td style="text-align:left;"> instituto </td> <td style="text-align:left;"> biomédico </td> <td style="text-align:left;"> ib </td> <td style="text-align:right;"> 5 </td> </tr> <tr> <td style="text-align:left;"> integração </td> <td style="text-align:left;"> acadêmica </td> <td style="text-align:left;"> sia </td> <td style="text-align:right;"> 5 </td> </tr> </tbody> </table> --- ## Análise de três palavras consecutivas Quando olhamos três palavras ao mesmo tempo, observamos a dominância das agendas musical, saúde e de divulgação. palavras musicais: "villa lobos", "série unirio musical". palavras vinculadas a saúde"infecção hiv aids", "enfermagem alfredo pinto", "alfredo pinto eeap", "hospital universitário gaffrée". palavras vinculadas a agenda de divulgação: "auditório vera janacopulo", "vai rolar palestra". --- ## Rede de termos A Rede de plavras é uma visualização do procedimento acima. --- ## Rede de co-ocorrência de termos <img src="analise_do_twitter_da_UNIRIO_files/figure-html/UNIRIOREDE-1.png" width="864" /> --- ## Previsão da próxima palavra Podemos criar também um modelo para prever a próxima palavra. Por exemplo, quando a comunicação usa a palavra "auditório", qual palavra poderia vir a seguir? Seria possível prever a próxima palavra que a comunicação oficial da UNIRIO utilizaria? <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> word1 </th> <th style="text-align:left;"> word2 </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> auditório </td> <td style="text-align:left;"> vera </td> </tr> <tr> <td style="text-align:left;"> auditório </td> <td style="text-align:left;"> tércio </td> </tr> <tr> <td style="text-align:left;"> auditório </td> <td style="text-align:left;"> paulo </td> </tr> <tr> <td style="text-align:left;"> auditório </td> <td style="text-align:left;"> cheio </td> </tr> <tr> <td style="text-align:left;"> auditório </td> <td style="text-align:left;"> geral </td> </tr> <tr> <td style="text-align:left;"> auditório </td> <td style="text-align:left;"> ibio </td> </tr> </tbody> </table> Os três primeiros resultados são os nomes dos auditórios da UNIRIO: 1. Auditório Vera Janacópulos, 2. Auditório Tércio Pacitti, 3. Auditório Paulo Freire. Isso indica um bom ajuste. Assim, quais as palavras associadas a palavra UNIRIO? Quando a comunicação pensa em UNRIO, ela pensa também em.... --- <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> word1 </th> <th style="text-align:left;"> word2 </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> musical </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> promove </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> recebe </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> inscrições </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> oferece </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> vai </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> confira </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> debate </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> participa </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> começam </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> lança </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> participam </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> realiza </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> fala </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> nesta </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> sedia </td> </tr> <tr> <td style="text-align:left;"> unirio </td> <td style="text-align:left;"> terminam </td> </tr> </tbody> </table> --- ## E a Educação? Entre outras funções, a universidade existe para produzir conhecimento e formar cidadãos. Assim, qual seria a próxima palavra associada a educação e pesquisa na UNIRIO. ### Educação <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> word1 </th> <th style="text-align:left;"> word2 </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> ambiental </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> infantil </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> tutoria </td> </tr> <tr> <td style="text-align:left;"> educa </td> <td style="text-align:left;"> ser </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> popular </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> tutorial </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> contra </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> cultura </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> estatística </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> excelência </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> fala </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> inclusiva </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> nesta </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> parabéns </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> promovido </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> superior </td> </tr> <tr> <td style="text-align:left;"> educação </td> <td style="text-align:left;"> vem </td> </tr> <tr> <td style="text-align:left;"> educacionais </td> <td style="text-align:left;"> fique </td> </tr> <tr> <td style="text-align:left;"> educacionais </td> <td style="text-align:left;"> promove </td> </tr> <tr> <td style="text-align:left;"> educacional </td> <td style="text-align:left;"> vida </td> </tr> <tr> <td style="text-align:left;"> educativas </td> <td style="text-align:left;"> promove </td> </tr> </tbody> </table> --- ## Sobre a pesquisa <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> word1 </th> <th style="text-align:left;"> word2 </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> pesquisa </td> <td style="text-align:left;"> economia </td> </tr> <tr> <td style="text-align:left;"> pesquisa </td> <td style="text-align:left;"> produção </td> </tr> <tr> <td style="text-align:left;"> pesquisa </td> <td style="text-align:left;"> científica </td> </tr> <tr> <td style="text-align:left;"> pesquisa </td> <td style="text-align:left;"> acadêmica </td> </tr> <tr> <td style="text-align:left;"> pesquisa </td> <td style="text-align:left;"> aids </td> </tr> <tr> <td style="text-align:left;"> pesquisa </td> <td style="text-align:left;"> bioescritas </td> </tr> <tr> <td style="text-align:left;"> pesquisa </td> <td style="text-align:left;"> cace </td> </tr> <tr> <td style="text-align:left;"> pesquisa </td> <td style="text-align:left;"> cultural </td> </tr> <tr> <td style="text-align:left;"> pesquisa </td> <td style="text-align:left;"> veja </td> </tr> <tr> <td style="text-align:left;"> pesquisador </td> <td style="text-align:left;"> alemão </td> </tr> <tr> <td style="text-align:left;"> pesquisadores </td> <td style="text-align:left;"> debateram </td> </tr> </tbody> </table> #### Economia? Busquei na base de dados e encontrei um Grupo de pesquisa chamado **Economia de Comunhão** coordenado pela professora da UNIRIO Heloisa Borges, com uma forte agenda de atividades. Não conhecia esse grupo. Parece interessante. --- ## Palavras associadas a Matemática e a Estatística Como o DATAUNIRIO está vinculado ao Departamento de Métodos Quantitativos, busquei responder a seguinte pergunta: Qual a palavra associada a Estatística na UNIRIO? ### Matemática <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> word1 </th> <th style="text-align:left;"> word2 </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> matemática </td> <td style="text-align:left;"> básica </td> </tr> <tr> <td style="text-align:left;"> matemática </td> <td style="text-align:left;"> traz </td> </tr> </tbody> </table> ### Estatística <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> word1 </th> <th style="text-align:left;"> word2 </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> estatístico </td> <td style="text-align:left;"> gae </td> </tr> </tbody> </table> --- ## Análise de Sentimentos A análise de sentimentos busca identificar se a opinião que foi expressada em um determinado texto, é positiva ou negativa. Por exemplo, a palavra feliz tem uma polaridade positiva enquanto a palavra infeliz tem uma polaridade negativa. O gráfico a seguir mostrar as palavras mais utilizadas que contribuem para o sentimento positivo/negativo. Para a classificação dos sentimentos foi utilizado o OpLexicon 3.0 é como o léxico de sentimento para a língua portuguesa. [Disponível para download aqui](http://ontolp.inf.pucrs.br/Recursos/downloads-OpLexicon.php) --- <img src="analise_do_twitter_da_UNIRIO_files/figure-html/UNIRIOTIDY8-1.png" width="864" /> --- ## Conclusão 1. A quantidade de postagem da UNIRIO é do mesmo tamanho da UFRJ. 2. A comunicação da Unirio cumpre uma agenda de divulgação das ações da UNIRIO. 3. O Teatro e a Música da Unirio são importantes e tem a comunicação da Universidade como canal de divulgação. 4. A divulgação do Cardápio do restaurante escola é a ação mais comum da comunicação da UNIRIO. 5. CCET, CCJP, CCHS não apareceram em nenhuma análise. Isso pode ser uma falha de comunicação ou eles podem ter outros canais de divulgação. Provalvelmente, eles têm outros canais. Por exemplo, o evento mais importante da escola de matemática é o MATURCA. Essa palavra não aparece nenhuma vez no twitter da Unirio. A centralização em um canal poderia aumentar o alcance desse evento. 6. A previsão da próxima palavra funcionou, mas não consegui ter um resultado analítico (ainda). 7. A análise de sentimentos indica mais sentimentos positivos que negativos. --- ## Próximos passos 1. Comparar o Bigrama da UNIRIO com a UFF, UFRJ e com a UERJ. 2. Continuar a investigar a próxima palavra até ter um resultado analítico. 3. Construir um agrupamento de palavras. 4. Integrar essa análise com o Iramuteq. --- class: inverse, middle, center background-image: url(https://media.giphy.com/media/xUPOqo6E1XvWXwlCyQ/giphy.gif) background-size: contain <br> <br> <br> <br> <br> <br> <br> <br> <br> <br> <br> <br> **[Visite o site do DATAUNIRIO](https://dataunirio.github.io/)** --- class: inverse, middle, center background-image: url(https://media.giphy.com/media/12xSrwKxHxB3BS/giphy.gif) background-size: contain