Análise do programa de pós-graduação de Ciência Política da Universidade de Brasília
Análise do programa de pós-graduação de Ciência Política da Universidade de Brasília
Resumo
Esse artigo é dedicado a expor uma breve análise do programa de pós-graduação de Ciência Política da Universidade de Brasília (53001010026P2), utilizando a técnica CRoss Industry Standard Process for Data Mining. O objetivo é que partes interessadas no programa de pós-graduação em questão possam se utilizar da informações e análises disponíveis por este artigo para auxiliar nas tomadas de decisões que afetam o funcionamento dele.
Termos chave: Ciência Política, pós-graduação, Universidade de Brasília, CRIP-DM, ciência.
Introdução
A ciência é caracterizada pelo estudo metódico e organizado de fenômenos da natureza com a finalidade de descrever estruturas e comportamentos dos diversos fenômenos. Sendo a produção científica também um fenômeno, existe uma área dedicada a estudar sobre como o próprio conhecimento científico é gerado denominada cienciometria, que consiste de utilizar dados empíricos (quantitativos ou qualitativos) sobre produtos científicos como quantidade de artigos e publicações em revistas para analisar o desenvolvimento da ciência. Esse tipo de estudo tem sua relevância na medida que o esforço de pesquisadores e recursos disponíveis para geração de conhecimento e divulgação são escassos e, portanto, permitem decisões melhor embasadas sobre a gestão de projetos e de finanças, viabilizando maior eficiência na produção dos produtos científicos.
Como, no Brasil, a criação de conhecimento científico se dá principalmente pelas instituições ingressadas no Sistema Nacional de Pós-Graduação (SNPG), foi concebida a Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) para garantir e aprimorar a qualidade dos cursos da pós-graduação no país. A CAPES é encarregada de avaliar e reconhecer os programas de pós-graduação strictu sensu do Brasil, além de promover acesso a divulgação científica e investir em pesquisas de alto nível.
A avaliação dos programas pela CAPES constitui-se de uma nota em uma escala de 1 a 7. As notas CAPES 6 e 7 são apenas possíveis para programas de pós-graduação que contém cursos de doutorado. Notas CAPES inferiores a 3 são consideradas insuficientes e têm seus respectivos programas de pós-graduação cortados do SNPQ.
Além da avaliação do programa em si, há também a avaliação Qualis, que classifica os diversos periódicos e revistas de publicação científica em diferentes níveis de acordo com a confiabilidade da revista e do seu impacto social. Esses níveis são, em ordem crescente de relevância: C, B5, B4, B3, B2, B1, A2, A1. A avaliação Qualis serve como parâmetro de qualidade das publicações, criando uma medidade de qualidade para as publicações que se destaca das medidas quantitativas tradicionais.
Este trabalho busca trazer de modo cienciométrico, uma avaliação do programa de pós-graduação de Ciência Política da Universidade de Brasília (UnB) no período entre 2010 e 2019, tendo como interesse analisar o programa dentro do contexto da ciência brasileira, conforme o modelo de relatório da turma de Ciência de Dados para Todos da Universidade de Brasília. Portanto, a abordagem do problema visa à produzir análises descritivas, quantitativas e de modelagem computacional ou estatística, que permitam caracterizar como e porque ocorrem produções científicas no grupo de docentes do programa de pós-graduação de Ciências Políticas da UnB, tendo como produto um artefato que possa ser utilizado para auxiliar decisões de gerenciamento da CAPES, do Instituto de Ciência Política da UnB ou do Decanato de Pós-Graduação da UnB (DPG).
Metodologia
O modelo de referência adotado na metodologia de análise é o CRISP-DM, uma abreviação de Cross Industry Standard Process for Data Mining (Processo Padrão Inter-Indústrias para Mineração de Dados), pois é um modelo comumente utilizado por especialistas na área de mineração de dados e, portanto, permite um apoio sólido nos testes e histórico já bem sucedidos da implementação da metodologia, o que o torna uma ótima opção para gerar uma análise do programa de pós-graduação da UnB.
Ciclo de Vida do CRISP-DM
Ferramentas
A cada 4 anos, a CAPES disponibiliza na Plataforma Sucupira, dados sobre os programas de pós-graduação. Esses dados podem ser retirados na plataforma E-LATTES da UnB, que disponibiliza de forma acessível informações relevantes dos programas avaliados. A partir desses dados gerados na plataforma E-LATTES é realizada a base de dados utilizada por este trabalho de análise.
O tratamento dos dados é feito em linguagem R, fazendo uso do pacote de tratamentos de dados e exibição de gráficos Tidyverse, enquato a publicação é feita pelo site RPubs, que facilita publicações feitas em RMarkdown.
Entendimento do Negócio
Seguindo o modelo CRISP-DM, a primeira fase quando se trata de mineração de dados é o entendimento do que a organização avaliada almeja alcançar, afinal, não se teria direcionamento sobre que tipo de informações precisam ser avaliadas se não há direcionamento sobre o que deve ser conhecido.
O que é o Sistema Nacional de Pós-Graduação?
A produção do conhecimento científico, no Brasil, é predominantemente efetuada por meio do Sistema Nacional de Pós-Graduação - SNPG, e mais fortemente relacionada com a formação de doutores nesse sistema (Pátaro e Mezzomo, 2013), por meio de cursos de pós-graduação strictu sensu.
Fernandes e Sampaio (2017) já indicaram que a ciência é reconhecidamente um elemento essencial para o desenvolvimento social e econômico de qualquer nação. Assim sendo, faz-se necessário aprimorar o (SNPG) como forma de promoção deste crescimento, visando a maximizar o retorno decorrente do emprego dos recursos nele aplicados. A promoção do crescimento do SNPG se dá predominantemente por meio de avaliações regulares de seus programas de pós-graduação, sob responsabilidade da CAPES, que realiza a cada quatro anos um complexo (Leite, 2018, p. 13) e custoso processo de coleta de dados, análise e deliberação sobre as pós-graduações strictu sensu, em coerência com o estabelecido no Plano Nacional de Pós-Graduação (PNPG) 2012-2020 (CAPES, 2010) e nos diversos documentos que definem os critérios de organização da pós-graduação em cada área do conhecimento (CAPES, 2018). Leite (2018) faz uma apresentação geral de como se organizam e são avaliadas as pós-graduações no Brasil.
O Plano Nacional de Pós-Graduação (PNPG), por outro lado, define diretrizes estratégicas para desenvolvimento da pós-graduação brasileira, que deve abordar prioritariamente grandes temas de interesse nacional, tais como a redução das assimetrias de desenvolvimento entre as regiões do Brasil, a formação de professores para a educação básica, a formação de recursos humanos para as empresas, a resposta aos grandes desafios brasileiros sobre Água, Energia, Transporte, Controle de Fronteiras, Agronegócio, Amazônia, Amazônia Azul (Mar), Saúde, Defesa, Programa Espacial, além de Justiça, Segurança Pública, Criminologia e Desequilíbrio Regional. O PNPG também traça as diretrizes para financiamento da pós-graduação e sua internacionalização, apresentando conclusões e recomendações.
As avaliações do SNPG, ao atribuírem mensurações de desempenho às diversas pós-graduações que dele fazem parte, geram incentivos e penalidades aos programas, tendo em vista a limitada disponibilidade de recursos para investimento em bolsas, taxas de bancada etc. Embora o sistema seja altamente sofisticado ele é também altamente criticado (Azevedo et al., 2016), sobretudo porque há percalços na busca por um equilíbrio entre as diferentes concepções de finalidade da ciência. Se de um lado a promoção do conhecimento gerado predominantemente nas ditas ciências hard contribui para criar fluxos econômicos mais intensos, isso não significa que essa promoção possa ocorrer em detrimento da menor promoção na geração de conhecimento sobre problemas sociais, predominantemente gerado nas ditas ciências soft, especialmente das áreas de humanidades, sob pena de ampliação de desigualdades (Azevedo et al., 2016).
Não há solução simples, mas postula-se, nesta disciplina, que uma maior agilidade na avaliação e a utilização de critérios mais objetivos, poderá facilitar a melhoria do sistema.
O Colégio, A Grande Área e A Área
Desde 2018, as diversas áreas da pós-graduação brasileira foram organizadas na forma de colégios, grandes áreas e áreas. No caso, os conhecimentos da áreas de Ciência Política e Relações Internacionais se encontram no Colégio das Humanidades, na grande área das Ciências Humanas.
O Que A Organização Precisa Alcançar?
Vários stakeholders estão envolvidos no projeto em curso, e pode-se considerar cada um deles como distintas organizações que possuem interesses distintos e complementares. Elas são:
- A UnB, representada pelos decanatos de pós-graduação (DPG) e de pesquisa e inovação (DPI), que querem dispor de instrumentos para realização de avaliações contínuas de suas pós-graduações.
- O SNPG, que assim com o DPG e DPI, também pode se beneficiar do uso de instrumentos para realização de avaliações contínuas de suas pós-graduações.
- Os interessados em melhor conhecer o que é produzido pelo Sistema Nacional de Pós-graduação, como empresas privadas, que querem desfrutar dos benefícios gerados pela ciência brasileira.
A fim de dar maior fidelidade e homogeneidade ao exercício realizado na disciplina, focaremos em atendimento aos interesses comuns das organizações DPI, DPG e CAPES, que desejam dispor de instrumentos ágeis para avaliação contínua da pós-graduação brasileira.
Avaliação das Circunstâncias
Um limitador para o desenvolvimento da mineração e análise deste projeto é a questão do tempo disponível para a realização dele, pois ele teve seu início do dia 2019-08-16 e tem sua data de entrega no dia 2019-11-19 (3 meses). Este tempo é ainda mais escasso se levar em conta que o autor do documento e da análise é estudante de Engenharia da Computação e está no meio do semestre letivo.
Outra possível restrição é a base de dados do E-LATTES da UnB usada para esse projeto, que pode não conter informações suficientes para o objetivo do relatório. As informações poderiam até ser complementadas, contudo, por questão de tempo e recursos disponíveis, não é realizada uma exploração uma fonte alternativa de dados ou ser realizada uma nova pesquisa em campo.
Avaliação Preliminar da Pós-graduação de Ciência Política da UnB
O artefato utilizado para se realizar uma avaliação preliminar é a Ficha de Avaliação da Avaliação Quadrienal disponível na Plataforma Sucupira. Nesta ficha publicada em 2017, avaliadores da CAPES, julgam aspectos sobre proposta do programa, corpo docente, corpo discente, produção intelectual e inserção social do programa de pós-graduação em questão no quadriênio de 2013 a 2016.
1. Proposta do Programa
Conceito da Comissão: Muito Bom
Apreciação:
1.1. O programa ao longo do período avaliado passou a se dividir em duas áreas de concentração. A área Democracia e sociedade que inclui as linhas Democracia e desigualdades e Participação, Estado e sociedade civil. Já a área Política e instituições inclui as linhas Estado, economia e políticas públicas, e Instituições políticas. O alinhamento entre a área de concentração, linhas de pesquisa, projetos e estrutura curricular está bom e coerente. As linhas de pesquisa estão bem ajustadas à área de concentração. Outra constatação relevante é que suas linhas de pesquisa estão bem coerentes aos campos de especialização do corpo docente. Nota-se que a quantidade de disciplinas é suficiente para uma boa formação tanto teórica, quanto de pesquisa bem como metodológica.
1.2. O programa ampliou ações visando aumentar sua internacionalização, como aumento de convênios com instituições internacionais, elevou o número de publicações em periódicos estrangeiros, a participação em comitês de associações e de revistas acadêmicas, e a presença de pesquisadores e discentes estrangeiros no programa. O programa manteve procedimentos internos de avaliação e procedimentos de credenciamento e descredenciamento fixados no regimento da universidade e também no regimento interno. Em função disso, o grupo é composto tanto por pesquisadores experientes quanto por professores mais jovens. O número de docentes permanentes oscilou pouco, ficando entre 14 e 18 membros; os colaboradores chegaram a quatro. O programa de doutorado adotou estratégias adicionais para melhorar a qualidade do ensino e pesquisa de Pós-Graduação.
1.3 Apresenta infraestrutura muito boa para pesquisa e docência. Contam com laboratórios para seus vários núcleos de pesquisa e bases de dados públicos para investigações.
2. Corpo Docente
Conceito da Comissão: Muito Bom
Apreciação:
2.1. O corpo docente apresenta 18 docentes. Mas um grupo de 14 professores esteve presente em todo triênio, o que mostra muito boa estabilidade do quadro. O programa tem importante liderança institucional, por meio de participação de docentes em conselhos editoriais de revistas nacionais e internacionais, comissões e conselhos científicos nacionais e diretorias de associações acadêmicas, nacionais e internacionais. Há evidência de participação em várias redes internacionais de pesquisa, envolvendo instituições de Portugal, Argentina, França e Alemanha. A maioria do corpo docente é formada por brasileiros com doutorados no exterior, com forte presença da academia norte-americana e três docentes permanentes são estrangeiros.
2.2. O corpo docente está adequado às atividades de ensino, orientação e pesquisa. A relação entre orientandos e docentes permanente ficou em 5,5, revelando uma boa distribuição. No que diz respeito à correlação com a produtividade, a UnB aumentou consideravelmente sua produção em termos do IPQr alcançado no quadriênio 2013-16 mais de 100.5, ficando na terceira posição em relação aos outros Programas. Importante ainda ressaltar que embora metade dos docentes tenha Bolsa Produtividade, sua produtividade está muito acima do esperado.
2.3. No que diz respeito a relação entre atividades de pesquisa, formação e produtividade científica o Programa atendeu muito bem a todas as condições avaliadas. A relação média de orientandos por docente ficou com menos de oito orientandos por docente permanente ficando situada no intervalo >3<8; apresentaram <10% dos docentes permanentes sem orientação: nenhum. A participação em projetos de pesquisa (com financiamento por agências de fomento nacionais) apresenta melhor distribuição entre docentes. Todos os nove projetos do Programa envolvem ao menos dois docentes permanentes, ocorrendo 3 Projetos com os mesmos dois professores. As pesquisas incluem vários discentes. Dos projetos, seis deles estão vinculados a área temática Democracia e Desigualdade e 3 à área Política e Instituição. Não houve menção a financiamentos a cada projeto. Mas o Programa conta com 11 financiadores.
3. Corpo Discente, Teses e Dissertações
Conceito da Comissão: Muito Bom
Apreciação:
3.1. A capacidade de formação de doutores do Programa é muito boa. O ITE/a foi de 0,15, ficando na quarta posição entre os Programas. Já na formação de mestres é regular, ficando com IME/a no terceiro quartil (0,93).
3.2. Todos os docentes tiveram pelo menos um orientando que concluiu seu trabalho final defendido. As orientações em curso estão bem distribuídas pelo corpo docente não se concentrando nos professores com maior produção bibliográfica, nem nos com menor.
3.3. A proporção de trabalhos apresentada nos principais eventos científicos nacionais e internacionais e a publicação discente em relação à dimensão do corpo discente é muito boa, situando-se no primeiro quartil do IPDi, na nona posição.
3.4. Tempo médio de defesa do Programa de Pós-Graduação: mestrado = 26,0 e doutorado = chegou a 54,86, ficando, portanto dentro do tempo esperado.
4. Produção Intelectual
Conceito da Comissão: Muito Bom
Apreciação:
4.1. Publicação per capita por docente permanente de artigos em periódicos Qualis A1, A2 e B1 (IPQ-r) é alta, ficando com 78,6 pontos. Seu IPQ-r/a foi de 106,1, assumindo a terceira posição entre os demais Programas. Produção de livros e capítulos ranqueou em 8º lugar na área, com 0,38 per capita. Ipqr/a = 106,1 e Ipqi/a = 0,38.
4.2. 78,6 % dos DP publicaram artigo A1, A2 ou B1 no período, ficando acima dos 75% indicado pelo Documento da área.
4.3. O IPTe/a ficou próximo a 51.0, localizando-se no terceiro quartil, com maior produção de relatórios de pesquisa feitos para instituições públicas e agências de fomento à pesquisa. O ITDo/a foi de 2,5 e o ITDi/a foi 0,4, ficando os dois índices no terceiro quartil. Organização de bancos de dados de acesso público.
Parecer da comissão de área sobre o mérito do programa
Conceito da comissão: 6
Apreciação:
O PPG-CP da Universidade de Brasília apresenta consistente proposta de programa, verificando- linhas de pesquisa bem congruentes à área de concentração. Essas estão claramente definidas e bem ajustadas aos campos de especialização do corpo docente. As ementas das disciplinas são coerentes e a bibliografia plenamente atual. O desenho da grade de disciplinas da pós-graduação continua muito bom, incluindo tanto a teoria como a parte mais empírica da ciência política, incluindo ao menos dois cursos de metodologia e importantes bancos de dados disponibilizados para o público.
No que que se refere a sua evolução, verificou-se um ótimo desenvolvimento no quadriênio, que se expressa marcadamente na produção de artigos científicos de qualidade, ranqueada em 3º lugar na área. Além disso, aumentou consideravelmente o número de capítulos e livros publicados nesse período. Já no que diz respeito a distribuição das atividades de pesquisa e formação houve grande melhora, apresentando correlação forte (r=0,53) entre a média de orientações e produções qualificadas entre os docentes permanentes. O número de teses de doutorado defendido também teve um aumento substancial, chegando a quarta posição da área ao final de 2016. No tocante a qualidade dessa produção e também de outras produções discentes, medida pelo IPDI/a, foi considerada muito boa, demonstrando que os discentes do programa são muito ativos e produtivos. Oito estudantes receberam bolsa sanduíche para estágio no exterior, no período, o que é uma boa proporção. Observa-se, também, muito boa distribuição entre número de orientandos e docentes permanentes havendo equilíbrio entre essas atividades. Há, ainda, uma produção forte de relatórios de pesquisa feitos para instituições públicas e agências de fomento à pesquisa.
No quesito internacionalização o PPG-CP da UnB apresentou forte aumento da inserção em redes internacionais, especialmente em função da formação de muitos professores em universidades da Europa e dos Estados Unidos e da participação destes em grupos de pesquisa. O impacto dessa inserção pode ser visto em termos de publicações internacionais (periódicos e livros científicos por editoras internacionais), pela participação e organização de congressos e seminários realizados em outros países, e, especialmente, pela realização de convênios, resultando em 17 projetos de cooperação e pesquisa no quadriênio com diversos países.
A edição da Revista Brasileira de Ciência Política, Qualis B1, vem conferindo ampla visibilidade ao programa. Ademais, o programa demonstra liderança institucional, por meio de elaboração de pareceres para revistas científicas Qualis e para agências de fomento nacionais e internacionais, bem como pela participação de docentes em conselhos editoriais de revistas nacionais e internacionais, comissões e conselhos científicos nacionais e diretorias de associações acadêmicas, especialmente internacionais.
No que se refere ao acompanhamento dos egressos percebe-se que uma parcela importante dos discentes que realizaram o mestrado no PPG-CP têm seguido sua formação por meio do doutorado no próprio programa, enquanto um número menor tem ido para programas de reconhecida qualidade, como os da USP, UFMG, UERJ, UFRGS e no exterior. Os doutores formados no IPol atuam, sobretudo, como professores (Instituto Federal de Brasília, PUC-GO, UFJF) ou em carreiras de Estado.
Foi digno de nota, a ampliação da capacidade de nucleação do IPOL à medida que seus docentes e discentes vem assumindo posições de liderança na academia e na sociedade. Assim, recomenda-se a subida da nota para 6.
Entendimento dos Dados
O entendimento dos dados é a segunda fase do modelo CRISP-DM. Trata-se determinar quais são os dados disponíveis e que tipo de conhecimentos são possı́veis de se extrair deles.
Coleta Inicial dos Dados
Para a obtenção dos dados, utilizou-se a ferramenta E-LATTES da UnB, que coleta informações do site Sucupira e os transforma em arquivos de formato JSON a medida que o usuário do site solicita. Seus recursos tornam-a uma ferramenta prática para compilar dados de docentes do curso de pós-graduação e disponibiliza-los.
Perfil Profissional dos Docentes
O arquivo Dados Ciência Política/profile.json apresenta dados sobre o perfil de todos os docentes vinculados ao programa de pós-graduação de Ciência Política da UnB, entre 2010 e 2019.
Orientações de Mestrado e Doutorado Realizadas Pelos Docentes
O arquivo Dados Ciência Política/advise.json apresenta dados sobre o orientações de mestrado e doutorado feitas por todos os docentes vinculados ao programa de pós-graduação de Ciência Política da UnB, entre 2010 e 2019.
Produção Bibliográfica Realizada Pelos Docentes
O arquivo Dados Ciência Política/publication.json apresenta dados sobre a produção bibliográfica gerada por todos os docentes vinculados ao programa de pós-graduação de Ciência Política da UnB, entre 2010 e 2019.
Redes de Colaboração Entre Docentes
O arquivo Dados Ciência Política/graph.json apresenta redes de colaboração na co-autoria de artigos científicos, feitas entre os docentes vinculados ao programa de pós-graduação de Ciência Política da UnB, entre 2010 e 2019.
Descrição dos Dados
A descrição dos dados verifica se os dados sendo acessados terão potencial para responder às questões de data mining. Além disso, deve-se avaliar qual o volume de dados, a estrutura dos dados (tipos), codificações usadas, etc.
Para ler e manipular inicialmente esses dados, serão usadas primordialmente as bibliotecas seguintes:
library(igraph)
library(jsonlite)
library(tidyverse)
library(tm); library(tokenizers)
library(wordcloud)Descrição dos Dados dos Perfis Profissionais
Dados Ciência Política/profile.json é um arquivo que contém um compilado de informações dos perfis dos docentes do programa de pós-graduação.
O arquivo pode ter um formato de lista pelo comando:
No caso desta avaliação, foram encontrados 19 docentes para essa avaliação.
Cada registro de perfil, tem os seguintes campos de informações:
| x |
|---|
| nome |
| resumo_cv |
| areas_de_atuacao |
| endereco_profissional |
| producao_bibiografica |
| orientacoes_academicas |
| senioridade |
Os conteúdos internos a cada um dos campos de informações citados aqui não serão abordados pois podem ser melhor entendidos por meio de outros arquivos que contém conteúdo específico e cada registro de perfil apresenta muitas informações que deixariam o texto mais extenso do que o pretendido.
Descrição dos Dados das Orientações
Dados Ciência Política/advise.json é um arquivo que contém dados relativos às orientações dos docentes fornecidas aos discentes do programa de pós-graduação de Ciência Política.
Para transformar o conteúdo do arquivo para o formato de lista, utiliza-se o comando:
No arquivo, os conteúdos das orientações estão separados por seus status de conclusão e nível (em questão de nível de escolaridade dos discentes). Depois dessa separação, o arquivo também divide os registros das orientações nos anos de cada uma dessas orientações.
Exemplos de orientações concluídas de doutorado iniciado no ano de 2018 são mostradas na tabela abaixo.
Descrição dos Dados de Produção Bibliográfica
Dados Ciência Política/publication.json é o arquivo relativo às publicações dos docentes, contendo título das publicações, ano, natureza.
Para transformar o conteúdo do arquivo para lista, utiliza-se o comando:
O arquivo divide as publicações em diferentes tipos:
| Tipos de publicações |
|---|
| PERIODICO |
| LIVRO |
| CAPITULO_DE_LIVRO |
| TEXTO_EM_JORNAIS |
| EVENTO |
| ARTIGO_ACEITO |
| DEMAIS_TIPOS_DE_PRODUCAO_BIBLIOGRAFICA |
Exemplos de cada um desses tipos de registros podem ser encontrados nas tabela abaixo.
Descrição dos Dados de Rede de Colaboração
Dados Ciência Política/graph.json é um arquivo que contém informações sobre colaborações entre os docentes para originar um produto científico. Essas informações estão abstraídas no formato de grafos, em que os vértices representam os docentes do programa de pós-graduação de Ciência Política e as arestas modelam as colaborações entre os docentes, em que o peso é o número de vezes que a colaboração entre dois docentes ocorreu.
Para transformar o conteúdo do arquivo para lista, utiliza-se o comando:
Exemplos de docentes representados por nós podem ser encontrados na tabela abaixo:
Cada um dos nós apresenta como propriedade apenas os nomes dos docentes os quais representam, conforme a tabela abaixo:
Cada aresta contém o id de dois docentes e um peso que significa o número de vezes que esses dois docentes colaboraram em algum projeto, conforme a tabela abaixo.
Análise Exploratória dos Dados e Verificação de Qualidade
Os dados, já descritos, os quais esse trabalho se utilizará possui margens para se estudar em que os docentes do programa de pós-graduação da UnB atuam. Com eles, é possível buscar sobre as área de atuação, que tipo de publicação os docentes vem fazendo e também qual é o currículo dos docentes.
Os dados sobre eventos e publicações também permitem entender sobre as cooperações internacionais para a produção científica e sobre a área de interesse dos docentes. Também é possível se observar, com esses dados sobre as publicações, quais são os principais financiadores das orientações no programa de pós graduação.
A cooperação entre os docentes também permite que se estude hipóteses sobre o que levam docentes a cooperar entre si a fim de produzir um novo conteúdo científico. O entendimento sobre o que leva a cooperações entre os docentes é importante para que os interessados no programa tenham mais ferramentas para incentivar ainda mais cooperações.
Preparação dos Dados
A fase de preparação dos dados é responsável por filtrar os dados, retirando partes que não interessam e selecionando os campos necessários para o trabalho de mineração.
Para que se realize a preparação dos dados, serão utilizados os scripts fornecidos pelos professores da matéria no arquivo script/elattes.ls2df.R. Os scripts deste arquivo tornam possível a transformação dos principais dados do conjunto original em tabelas de dados ou grafos no formato igraph, da biblioteca igraph.
source("script/elattes.ls2df.R")
perfis <- extrai.perfis(profile.json)
publicacoes_periodico <- pub.ls2df(publication.json, 1)
publicacoes_livro <- pub.ls2df(publication.json, 2)
publicacoes_capitulo <- pub.ls2df(publication.json, 3)
publicacoes_texto_jornal <- pub.ls2df(publication.json, 4)
eventos <- pub.ls2df(publication.json, 5)
publicacoes_artigo_aceito <- pub.ls2df(publication.json, 6)
publicacoes_demais <- pub.ls2df(publication.json, 7)
orientacoes <- extrai.orientacoes(profile.json)
areas_de_atuacao <- extrai.areas.atuacao(profile.json)
colaboracao <- g.ls2ig(graph.json)Seleção dos Dados
perfis <- perfis %>% select(idLattes, nome, resumo_cv)
publicacoes_periodico <- publicacoes_periodico %>% select(titulo, periodico, ano, autores)
publicacoes_livro <- publicacoes_livro %>% select(titulo, pais_de_publicacao, autores, ano)
publicacoes_capitulo <- publicacoes_capitulo %>% select(titulo_do_capitulo, titulo_do_livro, ano, pais_de_publicacao)
publicacoes_texto_jornal <- publicacoes_texto_jornal %>% select(titulo, periodico, ano, autores)
eventos <- eventos %>% select(titulo, nome_do_evento, ano_do_trabalho, pais_do_evento, classificacao, autores)
publicacoes_artigo_aceito <-publicacoes_artigo_aceito %>% select(titulo, periodico, ano, autores)
publicacoes_demais <- publicacoes_demais %>% select(natureza, titulo, ano, pais_de_publicacao, autores)
orientacoes <- orientacoes %>% select(titulo, ano, bolsa, agencia_financiadora, nome_orientadores, orientacao)
areas_de_atuacao <- areas_de_atuacao %>% select(grande_area, area, sub_area, especialidade, nome, idLattes)Construção dos Dados
publicacoes_periodico <- publicacoes_periodico %>% mutate(ano = as.integer(ano)); QUALIS_LEVELS = c("C", "B5", "B4", "B3", "B2", "B1", "A2", "A1")
publicacoes_livro <- publicacoes_livro %>% mutate(ano = as.integer(ano))
publicacoes_capitulo <- publicacoes_capitulo %>% mutate(ano = as.integer(ano), pais_de_publicacao = as.factor(pais_de_publicacao))
publicacoes_texto_jornal <- publicacoes_texto_jornal %>% mutate(ano = as.integer(ano))
eventos <- eventos %>% mutate(ano_do_trabalho = as.integer(ano_do_trabalho), pais_do_evento = as.factor(pais_do_evento), classificacao = if_else(classificacao == "INTERNACIONAL", "Internacional",
if_else(classificacao == "NACIONAL", "Nacional",
"Não informado"))
)
publicacoes_artigo_aceito <- publicacoes_artigo_aceito %>% mutate(ano = as.integer(ano))
publicacoes_demais <- publicacoes_demais %>% mutate(natureza = as.factor(natureza), ano = as.integer(ano), pais_de_publicacao = as.factor(pais_de_publicacao))
orientacoes <- orientacoes %>% mutate(ano = as.integer(ano), bolsa = as.factor(bolsa),
status = factor(if_else(grepl("CONCLUIDA", orientacao), "Concluído", "Em andamento"),
ordered = TRUE, levels = c("Em andamento", "Concluído")),
nivel = if_else(grepl("INICIACAO_CIENTIFICA", orientacao), "Iniciação científica",
if_else(grepl("GRADUACAO", orientacao), "Graduação",
if_else(grepl("MESTRADO", orientacao), "Mestrado",
if_else(grepl("DOUTORADO", orientacao), "Doutorado",
"Outro")))),
bolsa = if_else(bolsa == "SIM", "Sim", "Não")
) %>%
select(-orientacao) %>% filter(nivel %in% c("Mestrado", "Doutorado")) %>%
mutate(nivel = factor(nivel, ordered = TRUE, levels = c("Mestrado", "Doutorado")))
areas_de_atuacao <- areas_de_atuacao %>%
mutate(grande_area = if_else(grande_area == "CIENCIAS_SOCIAIS_APLICADAS", "Ciêcias Sociais Aplicadas",
if_else(grande_area == "CIENCIAS_HUMANAS", "Ciências Humanas",
"Outro"))
) %>% mutate(grande_area = as.factor(grande_area), area = as.factor(area), sub_area = as.factor(sub_area), especialidade = as.factor(especialidade))Avaliação
Áreas de Atuação dos Docentes
Estudar sobre as áreas de atuação dos docentes é importante para se explorar sobre as possibilidades que o programa de pós-graduação possui com seus recursos humanos. Também é importante se obter uma breve análise da distribuição de especialidades entre os docentes.
Grande Área de Atuação
areas_de_atuacao %>%
select(idLattes, grande_area) %>% distinct() %>% group_by(grande_area) %>% summarise(quantidade = n()) %>%
ggplot(aes(reorder(grande_area, quantidade), quantidade)) + geom_bar(stat = "identity") +
geom_text(aes(label = quantidade), hjust = -0.4) +
scale_x_discrete(labels = function(x) str_wrap(x, width = 15)) +
labs(title = "Grande área de atuação dos docentes", x = "Grande área", y = "Quantidade") +
theme_minimal() + coord_flip() + ylim(0, 20)O gráfico acima mostra que de todos os docentes encontrados, todos se encontram na grande área da Ciências Humanas, mas encontramos aluguns docentes que atuam na grande área da Ciências Sociais Aplicadas
Área de Atuação
areas_de_atuacao %>%
select(idLattes, area) %>% distinct() %>% group_by(area) %>% summarise(quantidade = n()) %>%
ggplot(aes(reorder(area, quantidade), quantidade)) + geom_bar(stat = "identity") +
geom_text(aes(label = quantidade), hjust = -0.4) +
scale_x_discrete(labels = function(x) str_wrap(x, width = 15)) +
labs(title = "Área dos docentes", x = "Área", y = "Quantidade") +
theme_minimal() + coord_flip() + ylim(0, 20)Pelo gráfico acima, percebe-se que a maioria dos docentes têm atuação na grande área da Ciência Política, como era de se esperar. Contudo, há uma boa distribuição de atuação de áreas entre outras ciências humanas.
Subárea de Atuação
areas_de_atuacao %>%
select(idLattes, sub_area) %>% distinct() %>% filter(sub_area != "") %>% group_by(sub_area) %>% summarise(quantidade = n()) %>%
ggplot(aes(reorder(sub_area, quantidade), quantidade)) + geom_bar(stat = "identity") +
geom_text(aes(label = quantidade), hjust = -0.4) +
labs(title = "Subárea dos docentes", x = "Subárea", y = "Quantidade") +
theme_minimal() + coord_flip() + ylim(0, 20) + scale_x_discrete(labels = function(x) str_wrap(x, width = 20))Como pode ser visto no gráfico acima, a subárea de atuação dos docentes estão divididas em 33 categorias. Porém, é notável a relevância das sub-áreas de Comportamento Político, Estado e Governo, Teoria Política e Políticas Públicas devido a quantidade de docentes nessas sub-áreas.
Especialidade
areas_de_atuacao %>%
select(idLattes, especialidade) %>% distinct() %>% filter(especialidade != "") %>% group_by(especialidade) %>% summarise(quantidade = n()) %>%
ggplot(aes(reorder(especialidade, quantidade), quantidade)) + geom_bar(stat = "identity") +
geom_text(aes(label = quantidade), hjust = -0.4) +
scale_x_discrete(labels = function(x) str_wrap(x, width = 30)) +
labs(title = "Especialidade dos docentes", x = "Especialidade", y = "Quantidade") +
theme_minimal() + coord_flip() + ylim(0, 20)Dentre as especialidades dos docentes, observa-se uma vasta distribuição de atuação. Pois, na exceção de Estudos Eleitorais e Partidos Políticos, nenhuma outra especialidade teve trabalhos de mais de três docentes.
Currículos dos Docentes
O objetivo de se analisar o currículo dos docentes é compreender sobre quais são os pontos mais importantes declarados pelos docentes. Os curriculos que serão analisados são aqueles que os docentes publicam na plataforma E-Lattes.
Para tratar os textos do currículo, os textos têm de ser limpados, nesse caso, serão: - retirados as pontuações do texto, - retirados todos os números, - todas as letras serão transformadas em minúsculo, - retiradas palavras recorrentes no contexto que não possuem valor para a análise. - retirados espaços duplos.
limparTextos <- function(textos) {
textos_limpos <- textos %>%
removePunctuation() %>%
removeNumbers() %>%
tolower() %>%
removeWords(words = c(stopwords("en"), stopwords("pt"), "ciência", "política", "universidade", "brasília")) %>%
stripWhitespace()
textos_limpos
}Para esta análise, as palavras do texto serão identificadas em duplas, portanto não serão analisados as palavras individualmente, mas nos pares que se acompanham.
Para que fosse visualmente mais fácil reconhecer os termos mais usados nos currículos, foi elaborado uma nuvem de palavras, em que termos mais repetidos fossem maiores visualmente do que termos poucos usados.
freqTerms <- function(textos, tokenize = tokenizer) {
documentos <- textos %>%
limparTextos() %>%
tokenize()
termos <- character()
for (i in 1:length(documentos)) {
termos <- c(termos, documentos[[i]])
}
data.frame(Termo = termos) %>% group_by(Termo) %>% summarise(Freq = n()) %>% arrange(desc(Freq))
}termos_curriculos <- freqTerms(perfis$resumo_cv)
wordcloud(termos_curriculos$Termo, termos_curriculos$Freq, max.words = 20, colors = topo.colors(20))Pela nuvem de palavras se observa que os pesquisadores têm destacado estudos em Democracia e Desigualdades e Políticas Públicas. Também é possível identificar que uma região de foco dos docentes é a América Latina.
O foco dos estudos dos docentes em Democracia e Desigualdades já havia sido identificado pela Avaliação Quadrienal da CAPES no tópico de proposta do programa, portanto, é natural que os pesquisadores exponham seu foco de estudos no próprio currículo Lattes. Outro foco de estudos identificado pela Avaliação Quadrienal é Participação, Estado e Sociedade Civil, que se relaciona diretamente com Políticas Públicas, área citada nos currículos Lattes.
Publicações dos Docentes
Publicações em Periódicos
Periódicos com Mais Publicações Entre Os Docentes
Aqui, o objetivo é entender sobre a qualidade da publicação dos docentes do programa. Para tanto, é necessário verificar quais são os periódicos em que há mais publicações de produções científicas dos docentes.
Para este trabalho foram encontrados um total de 242 publicações em periódicos e a quantidade de publicações dos 5 periódicos mais usados pelos docentes estão colocados no gráfico abaixo.
publicacoes_periodico %>%
group_by(periodico) %>% summarise(quantidade = n()) %>% arrange(desc(quantidade)) %>% top_n(5) %>%
mutate(Qualis = factor(c("B1", "A1", "A2", "B5", "A1"), levels = QUALIS_LEVELS)) %>% # Níveis baseados na pesquisa realizada na Qualis
ggplot(aes(x = reorder(periodico, quantidade), quantidade, fill = Qualis)) + geom_bar(stat = "identity") +
geom_text(aes(label = quantidade), hjust = -0.4) +
theme_minimal() + coord_flip() + ylim(0, 25) +
scale_x_discrete(labels = function(x) str_wrap(x, width = 15)) +
labs(title = "Quantidade de publicações por periódico", x = "Periódico", y = "Quantidade", fill = "Nível Qualis")Pelo gráfico acima, nota-se que a revista mais utilizada como veículo de divulgação de artefatos produzidos pelos docentes é a Revista Brasileira de Ciência Política (Impresso), provavelmente devido ao fato de essa revista ser da própria Universidade de Brasília. Ainda pelo gráfico acima, percebe-se que dois dos principais periódicos utilizados pelos docentes são de nível A1, o que significa alta qualidade do conteúdo produzido no programa de pós-graduação.
Docentes com Mais Publicações em Periódicos
Neste tópico, o objetivo é analisar os docentes (ou conjunto de docentes) que têm mais influência no número de publicações em periódico. Para isso, a tabela abaixo foi montada colocando-se os autores de publicações em uma coluna e a quantidade de publicações em outra.
É importante salientar que, na tabela acima, não se contabiliza a quantidade de publicações de um autor, mas do conjunto de autores que participaram da produção do conteúdo científico.
Pela tabela acima, observa-se que (MIGUEL, L. F.) possui o dobro de publicações em periódicos do que (NASCIMENTO, Paulo César), que já era o segundo conjunto de autores com mais publicações. Além disso, o (MIGUEL, L. F.) aparece no conjunto de autores que mais publicam mais de uma vez em diferentes grupos de autores, portanto, revela-se uma grande influência para a quantidade de publicações realizadas por docentes do programa de pós-graduação da UnB. Portanto, uma pergunta natural seria: “Quais as revistas em que (MIGUEL, L. F.) mais publicou?”. Indo além, quais são os grupos de pesquisadores que mais publicaram na Revista Brasileira de Ciência Política? Para responder essas questoes, foram montadas as duas tabelas abaixo.
periodico_mais_recorrente <- publicacoes_periodico %>% group_by(periodico) %>% summarise(quantidade = n()) %>% arrange(desc(quantidade)) %>% top_n(1) %>% select(periodico) %>% as.character()
publicacoes_periodico %>% filter(periodico == periodico_mais_recorrente) %>% group_by(autores) %>% summarise(quantidade = n()) %>% arrange(desc(quantidade)) %>% top_n(5)Percebe-se, pelas tabelas acima, que boa parte das publicações do (MIGUEL, L. F.) são na própria revista da UnB, Revista Brasileira de Ciência Política, revelando a relevância que a revista da universidade tem.
Publicações em Livros
O objetivo se avaliar sobre as publicações em livros dos docentes vem da necessidade de se entender como se ocorre a produção de livros dos pesquisadores, como por exemplo se os livros são lançados no Brasil ou no Exterior e a quantidade de livros que cada docente produz.
Países de publicação dos livros
A tabela abaixo foi criada para que se possa identificar em que países os docentes estão publicando seus livros.
Como pode ser verificado, o Brasil é o país em que os docentes publicam majoritariamente os livros, porém, observa-se uma alta relativa quantidade de publicações de livros em países cuja língua é o Inglês, provavelmente devido a docentes de origem estadunidense, como foi identificado na avaliação quadrienal da CAPES.
Docentes que mais publicam
Para se visualizar quais são os docentes que mais produziram conteúdo em formato de livro, foi feita a tabela abaixo, indicando em uma coluna os conjuntos de autores que produziram um livro e, na coluna da direita, a quantidade de livros publicados por este conjunto.
Como pode ser visto, o (MIGUEL L. F.) é novamente um expoente, mas dessa vez na quantidade de livros publicados e não mais em quantidade de publicações em periódicos, pois foi o autor que mais publicou livros individualmente e também está em mais de um conjunto de autores dentre os que mais publicaram livros.
Docentes que mais publicaram no exterior
O programa de pós-graduação de Ciência Política da UnB não possui muitas publicações de livros no exterior, o que tornou possível a confecção da tabela abaixo, a qual informa quais são os livros dos docentes do programa.
Os autores que publicaram livros no exterior podem ser vistos pela tabela abaixo, organizados por quantidade.
Temas das Publicações
Para que se possa identificar os temas de publicações dos docentes, será realizada uma análise de sacola de palavras novamente, utilizando as mesmas técnicas de tratamentos de termos utilizadas para se analisar os currículos dos docentes. Desta vez, porém, os textos a serem utilizadas para análise são os títulos das publicações dos docentes.
titulos <- c(publicacoes_periodico$titulo, publicacoes_livro$titulo, publicacoes_capitulo$titulo_do_livro, publicacoes_capitulo$titulo_do_capitulo, publicacoes_texto_jornal$titulo, publicacoes_artigo_aceito$titulo, publicacoes_demais$titulo)
termos <- freqTerms(titulos)
wordcloud(termos$Termo, termos$Freq, max.words = 50, colors = topo.colors(50))Pelos termos mais usados em títulos das publicações, é possível notar que boa parte do que é publicado se refere à assuntos de origem Feminista, políticas públicas, meio ambiente.
Quanto às regiões mencionadas nos títulos das publicações, estão notadas a América Latina e o Distrito Federal. É importante notar que o termo América Latina foi escrito muitas vezes em inglês, dando a entender que faz parte de publicações internacionais que abordam temas desta região explicada para estrangeiros.
Eventos com Participações dos Docentes
Participação em eventos é a forma em que pesquisadores de áreas semelhantes de atuação discutem sobre conhecimentos adquiridos e trabalhos sendo realizados por estes, como uma forma de divulgar novos conhecimentos e produtos científicos.
Docentes Mais Presentes em Eventos
Para uma primeira análise sobre os eventos, é interessante compreender quais grupos de pesquisadores mais organizam divulgações em eventos.
Novamente se percebe a influência (MIGUEL, L. F.) em divulgação científica dentro do grupo dos docentes analisados. Mas, quanto a eventos, (ALMEIDA, D. R.) é o docente que mais tem participação individualmente.
Eventos Quanto a Nacionalidade e Classificação
Para se ter uma noção de como se encontra o programa de pós-graduação no cenário internacional, foi produzido o gráfico abaixo que informa a quantidade de eventos quanto ao país do evento e a sua classificação (Nacional ou Internacional).
eventos %>% group_by(pais_do_evento, classificacao) %>% summarise(quantidade = n()) %>%
ggplot(aes(classificacao, pais_do_evento, size = quantidade)) + geom_point() +
labs(title = "Eventos Quanto a País e Classificação", x = "Classificação", y = "País", size = "Quantidade") +
scale_y_discrete(labels = function(x) str_wrap(x, width = 10)) +
geom_text(aes(label = quantidade), vjust = -1.1, size = 3)Sem surpresas, pelo gráfico, fica evidente que a maiorias das participações dos docentes em eventos são em eventos no país, todavia, grande parte destes estão configurados como eventos internacionais. Foram identificados muitos eventos nos Estados Unidos com participações de docentes também, provavelmente devido a rede de colaboração internacional e aos docentes estadunidenses identificados pela Avaliação Quadrienal da CAPES.
Docentes com Mais Participações em Eventos Internacionais
A fim de identificar quais são os docentes responsáveis pela quantidade relativamente grande de participações em eventos nos Estados Unidos, foi produzida a tabela abaixo.
eventos %>% filter(classificacao == "Internacional") %>% group_by(autores) %>% summarise(quantidade = n()) %>%
arrange(desc(quantidade)) %>% `colnames<-`(c("Autores", "Quantidade de Eventos nos Estados Unidos"))Docentes com Mais Participações nos Estados Unidos
eventos %>% filter(pais_do_evento == "Estados Unidos") %>% group_by(autores) %>% summarise(quantidade = n()) %>%
arrange(desc(quantidade)) %>% top_n(5)Apesar de (Rennó, L.) ser o docente com mais participações individuais em eventos nos Estados Unidos, não foi possível identificar um responsável único pela quantidade de participações em eventos estadunidenses, conforme pode ser verificado na tabela acima.
Temas dos Eventos
Para se estudar os principais temas dos eventos com participações dos docentes, será utilizado o mesmo método de estudo utilizado anteriormente, o sacola de palavras, em que separa diferentes termos usados nos títulos dos eventos dos docentes e se observa a frequência com que esses termos aparecem.
nomes_dos_eventos <- freqTerms(eventos$titulo)
wordcloud(nomes_dos_eventos$Termo, nomes_dos_eventos$Freq, max.words = 50, colors = topo.colors(50))Como pode ser observado, os principais temas de apresentação dos docentes nos eventos são sobre políticas públicas, democracia e sociedade civil.
Orientações
Uma das formas mais comuns de produção cientı́fica em programas de pós-graduação são as orientações oferecidas pelos docentes aos discentes, em que estes procuram publicar algum artefato científico no final de seu trabalho. Isto faz das orientações um marco para se entender o que o programa de pós-graduação cria em sua atividade.
Docentes que Mais Orientaram
Em questão de números, o programa de pós-graduação possuiu, no intervalo observado, 153 orientações concluídas.
Para que se pudesse observar quais são os docentes que mais tiveram impacto nesse número, foi construída a tabela abaixo.
Se pode observar um possível trade-off entre quantidade de orientações fornecidas e outras publicações ou eventos de autores, pois, no caso das orientações, nem (MIGUEL, L. F.) que era a referência na quantidade de publicações em periódicos e nem (ALMEIDA, D. R.) que possui a maior parte de participações em eventos foram destaques em quantidade de orientações fornecidas.
orientacoes %>% group_by(nome_orientadores, status) %>% summarise(quantidade = n()) %>%
ggplot(aes(reorder(nome_orientadores, quantidade), quantidade, fill = status)) + geom_bar(stat = "identity") +
facet_grid(.~status) + coord_flip() +
scale_y_discrete(labels = function(x) str_wrap(x, width = 10)) + geom_text(aes(label = quantidade), hjust = -0.1, size = 3) + theme_minimal() + ylim(0, 25) +
labs(title = "Distribuição das orientações por status", x = "Docente", y = "Status", fill = "") +
scale_x_discrete(labels = function(x) str_wrap(x, width = 20))Distribuição de Bolsas de Orientação
Um aspecto que pode ser de interesse comum entre as várias partes interessadas, é sobre quais são os orientadores que mais captam bolsas para seus projetos de orientação. Para auxiliar na resposta, a tabela abaixo coloca cada docente ao lado da quantidade de projetos com financiamento que o docente realizou.
orientacoes %>% group_by(nome_orientadores, bolsa) %>% summarise(quantidade = n()) %>%
ggplot(aes(reorder(nome_orientadores, quantidade), quantidade, fill = bolsa)) + geom_bar(stat = "identity") +
facet_grid(.~bolsa) + coord_flip() +
scale_y_discrete(labels = function(x) str_wrap(x, width = 10)) + geom_text(aes(label = quantidade), hjust = -0.1, size = 3) + theme_minimal() + ylim(0, 25) +
labs(title = "Distribuição das Orientações por Bolsa", x = "Docente", y = "Bolsa", fill = "Bolsa") +
scale_x_discrete(labels = function(x) str_wrap(x, width = 20))Como pode ser observado pelo gráfico acima, Flávia Millena Biroli Tokarski é a docente que mais conseguiu bolsas para os projetos em que orientou.
Análise de Colaborações
Análises dos grupos de colaboração servem principalmente para que se identifiquem grupos que colaboram entre si e se entenda o que faz dois docentes trabalharem em conjunto em um mesmo projeto.
Nessa análise de colaborações, cada docente é representado por um vértice em um grafo, e cada aresta representa uma ligação entre docentes, significando que esses docentes já trabalharam em algum projeto em conjunto. O peso das arestas é a quantidade de vezes que os docentes ligados por elas já fizeram projetos em conjunto.
Grupos de Colaboração
A visualização de grupos de colaboração facilita a identificação do que pode causar a colaboração entre os docentes e como se comportam os docentes no meio em que trabalham. No gráfico abaixo, grupos de docentes identificados conforme o método de cluster leading eigen foram marcados com cores diferentes. A quantidade de colaborações entre os docentes estão representadas pela grossura das arestas.
layout <- layout.fruchterman.reingold(colaboracao)
V(colaboracao)$centralidade<- eigen_centrality(colaboracao)$vector
plot(cluster_leading_eigen(colaboracao), colaboracao,
layout = layout,
vertex.label = labels <- str_wrap(substr(V(colaboracao)$label, 0, 12), width = 4),
vertex.size = 10 * V(colaboracao)$centralidade + 15,
edge.width = E(colaboracao)$weigth,
edge.labels = E(colaboracao)$weigth
)Pode ser identificado acima, apenas 3 componentes de pesquisadores que trabalham em equipe, constituindo de 4 grupos de cooperação. Sendo assim, fica claro a ausencia de tendência de pesquisadores de colaborarem entre si em uma rede.
A tabela abaixo, auxilia o entendimento do gráfico enumerando em ordem decreste quantas parcerias são identificadas em cada pesquisador.
Pode ser visto que o Luís Felipe Miguel, que já era um dos docentes que mais faziam publicações e mais tinham participações em eventos, também é o docente que mais teve parcerias de produção científica. Esse número do (MIGUEL, L. F.) indica que um dos fatores que levam a pesquisadores a colaborarem é a quantidade de produções científica realizadas por eles, ou seja, pesquisadores que produzem mais conteúdo são mais procurados nas buscas de parcerias por outros docentes.
grau <- data.frame(grau = degree(colaboracao, mode = "all"))
ggplot(grau, aes(grau)) + geom_density(alpha = 0.5, fill = "blue") +
labs(Main = "Gráfico de Densidade de Colaboração dos Docentes", x = "Quantidade de Colaborações", y = "Densidade") +
theme_minimal()O gráfico acima confirma a hipótese de que pesquisadores tendem a não colaborarem uns com os outros, a medida que é observado que há uma grande tendência entre eles de fazer zero ou, no máximo, uma parceria.
Referências
- Fernandes, Jorge H C, Ricardo Barros Sampaio, João Ribas de Moura e Jerônimo AVelar Filho. “Ciência de Dados para Todos (Data Science For All) - 2018.1 - Análise da Produção Científica e Acadêmica da Universidade de Brasília - Modelo de Relatório Final da Disciplina - Departamento de Ciência da Computação da UnB”. Disciplina 116297 - Tópicos Avançados em Computadores, turma D, do semestre 2018.1, do Departamento de Ciência da Computação do Instituto de Ciências Exatas da Universidade de Brasília, 13 de junho de 2018.
- J. Fernandes and R. Sampaio, “Considerações preliminares sobre a ciência e sua avaliação,” 2018.
- P. Vinkler, The evaluation of research by scientometric indicators. El-sevier, 2010.
- P. Chapman, J. Clinton, R. Kerber, T. Khabaza, T. Reinartz, C. Shearer, R. Wirth et al., “Crisp-dm 1.0: Step-by-step data mining guide,” SPSS inc, vol. 16, 2000.
- [Online]. Available: https://sucupira.capes.gov.br/sucupira/
- “Agora analytics7.1.” [Online]. Available: http://unb.elattes.com.br/
- “Tidyverse.” [Online]. Available: https://www.tidyverse.org/
- “American political science association ¿ home.” [Online]. Available: https://apsanet.org/