O relatório que será abordado a seguir tem a finalidade em obter resultados quanto ao progresso na área de saúde animal, nanociência e nanobiotecnologia, através de análises das respectivas produções científicas e acadêmicas. Este trabalho foi desenvolvido devido a disciplina DataScience4 All - Tópicos Avançados em Computadores-Turma D-2019.2, do Departamento de Ciência da Computação da Universidade de Brasília. A metodologia para desenvolvimento do relatório é baseada no modelo de mineração de dados denominado CRISP-DM (Chapman et al., 2000, Mariscal et al., 2010)
Todo o conhecimento adquirido através do estudo, pesquisa ou da prática, baseado em princípios certos. Em geral, a ciência, que é muita ampla, comporta vários conjuntos de saberes nos quais são elaboradas as suas teorias baseadas nos seus próprios métodos e pesquisas científicas. A ciência é composta por três componentes: a observação, a experimentação, e as leis. Visa a união entre o conhecimento teórico, a prática e a técnica. Não se utiliza de suposições, mas da comprovação após a aplicação do método científico.
Falar de um começo para a prática científica no Brasil não é tarefa fácil. Dependendo do conceito de Ciência que se leva em consideração, esse marco inicial aponta para uma direção, para um contexto, um grupo de pessoas, ou para outros. Devido a isso, um fato importante foi em 1993, no qual CNPq criou o Diretórios de grupos de pesquisa que, desde então, realiza, a cada dois anos, um censo para avaliar o cenário da ciência brasileira. A distribuição geográfica, as linhas de pesquisa desenvolvidas, a produção científica, tecnológica e artística dos pesquisadores e estudantes que integram os grupos cadastrados, as especialidades do conhecimento e setores de atividade são alguns dados que integram o mapeamento realizado pelo CNPq. O mais recente censo do Diretório dos Grupos de Pesquisa no Brasil foi realizado durante o ano de 2008 e acaba de ser divulgado. A análise dos dados processados proporciona a construção de um abrangente panorama sobre a atual capacidade de pesquisa do País. Segundo o censo, de 1993 para 2008 o número total de grupos de pesquisa no Brasil quase quadruplicou, passando de 3.015 para 11.120. Atualmente, o Brasil ocupa a 13º posição no ranking da produção científica mundial. Resultado da ampliação dos cursos de pós-graduação e expansão das Universidades públicas e instituições científicas. Porém, a realização da pesquisa científica no Brasil ainda se vê com muitos obstáculos pela frente.
Para um melhor resultado do trabalho buscou-se seguir e adaptar-se a metodologia CRISP-DM, para isso baseou-se no ciclo de projeto da metodologia CRISP-DM. O ciclo é definido pelas seguintes fases:
Entendimento do negócio: Primeiramente deve-se entender o que se busca encontrar, haja visto que não faz sentido fazer uma análise de dados sem saber o que se busca.
Entendimento dos dados: Busca-se entender os dados de forma mais superficial inicialmente.
Preparação de dados: Então os dados são tratados para que se possa facilitar o processamento dos mesmos.
Modelagem: Realiza a modelagem do dado.
Avaliação: Avalia-se o resultado da modelagem.
Implantação: Utilização dos dados.
Fases do Ciclo de Vida do CRISM-DM. Fonte: (Chapman et al., 2000).
Fonte: FERNANDES, JORGE H C, RICARDO BARROS SAMPAIO, JOÃO RIBAS DE MOURA E JERÔNIMO AVELAR FILHO.
Imagine uma analogia entre um projeto de datamining e a preparação de uma receita de bolo para ser usada em uma fábrica. Para iniciar a produção, com base numa receita de comprovada eficácia (metodológica e científica), você tem que minerar os ingredientes (dados) em um grande supermercado (dataset). Com os ingredientes você precisa aplicar um método (a forma de misturá-los), colocar os ingredientes numa determinada ordem, mexer por um certo tempo, aquecer por tantos minutos até o bolo ficar pronto e ser aprovado em um ou mais testes de degustação. Tendo por objetivo fazer com que essa receita (script de mineração de dados) possa ser executada com sucesso diversas vezes, numa fábrica, será que outro cozinheiro (cientista) que reproduzisse a receita (método) chegaria ao mesmo resultado? Se a metodologia (receita) já foi bastante testada, então é bem provável que o resultado será o mesmo e seu produto (receita de bolo) será aceito para a produção (deployment) de análises para consumo futuro, com base em fundamentos científicos.
Desenvolvimento dos objetivos e declaração das necessidades do projeto sob a perspectiva do negócio, para transformar isso tudo em definição de um problema de data mining. As atividades genéricas dentro dessa fase envolvem:
Identificar o que a organização realmente necessita alcançar. No caso específico desta disciplina, a necessidade do Sistema Nacional de Pós-Graduação do Brasil de produzir análises de alta qualidade de suas pós-graduações, com baixo custo. Como produzir um projeto de mineração de dados se você não sabe o que necessita encontrar ou resolver? Se você não entender os objetivos da organização pode levar ao erro de procurar as respostas certas para as perguntas erradas.
Avaliação das Circunstâncias. Envolve identificar quais recursos ou dificuldades podem influenciar os objetivos da mineração ou do projeto em si. No caso específico desta disciplina, isso envolve refletir, entre vários outros aspectos, sobre as limitações de tempo do projeto, que precisa ser realizado dentro de um semestre letivo, de modo que considerável parte das atividades já foram pré-organizadas pelos docentes responsáveis pela disciplina.
O projeto de mineração é o grande objetivo desta etapa e o relatório precisa conter uma seção sobre Metodologia, apresentando em detalhes o que se pretende fazer adiante.
Inicia determinando quais são os dados realmente disponíveis na organização, se existe permissão para utilizá-los, se existem dados confidenciais ou cobertos pelo sigilo. Na fase de entendimento dos dados pode-se trabalhar com quatro atividades genéricas:
Coleta inicial dos dados. Essa atividade envolve a análise das permissões de acesso e outras questões envolvendo sigilo e outros proprietários dos dados (terceiros). Por exemplo, eu poderia estar acessando uma base de dados que foi obtida de outro órgão por convênio, mas nesse convênio (contrato) não foi dada permissão para qualquer outro tipo de acesso ou exploração dos dados. Neste projeto, a coleta inicial foi feita pelos autores deste relatório. O relatório final deve conter indicações de como foi realizada a coleta inicial dos dados.
Descrição dos dados. A descrição dos dados verifica se os dados sendo acessados terão potencial para responder às questões de data mining. Além disso, deve-se avaliar qual o volume de dados, a estrutura dos dados (tipos), codificações usadas, etc. Neste projeto, a descrição dos dados é responsabilidade parcial dos alunos, tendo em vista que este modelo já oferece uma descrição inicial. O relatório final deve conter descrições significativas e aprofundadas dos dados.
Análise exploratória dos dados. A análise exploratória dos dados possibilita um entendimento mais profundo da relação estatística existente entre os dados dos datasets para um melhor entendimento da qualidade daqueles dados para o objetivo do projeto. Neste projeto, a análise exploratória dos dados é responsabilidade parcial dos alunos, tendo em vista que este relatório apresenta uma análise exploratória preliminar. O relatório final deve conter análises exploratórias dos dados que sejam significativas e aprofundadas.
Verificação da qualidade dos dados. A verificação da qualidade dos dados envolve responder se os dados disponíveis estão realmente completos. As informações disponíveis são suficientes para o trabalho proposto? Neste projeto, a verificação da qualidade dos dados é responsabilidade dos alunos.
Os datasets que serão utilizados em todo o trabalho são construídos a partir dos dados brutos. Aqui os dados são “filtrados” retirando-se partes que não interessam e selecionando-se os “campos” necessários para o trabalho de mineração. São 5 as atividades genéricas nesta fase de preparação dos dados:
Seleção dos dados. Envolve identificar quais dados, da nossa “montanha de dados”, serão realmente utilizados. Quais variáveis dos dados brutos serão convertidas para o dataset? Não é raro cometer o erro de selecionar dados para um modelo preditivo com base em uma falsa ideia de que aqueles dados contém a resposta para o modelo que se quer construir. Surge o cuidado de se separar o sinal do ruído (Silver, Nate. The Signal and the Noise: Why so many predictions fail — but some don’t. USA: The Penguin Press HC, 2012.).
Limpeza dos dados.
Construção dos dados. Envolve a criação de novas variáveis a partir de outros presentes nos datasets.
Integração dos dados. Envolve a união (merge) de diferentes tabelas para criar um único dataset para ser utilizado no R, por exemplo.
Formatação dos dados. Envolve a realização de pequenas alterações na estrutura dos dados, como a ordem das variáveis, para permitir a execução de determinado método de data mining.
Envolve a construção e avaliação do modelo, podendo ser realizada em quatro atividades genéricas:
Seleção das técnicas de modelagem.
Realização de testes de modelagem, onde diferentes modelos são previamente testados e avaliados. Pode-se dividir o dataset criado na etapa anterior para se ter uma base de treino na construção de modelos, e outra pequena parte para validar e avaliar a eficiência de cada modelo criado até se chegar ao mais “eficiente”.
Construção do modelo definitivo, com base na melhor experiência do passo anterior.
Avaliação do modelo.
Verifica se existem questões relacionadas à organização que não foram suficientemente abordadas. Deve-se refletir se o uso repetido do modelo criado pode trazer algum “efeito colateral” para a organização. Nesta fase, pode-se trabalhar com 3 atividades genéricas:
Avaliação dos resultados
Revisão do processo, por meio da qual verifica-se se o modelo foi construído adequadamente. As variáveis (passadas) para construir o modelo estarão disponíveis no futuro?
Determinação das etapas seguintes. Pode ser necessário decidir-se por finalizar o projeto, passar à etapa de desenvolvimento, ou rever algumas fases anteriores para a melhoria do projeto.
Realiza o planejamento de implantação dos produtos desenvolvidos (scripts, no caso do executado nesta disciplina) para o ambiente operacional, para seu uso repetitivo, envolvendo atividades de monitoramento e manutenção do sistema (script) desenvolvido. A fase de implantação concluir com a produção e apresentação do relatório final com os resultados do projeto. São atividades genéricas na fase de implantação:
Planejamento da transição dos produtos.
Planejamento do monitoramento dos produtos em utilização no ambiente operacional.
Planejamento de manutenção a ser eventualmente efetuada no produto (scripts).
Produção do relatório final.
Apresentação do relatório final.
Revisão sobre a execução do projeto, com registro de lições aprendidas etc. No contexto do projeto realizado no âmbito desta disciplina, a responsabilidade por execução de todas essas atividades é dos alunos, com exceção da apresentação do relatório final, que não será realizada.
A produção do conhecimento científico, no Brasil, é predominantemente efetuada por meio do Sistema Nacional de Pós-Graduação - SNPG, e mais fortemente relacionada com a formação de doutores nesse sistema (Pátaro e Mezzomo, 2013), por meio de cursos de pós-graduação strictu sensu. Fernandes e Sampaio (2017) já indicaram que a ciência é reconhecidamente um elemento essencial para o desenvolvimento social e econômico de qualquer nação. Assim sendo, faz-se mister aprimorar o SNPG como forma de promoção desse crescimento, visando maximizar o retorno decorrente do emprego dos recursos nele aplicados. A promoção do crescimento do SNPG se dá predominantemente por meio de avaliações regulares de seus programas de pós-graduação, sob responsabilidade da CAPES, que realiza a cada quatro 5 anos um complexo (Leite, 2018, p. 13) e custoso processo de coleta de dados, análise e deliberação sobre as pós-graduações strictu sensu, em coerência com o estabelecido no Plano Nacional de Pós-Graduação (PNPG) 2012-2020 (CAPES, 2010) e nos diversos documentos que definem os critérios de organização da pós-graduação em cada área do conhecimento (CAPES, 2018). Leite (2018) faz uma apresentação geral de como se organizam e são avaliadas as pós-graduações no Brasil. O Plano Nacional de Pós-Graduação (PNPG), por outro lado, define diretrizes estratégicas para desenvolvimento da pós-graduação brasileira, que deve abordar prioritariamente grandes temas de interesse nacional, tais como a redução das assimetrias de desenvolvimento entre as regiões do Brasil, a formação de professores para a educação básica, a formação de recursos humanos para as empresas, a resposta aos grandes desafios brasileiros sobre Água, Energia, Transporte, Controle de Fronteiras, Agronegócio, Amazônia, Amazônia Azul (Mar), Saúde, Defesa, Programa Espacial, além de Justiça, Segurança Pública, Criminologia e Desequilíbrio Regional. O PNPG também traça as diretrizes para financiamento da pós-graduação e sua internacionalização, apresentando conclusões e recomendações. As avaliações do SNPG, ao atribuírem mensurações de desempenho às diversas pós-graduações que dele fazem parte, geram incentivos e penalidades aos programas, tendo em vista a limitada disponibilidade de recursos para investimento em bolsas, taxas de bancada etc. Embora o sistema seja altamente sofisticado ele é também altamente criticado (Azevedo et al., 2016), sobretudo porque há percalços na busca por um equilíbrio entre as diferentes concepções de finalidade da ciência. Se de um lado a promoção do conhecimento gerado predominantemente nas ditas ciências hard contribui para criar fluxos econômicos mais intensos, isso não significa que essa promoção possa ocorrer em detrimento da menor promoção na geração de conhecimento sobre problemas sociais, predominantemente gerado nas ditas ciências soft, especialmente das áreas de humanidades, sob pena de ampliação de desigualdades (Azevedo et al., 2016).
Fonte: “PLANO NACIONAL DE PÓS-GRADUAÇÃO - PNPG 2011/2020 VOL. 2”
A partir de 2018, as diversas áreas da pós-graduação brasileira foram organizadas na forma de colégios, grandes áreas e áreas, conforme apresentam as tabelas a seguir.
| CIÊNCIAS AGRÁRIAS | CIÊNCIAS BIOLÓGICAS | CIÊNCIAS DA SAÚDE |
|---|---|---|
| Ciência de Alimentos | Biodiversidade | Educação Física |
| Ciências Agrárias I | Ciências Biológicas I | Enfermagem |
| Medicina Veterinária | Ciências Biológicas II | Farmácia |
| Zootecnia / Recursos Pesqueiros | Ciências Biológicas III | Medicina I |
| - | - | Medicina II |
| - | - | Medicina III |
| - | - | Medicina III |
| - | - | Nutrição |
| - | - | Odontologia |
| - | - | Saúde Coletiva |
| CIÊNCIAS EXATAS E DA TERRA | ENGENHARIAS | MULTIDISCIPLINAR |
|---|---|---|
| Astronomia / Física | Engenharias I | Biotecnologia |
| Ciência da Computação | Engenharias II | Ciências Ambientais |
| Geociências | Engenharias III | Ensino |
| Matemática / Probabilidade e Estatística | Engenharias IV | Interdisciplinar |
| Química | - | Materiais |
| CIÊNCIAS HUMANAS | CIÊNCIAS SOCIAIS APLICADAS | LINGUÍSTICA, LETRAS E ARTES |
|---|---|---|
| Antropol/Arqueol | Admin. Pub. /Empr. C. Contab. Tur. | Artes |
| Ciência Pol. e Rel. Int. | Arquit. Urban. Design | Linguística e Literatura |
| Ciências da Religião e Teol. | Comunicação e Informação | - |
| Educação | Direito | - |
| Filosofia | Economia | - |
| Geografia | Planej. Urbano e Reg. / Demografia | - |
| História | Serviço Social | - |
| Psicologia | - | - |
| Sociologia | - | - |
Cada um desses colégios, grandes áreas e áreas de conhecimento possuem dinâmicas próprias, e, portanto, não há um modelo universal que se aplique a todas. Existem aspectos comuns, mas também grandes peculiaridades, descritas parcialmente nos correspondentes documentos de área disponíveis em CAPES (2018)
A pós-graduação na Universidade de Brasília é uma imersão no mundo da pesquisa. A produção científica na instituição está distribuída em dezenas de programas destinados ao mestrado e ao doutorado, além de cursos de especialização. O anuário estatístico de 2015 aponta para a homologação anual de mais de 1,2 mil dissertações e de 400 teses na Universidade. A publicação também quantifica parte da produção intelectual bibliográfica, técnica e artística da UnB, que passa de 20 mil trabalhos no período. Pós-graduandos também necessitam de informações relativas aos procedimentos acadêmicos, aos órgãos e serviços disponibilizados. Por isso, sugerimos que consultem o Guia do Calouro, no qual é possível tirar dúvidas e encontrar dados sobre a estrutura da UnB, cursos de extensão e outros assuntos também pertinentes à pós.
Fonte: PÁGINA UNB - HTTP://WWW.UNB.BR/POS-GRADUACAO2?MENU=435
O Programa de Pós-Graduação em Nanociência e Nanobiotecnologia (PPG/NANO) da Universidade de Brasília tem como objetivo desenvolver a competência científica e a formação de profissionais de alto nível, de graduados e/ou mestres em Ciências Biológicas, Química, Física, Farmácia, Medicina ou áreas correlatas, por meio de estudos avançados e pesquisas na área de concentração de Nanociência e Nanobiotecnologia. A pesquisa desenvolvida no PPG/NANO envolve toda a cadeia do conhecimento transversal na área de nanociência e nanobiotecnologia, realização dos cálculos das propriedades básicas de nanoestruturas, rotas de produção de complexos nanoestruturados, metodologias de caracterização de complexos (droga + veiculador ou biomolécula + veiculador), protocolos de realização de testes pré-clínicos e testes clínicos com os complexos. Os complexos nanoestruturados a serem desenvolvidos serão poliméricos, liposomais, nanopartículas metálicas magnéticas ou não magnéticas, entre outras, podendo haver integração entre as diferentes nanoestruturas a exemplo dos fluidos magnéticos, nanocompósitos magnéticos, magnetolipossomas, nanocápsulas magnéticas, nanoemulsões magnéticas. Quaisquer das nanoestruturas mencionadas poderão ser utilizadas em combinação com diferentes fármacos, e/ou moléculas biológicas e sintéticas, para aplicação na saúde humana e animal, bem como para aplicações ambientais.
Linhas de pesquisa:
APLICAÇÕES DE MATERIAIS NANOESTRUTURADOS
SÍNTESE E CARACTERIZAÇÃO DE COMPLEXOS NANOESTRUTURADOS
NANOTOXICOLOGIA
Fonte: PAGINA WEB - HTTP://WWW.PPGNANO.UNB.BR/
O programa de Pós-graduação em Saúde Animal tem como objetivo qualificar Médicos Veterinários e profissionais de áreas afins para a geração e gestão de conhecimentos na área de Saúde Animal, visando o desenvolvimento social e econômico e a proteção da saúde e bem-estar do homem e dos animais. Fato justificado diante da necessidade de qualificação profissional em áreas estratégicas, garantido a caracterização cada vez mais acentuadamente, da necessária qualificação exigida pelo mercado de trabalho do profissional na área da Medicina Veterinária. Tal exigência vem revelando um mercado altamente competitivo, e que tem como anseio a busca pelo atendimento das exigências crescentes do consumidor final, seja no mercado interno ou externo. Neste contexto, atualizado e altamente competitivo, o programa de Pós-graduação em Saúde Animal visa qualificar profissionais para atuarem no campo da Saúde Animal, área estratégica para o desenvolvimento socioeconômico regional e ainda do País. O programa de Pós-graduação em Saúde Animal disponibiliza os cursos de Mestrado e Doutorado, com duas áreas de concentração “Medicina Preventiva” e “Patologia Veterinária”.
Linhas de pesquisa:
EPIDEMIOLOGIA, PREVENÇÃO E CONTRODE DE DOEÇAS DOS ANIMAIS E GESTÃO DOS RICOS PARA A SAÚDE PÚBLICA.
PATOLOGIA VETERINÁRIA.
PESQUISA E DESENVOLVIMENTO DE TÉCNICAS CIRÚRGICAS, PROTOCOLOS ANESTÉSICOS E TERAPIAS INOVADORAS.
MÉTODOS DE DIAGNÓSTICO E TRATAMENTO DE AFECÇÕES DOS ANIMAIS DOMÉSTICOS E SILVESTRES.
Fonte: PÁGINA DA WEB - HTTP://WWW.FAV.UNB.BR/CURSOS-DE-POS-GRADUACAO/POS-GRADUACAO-EM-SAUDE-ANIMAL
Dados adquiridos da plataforma unb-elattes onde mostram desde número de membros, artigos publicados ou aceitos, livros, orientações acadêmicas, publicações acadêmicas e orientações ao longo dos anos.
A produção científica da Universidade de Brasília despontou como uma das mais proeminentes do país. Dados revelados pela ferramenta SciVal – utilizada por instituições como Universidade de São Paulo (USP) e Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes) para análise de dados sobre pesquisa – revelam que, em um período de seis anos, o impacto das citações de pesquisadores vinculados à UnB aumentou mais de 100%. Em 2016, o chamado impacto normalizado por citação (Field-Weighted Citation Impact, na sigla em inglês) atingiu 1.45, ou seja, os pesquisadores da Universidade foram 45% mais citados do que a média global. Houve também um aumento significativo da produção de artigos. O indicador de produção científica (Scholarly Output) chegou a 9.771 itens em 2016, evidenciando um aumento de 42% nos seis anos considerados na análise. As equipes dos decanatos de Pós-Graduação (DPG) e de Pesquisa e Inovação (DPI) analisaram as métricas apresentadas pelo software e verificaram relação direta entre o aumento do número de docentes da UnB e da produção científica. Entre os anos de 2009 e 2013, 577 professores ingressaram no quadro permanente da instituição, um aumento de 32%. Entre 2013 e 2016, foram 185 docentes (8%). “Professores que entraram na UnB na época do Reuni têm, atualmente, forte atuação na pós-graduação. São jovens docentes, adaptados à instituição e que têm muita potência”, afirma a decana de Pós-Graduação, Helena Shimizu.
Vários stakeholders estão envolvidos no projeto em curso, e poderíamos considerar cada um deles como distintas organizações que possuem interesses distintos e complementares. Elas são: * A Disciplina Ciência de Dados para Todos 2018.1, que quer comprovar que seus alunos dominam ferramentas e técnicas de ciência de dados, para fins de avaliação de rendimento da disciplina. * A UnB, representada pelos decanatos de pós-graduação (DPG) e de pesquisa e inovação (DPI), que querem dispor de instrumentos para realização de avaliações contínuas de suas pós-graduações. * O SNPG, que assim com o DPG e DPI, também pode se beneficiar do uso de instrumentos para realização de avaliações contínuas de suas pós-graduações. * Os interessados em melhor conhecer o que é produzido pelo Sistema Nacional de Pós-graduação, como empresas privadas, que querem desfrutar dos benefícios gerados pela ciência brasileira. 7 A fim de dar maior fidelidade e homogeneidade ao exercício realizado na disciplina, focaremos em atendimento aos interesses comuns das organizações DPI, DPG e CAPES, que desejam dispor de instrumentos ágeis para avaliação contínua da pós-graduação brasileira. Com base no exposto, o objetivo do trabalho final a ser alcançado pelos produtos de mineração de dados desenvolvido pelos alunos da disciplina Ciência de Dados para Todos é produzir, tomando por base inicial os dados fornecidos pelos professores responsáveis pela disciplina, ferramentas para análise e avaliação contínuas e de baixo custo, do desempenho de um conjunto de pós-graduações que estão vinculadas a uma mesma subárea ou grupo de conhecimento. Cada área de pós-graduação apresenta suas características peculiares, assim como cada um dos programas vinculados a essas áreas. Como já informado, características peculiares de cada programa podem ser obtidas a partir de visita ao sítio da CAPES (2018).
Fonte: FERNANDES, JORGE H C, RICARDO BARROS SAMPAIO, JOÃO RIBAS DE MOURA E JERÔNIMO AVELAR FILHO. “CIÊNCIA DE DADOS PARA TODOS (DATA SCIENCE FOR ALL) - 2018.1
O Sistema de Avaliação desenvolvido pela CAPES pode ser dividido em dois processos distintos que se referem à entrada e permanência dos cursos de mestrado profissional (MP), mestrado acadêmico (ME) e doutorado (DO) no SNPG:
Ambos os processos são conduzidos com base nos mesmos fundamentos:
Reconhecimento e Confiabilidade fundados na qualidade assegurada pela análise dos pares;
Critérios debatidos e atualizados pela comunidade acadêmico-científica a cada período avaliativo;
Transparência firmada na ampla divulgação das decisões, ações e resultados:
A Avaliação Quadrienal é parte do processo de Permanência, e é realizada em 49 áreas de avaliação, número vigente em 2017, seguindo sistemática e conjunto de quesitos básicos estabelecidos no Conselho Técnico Científico da Educação Superior (CTC-ES), seguindo o seguinte fluxo:
Os resultados da avaliação periódica de programas de pós-graduação são expressos em notas, numa escala de 1 a 7, que são atribuídas aos mestrados e doutorados após análise dos indicadores referentes ao período avaliado. Esta análise é conduzida nas comissões de área de avaliação e, posteriormente, no CTC-ES, que homologa os resultados finais. São estes resultados que fundamentam a deliberação do Conselho Nacional de Educação - CNE/MEC sobre quais cursos obterão a renovação de reconhecimento para a continuidade de funcionamento no período subsequente.
A Universidade de Brasília obteve avanços em seus programas de pós-graduação (PPG). Avaliada em 93 programas, com cursos de mestrado e de doutorado – tanto acadêmicos quanto profissionais. O período considerado na análise foi de 2013 a 2016. Entre os programas de mestrado profissional, Administração Profissional (Face) alcançou a nota máxima para a categoria, que é 5. Além disso, foi mantida a quantidade de dez programas com nota 6. Para os de nota 5, o aumento foi considerável: em 2013 eles eram 10, agora são 17. Destaque também para os programas criados recentemente, pertencentes a áreas de pesquisa igualmente novas, e que alcançaram boa nota. É o caso do PPG de mestrado e de doutorado em Bioética (FS), que recebeu nota 5, e do curso de mestrado em Metafísica (IH), com 4. “A UnB caminha em direção à excelência, à base de muito esforço dos docentes, temos de reconhecer. Há um esforço sobre-humano dos professores, com a cobrança dos indicadores. É muito forte e muito estressante”, reforça a decana do DPG. ”
Fonte: http://noticias.unb.br/publicacoes/67-ensino/1801-unb-alcanca-indices-melhores-na-pos-graduacao
Desde o surgimento do programa de pós-graduação em 2011 a nota apresentada foi 4 e vem se mantendo desde então até o último ano de avaliação 2017 como pode ser visto na imagem obtida na plataforma Sucupira.
Desde o surgimento do programa de pós-graduação em 2004 a nota apresentada foi 3 e de 2010 para os dias atuais atingiu nota 4 como pode ser visto na imagem obtida na plataforma Sucupira.
O mapeamento foi feito com todos os 91 programas de pós-graduação da UnB, aos quais estão vinculados 2.157 professores, sendo 1.768 do quadro permanente – 389 atuam como colaborador ou pesquisador visitante. Dos docentes permanentes, 20% são bolsistas de produtividade do Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq), sendo que metade desses têm reconhecimento de excelência máxima, estando no nível 1.
Nos últimos cinco anos, foram desenvolvidos 3.558 projetos de pesquisa e registrados no CNPq 496 grupos de pesquisa, que juntos somam quase 5 mil pesquisadores, sendo que a grande maioria (mais de 60%) não pertence à UnB. “Isso significa que a Universidade tem muita colaboração externa e se relaciona com outras instituições, o grupo não é endógeno, mas aberto para o mundo”, interpreta Cláudia Amorim.
Mais de 1.500 pesquisadores da UnB integram grupos de pesquisa registrados no CNPq. Arte: Igor Outeiral/Secom UnB
Entre 2014 e 2017, a UnB teve uma produção de 15.578 publicações em periódicos qualificados, sendo mais da metade internacionais (54%) e quase um terço (28%) com as notas máximas de avaliação da Capes (A1 e A2). Quanto às bases, 4.271 artigos estão na Scopus e 2.367 na Web of Science e Scielo. A média de trabalhos nessas bases é de 7,49 por professor. Dois indicadores muito expressivos são o número de citações e o índice-H, também conhecido como fator de impacto. As citações correspondem ao número de vezes que um trabalho foi utilizado como referência e o índice-H relaciona o quantitativo de publicações científicas com o de suas citações, ou seja, quantos artigos um pesquisador publicou e quantas vezes foram referenciados.
O Scielo está integrado à base Web of Science. Arte: Igor Outeiral/Secom UnB
Os profissionais envolvidos nesse estudo destacam que, embora traga importantes indicadores, há que se considerar as especificidades das áreas. Por exemplo, as Ciências Humanas e Sociais Aplicadas têm mais grupos de pesquisa, mas por outro lado, o número de publicações em periódicos não é tão expressivo como as Ciências da Vida ou Exatas. Embora as Humanidades tenham um índice-H mais baixo nas bases de dados, trata-se de um campo internacionalizado. Além de ser a área com mais grupos de pesquisa, as Ciências Humanas ou Sociais detêm mais da metade (55%) dos cursos de excelência da UnB.
Todos os arquivos com dados iniciais a seguir apresentados foram fornecidos pelos professores responsáveis pela disciplina. Os dados foram gerados no mês de outubro de 2019, e compilam informações entre os anos de 2010 e 2017. Os arquivos estão no formato JSON, e seus atributos iniciais e conteúdo são apresentados a seguir.
Fonte: http://unb.elattes.com.br/ Fonte: FERNANDES, JORGE H C, RICARDO BARROS SAMPAIO, JOÃO RIBAS DE MOURA E JERÔNIMO AVELAR FILHO. “CIÊNCIA DE DADOS PARA TODOS (DATA SCIENCE FOR ALL) - 2018.1
## size isdir mode mtime
## 834.profile.json 1292441 FALSE 666 2019-09-15 01:35:18
## ctime atime exe
## 834.profile.json 2019-09-24 10:42:47 2019-09-24 10:42:47 no
## size isdir mode mtime ctime
## 847.profile.json 854632 FALSE 666 2019-10-01 03:31:28 2019-10-06 15:36:55
## atime exe
## 847.profile.json 2019-10-06 15:36:55 no
Arquivo 834.profile.json e 847.profile.json apresentam dados sobre o perfil de todos os docentes vinculados a programas de pós-graduação da UnB. Arquivo foi fornecido pelos docentes responsáveis pela disciplina.
## size isdir mode mtime ctime
## 834.advise.json 434316 FALSE 666 2019-09-15 01:35:18 2019-09-24 10:42:47
## atime exe
## 834.advise.json 2019-09-24 10:42:47 no
## size isdir mode mtime ctime
## 847.advise.json 339382 FALSE 666 2019-10-01 03:31:28 2019-10-06 15:36:55
## atime exe
## 847.advise.json 2019-10-06 15:36:55 no
Arquivo 834.advise.json e 847.advise.json apresentam dados sobre o perfil de todos os docentes vinculados a programas de pós-graduação da UnB. Arquivo foi fornecido pelos docentes responsáveis pela disciplina.
## size isdir mode mtime
## 834.publication.json 610674 FALSE 666 2019-09-15 01:35:18
## ctime atime exe
## 834.publication.json 2019-09-24 10:42:47 2019-09-24 10:42:47 no
## size isdir mode mtime
## 847.publication.json 372462 FALSE 666 2019-10-01 03:31:28
## ctime atime exe
## 847.publication.json 2019-10-06 15:36:55 2019-10-06 15:36:55 no
Arquivo 834.publication.json e 847.publication.json apresentam dados sobre publicações de todos os docentes vinculados a programas de pós-graduação da UnB. Arquivo foi fornecido pelos docentes responsáveis pela disciplina.
## size isdir mode mtime ctime
## 834.graph.json 9967 FALSE 666 2019-09-15 01:35:18 2019-09-24 10:42:47
## atime exe
## 834.graph.json 2019-09-24 10:42:47 no
## size isdir mode mtime ctime
## 847.graph.json 3203 FALSE 666 2019-10-01 03:31:28 2019-10-06 15:36:55
## atime exe
## 847.graph.json 2019-10-06 15:36:55 no
Arquivo 834.graph.json e 847.graph.json apresentam dados sobre a rede de colaboração de todos os docentes vinculados a programas de pós-graduação da UnB. Arquivo foi fornecido pelos docentes responsáveis pela disciplina.
Todos os scripts a seguir apresentados foram reutilizados de relatórios base fornecidos pelos professores responsáveis pela disciplina. Os pacotes utilizados para descrição destes dados podem ser encontrados no site da R Studio.
Fonte: FERNANDES, JORGE H C, RICARDO BARROS SAMPAIO, JOÃO RIBAS DE MOURA E JERÔNIMO AVELAR FILHO. “CIÊNCIA DE DADOS PARA TODOS (DATA SCIENCE FOR ALL) - 2018.1
## -- Attaching packages -------------------------------------------------------------------- tidyverse 1.2.1 --
## v ggplot2 3.2.1 v purrr 0.3.2
## v tibble 2.1.3 v dplyr 0.8.3
## v tidyr 1.0.0 v stringr 1.4.0
## v readr 1.3.1 v forcats 0.4.0
## -- Conflicts ----------------------------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
##
## Attaching package: 'jsonlite'
## The following object is masked from 'package:purrr':
##
## flatten
##
## Attaching package: 'igraph'
## The following objects are masked from 'package:dplyr':
##
## as_data_frame, groups, union
## The following objects are masked from 'package:purrr':
##
## compose, simplify
## The following object is masked from 'package:tidyr':
##
## crossing
## The following object is masked from 'package:tibble':
##
## as_data_frame
## The following objects are masked from 'package:stats':
##
## decompose, spectrum
## The following object is masked from 'package:base':
##
## union
#Pasta com códigos e arquivos
setwd("C:/Users/berna/Documents/nanotecnologia&saude_animal") #Pasta contendo os arquivos
#upload de arquivo com funções para transformar listas em Data Frames e objeto igraph
source("elattes.ls2df.R")Os pacotes apresentados foram utilizados para melhor coleta de dados dos arquivos de análise
#Leitura de arquivos de nanociencia_nanobiotecnologia e saude_animal
perfil_nano <- fromJSON("834.profile.json")
perfil_saude <- fromJSON("847.profile.json")
perfil_nano <- fromJSON("834.profile.json")
perfil_saude <- fromJSON("847.profile.json")
public_nano <- fromJSON("834.publication.json")
public_saude <- fromJSON("847.publication.json")
orient_nano <- fromJSON("834.advise.json")
orient_saude <- fromJSON("847.advise.json")
graphl_nano <- fromJSON("834.graph.json")
graphl_saude <- fromJSON("847.graph.json")Leitura dos arquivos JSON referentes aos participantes dos programas da UNB.
## [1] 21
## [1] 13
Quantidade de participantes do programa de nanotecnologia e saúde animal respectivamente.
## List of 7
## $ nome : chr "Sacha Braun Chaves"
## $ resumo_cv : chr "Possui graduação em Bacharelado em Ciências Biológicas pela Universidade de Brasília (2000), mestrado em Biolog"| __truncated__
## $ areas_de_atuacao :'data.frame': 4 obs. of 4 variables:
## ..$ grande_area : chr [1:4] "CIENCIAS_BIOLOGICAS" "CIENCIAS_BIOLOGICAS" "CIENCIAS_BIOLOGICAS" "CIENCIAS_BIOLOGICAS"
## ..$ area : chr [1:4] "Morfologia" "Morfologia" "Morfologia" "Morfologia"
## ..$ sub_area : chr [1:4] "Materiais Nanoestruturados" "Microtomografia" "" "Histologia"
## ..$ especialidade: chr [1:4] "" "" "" "Microscopia de Luz e Microscopia Eletrônica de Transmissã"
## $ endereco_profissional :List of 8
## ..$ instituicao: chr "Universidade de Brasília"
## ..$ orgao : chr "Instituto de Ciências Biológicas"
## ..$ unidade : chr "Departamento de Genética e Morfologia"
## ..$ DDD : chr "61"
## ..$ telefone : chr "31073074"
## ..$ bairro : chr "Asa Norte"
## ..$ cep : chr "70910-900"
## ..$ cidade : chr "Brasilia"
## $ producao_bibiografica :List of 1
## ..$ PERIODICO:'data.frame': 11 obs. of 10 variables:
## .. ..$ natureza : chr [1:11] "COMPLETO" "COMPLETO" "COMPLETO" "COMPLETO" ...
## .. ..$ titulo : chr [1:11] "Leukocyte transepithelial migration in lung induced by DMSA functionalized magnetic nanoparticles" "T Cells Induce Pre-Metastatic Osteolytic Disease and Help Bone Metastases Establishment in a Mouse Mo"| __truncated__ "The Caries Assessment Spectrum and Treatment (CAST) instrument: construct validation" "The effect of simvastatin on relapse of tooth movement and bone mineral density in rats measured by a new metho"| __truncated__ ...
## .. ..$ periodico : chr [1:11] "Cell Adhesion & Migration" "Plos One" "European Journal of Oral Sciences" "Acta Cirúrgica Brasileira (Online)" ...
## .. ..$ ano : chr [1:11] "2011" "2013" "2014" "2015" ...
## .. ..$ volume : chr [1:11] "5" "8" "122" "30" ...
## .. ..$ issn : chr [1:11] "19336918" "19326203" "09098836" "16782674" ...
## .. ..$ paginas : chr [1:11] "29 - 33" "e68171 - " "n/a - n/a" "319 - 327" ...
## .. ..$ doi : chr [1:11] "10.4161/cam.5.1.13558" "10.1371/journal.pone.0068171" "10.1111/eos.12116" "10.1590/s0102-865020150050000003" ...
## .. ..$ autores :List of 11
## .. ..$ autores-endogeno:List of 11
## $ orientacoes_academicas:List of 2
## ..$ ORIENTACAO_CONCLUIDA_MESTRADO:'data.frame': 1 obs. of 13 variables:
## .. ..$ natureza : chr "Dissertação de mestrado"
## .. ..$ titulo : chr "TERAPIA FOTODINÂMICA COM O USO DE NANOPARTICULAS: UM ESTUDO IN VITRO"
## .. ..$ ano : chr "2016"
## .. ..$ id_lattes_aluno : chr "3458129220811679"
## .. ..$ nome_aluno : chr "Maria de Sousa Brito Neta"
## .. ..$ instituicao : chr "Universidade de Brasília"
## .. ..$ curso : chr "Nanociência e Nanobiotecnologia"
## .. ..$ codigo_do_curso : chr "60471972"
## .. ..$ bolsa : chr "NAO"
## .. ..$ agencia_financiadora : chr ""
## .. ..$ codigo_agencia_financiadora: chr ""
## .. ..$ nome_orientadores :List of 1
## .. ..$ id_lattes_orientadores :List of 1
## ..$ OUTRAS_ORIENTACOES_CONCLUIDAS:'data.frame': 1 obs. of 13 variables:
## .. ..$ natureza : chr "INICIACAO_CIENTIFICA"
## .. ..$ titulo : chr "Análise histológica da distribuição de nanopartículas revestidas por ácido oleico em meio a base de óleo de and"| __truncated__
## .. ..$ ano : chr "2012"
## .. ..$ id_lattes_aluno : chr ""
## .. ..$ nome_aluno : chr "Frederico Hillesheim Horst"
## .. ..$ instituicao : chr "Universidade de Brasília"
## .. ..$ curso : chr "Ciências Biológicas"
## .. ..$ codigo_do_curso : chr "60226390"
## .. ..$ bolsa : chr "NAO"
## .. ..$ agencia_financiadora : chr ""
## .. ..$ codigo_agencia_financiadora: chr ""
## .. ..$ nome_orientadores :List of 1
## .. ..$ id_lattes_orientadores :List of 1
## $ senioridade : chr "9"
Breve descrição de como são apresentados os dados referentes ao perfil de cada docente no arquivo JSON.
## [1] "ORIENTACAO_EM_ANDAMENTO_DE_POS_DOUTORADO"
## [2] "ORIENTACAO_EM_ANDAMENTO_DOUTORADO"
## [3] "ORIENTACAO_EM_ANDAMENTO_MESTRADO"
## [4] "ORIENTACAO_EM_ANDAMENTO_GRADUACAO"
## [5] "ORIENTACAO_EM_ANDAMENTO_INICIACAO_CIENTIFICA"
## [6] "ORIENTACAO_CONCLUIDA_POS_DOUTORADO"
## [7] "ORIENTACAO_CONCLUIDA_DOUTORADO"
## [8] "ORIENTACAO_CONCLUIDA_MESTRADO"
## [9] "OUTRAS_ORIENTACOES_CONCLUIDAS"
Exemplo da descrição de dados de um dos programas estudados no relatório.
## [1] "PERIODICO"
## [2] "LIVRO"
## [3] "CAPITULO_DE_LIVRO"
## [4] "TEXTO_EM_JORNAIS"
## [5] "EVENTO"
## [6] "ARTIGO_ACEITO"
## [7] "DEMAIS_TIPOS_DE_PRODUCAO_BIBLIOGRAFICA"
Descrição do formato em que os dados de publicações são apresentados no JSON.
Com base nos dados descritos na sessão anterior poderemos fazer uma análise mais profunda de informações que nos ajude a entender algumas características especificas dos programas avaliados neste relatório.
#Leitura de arquivos de nanociencia_nanobiotecnologia e saude_animal
perfil_nano <- fromJSON("834.profile.json")
perfil_saude <- fromJSON("847.profile.json")A partir da extração dos arquivos podemos facilmente retirar informações a respeito de ambos os programas como por exemplo:
## [1] 21
## [1] 13
Os integrantes do programa de nanociência e nanotecnologia e um pouco maior que do programa de saúde animal podendo levantar hipóteses relevantes a dados futuros como maior número de publicações e de artigos aceitos mais a frente veremos se estas indagações conferem.
# Número de produções por ano
table(unlist(sapply(perfil_nano, function(x) (x$producao_bibiografica$ARTIGO_ACEITO$ano))))##
## 2017 2018 2019
## 2 6 1
##
## 2012 2013 2016
## 2 2 1
##
## 2011 2012 2013 2015 2016 2017
## 3 1 1 1 1 1
##
## 2010 2017 2018
## 1 2 8
##
## 2013 2014
## 1 1
##
## 2013
## 1
A Partir dos dados percebemos que nanociência além de ter um número de artigos aceitos por ano do que saúde animal, consequentemente o número de livros publicados ao ano é maior além de publicações de textos em jornais e revistas.
# Número de pessoas por grande area
table(unlist(sapply(perfil_nano, function(x) (x$areas_de_atuacao$grande_area))))##
## CIENCIAS_AGRARIAS CIENCIAS_BIOLOGICAS
## 2 36
## CIENCIAS_DA_SAUDE CIENCIAS_EXATAS_E_DA_TERRA
## 2 38
## ENGENHARIAS OUTROS
## 8 1
##
## CIENCIAS_AGRARIAS CIENCIAS_BIOLOGICAS
## 40 8
## LINGUISTICA_LETRAS_E_ARTES OUTROS
## 1 1
Script exemplo que gera os gráficos pizza dos dados acima:
#Converte perfil_nano e perfil_saude em data frame
dataframe_perfil_nano <- extrai.perfis(perfil_nano)
dataframe_perfil_saude <- extrai.perfis(perfil_saude)
#Distribuiçao de pesquisadores por grandes áreas
area_atuacao_nano <- extrai.areas.atuacao(perfil_nano)
area_atuacao_saude <- extrai.areas.atuacao(perfil_saude)
ggplot(area_atuacao_nano, aes(x = 1, y = grande_area, fill = grande_area)) +
# Use a column geometry.
geom_col() +
# Change coordinate system to polar.
coord_polar(theta = "y") +
theme_void() +
# Clean up the background with theme_void and give it a proper title with ggtitle.
ggtitle("Distribuiçao de pesquisadores por grande área na Nanociencia e Nanobiotecnologia")ggplot(area_atuacao_saude, aes(x = 1, y = grande_area, fill = grande_area)) +
# Use a column geometry.
geom_col() +
# Change coordinate system to polar.
coord_polar(theta = "y") +
theme_void() +
# Clean up the background with theme_void and give it a proper title with ggtitle.
ggtitle("Distribuiçao de pesquisadores por grande área na Saude Animal")Analisando os gráficos acima vemos que o programa de nanociência possui grande diversidade nas grandes áreas tendo grande influência em ciências exatas, biológicas e engenharias. Já o programa de saúde animal que não possui tanta diversidade, mas possui grande participação nas áreas agrarias e biológicas.
# Número de pessoas que produziram os específicos tipos de produção
table(unlist(sapply(perfil_nano, function(x) names(x$producao_bibiografica))))##
## ARTIGO_ACEITO CAPITULO_DE_LIVRO EVENTO LIVRO
## 6 10 16 3
## PERIODICO TEXTO_EM_JORNAIS
## 21 6
##
## ARTIGO_ACEITO
## 8
## CAPITULO_DE_LIVRO
## 5
## DEMAIS_TIPOS_DE_PRODUCAO_BIBLIOGRAFICA
## 2
## EVENTO
## 12
## LIVRO
## 2
## PERIODICO
## 13
## TEXTO_EM_JORNAIS
## 1
Com base nos dois programas podemos ver que a de certa forma uma relação muito próxima quando se trata de números de artigos aceitos, eventos e livros, mas que se olharmos para periódicos textos em jornais entre outros, vemos uma discrepância entre ambos, podemos supor que este fato seja porque historicamente pesquisas na área da saúde tendem a demorar que em outras áreas.
# Leitura de arquivos de nanociencia_nanobiotecnologia e saude_animal
public_nano <- fromJSON("834.publication.json")
public_saude <- fromJSON("847.publication.json")
# Análise dos dados no formato DF
public_nano.periodico.df <- pub.ls2df(public_nano, 1) #artigos
public_nano.livros.df <- pub.ls2df(public_nano, 2) #livros
public_nano.eventos.df <- pub.ls2df(public_nano, 5) #eventos
public_saude.periodico.df <- pub.ls2df(public_saude, 1) #artigos
public_saude.livros.df <- pub.ls2df(public_saude, 2) #livros
public_saude.eventos.df <- pub.ls2df(public_saude, 5) #eventosApós a extração dos dados de publicações podemos encontrar informações a respeito dos programas.
##
## 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
## 82 68 72 69 80 69 74 81 31 3
##
## 2010 2011 2012 2013 2014 2015 2016 2017 2018
## 30 42 39 34 41 42 59 42 12
Podemos observar que ambos os programas mantiveram uma taxa de publicações ao ano significativa, fica evidente através dos dados que o programa de nanociência desde o primeiro ano estudado já possuía 82 periódicos no ano contra 30 de saúde animal.
##
## Alemanha Austrália Estados Unidos Grã-Bretanha
## 1 1 2 1
##
## Brasil
## 2
Percebemos que o programa de nanociência possui uma internacionalização maior que saúde animal já que ao analisarmos os livros publicados por países vemos que nanociência possui livros publicados em diversos países enquanto que saúde possuí 2 livros publicados no Brasil.
# Eventos nos países ao longo dos anos
public_nano.eventos.df %>%
filter(pais_do_evento %in%
c(names(head(sort(table(public_nano.eventos.df$pais_do_evento)
, decreasing = TRUE), 10)))) %>%
group_by(ano_do_trabalho,pais_do_evento) %>%
ggplot(aes(x=ano_do_trabalho,y=pais_do_evento, color= pais_do_evento)) +
xlab("Ano") + ylab("Pais") + geom_point() + geom_jitter()public_saude.eventos.df %>%
filter(pais_do_evento %in%
c(names(head(sort(table(public_nano.eventos.df$pais_do_evento)
, decreasing = TRUE), 10)))) %>%
group_by(ano_do_trabalho,pais_do_evento) %>%
ggplot(aes(x=ano_do_trabalho,y=pais_do_evento, color= pais_do_evento)) +
xlab("Ano") + ylab("Pais") + geom_point() + geom_jitter() +
ggtitle("Eventos de Saude Animal nos paises ao longo dos anos")Após analisar os gráficos, percebe-se que a quantidade de eventos ocorridos sobre o programa de nanotecnologia é ligeiramente maior nos países como: Estados Unidos, Alemanha, Brasil em relação a saúde animal. Mesmo com essa discrepância, conclui-se que a presença de ambos programas em determinados países estrangeiros, ainda é pequena se comparada ao Brasil.
# Leitura de arquivos de nanociencia_nanobiotecnologia e saude_animal
orient_nano <- fromJSON("834.advise.json")
orient_saude <- fromJSON("847.advise.json")
# Análise dos dados no formato DF
orient_nano.posdoutorado.df <- ori.ls2df(orient_nano, 6) #pos-Doutorado concluído## Warning: Expected 2 pieces. Missing pieces filled with `NA` in 40 rows [1,
## 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...].
## Warning: Expected 2 pieces. Missing pieces filled with `NA` in 40 rows [1,
## 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...].
## Warning: Expected 2 pieces. Missing pieces filled with `NA` in 73 rows [1,
## 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 13, 14, 15, 16, 17, 18, 19, 20, 22, ...].
## Warning: Expected 2 pieces. Missing pieces filled with `NA` in 73 rows [1,
## 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 13, 14, 15, 16, 17, 18, 19, 20, 22, ...].
## Warning: Expected 2 pieces. Missing pieces filled with `NA` in 124 rows [1,
## 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...].
## Warning: Expected 2 pieces. Missing pieces filled with `NA` in 124 rows [1,
## 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...].
orient_nano.df <- rbind(rbind(orient_nano.posdoutorado.df, orient_nano.doutorado.df), orient_nano.mestrado.df)
orient_saude.posdoutorado.df <- ori.ls2df(orient_saude, 6) #pos-Doutorado concluído## Warning: Expected 2 pieces. Missing pieces filled with `NA` in 1 rows [1].
## Warning: Expected 2 pieces. Missing pieces filled with `NA` in 1 rows [1].
## Warning: Expected 2 pieces. Missing pieces filled with `NA` in 11 rows [1,
## 2, 3, 4, 5, 6, 7, 8, 9, 10, 11].
## Warning: Expected 2 pieces. Missing pieces filled with `NA` in 11 rows [1,
## 2, 3, 4, 5, 6, 7, 8, 9, 10, 11].
## Warning: Expected 2 pieces. Missing pieces filled with `NA` in 105 rows [1,
## 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21, ...].
## Warning: Expected 2 pieces. Missing pieces filled with `NA` in 105 rows [1,
## 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21, ...].
Após a extração dos dados de orientações podemos encontrar informações a respeito dos programas.
# Número de Orientações de Doutorado
sum(sapply(orient_nano$ORIENTACAO_CONCLUIDA_DOUTORADO, function(x) length(x$natureza)))## [1] 76
## [1] 11
Quando se trata de número de orientações concluídas de doutorado há uma discrepância enorme entre ambos os programas.
##
## NAO SIM
## 76 168
##
## NAO SIM
## 54 64
Claramente os participantes do programa de nanociência recebem mais recurso do que os demais de saúde animal, sendo assim um programa que atrai mais investidores para a causa.
# Natureza das orientacoes completas por ano
ggplot(orient_nano.df,aes(ano,fill=natureza)) +
geom_bar(stat = "count", position="dodge") +
ggtitle("Natureza das orientações Completas Por Ano de Nanociencia e Nanobiotecnologia") +
theme(legend.position="right",legend.text=element_text(size=7)) +
guides(fill=guide_legend(nrow=5, byrow=TRUE, title.position = "top")) +
labs(x="Ano",y="Quantidade")ggplot(orient_saude.df,aes(ano,fill=natureza)) +
geom_bar(stat = "count", position="dodge") +
ggtitle("Natureza das orientações Completas Por Ano de Saude Animal") +
theme(legend.position="right",legend.text=element_text(size=7)) +
guides(fill=guide_legend(nrow=5, byrow=TRUE, title.position = "top")) +
labs(x="Ano",y="Quantidade")Ambos os programas têm altos índices de dissertações de mestrado, logo o fator que diferencia esses dois programas são as supervisões de pós-doutorado e tese de doutorado que podem ter um número bem reduzido no programa de saúde animal.
FERNANDES, JORGE H C, RICARDO BARROS SAMPAIO, JOÃO RIBAS DE MOURA E JERÔNIMO AVELAR FILHO. “CIÊNCIA DE DADOS PARA TODOS (DATA SCIENCE FOR ALL) - 2018.1 - ANÁLISE DA PRODUÇÃO CIENTÍFICA E ACADÊMICA DA UNIVERSIDADE DE BRASÍLIA - MODELO DE RELATÓRIO FINAL DA DISCIPLINA - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO DA UNB”. DISCIPLINA 116297 - TÓPICOS AVANÇADOS EM COMPUTADORES, TURMA D, DO SEMESTRE 2018.1, DO DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO DO INSTITUTO DE CIÊNCIAS EXATAS DA UNIVERSIDADE DE BRASÍLIA, 13 DE JUNHO DE 2018.
“PLANO NACIONAL DE PÓS-GRADUAÇÃO - PNPG 2011/2020 VOL. 2”. HTTP://WWW.CAPES.GOV.BR/IMAGES/STORIES/DOWNLOAD/PNPG_MIOLO_V2.PDF.
Pagina dados sobre programas de pós-graduação - http://unb.elattes.com.br/#
Avaliação quadrienal - http://avaliacaoquadrienal.capes.gov.br/a-avaliacao
PÁGINA UNB - HTTP://WWW.UNB.BR/POS-GRADUACAO2?MENU=435
PAGINA WEB - HTTP://WWW.PPGNANO.UNB.BR/
PÁGINA DA WEB - HTTP://WWW.FAV.UNB.BR/CURSOS-DE-POS-GRADUACAO/POS-GRADUACAO-EM-SAUDE-ANIMAL
CAPES. “DOCUMENTOS DE ÁREA”. CAPES.GOV.BR. ACESSADO 12 DE JUNHO DE 2018. HTTP://AVALIACAOQUADRIENAL.CAPES.GOV.BR/DOCUMENTOS-DE-AREA.
SUCUPIRA: COLETA DE DADOS, DOCENTES DE PÓS-GRADUAÇÃO STRICTO SENSU NO BRASIL 2015”. CAPES - BANCO DE METADADOS, 16 DE MARÇO DE 2016. HTTP://METADADOS.CAPES.GOV.BR/INDEX.PHP/CATALOG/63.
CHAPMAN, PETE, JULIAN CLINTON, RANDY KERBER, THOMAS KHABAZA, THOMAS REINARTZ, COLIN SHEARER, E RÜDIGER WIRTH. “CRISP-DM 1.0: STEP-BY-STEP DATA MINING GUIDE”. USA: CRISP-DM CONSORTIUM, 2000. HTTPS://WWW.THE-MODELING-AGENCY.COM/CRISP-DM.PDF.
DATACAMP. “MACHINE LEARNING WITH R (SKILL TRACK)”. DATACAMP, 2018. HTTPS://WWW.DATACAMP.COM/TRACKS/MACHINE-LEARNING.
INTRODUCTION TO R - HTTPS://WWW.DATACAMP.COM/COURSES/FREE-INTRODUCTION-TO-R
INTERMEDIATE R HTTPS://WWW.DATACAMP.COM/COURSES/INTERMEDIATE-R
IMPORTING DATA IN R (PART 1) HTTPS://WWW.DATACAMP.COM/COURSES/IMPORTING-DATA-IN-R-PART-1
CLEANING DATA IN R HTTPS://WWW.DATACAMP.COM/COURSES/CLEANING-DATA-IN-R
INTRODUCTION TO THE TIDYVERSE HTTPS://WWW.DATACAMP.COM/COURSES/INTRODUCTION-TO-THE-TIDYVERSE
VISUALIZATION BEST PRACTICES IN R HTTPS://WWW.DATACAMP.COM/COURSES/VISUALIZATION-BEST-PRACTICES-IN-R
NETWORK ANALYSIS IN R HTTPS://WWW.DATACAMP.COM/COURSES/NETWORK-ANALYSIS-IN-R
BAG OF WORDS – TEXT MINING: BAG OF WORDS HTTPS://WWW.DATACAMP.COM/COURSES/INTRO-TO-TEXT-MINING-BAG-OF-WORDS