Resumo

Este documento apresenta o relatório 1 da disciplina de tópicos Avançados em computadores - Turma D - 2019.2 do departamento de Ciência da Computação da universidade de Brasília, que trata da análise qualitativa da produção científica e acadêmica na Universidade de Brasília, na área de Antropologia.

Introdução

Assim como descrito no plano de ensino, este trabalho tem como objetivo apresentar o contexto do programa de pós-graduação em Antropoligia da Universidade de Brasília, ao abordar sobre o conceito da ciência e como ela é feita no Brasil, assim como apresentar os dados descritivos do programa.

CRISP-DM

A metodologia para desenvolvimento do relatório é baseada no modelo de mineração de dados denominado CRISP-DM (Chapman et al., 2000, Mariscal et al., 2010). Este modelo é caracterizado por um projeto dividido em seis fases, as quais serão tratadas ao longo das seções seguintes.

  1. Entendimento do negócio: Busca definir um problema de mineração de dados com base nos objetivos e necessidades do projeto.
  2. Entendimento dos dados: Consiste na coleta e descrição dos dados, incluindo uma análise de qualidade e quantidade dos mesmos - necessários para avaliar a viabilidade do projeto.
  3. Preparação dos dados: Consiste na estruturação dos dados capturados, incluindo uma fase de limpeza de dados indesejados ou inconsistentes. Esta fase tem como objetivo produzir datasets prontos para análises estatísticas e produção de gráficos.
  4. Modelagem: Envolve a construção e revisão de modelos estatísticos de interesse para o projeto, além de testes para descarte dos modelos produzidos que não atingirem o grau desejado de confiabilidade.
  5. Avaliação: Consiste na avaliação dos resultados e do processo como um todo, revisando se todas as questões relevantes para o projeto foram abordadas adequadamente.
  6. Implementação: Consiste no planejamento e implementação dos entregáveis finais desenvolvidos pelo projeto, incluindo monitoramento e manutenção dos mesmos.

CRISP-DM Fase 1 - Entendimento do Negócio

O que é ciência

Ciência representa todo o conhecimento adquirido através do estudo, pesquisa ou experimentos baseados no método científico. Também vale ressaltar a diferença entre pesquisa básica, cujo objetivo é a compreensão das leis da natureza ou o estudo de um fenômeno. E da pesquisa aplicada que visa produzir um dispositivo útil para fins comerciais, onde a compreensão total do que acontece não é necessária.

Ciência no Brasil

O instituto Oswaldo Cruz foi criado em 1900, no Rio de Janeiro, e representa a institucionalização da pesquisa no Brasil. No entanto, o reconhecimento da importância da pesquisa científica para o desenvolvimento do país é recente, pois o CNPq e a CAPES foram criados em 1951. E somente na década de 70 que a ciência e tecnologia foram reconhecidos como assuntos de Estado.

Apesar do crescimento da ciência brasileira, em número de doutores e publicações, o investimento em ciência vem diminuindo drasticamente. E como consequência os equipamento de laboratórios estão se deteriorando por falta de manutenção e infra-estrutura, as bibliotecas das universidades não se mantêm atualizadas e a eficiência e qualidade da produção científica caem drasticamente.

Apresentação dos dados descritivos do programa de pós-graduação de Antropologia da UnB

O programa de pós-graduação em Antropologia Social da Universidade de Brasília foi criado em 1972, composto por 19 docentes permanentes, nos quais 13 são pesquisadores de produtividade no CNPq, e 3 colaboradores.

Além disso, o programa abriga dois cursos concebidos como etapas de uma formação continuada. O Mestrado visa a formação teórica composta por 30 créditos em disciplinas, sendo 12 em disciplinas teóricas obrigatórias e o Doutorado composto por 48 créditos, incluídos os 30 do Mestrado, prioriza a formação na capacidade de realizações de pesquisas e na elaboração teórica original.

Os docentes estão organizados em 10 linhas de pesquisa que se distribuem em 10 laboratórios. O programa contém 101 projetos de pesquisa com financiamentos de agências nacionais e internacionais, mantendo uma tradicional revista na área de antropologia, chamada Anuário Antropológico, assim como também mantém a tradição de publicações em forma de working papers na Série Antropológica.

De acordo com a avaliação quadrienal do site Sucupira, a produção de teses e dissertação, assim como a produção intelectual dos docentes e discentes demonstra que o programa continua atingindo resultados muito bons com relação às suas metas verificadas em sua concepção e atuação. A parceria com outros programas por meio de 3 PROCAD, com a UFBA, UFPe, UFPR e UFRN indica uma boa inserção de colaboração com outros programas no país.

! Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

Avaliação do Corpo Docente

De acordo com a ficha de avaliação do programa de pós graduação obtida através da avaliação quadrienal no site Sucupira, mais de 90% dos docentes têm mais de 10 anos de doutoramento, cuja a origem da titulação dos docentes permanentes está concentrada na UnB. Além disso, todos os professores coordenam e participam de projeto de pesquisa com fomentos de agências nacionais e internacionais. A média oferecida pelo corpo docente no quadriênio foi de 4,8.

De acordo com a analise obtida do Elattes, os docentes do programa possuem 416 orientações acadêmicas.

Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

Avaliação do Corpo Dicente

De acordo com a ficha de avaliação do programa de pós graduação obtida através da avaliação quadrienal no site Sucupira, no programa há uma boa distribuição das orienações das teses e dissertações defendidas em relação aos docentes. Além disso, a avaliação do tempo médio de titulação para mestrado é 27,6 meses e para doutorado é de 55,7 meses.

Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

Avaliação da Produção Intelectual

Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

De acordo com a ficha de avaliação do programa de pós graduação obtida através da avaliação quadrienal no site Sucupira, aponta que 100% dos professores publicaram resultados de pesquisa e ensaios acadêmicos.

Avaliação da Inserção Social

Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

Em 2014, de acordo com a ficha de avaliação do programa de pós graduação obtida através da avaliação quadrienal no site Sucupira, o programa implementou a política de ações afirmativas com cotas para negros e edital específico para vagas de indígenas, o que trouxe ao programa um conjunto de desafios institucionais e acadêmicos-pedagógicos.

Além disso, o programa tem recebido alunos de todas as unidades da federação do país e das principais universidades brasileiras. Seus egressos estão presentes em 39 universidades públicas, sendo que em 13 delas nos seus programas de pós-graduação em Antropologia, além de atuarem em 5 programas de pós graduação da Universidade de Brasília.

Avaliação da Qualidade de Dados

Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

De acordo com a ficha de avaliação do programa de pós graduação obtida através da avaliação quadrienal no site Sucupira, os indicadores da área demonstram que o programa está num nível de excelência na formação e na produção de conhecimento antropológico com uma boa inserção social regional/nacional, com grande capacidade de liderança e consistente inserção internacional.

Avaliação dos Quesitos de Excelência

Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

De acordo com a ficha de avaliação do programa de pós graduação obtida através da avaliação quadrienal no site Sucupira, o programa recebeu a nota máxima 7 porque demonstra alta capacidade de liderança, índices de produção intelectual total e qualificada considerada muito boa pelos parâmetros da área, reconhecido pelos pares por meio de vários prêmios de dissertações e teses, e apresenta também um processo consistente de internacionalização.

Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

Imagem retirada da Ficha de avaliação do programa de pós graduação do site Sucupira

CRISP-DM Fase 2 - Entendimento dos Dados

A segunda parte do CRISP-DM consiste no entendimento dos dados. Para realizar análises significativas com os datasets disponíveis, é essencial ter um bom entendimento sobre a forma que estão organizados. Os arquivos utilizados são provenientes da plataforma Elattes e compilam informações sobre a produção científica dos professores do Programa de Pós-graduação em Antropologia no período de 2010 a 2017.

Os datasets que serão trabalhados consistem em: perfil profissional; orientações de mestrado e doutorado realizadas; produções bibliográficas e redes de colaboração entre os pesquisadores.

Arquivos Analisados

Os arquivos com informações sobre os pesquisadores do Programa de Pós-graduação em Antropologia:

- 929.profile.json : apresenta dados sobre o perfil de todos os pesquisadores.
- 929.publication.json : apresenta dados sobre as publicações e produções bibliográficas geradas por todos os pesquisadores.
- 929.graph.json : apresenta dados sobre produções bibliográficas coolaborativas feitas entre os pesquisadores.
- 929.advise.json : apresenta dados sobre orientações de mestrado e doutorado feitas por todos os pesquisadores.

Análise estrutural dos dados

Para continuar com as análises, as seguintes bibliotecas são selecionadas:

## [1] "Número de pesquisadores na base:  33"

Após a importação e definição das bibliotecas utilizadas, podemos utilizar funções de tais pacotes para análise sistêmica dos dados.

## [1] "Quantidade de professores por tipo de senioridade"
## # A tibble: 5 x 2
##   senioridade     n
##   <chr>       <int>
## 1 10             23
## 2 8               5
## 3 4               2
## 4 9               2
## 5 0               1
## [1] "Quantidade de professores por tipo de grande área de atuação"
## # A tibble: 6 x 2
##   grande_area                    n
##   <chr>                      <int>
## 1 CIENCIAS_HUMANAS             112
## 2 CIENCIAS_SOCIAIS_APLICADAS     7
## 3 LINGUISTICA_LETRAS_E_ARTES     4
## 4 ""                             1
## 5 CIENCIAS_BIOLOGICAS            1
## 6 OUTROS                         1
## [1] "Quantidade de professores por tipo de area de atuação"
## # A tibble: 14 x 2
##    area                    n
##    <chr>               <int>
##  1 Antropologia          102
##  2 História                5
##  3 Direito                 4
##  4 Artes                   2
##  5 Ciência Política        2
##  6 Letras                  2
##  7 Serviço Social          2
##  8 ""                      1
##  9 Ciências Ambientais     1
## 10 Comunicação             1
## 11 Ecologia                1
## 12 Educação                1
## 13 Psicologia              1
## 14 Sociologia              1
## [1] "Quantidade de professores por tipo de sub_area de atuação"
## # A tibble: 66 x 2
##    sub_area                                  n
##    <chr>                                 <int>
##  1 Teoria Antropológica                     22
##  2 ""                                       11
##  3 Etnologia Indígena                       11
##  4 Antropologia da Política                  6
##  5 Antropologia Urbana                       6
##  6 Antropologia da Ciência                   3
##  7 Antropologia da Saúde                     3
##  8 Antropologia da África                    2
##  9 Antropologia das Sociedades Complexas     2
## 10 Antropologia Social                       2
## # ... with 56 more rows
## [1] "quantidade de publicações por ano"
## # A tibble: 9 x 2
##   ano       n
##   <chr> <int>
## 1 2010    114
## 2 2011    102
## 3 2012    151
## 4 2013     86
## 5 2014    118
## 6 2015    111
## 7 2016     96
## 8 2017     76
## 9 <NA>    279
## [1] "quantidade de tipos de publicações"
## # A tibble: 7 x 2
##   tipo_producao                              n
##   <chr>                                  <int>
## 1 ARTIGO_ACEITO                              4
## 2 TEXTO_EM_JORNAIS                          41
## 3 DEMAIS_TIPOS_DE_PRODUCAO_BIBLIOGRAFICA    47
## 4 LIVRO                                     93
## 5 EVENTO                                   279
## 6 CAPITULO_DE_LIVRO                        304
## 7 PERIODICO                                365

Pode-se conlcuir que a participação em eventos, em capitulo de livro e periódicos possui um maior peso na área de Antropologia.

## [1] "quantidade de publicações por pais"
## # A tibble: 19 x 2
##    pais_de_publicacao     n
##    <chr>              <int>
##  1 <NA>                 689
##  2 Brasil               386
##  3 Estados Unidos        13
##  4 Argentina              9
##  5 Portugal               8
##  6 França                 5
##  7 Austrália              3
##  8 Grã-Bretanha           3
##  9 Holanda                3
## 10 Camarões               2
## 11 Espanha                2
## 12 Índia                  2
## 13 Israel                 2
## 14 Cabo Verde             1
## 15 Colômbia               1
## 16 Hong Kong              1
## 17 México                 1
## 18 Moçambique             1
## 19 Uruguai                1

A partir da tabela acima, pode-se supor duas hipóteses:

## [1] "quantidade de participações em eventos por pais_do_evento"
## # A tibble: 22 x 2
##    pais_do_evento     n
##    <chr>          <int>
##  1 <NA>             854
##  2 Brasil           228
##  3 Austrália          9
##  4 Portugal           8
##  5 África do Sul      5
##  6 Canadá             5
##  7 Estados Unidos     5
##  8 Argentina          3
##  9 França             2
## 10 Uruguai            2
## # ... with 12 more rows
## [1] "quantidade de orientações por ano"
## # A tibble: 8 x 2
##   ano       n
##   <chr> <int>
## 1 2010     87
## 2 2011    114
## 3 2012     97
## 4 2013    163
## 5 2014    117
## 6 2015    119
## 7 2016    108
## 8 2017    134
## [1] "quantidade de orientações por docente"
## # A tibble: 10 x 2
##    nome_orientadores                    n
##    <chr>                            <int>
##  1 Sílvia Maria Ferreira Guimarães     82
##  2 Carlos Magno Santos Gomes           56
##  3 Miriam Krenzinger Azambuja          51
##  4 Ana Carolina Eiras Coelho Soares    45
##  5 Soraya Resende Fleischer            45
##  6 Stephen Grant Baines                45
##  7 Luis Roberto Cardoso de Oliveira    44
##  8 Antonádia Monteiro Borges           41
##  9 Daniel Schroeter Simião             38
## 10 Juliana Braz Dias                   37
## [1] "quantidade de tipos de orientações"
## # A tibble: 9 x 2
##   natureza                                                              n
##   <chr>                                                             <int>
## 1 Iniciação Científica                                                 14
## 2 Supervisão de pós-doutorado                                          19
## 3 MONOGRAFIA_DE_CONCLUSAO_DE_CURSO_APERFEICOAMENTO_E_ESPECIALIZACAO    25
## 4 ORIENTACAO-DE-OUTRA-NATUREZA                                         34
## 5 Trabalho de conclusão de curso de graduação                          37
## 6 Tese de doutorado                                                   128
## 7 INICIACAO_CIENTIFICA                                                200
## 8 Dissertação de mestrado                                             214
## 9 TRABALHO_DE_CONCLUSAO_DE_CURSO_GRADUACAO                            268
## [1] "Dscrição dos dados de produção bibliográfica"
## [1] "PERIODICO"                             
## [2] "LIVRO"                                 
## [3] "CAPITULO_DE_LIVRO"                     
## [4] "TEXTO_EM_JORNAIS"                      
## [5] "EVENTO"                                
## [6] "ARTIGO_ACEITO"                         
## [7] "DEMAIS_TIPOS_DE_PRODUCAO_BIBLIOGRAFICA"
## [1] "Os periódicos mais frequêntes"
## [1] "Títulos das publicações publicadas no o INTERETHNIC@ - REVISTADE ESTUDOS EM RELAC ?? ~OES INTER ??ETNICAS"
## [1] "Apresentação do Dossiê - Resumo"                                                                  
## [2] "Laboratório e Grupo de Estudos em Relações Interétnicas (LAGERI): 20 anos de atuação"             
## [3] "Organização do Dossiê 'LAGERI 20 ANOS' Interethnic@ - Revista de estudos em relações interétnicas"
## [1] "Qual o nome dos autores dos livros publicados em 2017 no Brasil"
##  [1] "DIAS, C."              "GUIMARÃES, S."        
##  [3] "MARTINS, Gisele"       "NASCIMENTO, R. C."    
##  [5] "CALDERO&#769;N, D."    "SILVA, H. G."         
##  [7] "GUINDANI, N."          "KRENZINGER,Miriam"    
##  [9] "ANSARI, M. R."         "SILVA, N. C. K. M. E."
## [11] "SILVA, E. S."          "LEAL, J."             
## [13] "SALVADOR, J."          "MALANQUINI, L."       
## [15] "ANHORN, M. G."         "OLIVEIRA, R. V. S. M."
## [17] "GUINDANI, N."          "CALDERO&#769;N, D."   
## [19] "NASCIMENTO, R. C."     "OLIVEIRA, R. V. S. M."
## [21] "KRENZINGER,Miriam"     "MARTINS, Gisele"      
## [23] "SILVA, E. S."          "ANSARI, M. R."        
## [25] "SILVA, N. C. K. M. E." "ANHORN, M. G."        
## [27] "MALANQUINI, L."        "SILVA, H. G."         
## [29] "GOMES, C.M."           "RAMALHO, C. B."       
## [31] "CARDOSO, A. M. L."     "SILVA, F. M."         
## [33] "GOMES, Carlos Magno"   "SOBRAL, M. N."        
## [35] "ROMAO, E."             "GOMES, Carlos Magno"  
## [37] "SOBRAL, M. N."         "ROMAO, E."
## Observations: 277
## Variables: 13
## $ natureza                    <chr> "Supervisão de pós-doutorado", "Su...
## $ titulo                      <chr> "", "", "Redes Ameríndias nas Guia...
## $ ano                         <chr> "2010", "2010", "2010", "2011", "2...
## $ id_lattes_aluno             <chr> "", "", "", "", "", "", "", "", ""...
## $ nome_aluno                  <chr> "Virginia Ferreira da Silva Castro...
## $ instituicao                 <chr> "Universidade Católica de Brasília...
## $ curso                       <chr> "", "", "", "", "", "", "", "", ""...
## $ codigo_do_curso             <chr> "", "", "", "", "", "", "", "", ""...
## $ bolsa                       <chr> "SIM", "NAO", "NAO", "NAO", "SIM",...
## $ agencia_financiadora        <chr> "Conselho Nacional de Desenvolvime...
## $ codigo_agencia_financiadora <chr> "002200000000", "", "", "", "00220...
## $ nome_orientadores           <list> ["Luis Roberto Cardoso de Oliveir...
## $ id_lattes_orientadores      <list> ["2935371042756080", "71710526162...
## [1] "Numero de orientacoes por ano"
## 
## 2010 2011 2012 2013 2014 2015 2016 2017 
##   24   28   34   41   37   44   33   36
## [1] "Tabela com nome dos 20 professores com maior numero de orientacoes"
## 
## Luis Roberto Cardoso de Oliveira             Stephen Grant Baines 
##                               32                               26 
##        Carlos Magno Santos Gomes              Lia Zanotta Machado 
##                               22                               17 
##        Antonádia Monteiro Borges Marcela Stockler Coelho de Souza 
##                               14                               13 
##             Carla Costa Teixeira           Jose Jorge de Carvalho 
##                               11                               11 
##       Miriam Krenzinger Azambuja  Sílvia Maria Ferreira Guimarães 
##                               10                               10 
##             Andrea de Souza Lobo          Carlos Emanuel Sautchuk 
##                                9                                9 
##       Cristina Patriota de Moura      José Antonio Vieira Pimenta 
##                                9                                8 
##         Kelly Cristiane da Silva         Luis Abraham Cayón Durán 
##                                8                                8 
##         Soraya Resende Fleischer                Juliana Braz Dias 
##                                8                                6 
##    Luiz Eduardo de Lacerda Abreu             Wilson Trajano Filho 
##                                6                                6
## [1] "Quantidade de orientações por instituição"
## # A tibble: 20 x 2
##    instituicao                                                       n
##    <chr>                                                         <int>
##  1 Escola Técnica Superior d'Arquitectura de Barcelona.              1
##  2 Freie Universität Berlin                                          1
##  3 Pontifícia Universidade Católica de Goiás                         1
##  4 Programa de Pós-Graduação em Antropologia Social - UFPR           1
##  5 Universidade Católica de Brasília                                 1
##  6 Universidade Federal de Mato Grosso                               1
##  7 Universidade Federal Fluminense                                   1
##  8 Universitat de Barcelona                                          1
##  9 Martin-Luther-Universität Halle-Wittenberg                        2
## 10 Programa de Pós Graduação da Escola de Serviço Social da UFRJ     3
## 11 Universidade de Cabo Verde                                        3
## 12 Universidade Federal de Goiás                                     3
## 13 Universidade Federal do Amapá                                     4
## 14 Universidade do Estado da Bahia                                   5
## 15 Universidade Federal do Piauí                                     5
## 16 Centro Universitário de Brasília                                  6
## 17 Fundação Universidade de Brasília                                 7
## 18 Universidade Federal do Rio de Janeiro                            7
## 19 Universidade Federal de Sergipe                                  18
## 20 Universidade de Brasília                                        206
## [1] "Quantidade de orientações que possuem bolsa da universidade de Brasília"
## # A tibble: 2 x 2
##   bolsa     n
##   <chr> <int>
## 1 NAO      71
## 2 SIM     135
## [1] "Quantidade de orientações por curso da universidade de Brasília"
## # A tibble: 14 x 2
##    curso                                                                  n
##    <chr>                                                              <int>
##  1 Antropologia                                                         104
##  2 Antropologia Social                                                   23
##  3 Programa de Pós-Graduação em Antropologia Social                      21
##  4 ""                                                                    17
##  5 Direito                                                               12
##  6 Doutorado em Antropologia - PPGAS/UnB                                  7
##  7 Pós-Graduação. em Ciências e Tecnologias em Saúde                      7
##  8 CEPPAC                                                                 5
##  9 Sustentabilidade junto a Povos e Terras Tradiciona                     3
## 10 Ciências Sociais Estudos Comparados das Américas                       2
## 11 Mestrado Profissional em Sustentabilidade junto a Povos e Terras ~     2
## 12 Doutorado do CEPPAC                                                    1
## 13 Pós Graduação em Estudos sobre as Américas                             1
## 14 Programa de Pós-Graduação em Direito                                   1

CRISP-DM Fase 3 - Preparação dos Dados

A terceira fase do CRISP é conhecida por ser a parte de preparação dos dados. Tal fase possui como característica a execução de atividades para construir o conjunto final de dados a partir dos dados brutos iniciais. Pode-se separar essa etapa em cinco momentos que serão descritos nessa seção.

- Seleção dos dados
- Limpeza dos dados
- Construção dos dados
- Integração dos dados
- Formatação dos dados

Na etapa de seleção dos dados a entrada é o conjunto de dados bruto e nela ocorre a decisão dos dados a serem usados para análise. Os critérios incluem relevância para as metas de mineração de dados, qualidade e restrições técnicas, como limites no volume de dados ou tipos de dados. Então vem a fase da limpeza que recebe a seleção de dados úteis efetuada anteriormente e é efetuado um aumento na qualidade dos dados para o nível exigido pelas técnicas de análise selecionadas. Aqui pode haver o uso de técnicas mais elaboradas, como a estimativa de dados ausentes por modelagem e inserção de padrões adequados.

O terceiro passo é a construção dos dados. Essa tarefa inclui operações de preparação de dados construtivos, como a produção de atributos derivados, novos registros ou valores transformados para atributos existentes. A penúltima atividade é a integração dos dados. Este é o momento no qual as informações são combinadas de vários bancos de dados, tabelas ou registros para criar novos registros ou valores. Por fim, ocorre a tarefa de formatação dos dados, que é a realização de modificações na estrutura dos dados de forma que as operações planejadas possam ser efetuadas de forma conveniente.

CRISP-DM Fases 4 a 6 - Resultados e visualizações:

Foram escolhidos alguns resultados, em relação aos dados encontrados durante o processo, para serem plotados em gráficos.

Sob uma perspectiva de publicações, o Programa de Pós-Graduação de Antropologia apresentou uma grande variação entre os anos de 2010 e 2017, com muitas publicações em 2012 em comparação com 2017, que houve menos publicações. No entanto, esses comportamentos não foram observados nos outros anos, caracterizando anos atípicos na amostra.

Sob a perspectiva de área de atuação, o gráfico acima mostra que grande dos docentes do programa de Pós Graduação de Antropologia atua na área de Ciências Humanas, o que evidência uma baixa aplicabilidade nas demais áreas.

Sob a pespectiva de publicações por país, nota-se que grande parte das publicações são feitas no Brasil, o que evidência uma baixa internacionalização do Programa de Pós-Graduação em Antropologia.

Sob a pespectiva da quantidade de orientações por tipo é possível perceber que a quantidade de dissertações de mestrado aumentou entre os anos de 2010 à 2017.

Sob a pespectiva da quantidade de orientações que possuem bolsa de pesquisa, percebe-se que de 2010 a 2012 houve um crescimento, o que indica um aumento de verba destinada aos orgãos que fomentam pesquisa no Brasil, como CNPq e a CAPES.

De 2013 a 2015 o número de bolsas de pesquisa se manteve o mesmo. Ou seja, indica que não houve diminuição da verba por parte do governo.

No entanto, do ano de 2015 para 2016 houve uma diminuição da verba destinada a pesquisa porque decresceu a quantidade de bolsas de pesquisa para as orientações do programa de pós-graduação de Antropologia.

Análise de Redes

##  [1] "0099860141022736" "0205473778329094" "0405000888325357"
##  [4] "0712338026370509" "0854801305953601" "1360252482418200"
##  [7] "1706193123967139" "2089135273264758" "2440057525269977"
## [10] "2699955351343721"
##  [1] "Sílvia Maria Ferreira Guimarães"  
##  [2] "Christine de Alencar Chaves"      
##  [3] "Marcela Stockler Coelho de Souza" 
##  [4] "Cristina Patriota de Moura"       
##  [5] "José Antonio Vieira Pimenta"      
##  [6] "Virgínia Ferreira da Silva Castro"
##  [7] "Andrea de Souza Lobo"             
##  [8] "Jose Jorge de Carvalho"           
##  [9] "Wilson Trajano Filho"             
## [10] "Antonádia Monteiro Borges"
## NULL

O grafo acima mostra a rede formada pelos professores do curso de Pós-graduação de Antropologia da UnB, nesse caso a representação está um pouco poluída pelas informações contidas nos nós do grafo. Dessa forma, foi necessário melhorar a representação: De acordo com o grafo acima pode-se observar que não há muitas conexões entre os professores do curso de pós graduação em Antropologia na UnB, indicando que a maioria deles publicam artigos/periódicos individualmente.

Desse modo, as poucas conexões existente evidenciam que alguns professores devem desenvolver trabalhos com áreas em comum.

Mineração de Textos

A seguir será mostrada uma nuvem de palavras composta pelo resumo dos currículos dos pesquisadores que possuem nas suas áreas de atuação a Antropologia:

## [1] "é professor adjunto i e atualmente exerce a chefia do departamento de antropologia (dan) da universidade de brasília (unb). realizou estágio pós-doutoral (bolsa capes) no programa de pós-graduação em antropologia social (ppgas) dan, unb (2012 a 2015). finalizou estágio pós-doutoral júnior (bolsa cnpq) pelo instituto de estudos comparados em administração institucional de conflitos/ineac, vinculado a universidade federal fluminense (2011). no ppgas/dan/unb concluiu o doutorado (2010) e o mestrado em antropologia social (2006). ainda no dan/unb, realizou o bacharelado em ciências sociais, habilitação em antropologia (1995). possui também graduação em geografia (1990), graduação em estudos sociais (1989) e especialização em geografia do brasil (1990). integra o instituto de estudos comparados em administração institucional de conflitos (inct/ineac). foi professor substituto no departamento de antropologia da unb (2011/2012 - 2015/2016). linha de pesquisa: campesinato, parentesco, memória, escravidão e pós-emancipação, comunidades negras rurais e urbanas - quilombolas."
## [1] "É professor Adjunto I e atualmente exerce a chefia do Departamento de Antropologia DAN da Universidade de Brasília UnB Realizou estágio PósDoutoral bolsa Capes no Programa de PósGraduação em Antropologia Social PPGAS DAN UnB 2012 a 2015 Finalizou estágio PósDoutoral Júnior bolsa CNPq pelo Instituto de Estudos Comparados em Administração Institucional de ConflitosInEAC vinculado a Universidade Federal Fluminense 2011 No PPGASDANUnB concluiu o Doutorado 2010 e o Mestrado em Antropologia Social 2006 Ainda no DANUnB realizou o Bacharelado em Ciências Sociais habilitação em Antropologia 1995 Possui também graduação em Geografia 1990 graduação em Estudos Sociais 1989 e especialização em Geografia do Brasil 1990 Integra o Instituto de Estudos Comparados em Administração Institucional de Conflitos INCTInEAC Foi Professor Substituto no Departamento de Antropologia da UnB 20112012  20152016 Linha de pesquisa Campesinato Parentesco Memória Escravidão e pósemancipação Comunidades Negras Rurais e Urbanas  Quilombolas"
## [1] "É professor Adjunto I e atualmente exerce a chefia do Departamento de Antropologia (DAN) da Universidade de Brasília (UnB). Realizou estágio Pós-Doutoral (bolsa Capes) no Programa de Pós-Graduação em Antropologia Social (PPGAS) DAN, UnB ( a ). Finalizou estágio Pós-Doutoral Júnior (bolsa CNPq) pelo Instituto de Estudos Comparados em Administração Institucional de Conflitos/InEAC, vinculado a Universidade Federal Fluminense (). No PPGAS/DAN/UnB concluiu o Doutorado () e o Mestrado em Antropologia Social (). Ainda no DAN/UnB, realizou o Bacharelado em Ciências Sociais, habilitação em Antropologia (). Possui também graduação em Geografia (), graduação em Estudos Sociais () e especialização em Geografia do Brasil (). Integra o Instituto de Estudos Comparados em Administração Institucional de Conflitos (INCT/InEAC). Foi Professor Substituto no Departamento de Antropologia da UnB (/ - /). Linha de pesquisa: Campesinato, Parentesco, Memória, Escravidão e pós-emancipação, Comunidades Negras Rurais e Urbanas - Quilombolas."
## [1] "É professor Adjunto I atualmente exerce chefia Departamento Antropologia (DAN) Universidade Brasília (UnB). Realizou estágio Pós-Doutoral (bolsa Capes) Programa Pós-Graduação Antropologia Social (PPGAS) DAN, UnB (2012 2015). Finalizou estágio Pós-Doutoral Júnior (bolsa CNPq) Instituto Estudos Comparados Administração Institucional Conflitos/InEAC, vinculado Universidade Federal Fluminense (2011). No PPGAS/DAN/UnB concluiu Doutorado (2010) Mestrado Antropologia Social (2006). Ainda DAN/UnB, realizou Bacharelado Ciências Sociais, habilitação Antropologia (1995). Possui graduação Geografia (1990), graduação Estudos Sociais (1989) especialização Geografia Brasil (1990). Integra Instituto Estudos Comparados Administração Institucional Conflitos (INCT/InEAC). Foi Professor Substituto Departamento Antropologia UnB (2011/2012 - 2015/2016). Linha pesquisa: Campesinato, Parentesco, Memória, Escravidão pós-emancipação, Comunidades Negras Rurais Urbanas - Quilombolas."
## [1] "É professor Adjunto I atualmente exerce chefia Departamento Antropologia (DAN) Universidade Brasília (UnB). Realizou estágio Pós-Doutoral (bolsa Capes) Programa Pós-Graduação Antropologia Social (PPGAS) DAN, UnB (2012 2015). Finalizou estágio Pós-Doutoral Júnior (bolsa CNPq) Instituto Estudos Comparados Administração Institucional Conflitos/InEAC, vinculado Universidade Federal Fluminense (2011). No PPGAS/DAN/UnB concluiu Doutorado (2010) Mestrado Antropologia Social (2006). Ainda DAN/UnB, realizou Bacharelado Ciências Sociais, habilitação Antropologia (1995). Possui graduação Geografia (1990), graduação Estudos Sociais (1989) especialização Geografia Brasil (1990). Integra Instituto Estudos Comparados Administração Institucional Conflitos (INCT/InEAC). Foi Professor Substituto Departamento Antropologia UnB (2011/2012 - 2015/2016). Linha pesquisa: Campesinato, Parentesco, Memória, Escravidão pós-emancipação, Comunidades Negras Rurais Urbanas - Quilombolas."
##     comput     comput     comput 
## "computer" "computer" "computer"
## <<DocumentTermMatrix (documents: 29, terms: 1165)>>
## Non-/sparse entries: 2108/31677
## Sparsity           : 94%
## Maximal term length: 23
## Weighting          : term frequency (tf)
## [1]   29 1165
## <<TermDocumentMatrix (terms: 1165, documents: 29)>>
## Non-/sparse entries: 2108/31677
## Sparsity           : 94%
## Maximal term length: 23
## Weighting          : term frequency (tf)
## [1] 1165   29

A seguir será mostrada uma nuvem de palavras composta pelo resumo dos currículos dos pesquisadores que possuem nas suas grandes áreas de atuação a CIENCIAS_HUMANAS:

## [1] "é professor adjunto i e atualmente exerce a chefia do departamento de antropologia (dan) da universidade de brasília (unb). realizou estágio pós-doutoral (bolsa capes) no programa de pós-graduação em antropologia social (ppgas) dan, unb (2012 a 2015). finalizou estágio pós-doutoral júnior (bolsa cnpq) pelo instituto de estudos comparados em administração institucional de conflitos/ineac, vinculado a universidade federal fluminense (2011). no ppgas/dan/unb concluiu o doutorado (2010) e o mestrado em antropologia social (2006). ainda no dan/unb, realizou o bacharelado em ciências sociais, habilitação em antropologia (1995). possui também graduação em geografia (1990), graduação em estudos sociais (1989) e especialização em geografia do brasil (1990). integra o instituto de estudos comparados em administração institucional de conflitos (inct/ineac). foi professor substituto no departamento de antropologia da unb (2011/2012 - 2015/2016). linha de pesquisa: campesinato, parentesco, memória, escravidão e pós-emancipação, comunidades negras rurais e urbanas - quilombolas."
## [1] "É professor Adjunto I e atualmente exerce a chefia do Departamento de Antropologia DAN da Universidade de Brasília UnB Realizou estágio PósDoutoral bolsa Capes no Programa de PósGraduação em Antropologia Social PPGAS DAN UnB 2012 a 2015 Finalizou estágio PósDoutoral Júnior bolsa CNPq pelo Instituto de Estudos Comparados em Administração Institucional de ConflitosInEAC vinculado a Universidade Federal Fluminense 2011 No PPGASDANUnB concluiu o Doutorado 2010 e o Mestrado em Antropologia Social 2006 Ainda no DANUnB realizou o Bacharelado em Ciências Sociais habilitação em Antropologia 1995 Possui também graduação em Geografia 1990 graduação em Estudos Sociais 1989 e especialização em Geografia do Brasil 1990 Integra o Instituto de Estudos Comparados em Administração Institucional de Conflitos INCTInEAC Foi Professor Substituto no Departamento de Antropologia da UnB 20112012  20152016 Linha de pesquisa Campesinato Parentesco Memória Escravidão e pósemancipação Comunidades Negras Rurais e Urbanas  Quilombolas"
## [1] "É professor Adjunto I e atualmente exerce a chefia do Departamento de Antropologia (DAN) da Universidade de Brasília (UnB). Realizou estágio Pós-Doutoral (bolsa Capes) no Programa de Pós-Graduação em Antropologia Social (PPGAS) DAN, UnB ( a ). Finalizou estágio Pós-Doutoral Júnior (bolsa CNPq) pelo Instituto de Estudos Comparados em Administração Institucional de Conflitos/InEAC, vinculado a Universidade Federal Fluminense (). No PPGAS/DAN/UnB concluiu o Doutorado () e o Mestrado em Antropologia Social (). Ainda no DAN/UnB, realizou o Bacharelado em Ciências Sociais, habilitação em Antropologia (). Possui também graduação em Geografia (), graduação em Estudos Sociais () e especialização em Geografia do Brasil (). Integra o Instituto de Estudos Comparados em Administração Institucional de Conflitos (INCT/InEAC). Foi Professor Substituto no Departamento de Antropologia da UnB (/ - /). Linha de pesquisa: Campesinato, Parentesco, Memória, Escravidão e pós-emancipação, Comunidades Negras Rurais e Urbanas - Quilombolas."
## [1] "É professor Adjunto I atualmente exerce chefia Departamento Antropologia (DAN) Universidade Brasília (UnB). Realizou estágio Pós-Doutoral (bolsa Capes) Programa Pós-Graduação Antropologia Social (PPGAS) DAN, UnB (2012 2015). Finalizou estágio Pós-Doutoral Júnior (bolsa CNPq) Instituto Estudos Comparados Administração Institucional Conflitos/InEAC, vinculado Universidade Federal Fluminense (2011). No PPGAS/DAN/UnB concluiu Doutorado (2010) Mestrado Antropologia Social (2006). Ainda DAN/UnB, realizou Bacharelado Ciências Sociais, habilitação Antropologia (1995). Possui graduação Geografia (1990), graduação Estudos Sociais (1989) especialização Geografia Brasil (1990). Integra Instituto Estudos Comparados Administração Institucional Conflitos (INCT/InEAC). Foi Professor Substituto Departamento Antropologia UnB (2011/2012 - 2015/2016). Linha pesquisa: Campesinato, Parentesco, Memória, Escravidão pós-emancipação, Comunidades Negras Rurais Urbanas - Quilombolas."
## [1] "É professor Adjunto I atualmente exerce chefia Departamento Antropologia (DAN) Universidade Brasília (UnB). Realizou estágio Pós-Doutoral (bolsa Capes) Programa Pós-Graduação Antropologia Social (PPGAS) DAN, UnB (2012 2015). Finalizou estágio Pós-Doutoral Júnior (bolsa CNPq) Instituto Estudos Comparados Administração Institucional Conflitos/InEAC, vinculado Universidade Federal Fluminense (2011). No PPGAS/DAN/UnB concluiu Doutorado (2010) Mestrado Antropologia Social (2006). Ainda DAN/UnB, realizou Bacharelado Ciências Sociais, habilitação Antropologia (1995). Possui graduação Geografia (1990), graduação Estudos Sociais (1989) especialização Geografia Brasil (1990). Integra Instituto Estudos Comparados Administração Institucional Conflitos (INCT/InEAC). Foi Professor Substituto Departamento Antropologia UnB (2011/2012 - 2015/2016). Linha pesquisa: Campesinato, Parentesco, Memória, Escravidão pós-emancipação, Comunidades Negras Rurais Urbanas - Quilombolas."
##     comput     comput     comput 
## "computer" "computer" "computer"
## <<DocumentTermMatrix (documents: 30, terms: 1189)>>
## Non-/sparse entries: 2169/33501
## Sparsity           : 94%
## Maximal term length: 23
## Weighting          : term frequency (tf)
## [1]   30 1189
## <<TermDocumentMatrix (terms: 1189, documents: 30)>>
## Non-/sparse entries: 2169/33501
## Sparsity           : 94%
## Maximal term length: 23
## Weighting          : term frequency (tf)
## [1] 1189   30

# Conclusão

Esse trabalho mostrou as técnicas do método CRISP-DM para análise de dados de arquivos .json. Dessa forma foi possível aprender um pouco sobre a ciência de dados, geração de scripts e sobre a representação desses resultados.

A geração desse relatório foi baseado no exemplo disponibilizado pelo professor no Aprender UnB, no qual foi implementado scripts R que faz uso de técnicas de manipulação de dados, análise de redes e mineração de texto.

Por fim, os resultados obtidos podem ser considerados relevantes e bem-sucedidos para o conjunto de dados. Ao comparar as pontuações de avaliação quadrienal, que colocam o programa de pós graduação de Antropologia com uma nota máxima de 7 e por possuir um número alto de publicações e orientações acadêmicas.

Referências