1 Contexto

2 Levantamento dos dados

Para o levantamento de dados, utilizou as bases Scopus e Web of Science, a partir de uma mesma query adaptada a cada base de dados. A busca foi realizada em 11/04/2023, por meio do Portal Capes. A abrangência temporal assumida foi de 2005 a 2023. As queries utilizadas e os resultados obtidos estão apresentados abaixo:

  • Scopus - query: TITLE-ABS-KEY ( “amaz?n” AND “Agro syst” OR “Agrof syst*” ). Resultado: 273 registros
  • Web of Science: TS=“amaz?n” AND “Agro syst” OR “Agrof syst*“. Resultado: 4010 registros

3 Bases de dados

3.1 Verificação de duplicidades da Scopus

Títulos duplicados:

  • Integration of native genetic resources in Brazilian agroforestry systems
  • How to improve adoption of agroforestry systems among small farmers in Peruvian Amazon

3.2 Verificação de duplicidades da Web of Science

Títulos duplicados:

  • Tree diversity in agroforestry systems of native fine-aroma cacao, Amazonas, Peru
  • Revisiting IPCC Tier 1 coefficients for soil organic and biomass carbon storage in agroforestry systems (vol 13, 124020, 2018)
  • Biodiversity in agricultural and food systems of jhum landscape in the West Garo Hills, North-eastern India
  • Between two trees: Environmental effects of I. micheliana and A. latifolia on leaf litter ants in a coffee agroecosystem

4 Definição das variáveis para ambas as bases

Definição das variáveis de interesse, quais sejam: Autor, Título, Afiliação, Abstract, Palavra-chave, Palavra-chave Autor, Ano, Fonte, Tipo de documento e Base. * Cada arquivo ficará com o quantitativo de suas observações (Scopus = 271; WoS = 4006) e as nove variáveis declaradas anteriormente.

5 Estruturando as bases Scopus e WoS para futura junção

Procedimentos realizados: alteração dos nomes das colunas, criação de uma variável para identifição de cada base e também o ordenamento das variáveis para futura junção.

##  [1]  TRUE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE
##  [1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE

6 Junção das bases Scopus e Web of Science

Os arquivos correspondentes à Scopus e à Web of Science são agrupados por meio da função rbind, que exige o ordenamento das colunas (o que foi realizado anteriormente).

  • Nesta etapa a base final corresponde a um dataframe de 4277 observações e 10 variáveis

6.1 Verificando duplicidades e ausências de observações

Na verificação de duplicidades entre as bases, identificou-se:

  • 99 documentos repetidos, os quais podem ser acessados em: Títulos duplicados
  • Também foram identificados, e excluídos, 22 registros sem o preenchimento do campo “Resumo”.

6.2 Limpeza e transformação da base

Nesta etapa, busca-se iniciar a preparação do campo que servirá para a futura mineração de dados. Assim, serão retirados caracteres como aspas, hífens, pontuações etc. e palavras indesejadas, como artigos, preposições etc.

  • Palavras indesejadas: assumiu-se Stopwords em inglês.
  • Retirou-se, também, 67 publicações do ano de 2023.
## [1] "peru contributes average  gross domestic product employs directly indirectly  economically active population developing great diversity agroecological ecosystems hyperarid zone perhumid zone amazon basin activity occupies least million hectares responsible  water consumptive nonconsumptive consumption involving agrobiodiversity hundred species native introduced within context development innovative management agroforestry systems afs still process adoption scalingup demonstrating sustainability silvopastoral agroforestry prototypes research carried total  communities yurimaguas district loreto peru nonprobabilistic sample  farmers interviewed questionnaire  variables statistical methods numerical data summary nds exploratory data analysis eda multivariate techniques factor analysis cluster analysis main described complex strategy conformation agroforestry systems afs based forest implementation conservation established social housing conditions services availability among others diverse changing farmhouse another farmer another two indices estimated food security another perception subjective wellbeing allow farmers classified medium high wellbeing indices ranging   similar situation appreciated case food safety finally factor analysis satisfactory according kmo kayser – m – olguin statistics bartlett sphericity possible explain  variance three dimensions allowing farmers identified according social economic environmental sustainability indices ©  international society horticultural science"

7 Estatística Descritiva da Base

Após a verificação de duplicidade e a limpeza da base, obteve-se um dataframe com XXXX observações e 10 variáveis. Foram identificados XX tipos de documentos e a quantidade de publicações por ano, conforme dados abaixo.

## [1] 8.15161
Estatísticas Descritivas
Categoria Nome Contagem
Base de Dados scopus 263
Base de Dados web of science 3727
Quantidade de Autoria com 1 Autor(es) 12
Quantidade de Autoria com 2 Autor(es) 163
Quantidade de Autoria com 3 Autor(es) 436
Quantidade de Autoria com 4 Autor(es) 706
Quantidade de Autoria com 5 Autor(es) 717
Quantidade de Autoria com 6 Autor(es) 704
Quantidade de Autoria com 7 Autor(es) 455
Quantidade de Autoria com 8 Autor(es) 286
Quantidade de Autoria com 9 Autor(es) 203
Quantidade de Autoria com 10 Autor(es) 113
Quantidade de Autoria com 11 Autor(es) 65
Quantidade de Autoria com 12 Autor(es) 33
Quantidade de Autoria com 13 Autor(es) 15
Quantidade de Autoria com 14 Autor(es) 17
Quantidade de Autoria com 15 Autor(es) 13
Quantidade de Autoria com 16 Autor(es) 7
Quantidade de Autoria com 17 Autor(es) 9
Quantidade de Autoria com 18 Autor(es) 9
Quantidade de Autoria com 19 Autor(es) 5
Quantidade de Autoria com 20 Autor(es) 4
Quantidade de Autoria com 21 Autor(es) 5
Quantidade de Autoria com 23 Autor(es) 2
Quantidade de Autoria com 24 Autor(es) 1
Quantidade de Autoria com 25 Autor(es) 3
Quantidade de Autoria com 29 Autor(es) 1
Quantidade de Autoria com 30 Autor(es) 1
Quantidade de Autoria com 33 Autor(es) 1
Quantidade de Autoria com 36 Autor(es) 1
Quantidade de Autoria com 39 Autor(es) 1
Quantidade de Autoria com 41 Autor(es) 1
Quantidade de Autoria com 42 Autor(es) 1
Quantidade de Fontes Periódicos, Livros etc 910
Tipo de Documento Article 3565
Tipo de Documento Article; Data Paper 1
Tipo de Documento Article; Proceedings Paper 45
Tipo de Documento Book 2
Tipo de Documento Book Chapter 20
Tipo de Documento Conference Paper 3
Tipo de Documento Correction 3
Tipo de Documento Editorial Material 8
Tipo de Documento Erratum 2
Tipo de Documento Letter 2
Tipo de Documento Note 1
Tipo de Documento Proceedings Paper 113
Tipo de Documento Proceedings Paper; Retracted Publication 1
Tipo de Documento Review 213
Tipo de Documento Review; Book Chapter 11
Ano 2005 85
Ano 2006 80
Ano 2007 116
Ano 2008 116
Ano 2009 120
Ano 2010 117
Ano 2011 131
Ano 2012 160
Ano 2013 165
Ano 2014 156
Ano 2015 180
Ano 2016 209
Ano 2017 217
Ano 2018 337
Ano 2019 369
Ano 2020 447
Ano 2021 487
Ano 2022 498

8 Tokenização

Nesta etapa são extraídas as principais palavras e grupos de termos do resumo.

8.1 Visualização gráfica dos tokens

8.1.1 Ngrams

8.1.2 Bigrams

8.1.3 Trigrams