Bibliometria no bibliometrix (R)

Pesquisa bibliométrica

Pesquisa bibliométrica ou bibliometria é o entendimento do estado de estudo (levantamento bibliógrafico robusto) ao longo do tempo e/ou espaço sobre determinado assunto auxiliado pelo uso de alguns testes estatísticos.
Assim como a maioria das análises estatísticas, o R também realiza tudo o que se é preciso para realizar uma boa bibliometria, mas para isso, é necessário seguir alguns passos simples.

Passo 1 - Acesso ao Periódicos CAPES

Acesse a plataforma CAFe a partir dos periódicos CAPES - link aqui e clique no “ACESSO CAFE”, assim como mostrado na figura 1.

Figura 1: Visão geral da platadorma Peródicos CAPES.

Passo 2 - Acesso ao CAFe

Na plataforma CAFe, selecione a instituição na qual fazes parte (no meu caso, acho que o de muitos de vcs, a UFPE), seguindo o descrito na figura 2.

Figura 2: Selecionando a instituição na plataforma CAFe.

Passo 3 - Logando na plataforma

Com a matrícula do SIG@ (CPF) no lugar do " Username " e a senha do próprio SIG@ também ( Password ), faça o login na plataforma CAFe (figura 3).

Figura 3: Fazendo login na plataforma CAFe.

Passo 4 - Buscando base bibliográfica

Para buscar a base, assim que entrar no acesso CAFe, selecione a opção “Base” e selecione “S” (figura 4).

Figura 4: Buscando base bibliográfica.

Após isso, selecione a opção “SCOPUS”, pois essa será a base na qual será realizado o levantamento bibliográfico (figura 5).

Figura 5: Selecionando a base desejada “SCOPUS”.

Passo 5 - Acessando busca avançada

Após entrar no site da base, selecione logo na página carregada, a opção " Advanced document search " (figura 6).

Figura 6: selecionando o tipo de busca avançada.

Na busca avançada, há alguns caracteres que permitem que a pesquisa bibliográfica seja realizada, como por exemplo, a função TITLE("Oceanography") no site da SCOPUS diz que no título do artigo há de ter a palavra Oceanography. ABS("Marine" OR "Sea"), diz que no abstract tem de haver a palavra Marine OU Sea, ALL("Sediment" AND "Interstice") quer dizer que em todo o teste deve conter as palavras Sediment E Interstice, KEY("Oil" AND NOT "Spill") quer dizer que nas palavra-chave deve haver a palavra Oil, mas não a palavra Spill (figura 7) . A pesquisa para este exemplo foi realizada de acordo com a figura 8.

Figura 7: Funções de pesquisa na plataforma SCOPUS

Figura 8: Pesquisa realizada na plataforma SCOPUS

Passo 6 - Selecionando e exportando resultados

Após a pesquisa, deve-se clicar em " All " e após isso em " Export " (Atente-se a sequência, no caso contrário a pesquisa bibliográfica será mal sucedida) (figura 9).

Figura 9: Selecionando os dados e os exportando

Para exportar de forma bem sucedida os dados, após selecionar Export, deve-se selecionar TODAS AS OPÇÕES, colocar o formato como BibTex e então, selecionar Export dentro da caixa aberta (figura 10).

Figura 10: Exportando os resultados da pesquisa bibliográfica.

bibliometrix no R

Bibliometrix é uma biblioteca no R que é especializada para realizar testes estatísticos e gráficos para a bibliometria.

install.packages("bibliometrix")  # Para quem ainda não instalou
library(bibliometrix)

Carregamento dos dados

Para carregar os dados obtidos no SCOPUS no bibliometrix, precisa-se colocar em uma variável o atalho do arquivo .bib baixado e após isso convertê-lo para um data frame especificando de onde veio os dados e qual o formato dos dados.

bibaula <- "/Users/files/Desktop/Mtd.Comp/Aulas/Aula_R4/Data/scopus.bib"
bibdf <- convert2df(bibaula, dbsource = "scopus", format = "bibtex")

Converting your scopus collection into a bibliographic dataframe

Done!


Generating affiliation field tag AU_UN from C1:  Done!

Análise bibliométrica

Após o carregamento dos dados, pede-se para que o R realize a análise bibliométrica com o data frame obtido, especificando o tipo de separador, que geralmente é o semicolon ; e também pede a estatística descritiva a partir da função summary().

biban <- biblioAnalysis(bibdf, sep = ";")
summary(biban)


MAIN INFORMATION ABOUT DATA

 Timespan                              1986 : 2019 
 Sources (Journals, Books, etc)        11 
 Documents                             15 
 Average years from publication        14.3 
 Average citations per documents       35.27 
 Average citations per year per doc    2.992 
 References                            722 
 
DOCUMENT TYPES                     
 article               14 
 conference paper      1 
 
DOCUMENT CONTENTS
 Keywords Plus (ID)                    306 
 Author's Keywords (DE)                46 
 
AUTHORS
 Authors                               75 
 Author Appearances                    77 
 Authors of single-authored documents  1 
 Authors of multi-authored documents   74 
 
AUTHORS COLLABORATION
 Single-authored documents             1 
 Documents per Author                  0.2 
 Authors per Document                  5 
 Co-Authors per Documents              5.13 
 Collaboration Index                   5.29 
 

Annual Scientific Production

 Year    Articles
    1986        1
    1995        2
    1999        1
    2000        1
    2003        1
    2005        1
    2008        1
    2013        2
    2015        2
    2017        1
    2018        1
    2019        1

Annual Percentage Growth Rate 0 


Most Productive Authors

   Authors        Articles Authors        Articles Fractionalized
1     EDGAR GJ           2 GLEMAREC M                       1.000
2     EDWARDS DP         2 EDGAR GJ                         0.833
3     ABED RMM           1 BARRETT NS                       0.500
4     ADAMS JM           1 CHELLAIAH D                      0.500
5     AMOUROUX D         1 DEBROT AO                        0.500
6     BAGULEY JG         1 NAGELKERKEN IA                   0.500
7     BALTHIS WL         1 YULE CM                          0.500
8     BARANTAL S         1 EDWARDS DP                       0.361
9     BARRETT NS         1 BONNER J                         0.333
10    BLANCHARD A        1 GELIN A                          0.333


Top manuscripts per citations

                               Paper                                    DOI TC TCperYear   NTC
1  JEWETT SC, 1999, MAR ECOL PROG SER         10.3354/meps185059            88     3.826 1.000
2  LEE-CRUZ L, 2013, APPL ENVIRON MICROBIOL   10.1128/AEM.02541-13          82     9.111 1.302
3  SCHWERMER CU, 2008, APPL ENVIRON MICROBIOL 10.1128/AEM.02027-07          74     5.286 1.000
4  KINGSTON PF, 1995, MAR POLLUT BULL         10.1016/0025-326X(95)00052-O  49     1.815 1.690
5  GILROY JJ, 2015, GLOBAL CHANGE BIOL        10.1111/gcb.12696             48     6.857 1.000
6  GIAM X, 2015, CONSERV BIOL                 10.1111/cobi.12483            48     6.857 1.000
7  STAUFFERT M, 2013, PLOS ONE                10.1371/journal.pone.0065347  44     4.889 0.698
8  GLEMAREC M, 1986, WATER SCI TECHNOL        10.2166/wst.1986.0196         28     0.778 1.000
9  EDGAR GJ, 2000, MAR POLLUT BULL            10.1016/S0025-326X(99)00101-0 26     1.182 1.000
10 GELIN A, 2003, MAR POLLUT BULL             10.1016/S0025-326X(03)00368-0 20     1.053 1.000


Corresponding Author's Countries

         Country Articles   Freq SCP MCP MCP_Ratio
1 USA                   3 0.2308   3   0       0.0
2 AUSTRALIA             2 0.1538   1   1       0.5
3 UNITED KINGDOM        2 0.1538   1   1       0.5
4 FRANCE                1 0.0769   1   0       0.0
5 GERMANY               1 0.0769   0   1       1.0
6 INDONESIA             1 0.0769   0   1       1.0
7 KOREA                 1 0.0769   0   1       1.0
8 MALAYSIA              1 0.0769   0   1       1.0
9 NETHERLANDS           1 0.0769   0   1       1.0


SCP: Single Country Publications

MCP: Multiple Country Publications


Total Citations per Country

    Country      Total Citations Average Article Citations
1 UNITED KINGDOM              97                      48.5
2 USA                         95                      31.7
3 KOREA                       82                      82.0
4 GERMANY                     74                      74.0
5 AUSTRALIA                   46                      23.0
6 FRANCE                      44                      44.0
7 NETHERLANDS                  9                       9.0
8 MALAYSIA                     6                       6.0
9 INDONESIA                    0                       0.0


Most Relevant Sources

                                       Sources        Articles
1  MARINE POLLUTION BULLETIN                                 4
2  APPLIED AND ENVIRONMENTAL MICROBIOLOGY                    2
3  2005 INTERNATIONAL OIL SPILL CONFERENCE IOSC 2005         1
4  BIODIVERSITAS                                             1
5  CONSERVATION BIOLOGY                                      1
6  ECOLOGICAL INDICATORS                                     1
7  GLOBAL CHANGE BIOLOGY                                     1
8  INTEGRATED ENVIRONMENTAL ASSESSMENT AND MANAGEMENT        1
9  MARINE ECOLOGY PROGRESS SERIES                            1
10 PLOS ONE                                                  1


Most Relevant Keywords

   Author Keywords (DE)      Articles Keywords-Plus (ID)     Articles
1      INFAUNA                      2    BIODIVERSITY              11
2      OIL PALM PLANTATION          2    OIL SPILL                  9
3      OIL SPILL                    2    ARTICLE                    7
4      'EXXON VALDEZ'               1    AGRICULTURE                6
5      AGRICULTURE                  1    BACTERIA                   6
6      AGROECOSYSTEMS               1    BORNEO                     6
7      AMPHIBIANS                   1    DNA                        6
8      ANTS                         1    NONHUMAN                   6
9      AQUATIC INVERTEBRATES        1    SPECIES RICHNESS           6
10     BACTERIAL COMMUNITIES        1    COMMUNITY STRUCTURE        5

Obtém-se, desta forma, a amplitude temporal desde o primeiro artigo publicado até o último no momento Timespan.
Os tipos de documentos, se são artigos, livros, anais, etc. DOCUMENT TYPES.
As palavras-chave, quantas aparecem apenas uma vez ID e quantas mais de uma vez DE em DOCUMENT CONTENTS.
Os autores, quantos há, o número dos que aparecem apenas uma vez e os que aparecem mais de uma vez AUTHORS, as colaborações, que é a interação entre os autores, co-autores e uma média de artigos por autores também é mostrada AUTHORS COLLABORATION. A produção anual científica dos documentos publicados é mostrada por ano desde o primeiro ano de publicação até o último, se a taxa percentual de crescimento estiver até 5%, o crescimento da produção científica sobre o assunto é dado como significativo Annual Scientifi Production. Os Autores mais produtivos (que mais publicaram sobre o assunto) também são mostrados Most Productive Authors. O documento mais citado Top manuscript per citations Os países que mais publicaram e a frequência de publicação sobre o assunto Corresponding Author's Countries junto com os países das publicações mais citadas Total Citations per Country. As revistas que mais publicaram sobre o assunto Most Relevant Sources. As palavras chave mais utilizadas nos documentos Most Relevant Keywords.

Plotando gráficos

Com a função plot() e o resultado da análise bibliométrica, pode-se plotar poderosos gráficos para facilitar a análise, tais como os de autores mais produtivos, países mais produtivos, produção científica anual, média de citação dos artigos por ano e média total de citação por ano. SCP = produção sozinho (somente um país), MCP = mais de um país

plot(biban)

Para melhorar a análise, porém outros tipos de gráficos podem ser plotados, tais como:

  • Os autores mais produtivos ao longo do tempo, o que dá para ser usado para identificar acontecimentos, visto a queda ou aumento brusco na taxa de novos autores por ano.
authorProdOverTime(bibdf, k = 9, graph = TRUE)  # k é o número de países que já publicaram sobre o assunto

  • Interação/colaboração entre países para publicação
bib_country <- metaTagExtraction(bibdf, Field = "AU_CO", sep = ";")
bib_country_matrix <- biblioNetwork(bib_country, analysis = "collaboration", network = "countries", 
    sep = ";")
networkPlot(bib_country_matrix, n = dim(bib_country_matrix)[1], Title = "", type = "circle", 
    size = TRUE, cluster = "none")

  • Co-ocorrência de palavras-chave.
bib_key_matrix <- biblioNetwork(bib_country, analysis = "co-occurrences", network = "keywords", 
    sep = ";")
bib_key_plot <- networkPlot(bib_key_matrix, normalize = "association", n = 20, Title = "", 
    type = "fruchterman", size = TRUE)

Com essas análises e gráficos, pode até gerar bons artigos bibliométricos e muito bem aceitos por várias revistas, basta entender muito bem e ter afinidade sobre o assunto para saber acontecimentos, fenômenos ou autores de impacto para dissertar/discutir sobre os resultados obtidos.

Questão

Para esse exercício será preciso utilizar-se do word office (ou similares) e de scripts no RStudio…
Para a entrega do exercício envie dois arquivos: o documento word em PDF ou docx e o script do R.
Qualquer dúvida, é só postar no mural, Boa atividade!

  • Esta é a última atividade utilizando do R, então…

De acordo com o visto acima, elabore uma pesquisa bibliográfica sobre algum assunto de interesse e que não seja o mesmo do abordado pelo exemplo acima. Plote, apresente e discuta todos os gráficos da função plot(), o de interação/colaboração entre países e o de co-ocorrência das palavras-chave.