Bibliometria no bibliometrix (R)
Pesquisa bibliométrica
Pesquisa bibliométrica ou bibliometria é o entendimento do estado de estudo (levantamento bibliógrafico robusto) ao longo do tempo e/ou espaço sobre determinado assunto auxiliado pelo uso de alguns testes estatísticos.
Assim como a maioria das análises estatísticas, o R também realiza tudo o que se é preciso para realizar uma boa bibliometria, mas para isso, é necessário seguir alguns passos simples.
Passo 1 - Acesso ao Periódicos CAPES
Acesse a plataforma CAFe a partir dos periódicos CAPES - link aqui e clique no “ACESSO CAFE”, assim como mostrado na figura 1.
Figura 1: Visão geral da platadorma Peródicos CAPES.
Passo 2 - Acesso ao CAFe
Na plataforma CAFe, selecione a instituição na qual fazes parte (no meu caso, acho que o de muitos de vcs, a UFPE), seguindo o descrito na figura 2.
Figura 2: Selecionando a instituição na plataforma CAFe.
Passo 3 - Logando na plataforma
Com a matrícula do SIG@ (CPF) no lugar do " Username " e a senha do próprio SIG@ também ( Password ), faça o login na plataforma CAFe (figura 3).
Figura 3: Fazendo login na plataforma CAFe.
Passo 4 - Buscando base bibliográfica
Para buscar a base, assim que entrar no acesso CAFe, selecione a opção “Base” e selecione “S” (figura 4).
Figura 4: Buscando base bibliográfica.
Após isso, selecione a opção “SCOPUS”, pois essa será a base na qual será realizado o levantamento bibliográfico (figura 5).
Figura 5: Selecionando a base desejada “SCOPUS”.
Passo 5 - Acessando busca avançada
Após entrar no site da base, selecione logo na página carregada, a opção " Advanced document search " (figura 6).
Figura 6: selecionando o tipo de busca avançada.
Na busca avançada, há alguns caracteres que permitem que a pesquisa bibliográfica seja realizada, como por exemplo, a função TITLE("Oceanography") no site da SCOPUS diz que no título do artigo há de ter a palavra Oceanography. ABS("Marine" OR "Sea"), diz que no abstract tem de haver a palavra Marine OU Sea, ALL("Sediment" AND "Interstice") quer dizer que em todo o teste deve conter as palavras Sediment E Interstice, KEY("Oil" AND NOT "Spill") quer dizer que nas palavra-chave deve haver a palavra Oil, mas não a palavra Spill (figura 7) . A pesquisa para este exemplo foi realizada de acordo com a figura 8.
Figura 7: Funções de pesquisa na plataforma SCOPUS
Figura 8: Pesquisa realizada na plataforma SCOPUS
Passo 6 - Selecionando e exportando resultados
Após a pesquisa, deve-se clicar em " All " e após isso em " Export " (Atente-se a sequência, no caso contrário a pesquisa bibliográfica será mal sucedida) (figura 9).
Figura 9: Selecionando os dados e os exportando
Para exportar de forma bem sucedida os dados, após selecionar Export, deve-se selecionar TODAS AS OPÇÕES, colocar o formato como BibTex e então, selecionar Export dentro da caixa aberta (figura 10).
Figura 10: Exportando os resultados da pesquisa bibliográfica.
bibliometrix no R
Bibliometrix é uma biblioteca no R que é especializada para realizar testes estatísticos e gráficos para a bibliometria.
Carregamento dos dados
Para carregar os dados obtidos no SCOPUS no bibliometrix, precisa-se colocar em uma variável o atalho do arquivo .bib baixado e após isso convertê-lo para um data frame especificando de onde veio os dados e qual o formato dos dados.
bibaula <- "/Users/files/Desktop/Mtd.Comp/Aulas/Aula_R4/Data/scopus.bib"
bibdf <- convert2df(bibaula, dbsource = "scopus", format = "bibtex")
Converting your scopus collection into a bibliographic dataframe
Done!
Generating affiliation field tag AU_UN from C1: Done!
Análise bibliométrica
Após o carregamento dos dados, pede-se para que o R realize a análise bibliométrica com o data frame obtido, especificando o tipo de separador, que geralmente é o semicolon ; e também pede a estatística descritiva a partir da função summary().
MAIN INFORMATION ABOUT DATA
Timespan 1986 : 2019
Sources (Journals, Books, etc) 11
Documents 15
Average years from publication 14.3
Average citations per documents 35.27
Average citations per year per doc 2.992
References 722
DOCUMENT TYPES
article 14
conference paper 1
DOCUMENT CONTENTS
Keywords Plus (ID) 306
Author's Keywords (DE) 46
AUTHORS
Authors 75
Author Appearances 77
Authors of single-authored documents 1
Authors of multi-authored documents 74
AUTHORS COLLABORATION
Single-authored documents 1
Documents per Author 0.2
Authors per Document 5
Co-Authors per Documents 5.13
Collaboration Index 5.29
Annual Scientific Production
Year Articles
1986 1
1995 2
1999 1
2000 1
2003 1
2005 1
2008 1
2013 2
2015 2
2017 1
2018 1
2019 1
Annual Percentage Growth Rate 0
Most Productive Authors
Authors Articles Authors Articles Fractionalized
1 EDGAR GJ 2 GLEMAREC M 1.000
2 EDWARDS DP 2 EDGAR GJ 0.833
3 ABED RMM 1 BARRETT NS 0.500
4 ADAMS JM 1 CHELLAIAH D 0.500
5 AMOUROUX D 1 DEBROT AO 0.500
6 BAGULEY JG 1 NAGELKERKEN IA 0.500
7 BALTHIS WL 1 YULE CM 0.500
8 BARANTAL S 1 EDWARDS DP 0.361
9 BARRETT NS 1 BONNER J 0.333
10 BLANCHARD A 1 GELIN A 0.333
Top manuscripts per citations
Paper DOI TC TCperYear NTC
1 JEWETT SC, 1999, MAR ECOL PROG SER 10.3354/meps185059 88 3.826 1.000
2 LEE-CRUZ L, 2013, APPL ENVIRON MICROBIOL 10.1128/AEM.02541-13 82 9.111 1.302
3 SCHWERMER CU, 2008, APPL ENVIRON MICROBIOL 10.1128/AEM.02027-07 74 5.286 1.000
4 KINGSTON PF, 1995, MAR POLLUT BULL 10.1016/0025-326X(95)00052-O 49 1.815 1.690
5 GILROY JJ, 2015, GLOBAL CHANGE BIOL 10.1111/gcb.12696 48 6.857 1.000
6 GIAM X, 2015, CONSERV BIOL 10.1111/cobi.12483 48 6.857 1.000
7 STAUFFERT M, 2013, PLOS ONE 10.1371/journal.pone.0065347 44 4.889 0.698
8 GLEMAREC M, 1986, WATER SCI TECHNOL 10.2166/wst.1986.0196 28 0.778 1.000
9 EDGAR GJ, 2000, MAR POLLUT BULL 10.1016/S0025-326X(99)00101-0 26 1.182 1.000
10 GELIN A, 2003, MAR POLLUT BULL 10.1016/S0025-326X(03)00368-0 20 1.053 1.000
Corresponding Author's Countries
Country Articles Freq SCP MCP MCP_Ratio
1 USA 3 0.2308 3 0 0.0
2 AUSTRALIA 2 0.1538 1 1 0.5
3 UNITED KINGDOM 2 0.1538 1 1 0.5
4 FRANCE 1 0.0769 1 0 0.0
5 GERMANY 1 0.0769 0 1 1.0
6 INDONESIA 1 0.0769 0 1 1.0
7 KOREA 1 0.0769 0 1 1.0
8 MALAYSIA 1 0.0769 0 1 1.0
9 NETHERLANDS 1 0.0769 0 1 1.0
SCP: Single Country Publications
MCP: Multiple Country Publications
Total Citations per Country
Country Total Citations Average Article Citations
1 UNITED KINGDOM 97 48.5
2 USA 95 31.7
3 KOREA 82 82.0
4 GERMANY 74 74.0
5 AUSTRALIA 46 23.0
6 FRANCE 44 44.0
7 NETHERLANDS 9 9.0
8 MALAYSIA 6 6.0
9 INDONESIA 0 0.0
Most Relevant Sources
Sources Articles
1 MARINE POLLUTION BULLETIN 4
2 APPLIED AND ENVIRONMENTAL MICROBIOLOGY 2
3 2005 INTERNATIONAL OIL SPILL CONFERENCE IOSC 2005 1
4 BIODIVERSITAS 1
5 CONSERVATION BIOLOGY 1
6 ECOLOGICAL INDICATORS 1
7 GLOBAL CHANGE BIOLOGY 1
8 INTEGRATED ENVIRONMENTAL ASSESSMENT AND MANAGEMENT 1
9 MARINE ECOLOGY PROGRESS SERIES 1
10 PLOS ONE 1
Most Relevant Keywords
Author Keywords (DE) Articles Keywords-Plus (ID) Articles
1 INFAUNA 2 BIODIVERSITY 11
2 OIL PALM PLANTATION 2 OIL SPILL 9
3 OIL SPILL 2 ARTICLE 7
4 'EXXON VALDEZ' 1 AGRICULTURE 6
5 AGRICULTURE 1 BACTERIA 6
6 AGROECOSYSTEMS 1 BORNEO 6
7 AMPHIBIANS 1 DNA 6
8 ANTS 1 NONHUMAN 6
9 AQUATIC INVERTEBRATES 1 SPECIES RICHNESS 6
10 BACTERIAL COMMUNITIES 1 COMMUNITY STRUCTURE 5
Obtém-se, desta forma, a amplitude temporal desde o primeiro artigo publicado até o último no momento Timespan.
Os tipos de documentos, se são artigos, livros, anais, etc. DOCUMENT TYPES.
As palavras-chave, quantas aparecem apenas uma vez ID e quantas mais de uma vez DE em DOCUMENT CONTENTS.
Os autores, quantos há, o número dos que aparecem apenas uma vez e os que aparecem mais de uma vez AUTHORS, as colaborações, que é a interação entre os autores, co-autores e uma média de artigos por autores também é mostrada AUTHORS COLLABORATION. A produção anual científica dos documentos publicados é mostrada por ano desde o primeiro ano de publicação até o último, se a taxa percentual de crescimento estiver até 5%, o crescimento da produção científica sobre o assunto é dado como significativo Annual Scientifi Production. Os Autores mais produtivos (que mais publicaram sobre o assunto) também são mostrados Most Productive Authors. O documento mais citado Top manuscript per citations Os países que mais publicaram e a frequência de publicação sobre o assunto Corresponding Author's Countries junto com os países das publicações mais citadas Total Citations per Country. As revistas que mais publicaram sobre o assunto Most Relevant Sources. As palavras chave mais utilizadas nos documentos Most Relevant Keywords.
Plotando gráficos
Com a função plot() e o resultado da análise bibliométrica, pode-se plotar poderosos gráficos para facilitar a análise, tais como os de autores mais produtivos, países mais produtivos, produção científica anual, média de citação dos artigos por ano e média total de citação por ano. SCP = produção sozinho (somente um país), MCP = mais de um país
Para melhorar a análise, porém outros tipos de gráficos podem ser plotados, tais como:
- Os autores mais produtivos ao longo do tempo, o que dá para ser usado para identificar acontecimentos, visto a queda ou aumento brusco na taxa de novos autores por ano.
authorProdOverTime(bibdf, k = 9, graph = TRUE) # k é o número de países que já publicaram sobre o assunto- Interação/colaboração entre países para publicação
bib_country <- metaTagExtraction(bibdf, Field = "AU_CO", sep = ";")
bib_country_matrix <- biblioNetwork(bib_country, analysis = "collaboration", network = "countries",
sep = ";")
networkPlot(bib_country_matrix, n = dim(bib_country_matrix)[1], Title = "", type = "circle",
size = TRUE, cluster = "none")- Co-ocorrência de palavras-chave.
bib_key_matrix <- biblioNetwork(bib_country, analysis = "co-occurrences", network = "keywords",
sep = ";")
bib_key_plot <- networkPlot(bib_key_matrix, normalize = "association", n = 20, Title = "",
type = "fruchterman", size = TRUE)Com essas análises e gráficos, pode até gerar bons artigos bibliométricos e muito bem aceitos por várias revistas, basta entender muito bem e ter afinidade sobre o assunto para saber acontecimentos, fenômenos ou autores de impacto para dissertar/discutir sobre os resultados obtidos.
Questão
Para esse exercício será preciso utilizar-se do word office (ou similares) e de scripts no RStudio…
Para a entrega do exercício envie dois arquivos: o documento word em PDF ou docx e o script do R.
Qualquer dúvida, é só postar no mural, Boa atividade!
- Esta é a última atividade utilizando do R, então…