openalex R paketleri (openalexR ve openalex)

openalexR ve openalex paketleri OpenAlex akademik ağı içerisinden üst veri almak için tasarlanmış paketlerdir. Bu paketlerin sağladığı veriler için küçük bir deneme yapalım. Gerekli paketleri yükleyerek işe başlayalım.

library(tidyverse) # JSON verisini düzenlemek için kullanacağız.
library(openalexR) # https://github.com/ekmaloney/openalexR 
library(openalex) #https://github.com/KTH-Library/openalex
library(DT) #Verileri düzgün bir tabloda göstermek için kullanacağız.

Geçmiş verileri silme

Sistemde kalan değişkenler nedeniyle herhangi bir hata yapmamak için tüm değişkenleri silelim.

rm(list = ls(all.names = TRUE))

Kalıcı bir tanımlayıcı ile veriye ulaşma

Bilimsel araştırma ekosisteminde tekilliği sağlayabilmek için PID(persistent identifiers) kullanımı oldukça yaygındır. openalex de bu tanımlayıcıları kullanarak bilimsel yayın veya araştırmacıya ulaşma imkanı veriyor.Araştırmacıyı bulmak için DOI bilgisini bildiğimiz bir çalışmayı kullanabiliriz. Örnekte 2019 yılında yapmış olduğum bir çalışmaya ait DOI bilgisini kullandım.

paper_info <- find_work (id_type = "doi", 
                         id = "https://dx.doi.org/10.5152/FNJN.2019.18028",
                         variable_unnest = "authors")
paper_tbl <- paper_info %>% select(title,openalexid,publication_date)

sonuçların daha iyi görünmesi için veri tablosu formatını kullanalım.

datatable(paper_tbl)

Tüm Çalışmaları Toplamak

Sistemde verileri tanımlamak için pek çok tanımlayıcı kullanılmış. openalex id olarak tanımlanan değişken ile araştırmacının sistemde yer alan bütün çalışmalarının sayısı görülebilir. Bu tanımlayıcının yanında SCOPUS, MAG ve ORCid gibi tanımlayıcıları da kullanarak sorgu gerçekleştirilebilir.

find_author_by_id <-find_author(id_type = "openalex",id="https://openalex.org/A2614412206")
clean_author_info(find_author_by_id)
tbl_info <- find_author_by_id %>%select(name,orcid,openalex_id,total_works)

sonuçları daha düzgün görmek için yine veri tablosu ile görünümü anlaşılır hale getiriyoruz.

datatable(tbl_info)

Bütün çalışmaları listelemek

Sistemde yer alan bütün çalışmaları sayısını gördükten sonra bunları listeleyelim.

Researcher_oa_id <- paper_info$authors_id[1]
all_papers <- get_authors_papers(id_type = "openalex",
                                 id = Researcher_oa_id)
tbl_all_papers <- all_papers %>% select(title,openalex,publication_year)

Yine anlaşılması için bütün çalışmaları listeleyelim.

datatable(tbl_all_papers)

Son Değerlendirme

openalex.org sitesi resmi olarak hizmet vermese de geliştirilen sorgular ile birçok sonuca ulaşmak mümkün. Ancak yukarıdaki tabloda da göreceğiniz gibi bu çalışmaların bazıları mükerrer olarak sistemde yer alabiliyor. Bu hataları dikkate alarak gelecekte bu sistemden metaverileri kullanmakta yarar olduğunu düşünüyorum.