In prezent, peste 80% din datele digitale generate sunt date nestructurate sau semi-strucutrate. Prin urmare, necesitatea identificarii tiparelor, a tendintelor, respectiv extragerea informatiilor relevante din astfel de date reprezinta o provocare. Exista diverse instrumente si tehnici data mining ce pot fi utilizate pentru analiza tendintelor, respectiv pentru identificarea noilor directii de cercetare prin procesarea si analizarea datelor nestructurate. Aplicarea instrumentelor NLP (natural language processing) intr-un domeniu de cercetare poate ajuta la extragerea, preprocesarea, transformarea textului, extragerea caracteristicilor, identificarea pattern-urilor, respectiv gruparea documentelor stiintifice relevate (Talib et al. 2016).
Obiectiv
Studiul este focalizat pe analiza scientometrica a unui set de date ce contine informatii cu privire la domeniile Quantum machine learning (QML) and Quantum Computing (QC) - set de documente stiintifice indexate pe Web of Science.
Dintre obiectivele propuse amintim:
identificarea celor mai citati autori,
distributia geografica a publicatiilor stiintifice,
evolutia cuvintelor cheie
Descrierea setului de date analizat
Setul de date analizat in cadrul lucrarii contine un numar de 2119 documente stiintifice indexate in Web of Science, publicate in perioada 1999 - 2026, ce abordeaza diferite teme de cercetare din domeniile QML si QC, fiind descarcate prin intermediul plataformei e-nformation.
Descrierea variabilelor din setul de date analizat
Setul de date analizat contine un numar de 79 de variabile numerice si nenumerice. In tabelul de mai sus sunt prezentate o parte din cele mai importante variabile ce vor fi utilizate in analiza. Mai multe detalii gasiti aici
Pentru obtinerea rezultatelor analizei bibliometrice vom folosi functia summary() care permite afisarea unor informatii sub forma de tabele, precum: numarul de documente stiintifice publicate anual, productivitatea pe autor, respectiv pe tara, numarul de citari pe autor pe autor, respectiv tara, numarul total de citari pe tara, cele mai relevante publicatii stiintifice, respectiv cuvinte cheie etc.
Numarul de documente stiintifice publicate anual
Observam ca cele mai multe documente stiintifice au fost publicate in anul 2024 (506 documente stiintifice).
Productivitatea fiecarui autor
Observam ca Kim J este autorul care a publicat cele mai multe articole (20 de articole publicate), fiind urmat de Park S cu 16 articole stiintifice publicate.
Tabel. Articolele stiintifice publicate de PARK S.
Tabel. Articolele stiintifice publicate de KIM J.
Activitatea desfasurata de Kim J.
Ne vom uita in detaliu la activitatea desfasurata de Kim J
Fiecare articol a fost publicat in diferite reviste stiintifice fie ca:
single author (1 articol),
prim authori (2 articole), respectiv
co-author (17 articole din care 2 articole sunt proceedings paper).
Tabel. Numarul de articole scrise ca single autor este:
Numarul de articole scrise ca prim autor:
Obervam ca are doua articole scrise ca prim autor si un singur articol ca single author, in timp ce in celelalte articole este co-autor.
In general rolul primului autor este acela de a realiza cea mai mare parte a muncii practice si a analizei datelor. Este persoana care contribuie cel mai mult la realizarea cercetarii: de la stabilirea obiectivului de cercetarea si planificarea experimentala, pana la scrierea si editarea lucrarii.
Tabel. Numarul articolelor in care KIM J este co-autor este:
Tabel. Tipul articolelor publicate
Observam ca 18 din lucrarile publicate de Kim J sunt articole standard si 2 sunt articole publicate in revistele conferintelor.
Co-authorship network
Reprezentarea retelei de colaborare dintre autori pentru autorul Kim J.
Table. Numarul de grupuri de cercetare
Table. Componenta grupurilor de cercetare.
Reteaua de colaborare este formata din 30 de autori si are 126 de conexiuni din totalul de conexiuni posibile (435 conexiuni posibile). Numarul grupurilor de cercetare este 7 grupuri. Observam ca cel mai mare grup de cercetare este grupul 1 cu 11 membri, urmat de grupul 2 cu 6 membri. Observam ca autorul Kim J joaca rolul de autor care conecteaza grupurile de cercetare/cercetatori si are si cea mai mare influenta.
Caracteristicile retelei de colaborare dintre autori
Matricea de vecinatate (sociomatrix) este:
## KIM J PARK S BAEK H JUNG S KIM JP PARK C YUN WJ KIM GS ROH EJ SEOL J CHO S
## KIM J 20 11 5 4 3 3 3 2 2 2 1
## PARK S 11 11 4 4 2 3 2 2 1 0 1
## BAEK H 5 4 5 0 0 0 1 0 1 0 0
## JUNG S 4 4 0 4 2 3 1 0 1 0 1
## KIM JP 3 2 0 2 3 2 2 0 0 0 0
## PARK C 3 3 0 3 2 3 1 0 0 0 1
## YUN WJ 3 2 1 1 2 1 3 0 0 0 0
## KIM GS 2 2 0 0 0 0 0 2 0 0 0
## ROH EJ 2 1 1 1 0 0 0 0 2 0 0
## SEOL J 2 0 0 0 0 0 0 0 0 2 0
## CHO S 1 1 0 1 0 1 0 0 0 0 1
## CHOI J 1 0 0 0 0 0 0 0 0 0 0
## CHOI M 1 1 0 1 0 1 0 0 0 0 1
## CHONG Y 1 0 0 0 0 0 0 0 0 0 0
## CHUNG J 1 1 0 1 0 1 0 0 0 0 1
## HAN Z 1 1 0 0 0 0 0 1 0 0 0
## HONG DW 1 0 0 0 0 0 0 0 0 0 0
## HWANG E 1 0 0 0 0 0 0 0 0 0 0
## JEONG S 1 0 0 0 0 0 0 0 0 0 0
## JHO NS 1 0 0 0 0 0 0 0 0 0 0
## JUNG SY 1 0 0 0 1 0 1 0 0 0 0
## KANCHARLA A 1 0 0 0 0 0 0 0 0 1 0
## KIM D 1 0 1 0 0 0 0 0 1 0 0
## KIM HY 1 0 0 0 0 0 0 0 0 1 0
## KIM JH 1 0 0 0 1 0 1 0 0 0 0
## OH B 1 0 0 0 0 0 0 0 0 0 0
## OH S 1 0 0 0 0 0 0 0 0 0 0
## PARK DK 1 0 0 0 0 0 0 0 0 0 0
## RODRIGUES TK 1 1 0 1 1 1 1 0 0 0 0
## SHIM JY 1 0 0 0 0 0 0 0 0 0 0
Indicatori de centralitate a retelei de colaborare dintre autori: Kim J
##
##
## Main statistics about the network
##
## Size 30
## Density 0.193
## Transitivity 0.422
## Diameter 2
## Degree Centralization 0.807
## Average path length 1.807
##
Observam ca autorul Kim J a colaborat cu 30 de autori (dimensiunea retelei este 30). Densitatea retelei este 19.3% ceea ce indica faptul ca reteaua este fragmentata. Majoritatea colaborarilor (pe care le-a avut autorul Kim J) au fost cu cercetatori Park S, Beak H, respectiv Jung S. Informatia circula intre membri comunitatilor stiintifice relativ rapid si exista grupuri care formeaza triunghiuri. Reteau de colaborare este centralizata, deoarece Kim J detine majoritatea conexiunilor, iar restul autorilor sunt izolati sau au foarte putine colaborari. Observam ca avem o retea compacta, bine definita, in care majoritatea autorilor sunt conectati direct, iar restul autorilor sunt la un singur pas (Newman (2005)).
Reprezentarea colaborarilor internationale
Reprezentarea colaborarilor la nivel de tara
Observam ca Kim J care este din Korea a colaborat cu autori din SUA si Japonia.
Reprezentarea colaborarilor institutionale
Reprezentarea colaborarilor la nivel de organizatie/institutii de cercetare
Matricea de vecintate pentru institutiile de cercetare analizate
Componenta clusterelor si indicatori de centralitate a retelei de colaborare
Observam ca reteaua de colaborare institutionala este formata dintr-un numar de 5 grupuri de institutii de cercetare. Grupul 1 este format din 7 institutii de cercetare, fiind si cel mai mare. Cea mai mare valoare pentru coeficientul betweenness este inregistrat de Universitatea Korea, urmat de universitatea Sookmyung Women’s University si Ajou University. Observam ca in retea apare si o companie (de exemplu compania Hyundai Motors).
Observam ca grupul 1 de cercetare colaboreaza mai mult doar cu institutii din Korea. Universitatea Korea este cea care conecteaza diferite grupuri de cercetare din cadrul altor universitati, institute de cercetare si companii. De asemenea, atat grupurile de cercetare din cadrul Korea University, cat si cele din cadrul Sookmyung Women’s University colaboreaza cu institutii de cercetare din SUA Umadevi (2013).
Reteaua co-citarilor pe baza referintelor (Co-Citation Network)
Reprezentarea co-citarilor pe baza referintelor
Citarile pe fiecare articol
Observam ca cel mai citat articol (9697 citari) este articolul scris de RAISSI M si colaboratori sai (cu titlul Physics-informed neural networks: a deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations), in anul 2019, si este publicat in revista J COMPUT PHYS. De asemenea, observam ca articolul a fost citati cu 42% mai mult decat valoarea medie a articolelor similare publicate in anul 2019. Numarul citarilor medii per an este de 1212 citari (avem un numar total de citari 9697, iar articolul a fost scris in 2019. Prin urmare, 9697 / (2026 - 2019) + 1 = 1212 citari).
Top 10 cele mai citate articole stiintifice
Titlul articolului scris de cercetatorul Maziar Raissi at al.
Pentru a obtine o serie de informatii cu privire la Maziar Raissi
## WARNING: No OpenAlex API key detected. Rate limits will be stricter.
## Get a free API key at: https://openalex.org/
## Set it with: Sys.setenv(openalexR_apikey = 'YOUR_API_KEY')
##
## Retrieving article information for DOI: 10.1016/j.jcp.2018.10.045
## Article found: Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations
## Total number of authors: 3
## Authors:
## 1 . Maziar Raissi
## 2 . Paris Perdikaris
## 3 . George Em Karniadakis
##
## Retrieving information for author at position 2
## Author name: Paris Perdikaris
## OpenAlex ID: A5002562845
## Position type: middle
## Is corresponding author: TRUE
## Waiting 1 seconds before API call...
##
## === Success ===
## Information successfully retrieved for: Paris Perdikaris
## Number of publications: 161
## Number of citations: 39903
## H-index: 52
## Primary affiliation: University of Pennsylvania
Observam ca autorul este afiliat la Universitatea Brown si a scris 92 de articole stiintifice. Numarul de citari este 30108 citari.
Inforamtii cu privire la al II-lea autor Paris Perdikaris
## WARNING: No OpenAlex API key detected. Rate limits will be stricter.
## Get a free API key at: https://openalex.org/
## Set it with: Sys.setenv(openalexR_apikey = 'YOUR_API_KEY')
##
## Retrieving article information for DOI: 10.1016/j.jcp.2018.10.045
## Article found: Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations
## Total number of authors: 3
## Authors:
## 1 . Maziar Raissi
## 2 . Paris Perdikaris
## 3 . George Em Karniadakis
##
## Retrieving information for author at position 2
## Author name: Paris Perdikaris
## OpenAlex ID: A5002562845
## Position type: middle
## Is corresponding author: TRUE
## Waiting 1 seconds before API call...
##
## === Success ===
## Information successfully retrieved for: Paris Perdikaris
## Number of publications: 161
## Number of citations: 39903
## H-index: 52
## Primary affiliation: University of Pennsylvania
Inforamtii cu privire la al II-lea autor Paris Perdikaris
## WARNING: No OpenAlex API key detected. Rate limits will be stricter.
## Get a free API key at: https://openalex.org/
## Set it with: Sys.setenv(openalexR_apikey = 'YOUR_API_KEY')
##
## Retrieving article information for DOI: 10.1016/j.jcp.2018.10.045
## Article found: Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations
## Total number of authors: 3
## Authors:
## 1 . Maziar Raissi
## 2 . Paris Perdikaris
## 3 . George Em Karniadakis
##
## Retrieving information for author at position 3
## Author name: George Em Karniadakis
## OpenAlex ID: A5009658255
## Position type: last
## Is corresponding author: FALSE
## Waiting 1 seconds before API call...
##
## === Success ===
## Information successfully retrieved for: George Em Karniadakis
## Number of publications: 1254
## Number of citations: 105265
## H-index: 136
## Primary affiliation: Brown University
Productivitatea pe tara
Variabilele au urmatoarea semnificatie:
aricles - numarul total de articole in care cel putin un autor este din acea tara (colaborare la nivel national)
SCP - ssingle country publication - numarul de articole in care toti autori sunt din acea tara (colaborare la nivel national)
MCP - multiple country publications - numarul total de articole in care exista cel putin un autor din alta tara (colaborare la nivel international)
frecventa - proportia totala a articolelor din acea tara fata de numarul total de articole inregistrat la nivel global (mai exact SCP + MCP = numarul total de articole)
MCP_Ratio - fiind proportia articolelor scrise de autori ce colaboreaza la nivel internationala
Tabel. Top 10 cele mai productive tari din perioada 1999 - 2026.
Avem doua tipuri sau categorii de articole: fie articole scrise de autori ce fac parte din aceeasi tara (colaborari nationale), fie articole scrise in colaborare, autori ce fac parte din tari diferite (colaborari internationale). In tabel sunt prezentate valorile obtinute pentru indicatori de colaborare dintre autori.
Numarul total de citari pe tara
Revistele stiintifice relevante
Cele mai utilizate/relevante cuvinte cheie
Observam ca cele mai multe articole sunt scrise de cercetatori din domeniul Computer Science (399 articole stiintifice), urmat de cei din domeniul Physics (328 articole stiintifice).
Distributia documentelor stiintifice dupa domeniile stiintifice care
contribuie la dezvoltarea domeniilor analizate in perioada 2016 - 2026
Se poate observa ca daca initial numarul domeniilor stiintifice care
contribuiau la dezvoltarea domeniului QML&QC este mic, dupa anul
2019 incep sa apara articole publicate de autori care provind din
diverse domenii. Observam ca perioda de dinainte de 2019 este dominata
de articole publicate de autori din domenii precum
Physics si Computer Science. Dupa anul
2019 incep sa apara si publicatii scrise de autori din alte domenii
stiintifice care isi aduc contributia (Bansal and
Rajput 2025).
Conclusions
In cadrul studiului s-a realizat analiza bibliometrica a domeniilor Quantum Computing and Quantum Machine learning pe baza documentelor stiintifice publicate in perioada 1999 - 2026 si descarcate de pe Web of Science. Desi dezvoltarea domeniilor analizate este semnificativa, literatura stiintifica pe acest domeniu este relativ mica, fiind compusa dintr-un numar de 2119 documente stiintifice. Analiza bibliometrica s-a realizat cu ajutorul pachetului R bibliometrix. In cadrul studiului s-a realizat analiza principalelor caracteristici ale publicatiilor cum ar fi: numarul de documente stiintifice publicate anual, productivitatea pe autor, respectiv pe tara, numarul de citari pe autor pe autor, respectiv tara, numarul total de citari pe tara, cele mai relevante publicatii stiintifice, respectiv cuvinte cheie etc. Rezultatele obtinute arata faptul ca cele mai multe publicatii s-au realizat dupa anul 2019, indicand o crestere a interesului acordat domeniilor analizate. SUA ramane cea mai productiva tara, urmata de China si India. De asemenea, SUA detine cele mai multe articole publicate la nivel national, in timp ce la nivel international cele mai multe articole sunt realizate de cercetatori din China. Combinarea capabilitatilor calculatoarelor cuantice cu cele ale invatarii automate clasice poate accelera dezvoltarea a diferite domenii, precum: santatea, stiinta materialelor etc.
Bibliography
Martin Geissmann, Comparison of Word Cloud R Packages, 2024, https://rpubs.com/mgei/1259234 accessed on 03.07.2026.