OPTIMALISASI POSISI PENYERANG KIRI ARSENAL MELALUI ANALISIS CLUSTER K-MEANS DATA MUSIM 2023/2024

1. PENDAHULUAN

1.1 Latar Belakang

Arsenal adalah salah satu tim di Liga Primer Inggris yang berasal dari London. Dari dua musim terakhir tim asuhan Mikel Arteta selalu menjadi tim penantang gelar berkat kesuburan trio lini depan. Pada musim 2022/2023 Arsenal hampir menjadi juara Liga Inggris setelah 19 tahun puasa gelar, namun inkonsistensi adalah penyebab utamanya. Hal tersebut juga kembali terjadi di musim 2023/2024 Arsenal hanya terpaut 2 point dari sang juara Manchester City. Namun yang menjadi permasalahan tetap sama yaitu konsistensi lini depan disaat - saat krusial. Tidak seperti musim 2022/2023 Gabriel Martinelli adalah salah satu pemain vital di sistem Mikel Arteta dengan menjadi salah satu pemain terbaik dengan Bukayo Saka, namun tidak seperti koleganya ia mengalami penurunan baik dari jumlah gol , asis, dan keberanian untuk memasuki pertahanan lawan sejak musim 2023/2024 bahkan hingga paruh musim 2024/2025. Hal ini tentu menjadi PR besar yang harus diselesaikan Sang pelatih untuk menjaga asa meraih gelar primer Inggis yang sudah 21 tahun tidak kembali ke The Gooners .

Analisis Cluster merupakan salah satu metode statistika yang dapat digunakan untuk melakukan proses pengelompokan objek-objek, sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama (Gabriella & Yonlib, 2020). Secara umum, analisis cluster dibagi dalam dua metode yaitu metode Non-hierarki dan metode Hierarki. Pada metode Non-hierarki banyaknya cluster ditentukan terlebih dahulu sedangkan metode cluster Hierarki harus melakukan analisis terlebih dahulu untuk menentukan banyaknya cluster. Menurut Dewi (2014) metode hierarki dibagi menjadi dua yaitu metode agglomerative (pemusatan) dan metode divisive.

Metode analisis cluster yang digunakan dalam kasus ini adalah analisis cluster hierarki yaitu terdiri dari Single Linkage Method, Complete Linkage Method, Average Linkage Method, Ward’s Method, dan Centroid Method. Salah satu masalah dalam analisis cluster adalah penentuan jumlah cluster optimal dalam cluster yang sudah di bentuk. Oleh karena itu, dalam melakukan analisis cluster perlu dilakukan uji validitas cluster untuk mendapatkan jumlah cluster yang optimal, maka digunakan indeks validitas silhouette berdasarkan jarak Euclidean (Nicolaus, Evy, dan Hendra, 2016). Analisis cluster dapat digunakan untuk mencari pemain penyerang kiri yang tepat bagi Arsenal dengan mengelompokan seluruh pemain penyerang kiri di lima liga terbaik di Eropa berdasarkan beberapa variabel seperti performa keseluruhan, aspek playmaking, aspek bertahan

1.2 Rumusan Masalah

  1. Kelompok mana yang paling sesuai dengan profil penyerang kiri yang dibutuhkan Arsenal berdasarkan analisis cluster?
  2. Faktor-faktor apa saja yang membedakan antara kelompok penyerang kiri yang berkinerja baik dan buruk di Arsenal?

1.3 Tujuan

  1. Memberikan rekomendasi mengenai profil penyerang kiri yang harus dicari untuk memperkuat lini depan.
  2. Mengelompokkan pemain penyerang kiri di lima liga top Eropa berdasarkan kinerja dan karakteristik mereka.
  3. Mengidentifikasi faktor-faktor yang membedakan antara kelompok penyerang kiri yang berkinerja baik dan buruk.

1.4 Data

Data yang digunakan adalah data sekunder sebanyak 69 pemain penyerang kiri dari lima liga top eropa yang bersumber dari fbref.com

Data Pemain Penyerang Kiri di 5 Liga Top Eropa
Player Age Min G-PK Succ_Takeon Carrier_ToPenaltyArea TotDist Miss_Control Ast TB Crs Recov Market
Ademola Lookman 25 1894 11 39 35 4257 66 7 6 69 89 40.0
Alejandro Garnacho 19 2565 7 48 102 8015 69 4 2 58 106 50.0
Alexander Isak 23 2255 16 42 38 3052 49 2 5 10 38 75.0
Alexis Sánchez 34 763 1 12 4 1426 22 5 5 31 28 2.5
Amad Diallo 21 390 1 11 4 1035 7 1 0 1 14 22.0
André Ayew 33 1104 5 16 5 1466 25 0 0 4 40 0.8
Ansu Fati 20 521 2 5 9 1025 15 0 1 3 22 15.0
Anthony Gordon 22 2890 10 54 59 7622 70 10 8 111 125 60.0
Ayoze Pérez 30 2294 9 50 41 4465 70 1 5 19 121 10.0
Bradley Barcola 20 1640 4 54 58 5215 52 7 4 18 63 65.0
Brahim Díaz 23 1545 8 55 32 4465 48 6 7 31 74 40.0
Bryan Mbeumo 23 1960 6 26 38 4326 67 6 15 92 93 40.0
Bryan Zaragoza 22 183 0 8 6 676 3 0 0 10 4 12.0
Callum Hudson-Odoi 22 1854 8 43 39 5044 34 1 3 74 98 22.0
Christian Pulisic 24 2602 12 47 46 7489 70 8 3 101 100 50.0
Christopher Nkunku 25 443 3 2 2 606 17 0 3 4 12 65.0
Diogo Jota 26 1145 10 15 23 2104 42 3 5 9 48 50.0
Donyell Malen 24 1781 13 42 45 3933 51 1 6 39 71 40.0
Elye Wahi 20 14 0 1 1 82 3 0 0 0 1 30.0
Facundo Pellistri 21 172 0 5 4 482 4 1 0 4 11 10.0
Federico Chiesa 25 2197 8 35 58 4746 54 2 6 117 62 30.0
Ferrán Torres 23 1211 7 10 15 1744 35 2 3 21 40 30.0
Gabriel Jesus 26 1478 4 35 25 2654 61 5 8 9 59 55.0
Gabriel Martinelli 22 2019 6 40 82 5863 54 4 3 109 95 60.0
Hwang Hee-chan 27 2119 11 36 24 2586 55 3 3 11 75 25.0
Jack Grealish 27 1009 3 18 50 4025 19 1 3 16 42 55.0
Jadon Sancho 23 1026 2 39 34 3480 21 2 3 30 50 30.0
Jarrod Bowen 26 3019 16 34 49 4859 79 6 5 75 118 50.0
Jeremy Doku 21 1706 4 96 154 8162 54 8 2 62 82 65.0
João Félix 23 1540 7 29 31 3648 43 3 8 17 68 30.0
João Pedro 21 2045 5 43 47 5003 83 3 6 29 65 50.0
Jordan Ayew 31 2543 4 52 20 5509 85 7 4 97 155 4.0
Julio Enciso 19 475 0 17 7 1299 15 2 2 8 13 22.0
Kaoru Mitoma 26 1486 3 39 62 4879 38 4 3 44 68 45.0
Karim Adeyemi 21 913 3 18 27 2413 29 1 0 25 60 35.0
Khvicha Kvaratskhelia 22 2737 11 101 81 9260 58 6 6 99 99 80.0
Kingsley Coman 27 1113 3 29 35 4124 26 3 1 60 50 40.0
Kylian Mbappé 24 2158 21 61 66 6749 56 7 12 23 47 180.0
Leandro Trossard 28 1649 12 25 27 3651 47 1 8 57 88 35.0
Leroy Sané 27 2137 8 93 44 7599 63 11 8 86 97 60.0
Luis Díaz 26 2629 8 67 70 7500 69 5 4 26 127 80.0
Luis Javier Suárez 25 917 5 12 15 1501 30 0 2 7 17 3.5
Luis Sinisterra 24 699 2 29 35 2098 24 2 1 11 47 17.0
Marcus Rashford 25 2271 5 48 64 4980 59 2 6 35 81 60.0
Michail Antonio 33 1695 6 29 19 2320 69 2 3 27 55 4.0
Mikel Oyarzabal 26 2156 7 10 10 1603 61 3 2 10 69 40.0
Mohammed Kudus 22 2484 8 124 40 6874 80 6 3 94 212 50.0
Moussa Diaby 24 2174 6 29 39 3926 33 8 6 45 62 55.0
Mykhailo Mudryk 22 1576 5 39 36 4183 54 2 5 78 50 30.0
Nico Williams 21 2263 5 86 62 6467 76 11 8 153 131 70.0
Noni Madueke 21 1053 4 37 38 3556 25 2 2 22 54 35.0
Ola Solbakken 24 23 0 1 0 76 0 0 0 1 1 2.5
Oscar Bobb 20 302 1 11 5 671 6 1 3 5 17 25.0
Pedro Neto 23 1516 2 37 42 4915 44 9 1 115 79 55.0
Phil Foden 23 2857 19 47 56 6921 62 8 15 89 127 150.0
Rafael Leão 24 2512 9 77 82 7403 66 9 7 108 78 75.0
Raheem Sterling 28 1978 8 45 65 5113 54 4 11 59 92 35.0
Randal Kolo Muani 24 153 1 4 2 336 3 0 0 0 3 40.0
Raphinha 26 1368 5 24 23 2884 41 9 6 82 74 60.0
Reiss Nelson 23 268 0 1 4 729 11 0 0 14 22 15.0
Serge Gnabry 28 432 3 6 12 1082 11 1 3 10 26 40.0
Simon Adingra 21 2222 6 50 63 5063 48 1 7 76 118 30.0
Son Heung-min 31 2934 15 39 64 5688 55 10 17 36 80 45.0
Takuma Asano 28 1986 6 16 28 2790 47 1 1 37 74 4.0
Timo Werner 27 1016 3 18 41 3147 14 3 2 32 34 17.0
Vinicius Júnior 23 1864 14 65 88 6384 71 5 10 56 44 200.0
Vitor Roque 18 328 2 4 6 573 11 0 0 2 8 30.0
Yoane Wissa 26 2493 12 20 20 2666 58 3 3 21 99 28.0
Youssoufa Moukoko 18 625 5 11 10 685 21 0 1 4 21 20.0

Penjelasan variabel yang digunakan :
1. Player : Nama pemain yang berposisi penyerang kiri
2. Age : Usia pemain
3. Min : Menit bermain di semua kompetisi yang dijalankan pada musim 2023/2024
4. G-PK : Jumlah gol tanpa penati
5. Succ_Takeon : Jumlah berhasilnya melewati pemain lawan
6. Carrier_ToPenaltyArea : Jumlah driblling berhasil hingga ke kotak penalti lawan
7. TotDist : Jumlah jarak driblling berhasil
8. Miss_Control : Jumlah pemain gagal dalam mengontrol bola
9. Ast : Jumlah assist
10. TB : Jumlah operan terobosan
11. Crs : Jumlah crossing
12.TklW : Jumlah pemain berhasil merebut bola dari lawan
13.Market : Harga pasar pemain dalam euro

2. TINJAUAN PUSTAKA

2.1 Statistika Deskriptif

Statistika deskriptif merupakan cabang ilmu statistika yang fokus pada pengumpulan, pengolahan, penyajian, dan peringkasan data untuk menggambarkan karakteristik dasar suatu kumpulan data. Menurut Sugiyono (2017), statistika deskriptif adalah statistik yang digunakan untuk menganalisis data dengan cara mendeskripsikan atau menggambarkan data yang telah terkumpul sebagaimana adanya tanpa bermaksud membuat kesimpulan yang berlaku untuk umum atau generalisasi.

2.2 Analisis Cluster

Analisis cluster adalah metode statistik yang digunakan untuk mengelompokkan objek ke dalam beberapa kelompok (cluster) berdasarkan karakteristik yang serupa di antara objek tersebut. Tujuan utama analisis cluster adalah untuk menciptakan kelompok yang memiliki kesamaan yang maksimal di dalam kelompok dan meminimalkan kesamaan antar kelompok yang berbeda. Menurut Sitepu, R., dkk (2011), analisis cluster termasuk dalam analisis statistic multivariate interdependen, oleh karena itu tujuan dari analisis cluster tidak untuk menghubungkan ataupun membedakan dengan variabel lain. Analisis cluster dapat dibagi menjadi dua jenis berdasarkan struktur cluster yang dihasilkan, yaitu :

2.2.1 Analisis Cluster Non-Hirarki

Analisis cluster non-hirarki melakukan proses clustering dengan langsung mengelompokkan semua observasi dalam dataset tanpa adanya tingkatan, sehingga proses pengelompokan terjadi dalam satu level atau tidak hirarki. Metode yang termasuk dalam jenis ini antara lain: a. K-Means
Mengelompokkan data berdasarkan centroid yang diperbarui iteratif. b. K-Medoids Mirip dengan K-Means tetapi menggunakan medoid (poin aktual dalam dataset) sebagai pusat cluster. c. DBSCAN (Density-based Spatial Clustering of Applications with Noise) Mengelompokkan data berdasarkan kepadatan, mampu menemukan cluster dengan bentuk arbitrer dan menangani noise.

2.2.2 Analisis Cluster Hirarki

Analisis cluster hirarki adalah metode analisis kelompok yang menggunakan proses clustering bertingkat. Metode ini dibagi menjadi dua pendekatan utama: a. Agglomeratif Clustering (Bottom-Up): Dimulai dengan setiap observasi sebagai cluster terpisah dan menggabungkannya secara bertahap berdasarkan kemiripan hingga semua observasi berada dalam satu cluster. b. Divisif Clustering (Top-Down): Dimulai dengan satu cluster yang mencakup semua observasi dan membagi cluster ini secara bertahap hingga setiap observasi berada dalam cluster terpisah atau sesuai dengan jumlah cluster yang diinginkan.

2.3 Allgoritma K-Means

K-Means adalah teknik pengelompokan non-hirarki yang digunakan dalam analisis data atau sebagai metode data mining yang berbasis unsupervised learning. Metode ini mengelompokkan data dengan menggunakan sistem partisi. Menurut Prasetyo, E. (2012), langkah-langkah melakukan clustering dengan metode K-Means adalah sebagai berikut:

  1. Menentukan k sebagai jumlah cluster yang ingin dibentuk

  2. Memasukan data ke dalam cluster secara acak

  3. Menentukan pusat cluster (centroid) dari data yang ada pada masing-masing cluster dengan persamaan :\(C_{kj}=\frac{X_{1j} +X_{2j}+...+X_{nj}}{{n}}\)

    \(C_{kj}\):Pusat cluster ke-k pada variabel ke j(J=1,2,..,p)

    \(n\):Banyak data cluster ke-k

  4. Menentukan jarak setiap objek dengan sertiap centorid menggunakan jarak Euclidean

    \[ d(X_i,X_g)=\sqrt{\sum_{j=1}^p(X_{ij}-X_{gj})^{2}} \]

  5. Menghitung fungsi objektif dengan formula :

    \[ J=\sum_{i=1}^n\sum_{j=1}^ka_{ij}d(X_i,C_{kj})^2 \]

  6. Mengalokasikan masing-masing data ke centoroid terdekat yang dirumuskan sebagai berikut :

    \[ a_{ij} = \begin{cases} 1, & \text{if } s = \min\{d(X_i, C_k)\} \\ 0, & \text{otherwise.} \end{cases} \]

  7. Mengulangi Kembali langkah 3-6 sampai tidak ada lagi perpindahan objek atau tidak ada perubahan pada fungsi

2.4 Silhouuette Index

Menurut penjelasan Paembonan & Abduh (2021), Metode validasi silhouette index adalah teknik yang digunakan untuk mengevaluasi kualitas pengelompokan(clustering) berdasarkan kriteria internal. Indeks ini mengukur seberapa baik setiap objek ditempatkan dalam clusternya dengan membandingkan jarak rata-rata objek tersebut dengan objek lain dalam cluster yang sama, serta jarak objek tersebut dengan objek dari cluster yang berbeda. Semakin besar nilai silhouette untuk sebuah objek, semakin tepat penempatan objek tersebut dalam clusternya. Koefisien silhouette dihitung sebagai ratarata dari nilai-nilai silhouette untuk setiap objek dalam data, yang dilambangkan dengan s(𝑖).

\[ SC=\frac{1}{n}\sum_{i=1}^{n} s(i) \] \[ SC=\frac{b(i)-a(i)}{max(a(i),b(i))} \]

3. Source Code

Syntax Fungsi
library(rmarkdown)
library(readxl)
library(tidyverse)
library(cluster)
library(factoextra)
Memuat package yang akan digunakan
dataPrak <- read_excel(“C:/Kuliah/Semester 5/Anmul/praktikum/LW_ACROSS_TOP5_EU_LEAGUE.xlsx”) Memuat data yang akan digunakan
dataclus<-dataPrak[,-(1:2)] Menghilangkan kolom yang tidak akan dianalisis
summary(dataclus) Menghasilkan ringkasan statistik
var(dataclus$var) Menghitung varians dari setiap variabel
datafix<-scale(dataclus) Menstandarisasi data agar disatuan yang sama
fviz_nbclust(datafix, kmeans, method = “silhouette”) Metode Silhouette
KM <- kmeans(datafix, 2, nstart = 74) print(KM) Menggunakan fungsi kmeans dan menyimpan pada variabel KM
fviz_cluster(KM, data = datafix) Visualiasi data cluster
dataclus %>% mutate(Cluster = KM$cluster) %>% group_by(Cluster) %>% summarise_all(“mean”) Menggambarkan karakteristitik amatan berdasarkan nilai tengah variabel

4. Hasil dan Pembahasan

4.1 Statistika Deskriptif

> summary(dataclus)
      Min            G-PK         Succ_Takeon     Carrier_ToPenaltyArea
 Min.   :  14   Min.   : 0.000   Min.   :  1.00   Min.   :  0.00       
 1st Qu.: 917   1st Qu.: 3.000   1st Qu.: 15.00   1st Qu.: 15.00       
 Median :1649   Median : 5.000   Median : 35.00   Median : 35.00       
 Mean   :1556   Mean   : 6.319   Mean   : 34.94   Mean   : 37.22       
 3rd Qu.:2197   3rd Qu.: 8.000   3rd Qu.: 47.00   3rd Qu.: 56.00       
 Max.   :3019   Max.   :21.000   Max.   :124.00   Max.   :154.00       
    TotDist      Miss_Control        Ast               TB        
 Min.   :  76   Min.   : 0.00   Min.   : 0.000   Min.   : 0.000  
 1st Qu.:1603   1st Qu.:22.00   1st Qu.: 1.000   1st Qu.: 2.000  
 Median :3926   Median :48.00   Median : 3.000   Median : 3.000  
 Mean   :3785   Mean   :42.93   Mean   : 3.638   Mean   : 4.362  
 3rd Qu.:5113   3rd Qu.:61.00   3rd Qu.: 6.000   3rd Qu.: 6.000  
 Max.   :9260   Max.   :85.00   Max.   :11.000   Max.   :17.000  
      Crs             Recov            Market      
 Min.   :  0.00   Min.   :  1.00   Min.   :  0.80  
 1st Qu.: 10.00   1st Qu.: 38.00   1st Qu.: 22.00  
 Median : 30.00   Median : 63.00   Median : 40.00  
 Mean   : 42.58   Mean   : 65.12   Mean   : 43.42  
 3rd Qu.: 74.00   3rd Qu.: 92.00   3rd Qu.: 55.00  
 Max.   :153.00   Max.   :212.00   Max.   :200.00  

Interpretasi :

  1. Min(Menit Bermain)
    Pada variabel menit bermain waktu terendah untuk pemain sayap kiri bermain dalam amatan hanya 14 menit yaitu Elye Wahi dan pemain sayap kiri dengan menit main terbanyak adalah Jarrod Bowen dengan 3019 menit , ini menandakan bahwa semakin tinggi menit bermain maka semakin dipercaya pemain tersebut untuk bermain dan pemain tersebut memiliki fisik yang bugar pada musim 2023/2024,
  2. G-Pk(Jumlah gol tanpa penalti)
    Pada variabel Jumlah gol tanpa penalti, jumlah terendah untuk pemain sayap kiri yang mencetak gol dalam amatan 0 gol yaitu Elye Wahi dan pemain sayap kiri dengan gol terbanyak adalah Kylian Mbappe dengan 21 gol, ini menandakan bahwa semakin banyak gol yang dicetak maka semakin tajam insting mencetak gol pemain tersebut pada musim 2023/2024.
  3. Succ_Takeon(Keberhasilan melewati lawan)
    Pada variabel Jumlah keberhasilan dalam melewati lawan, jumlah terendah untuk pemain sayap kiri yang dalam amatan 1 kali yaitu Elye Wahi dan pemain sayap kiri dengan melewati lawan terbanyak adalah Muhammad Kudus ini menandakan bahwa semakin banyak keberhasilan melewati lawan maka pemain tersebut memiliki kecepatan, kelincahan, dan teknik individu atau skill yang tinggi pada musim 2023/2024.
  4. Carrier_ToPenaltyArea(Menggring bola hingga kotak penalti lawan)
    Pada variabel jumlah menggiring bola hingga kotak penalti lawan , jumlah terendah untuk pemain sayap kiri yang dalam amatan 0 kali yaitu Ole Solbaken dan pemain sayap kiri dengan jumlah menggiring bola hingga kotak penalti lawan terbanyak adalah Jeremy Doku dengan ini menandakan bahwa semakin banyak jumlah menggiring bola hingga kotak penalti lawan maka semakin baik kemampuan dribilling pemain tersebut pada musim 2023/2024.
  5. TotDist(Totak Jarak Menggiring Bola dalam yard)
    Pada variabel jumlah menggiring bola hingga kotak penalti lawan , jarak terendah menggiring bola untuk pemain sayap kiri yang dalam amatan 76 yard yaitu Ole Solbaken dan pemain sayap kiri dengan jarak menggiring bola terjauh adalah Kvicha Kvaratshkeila dengan 9260 yard ini menandakan bahwa semakin jauh total jarak tempuhnya semakin sering pemain menguasai bola oleh pemain tersebut pada musim 2023/2024.
  6. Miss_Control(Gagal menguasai bola)
    Pada variabel miss control , kegagalan terendah dalam amatan adalah 0 yaitu Ole Solbakken dan kegagalan terbanyak 85 yaitu Jordan Ayew, ini menandakan bahwa semakin sedikit kegagalan pemain maka semakin baik pengendalain bola.
  7. Ast(Assist)
    Pada variabel assist , jumlah terendah dalam amatan adalah 0 yaitu ada 17 amatan dan jumlah terbanyak adalah 11 assist yaitu Nico William dan Leroy Sane
  8. TB(Umpan Terobosan)
    Pada variabel umpan terobosan, jumlah terendah adalah 0 yaitu 14 amatan dan jumlah umpan terobosan terbanyak adalah 17 Son Heung Min, semakin banyak umpan terobosan yang berhasil dilakukan semakin tinggi juga visi, passing dan playmaking pemain tersebut
  9. Crs(Umpan Lambung)
    Pada variabel umpan lambung, jumlah terendah adalah 0 yaitu 2 amatan dan jumlah umpan terobosan terbanyak adalah 153 yaitu Nico William semakin banyak umpan lambung yang berhasil dilakukan semakin tinggi juga visi, passing, dan playmaking pemain tersebut
  10. Recov(Mengambil Bola Kembali)
    Pada variabel mengambil bola kembali, jumlah terendah adalah 1 yaitu 2 amatan dan jumlah mengambil bola kembali adalah 212 yaitu Muhammed Kudus semakin banyak mengambil bola kembali yang berhasil dilakukan semakin tinggi juga etos bertahan pemain.
  11. Market(Harga Pasar Pemain)
    Pada variabel Harga pasar pemain, harga pemain terendah adalah 800 ribu euro yaitu Andrew Ayew dan harga tertinggi adalah Vinicius Junior, harga pemain yang makin mahal tentu akan menjadi pertingmbangan untuk direkrut

4.2 Silhouette Index

Berdasarkan gambar hasil plot silhouette score banyaknya cluster dari k=1 hingga k=10 adalah k=2. Hal ini dikarenakan k=2 memiliki nilai silhouette tertinggi.

4.3 K-mean clustering

> KM <- kmeans(datafix, 2, nstart = 74) 
> print(KM) 
K-means clustering with 2 clusters of sizes 40, 29

Cluster means:
         Min       G-PK Succ_Takeon Carrier_ToPenaltyArea    TotDist
1  0.6837184  0.5172994   0.5933011             0.5515400  0.6573594
2 -0.9430599 -0.7135164  -0.8183463            -0.7607449 -0.9067027
  Miss_Control        Ast         TB        Crs     Recov     Market
1    0.6641631  0.5446270  0.5334636  0.5426391  0.609862  0.3850056
2   -0.9160870 -0.7512096 -0.7358118 -0.7484677 -0.841189 -0.5310421

Clustering vector:
 [1] 1 1 1 2 2 2 2 1 1 1 1 1 2 1 1 2 2 1 2 2 1 2 1 1 1 2 2 1 1 1 1 1 2 1 2 1 2 1
[39] 1 1 1 2 2 1 2 2 1 1 1 1 2 2 2 1 1 1 1 2 1 2 2 1 1 2 2 1 2 1 2

Within cluster sum of squares by cluster:
[1] 319.68813  79.94979
 (between_SS / total_SS =  46.6 %)

Available components:

[1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
[6] "betweenss"    "size"         "iter"         "ifault"      
> cluster<-cbind.data.frame(dataPrak$Player,KM$cluster)
> cluster
         dataPrak$Player KM$cluster
1        Ademola Lookman          1
2     Alejandro Garnacho          1
3         Alexander Isak          1
4         Alexis Sánchez          2
5            Amad Diallo          2
6             André Ayew          2
7              Ansu Fati          2
8         Anthony Gordon          1
9            Ayoze Pérez          1
10       Bradley Barcola          1
11           Brahim Díaz          1
12          Bryan Mbeumo          1
13        Bryan Zaragoza          2
14    Callum Hudson-Odoi          1
15     Christian Pulisic          1
16    Christopher Nkunku          2
17            Diogo Jota          2
18         Donyell Malen          1
19             Elye Wahi          2
20     Facundo Pellistri          2
21       Federico Chiesa          1
22         Ferrán Torres          2
23         Gabriel Jesus          1
24    Gabriel Martinelli          1
25        Hwang Hee-chan          1
26         Jack Grealish          2
27          Jadon Sancho          2
28          Jarrod Bowen          1
29           Jeremy Doku          1
30            João Félix          1
31            João Pedro          1
32           Jordan Ayew          1
33          Julio Enciso          2
34          Kaoru Mitoma          1
35         Karim Adeyemi          2
36 Khvicha Kvaratskhelia          1
37        Kingsley Coman          2
38         Kylian Mbappé          1
39      Leandro Trossard          1
40            Leroy Sané          1
41             Luis Díaz          1
42    Luis Javier Suárez          2
43       Luis Sinisterra          2
44       Marcus Rashford          1
45       Michail Antonio          2
46       Mikel Oyarzabal          2
47        Mohammed Kudus          1
48          Moussa Diaby          1
49       Mykhailo Mudryk          1
50         Nico Williams          1
51          Noni Madueke          2
52         Ola Solbakken          2
53            Oscar Bobb          2
54            Pedro Neto          1
55            Phil Foden          1
56           Rafael Leão          1
57       Raheem Sterling          1
58     Randal Kolo Muani          2
59              Raphinha          1
60          Reiss Nelson          2
61          Serge Gnabry          2
62         Simon Adingra          1
63         Son Heung-min          1
64          Takuma Asano          2
65           Timo Werner          2
66       Vinicius Júnior          1
67           Vitor Roque          2
68           Yoane Wissa          1
69     Youssoufa Moukoko          2
Cluster Jumlah Anggota Anggota Cluster
1 40 Ademola Lookman, Alejandro Garnacho, Alexander Isak, Anthony Gordon, Ayoze Pérez, Bradley Barcola, Brahim Díaz, Bryan Mbeumo, Callum Hudson-Odoi, Christian Pulisic, Donyell Malen, Federico Chiesa, Gabriel Jesus, Gabriel Martinelli, Hwang Hee-chan, Jarrod Bowen, Jeremy Doku, João Félix, João Pedro, Jordan Ayew, Khvicha Kvaratskhelia, Kylian Mbappé, Leandro Trossard, Leroy Sané, Luis Díaz, Marcus Rashford, Mohammed Kudus, Mykhailo Mudryk, Nico Williams, Pedro Neto, Phil Foden, Rafael Leao, Raheem Sterling, Rapinha, Simon Adingra, Son Heung Min, Vinicius Junior, Yoane WIssa
2 29 Alexis Sánchez, Amad Diallo, André Ayew, Ansu Fati, Bryan Zaragoza, Christopher Nkunku, Diogo Jota. Elye Wahi. Facundo Pellistri, Ferrán Torres, Jack Grealish, Jadon Sancho, Julio Enciso, Kaoru Mitoma, Karim Adeyemi, Kingsley Coman, Luis Javier Suárez, Luis Sinisterra, Michail Antonio, Mikel Oyarzabal, Moussa Diaby, Noni Madueke, Ola Solbakken, Oscar Bobb, Randal Kolo Muani, Reiss Nelson, Serge Gnabry, Takuma Asano, Timo Werner, Victor Roque

4.3 Profilling CLuster

Profiling cluster adalah memberikan karakteristik yang mendeskripsikan isi pada setiap cluster yang berbeda dengan cluster lainnya. Karakteristik setiap cluster adalah sebagai berikut:

     Cluster       Min     G-PK Succ_Takeon Carrier_ToPenaltyArea TotDist
[1,]       1 2131.3500 8.775000    50.40000              52.92500 5350.45
[2,]       2  763.2759 2.931034    13.62069              15.55172 1626.00
     Miss_Control      Ast       TB      Crs    Recov   Market
[1,]     58.65000 5.375000 6.375000 63.25000 90.25000 57.10000
[2,]     21.24138 1.241379 1.586207 14.06897 30.44828 24.56207

Cluster 1
Kelompok Penyerang kiri dari amatan memiliki rata rata menit bermain yang lebih tinggi dari rata rata Penyerang kiri keseluruhan amatan, demikian pula dengan rata rata jumlah gol pada kelompok 1 lebih tinggi dari rata rata keseluruhan amatan. Pada aspek driblling para pemain yang berada di cluster 1 memiliki kemampuan diatas rata rata keseluruhan amatan, hal ini dapat dilihat dari variabel Succ_Takeon, Carrier To Penalty Area, TotDist, dan Miss_Control yang memiliki rata rata kelompok yang lebih besar dari rata rata keseluruhan. Pada cluster ini harga pemain juga berada diatas rata-rata keseluruhan, ini memiliki makna bahwa pemain sangat berharga bagi masing masing mengingat dengan beberapa aspek penunjang yang mereka miliki sangat unggul, selain itu harga yang tinggi bisa disebabkan para pemain dalam cluster sedang dalam masa prima atau memiliki potensial yang sangat besar sehingga bisa menjadi invertasi bagi Arsenal.

Cluster 2
Kelompok Penyerang kiri dari amatan memiliki rata rata menit bermain yang lebih rendah dari rata rata Penyerang kiri keseluruhan amatan, demikian pula dengan rata rata jumlah gol pada kelompok 2 lebih rendah dari rata rata keseluruhan amatan. Pada aspek driblling para pemain yang berada di cluster 2 memiliki kemampuan dibawah rata rata keseluruhan amatan, hal ini dapat dilihat dari variabel Succ_Takeon, Carrier To Penalty Area, TotDist, dan Miss_Control yang memiliki rata rata kelompok yang lebih rendah dari rata rata keseluruhan. Pada cluster ini harga pemain juga berada dibawahrata-rata keseluruhan, ini memiliki makna bahwa pemain ada kemungkinan hanya pemain yang tidak begitu special bagi klub dan dari beberapa aspek penunjang yang mereka miliki sangat rendah,selain itu harga yang rendah bisa disebabkan para pemain dalam cluster sudah tidak dalam kondisi prima ataupun kemungkinan lain pemain masih telalu muda dan kurang cocok bagi tim pengejar gelar seperti Arsenal.

5. Kesimpulan

5.1 Kesimpulan

Berdasarkan hasil pembahasan makan dapat disimpulkan :

  1. Hasil analisis cluster menggunakan algoritma K-Means berdasarkan variabel performa, teknik, dan financial dapat disimpulkan bahwa pemyerang kiri di lima liga top eropa dapat dibagi dua cluster yang bisa kita kategorikan penyerang kiri elite penyerang kiri standart. Untuk penyerang kiri elite penyerang kiri pada cluster 1, karena memiliki aspek performa dan teknik yang diatas rata yang berisikan : Ademola Lookman, Alejandro Garnacho, Alexander Isak, Anthony Gordon, Ayoze Pérez, Bradley Barcola, Brahim Díaz, Bryan Mbeumo, Callum Hudson-Odoi, Christian Pulisic, Donyell Malen, Federico Chiesa, Gabriel Jesus, Gabriel Martinelli, Hwang Hee-chan, Jarrod Bowen, Jeremy Doku, João Félix, João Pedro, Jordan Ayew, Khvicha Kvaratskhelia, Kylian Mbappé, Leandro Trossard, Leroy Sané, Luis Díaz, Marcus Rashford, Mohammed Kudus, Mykhailo Mudryk, Nico Williams, Pedro Neto, Phil Foden, Rafael Leao, Raheem Sterling, Rapinha, Simon Adingra, Son Heung Min, Vinicius Junior, Yoane WIssa.
  2. Cluster 1 atau cluster yang berisi pemain elite memiliki karakterisik yang mencolok namun serupa, yaitu mereka memiliki performa yang sangat baik di klubnya, hal ini dapat dilihat dari jumlah gol dan menit bermain yang mereka jalani. Selain itu aspek teknis mereka sebagai penyerang kiri seperti dalam 1v1 dengan pemain, keberanian untuk menusuk ke kotak penalti, total jarak driblling yang mereka miliki diatas rata-rata penyerang kiri lain, sehingga mereka adalah pemain yang sangat luar biasa dan bisa memnuhi kebutuhan Arsenal.

6. Daftar Pustaka

Nahdliyahm M. A., & other. (2019). METODE K-MEDOIDS CLUSTERING DENGAN VALIDASI SILHOUETTE INDEX DAN C-INDEX. Jurnal Gaussian, 8(2), 161-170.

Ribeiro, J. P., Silva, P. B., & Duarte, J. A. R. (2021). Machine learning application in soccer performance analysis: A systematic review. International Journal of Sports Science & Coaching, 16(3), 594-612.

Wahyuning, S. 2021. Dasar – Dasar Statistika. Semarang: Yayasan Prima Agus Teknik.

Walpole, R. E. 1988. Pengantar Statistika Edisi ke-3. (Alih bahasa: Ir. Bambang Sumantri). Jakarta: PT Gramedia Pustaka Utama

Wei, X., Wang, C., & Zhang, Z. (2019). Player role classification in soccer using machine learning approach. IEEE Access, 7, 99487-99495.