OPTIMALISASI POSISI PENYERANG KIRI ARSENAL MELALUI ANALISIS CLUSTER K-MEANS DATA MUSIM 2023/2024
1. PENDAHULUAN
1.1 Latar Belakang
Arsenal adalah salah satu tim di Liga Primer Inggris yang berasal dari London. Dari dua musim terakhir tim asuhan Mikel Arteta selalu menjadi tim penantang gelar berkat kesuburan trio lini depan. Pada musim 2022/2023 Arsenal hampir menjadi juara Liga Inggris setelah 19 tahun puasa gelar, namun inkonsistensi adalah penyebab utamanya. Hal tersebut juga kembali terjadi di musim 2023/2024 Arsenal hanya terpaut 2 point dari sang juara Manchester City. Namun yang menjadi permasalahan tetap sama yaitu konsistensi lini depan disaat - saat krusial. Tidak seperti musim 2022/2023 Gabriel Martinelli adalah salah satu pemain vital di sistem Mikel Arteta dengan menjadi salah satu pemain terbaik dengan Bukayo Saka, namun tidak seperti koleganya ia mengalami penurunan baik dari jumlah gol , asis, dan keberanian untuk memasuki pertahanan lawan sejak musim 2023/2024 bahkan hingga paruh musim 2024/2025. Hal ini tentu menjadi PR besar yang harus diselesaikan Sang pelatih untuk menjaga asa meraih gelar primer Inggis yang sudah 21 tahun tidak kembali ke The Gooners .
Analisis Cluster merupakan salah satu metode statistika yang dapat digunakan untuk melakukan proses pengelompokan objek-objek, sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama (Gabriella & Yonlib, 2020). Secara umum, analisis cluster dibagi dalam dua metode yaitu metode Non-hierarki dan metode Hierarki. Pada metode Non-hierarki banyaknya cluster ditentukan terlebih dahulu sedangkan metode cluster Hierarki harus melakukan analisis terlebih dahulu untuk menentukan banyaknya cluster. Menurut Dewi (2014) metode hierarki dibagi menjadi dua yaitu metode agglomerative (pemusatan) dan metode divisive.
Metode analisis cluster yang digunakan dalam kasus ini adalah analisis cluster hierarki yaitu terdiri dari Single Linkage Method, Complete Linkage Method, Average Linkage Method, Ward’s Method, dan Centroid Method. Salah satu masalah dalam analisis cluster adalah penentuan jumlah cluster optimal dalam cluster yang sudah di bentuk. Oleh karena itu, dalam melakukan analisis cluster perlu dilakukan uji validitas cluster untuk mendapatkan jumlah cluster yang optimal, maka digunakan indeks validitas silhouette berdasarkan jarak Euclidean (Nicolaus, Evy, dan Hendra, 2016). Analisis cluster dapat digunakan untuk mencari pemain penyerang kiri yang tepat bagi Arsenal dengan mengelompokan seluruh pemain penyerang kiri di lima liga terbaik di Eropa berdasarkan beberapa variabel seperti performa keseluruhan, aspek playmaking, aspek bertahan
1.2 Rumusan Masalah
- Kelompok mana yang paling sesuai dengan profil penyerang kiri yang dibutuhkan Arsenal berdasarkan analisis cluster?
- Faktor-faktor apa saja yang membedakan antara kelompok penyerang kiri yang berkinerja baik dan buruk di Arsenal?
1.3 Tujuan
- Memberikan rekomendasi mengenai profil penyerang kiri yang harus dicari untuk memperkuat lini depan.
- Mengelompokkan pemain penyerang kiri di lima liga top Eropa berdasarkan kinerja dan karakteristik mereka.
- Mengidentifikasi faktor-faktor yang membedakan antara kelompok penyerang kiri yang berkinerja baik dan buruk.
1.4 Data
Data yang digunakan adalah data sekunder sebanyak 69 pemain penyerang kiri dari lima liga top eropa yang bersumber dari fbref.com
| Player | Age | Min | G-PK | Succ_Takeon | Carrier_ToPenaltyArea | TotDist | Miss_Control | Ast | TB | Crs | Recov | Market |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Ademola Lookman | 25 | 1894 | 11 | 39 | 35 | 4257 | 66 | 7 | 6 | 69 | 89 | 40.0 |
| Alejandro Garnacho | 19 | 2565 | 7 | 48 | 102 | 8015 | 69 | 4 | 2 | 58 | 106 | 50.0 |
| Alexander Isak | 23 | 2255 | 16 | 42 | 38 | 3052 | 49 | 2 | 5 | 10 | 38 | 75.0 |
| Alexis Sánchez | 34 | 763 | 1 | 12 | 4 | 1426 | 22 | 5 | 5 | 31 | 28 | 2.5 |
| Amad Diallo | 21 | 390 | 1 | 11 | 4 | 1035 | 7 | 1 | 0 | 1 | 14 | 22.0 |
| André Ayew | 33 | 1104 | 5 | 16 | 5 | 1466 | 25 | 0 | 0 | 4 | 40 | 0.8 |
| Ansu Fati | 20 | 521 | 2 | 5 | 9 | 1025 | 15 | 0 | 1 | 3 | 22 | 15.0 |
| Anthony Gordon | 22 | 2890 | 10 | 54 | 59 | 7622 | 70 | 10 | 8 | 111 | 125 | 60.0 |
| Ayoze Pérez | 30 | 2294 | 9 | 50 | 41 | 4465 | 70 | 1 | 5 | 19 | 121 | 10.0 |
| Bradley Barcola | 20 | 1640 | 4 | 54 | 58 | 5215 | 52 | 7 | 4 | 18 | 63 | 65.0 |
| Brahim Díaz | 23 | 1545 | 8 | 55 | 32 | 4465 | 48 | 6 | 7 | 31 | 74 | 40.0 |
| Bryan Mbeumo | 23 | 1960 | 6 | 26 | 38 | 4326 | 67 | 6 | 15 | 92 | 93 | 40.0 |
| Bryan Zaragoza | 22 | 183 | 0 | 8 | 6 | 676 | 3 | 0 | 0 | 10 | 4 | 12.0 |
| Callum Hudson-Odoi | 22 | 1854 | 8 | 43 | 39 | 5044 | 34 | 1 | 3 | 74 | 98 | 22.0 |
| Christian Pulisic | 24 | 2602 | 12 | 47 | 46 | 7489 | 70 | 8 | 3 | 101 | 100 | 50.0 |
| Christopher Nkunku | 25 | 443 | 3 | 2 | 2 | 606 | 17 | 0 | 3 | 4 | 12 | 65.0 |
| Diogo Jota | 26 | 1145 | 10 | 15 | 23 | 2104 | 42 | 3 | 5 | 9 | 48 | 50.0 |
| Donyell Malen | 24 | 1781 | 13 | 42 | 45 | 3933 | 51 | 1 | 6 | 39 | 71 | 40.0 |
| Elye Wahi | 20 | 14 | 0 | 1 | 1 | 82 | 3 | 0 | 0 | 0 | 1 | 30.0 |
| Facundo Pellistri | 21 | 172 | 0 | 5 | 4 | 482 | 4 | 1 | 0 | 4 | 11 | 10.0 |
| Federico Chiesa | 25 | 2197 | 8 | 35 | 58 | 4746 | 54 | 2 | 6 | 117 | 62 | 30.0 |
| Ferrán Torres | 23 | 1211 | 7 | 10 | 15 | 1744 | 35 | 2 | 3 | 21 | 40 | 30.0 |
| Gabriel Jesus | 26 | 1478 | 4 | 35 | 25 | 2654 | 61 | 5 | 8 | 9 | 59 | 55.0 |
| Gabriel Martinelli | 22 | 2019 | 6 | 40 | 82 | 5863 | 54 | 4 | 3 | 109 | 95 | 60.0 |
| Hwang Hee-chan | 27 | 2119 | 11 | 36 | 24 | 2586 | 55 | 3 | 3 | 11 | 75 | 25.0 |
| Jack Grealish | 27 | 1009 | 3 | 18 | 50 | 4025 | 19 | 1 | 3 | 16 | 42 | 55.0 |
| Jadon Sancho | 23 | 1026 | 2 | 39 | 34 | 3480 | 21 | 2 | 3 | 30 | 50 | 30.0 |
| Jarrod Bowen | 26 | 3019 | 16 | 34 | 49 | 4859 | 79 | 6 | 5 | 75 | 118 | 50.0 |
| Jeremy Doku | 21 | 1706 | 4 | 96 | 154 | 8162 | 54 | 8 | 2 | 62 | 82 | 65.0 |
| João Félix | 23 | 1540 | 7 | 29 | 31 | 3648 | 43 | 3 | 8 | 17 | 68 | 30.0 |
| João Pedro | 21 | 2045 | 5 | 43 | 47 | 5003 | 83 | 3 | 6 | 29 | 65 | 50.0 |
| Jordan Ayew | 31 | 2543 | 4 | 52 | 20 | 5509 | 85 | 7 | 4 | 97 | 155 | 4.0 |
| Julio Enciso | 19 | 475 | 0 | 17 | 7 | 1299 | 15 | 2 | 2 | 8 | 13 | 22.0 |
| Kaoru Mitoma | 26 | 1486 | 3 | 39 | 62 | 4879 | 38 | 4 | 3 | 44 | 68 | 45.0 |
| Karim Adeyemi | 21 | 913 | 3 | 18 | 27 | 2413 | 29 | 1 | 0 | 25 | 60 | 35.0 |
| Khvicha Kvaratskhelia | 22 | 2737 | 11 | 101 | 81 | 9260 | 58 | 6 | 6 | 99 | 99 | 80.0 |
| Kingsley Coman | 27 | 1113 | 3 | 29 | 35 | 4124 | 26 | 3 | 1 | 60 | 50 | 40.0 |
| Kylian Mbappé | 24 | 2158 | 21 | 61 | 66 | 6749 | 56 | 7 | 12 | 23 | 47 | 180.0 |
| Leandro Trossard | 28 | 1649 | 12 | 25 | 27 | 3651 | 47 | 1 | 8 | 57 | 88 | 35.0 |
| Leroy Sané | 27 | 2137 | 8 | 93 | 44 | 7599 | 63 | 11 | 8 | 86 | 97 | 60.0 |
| Luis Díaz | 26 | 2629 | 8 | 67 | 70 | 7500 | 69 | 5 | 4 | 26 | 127 | 80.0 |
| Luis Javier Suárez | 25 | 917 | 5 | 12 | 15 | 1501 | 30 | 0 | 2 | 7 | 17 | 3.5 |
| Luis Sinisterra | 24 | 699 | 2 | 29 | 35 | 2098 | 24 | 2 | 1 | 11 | 47 | 17.0 |
| Marcus Rashford | 25 | 2271 | 5 | 48 | 64 | 4980 | 59 | 2 | 6 | 35 | 81 | 60.0 |
| Michail Antonio | 33 | 1695 | 6 | 29 | 19 | 2320 | 69 | 2 | 3 | 27 | 55 | 4.0 |
| Mikel Oyarzabal | 26 | 2156 | 7 | 10 | 10 | 1603 | 61 | 3 | 2 | 10 | 69 | 40.0 |
| Mohammed Kudus | 22 | 2484 | 8 | 124 | 40 | 6874 | 80 | 6 | 3 | 94 | 212 | 50.0 |
| Moussa Diaby | 24 | 2174 | 6 | 29 | 39 | 3926 | 33 | 8 | 6 | 45 | 62 | 55.0 |
| Mykhailo Mudryk | 22 | 1576 | 5 | 39 | 36 | 4183 | 54 | 2 | 5 | 78 | 50 | 30.0 |
| Nico Williams | 21 | 2263 | 5 | 86 | 62 | 6467 | 76 | 11 | 8 | 153 | 131 | 70.0 |
| Noni Madueke | 21 | 1053 | 4 | 37 | 38 | 3556 | 25 | 2 | 2 | 22 | 54 | 35.0 |
| Ola Solbakken | 24 | 23 | 0 | 1 | 0 | 76 | 0 | 0 | 0 | 1 | 1 | 2.5 |
| Oscar Bobb | 20 | 302 | 1 | 11 | 5 | 671 | 6 | 1 | 3 | 5 | 17 | 25.0 |
| Pedro Neto | 23 | 1516 | 2 | 37 | 42 | 4915 | 44 | 9 | 1 | 115 | 79 | 55.0 |
| Phil Foden | 23 | 2857 | 19 | 47 | 56 | 6921 | 62 | 8 | 15 | 89 | 127 | 150.0 |
| Rafael Leão | 24 | 2512 | 9 | 77 | 82 | 7403 | 66 | 9 | 7 | 108 | 78 | 75.0 |
| Raheem Sterling | 28 | 1978 | 8 | 45 | 65 | 5113 | 54 | 4 | 11 | 59 | 92 | 35.0 |
| Randal Kolo Muani | 24 | 153 | 1 | 4 | 2 | 336 | 3 | 0 | 0 | 0 | 3 | 40.0 |
| Raphinha | 26 | 1368 | 5 | 24 | 23 | 2884 | 41 | 9 | 6 | 82 | 74 | 60.0 |
| Reiss Nelson | 23 | 268 | 0 | 1 | 4 | 729 | 11 | 0 | 0 | 14 | 22 | 15.0 |
| Serge Gnabry | 28 | 432 | 3 | 6 | 12 | 1082 | 11 | 1 | 3 | 10 | 26 | 40.0 |
| Simon Adingra | 21 | 2222 | 6 | 50 | 63 | 5063 | 48 | 1 | 7 | 76 | 118 | 30.0 |
| Son Heung-min | 31 | 2934 | 15 | 39 | 64 | 5688 | 55 | 10 | 17 | 36 | 80 | 45.0 |
| Takuma Asano | 28 | 1986 | 6 | 16 | 28 | 2790 | 47 | 1 | 1 | 37 | 74 | 4.0 |
| Timo Werner | 27 | 1016 | 3 | 18 | 41 | 3147 | 14 | 3 | 2 | 32 | 34 | 17.0 |
| Vinicius Júnior | 23 | 1864 | 14 | 65 | 88 | 6384 | 71 | 5 | 10 | 56 | 44 | 200.0 |
| Vitor Roque | 18 | 328 | 2 | 4 | 6 | 573 | 11 | 0 | 0 | 2 | 8 | 30.0 |
| Yoane Wissa | 26 | 2493 | 12 | 20 | 20 | 2666 | 58 | 3 | 3 | 21 | 99 | 28.0 |
| Youssoufa Moukoko | 18 | 625 | 5 | 11 | 10 | 685 | 21 | 0 | 1 | 4 | 21 | 20.0 |
Penjelasan variabel yang digunakan :
1. Player : Nama pemain yang berposisi penyerang kiri
2. Age : Usia pemain
3. Min : Menit bermain di semua kompetisi yang dijalankan pada musim
2023/2024
4. G-PK : Jumlah gol tanpa penati
5. Succ_Takeon : Jumlah berhasilnya melewati pemain lawan
6. Carrier_ToPenaltyArea : Jumlah driblling berhasil hingga ke
kotak penalti lawan
7. TotDist : Jumlah jarak driblling berhasil
8. Miss_Control : Jumlah pemain gagal dalam mengontrol bola
9. Ast : Jumlah assist
10. TB : Jumlah operan terobosan
11. Crs : Jumlah crossing
12.TklW : Jumlah pemain berhasil merebut bola dari lawan
13.Market : Harga pasar pemain dalam euro
2. TINJAUAN PUSTAKA
2.1 Statistika Deskriptif
Statistika deskriptif merupakan cabang ilmu statistika yang fokus pada pengumpulan, pengolahan, penyajian, dan peringkasan data untuk menggambarkan karakteristik dasar suatu kumpulan data. Menurut Sugiyono (2017), statistika deskriptif adalah statistik yang digunakan untuk menganalisis data dengan cara mendeskripsikan atau menggambarkan data yang telah terkumpul sebagaimana adanya tanpa bermaksud membuat kesimpulan yang berlaku untuk umum atau generalisasi.
2.2 Analisis Cluster
Analisis cluster adalah metode statistik yang digunakan untuk mengelompokkan objek ke dalam beberapa kelompok (cluster) berdasarkan karakteristik yang serupa di antara objek tersebut. Tujuan utama analisis cluster adalah untuk menciptakan kelompok yang memiliki kesamaan yang maksimal di dalam kelompok dan meminimalkan kesamaan antar kelompok yang berbeda. Menurut Sitepu, R., dkk (2011), analisis cluster termasuk dalam analisis statistic multivariate interdependen, oleh karena itu tujuan dari analisis cluster tidak untuk menghubungkan ataupun membedakan dengan variabel lain. Analisis cluster dapat dibagi menjadi dua jenis berdasarkan struktur cluster yang dihasilkan, yaitu :
2.2.1 Analisis Cluster Non-Hirarki
Analisis cluster non-hirarki melakukan proses clustering dengan
langsung mengelompokkan semua observasi dalam dataset tanpa adanya
tingkatan, sehingga proses pengelompokan terjadi dalam satu level atau
tidak hirarki. Metode yang termasuk dalam jenis ini antara lain: a.
K-Means
Mengelompokkan data berdasarkan centroid yang diperbarui iteratif. b.
K-Medoids Mirip dengan K-Means tetapi menggunakan medoid (poin aktual
dalam dataset) sebagai pusat cluster. c. DBSCAN (Density-based Spatial
Clustering of Applications with Noise) Mengelompokkan data berdasarkan
kepadatan, mampu menemukan cluster dengan bentuk arbitrer dan menangani
noise.
2.2.2 Analisis Cluster Hirarki
Analisis cluster hirarki adalah metode analisis kelompok yang menggunakan proses clustering bertingkat. Metode ini dibagi menjadi dua pendekatan utama: a. Agglomeratif Clustering (Bottom-Up): Dimulai dengan setiap observasi sebagai cluster terpisah dan menggabungkannya secara bertahap berdasarkan kemiripan hingga semua observasi berada dalam satu cluster. b. Divisif Clustering (Top-Down): Dimulai dengan satu cluster yang mencakup semua observasi dan membagi cluster ini secara bertahap hingga setiap observasi berada dalam cluster terpisah atau sesuai dengan jumlah cluster yang diinginkan.
2.3 Allgoritma K-Means
K-Means adalah teknik pengelompokan non-hirarki yang digunakan dalam analisis data atau sebagai metode data mining yang berbasis unsupervised learning. Metode ini mengelompokkan data dengan menggunakan sistem partisi. Menurut Prasetyo, E. (2012), langkah-langkah melakukan clustering dengan metode K-Means adalah sebagai berikut:
Menentukan k sebagai jumlah cluster yang ingin dibentuk
Memasukan data ke dalam cluster secara acak
Menentukan pusat cluster (centroid) dari data yang ada pada masing-masing cluster dengan persamaan :\(C_{kj}=\frac{X_{1j} +X_{2j}+...+X_{nj}}{{n}}\)
\(C_{kj}\):Pusat cluster ke-k pada variabel ke j(J=1,2,..,p)
\(n\):Banyak data cluster ke-k
Menentukan jarak setiap objek dengan sertiap centorid menggunakan jarak Euclidean
\[ d(X_i,X_g)=\sqrt{\sum_{j=1}^p(X_{ij}-X_{gj})^{2}} \]
Menghitung fungsi objektif dengan formula :
\[ J=\sum_{i=1}^n\sum_{j=1}^ka_{ij}d(X_i,C_{kj})^2 \]
Mengalokasikan masing-masing data ke centoroid terdekat yang dirumuskan sebagai berikut :
\[ a_{ij} = \begin{cases} 1, & \text{if } s = \min\{d(X_i, C_k)\} \\ 0, & \text{otherwise.} \end{cases} \]
Mengulangi Kembali langkah 3-6 sampai tidak ada lagi perpindahan objek atau tidak ada perubahan pada fungsi
2.4 Silhouuette Index
Menurut penjelasan Paembonan & Abduh (2021), Metode validasi silhouette index adalah teknik yang digunakan untuk mengevaluasi kualitas pengelompokan(clustering) berdasarkan kriteria internal. Indeks ini mengukur seberapa baik setiap objek ditempatkan dalam clusternya dengan membandingkan jarak rata-rata objek tersebut dengan objek lain dalam cluster yang sama, serta jarak objek tersebut dengan objek dari cluster yang berbeda. Semakin besar nilai silhouette untuk sebuah objek, semakin tepat penempatan objek tersebut dalam clusternya. Koefisien silhouette dihitung sebagai ratarata dari nilai-nilai silhouette untuk setiap objek dalam data, yang dilambangkan dengan s(𝑖).
\[ SC=\frac{1}{n}\sum_{i=1}^{n} s(i) \] \[ SC=\frac{b(i)-a(i)}{max(a(i),b(i))} \]
3. Source Code
| Syntax | Fungsi |
|---|---|
| library(rmarkdown) library(readxl) library(tidyverse) library(cluster) library(factoextra) |
Memuat package yang akan digunakan |
| dataPrak <- read_excel(“C:/Kuliah/Semester 5/Anmul/praktikum/LW_ACROSS_TOP5_EU_LEAGUE.xlsx”) | Memuat data yang akan digunakan |
| dataclus<-dataPrak[,-(1:2)] | Menghilangkan kolom yang tidak akan dianalisis |
| summary(dataclus) | Menghasilkan ringkasan statistik |
| var(dataclus$var) | Menghitung varians dari setiap variabel |
| datafix<-scale(dataclus) | Menstandarisasi data agar disatuan yang sama |
| fviz_nbclust(datafix, kmeans, method = “silhouette”) | Metode Silhouette |
| KM <- kmeans(datafix, 2, nstart = 74) print(KM) | Menggunakan fungsi kmeans dan menyimpan pada variabel KM |
| fviz_cluster(KM, data = datafix) | Visualiasi data cluster |
| dataclus %>% mutate(Cluster = KM$cluster) %>% group_by(Cluster) %>% summarise_all(“mean”) | Menggambarkan karakteristitik amatan berdasarkan nilai tengah variabel |
4. Hasil dan Pembahasan
4.1 Statistika Deskriptif
> summary(dataclus)
Min G-PK Succ_Takeon Carrier_ToPenaltyArea
Min. : 14 Min. : 0.000 Min. : 1.00 Min. : 0.00
1st Qu.: 917 1st Qu.: 3.000 1st Qu.: 15.00 1st Qu.: 15.00
Median :1649 Median : 5.000 Median : 35.00 Median : 35.00
Mean :1556 Mean : 6.319 Mean : 34.94 Mean : 37.22
3rd Qu.:2197 3rd Qu.: 8.000 3rd Qu.: 47.00 3rd Qu.: 56.00
Max. :3019 Max. :21.000 Max. :124.00 Max. :154.00
TotDist Miss_Control Ast TB
Min. : 76 Min. : 0.00 Min. : 0.000 Min. : 0.000
1st Qu.:1603 1st Qu.:22.00 1st Qu.: 1.000 1st Qu.: 2.000
Median :3926 Median :48.00 Median : 3.000 Median : 3.000
Mean :3785 Mean :42.93 Mean : 3.638 Mean : 4.362
3rd Qu.:5113 3rd Qu.:61.00 3rd Qu.: 6.000 3rd Qu.: 6.000
Max. :9260 Max. :85.00 Max. :11.000 Max. :17.000
Crs Recov Market
Min. : 0.00 Min. : 1.00 Min. : 0.80
1st Qu.: 10.00 1st Qu.: 38.00 1st Qu.: 22.00
Median : 30.00 Median : 63.00 Median : 40.00
Mean : 42.58 Mean : 65.12 Mean : 43.42
3rd Qu.: 74.00 3rd Qu.: 92.00 3rd Qu.: 55.00
Max. :153.00 Max. :212.00 Max. :200.00 Interpretasi :
- Min(Menit Bermain)
Pada variabel menit bermain waktu terendah untuk pemain sayap kiri bermain dalam amatan hanya 14 menit yaitu Elye Wahi dan pemain sayap kiri dengan menit main terbanyak adalah Jarrod Bowen dengan 3019 menit , ini menandakan bahwa semakin tinggi menit bermain maka semakin dipercaya pemain tersebut untuk bermain dan pemain tersebut memiliki fisik yang bugar pada musim 2023/2024, - G-Pk(Jumlah gol tanpa penalti)
Pada variabel Jumlah gol tanpa penalti, jumlah terendah untuk pemain sayap kiri yang mencetak gol dalam amatan 0 gol yaitu Elye Wahi dan pemain sayap kiri dengan gol terbanyak adalah Kylian Mbappe dengan 21 gol, ini menandakan bahwa semakin banyak gol yang dicetak maka semakin tajam insting mencetak gol pemain tersebut pada musim 2023/2024. - Succ_Takeon(Keberhasilan melewati lawan)
Pada variabel Jumlah keberhasilan dalam melewati lawan, jumlah terendah untuk pemain sayap kiri yang dalam amatan 1 kali yaitu Elye Wahi dan pemain sayap kiri dengan melewati lawan terbanyak adalah Muhammad Kudus ini menandakan bahwa semakin banyak keberhasilan melewati lawan maka pemain tersebut memiliki kecepatan, kelincahan, dan teknik individu atau skill yang tinggi pada musim 2023/2024. - Carrier_ToPenaltyArea(Menggring bola hingga kotak penalti
lawan)
Pada variabel jumlah menggiring bola hingga kotak penalti lawan , jumlah terendah untuk pemain sayap kiri yang dalam amatan 0 kali yaitu Ole Solbaken dan pemain sayap kiri dengan jumlah menggiring bola hingga kotak penalti lawan terbanyak adalah Jeremy Doku dengan ini menandakan bahwa semakin banyak jumlah menggiring bola hingga kotak penalti lawan maka semakin baik kemampuan dribilling pemain tersebut pada musim 2023/2024. - TotDist(Totak Jarak Menggiring Bola dalam yard)
Pada variabel jumlah menggiring bola hingga kotak penalti lawan , jarak terendah menggiring bola untuk pemain sayap kiri yang dalam amatan 76 yard yaitu Ole Solbaken dan pemain sayap kiri dengan jarak menggiring bola terjauh adalah Kvicha Kvaratshkeila dengan 9260 yard ini menandakan bahwa semakin jauh total jarak tempuhnya semakin sering pemain menguasai bola oleh pemain tersebut pada musim 2023/2024. - Miss_Control(Gagal menguasai bola)
Pada variabel miss control , kegagalan terendah dalam amatan adalah 0 yaitu Ole Solbakken dan kegagalan terbanyak 85 yaitu Jordan Ayew, ini menandakan bahwa semakin sedikit kegagalan pemain maka semakin baik pengendalain bola. - Ast(Assist)
Pada variabel assist , jumlah terendah dalam amatan adalah 0 yaitu ada 17 amatan dan jumlah terbanyak adalah 11 assist yaitu Nico William dan Leroy Sane - TB(Umpan Terobosan)
Pada variabel umpan terobosan, jumlah terendah adalah 0 yaitu 14 amatan dan jumlah umpan terobosan terbanyak adalah 17 Son Heung Min, semakin banyak umpan terobosan yang berhasil dilakukan semakin tinggi juga visi, passing dan playmaking pemain tersebut - Crs(Umpan Lambung)
Pada variabel umpan lambung, jumlah terendah adalah 0 yaitu 2 amatan dan jumlah umpan terobosan terbanyak adalah 153 yaitu Nico William semakin banyak umpan lambung yang berhasil dilakukan semakin tinggi juga visi, passing, dan playmaking pemain tersebut - Recov(Mengambil Bola Kembali)
Pada variabel mengambil bola kembali, jumlah terendah adalah 1 yaitu 2 amatan dan jumlah mengambil bola kembali adalah 212 yaitu Muhammed Kudus semakin banyak mengambil bola kembali yang berhasil dilakukan semakin tinggi juga etos bertahan pemain. - Market(Harga Pasar Pemain)
Pada variabel Harga pasar pemain, harga pemain terendah adalah 800 ribu euro yaitu Andrew Ayew dan harga tertinggi adalah Vinicius Junior, harga pemain yang makin mahal tentu akan menjadi pertingmbangan untuk direkrut
4.2 Silhouette Index
Berdasarkan gambar hasil plot silhouette score banyaknya cluster dari k=1 hingga k=10 adalah k=2. Hal ini dikarenakan k=2 memiliki nilai silhouette tertinggi.
4.3 K-mean clustering
> KM <- kmeans(datafix, 2, nstart = 74)
> print(KM)
K-means clustering with 2 clusters of sizes 40, 29
Cluster means:
Min G-PK Succ_Takeon Carrier_ToPenaltyArea TotDist
1 0.6837184 0.5172994 0.5933011 0.5515400 0.6573594
2 -0.9430599 -0.7135164 -0.8183463 -0.7607449 -0.9067027
Miss_Control Ast TB Crs Recov Market
1 0.6641631 0.5446270 0.5334636 0.5426391 0.609862 0.3850056
2 -0.9160870 -0.7512096 -0.7358118 -0.7484677 -0.841189 -0.5310421
Clustering vector:
[1] 1 1 1 2 2 2 2 1 1 1 1 1 2 1 1 2 2 1 2 2 1 2 1 1 1 2 2 1 1 1 1 1 2 1 2 1 2 1
[39] 1 1 1 2 2 1 2 2 1 1 1 1 2 2 2 1 1 1 1 2 1 2 2 1 1 2 2 1 2 1 2
Within cluster sum of squares by cluster:
[1] 319.68813 79.94979
(between_SS / total_SS = 46.6 %)
Available components:
[1] "cluster" "centers" "totss" "withinss" "tot.withinss"
[6] "betweenss" "size" "iter" "ifault"
> cluster<-cbind.data.frame(dataPrak$Player,KM$cluster)
> cluster
dataPrak$Player KM$cluster
1 Ademola Lookman 1
2 Alejandro Garnacho 1
3 Alexander Isak 1
4 Alexis Sánchez 2
5 Amad Diallo 2
6 André Ayew 2
7 Ansu Fati 2
8 Anthony Gordon 1
9 Ayoze Pérez 1
10 Bradley Barcola 1
11 Brahim Díaz 1
12 Bryan Mbeumo 1
13 Bryan Zaragoza 2
14 Callum Hudson-Odoi 1
15 Christian Pulisic 1
16 Christopher Nkunku 2
17 Diogo Jota 2
18 Donyell Malen 1
19 Elye Wahi 2
20 Facundo Pellistri 2
21 Federico Chiesa 1
22 Ferrán Torres 2
23 Gabriel Jesus 1
24 Gabriel Martinelli 1
25 Hwang Hee-chan 1
26 Jack Grealish 2
27 Jadon Sancho 2
28 Jarrod Bowen 1
29 Jeremy Doku 1
30 João Félix 1
31 João Pedro 1
32 Jordan Ayew 1
33 Julio Enciso 2
34 Kaoru Mitoma 1
35 Karim Adeyemi 2
36 Khvicha Kvaratskhelia 1
37 Kingsley Coman 2
38 Kylian Mbappé 1
39 Leandro Trossard 1
40 Leroy Sané 1
41 Luis Díaz 1
42 Luis Javier Suárez 2
43 Luis Sinisterra 2
44 Marcus Rashford 1
45 Michail Antonio 2
46 Mikel Oyarzabal 2
47 Mohammed Kudus 1
48 Moussa Diaby 1
49 Mykhailo Mudryk 1
50 Nico Williams 1
51 Noni Madueke 2
52 Ola Solbakken 2
53 Oscar Bobb 2
54 Pedro Neto 1
55 Phil Foden 1
56 Rafael Leão 1
57 Raheem Sterling 1
58 Randal Kolo Muani 2
59 Raphinha 1
60 Reiss Nelson 2
61 Serge Gnabry 2
62 Simon Adingra 1
63 Son Heung-min 1
64 Takuma Asano 2
65 Timo Werner 2
66 Vinicius Júnior 1
67 Vitor Roque 2
68 Yoane Wissa 1
69 Youssoufa Moukoko 2| Cluster | Jumlah Anggota | Anggota Cluster |
| 1 | 40 | Ademola Lookman, Alejandro Garnacho, Alexander Isak, Anthony Gordon, Ayoze Pérez, Bradley Barcola, Brahim Díaz, Bryan Mbeumo, Callum Hudson-Odoi, Christian Pulisic, Donyell Malen, Federico Chiesa, Gabriel Jesus, Gabriel Martinelli, Hwang Hee-chan, Jarrod Bowen, Jeremy Doku, João Félix, João Pedro, Jordan Ayew, Khvicha Kvaratskhelia, Kylian Mbappé, Leandro Trossard, Leroy Sané, Luis Díaz, Marcus Rashford, Mohammed Kudus, Mykhailo Mudryk, Nico Williams, Pedro Neto, Phil Foden, Rafael Leao, Raheem Sterling, Rapinha, Simon Adingra, Son Heung Min, Vinicius Junior, Yoane WIssa |
| 2 | 29 | Alexis Sánchez, Amad Diallo, André Ayew, Ansu Fati, Bryan Zaragoza, Christopher Nkunku, Diogo Jota. Elye Wahi. Facundo Pellistri, Ferrán Torres, Jack Grealish, Jadon Sancho, Julio Enciso, Kaoru Mitoma, Karim Adeyemi, Kingsley Coman, Luis Javier Suárez, Luis Sinisterra, Michail Antonio, Mikel Oyarzabal, Moussa Diaby, Noni Madueke, Ola Solbakken, Oscar Bobb, Randal Kolo Muani, Reiss Nelson, Serge Gnabry, Takuma Asano, Timo Werner, Victor Roque |
4.3 Profilling CLuster
Profiling cluster adalah memberikan karakteristik yang mendeskripsikan isi pada setiap cluster yang berbeda dengan cluster lainnya. Karakteristik setiap cluster adalah sebagai berikut:
Cluster Min G-PK Succ_Takeon Carrier_ToPenaltyArea TotDist
[1,] 1 2131.3500 8.775000 50.40000 52.92500 5350.45
[2,] 2 763.2759 2.931034 13.62069 15.55172 1626.00
Miss_Control Ast TB Crs Recov Market
[1,] 58.65000 5.375000 6.375000 63.25000 90.25000 57.10000
[2,] 21.24138 1.241379 1.586207 14.06897 30.44828 24.56207
Cluster 1
Kelompok Penyerang kiri dari amatan memiliki rata rata menit
bermain yang lebih tinggi dari rata rata Penyerang kiri keseluruhan
amatan, demikian pula dengan rata rata jumlah gol pada kelompok 1 lebih
tinggi dari rata rata keseluruhan amatan. Pada aspek driblling
para pemain yang berada di cluster 1 memiliki kemampuan diatas
rata rata keseluruhan amatan, hal ini dapat dilihat dari variabel
Succ_Takeon, Carrier To Penalty Area, TotDist, dan Miss_Control yang
memiliki rata rata kelompok yang lebih besar dari rata rata keseluruhan.
Pada cluster ini harga pemain juga berada diatas rata-rata keseluruhan,
ini memiliki makna bahwa pemain sangat berharga bagi masing masing
mengingat dengan beberapa aspek penunjang yang mereka miliki sangat
unggul, selain itu harga yang tinggi bisa disebabkan para pemain dalam
cluster sedang dalam masa prima atau memiliki potensial yang
sangat besar sehingga bisa menjadi invertasi bagi Arsenal.
Cluster 2
Kelompok Penyerang kiri dari amatan memiliki rata rata menit
bermain yang lebih rendah dari rata rata Penyerang kiri keseluruhan
amatan, demikian pula dengan rata rata jumlah gol pada kelompok 2 lebih
rendah dari rata rata keseluruhan amatan. Pada aspek driblling
para pemain yang berada di cluster 2 memiliki kemampuan dibawah
rata rata keseluruhan amatan, hal ini dapat dilihat dari variabel
Succ_Takeon, Carrier To Penalty Area, TotDist, dan Miss_Control yang
memiliki rata rata kelompok yang lebih rendah dari rata rata
keseluruhan. Pada cluster ini harga pemain juga berada
dibawahrata-rata keseluruhan, ini memiliki makna bahwa pemain ada
kemungkinan hanya pemain yang tidak begitu special bagi klub
dan dari beberapa aspek penunjang yang mereka miliki sangat
rendah,selain itu harga yang rendah bisa disebabkan para pemain dalam
cluster sudah tidak dalam kondisi prima ataupun kemungkinan
lain pemain masih telalu muda dan kurang cocok bagi tim pengejar gelar
seperti Arsenal.
5. Kesimpulan
5.1 Kesimpulan
Berdasarkan hasil pembahasan makan dapat disimpulkan :
- Hasil analisis cluster menggunakan algoritma K-Means berdasarkan variabel performa, teknik, dan financial dapat disimpulkan bahwa pemyerang kiri di lima liga top eropa dapat dibagi dua cluster yang bisa kita kategorikan penyerang kiri elite penyerang kiri standart. Untuk penyerang kiri elite penyerang kiri pada cluster 1, karena memiliki aspek performa dan teknik yang diatas rata yang berisikan : Ademola Lookman, Alejandro Garnacho, Alexander Isak, Anthony Gordon, Ayoze Pérez, Bradley Barcola, Brahim Díaz, Bryan Mbeumo, Callum Hudson-Odoi, Christian Pulisic, Donyell Malen, Federico Chiesa, Gabriel Jesus, Gabriel Martinelli, Hwang Hee-chan, Jarrod Bowen, Jeremy Doku, João Félix, João Pedro, Jordan Ayew, Khvicha Kvaratskhelia, Kylian Mbappé, Leandro Trossard, Leroy Sané, Luis Díaz, Marcus Rashford, Mohammed Kudus, Mykhailo Mudryk, Nico Williams, Pedro Neto, Phil Foden, Rafael Leao, Raheem Sterling, Rapinha, Simon Adingra, Son Heung Min, Vinicius Junior, Yoane WIssa.
- Cluster 1 atau cluster yang berisi pemain elite memiliki karakterisik yang mencolok namun serupa, yaitu mereka memiliki performa yang sangat baik di klubnya, hal ini dapat dilihat dari jumlah gol dan menit bermain yang mereka jalani. Selain itu aspek teknis mereka sebagai penyerang kiri seperti dalam 1v1 dengan pemain, keberanian untuk menusuk ke kotak penalti, total jarak driblling yang mereka miliki diatas rata-rata penyerang kiri lain, sehingga mereka adalah pemain yang sangat luar biasa dan bisa memnuhi kebutuhan Arsenal.
6. Daftar Pustaka
Nahdliyahm M. A., & other. (2019). METODE K-MEDOIDS CLUSTERING DENGAN VALIDASI SILHOUETTE INDEX DAN C-INDEX. Jurnal Gaussian, 8(2), 161-170.
Ribeiro, J. P., Silva, P. B., & Duarte, J. A. R. (2021). Machine learning application in soccer performance analysis: A systematic review. International Journal of Sports Science & Coaching, 16(3), 594-612.
Wahyuning, S. 2021. Dasar – Dasar Statistika. Semarang: Yayasan Prima Agus Teknik.
Walpole, R. E. 1988. Pengantar Statistika Edisi ke-3. (Alih bahasa: Ir. Bambang Sumantri). Jakarta: PT Gramedia Pustaka Utama
Wei, X., Wang, C., & Zhang, Z. (2019). Player role classification in soccer using machine learning approach. IEEE Access, 7, 99487-99495.