Input Data

library(readxl)

data_kpop <- read_excel("~/Downloads/Kpop Group listeners on spotify late feb-march 2026.xlsx")

head(data_kpop, n=20)
## # A tibble: 10 × 5
##    Group       Agency       Gender Listeners `Debut Year`
##    <chr>       <chr>        <chr>      <dbl>        <dbl>
##  1 Blackpink   YG           Female  25700000         2016
##  2 BTS         BIGHIT       Male    25500000         2013
##  3 TWICE       JYP          Female  17100000         2015
##  4 Le sserafim Source Music Female  15100000         2022
##  5 Illit       Belift Lab   Female  14100000         2024
##  6 New Jeans   Ador         Female  13600000         2022
##  7 Stray Kids  JYP          Male    10800000         2018
##  8 Enhypen     Belift Lab   Male     9900000         2020
##  9 Aespa       SM           Female   9700000         2020
## 10 Cortis      BIGHIT       Male     7600000         2025

Data ini berisi informasi beberapa grup K-Pop yang meliputi nama grup, agensi, gender, jumlah pendengar Spotify (Listeners), dan tahun debut.


options(scipen = 999)
gender_counts <-
  table(data_kpop$Gender)
percent_labels <- round(100 * gender_counts / sum(gender_counts), 1)
final_labels <-
  paste(names(gender_counts), "\n", percent_labels, "%", sep = "")
pie(gender_counts,
    main = "Pie Chart K-pop Group Gender Distribution",
    col = c("#ff9999", "#66b3ff"),
    labels = final_labels,
    cex = 1.2)

Berdasarkan sampel data, grup wanita (Female) mendominasi sebesar 60%, sementara grup pria (Male) sebesar 50%. Data tersebut menunjukkan bahwa jumlah girl group lebih banyak di bandingkan boy group.

options(scipen = 999)
par(mar=c(7, 7, 4, 4))
barplot(data_kpop$Listeners,
        names.arg = data_kpop$Group,
        las = 2,
        col = "#9b59b6",
        main = "Monthly Listeners (Million)",
        ylab = "")
        
mtext("Million Listeners", side = 2, line = 5)

Dalam Bar Chart yang menunjukkan pendengar bulanan Spotify masing-masing group, sehingga girl group Blackpink dan boy group BTS memiliki jumlah pendengar tertinggi yaitu sekitar 25 juta pendengar bulanan. Pola ini menunjukkan adanya konsentrasi popularitas yang sangat kuat pada grup “Global Tier”. Secara inferensia, nama besar grup merupakan faktor penentu utama jumlah pendengar, di mana grup yang sudah menembus pasar Barat akan memiliki jumlah pendengar berkali-kali lipat dibanding grup lokal Korea.

options(scipen = 999)
hist(data_kpop$`Debut Year`,
     breaks = 5,
     col = "#fdfd96",
     main = "Year of Debut",
     xlab = "Debut Year",
     ylab = "Frequency")

Histogram Debut Year yang menunjukkan distribusi tahun debut masing-masing group sesuai dengan tahun mereka debut dan jumlah group yang debut di rentang tahun 2015-2022. Frekuensi tertinggi berada pada rentang tahun debut setelah 2020, yang menunjukkan bahwa banyak grup pendatang baru yang langsung mendapatkan popularitas tinggi.

options(scipen = 999)
plot(density(data_kpop$Listeners),
     main = "Density Plot Monthly Listeners Density",
     col = "#2980b9",
     lwd = 3)
polygon(density(data_kpop$Listeners),
        col = "#3498db77",
        border = "#2980b9")
      
abline(v = mean(data_kpop$Listeners),
       col = "red", lty = 2, lwd = 2)
legend("topright", legend = "Mean", col = "red", lty = 2, bty = "n")

Density Plot yang menunjukkan kepadatan jumlah pendengar Spotify pada kisaran 10 juta hingga 16 juta pendengar yang dimana garis merah merupakan rata-rata jumlah pendengar sekitar 14,9 juta. Bentuk kurva yang melandai ke kanan menunjukkan bahwa hanya beberapa grup yang mampu mencapai angka pendengar sangat tinggi, sementara mayoritas grup berada di angka menengah.

options(scipen = 999)
par(mar=c(7, 6, 4, 2))
boxplot(Listeners ~ Agency,
        data = data_kpop,
        main = "Boxplot Distribution By Agency",
        col = c("pink", "skyblue", "#fdfd96", "#9b59b6"),
        xlab = "Agency",
        ylab = "",
        las = 2)

mtext("Listeners (Million)", side = 2, line = 5)

Berdasarkan hasil grafik, menunjukkan bahwa dominan pendengar terbanyak sesuai dengan popularitas boy group atau girl group. Data dari beberapa agensi besar yang menonjol menunjukkan bahwa besarnya dukungan manajemen merupakan variabel prediktor yang signifikan dalam menentukan pencapaian jumlah pendengar.

Ukuran Pemusatan dan Penyebaran

options(scipen = 999)
# Mean
mean(data_kpop$Listeners)
## [1] 14910000
# Median
median(data_kpop$Listeners)
## [1] 13850000
# Fungsi Modus
Mode <- function(x){
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}

Mode(data_kpop$Listeners)
## [1] 25700000
# Varians
var(data_kpop$Listeners)
## [1] 39816555555556
# Standar Deviasi
sd(data_kpop$Listeners)
## [1] 6310036
# Range
range(data_kpop$Listeners)
## [1]  7600000 25700000
# Kuartil
quantile(data_kpop$Listeners)
##       0%      25%      50%      75%     100% 
##  7600000 10125000 13850000 16600000 25700000

Nilai mean (rata-rata) jumlah pendengar adalah 14.910.000 juta pendengar bulanan di Spotify. Nilai median sebesar 13.850.000 menunjukkan bahwa setengah dari grup memiliki jumlah pendengar di bawah nilai tersebut dan setengah lainnya berada di atas nilai tersebut. ```