Input Data

library(readxl)
options(scipen = 999)
kpop_data <- read_excel("C:/users/hype amd/OneDrive/Documents/coolyeah/SEMESTER 2/Probabilitas dan Statistika/Tugas/Kpop Group listeners on spotify late feb-march 2026.xlsx")
knitr::kable(kpop_data)
Group Agency Gender Listeners Debut Year
Blackpink YG Female 25700000 2016
BTS BIGHIT Male 25500000 2013
TWICE JYP Female 17100000 2015
Le sserafim Source Music Female 15100000 2022
Illit Belift Lab Female 14100000 2024
New Jeans Ador Female 13600000 2022
Stray Kids JYP Male 10800000 2018
Enhypen Belift Lab Male 9900000 2020
Aespa SM Female 9700000 2020
Cortis BIGHIT Male 7600000 2025

Data ini berisi informasi beberapa grup K-Pop yang meliputi nama grup, agensi, gender, jumlah pendengar Spotify (Listeners), dan tahun debut.

Grafik

# Pie Chart
gender_counts <-
  table(kpop_data$Gender)
percent_labels <- round(100 * gender_counts / sum(gender_counts), 1)
final_labels <-
  paste(names(gender_counts), "\n", percent_labels, "%", sep = "")
pie(gender_counts,
    main = "K-pop Group Gender Distribution",
    col = c("#ff9999", "#66b3ff"),
    labels = final_labels,
    cex = 1.2)

Berdasarkan sampel data, grup wanita (Female) mendominasi sebesar 60%, sementara grup pria (Male) sebesar 50%. Data tersebut menunjukkan bahwa jumlah girl group lebih banyak di bandingkan boy group.

# Bar Chart
par(mar=c(10, 9, 4, 2))
barplot(kpop_data$Listeners,
        names.arg = kpop_data$Group,
        las = 2,
        col = "#9b59b6",
        main = "Monthly Listeners (Million)",
        ylab = "")
mtext("Total Listeners", side = 2, line = 7)

Dalam Bar Chart yang menunjukkan pendengar bulanan Spotify masing-masing group, sehingga girl group Blackpink dan boy group BTS memiliki jumlah pendengar tertinggi yaitu sekitar 25 juta pendengar bulanan. Pola ini menunjukkan adanya konsentrasi popularitas yang sangat kuat pada grup “Global Tier”. Secara inferensia, nama besar grup merupakan faktor penentu utama jumlah pendengar, di mana grup yang sudah menembus pasar Barat akan memiliki jumlah pendengar berkali-kali lipat dibanding grup lokal Korea.

# Histogram
hist(kpop_data$`Debut Year`,
     breaks = 5,
     col = "#fdfd96",
     main = "Year of Debut",
     xlab = "Debut Year",
     ylab = "Frequency")

Histogram Debut Year yang menunjukkan distribusi tahun debut masing-masing group sesuai dengan tahun mereka debut dan jumlah group yang debut di rentang tahun 2015-2022. Frekuensi tertinggi berada pada rentang tahun debut setelah 2020, yang menunjukkan bahwa banyak grup pendatang baru yang langsung mendapatkan popularitas tinggi.

# Density Plot
plot(density(kpop_data$Listeners),
     main = "Monthly Listeners Density",
     col = "#2980b9",
     lwd = 3)
polygon(density(kpop_data$Listeners),
        col = "#3498db77",
        border = "#2980b9")
abline(v = mean(kpop_data$Listeners),
       col = "red", lty = 2, lwd = 2)
legend("topright", legend = "Mean", col = "red", lty = 2, bty = "n")

Density Plot yang menunjukkan kepadatan jumlah pendengar Spotify pada kisaran 10 juta hingga 16 juta pendengar yang dimana garis merah merupakan rata-rata jumlah pendengar sekitar 14,9 juta. Bentuk kurva yang melandai ke kanan menunjukkan bahwa hanya beberapa grup yang mampu mencapai angka pendengar sangat tinggi, sementara mayoritas grup berada di angka menengah.

# Box Plot
par(mar=c(10, 9, 4, 2))
boxplot(Listeners ~ Agency,
        data = kpop_data,
        main = "Distribution By Agency",
        col = c("pink", "skyblue", "#fdfd96", "#9b59b6"),
        xlab = "",
        ylab = "",
        las = 2,
        cex.axis = 0.8)

Berdasarkan hasil grafik, menunjukkan bahwa dominan pendengar terbanyak sesuai dengan popularitas boy group atau girl group. Data dari beberapa agensi besar yang menonjol menunjukkan bahwa besarnya dukungan manajemen merupakan variabel prediktor yang signifikan dalam menentukan pencapaian jumlah pendengar.

Ukuran Pemusatan dan Penyebaran

# Mean
mean(kpop_data$Listeners)
## [1] 14910000
# Median
median(kpop_data$Listeners)
## [1] 13850000
# Fungsi Modus
Mode <- function(x){
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}

Mode(kpop_data$Listeners)
## [1] 25700000
# Varians
var(kpop_data$Listeners)
## [1] 39816555555556
# Standar Deviasi
sd(kpop_data$Listeners)
## [1] 6310036
# Range
range(kpop_data$Listeners)
## [1]  7600000 25700000
# Kuartil
quantile(kpop_data$Listeners)
##       0%      25%      50%      75%     100% 
##  7600000 10125000 13850000 16600000 25700000

Nilai mean (rata-rata) jumlah pendengar adalah 14.910.000 juta pendengar bulanan di Spotify. Nilai median sebesar 13.850.000 menunjukkan bahwa setengah dari grup memiliki jumlah pendengar di bawah nilai tersebut dan setengah lainnya berada di atas nilai tersebut.