Pendahuluan

Musik merupakan salah satu bentuk hiburan yang sangat populer di era digital. Platform streaming seperti Spotify memungkinkan kita melihat jumlah pendengar setiap lagu secara harian. Dalam laporan ini akan dilakukan analisis statistik sederhana terhadap 10 lagu dari Hindia dengan jumlah pendengar harian tertinggi.

Tujuan analisis ini adalah untuk melihat distribusi jumlah pendengar harian,serta membandingkan popularitas beberapa lagu berdasarkan data yang tersedia.

Penyajian Data

Berikut adalah dataset yang digunakan dalam analisis.

data_lagu <- data.frame(
  Judul_Lagu = c("Rumah Ke Rumah",
                 "Evaluasi",
                 "Secukupnya",
                 "Cincin",
                 "everything u are",
                 "Membasuh",
                 "Kita Ke Sana",
                 "semua lagu cinta terdengar sama",
                 "Evakuasi",
                 "Berdansalah, Karir Ini Tak Ada Artinya"),
  
  Album = c("Menari Dengan Bayangan",
            "Menari Dengan Bayangan",
            "Menari Dengan Bayangan",
            "Lagipula Hidup Akan Berakhir",
            "Doves. 25 on Blank Canvas",
            "Menari Dengan Bayangan",
            "Lagipula Hidup Akan Berakhir",
            "Doves. 25 on Blank Canvas",
            "Menari Dengan Bayangan",
            "Lagipula Hidup Akan Berakhir"),
  
  Total_Pendengar = c(666777804,
                      525355066,
                      444154203,
                      423825034,
                      299379834,
                      209811984,
                      189186868,
                      130319648,
                      129027042,
                      127919836),
  
  Total_Pendengar_Harian = c(559531,
                             319157,
                             279812,
                             597603,
                             1028334,
                             224851,
                             304194,
                             175022,
                             136482,
                             213606),
  
  Durasi = c("4:37",
             "3:14",
             "3:25",
             "4:26",
             "3:56",
             "6:13",
             "4:42",
             "3:58",
             "3:44",
             "3:08"),
  
  Tahun_Rilis = c(2019,
                  2019,
                  2019,
                  2023,
                  2025,
                  2019,
                  2023,
                  2025,
                  2023,
                  2020)
)

kable(data_lagu, caption = "Dataset Lagu Hindia")
Dataset Lagu Hindia
Judul_Lagu Album Total_Pendengar Total_Pendengar_Harian Durasi Tahun_Rilis
Rumah Ke Rumah Menari Dengan Bayangan 666777804 559531 4:37 2019
Evaluasi Menari Dengan Bayangan 525355066 319157 3:14 2019
Secukupnya Menari Dengan Bayangan 444154203 279812 3:25 2019
Cincin Lagipula Hidup Akan Berakhir 423825034 597603 4:26 2023
everything u are Doves. 25 on Blank Canvas 299379834 1028334 3:56 2025
Membasuh Menari Dengan Bayangan 209811984 224851 6:13 2019
Kita Ke Sana Lagipula Hidup Akan Berakhir 189186868 304194 4:42 2023
semua lagu cinta terdengar sama Doves. 25 on Blank Canvas 130319648 175022 3:58 2025
Evakuasi Menari Dengan Bayangan 129027042 136482 3:44 2023
Berdansalah, Karir Ini Tak Ada Artinya Lagipula Hidup Akan Berakhir 127919836 213606 3:08 2020

Statistik Deskriptif

Statistik deskriptif digunakan untuk memberikan gambaran umum mengenai data yang dianalisis.

pendengar <- data_lagu$Total_Pendengar_Harian

# fungsi modus
get_mode <- function(v){
  uniqv <- unique(v)
  uniqv[which.max(tabulate(match(v, uniqv)))]
}

stats_output <- data.frame(
  Statistik = c("Mean","Median","Modus","Minimum","Maximum","Range","Varians","Standar Deviasi"),
  Nilai = c(
    mean(pendengar),
    median(pendengar),
    get_mode(pendengar),
    min(pendengar),
    max(pendengar),
    diff(range(pendengar)),
    var(pendengar),
    sd(pendengar)
  )
)

kable(stats_output, digits = 0, caption = "Statistik Deskriptif Pendengar Harian")
Statistik Deskriptif Pendengar Harian
Statistik Nilai
Mean 383859
Median 292003
Modus 559531
Minimum 136482
Maximum 1028334
Range 891852
Varians 74703523862
Standar Deviasi 273319

Visualisasi Data

A. Pie Chart

Pie chart digunakan untuk menunjukkan proporsi jumlah lagu berdasarkan kategori musik.

pie_data <- data_lagu %>%
  count(Album) %>%
  mutate(persen = n/sum(n)*100,
         label = paste0(round(persen,1),"%"))

ggplot(pie_data, aes(x="", y=n, fill=Album)) +
  geom_bar(stat="identity", width=1) +
  coord_polar("y") +
  geom_text(aes(label=label),
            position=position_stack(vjust=0.5),
            color="white",
            size=5) +
  theme_void() +
  labs(title="Distribusi Lagu Berdasarkan Album")

B. Bar Chart

Bar chart digunakan untuk membandingkan jumlah pendengar harian setiap lagu.

ggplot(data_lagu, aes(x=reorder(Judul_Lagu,-Total_Pendengar_Harian), 
                      y=Total_Pendengar_Harian,
                      fill=Judul_Lagu)) +
  geom_bar(stat="identity") +
  theme_minimal() +
  labs(title="Jumlah Pendengar Harian Lagu Hindia",
       x="Judul Lagu",
       y="Pendengar Harian") +
  theme(axis.text.x = element_text(angle=45, hjust=1))

C. Histogram

Histogram digunakan untuk melihat distribusi jumlah pendengar harian.

ggplot(data_lagu, aes(x=Total_Pendengar_Harian)) +
  geom_histogram(bins=5, fill="skyblue", color="black") +
  theme_minimal() +
  labs(title="Histogram Pendengar Harian",
       x="Pendengar Harian",
       y="Frekuensi")

D. Density Plot

Density plot digunakan untuk melihat kepadatan distribusi data.

ggplot(data_lagu, aes(x=Total_Pendengar_Harian)) +
  geom_density(fill="lightgreen", alpha=0.5) +
  theme_minimal() +
  labs(title="Density Plot Pendengar Harian",
       x="Pendengar Harian",
       y="Density")

E. Boxplot

Boxplot digunakan untuk melihat sebaran data dan kemungkinan adanya outlier.

ggplot(data_lagu, aes(x=Album, y=Total_Pendengar_Harian, fill=Album)) +
  geom_boxplot(alpha=0.7) +
  geom_jitter(width=0.2, size=3, alpha=0.7) +
  theme_minimal() +
  labs(title="Boxplot Pendengar Harian Berdasarkan Album",
       x="Album",
       y="Pendengar Harian") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Analisis

Berdasarkan data yang diperoleh, lagu dengan jumlah pendengar harian tertinggi adalah everything u are dengan lebih dari satu juta pendengar per hari. Sementara itu lagu dengan jumlah pendengar harian terendah pada dataset ini adalah Evakuasi.

Distribusi pendengar menunjukkan bahwa beberapa lagu memiliki popularitas yang jauh lebih tinggi dibandingkan lagu lainnya. Hal ini dapat dipengaruhi oleh faktor seperti tren media sosial, promosi musik, serta preferensi pendengar.

Kesimpulan

Berdasarkan analisis statistik yang telah dilakukan, dapat disimpulkan bahwa terdapat variasi yang cukup besar dalam jumlah pendengar harian pada lagu-lagu Hindia. Lagu everything u are menjadi lagu dengan pendengar harian tertinggi dalam dataset ini.

Analisis sederhana ini menunjukkan bagaimana metode statistik dan visualisasi data dapat digunakan untuk memahami pola popularitas musik pada platform streaming digital.

cor(data_lagu$Total_Pendengar, data_lagu$Total_Pendengar_Harian)
## [1] 0.4073807