Musik merupakan salah satu bentuk hiburan yang sangat populer di era digital. Platform streaming seperti Spotify memungkinkan kita melihat jumlah pendengar setiap lagu secara harian. Dalam laporan ini akan dilakukan analisis statistik sederhana terhadap 10 lagu dari Hindia dengan jumlah pendengar harian tertinggi.
Tujuan analisis ini adalah untuk melihat distribusi jumlah pendengar harian,serta membandingkan popularitas beberapa lagu berdasarkan data yang tersedia.
Berikut adalah dataset yang digunakan dalam analisis.
data_lagu <- data.frame(
Judul_Lagu = c("Rumah Ke Rumah",
"Evaluasi",
"Secukupnya",
"Cincin",
"everything u are",
"Membasuh",
"Kita Ke Sana",
"semua lagu cinta terdengar sama",
"Evakuasi",
"Berdansalah, Karir Ini Tak Ada Artinya"),
Album = c("Menari Dengan Bayangan",
"Menari Dengan Bayangan",
"Menari Dengan Bayangan",
"Lagipula Hidup Akan Berakhir",
"Doves. 25 on Blank Canvas",
"Menari Dengan Bayangan",
"Lagipula Hidup Akan Berakhir",
"Doves. 25 on Blank Canvas",
"Menari Dengan Bayangan",
"Lagipula Hidup Akan Berakhir"),
Total_Pendengar = c(666777804,
525355066,
444154203,
423825034,
299379834,
209811984,
189186868,
130319648,
129027042,
127919836),
Total_Pendengar_Harian = c(559531,
319157,
279812,
597603,
1028334,
224851,
304194,
175022,
136482,
213606),
Durasi = c("4:37",
"3:14",
"3:25",
"4:26",
"3:56",
"6:13",
"4:42",
"3:58",
"3:44",
"3:08"),
Tahun_Rilis = c(2019,
2019,
2019,
2023,
2025,
2019,
2023,
2025,
2023,
2020)
)
kable(data_lagu, caption = "Dataset Lagu Hindia")
| Judul_Lagu | Album | Total_Pendengar | Total_Pendengar_Harian | Durasi | Tahun_Rilis |
|---|---|---|---|---|---|
| Rumah Ke Rumah | Menari Dengan Bayangan | 666777804 | 559531 | 4:37 | 2019 |
| Evaluasi | Menari Dengan Bayangan | 525355066 | 319157 | 3:14 | 2019 |
| Secukupnya | Menari Dengan Bayangan | 444154203 | 279812 | 3:25 | 2019 |
| Cincin | Lagipula Hidup Akan Berakhir | 423825034 | 597603 | 4:26 | 2023 |
| everything u are | Doves. 25 on Blank Canvas | 299379834 | 1028334 | 3:56 | 2025 |
| Membasuh | Menari Dengan Bayangan | 209811984 | 224851 | 6:13 | 2019 |
| Kita Ke Sana | Lagipula Hidup Akan Berakhir | 189186868 | 304194 | 4:42 | 2023 |
| semua lagu cinta terdengar sama | Doves. 25 on Blank Canvas | 130319648 | 175022 | 3:58 | 2025 |
| Evakuasi | Menari Dengan Bayangan | 129027042 | 136482 | 3:44 | 2023 |
| Berdansalah, Karir Ini Tak Ada Artinya | Lagipula Hidup Akan Berakhir | 127919836 | 213606 | 3:08 | 2020 |
Statistik deskriptif digunakan untuk memberikan gambaran umum mengenai data yang dianalisis.
pendengar <- data_lagu$Total_Pendengar_Harian
# fungsi modus
get_mode <- function(v){
uniqv <- unique(v)
uniqv[which.max(tabulate(match(v, uniqv)))]
}
stats_output <- data.frame(
Statistik = c("Mean","Median","Modus","Minimum","Maximum","Range","Varians","Standar Deviasi"),
Nilai = c(
mean(pendengar),
median(pendengar),
get_mode(pendengar),
min(pendengar),
max(pendengar),
diff(range(pendengar)),
var(pendengar),
sd(pendengar)
)
)
kable(stats_output, digits = 0, caption = "Statistik Deskriptif Pendengar Harian")
| Statistik | Nilai |
|---|---|
| Mean | 383859 |
| Median | 292003 |
| Modus | 559531 |
| Minimum | 136482 |
| Maximum | 1028334 |
| Range | 891852 |
| Varians | 74703523862 |
| Standar Deviasi | 273319 |
Pie chart digunakan untuk menunjukkan proporsi jumlah lagu berdasarkan kategori musik.
pie_data <- data_lagu %>%
count(Album) %>%
mutate(persen = n/sum(n)*100,
label = paste0(round(persen,1),"%"))
ggplot(pie_data, aes(x="", y=n, fill=Album)) +
geom_bar(stat="identity", width=1) +
coord_polar("y") +
geom_text(aes(label=label),
position=position_stack(vjust=0.5),
color="white",
size=5) +
theme_void() +
labs(title="Distribusi Lagu Berdasarkan Album")
Bar chart digunakan untuk membandingkan jumlah pendengar harian setiap lagu.
ggplot(data_lagu, aes(x=reorder(Judul_Lagu,-Total_Pendengar_Harian),
y=Total_Pendengar_Harian,
fill=Judul_Lagu)) +
geom_bar(stat="identity") +
theme_minimal() +
labs(title="Jumlah Pendengar Harian Lagu Hindia",
x="Judul Lagu",
y="Pendengar Harian") +
theme(axis.text.x = element_text(angle=45, hjust=1))
Histogram digunakan untuk melihat distribusi jumlah pendengar harian.
ggplot(data_lagu, aes(x=Total_Pendengar_Harian)) +
geom_histogram(bins=5, fill="skyblue", color="black") +
theme_minimal() +
labs(title="Histogram Pendengar Harian",
x="Pendengar Harian",
y="Frekuensi")
Density plot digunakan untuk melihat kepadatan distribusi data.
ggplot(data_lagu, aes(x=Total_Pendengar_Harian)) +
geom_density(fill="lightgreen", alpha=0.5) +
theme_minimal() +
labs(title="Density Plot Pendengar Harian",
x="Pendengar Harian",
y="Density")
Boxplot digunakan untuk melihat sebaran data dan kemungkinan adanya outlier.
ggplot(data_lagu, aes(x=Album, y=Total_Pendengar_Harian, fill=Album)) +
geom_boxplot(alpha=0.7) +
geom_jitter(width=0.2, size=3, alpha=0.7) +
theme_minimal() +
labs(title="Boxplot Pendengar Harian Berdasarkan Album",
x="Album",
y="Pendengar Harian") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Berdasarkan data yang diperoleh, lagu dengan jumlah pendengar harian tertinggi adalah everything u are dengan lebih dari satu juta pendengar per hari. Sementara itu lagu dengan jumlah pendengar harian terendah pada dataset ini adalah Evakuasi.
Distribusi pendengar menunjukkan bahwa beberapa lagu memiliki popularitas yang jauh lebih tinggi dibandingkan lagu lainnya. Hal ini dapat dipengaruhi oleh faktor seperti tren media sosial, promosi musik, serta preferensi pendengar.
Berdasarkan analisis statistik yang telah dilakukan, dapat disimpulkan bahwa terdapat variasi yang cukup besar dalam jumlah pendengar harian pada lagu-lagu Hindia. Lagu everything u are menjadi lagu dengan pendengar harian tertinggi dalam dataset ini.
Analisis sederhana ini menunjukkan bagaimana metode statistik dan visualisasi data dapat digunakan untuk memahami pola popularitas musik pada platform streaming digital.
cor(data_lagu$Total_Pendengar, data_lagu$Total_Pendengar_Harian)
## [1] 0.4073807