Fenomena Hallyu atau Korean Wave saat ini cukup banyak diminati oleh masyarakat Indonesia. Salah satunya adalah idol K-pop. Hingga saat ini, idol K-pop telah memasuki generasi ke-4. Generasi ke-4 inilah yang akan kita analisis pada proyek ini. Dari proyek ini, kita akan mengetahui:

  1. Grup K-Pop generasi ke-4 manakah yang memiliki total penjualan terbesar?
  2. Bagaimana trend penjualan untuk masing masing grup K-Pop generasi ke-4?
  3. Album Grup K-Pop generasi ke-4 manakah yang memiliki total penjualan terbesar?
  4. Grup K-Pop generasi ke-4 manakah yang memiliki total penjualan terbesar di masing-masing negara tujuan penjualan?

Berikut merupakan library yang akan digunakan.

library(lubridate)
library(tidyverse)
library(ggplot2)
library(glue)
library(plotly)
library(scales)

Dataset ini diambil dari website Kaggle. Berikut ini merupakan deskripsi untuk masing-masing kolomnya:

  • Artist: Artis

  • title: Nama Album

  • date: tanggal Update (13 Maret 2017 sampai 24 Maret 2021)

  • country: Negara penjualan album

  • sales: total penjualan

  • peak_chat: ranking chart

kpop <- read.csv("Kpop 4th gen Sales - Sheet1.csv")
head(kpop)

Data Cleaning

Pertama-tama, kita akan mengubah tipe data dari masing-masing kolom yang masih belum memiliki tipe data yang sesuai.

kpop$date <- mdy(kpop$date)
kpop$sales <- str_remove(kpop$sales, "[,]")
kpop$sales <- as.numeric(kpop$sales)
kpop$Artist <- as.factor(kpop$Artist)
kpop$country <- as.factor(kpop$country)
kpop$peak_chart <- as.factor(kpop$peak_chart)
str(kpop)
## 'data.frame':    97 obs. of  6 variables:
##  $ Artist    : Factor w/ 11 levels "(G)I-dle","Ateez",..: 6 6 6 6 6 6 6 6 6 6 ...
##  $ title     : chr  "Bloom*iz" "Bloom*iz" "TWELVE" "Color*Iz" ...
##  $ date      : Date, format: "2020-02-17" "2020-02-17" ...
##  $ country   : Factor w/ 3 levels "CHN","JPN","KOR": 3 2 2 3 2 3 2 3 2 3 ...
##  $ sales     : num  492504 23960 135113 282816 48734 ...
##  $ peak_chart: Factor w/ 25 levels "0","1","2","3",..: 3 4 2 3 2 2 5 3 9 2 ...

Data Visualization

Which group has the biggest sales?

# Data Wrangling
big_sales <- aggregate(sales~Artist,data=kpop, FUN=mean)
big_sales <- big_sales[order(big_sales$sales,decreasing = T),]
# Data Visualization
ggplot(data=big_sales, mapping = aes(x=sales,y=reorder(Artist, sales)))+
  geom_col(aes(fill=sales))+
  scale_fill_gradient(low="orange",high = "navy")+
  labs(title = "K-Pop Idol 4th Generation Ranking",
       subtitle =  "based on Sales",
       y=NULL)

Dapat kita lihat dari hasil data di atas bahwa girlgroup IZONE memiliki total penjualan tertinggi.

Which group has an increase in their sales?

# Visualization
ggplot(data=kpop, mapping= aes(x = date, y = sales/1000, col=Artist))+
  geom_point()+
  geom_line()+
  labs(title = "Sales Trend for Each Group",
       y="Sales (Thousand Copies)",
       x="period")+
  facet_wrap(~Artist)+
  theme(legend.position = "none",
        plot.title = element_text(hjust=0.5))

Berdasarkan visualisasi data di atas, dapat kita lihat bahwa terdapat beberapa grup yang mengalami kenaikan ataupun yang tidak mengalami kenaikan atau penurunan apapun. Grup yang cenderung mengalami peningkatan terhadap total penjualan yaitu (G)I-dle, Ateez, ITZY, IZONE, Loona, Stray Kids, Treasure, TXT. Sedangkan grup yang menghasilkan total penjualan yang cenderung stagnan yaitu Cravity, Everglow, dan Verivery.

Which album has the biggest sales?

# Data Wrangling
big_album <- aggregate(sales~title+Artist, data=kpop, FUN="sum")
big_album <- big_album[order(big_album$sales, decreasing = T),]
big_album$label <- glue("Artist : {big_album$Artist}
                        Total Sales: {big_album$sales}")
# Visualization
plot_album <- ggplot(data=head(big_album,10), mapping = aes(x=sales/1000, y=reorder(title,sales), text=label))+
  geom_col(aes(fill=sales))+
  scale_fill_gradient(low="orange",high = "navy")+
  labs(title="Album Ranking based on Sales",
       y = "Album",
       x = "sales (thousand Copies)")+
  scale_y_discrete(labels = wrap_format(25))
ggplotly(plot_album, tooltip="text")

Dapat kita lihat dari visualisasi data di atas bahwa 2 album dari grup IZONE berada pada peringkat pertama dan ketiga. yaitu album Oneiric Diary dan Blue Hour. Sedangkan posisi kedua ditempati oleh album “Blue Hour` dari grup TXT.

Which grup has the biggest sales in each country?

# Visualization
ggplot(data=kpop, mapping= aes(x = country, y = sales/1000, fill=country))+
  geom_col()+
  labs(title = "Total Sales in Each Country",
       y="Sales (Thousand Copies)",
       x="Country")+
  facet_wrap(~Artist)+
  theme(legend.position = "none",
        plot.title = element_text(hjust=0.5))

Dapat kita lihat dari visualisasi di atas bahwa IZONE menjadi kpop grup generasi ke-4 yang memiliki total penjualan terbesar, baik di negara Korea maupun di negara Jepang. Namun, untuk negara China, grup (G)I-dle menjadi kpop grup generasi ke-4 yang memiliki total penjualan terbesar.

Summary

  • IZONE menjadi idol grup yang paling banyak menempati urutan pertama, baik dari segi penjualan seluruh album maupun masing-masing album. IZONE juga menempati urutan pertama untuk total penjualan album di negara Jepang dan Korea. Sedangkan untuk negara China, urutan pertama ditempati oleh (G)I-dle.
  • Terdapat beberapa grup yang mengalami kenaikan ataupun yang tidak mengalami kenaikan atau penurunan apapun. Grup yang cenderung mengalami peningkatan terhadap total penjualan yaitu (G)I-dle, Ateez, ITZY, IZONE, Loona, Stray Kids, Treasure, TXT. Sedangkan grup yang menghasilkan total penjualan yang cenderung stagnan yaitu Cravity, Everglow, dan Verivery.