HOME

UTS - Mata Kuliah Pengantar Sains Data B

Nama: Judah Toba Butar Butar

NIM: 16231028

Selamat datang di dashboard visualisasi yang berisi eksplorasi data penjualan LEGO. Project ini dibuat sebagai Ujian Tengah Semester mata kuliah Pengantar Sains Data (PSD) kelas B.

Dataset yang digunakan berjudul LEGO Sales Dataset, yang berisi informasi penjualan berbagai produk LEGO oleh konsumen dari berbagai usia, kategori, dan tema. Dataset ini mencakup berbagai atribut penting seperti:

  • Product ID dan Nama Produk
  • Jumlah Kepingan (pieces)
  • Harga Jual (US Dollar)
  • Target Usia Konsumen
  • Waktu Transaksi
  • Informasi Customer (nama depan dan belakang)
  • Tema LEGO (seperti Star Wars, City, Friends, dll)

Data ini dapat digunakan untuk mengidentifikasi Customer dengan jumlah transaksi terbanyak, tema LEGO terpopuler, sebaran jumlah Pieces dan Harga, komposisi penjualan, dan intensitas antar variabel variabel numerik. Dengan eksplorasi ini, kita dapat memperoleh insight yang berguna untuk memperoleh gambaran umum mengenai struktur dan isi data LEGO.

Eksplorasi Data Awal


INFORMASI DATA UMUM DATASET

Rows: 287
Columns: 14
$ first_name   <chr> "Kimberly", "Neel", "Kevin", "Connor", "Connor", "Toni", …
$ last_name    <chr> "Beckstead", "Garvin", "Cruz", "Brown", "Brown", "Borison…
$ age          <dbl> 24, 35, 20, 36, 36, 40, 40, 44, 45, 45, 31, 31, 31, 55, 4…
$ phone_number <chr> "216-555-2549", "819-555-3189", "947-555-7946", "516-555-…
$ set_id       <dbl> 24701, 25626, 24767, 24548, 24913, 25626, 24994, 24903, 2…
$ number       <chr> "76062", "70595", "70335", "71230", "60112", "70595", "10…
$ theme        <chr> "DC Comics Super Heroes", "Ninjago", "Nexo Knights", "Dim…
$ subtheme     <chr> "Mighty Micros", "Rise of the Villains", "Ultimate", "Fun…
$ year         <dbl> 2018, 2018, 2018, 2018, 2018, 2018, 2018, 2018, 2018, 201…
$ name         <chr> "Robin vs. Bane", "Ultra Stealth Raider", "Ultimate Lavar…
$ pieces       <dbl> 77, 1093, 69, 69, 376, 1093, 2380, 63, 409, 248, 194, 101…
$ us_price     <dbl> 9.99, 119.99, 9.99, 14.99, 49.99, 119.99, 169.99, 4.99, 5…
$ image_url    <chr> "http://images.brickset.com/sets/images/76062-1.jpg", "ht…
$ quantity     <dbl> 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 3, 1, 2, 2, 1, 1, …

PEMBERSIHAN DATA

tibble [287 × 14] (S3: tbl_df/tbl/data.frame)
 $ first_name  : chr [1:287] "Kimberly" "Neel" "Kevin" "Connor" ...
 $ last_name   : chr [1:287] "Beckstead" "Garvin" "Cruz" "Brown" ...
 $ age         : num [1:287] 24 35 20 36 36 40 40 44 45 45 ...
 $ phone_number: chr [1:287] "216-555-2549" "819-555-3189" "947-555-7946" "516-555-4310" ...
 $ set_id      : num [1:287] 24701 25626 24767 24548 24913 ...
 $ number      : chr [1:287] "76062" "70595" "70335" "71230" ...
 $ theme       : chr [1:287] "DC Comics Super Heroes" "Ninjago" "Nexo Knights" "Dimensions" ...
 $ subtheme    : chr [1:287] "Mighty Micros" "Rise of the Villains" "Ultimate" "Fun Pack" ...
 $ year        : num [1:287] 2018 2018 2018 2018 2018 ...
 $ name        : chr [1:287] "Robin vs. Bane" "Ultra Stealth Raider" "Ultimate Lavaria" "Fun Pack: Doc Brown" ...
 $ pieces      : num [1:287] 77 1093 69 69 376 ...
 $ us_price    : num [1:287] 9.99 119.99 9.99 14.99 49.99 ...
 $ image_url   : chr [1:287] "http://images.brickset.com/sets/images/76062-1.jpg" "http://images.brickset.com/sets/images/70595-1.jpg" "http://images.brickset.com/sets/images/70335-1.jpg" "http://images.brickset.com/sets/images/71230-1.jpg" ...
 $ quantity    : num [1:287] 1 1 2 1 1 1 1 1 1 1 ...
 - attr(*, "spec")=List of 3
  ..$ cols   :List of 14
  .. ..$ first_name  : list()
  .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
  .. ..$ last_name   : list()
  .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
  .. ..$ age         : list()
  .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
  .. ..$ phone_number: list()
  .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
  .. ..$ set_id      : list()
  .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
  .. ..$ number      : list()
  .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
  .. ..$ theme       : list()
  .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
  .. ..$ subtheme    : list()
  .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
  .. ..$ year        : list()
  .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
  .. ..$ name        : list()
  .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
  .. ..$ pieces      : list()
  .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
  .. ..$ us_price    : list()
  .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
  .. ..$ image_url   : list()
  .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
  .. ..$ quantity    : list()
  .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
  ..$ default: list()
  .. ..- attr(*, "class")= chr [1:2] "collector_guess" "collector"
  ..$ skip   : num 1
  ..- attr(*, "class")= chr "col_spec"

Visualisasi 1

10 Customer Dengan Jumlah Transaksi Terbanyak

Insight dan Narasi

  1. Dominasi oleh Josie Paley: Josie Paley adalah pelanggan dengan jumlah transaksi terbanyak, yaitu 8 transaksi, unggul dari pelanggan lainnya. Ini menunjukkan bahwa Josie adalah salah satu pelanggan paling aktif dalam pembelian LEGO.

  2. Pola yang cukup merata di Top 5: Pelanggan di urutan 2 sampai 5 (Shina Hegarty, Orion Gates, Caroline Holstein, dan Aaron Bruner) memiliki jumlah transaksi yang hampir sama, sekitar 7 transaksi, menunjukkan ada kelompok pelanggan setia yang konsisten melakukan pembelian.

  3. Perbedaan warna menunjukkan volume transaksi: Gradasi warna dari biru muda ke biru tua digunakan dengan efektif untuk menunjukkan intensitas transaksi—semakin tua warnanya, semakin banyak transaksinya. Ini membantu identifikasi cepat siapa pelanggan paling aktif.

  4. Pelanggan top hanya beda tipis jumlahnya: Meskipun hanya 10 pelanggan yang ditampilkan, selisih antara posisi 1 dan posisi 10 tidak terlalu jauh (8 vs 6 transaksi), artinya ada komunitas pelanggan aktif yang mungkin bisa ditargetkan untuk promosi eksklusif.

Visualisasi 2

10 Tema LEGO Terpopuler Berdasarkan Penjualan

Insight dan Narasi

  1. Dominasi Tema Star Wars: Tema Star Wars menempati posisi puncak dengan total penjualan mendekati 100 unit. Ini menunjukkan daya tarik yang luar biasa dari franchise ini, kemungkinan besar karena basis penggemar yang luas dan rilis film atau acara TV yang berdekatan dengan periode penjualan.

  2. City & Mixels di Posisi Menengah: Tema City dan Mixels berada di posisi 2 dan 3, dengan penjualan yang signifikan namun tidak terlalu jauh dari tema di bawahnya. Ini menunjukkan bahwa keduanya merupakan produk populer namun belum seikonik Star Wars.

  3. Persaingan Ketat di Posisi Bawah: Tema Ninjago, Friends, Bionicle, hingga Dimensions menunjukkan angka penjualan yang relatif berdekatan (sekitar 20–35 unit). Ini mencerminkan adanya kelompok tema yang memiliki penggemar cukup setia namun belum mencapai skala yang masif.

  4. Efektivitas Visualisasi Warna: Penggunaan gradasi warna dari kuning ke oranye memberikan indikator visual yang kuat terkait volume penjualan. Tema dengan warna lebih gelap langsung menonjol sebagai yang terlaris.

  5. Potensi Strategi Promosi Berdasarkan Tema: Tema dengan performa menengah ke bawah bisa menjadi target promosi atau bundling, terutama jika ingin meningkatkan popularitasnya mendekati tema terlaris. Sementara itu, Star Wars bisa diprioritaskan untuk stok dan pengembangan produk baru.

Visualisasi 3

Sebaran Jumlah Pieces dan Harga

Insight dan Narasi

  1. Korelasi Positif antara Jumlah Kepingan dan Harga: Grafik scatter plot menunjukkan pola yang jelas bahwa semakin banyak jumlah kepingan dalam satu set LEGO, maka harga cenderung meningkat. Garis regresi merah mempertegas hubungan linier positif ini, menandakan bahwa jumlah kepingan adalah faktor penentu utama dalam pembentukan harga.

  2. Distribusi Dominan di Kelas Rendah–Menengah: Sebagian besar titik data terkonsentrasi pada jumlah kepingan di bawah 1000 dan harga di bawah $100. Hal ini menunjukkan bahwa produk LEGO lebih banyak dirilis dalam kategori set menengah yang lebih terjangkau dan mudah diakses oleh konsumen umum.

  3. Outlier di Sisi Atas: Terdapat beberapa outlier, seperti set dengan lebih dari 2000 keping yang harganya jauh lebih tinggi dari rata-rata. Ini kemungkinan besar merupakan koleksi edisi khusus atau premium yang menyasar kolektor atau penggemar berat.

  4. Potensi Perhitungan Value for Money: Dengan hubungan ini, pembeli bisa menghitung rasio harga per keping (price per piece) sebagai dasar untuk menilai apakah suatu set menawarkan nilai yang baik. Data ini bisa juga dimanfaatkan oleh LEGO untuk mengatur segmentasi harga produk mereka lebih strategis.

Visualisasi 4

Komposisi Penjualan Berdasarkan Usia

Insight dan Narasi

  1. Dominasi Usia Muda hingga Paruh Baya: Grafik histogram menunjukkan bahwa mayoritas pembeli LEGO berada di rentang usia 20 hingga 40 tahun. Ini adalah usia produktif, di mana konsumen cenderung memiliki daya beli yang kuat dan kemungkinan besar membeli LEGO baik untuk diri sendiri (koleksi/hobi) maupun untuk anak-anak mereka.

  2. Puncak Tertinggi Penjualan: Titik penjualan tertinggi terjadi pada usia sekitar 36 tahun, menandakan bahwa orang dewasa di usia ini sangat aktif dalam pembelian LEGO. Ini bisa jadi karena mereka adalah orang tua atau penggemar LEGO yang tumbuh bersama brand ini.

  3. Segmen Remaja Masih Signifikan: Pembelian juga cukup tinggi pada usia remaja akhir dan awal 20-an, memperlihatkan bahwa LEGO tetap relevan di kalangan muda, entah untuk hobi, koleksi, atau sebagai hadiah.

  4. Menurunnya Pembelian di Usia Lebih Tua: Setelah usia 40 tahun, terjadi penurunan jumlah pembelian secara bertahap. Meskipun begitu, masih ada pembeli di atas usia 50 bahkan hingga 60 tahun, yang menunjukkan loyalitas atau minat dari kalangan kolektor dewasa.

  5. Peluang Segmentasi Pasar: Berdasarkan data ini, LEGO bisa mempertimbangkan membuat strategi pemasaran yang lebih tajam untuk dua segmen utama:

  • Usia 20–40 tahun: konten nostalgia, koleksi dewasa, edisi spesial
  • Usia <25 tahun: promosi digital dan media sosial yang kuat

Visualisasi 5

Heatmap Korelasi Antar Variabel Numerik

Insight dan Narasi

  1. Korelasi Kuat antara Pieces dan Harga: Terdapat korelasi yang sangat tinggi (0.94) antara jumlah kepingan (pieces) dan harga produk (us_price). Hal ini menunjukkan bahwa semakin banyak jumlah kepingan dalam satu set LEGO, maka semakin tinggi pula harganya. Ini adalah relasi yang logis dan menunjukkan konsistensi penentuan harga berdasarkan kompleksitas produk.

  2. Jumlah Terjual Tidak Berkorelasi dengan Harga atau Pieces: Menariknya, variabel quantity (jumlah terjual) memiliki korelasi sangat rendah terhadap harga (-0.05) maupun jumlah pieces (-0.04). Artinya:

  • Set LEGO yang mahal atau kompleks tidak selalu laku keras.
  • Sebaliknya, set yang lebih sederhana atau lebih murah bisa jadi lebih diminati karena lebih terjangkau dan mudah dimainkan.
  1. Implikasi Strategis:
  • Tim marketing bisa menyasar produk dengan harga sedang yang punya potensi volume tinggi.
  • Produk dengan jumlah pieces tinggi dapat diposisikan sebagai produk koleksi premium.
  • Ada peluang untuk eksperimen promosi pada set dengan harga tinggi, karena korelasinya lemah terhadap penjualan.
  1. Validasi dari Visualisasi Sebelumnya: Hasil ini memperkuat temuan pada visualisasi scatter plot (pieces vs price) sebelumnya, di mana terlihat jelas hubungan linier antara kepingan dan harga.