AnthonyDCD
# Prophet Method for Retail Industies
Latar Belakang
Toko ritel merupakan bisnis yang kompleks dan memiliki berbagai macam jenis dan format, termasuk supermarket, minimarket, department store, toko khusus, outlet, dan toko online. Setiap format toko ritel memiliki keunikan dan strategi bisnis yang berbeda-beda, dengan berbagai format dan jenis usaha yang berbeda. Dalam bisnis toko ritel, lokasi menjadi faktor yang sangat penting. Lokasi toko ritel harus dipilih dengan cermat dan harus memenuhi kriteria tertentu agar dapat berhasil dan bersaing di pasar.
Selain itu, dalam industri toko ritel faktor promosi, pemasaran dan manajemen stok sangat penting. Strategi pemasaran yang efektif untuk menarik pelanggan merupakan salah satu penentu peningkatan penjualan. Strategi pemasaran dapat mencakup iklan di media massa, promosi di toko, diskon, dan program loyalitas pelanggan, manajemen stok merupakan hal penting untuk memenuhi kebutuhan pasar, mengoptimalkan keuntungan serta meminimalisir kerugian yang diakibatkan ketidaksesuaian stok. Prediksi yang akurat dapat membantu toko ritel untuk melakukan perencanaan pengadaan stok yang lebih efektif. Pada era digital, toko ritel juga semakin bergeser ke arah e-commerce atau penjualan secara online. Hal ini dapat menjangkau lebih banyak pelanggan dan memperluas pasar. Mengelola persediaan dan mengendalikan biaya operasional mereka agar dapat bertahan di pasar yang kompetitif. Hal ini termasuk mengelola biaya sewa toko, biaya tenaga kerja, dan biaya operasional lainnya.
Teknologi memiliki peran penting dalam meningkatkan efisiensi operasional dan strategi bisnis. Teknologi dapat membantu toko ritel dalam pengolahan data, manajemen stok, dan pemasaran digital. Selain itu, teknologi juga dapat membantu toko ritel dalam meningkatkan pengalaman pelanggan dan memperbaiki kualitas layanan mereka.
Pada kesempatan kali ini pemodelan “forcasting” yang bertujuan untuk memprediksi penjualan produk selama 3 bulan ke depan di berbagai toko ritel. Masalah ini penting karena dapat membantu perusahaan dalam perencanaan stok dan produksi, serta membantu toko-toko ritel dalam merencanakan promosi dan strategi penjualan.
Masalah ini kompleks karena melibatkan berbagai faktor yang dapat memengaruhi penjualan produk, seperti musim, perubahan tren, dan kondisi ekonomi. Selain itu, tantangan ini juga melibatkan data yang besar dan kompleks, yang memerlukan pemahaman yang kuat tentang pengolahan data, analisis statistik, dan pemodelan prediksi.
Dalam industri ritel, mengembangkan model prediksi yang akurat dan dapat diandalkan sangat penting untuk memastikan keberhasilan bisnis dan menjaga persaingan di pasar. Keterlambatan dalam merespons perubahan permintaan dapat mengakibatkan stok yang berlebihan atau kekurangan stok, yang dapat merugikan bisnis dan menyebabkan kerugian finansial.
Oleh karena itu, masalah prediksi penjualan produk selama 3 bulan ke depan di berbagai toko ritel merupakan masalah yang penting dan memiliki implikasi besar bagi bisnis dan industri. Melalui pengembangan model prediksi yang akurat dan efektif, perusahaan dan toko ritel dapat memperbaiki perencanaan stok dan produksi, serta meningkatkan strategi penjualan dan keuntungan bisnis secara keseluruhan.
Salah satu tantangan utama dalam industri ritel adalah bagaimana mengoptimalkan persediaan dan meningkatkan penjualan produk untuk memenuhi permintaan pelanggan. Banyak kasus, toko-toko ritel mengalami kesulitan dalam memprediksi permintaan pelanggan dan sering mengalami kekurangan atau kelebihan persediaan yang tidak perlu. Hal ini dapat menyebabkan biaya operasional yang tidak perlu dan menimbulkan ketidakpuasan pelanggan. Selain itu, toko-toko juga sering kesulitan dalam menentukan strategi pemasaran dan promosi produk yang efektif.
Dengan menggunakan data historis penjualan dan informasi produk yang relevan, proyek ini bertujuan untuk mengembangkan model prediksi penjualan yang akurat dan relevan untuk membantu toko-toko ritel dalam perencanaan stok dan strategi pemasaran. Dengan memiliki prediksi penjualan yang lebih akurat, toko-toko dapat mengoptimalkan persediaan dan menghindari kekurangan atau kelebihan persediaan yang tidak perlu. Selain itu, toko-toko juga dapat mengambil keputusan yang lebih tepat dalam menentukan strategi pemasaran dan promosi produk.
Dalam hal ini, permasalahan yang ingin diselesaikan adalah bagaimana mengoptimalkan persediaan dan meningkatkan penjualan produk dalam industri ritel dengan menggunakan prediksi penjualan yang akurat dan relevan. Dengan demikian, proyek ini dapat membantu toko-toko ritel dalam meningkatkan efisiensi operasional, meningkatkan kepuasan pelanggan, dan meningkatkan profitabilitas bisnis.
Project Impact
Project / Proyek ini menggunakan metode Prophet memiliki dampak positif pada toko-toko ritel dengan memberikan informasi yang berguna dalam perencanaan stok dan strategi pemasaran. Dengan memiliki prediksi penjualan yang lebih akurat, toko dapat mengoptimalkan persediaan dan menghindari kekurangan atau kelebihan persediaan yang tidak perlu, sehingga dapat menghemat biaya dan meningkatkan efisiensi operasional.
Selain itu, dengan memiliki informasi yang lebih akurat tentang penjualan produk, toko-toko dapat mengambil keputusan yang lebih tepat dalam menentukan strategi pemasaran dan promosi produk. Hal ini dapat membantu meningkatkan penjualan, meningkatkan kepuasan pelanggan, dan memperkuat citra merek toko.
Lebih jauh lagi, proyek ini dapat memiliki dampak positif pada industri ritel secara keseluruhan. Dengan meningkatkan efisiensi dan keakuratan perencanaan stok dan strategi pemasaran, toko-toko dapat meningkatkan daya saing mereka dan membantu meningkatkan kualitas layanan yang mereka berikan kepada pelanggan. Hal ini dapat berdampak positif pada pertumbuhan dan perkembangan industri ritel secara keseluruhan.
Namun, dampak positif dari proyek ini dapat dicapai hanya jika data yang digunakan untuk membuat prediksi akurat dan relevan. Oleh karena itu, sangat penting untuk memastikan bahwa data yang digunakan dalam proyek ini akurat, terpercaya, dan relevan dengan konteks toko-toko dan lingkungan bisnis yang ada.
Manfaat Proyek
Proyek ini dapat memberikan manfaat yang besar bagi toko-toko ritel dan industri ritel secara keseluruhan. Berikut adalah beberapa manfaat yang dapat didapatkan dari proyek ini:
Perencanaan stok yang lebih efektif: Dengan memiliki prediksi penjualan yang lebih akurat, toko-toko dapat mengoptimalkan persediaan dan menghindari kekurangan atau kelebihan persediaan yang tidak perlu. Hal ini dapat membantu meningkatkan efisiensi operasional dan menghemat biaya.
Peningkatan efektivitas strategi pemasaran: Dengan memiliki informasi yang lebih akurat tentang penjualan produk, toko-toko dapat mengambil keputusan yang lebih tepat dalam menentukan strategi pemasaran dan promosi produk. Hal ini dapat membantu meningkatkan penjualan, meningkatkan kepuasan pelanggan, dan memperkuat citra merek toko.
Meningkatkan daya saing: Dengan meningkatkan efisiensi dan keakuratan perencanaan stok dan strategi pemasaran, toko-toko dapat meningkatkan daya saing mereka dan membantu meningkatkan kualitas layanan yang mereka berikan kepada pelanggan. Hal ini dapat berdampak positif pada pertumbuhan dan perkembangan industri ritel secara keseluruhan.
Meningkatkan kepuasan pelanggan: Dengan memiliki persediaan yang cukup dan dapat memenuhi permintaan pelanggan, toko-toko dapat meningkatkan kepuasan pelanggan dan memperkuat hubungan bisnis yang baik.
Meningkatkan profitabilitas: Dengan mengoptimalkan persediaan dan meningkatkan penjualan, toko-toko dapat meningkatkan profitabilitas bisnis mereka dan memperkuat posisi keuangan mereka dalam jangka panjang.
Secara keseluruhan, proyek ini dapat membantu toko-toko ritel dan industri ritel secara keseluruhan untuk menjadi lebih efisien, efektif, dan berdaya saing, serta dapat meningkatkan kepuasan pelanggan dan profitabilitas bisnis.
Tujuan
Tujuan utama proyek ini adalah untuk meramalkan penjualan berdasarkan data series menyesuaikan dengan waktu yang diinginankan sesuai kebutuhan dan menentukan prediksi terbaik dengan membandingkan setiap metode machine learning forcasting. adapun permasalahan yang ingin diselesaikan dalam proyek adalah permasalahan perencanaan stok dan strategi pemasaran pada toko-toko ritel. Salah satu tantangan utama dalam industri ritel adalah bagaimana mengoptimalkan persediaan dan meningkatkan penjualan produk untuk memenuhi permintaan pelanggan.
Dalam banyak kasus, toko-toko ritel mengalami kesulitan dalam memprediksi permintaan pelanggan dan sering mengalami kekurangan atau kelebihan persediaan yang tidak perlu. Hal ini dapat menyebabkan biaya operasional yang tidak perlu dan menimbulkan ketidakpuasan pelanggan. Selain itu, toko-toko juga sering kesulitan dalam menentukan strategi pemasaran dan promosi produk yang efektif.
Dengan menggunakan data historis penjualan dan informasi produk yang relevan, proyek ini bertujuan untuk mengembangkan model prediksi penjualan yang akurat dan relevan untuk membantu toko-toko ritel dalam perencanaan stok dan strategi pemasaran. Dengan memiliki prediksi penjualan yang lebih akurat, toko-toko dapat mengoptimalkan persediaan dan menghindari kekurangan atau kelebihan persediaan yang tidak perlu. Selain itu, toko-toko juga dapat mengambil keputusan yang lebih tepat dalam menentukan strategi pemasaran dan promosi produk.
Dalam hal ini, permasalahan yang ingin diselesaikan adalah bagaimana mengoptimalkan persediaan dan meningkatkan penjualan produk dalam industri ritel dengan menggunakan prediksi penjualan yang akurat dan relevan. Dengan demikian, proyek ini dapat membantu toko-toko ritel dalam meningkatkan efisiensi operasional, meningkatkan kepuasan pelanggan, dan meningkatkan profitabilitas bisnis.
Poin penting dari proyek ini :
- Memprediksi kebutuhan industri retail dengan akurasi tinggi
menggunakan
machine learning & forcasting. - Membantu industri retail terkait pengadaan stock barang, pemasaran dan strategi yang tepat sasaran & profitable.
- Memprediksi trend pasar dimasa mendatang.
- Mengetahui trend saat ini.
- Menampilkan Visualisasi yang menarik dan mudah dimengerti
Proyek ini akan memaksimalkan proses forcasting dan membandingkan setiap metode untuk dapat menghasilkan hasil yang maksimal, apabila ingin berdiskusi silahkan untuk menghubungi Anthony
Pengumpulan Data
Proses pengumpulan data memanfaatkan browser googlechrome, menggunakan proses pengumpulan data sekunder bersumber dari Data Competition Kaggle, Data yang digunakan sesuai dengan permasalahan yang ingin dipecahkan dan tujuan sebagai solusi permasalah yang terjadi guna memberikan manfaat untuk memperbaiki dan meningkatkan performa industri / bisnis retail.
Persiapan Data
- Set Library Memastikan pemasangan fungsi library(package) pada
Rstudio sudah terpadang dan dapat di pergunakan dengan baik, berikut
kode yang saya lampirkan hanya sebagai contoh installasi
package(library) di Rstudio maka saya berikan tanda
#untuk menonaktifkan kode, catatan penting pastikan library yang digunakan sesuai dengan kebutuhan.
# (library(forecast)
# (library(prophet)- Pemanggilan dataset
Pemanggilan dataset menggunakan fungsi read_csv setelah
itu dataframe diberi nama train & test
setelah itu saya melakukan pengecekan tipe data menggunakan fungsi
glimpse, Kumpulan Data train memiliki 913000 baris dan 4
kolom dan Kumpulan Data test memiliki 45000 baris dan 4
kolom, seperti dideskripsikan pada code dibawah ini.
train = read_csv("Anthonylab/Anthony_train.csv")
glimpse(train)#> Rows: 913,000
#> Columns: 4
#> $ date <date> 2013-01-01, 2013-01-02, 2013-01-03, 2013-01-04, 2013-01-05, 201…
#> $ store <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
#> $ item <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
#> $ sales <dbl> 13, 11, 14, 13, 10, 12, 10, 9, 12, 9, 9, 7, 10, 12, 5, 7, 16, 7,…
test <- read_csv("Anthonylab/Anthony_test.csv")
sprintf("Kumpulan Data test memiliki %d baris dan %d kolom", nrow(test), ncol(test) )#> [1] "Kumpulan Data test memiliki 45000 baris dan 4 kolom"
glimpse(test)#> Rows: 45,000
#> Columns: 4
#> $ id <dbl> 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18…
#> $ date <date> 2018-01-01, 2018-01-02, 2018-01-03, 2018-01-04, 2018-01-05, 201…
#> $ store <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
#> $ item <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
- Cek missing value pastikan data bersih dan sesuai untuk proses
selanjutnya, pada kesempatan kali ini saya menggunakan fungsi
sum(is.na(xx))dimana fungsi ini merupakan 2 fungsi antara fungsisumsebagai perhitungan aritmatika &is.nasebagai pengecek data yang terindikasi hilang pada dataframe(dataset). berdasarkan fungsisum(is.na(xx))secara spesifik akan melakukan pegecekan, menghitung dan menampilkan hasil perhitungan data hilang dari setiap kolom dari dataframe(dataset).
sum(is.na(train))#> [1] 0
Berikut ini saya tampilkan data hilang (missing value) dalam bentuk plot :
MV
Berdasarkan hasil pengecekan dapat dipastikan data terhindar dari
kehilangan data, mengapa saya memproses pengecekan 2 kali, menggunakan
proses visualisasi kata dan plot, karena proses ini sangat penting untuk
menghasilkan hasil yang sempurna maka saya lakukan prosesnya kembali
untuk memastikan data yang saya gunakan sudah bersih dan siap
digunakan.
- Melakukan proses EDA (Exploration Data Analysis)
Ringkasan Data train pada kolom sales sebagai indikator
utama memprediksi nilai penjualan berdasarkan histori data.
summary(train$sales)#> Min. 1st Qu. Median Mean 3rd Qu. Max.
#> 0.00 30.00 47.00 52.25 70.00 231.00
Ekstraksi data menjadi Kolom Day, Month,
MonthYear, Year dari Data date
pastikan kembali data yang digunakan adalah data series bertujuan untuk
mudahkan proses selanjutnya yaitu menggunakan metode machine learning
dan visualisasi.
Data yang dimiliki memiliki range Waktu mulai dari 2013-01-01 - 2017-12-31.
Check Data Kolom yang sudah di tambahkan yaitu : Day,
Month, Year.
head(train)#> # A tibble: 6 × 7
#> date store item sales Day Month Year
#> <date> <dbl> <dbl> <dbl> <int> <dbl> <dbl>
#> 1 2013-01-01 1 1 13 1 1 2013
#> 2 2013-01-02 1 1 11 2 1 2013
#> 3 2013-01-03 1 1 14 3 1 2013
#> 4 2013-01-04 1 1 13 4 1 2013
#> 5 2013-01-05 1 1 10 5 1 2013
#> 6 2013-01-06 1 1 12 6 1 2013
head(test)#> # A tibble: 6 × 7
#> id date store item Day Month Year
#> <dbl> <date> <dbl> <dbl> <int> <dbl> <dbl>
#> 1 0 2018-01-01 1 1 1 1 2018
#> 2 1 2018-01-02 1 1 2 1 2018
#> 3 2 2018-01-03 1 1 3 1 2018
#> 4 3 2018-01-04 1 1 4 1 2018
#> 5 4 2018-01-05 1 1 5 1 2018
#> 6 5 2018-01-06 1 1 6 1 2018
Check Data Kolom yang sudah di tambahkan yaitu :
MonthYear
head(train)#> # A tibble: 6 × 8
#> date store item sales Day Month Year MonthYear
#> <date> <dbl> <dbl> <dbl> <int> <dbl> <dbl> <yearmon>
#> 1 2013-01-01 1 1 13 1 1 2013 Jan 2013
#> 2 2013-01-02 1 1 11 2 1 2013 Jan 2013
#> 3 2013-01-03 1 1 14 3 1 2013 Jan 2013
#> 4 2013-01-04 1 1 13 4 1 2013 Jan 2013
#> 5 2013-01-05 1 1 10 5 1 2013 Jan 2013
#> 6 2013-01-06 1 1 12 6 1 2013 Jan 2013
head(test)#> # A tibble: 6 × 8
#> id date store item Day Month Year MonthYear
#> <dbl> <date> <dbl> <dbl> <int> <dbl> <dbl> <yearmon>
#> 1 0 2018-01-01 1 1 1 1 2018 Jan 2018
#> 2 1 2018-01-02 1 1 2 1 2018 Jan 2018
#> 3 2 2018-01-03 1 1 3 1 2018 Jan 2018
#> 4 3 2018-01-04 1 1 4 1 2018 Jan 2018
#> 5 4 2018-01-05 1 1 5 1 2018 Jan 2018
#> 6 5 2018-01-06 1 1 6 1 2018 Jan 2018
- Machine Learning
menggunakan metode forcasting
- Visualisasi
Menampilkan aggregate data sales berdasarkan data
date, menghasilkan visualisasi pertumbuhan penjualan
berdasarkan runtutan waktu disajikan dalam bentu plot, dan perbandingan
selisih kenaikan dan penurunan penjualan dari deret waktu bulan yang
disajikan dalam plot.
grid.arrange(Sales1,Sales2)VisualIsasi histogram sales berdasarkan
date
SaleshistogProduct Design
Proyek saya akan menggunakan metode machine learning Prophet dan metode Forcasting seperti ARIMA (Autoregressive Integrated Moving Average), SARIMA (Seasonal Autoregressive Integrated Moving Average), dan Holt-Winters. sebagai pembanding model manakah yang paling tepat dan baik untuk data yang diolah bertujuan untuk dapat memprediksi penjualan dan kebutuhan stok perusahaan retail dimasa mendatang. proyek ini bertujuan memenuhi kebutuhan data prediksi sebagai penunjang industri retail dapat memenuhi kebutuhan pelanggan dengan strategi yang tepat sasaran & profitable. proyek ini mempermudah pengguna, karena hanya dengan memasukan data histori penjualan industri retail makan akan mendapatkan output data prediksi sesuai dengan kebutuhan industri retail menjadi tepat sasaran dan profitable.
Fitur apa saja yang akan ada di dashboard?
- Login akun untuk akses Machine learning
- kolom untuk memasukan data awal bentuk tabel dengan tipe data “.CSV”
- Visualisasi data awal & Pertumbuhan berdasarkan waktu (bulan & tahun) dengan predikto yang dapat dipilih
- Visualisasi Korelasi Data
- input data untuk diuji menggunakan machine learning metode Prophet
- output data hasil uji secara terperinci sesuai dengan kebutuhan dan prediksi yang telah ditetapkan
References
- Prophet method
- ARIMA
- SARIMA
- holt-winters
- AnthonyTSpy
- Box, G. E., Jenkins, G. M., Reinsel, G. C., & Ljung, G. M. (2015). Time series analysis: forecasting and control. John Wiley & Sons.
- Hyndman, R. J., & Athanasopoulos, G. (2018). Forecasting: principles and practice. OTexts.