#Memuat paket yang di perlukan untuk impor datasets .xlsx dan visualisasi
library(readxl)
library(ggplot2)
library(scales)
library(dplyr)
Pada laporan ini dilakukan proses analisis data menggunakan RStudio dengan format R Markdown. Data yang digunakan berasal dari file Excel (.xlsx). Tahapan yang dilakukan meliputi proses impor data, eksplorasi dan analisis, visualisasi data, serta interpretasi hasil.
“Insight” yang diambil dari Coffee Chain Datasets adalah perbandingan total target penjualan(Budget Sales) dari setiap jenis produk yang ada. variabel yang digunakan dalam menampilkan “insight” ini tentunya adalah kolom produk yang berisi setiap jenis produk dan kolom Target Penjualan(Budget Sales) yang berisi target hasil profit yang diharapkan, sehingga hasil dari “insight” yang didapatkan adalah dapat mengetahui jenis produk apa yang paling mengusai pasar, yang paling mendominasi di pasaran, atau yang paling diunggulkan. Hasilnya, dapat menjadi dasar informasi dan strategi pemasaran produk, dan dasar informasi produk mana yang paling menjanjikan atau dapat dikatakan yang paling berpotensi memberikan kepuasan tertinggi bagi konsumen di pasaran.
data <- read_excel("D:/Tugas SIM 2025B - Coffee Chain Datasets.xlsx")
Setelah data .xlsx tersebut berhasil di impor ke dalam r, maka langkah analisis selanjutnya adalah melakukan eksplorasi data. Pada analisis data berikut, eksplorasi yang dilakukan adalah mengambil “insight” mengenai perbandingan antara budget sales, yaitu target penjualan dengan produk yang ada.
Menganalisis “insight” yang akan ditampilkan untuk dijadikan dasar informasi bagi pihak yang bersangkutan, baik bagi perusahaan, maupun bagi para konsumen dan masyarakat awam mengenai produk apa yang mendominasi dan paling berpotensial di pasaran dan menghasilkan informasi mengenai produk yang paling di unggulkan, dengan kata lain, produk yang paling menjanjikan di pasaran. Eksplorasi juga dilakukan guna mengetahui struktur dari datasets yang ada. Eksplorasi dilakukan dengan menjalankan fungsi seperti summary(), head(), tail(), str() sehingga memudahkan memahami struktur dan bentuk dari datasets yang ada.
# eksplorasi
head(data)
## # A tibble: 6 × 20
## `Area Code` Date Market `Market Size` Product `Product Line`
## <dbl> <dttm> <chr> <chr> <chr> <chr>
## 1 719 2012-01-01 00:00:00 Central Major Market Amaretto Beans
## 2 970 2012-01-01 00:00:00 Central Major Market Colombian Beans
## 3 970 2012-01-01 00:00:00 Central Major Market Decaf Ir… Beans
## 4 303 2012-01-01 00:00:00 Central Major Market Green Tea Leaves
## 5 303 2012-01-01 00:00:00 Central Major Market Caffe Mo… Beans
## 6 720 2012-01-01 00:00:00 Central Major Market Decaf Es… Beans
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## # `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## # `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## # Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
tail(data)
## # A tibble: 6 × 20
## `Area Code` Date Market `Market Size` Product `Product Line`
## <dbl> <dttm> <chr> <chr> <chr> <chr>
## 1 425 2013-12-01 00:00:00 West Small Market Lemon Leaves
## 2 206 2013-12-01 00:00:00 West Small Market Caffe Lat… Beans
## 3 509 2013-12-01 00:00:00 West Small Market Caffe Moc… Beans
## 4 360 2013-12-01 00:00:00 West Small Market Decaf Esp… Beans
## 5 360 2013-12-01 00:00:00 West Small Market Colombian Beans
## 6 206 2013-12-01 00:00:00 West Small Market Decaf Iri… Beans
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## # `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## # `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## # Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
str(data)
## tibble [4,248 × 20] (S3: tbl_df/tbl/data.frame)
## $ Area Code : num [1:4248] 719 970 970 303 303 720 970 719 970 719 ...
## $ Date : POSIXct[1:4248], format: "2012-01-01" "2012-01-01" ...
## $ Market : chr [1:4248] "Central" "Central" "Central" "Central" ...
## $ Market Size : chr [1:4248] "Major Market" "Major Market" "Major Market" "Major Market" ...
## $ Product : chr [1:4248] "Amaretto" "Colombian" "Decaf Irish Cream" "Green Tea" ...
## $ Product Line : chr [1:4248] "Beans" "Beans" "Beans" "Leaves" ...
## $ Product Type : chr [1:4248] "Coffee" "Coffee" "Coffee" "Tea" ...
## $ State : chr [1:4248] "Colorado" "Colorado" "Colorado" "Colorado" ...
## $ Type : chr [1:4248] "Regular" "Regular" "Decaf" "Regular" ...
## $ Budget COGS : num [1:4248] 90 80 100 30 60 80 140 50 50 40 ...
## $ Budget Margin : num [1:4248] 130 110 140 50 90 130 160 80 70 70 ...
## $ Budget Profit : num [1:4248] 100 80 110 30 70 80 110 20 40 20 ...
## $ Budget Sales : num [1:4248] 220 190 240 80 150 210 300 130 120 110 ...
## $ COGS : num [1:4248] 89 83 95 44 54 72 170 63 60 58 ...
## $ Inventory : num [1:4248] 777 623 821 623 456 ...
## $ Margin : num [1:4248] 130 107 139 56 80 108 171 87 80 72 ...
## $ Marketing : num [1:4248] 24 27 26 14 15 23 47 57 19 22 ...
## $ Profit : num [1:4248] 94 68 101 30 54 53 99 0 33 17 ...
## $ Sales : num [1:4248] 219 190 234 100 134 180 341 150 140 130 ...
## $ Total Expenses: num [1:4248] 36 39 38 26 26 55 72 87 47 55 ...
summary(data)
## Area Code Date Market
## Min. :203.0 Min. :2012-01-01 00:00:00 Length:4248
## 1st Qu.:417.0 1st Qu.:2012-06-23 12:00:00 Class :character
## Median :573.0 Median :2012-12-16 12:00:00 Mode :character
## Mean :582.3 Mean :2012-12-15 22:00:00
## 3rd Qu.:772.0 3rd Qu.:2013-06-08 12:00:00
## Max. :985.0 Max. :2013-12-01 00:00:00
## Market Size Product Product Line Product Type
## Length:4248 Length:4248 Length:4248 Length:4248
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## State Type Budget COGS Budget Margin
## Length:4248 Length:4248 Min. : 0.00 Min. :-210.0
## Class :character Class :character 1st Qu.: 30.00 1st Qu.: 50.0
## Mode :character Mode :character Median : 50.00 Median : 70.0
## Mean : 74.83 Mean : 100.8
## 3rd Qu.: 90.00 3rd Qu.: 130.0
## Max. :450.00 Max. : 690.0
## Budget Profit Budget Sales COGS Inventory
## Min. :-320.00 Min. : 0.0 Min. : 0.00 Min. :-3534.0
## 1st Qu.: 20.00 1st Qu.: 80.0 1st Qu.: 43.00 1st Qu.: 432.0
## Median : 40.00 Median : 130.0 Median : 60.00 Median : 619.0
## Mean : 60.91 Mean : 175.6 Mean : 84.43 Mean : 749.4
## 3rd Qu.: 80.00 3rd Qu.: 210.0 3rd Qu.:100.00 3rd Qu.: 910.5
## Max. : 560.00 Max. :1140.0 Max. :364.00 Max. : 8252.0
## Margin Marketing Profit Sales
## Min. :-302.00 Min. : 0.00 Min. :-638.0 Min. : 17
## 1st Qu.: 52.75 1st Qu.: 13.00 1st Qu.: 17.0 1st Qu.:100
## Median : 76.00 Median : 22.00 Median : 40.0 Median :138
## Mean : 104.29 Mean : 31.19 Mean : 61.1 Mean :193
## 3rd Qu.: 132.00 3rd Qu.: 39.00 3rd Qu.: 92.0 3rd Qu.:230
## Max. : 613.00 Max. :156.00 Max. : 778.0 Max. :912
## Total Expenses
## Min. : 10.00
## 1st Qu.: 33.00
## Median : 46.00
## Mean : 54.06
## 3rd Qu.: 65.00
## Max. :190.00
# analisis
produk_sales <- data %>%
group_by(Product) %>%
summarise(Total_Budget = sum(`Budget Sales`, na.rm = TRUE)) %>%
arrange(desc(Total_Budget))
produk_sales
## # A tibble: 13 × 2
## Product Total_Budget
## <chr> <dbl>
## 1 Colombian 134380
## 2 Caffe Mocha 84600
## 3 Lemon 78300
## 4 Decaf Espresso 75720
## 5 Decaf Irish Cream 67040
## 6 Chamomile 63840
## 7 Darjeeling 57360
## 8 Earl Grey 50900
## 9 Caffe Latte 30540
## 10 Mint 28320
## 11 Amaretto 27200
## 12 Green Tea 25340
## 13 Regular Espresso 22620
Pada hasil syntax di atas, hal yang dilakukan adalah mengelompokkan jenis produk menjadi satu grup dengan syntax group_by(), sehingga setelah target penjualan setiap jenis produk yang sama di jumlahkan, maka akan mendapatkan total jumlah dari target penjualan setiap jenis produk, dan mengurutkannya dari yang terbesar ke terkecil dengan fungsi arrange(desc()). Sehingga, sebagai hasil yang di dapatkan adalah bahwa jenis produk dengan target penjualan tertinggi adalah produk yang menjadi fokus utama perusahaan dalam pemasaran dan distribusi, yang menampilkan produk yang paling dominan di pasaran, sehingga dapat mengambil suatu insight produk mana yang paling potensial.
Visualisasi dari data tersebut akan memberikan informasi secara ringkas dan kemudahan mengenai hasil eksplorasi dan analisis yang di lakukan.
ggplot(produk_sales, aes(x = reorder(Product, Total_Budget), y = Total_Budget)) +
geom_col() +
coord_flip() +
labs(
title = "Perbandingan Budget Sales per Produk",
x = "Produk",
y = "Total Budget Sales"
)+
scale_y_continuous(
breaks = seq(0, 150000, by = 25000),
labels = label_number(big.mark = ".", decimal.mark = ",")
)
Untuk Visualisasi, dapat dilihat pada syntax di atas dimana menggunakan
package ggplot2 dan menambahkan interval tiap angka total budget sales,
yaitu dari 0 sampai 150.000, dengan jarak atau besar tiap nilai di dalam
interval sebesar 25.000 untuk memberikan informasi visual yang lebih
detail dan informatif dengan adanya standar angka untuk mendapatkan
informasi jumlah total budget sales tiap produk secara visual. Pada
visualisasi ini juga ditambahkan fungsi labels untuk membuat angka atau
jumlah total budget sales tidak hanya menjadi semacam angka mentah,
tetapi ada pemisah tiap digitnya dimana untuk angka besar sampai ribuan
menggunakan titik untuk memisahkan tiap digitnya, dan koma untuk angka
yang desimal agar sisem r “tidak bingung” dalam membaca syntax
visualisasi nya.
Melalui analisis yang dilakukan dengan melakukan eksplorasi dan visualisasi, pada laporan ini, diharapkan dapat menjadi perhatian mengenai produk yang di jadikan fokus utama di pasaran dan menjadi produk unggulan yang paling berpotensial, dan produk mana yang perlu untuk ditingkatkan, serta dapat menjadi dasar strategi untuk pengembangan produk di pasaran.
Visualisasi yang diberikan juga memberikan kemudahan informasi dalam mendapatkan informasi yang diperlukan mengenai produk mana yang paling berkontribusi terhadap perusahaan, dan bagi masyarakat awam, dapat menjadi kemudahan pemberian informasi mengenai produk yang paling unggul di pasaran yang menunjukkan produk mana yang paling berpotensi, sehingga yang dapat melihat bahwa produk itulah yang paling menjanjikan di pasaran daripada produk lainnya.
Berdasarkan hasil eksplorasi dan visualisasi data, dapat disimpulkan bahwa eksplorasi data membantu dalam memahami struktur, kondisi, dan karakteristik dari dataset yang ingin ditampilkan seperti apa sesuai dengan tujuan “insight” nya. Sementara itu, visualisasi data mempermudah dalam melihat pola, perbandingan, serta distribusi antar kategori atau produk secara lebih jelas. Secara keseluruhan, kedua proses ini sangat penting untuk mendukung analisis dan pengambilan keputusan berbasis data.