#Memuat paket yang di perlukan untuk impor datasets .xlsx dan visualisasi
library(readxl)
library(ggplot2)
library(scales)
library(dplyr)

Pendahuluan

Pada laporan ini dilakukan proses analisis data menggunakan RStudio dengan format R Markdown. Data yang digunakan berasal dari file Excel (.xlsx). Tahapan yang dilakukan meliputi proses impor data, eksplorasi dan analisis, visualisasi data, serta interpretasi hasil.

Deskripsi “Insight” dari Coffee Chain Datasets

“Insight” yang diambil dari Coffee Chain Datasets adalah perbandingan total target penjualan(Budget Sales) dari setiap jenis produk yang ada. variabel yang digunakan dalam menampilkan “insight” ini tentunya adalah kolom produk yang berisi setiap jenis produk dan kolom Target Penjualan(Budget Sales) yang berisi target hasil profit yang diharapkan, sehingga hasil dari “insight” yang didapatkan adalah dapat mengetahui jenis produk apa yang paling mengusai pasar, yang paling mendominasi di pasaran, atau yang paling diunggulkan. Hasilnya, dapat menjadi dasar informasi dan strategi pemasaran produk, dan dasar informasi produk mana yang paling menjanjikan atau dapat dikatakan yang paling berpotensi memberikan kepuasan tertinggi bagi konsumen di pasaran.

Impor Data Berbentuk .xlxs Menggunakan Fungsi read_excel(“nama_file.xlsx”)

data <- read_excel("D:/Tugas SIM 2025B - Coffee Chain Datasets.xlsx")

Setelah data .xlsx tersebut berhasil di impor ke dalam r, maka langkah analisis selanjutnya adalah melakukan eksplorasi data. Pada analisis data berikut, eksplorasi yang dilakukan adalah mengambil “insight” mengenai perbandingan antara budget sales, yaitu target penjualan dengan produk yang ada.

Analisis dan Eksplorasi Data

Menganalisis “insight” yang akan ditampilkan untuk dijadikan dasar informasi bagi pihak yang bersangkutan, baik bagi perusahaan, maupun bagi para konsumen dan masyarakat awam mengenai produk apa yang mendominasi dan paling berpotensial di pasaran dan menghasilkan informasi mengenai produk yang paling di unggulkan, dengan kata lain, produk yang paling menjanjikan di pasaran. Eksplorasi juga dilakukan guna mengetahui struktur dari datasets yang ada. Eksplorasi dilakukan dengan menjalankan fungsi seperti summary(), head(), tail(), str() sehingga memudahkan memahami struktur dan bentuk dari datasets yang ada.

# eksplorasi
head(data)
## # A tibble: 6 × 20
##   `Area Code` Date                Market  `Market Size` Product   `Product Line`
##         <dbl> <dttm>              <chr>   <chr>         <chr>     <chr>         
## 1         719 2012-01-01 00:00:00 Central Major Market  Amaretto  Beans         
## 2         970 2012-01-01 00:00:00 Central Major Market  Colombian Beans         
## 3         970 2012-01-01 00:00:00 Central Major Market  Decaf Ir… Beans         
## 4         303 2012-01-01 00:00:00 Central Major Market  Green Tea Leaves        
## 5         303 2012-01-01 00:00:00 Central Major Market  Caffe Mo… Beans         
## 6         720 2012-01-01 00:00:00 Central Major Market  Decaf Es… Beans         
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## #   `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## #   `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## #   Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
tail(data)
## # A tibble: 6 × 20
##   `Area Code` Date                Market `Market Size` Product    `Product Line`
##         <dbl> <dttm>              <chr>  <chr>         <chr>      <chr>         
## 1         425 2013-12-01 00:00:00 West   Small Market  Lemon      Leaves        
## 2         206 2013-12-01 00:00:00 West   Small Market  Caffe Lat… Beans         
## 3         509 2013-12-01 00:00:00 West   Small Market  Caffe Moc… Beans         
## 4         360 2013-12-01 00:00:00 West   Small Market  Decaf Esp… Beans         
## 5         360 2013-12-01 00:00:00 West   Small Market  Colombian  Beans         
## 6         206 2013-12-01 00:00:00 West   Small Market  Decaf Iri… Beans         
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## #   `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## #   `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## #   Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
str(data)
## tibble [4,248 × 20] (S3: tbl_df/tbl/data.frame)
##  $ Area Code     : num [1:4248] 719 970 970 303 303 720 970 719 970 719 ...
##  $ Date          : POSIXct[1:4248], format: "2012-01-01" "2012-01-01" ...
##  $ Market        : chr [1:4248] "Central" "Central" "Central" "Central" ...
##  $ Market Size   : chr [1:4248] "Major Market" "Major Market" "Major Market" "Major Market" ...
##  $ Product       : chr [1:4248] "Amaretto" "Colombian" "Decaf Irish Cream" "Green Tea" ...
##  $ Product Line  : chr [1:4248] "Beans" "Beans" "Beans" "Leaves" ...
##  $ Product Type  : chr [1:4248] "Coffee" "Coffee" "Coffee" "Tea" ...
##  $ State         : chr [1:4248] "Colorado" "Colorado" "Colorado" "Colorado" ...
##  $ Type          : chr [1:4248] "Regular" "Regular" "Decaf" "Regular" ...
##  $ Budget COGS   : num [1:4248] 90 80 100 30 60 80 140 50 50 40 ...
##  $ Budget Margin : num [1:4248] 130 110 140 50 90 130 160 80 70 70 ...
##  $ Budget Profit : num [1:4248] 100 80 110 30 70 80 110 20 40 20 ...
##  $ Budget Sales  : num [1:4248] 220 190 240 80 150 210 300 130 120 110 ...
##  $ COGS          : num [1:4248] 89 83 95 44 54 72 170 63 60 58 ...
##  $ Inventory     : num [1:4248] 777 623 821 623 456 ...
##  $ Margin        : num [1:4248] 130 107 139 56 80 108 171 87 80 72 ...
##  $ Marketing     : num [1:4248] 24 27 26 14 15 23 47 57 19 22 ...
##  $ Profit        : num [1:4248] 94 68 101 30 54 53 99 0 33 17 ...
##  $ Sales         : num [1:4248] 219 190 234 100 134 180 341 150 140 130 ...
##  $ Total Expenses: num [1:4248] 36 39 38 26 26 55 72 87 47 55 ...
summary(data)
##    Area Code          Date                        Market         
##  Min.   :203.0   Min.   :2012-01-01 00:00:00   Length:4248       
##  1st Qu.:417.0   1st Qu.:2012-06-23 12:00:00   Class :character  
##  Median :573.0   Median :2012-12-16 12:00:00   Mode  :character  
##  Mean   :582.3   Mean   :2012-12-15 22:00:00                     
##  3rd Qu.:772.0   3rd Qu.:2013-06-08 12:00:00                     
##  Max.   :985.0   Max.   :2013-12-01 00:00:00                     
##  Market Size          Product          Product Line       Product Type      
##  Length:4248        Length:4248        Length:4248        Length:4248       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##     State               Type            Budget COGS     Budget Margin   
##  Length:4248        Length:4248        Min.   :  0.00   Min.   :-210.0  
##  Class :character   Class :character   1st Qu.: 30.00   1st Qu.:  50.0  
##  Mode  :character   Mode  :character   Median : 50.00   Median :  70.0  
##                                        Mean   : 74.83   Mean   : 100.8  
##                                        3rd Qu.: 90.00   3rd Qu.: 130.0  
##                                        Max.   :450.00   Max.   : 690.0  
##  Budget Profit      Budget Sales         COGS          Inventory      
##  Min.   :-320.00   Min.   :   0.0   Min.   :  0.00   Min.   :-3534.0  
##  1st Qu.:  20.00   1st Qu.:  80.0   1st Qu.: 43.00   1st Qu.:  432.0  
##  Median :  40.00   Median : 130.0   Median : 60.00   Median :  619.0  
##  Mean   :  60.91   Mean   : 175.6   Mean   : 84.43   Mean   :  749.4  
##  3rd Qu.:  80.00   3rd Qu.: 210.0   3rd Qu.:100.00   3rd Qu.:  910.5  
##  Max.   : 560.00   Max.   :1140.0   Max.   :364.00   Max.   : 8252.0  
##      Margin          Marketing          Profit           Sales    
##  Min.   :-302.00   Min.   :  0.00   Min.   :-638.0   Min.   : 17  
##  1st Qu.:  52.75   1st Qu.: 13.00   1st Qu.:  17.0   1st Qu.:100  
##  Median :  76.00   Median : 22.00   Median :  40.0   Median :138  
##  Mean   : 104.29   Mean   : 31.19   Mean   :  61.1   Mean   :193  
##  3rd Qu.: 132.00   3rd Qu.: 39.00   3rd Qu.:  92.0   3rd Qu.:230  
##  Max.   : 613.00   Max.   :156.00   Max.   : 778.0   Max.   :912  
##  Total Expenses  
##  Min.   : 10.00  
##  1st Qu.: 33.00  
##  Median : 46.00  
##  Mean   : 54.06  
##  3rd Qu.: 65.00  
##  Max.   :190.00
# analisis
produk_sales <- data %>%
  group_by(Product) %>%
  summarise(Total_Budget = sum(`Budget Sales`, na.rm = TRUE)) %>%
  arrange(desc(Total_Budget))

produk_sales
## # A tibble: 13 × 2
##    Product           Total_Budget
##    <chr>                    <dbl>
##  1 Colombian               134380
##  2 Caffe Mocha              84600
##  3 Lemon                    78300
##  4 Decaf Espresso           75720
##  5 Decaf Irish Cream        67040
##  6 Chamomile                63840
##  7 Darjeeling               57360
##  8 Earl Grey                50900
##  9 Caffe Latte              30540
## 10 Mint                     28320
## 11 Amaretto                 27200
## 12 Green Tea                25340
## 13 Regular Espresso         22620

Pada hasil syntax di atas, hal yang dilakukan adalah mengelompokkan jenis produk menjadi satu grup dengan syntax group_by(), sehingga setelah target penjualan setiap jenis produk yang sama di jumlahkan, maka akan mendapatkan total jumlah dari target penjualan setiap jenis produk, dan mengurutkannya dari yang terbesar ke terkecil dengan fungsi arrange(desc()). Sehingga, sebagai hasil yang di dapatkan adalah bahwa jenis produk dengan target penjualan tertinggi adalah produk yang menjadi fokus utama perusahaan dalam pemasaran dan distribusi, yang menampilkan produk yang paling dominan di pasaran, sehingga dapat mengambil suatu insight produk mana yang paling potensial.

Visualisasi Data

Visualisasi dari data tersebut akan memberikan informasi secara ringkas dan kemudahan mengenai hasil eksplorasi dan analisis yang di lakukan.

ggplot(produk_sales, aes(x = reorder(Product, Total_Budget), y = Total_Budget)) +
  geom_col() +
  coord_flip() +
  labs(
    title = "Perbandingan Budget Sales per Produk",
    x = "Produk",
    y = "Total Budget Sales"
  )+
      scale_y_continuous(
    breaks = seq(0, 150000, by = 25000),
    labels = label_number(big.mark = ".", decimal.mark = ",")
  )

Untuk Visualisasi, dapat dilihat pada syntax di atas dimana menggunakan package ggplot2 dan menambahkan interval tiap angka total budget sales, yaitu dari 0 sampai 150.000, dengan jarak atau besar tiap nilai di dalam interval sebesar 25.000 untuk memberikan informasi visual yang lebih detail dan informatif dengan adanya standar angka untuk mendapatkan informasi jumlah total budget sales tiap produk secara visual. Pada visualisasi ini juga ditambahkan fungsi labels untuk membuat angka atau jumlah total budget sales tidak hanya menjadi semacam angka mentah, tetapi ada pemisah tiap digitnya dimana untuk angka besar sampai ribuan menggunakan titik untuk memisahkan tiap digitnya, dan koma untuk angka yang desimal agar sisem r “tidak bingung” dalam membaca syntax visualisasi nya.

Interpretasi

Melalui analisis yang dilakukan dengan melakukan eksplorasi dan visualisasi, pada laporan ini, diharapkan dapat menjadi perhatian mengenai produk yang di jadikan fokus utama di pasaran dan menjadi produk unggulan yang paling berpotensial, dan produk mana yang perlu untuk ditingkatkan, serta dapat menjadi dasar strategi untuk pengembangan produk di pasaran.

Visualisasi yang diberikan juga memberikan kemudahan informasi dalam mendapatkan informasi yang diperlukan mengenai produk mana yang paling berkontribusi terhadap perusahaan, dan bagi masyarakat awam, dapat menjadi kemudahan pemberian informasi mengenai produk yang paling unggul di pasaran yang menunjukkan produk mana yang paling berpotensi, sehingga yang dapat melihat bahwa produk itulah yang paling menjanjikan di pasaran daripada produk lainnya.

Kesimpulan

Berdasarkan hasil eksplorasi dan visualisasi data, dapat disimpulkan bahwa eksplorasi data membantu dalam memahami struktur, kondisi, dan karakteristik dari dataset yang ingin ditampilkan seperti apa sesuai dengan tujuan “insight” nya. Sementara itu, visualisasi data mempermudah dalam melihat pola, perbandingan, serta distribusi antar kategori atau produk secara lebih jelas. Secara keseluruhan, kedua proses ini sangat penting untuk mendukung analisis dan pengambilan keputusan berbasis data.