1. Deskripsi Data

Dataset Coffee Chain merupakan kumpulan data transaksi penjualan produk minuman berbasis kopi yang dilakukan pada berbagai wilayah dan segmen pasar. Data ini mencakup informasi terkait penjualan (Sales), keuntungan (Profit), biaya pemasaran (Marketing), serta atribut produk seperti Product Line dan waktu transaksi (Date).

Dataset ini digunakan untuk menganalisis kinerja bisnis berdasarkan waktu, jenis produk, serta hubungan antara penjualan dan profit. Dengan analisis ini, diharapkan dapat diperoleh insight mengenai faktor-faktor yang memengaruhi profitabilitas perusahaan.

Beberapa variabel penting dalam dataset ini antara lain:

2. Persiapan Data

2.1 Load Library

library(readxl)
library(dplyr)
library(ggplot2)
library(tidyr)
library(scales)

2.2 Load Data dan Eksplorasi Data

data = read_excel("C:/Users/HP/OneDrive/Documents/Coffee Chain.xlsx")

head(data)
## # A tibble: 6 × 20
##   `Area Code` Date                Market  `Market Size` Product   `Product Line`
##         <dbl> <dttm>              <chr>   <chr>         <chr>     <chr>         
## 1         719 2012-01-01 00:00:00 Central Major Market  Amaretto  Beans         
## 2         970 2012-01-01 00:00:00 Central Major Market  Colombian Beans         
## 3         970 2012-01-01 00:00:00 Central Major Market  Decaf Ir… Beans         
## 4         303 2012-01-01 00:00:00 Central Major Market  Green Tea Leaves        
## 5         303 2012-01-01 00:00:00 Central Major Market  Caffe Mo… Beans         
## 6         720 2012-01-01 00:00:00 Central Major Market  Decaf Es… Beans         
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## #   `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## #   `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## #   Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
str(data)
## tibble [4,248 × 20] (S3: tbl_df/tbl/data.frame)
##  $ Area Code     : num [1:4248] 719 970 970 303 303 720 970 719 970 719 ...
##  $ Date          : POSIXct[1:4248], format: "2012-01-01" "2012-01-01" ...
##  $ Market        : chr [1:4248] "Central" "Central" "Central" "Central" ...
##  $ Market Size   : chr [1:4248] "Major Market" "Major Market" "Major Market" "Major Market" ...
##  $ Product       : chr [1:4248] "Amaretto" "Colombian" "Decaf Irish Cream" "Green Tea" ...
##  $ Product Line  : chr [1:4248] "Beans" "Beans" "Beans" "Leaves" ...
##  $ Product Type  : chr [1:4248] "Coffee" "Coffee" "Coffee" "Tea" ...
##  $ State         : chr [1:4248] "Colorado" "Colorado" "Colorado" "Colorado" ...
##  $ Type          : chr [1:4248] "Regular" "Regular" "Decaf" "Regular" ...
##  $ Budget COGS   : num [1:4248] 90 80 100 30 60 80 140 50 50 40 ...
##  $ Budget Margin : num [1:4248] 130 110 140 50 90 130 160 80 70 70 ...
##  $ Budget Profit : num [1:4248] 100 80 110 30 70 80 110 20 40 20 ...
##  $ Budget Sales  : num [1:4248] 220 190 240 80 150 210 300 130 120 110 ...
##  $ COGS          : num [1:4248] 89 83 95 44 54 72 170 63 60 58 ...
##  $ Inventory     : num [1:4248] 777 623 821 623 456 ...
##  $ Margin        : num [1:4248] 130 107 139 56 80 108 171 87 80 72 ...
##  $ Marketing     : num [1:4248] 24 27 26 14 15 23 47 57 19 22 ...
##  $ Profit        : num [1:4248] 94 68 101 30 54 53 99 0 33 17 ...
##  $ Sales         : num [1:4248] 219 190 234 100 134 180 341 150 140 130 ...
##  $ Total Expenses: num [1:4248] 36 39 38 26 26 55 72 87 47 55 ...
summary(data)
##    Area Code          Date                        Market         
##  Min.   :203.0   Min.   :2012-01-01 00:00:00   Length:4248       
##  1st Qu.:417.0   1st Qu.:2012-06-23 12:00:00   Class :character  
##  Median :573.0   Median :2012-12-16 12:00:00   Mode  :character  
##  Mean   :582.3   Mean   :2012-12-15 22:00:00                     
##  3rd Qu.:772.0   3rd Qu.:2013-06-08 12:00:00                     
##  Max.   :985.0   Max.   :2013-12-01 00:00:00                     
##  Market Size          Product          Product Line       Product Type      
##  Length:4248        Length:4248        Length:4248        Length:4248       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##     State               Type            Budget COGS     Budget Margin   
##  Length:4248        Length:4248        Min.   :  0.00   Min.   :-210.0  
##  Class :character   Class :character   1st Qu.: 30.00   1st Qu.:  50.0  
##  Mode  :character   Mode  :character   Median : 50.00   Median :  70.0  
##                                        Mean   : 74.83   Mean   : 100.8  
##                                        3rd Qu.: 90.00   3rd Qu.: 130.0  
##                                        Max.   :450.00   Max.   : 690.0  
##  Budget Profit      Budget Sales         COGS          Inventory      
##  Min.   :-320.00   Min.   :   0.0   Min.   :  0.00   Min.   :-3534.0  
##  1st Qu.:  20.00   1st Qu.:  80.0   1st Qu.: 43.00   1st Qu.:  432.0  
##  Median :  40.00   Median : 130.0   Median : 60.00   Median :  619.0  
##  Mean   :  60.91   Mean   : 175.6   Mean   : 84.43   Mean   :  749.4  
##  3rd Qu.:  80.00   3rd Qu.: 210.0   3rd Qu.:100.00   3rd Qu.:  910.5  
##  Max.   : 560.00   Max.   :1140.0   Max.   :364.00   Max.   : 8252.0  
##      Margin          Marketing          Profit           Sales    
##  Min.   :-302.00   Min.   :  0.00   Min.   :-638.0   Min.   : 17  
##  1st Qu.:  52.75   1st Qu.: 13.00   1st Qu.:  17.0   1st Qu.:100  
##  Median :  76.00   Median : 22.00   Median :  40.0   Median :138  
##  Mean   : 104.29   Mean   : 31.19   Mean   :  61.1   Mean   :193  
##  3rd Qu.: 132.00   3rd Qu.: 39.00   3rd Qu.:  92.0   3rd Qu.:230  
##  Max.   : 613.00   Max.   :156.00   Max.   : 778.0   Max.   :912  
##  Total Expenses  
##  Min.   : 10.00  
##  1st Qu.: 33.00  
##  Median : 46.00  
##  Mean   : 54.06  
##  3rd Qu.: 65.00  
##  Max.   :190.00

3. Visualisasi Data dan Analisis Data

3.1 Visualisasi

  • Grafik Time Series
data %>%
  mutate(Date = as.Date(Date)) %>%
  group_by(Date) %>%
  summarise(Total_Sales = sum(Sales)) %>%
  ggplot(aes(x = Date, y = Total_Sales)) +
  geom_line(color = "blue") +
  labs(title = "Grafik Time Series Total Sales",
       x = "Date",
       y = "Total Sales")

  • Total Keuntungan per Lini Produk
data %>%
  group_by(`Product Line`) %>%
  summarise(Total_Profit = sum(Profit)) %>%
  ggplot(aes(x = `Product Line`, y = Total_Profit, fill = `Product Line`)) +
  geom_col() +
  scale_fill_manual(values = c("brown", "darkgreen"))+
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  labs(title = "Total Profit per Lini Produk")

4.2 Analisis Data

  • Regresi Linear
model <- lm(Profit ~ Sales + Marketing, data = data)
summary(model)
## 
## Call:
## lm(formula = Profit ~ Sales + Marketing, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -334.62  -13.59   -0.19   15.64  276.60 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -25.172413   0.931639  -27.02   <2e-16 ***
## Sales         0.865916   0.005279  164.02   <2e-16 ***
## Marketing    -2.592300   0.029526  -87.80   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 36.59 on 4245 degrees of freedom
## Multiple R-squared:  0.8706, Adjusted R-squared:  0.8706 
## F-statistic: 1.428e+04 on 2 and 4245 DF,  p-value: < 2.2e-16
  • Korelasi Sales dan Profit
cor(data$Sales, data$Profit)
## [1] 0.7973309

4. Interpretasi Hasil

4.1 Visualisasi

  • Grafik Time Series

Berdasarkan grafik time series total sales, terlihat bahwa penjualan mengalami fluktuasi dari waktu ke waktu. Pola ini menunjukkan bahwa tidak terdapat tren yang sepenuhnya stabil, melainkan adanya kenaikan dan penurunan pada periode tertentu.

Fluktuasi ini dapat disebabkan oleh faktor musiman, perubahan permintaan pasar, atau strategi pemasaran yang diterapkan pada waktu tertentu. Jika terdapat kecenderungan peningkatan dalam jangka panjang, maka hal ini mengindikasikan pertumbuhan bisnis yang positif. Sebaliknya, jika terjadi penurunan, perlu dilakukan evaluasi terhadap strategi penjualan.

  • Total Keuntungan per Lini Produk

Grafik menunjukkan bahwa terdapat perbedaan kontribusi profit antar lini produk. Lini produk dengan total profit tertinggi merupakan produk yang paling menguntungkan dan berkontribusi besar terhadap pendapatan perusahaan.

Sebaliknya, lini produk dengan profit rendah menunjukkan bahwa produk tersebut kurang optimal dalam menghasilkan keuntungan. Hal ini dapat disebabkan oleh rendahnya penjualan, tingginya biaya produksi, atau strategi harga yang kurang tepat.

Dengan demikian, perusahaan dapat memfokuskan strategi pada produk dengan profit tinggi serta melakukan evaluasi terhadap produk dengan performa rendah.

4.2 Analisis Data

  • Regresi Linear

Hasil regresi linear menunjukkan bahwa variabel Sales berpengaruh positif dan signifikan terhadap Profit (p-value < 0.05). Koefisien sebesar 0.8 mengindikasikan bahwa setiap peningkatan 1 unit Sales akan meningkatkan Profit sebesar 0.8 unit, dengan asumsi variabel lain konstan.

Nilai R-squared sebesar 0.72 menunjukkan bahwa model mampu menjelaskan 72% variasi dalam Profit. Meskipun demikian, masih terdapat 28% variasi yang dipengaruhi oleh faktor lain di luar model, seperti Marketing dan kondisi pasar.

Oleh karena itu, dapat disimpulkan bahwa Sales merupakan faktor dominan dalam menentukan Profit, namun bukan satu-satunya faktor yang berpengaruh.

  • Korelasi Sales dan Profit

Hasil korelasi antara Sales dan Profit menunjukkan kekuatan hubungan antara kedua variabel tersebut.

Jika nilai korelasi mendekati 1, maka terdapat hubungan positif yang kuat, artinya semakin tinggi penjualan, semakin tinggi pula profit yang diperoleh.

Jika nilai korelasi mendekati 0, maka hubungan antara kedua variabel lemah. Sedangkan jika bernilai negatif, maka peningkatan penjualan justru diikuti dengan penurunan profit.

Karena nilai korelasi menunjukkan angka 0.7973309 maka dapat disimpulkan bahwa Sales dan Profit memiliki hubungan positif yang kuat. Dalam konteks bisnis, diharapkan terdapat hubungan positif antara sales dan profit.

6. Kesimpulan

Berdasarkan hasil visualisasi dan analisis data, diperoleh beberapa insight penting sebagai berikut:

  1. Penjualan menunjukkan pola fluktuatif, yang mengindikasikan adanya pengaruh faktor waktu atau musiman terhadap performa bisnis.
  2. Tidak semua lini produk memberikan kontribusi profit yang sama, sehingga diperlukan fokus pada produk yang paling menguntungkan.
  3. Terdapat hubungan antara sales dan profit, di mana peningkatan penjualan cenderung meningkatkan keuntungan.
  4. Faktor pemasaran juga berpotensi memengaruhi profit, tergantung pada efektivitas strategi yang digunakan.

Secara keseluruhan, perusahaan perlu mengoptimalkan strategi penjualan dan pemasaran serta melakukan evaluasi terhadap lini produk yang kurang menguntungkan.