Dataset Coffee Chain merupakan kumpulan data transaksi penjualan produk minuman berbasis kopi yang dilakukan pada berbagai wilayah dan segmen pasar. Data ini mencakup informasi terkait penjualan (Sales), keuntungan (Profit), biaya pemasaran (Marketing), serta atribut produk seperti Product Line dan waktu transaksi (Date).
Dataset ini digunakan untuk menganalisis kinerja bisnis berdasarkan waktu, jenis produk, serta hubungan antara penjualan dan profit. Dengan analisis ini, diharapkan dapat diperoleh insight mengenai faktor-faktor yang memengaruhi profitabilitas perusahaan.
Beberapa variabel penting dalam dataset ini antara lain:
Sales: Total penjualan
Profit: Keuntungan yang diperoleh
Marketing: Biaya pemasaran
Product Line: Kategori produk
Date: Waktu transaksi
library(readxl)
library(dplyr)
library(ggplot2)
library(tidyr)
library(scales)
data = read_excel("C:/Users/HP/OneDrive/Documents/Coffee Chain.xlsx")
head(data)
## # A tibble: 6 × 20
## `Area Code` Date Market `Market Size` Product `Product Line`
## <dbl> <dttm> <chr> <chr> <chr> <chr>
## 1 719 2012-01-01 00:00:00 Central Major Market Amaretto Beans
## 2 970 2012-01-01 00:00:00 Central Major Market Colombian Beans
## 3 970 2012-01-01 00:00:00 Central Major Market Decaf Ir… Beans
## 4 303 2012-01-01 00:00:00 Central Major Market Green Tea Leaves
## 5 303 2012-01-01 00:00:00 Central Major Market Caffe Mo… Beans
## 6 720 2012-01-01 00:00:00 Central Major Market Decaf Es… Beans
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## # `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## # `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## # Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
str(data)
## tibble [4,248 × 20] (S3: tbl_df/tbl/data.frame)
## $ Area Code : num [1:4248] 719 970 970 303 303 720 970 719 970 719 ...
## $ Date : POSIXct[1:4248], format: "2012-01-01" "2012-01-01" ...
## $ Market : chr [1:4248] "Central" "Central" "Central" "Central" ...
## $ Market Size : chr [1:4248] "Major Market" "Major Market" "Major Market" "Major Market" ...
## $ Product : chr [1:4248] "Amaretto" "Colombian" "Decaf Irish Cream" "Green Tea" ...
## $ Product Line : chr [1:4248] "Beans" "Beans" "Beans" "Leaves" ...
## $ Product Type : chr [1:4248] "Coffee" "Coffee" "Coffee" "Tea" ...
## $ State : chr [1:4248] "Colorado" "Colorado" "Colorado" "Colorado" ...
## $ Type : chr [1:4248] "Regular" "Regular" "Decaf" "Regular" ...
## $ Budget COGS : num [1:4248] 90 80 100 30 60 80 140 50 50 40 ...
## $ Budget Margin : num [1:4248] 130 110 140 50 90 130 160 80 70 70 ...
## $ Budget Profit : num [1:4248] 100 80 110 30 70 80 110 20 40 20 ...
## $ Budget Sales : num [1:4248] 220 190 240 80 150 210 300 130 120 110 ...
## $ COGS : num [1:4248] 89 83 95 44 54 72 170 63 60 58 ...
## $ Inventory : num [1:4248] 777 623 821 623 456 ...
## $ Margin : num [1:4248] 130 107 139 56 80 108 171 87 80 72 ...
## $ Marketing : num [1:4248] 24 27 26 14 15 23 47 57 19 22 ...
## $ Profit : num [1:4248] 94 68 101 30 54 53 99 0 33 17 ...
## $ Sales : num [1:4248] 219 190 234 100 134 180 341 150 140 130 ...
## $ Total Expenses: num [1:4248] 36 39 38 26 26 55 72 87 47 55 ...
summary(data)
## Area Code Date Market
## Min. :203.0 Min. :2012-01-01 00:00:00 Length:4248
## 1st Qu.:417.0 1st Qu.:2012-06-23 12:00:00 Class :character
## Median :573.0 Median :2012-12-16 12:00:00 Mode :character
## Mean :582.3 Mean :2012-12-15 22:00:00
## 3rd Qu.:772.0 3rd Qu.:2013-06-08 12:00:00
## Max. :985.0 Max. :2013-12-01 00:00:00
## Market Size Product Product Line Product Type
## Length:4248 Length:4248 Length:4248 Length:4248
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## State Type Budget COGS Budget Margin
## Length:4248 Length:4248 Min. : 0.00 Min. :-210.0
## Class :character Class :character 1st Qu.: 30.00 1st Qu.: 50.0
## Mode :character Mode :character Median : 50.00 Median : 70.0
## Mean : 74.83 Mean : 100.8
## 3rd Qu.: 90.00 3rd Qu.: 130.0
## Max. :450.00 Max. : 690.0
## Budget Profit Budget Sales COGS Inventory
## Min. :-320.00 Min. : 0.0 Min. : 0.00 Min. :-3534.0
## 1st Qu.: 20.00 1st Qu.: 80.0 1st Qu.: 43.00 1st Qu.: 432.0
## Median : 40.00 Median : 130.0 Median : 60.00 Median : 619.0
## Mean : 60.91 Mean : 175.6 Mean : 84.43 Mean : 749.4
## 3rd Qu.: 80.00 3rd Qu.: 210.0 3rd Qu.:100.00 3rd Qu.: 910.5
## Max. : 560.00 Max. :1140.0 Max. :364.00 Max. : 8252.0
## Margin Marketing Profit Sales
## Min. :-302.00 Min. : 0.00 Min. :-638.0 Min. : 17
## 1st Qu.: 52.75 1st Qu.: 13.00 1st Qu.: 17.0 1st Qu.:100
## Median : 76.00 Median : 22.00 Median : 40.0 Median :138
## Mean : 104.29 Mean : 31.19 Mean : 61.1 Mean :193
## 3rd Qu.: 132.00 3rd Qu.: 39.00 3rd Qu.: 92.0 3rd Qu.:230
## Max. : 613.00 Max. :156.00 Max. : 778.0 Max. :912
## Total Expenses
## Min. : 10.00
## 1st Qu.: 33.00
## Median : 46.00
## Mean : 54.06
## 3rd Qu.: 65.00
## Max. :190.00
data %>%
mutate(Date = as.Date(Date)) %>%
group_by(Date) %>%
summarise(Total_Sales = sum(Sales)) %>%
ggplot(aes(x = Date, y = Total_Sales)) +
geom_line(color = "blue") +
labs(title = "Grafik Time Series Total Sales",
x = "Date",
y = "Total Sales")
data %>%
group_by(`Product Line`) %>%
summarise(Total_Profit = sum(Profit)) %>%
ggplot(aes(x = `Product Line`, y = Total_Profit, fill = `Product Line`)) +
geom_col() +
scale_fill_manual(values = c("brown", "darkgreen"))+
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
labs(title = "Total Profit per Lini Produk")
model <- lm(Profit ~ Sales + Marketing, data = data)
summary(model)
##
## Call:
## lm(formula = Profit ~ Sales + Marketing, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -334.62 -13.59 -0.19 15.64 276.60
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -25.172413 0.931639 -27.02 <2e-16 ***
## Sales 0.865916 0.005279 164.02 <2e-16 ***
## Marketing -2.592300 0.029526 -87.80 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 36.59 on 4245 degrees of freedom
## Multiple R-squared: 0.8706, Adjusted R-squared: 0.8706
## F-statistic: 1.428e+04 on 2 and 4245 DF, p-value: < 2.2e-16
cor(data$Sales, data$Profit)
## [1] 0.7973309
Berdasarkan grafik time series total sales, terlihat bahwa penjualan mengalami fluktuasi dari waktu ke waktu. Pola ini menunjukkan bahwa tidak terdapat tren yang sepenuhnya stabil, melainkan adanya kenaikan dan penurunan pada periode tertentu.
Fluktuasi ini dapat disebabkan oleh faktor musiman, perubahan permintaan pasar, atau strategi pemasaran yang diterapkan pada waktu tertentu. Jika terdapat kecenderungan peningkatan dalam jangka panjang, maka hal ini mengindikasikan pertumbuhan bisnis yang positif. Sebaliknya, jika terjadi penurunan, perlu dilakukan evaluasi terhadap strategi penjualan.
Grafik menunjukkan bahwa terdapat perbedaan kontribusi profit antar lini produk. Lini produk dengan total profit tertinggi merupakan produk yang paling menguntungkan dan berkontribusi besar terhadap pendapatan perusahaan.
Sebaliknya, lini produk dengan profit rendah menunjukkan bahwa produk tersebut kurang optimal dalam menghasilkan keuntungan. Hal ini dapat disebabkan oleh rendahnya penjualan, tingginya biaya produksi, atau strategi harga yang kurang tepat.
Dengan demikian, perusahaan dapat memfokuskan strategi pada produk dengan profit tinggi serta melakukan evaluasi terhadap produk dengan performa rendah.
Hasil regresi linear menunjukkan bahwa variabel Sales berpengaruh positif dan signifikan terhadap Profit (p-value < 0.05). Koefisien sebesar 0.8 mengindikasikan bahwa setiap peningkatan 1 unit Sales akan meningkatkan Profit sebesar 0.8 unit, dengan asumsi variabel lain konstan.
Nilai R-squared sebesar 0.72 menunjukkan bahwa model mampu menjelaskan 72% variasi dalam Profit. Meskipun demikian, masih terdapat 28% variasi yang dipengaruhi oleh faktor lain di luar model, seperti Marketing dan kondisi pasar.
Oleh karena itu, dapat disimpulkan bahwa Sales merupakan faktor dominan dalam menentukan Profit, namun bukan satu-satunya faktor yang berpengaruh.
Hasil korelasi antara Sales dan Profit menunjukkan kekuatan hubungan antara kedua variabel tersebut.
Jika nilai korelasi mendekati 1, maka terdapat hubungan positif yang kuat, artinya semakin tinggi penjualan, semakin tinggi pula profit yang diperoleh.
Jika nilai korelasi mendekati 0, maka hubungan antara kedua variabel lemah. Sedangkan jika bernilai negatif, maka peningkatan penjualan justru diikuti dengan penurunan profit.
Karena nilai korelasi menunjukkan angka 0.7973309 maka dapat disimpulkan bahwa Sales dan Profit memiliki hubungan positif yang kuat. Dalam konteks bisnis, diharapkan terdapat hubungan positif antara sales dan profit.
Berdasarkan hasil visualisasi dan analisis data, diperoleh beberapa insight penting sebagai berikut:
Secara keseluruhan, perusahaan perlu mengoptimalkan strategi penjualan dan pemasaran serta melakukan evaluasi terhadap lini produk yang kurang menguntungkan.