ANALISIS PENGARUH BIAYA OPERASIONAL TERHADAP PROFIT PENJUALAN KOPI MENGGUNAKAN METODE STATISTIK
Pendahuluan
Industri kopi merupakan salah satu sektor ritel yang terus berkembang dan memiliki tingkat persaingan yang tinggi, yang ditandai dengan semakin banyaknya coffee chain di berbagai wilayah. Dalam menghadapi persaingan tersebut, perusahaan perlu memiliki pemahaman yang baik terhadap data operasional, khususnya yang berkaitan dengan biaya dan keuntungan. Data tersebut dapat memberikan gambaran mengenai kinerja bisnis serta membantu dalam menyusun strategi yang lebih efektif dan efisien.
Salah satu pendekatan yang dapat digunakan untuk memahami kinerja bisnis tersebut adalah melalui analisis statistik. Analisis ini memungkinkan perusahaan untuk mengidentifikasi pola hubungan antara variabel, seperti total biaya operasional dan keuntungan, serta mmengevaluasi kinerja setiap market. Selain itu, melalui analisis ini juga dapat diketahui tingkat efisiensi dalam menghasilkan keuntungan, misalnya melalui perhitungan profit margin.
Laporan ini bertujuan untuk menganalisis dataset Coffee Chain dengan menggunakan pendekatan eksplorasi data, visualisasi, serta metode statistik seperti regresi linear dan ANOVA. Analisis dilakukan untuk memahami hubungan antara Total Expenses dan Profit, serta membandingkan kinerja dan efisiensi profit pada setiap market. Hasil dari analisis ini diharapkan dapat memberikan insight yang berguna dalam mengevaluasi kinerja bisnis dan mendukung pengambilan keputusan yang lebih tepat.
Analisis, Hasil, dan Interpretasi
Insight yang diambil dalam analisis ini adalah “Analisis pengaruh Total Expenses terhadap Profit serta perbedaan kinerja profit pada setiap Market”. Variabel yang digunakan dalam analisis ini meliputi Profit sebagai variabel dependen, yang merepresentasikan hasil kinerja yang dianalisis. Total Expenses digunakan sebagai variabel independen karena diduga memengaruhi profit. Variabel Profit Margin digunakan untuk mengetahui tingkat efisiensi dalam menghasilkan keuntungan dibanding biaya yang dikeluarkan. Selain itu, Market digunakan sebagai variabel kategori untuk membedakan wilayah dan membandingkan kinerja antar market, serta Product sebagai variabel kategorikal tambahan yang digunakan untuk mengidentifikasi produk dengan profit tertinggi dan terendah.
library(readxl)
data_excel <- read_excel("Coffee Chain Datasets.xlsx")
Dataset yang digunakan dalam analisis ini memiliki 150 observasi yang diambil dari dataset utama “Coffee Chain Datasets” melalui metode random sampling.
set.seed(123)
data_coffee <- data_excel[sample(nrow(data_excel), 150),]
View(data_coffee)
Eksplorasi data dilakukan untuk memahami struktur dan karakteristik dataset yang digunakan dalam analisis. Fungsi summary(), str(), dan dim() digunakan untuk memperoleh gambaran umum data, sedangkan head() dan View() digunakan untuk melihat contoh isi data. Eksplorasi ini penting sebagai dasar sebelum melakukan analisis lebih lanjut.
summary(data_coffee)
## Area Code Date Market
## Min. :203.0 Min. :2012-01-01 00:00:00 Length:150
## 1st Qu.:431.2 1st Qu.:2012-07-01 00:00:00 Class :character
## Median :552.0 Median :2012-12-01 00:00:00 Mode :character
## Mean :573.6 Mean :2012-12-13 01:26:24
## 3rd Qu.:715.8 3rd Qu.:2013-05-01 00:00:00
## Max. :985.0 Max. :2013-12-01 00:00:00
## Market Size Product Product Line Product Type
## Length:150 Length:150 Length:150 Length:150
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## State Type Budget COGS Budget Margin
## Length:150 Length:150 Min. : 0.00 Min. :-160.00
## Class :character Class :character 1st Qu.: 30.00 1st Qu.: 50.00
## Mode :character Mode :character Median : 50.00 Median : 80.00
## Mean : 74.53 Mean : 98.13
## 3rd Qu.: 90.00 3rd Qu.: 130.00
## Max. :320.00 Max. : 340.00
## Budget Profit Budget Sales COGS Inventory
## Min. :-240.00 Min. : 0.0 Min. : 0.00 Min. :-258.0
## 1st Qu.: 30.00 1st Qu.: 82.5 1st Qu.: 40.00 1st Qu.: 475.0
## Median : 50.00 Median :130.0 Median : 62.50 Median : 768.0
## Mean : 59.33 Mean :172.7 Mean : 85.21 Mean : 808.1
## 3rd Qu.: 90.00 3rd Qu.:217.5 3rd Qu.:103.75 3rd Qu.: 950.8
## Max. : 240.00 Max. :640.0 Max. :311.00 Max. :5121.0
## Margin Marketing Profit Sales
## Min. :-245.00 Min. : 0.00 Min. :-505.00 Min. : 34.0
## 1st Qu.: 54.25 1st Qu.: 13.00 1st Qu.: 22.25 1st Qu.: 96.0
## Median : 78.50 Median : 21.00 Median : 43.00 Median :142.5
## Mean : 103.85 Mean : 30.19 Mean : 64.11 Mean :193.8
## 3rd Qu.: 140.00 3rd Qu.: 37.50 3rd Qu.: 100.50 3rd Qu.:243.5
## Max. : 453.00 Max. :156.00 Max. : 459.00 Max. :796.0
## Total Expenses
## Min. : 11.00
## 1st Qu.: 30.25
## Median : 42.00
## Mean : 52.19
## 3rd Qu.: 64.00
## Max. :190.00
str(data_coffee)
## tibble [150 × 20] (S3: tbl_df/tbl/data.frame)
## $ Area Code : num [1:150] 503 660 505 206 702 772 603 970 603 417 ...
## $ Date : POSIXct[1:150], format: "2013-02-01" "2013-03-01" ...
## $ Market : chr [1:150] "West" "Central" "South" "West" ...
## $ Market Size : chr [1:150] "Small Market" "Small Market" "Small Market" "Small Market" ...
## $ Product : chr [1:150] "Decaf Espresso" "Earl Grey" "Colombian" "Chamomile" ...
## $ Product Line : chr [1:150] "Beans" "Leaves" "Beans" "Leaves" ...
## $ Product Type : chr [1:150] "Espresso" "Tea" "Coffee" "Herbal Tea" ...
## $ State : chr [1:150] "Oregon" "Missouri" "New Mexico" "Washington" ...
## $ Type : chr [1:150] "Decaf" "Regular" "Regular" "Decaf" ...
## $ Budget COGS : num [1:150] 160 20 60 100 10 90 0 50 20 10 ...
## $ Budget Margin : num [1:150] 160 40 90 170 30 130 40 70 40 20 ...
## $ Budget Profit : num [1:150] 100 0 50 120 20 90 30 50 0 0 ...
## $ Budget Sales : num [1:150] 320 60 150 270 40 220 40 120 60 30 ...
## $ COGS : num [1:150] 170 33 48 123 20 102 0 52 29 25 ...
## $ Inventory : num [1:150] 1073 162 372 932 784 ...
## $ Margin : num [1:150] 170 42 72 186 29 143 43 68 36 31 ...
## $ Marketing : num [1:150] 47 12 15 40 5 31 0 17 11 9 ...
## $ Profit : num [1:150] 147 -4 41 115 18 89 31 54 -12 -11 ...
## $ Sales : num [1:150] 362 80 134 309 49 245 43 119 64 56 ...
## $ Total Expenses: num [1:150] 71 45 48 71 15 54 12 27 42 42 ...
dim(data_coffee)
## [1] 150 20
head(data_coffee)
## # A tibble: 6 × 20
## `Area Code` Date Market `Market Size` Product `Product Line`
## <dbl> <dttm> <chr> <chr> <chr> <chr>
## 1 503 2013-02-01 00:00:00 West Small Market Decaf Es… Beans
## 2 660 2013-03-01 00:00:00 Central Small Market Earl Grey Leaves
## 3 505 2013-01-01 00:00:00 South Small Market Colombian Beans
## 4 206 2012-03-01 00:00:00 West Small Market Chamomile Leaves
## 5 702 2013-05-01 00:00:00 West Small Market Decaf Es… Beans
## 6 772 2012-11-01 00:00:00 East Major Market Decaf Ir… Beans
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## # `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## # `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## # Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
View(head(data_coffee))
Key performance indicators memberikan gambaran umum mengenai kinerja keseluruhan data.
data_coffee$Profit_Margin <- data_coffee$Profit / data_coffee$`Total Expenses`
total_profit <- sum(data_coffee$Profit, na.rm = TRUE)
total_expenses <- sum(data_coffee$`Total Expenses`, na.rm = TRUE)
avg_profit <- mean(data_coffee$Profit, na.rm = TRUE)
avg_margin <- mean(data_coffee$Profit_Margin, na.rm = TRUE)
cat("Total Profit:", total_profit, "\n")
## Total Profit: 9616
cat("Total Expenses:", total_expenses, "\n")
## Total Expenses: 7829
cat("Average Profit:", avg_profit, "\n")
## Average Profit: 64.10667
cat("Average Profit Margin:", avg_margin)
## Average Profit Margin: 1.35282
Variabel Profit Margin dihitung sebagai perbandingan antara Profit dan Total Expenses, yang bertujuan untuk mengukur tingkat efisiensi dalam menghasilkan keuntungan dari biaya yang dikeluarkan. Selanjutnya, Total Profit sebagai jumlah keseluruhan keuntungan yang diperoleh, serta Total Expenses sebagai total biaya yang dikeluarkan dalam seluruh transaksi. Selain itu, Average Profit digunakan untuk melihat rata-rata keuntungan per transaksi, sedangkan Average Profit Margin digunakan untuk mengetahui tingkat efisiensi rata-rata dalam menghasilkan profit.
Digunakan boxplot untuk menganalisis distribusi dan variasi profit pada setiap market. Melalui boxplot, dapat dilihat nilai median, variabilitas data, dan adanya nilai ekstrem (outlier) sehingga memberikan gambaran mengenai tingkat keuntungan, kestabilan, dan risiko pada setiap market.
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.3
ggplot(data_coffee, aes(x = Market, y = Profit, fill = Market)) +
geom_boxplot() +
labs(title = "Perbandingan Profit per Market",
x = "Market",
y = "Profit") +
theme_minimal()
Berdasarkan hasil visualisasi boxplot, dapat dilihat bahwa setiap market memiliki perbedaan dalam tingkat profit sebagai berikut.
Market Central memiliki median berkisar antara 30-40 dengan variabilitas moderat. Market ini menghasilkan profit yang tidak terlalu tinggi sehingga dapat dikategorikan sebagai market dengan performa sedang yang cukup stabil dan risiko moderat.
Market East memiliki median yang rendah berkisar antara 10-20 dengan variabilitas tinggi. Market ini memiliki banyak outlier tinggi hingga sekitar 380 dan terdapat outlier sangat rendah hingga sekitar -200. Oleh karena itu, performa market ini tidak stabil dengan potensi dan risiko yang tinggi.
Market South memiliki median berkisar antara 40-50 dengan variabilitas cukup rendah. Market ini tidak memiliki banyak outlier ekstrem sehingga menghasilkan performa yang cukup baik dan cukup baik, serta risiko moderat.
Market West memiliki median sekitar 50 dengan variabilitas cukup tinggi. Market ini memiliki banyak outlier tinggi hingga sekitar 300 dan terdapat nilai negatif. Performa market ini baik dengan potensi dan risiko yang cukup tinggi.
Dengan demikian, dapat disimpulkan bahwa market West menghasilkan profit yang paling tinggi, diikuti oleh market South. Sementara itu, market Central menghasilkan profit menengah dan market East dengan profit terendah. Hal ini menunjukkan bahwa semakin besar perbedaan distribusi profit antar market, maka semakin kuat indikasi adanya perbedaan kinerja pada setiap market, baik tingkat keuntungan maupun kerugiannya.
Analisis ini bertujuan mengidentifikasi produk dengan profit tertinggi dan terendah untuk melihat gambaran keuntungan dan kerugian maksimum yang diperoleh. Visualisasi menggunakan geom bar digunakan untuk membandingkan secara jelas nilai profit pada Top 5 dan Bottom 5 produk.
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.5.2
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
top5 <- data_coffee %>%
arrange(desc(Profit)) %>%
head(5) %>%
mutate(kategori = "Top 5")
bottom5 <- data_coffee %>%
arrange(Profit) %>%
head(5) %>%
mutate(kategori = "Bottom 5")
combined <- bind_rows(top5, bottom5)
ggplot(combined, aes(x = reorder(Product, Profit), y = Profit, fill = kategori)) +
geom_bar(stat = "identity") +
coord_flip() +
facet_wrap(~kategori, scales = "free") +
labs(title="Perbandingan Top 5 dan Bottom 5 Profit",
x = "Produk",
y = "Profit") +
theme_minimal()
Berdasarkan hasil analisis Top 5 transaksi dengan Profit tertinggi, terlihat bahwa terdapat beberapa transaksi yang mampu menghasilkan keuntungan yang jauh di atas rata-rata. Penjualan dengan Profit tertinggi yaitu produk Lemon di wilayah East. Tingginya profit ini mengindikasikan bahwa kombinasi antara biaya dan pendapatan pada transaksi tersebut berjalan secara optimal.
Sementara itu, hasil analisis Bottom 5 transaksi dengan Profit terendah, terlihat adanya transaksi dengan keuntungan yang sangat rendah hingga mengalami kerugian. Penjualan dengan Profit terendah yaitu produk Green Tea di wilayah West. Hal ini menunjukkan bahwa terjadi ketidakefisienan dimana biaya yang dikeluarkan tidak sebanding dengan hasil yang diperoleh.
Perbandingan antara Top 5 dan Bottom 5 menunjukkan adanya kesenjangan yang sangat besar. Hal ini mengindikasikan bahwa profit sangat dipengaruhi oleh kondisi tertentu sehingga diperlukan analisis lebih lanjut untuk mengidentifikasi faktor-faktor yang menyebabkan perbedaan ekstrem tersebut.
Visualisasi rata-rata Profit Margin per market bertujuan untuk membandingkan tingkat efisiensi dalam menghasilkan keuntungan pada setiap market. Melalui Profit Margin ini dapat diketahui market mana yang mampu menghasilkan Profit lebih optimal dibandingkan biaya yang dikeluarkan.
library(ggplot2)
ggplot(data_coffee, aes(x = Market, y = Profit_Margin, fill = Market)) +
stat_summary(fun = mean, geom = "bar") +
labs(title = "Rata-rata Profit Margin per Market",
x = "Market",
y = "Profit Margin") +
theme_minimal()
Berdasarkan visualisasi, terlihat bahwa setiap market memiliki tingkat efisiensi yang berbeda dalam menghasilkan keuntungan. Market dengan profit margin yang lebih tinggi menunjukkan bahwa biaya yang dikeluarkan lebih efisien dalam menghasilkan profit, sedangkan market dengan margin yang lebih rendah menunjukkan bahwa biaya yang dikeluarkan relatif lebih besar dibandingkan keuntungan yang diperoleh. Jika dibandingkan dengan hasil boxplot profit, terlihat bahwa market dengan profit tinggi tidak selalu memiliki profit margin yang tinggi.
Visualisasi ini dilakukan untuk menganalisis hubungan antara Total Expenses dan Profit pada setiap Market. Melalui scatter plot, dapat dilihat pola hubungan antara biaya yang dikeluarkan dengan keuntungan yang dihasilkan.
data_coffee$Market <- as.factor(data_coffee$Market)
plot(data_coffee$"Total Expenses", data_coffee$Profit,
col = data_coffee$Market,
pch = 16,
main = "Pengaruh Total Expenses Terhadap Profit per Market",
xlab = "Total Expenses",
ylab = "Profit")
legend("topright",
legend = levels(data_coffee$Market),
col = 1:length(levels(data_coffee$Market)),
pch = 16)
abline(lm(Profit ~ `Total Expenses`, data = data_coffee), col = "darkred")
Berdasarkan hasil visualisasi scatter plot, pada tingkat expenses yang rendah, nilai profit cenderung stabil. Sedangkan, pada tingkat expenses yang tinggi, profit menyebar secara lebih variatif dan tidak stabil. Market West dan East memiliki pola penyebaran data yang lebih luas yang mengindikasikan adanya potensi keuntungan yang tinggi sekaligus risiko kerugian yang tinggi. Sementara itu, market Central dan South memiliki pola penyebaran data yang lebih terkonsentrasi yang menunjukkan stabilitas keuntungan yang lebih baik dan risiko kerugian yang lebih rendah.
Terdapat titik yang sangat tinggi di market East dan titik yang sangat rendah di market West. Meskipun kedua titik tersebut memiliki total expenses yang cukup mirip yaitu mendekati 150, tetapi terdapat perbedaan profit yang sangat ekstrem sehingga terdapat keuntungan dan kerugian yang besar. Maka, hubungan antara Total Expenses dan Profit tidak menunjukkan pola linear yang kuat, namun terdapat kecenderungan bahwa semakin besar biaya yang dikeluarkan, semakin besar juga variasi dan ketidakstabilan Profit yang dihasilkan.
Proses pembersihan data dilakukan untuk menghilangkan nilai yang hilang (missing value) sehingga data lebih akurat dan tidak bias.
data_coffee_chain <- data_coffee[
complete.cases(data_coffee$Profit,
data_coffee$"Total Expenses",
data_coffee$Market),
]
Analisis regresi linear digunakan untuk mengetahui pengaruh Total Expenses terhadap Profit pada setiap Market.
model <- lm(Profit ~ `Total Expenses` * Market, data = data_coffee_chain)
summary(model)
##
## Call:
## lm(formula = Profit ~ `Total Expenses` * Market, data = data_coffee_chain)
##
## Residuals:
## Min 1Q Median 3Q Max
## -562.26 -31.18 -1.95 37.38 285.37
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -10.1118 26.0277 -0.389 0.69823
## `Total Expenses` 1.5607 0.4695 3.324 0.00113 **
## MarketEast -21.0714 40.1940 -0.524 0.60093
## MarketSouth 33.5002 59.8969 0.559 0.57684
## MarketWest 77.6348 35.3521 2.196 0.02971 *
## `Total Expenses`:MarketEast 0.6335 0.6978 0.908 0.36550
## `Total Expenses`:MarketSouth -0.9757 1.4736 -0.662 0.50897
## `Total Expenses`:MarketWest -1.6415 0.5655 -2.903 0.00429 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 87.45 on 142 degrees of freedom
## Multiple R-squared: 0.1811, Adjusted R-squared: 0.1408
## F-statistic: 4.487 on 7 and 142 DF, p-value: 0.0001533
Berdasarkan hasil analisis regresi linear, diperoleh nilai p-value sebesar 0.05845. Nilai p-value > 0.05 sehingga model regresi secara keseluruhan tidak signifikan secara statistik. Hal ini menunjukkan bahwa variabel Total Expenses dan Market tidak memiliki pengaruh yang signifikan terhadap Profit. Hasil ini mengindikasikan bahwa terdapat kemungkinan faktor lain yang lebih berpengaruh terhadap Profit, seperti efisiensi operasional, strategi pemasaran, atau kondisi pasar. Dengan demikian, peningkatan biaya tidak secara otomatis meningkatkan profit, dan perusahaan perlu mempertimbangkan faktor lain dalam pengambilan keputusan.
H0: mu1 = mu2 = mu3 = mu4
H1: ada i =! j sehingga mui =! muj
Analisis ANOVA digunakan untuk menguji apakah terdapat perbedaan rata-rata Profit yang signifikan antar Market. Dengan menggunakan ANOVA, dapat diketahui apakah perbedaan yang terlihat pada visualisasi data signifikan secara statistik atau hanya disebabkan oleh variasi data.
hasil_aov <- aov(Profit ~ Market, data = data_coffee_chain)
summary(hasil_aov)
## Df Sum Sq Mean Sq F value Pr(>F)
## Market 3 15655 5218 0.581 0.628
## Residuals 146 1310355 8975
anova <- summary(hasil_aov)[[1]]
p_val <- anova["Market", "Pr(>F)"]
cat("P-value:", p_val, "\n")
## P-value: 0.6281079
cat("Keputusan:",
ifelse(p_val < 0.05,
"TOLAK H0 - terdapat perbedaan signifikan rata-rata profit antar market",
"GAGAL TOLAK H0 - tidak terdapat perbedaan signifikan rata-rata profit antar
market"))
## Keputusan: GAGAL TOLAK H0 - tidak terdapat perbedaan signifikan rata-rata profit antar
## market
Berdasarkan hasil analisis varians (ANOVA) satu arah dengan model Profit ~ Market, diperoleh nilai F hitung sebesar 0,581 dengan p-value sebesar 0,628 (p > 0,05). Nilai tersebut menunjukkan bahwa H0 gagal ditolak, sehingga dapat disimpulkan bahwa tidak terdapat perbedaan rata-rata profit yang signifikan antar market.
Hal ini berarti bahwa meskipun secara visual (boxplot) terlihat adanya perbedaan distribusi profit antar market, perbedaan tersebut tidak cukup kuat secara statistik untuk dinyatakan signifikan.
Kesimpulan
Berdasarkan hasil analisis visualisasi yang telah dilakukan, dapat disimpulkan bahwa hubungan antara Total Expenses dan Profit tidak menunjukkan pola yang kuat dan konsisten. Peningkatan biaya tidak selalu diikuti oleh peningkatan keuntungan, melainkan cenderung meningkatkan variasi profit. Analisis profit margin menunjukkan bahwa profit yang tinggi tidak selalu mencerminkan efisiensi yang baik. Sementara itu, analisis Top 5 dan Bottom 5 menunjukkan adanya kesenjangan yang sangat besar antara profit tertinggi dan terendah yang mengindikasikan adanya ketidakkonsistenan serta potensi risiko dalam kinerja profit.
Secara statistik, hasil analisis regresi linear dan ANOVA menunjukkan bahwa Total Expenses tidak berpengaruh signifikan terhadap Profit, serta tidak terdapat perbedaan rata-rata profit yang signifikan antar market. Selain itu, pengaruh Total Expenses terhadap Profit juga tidak berbeda secara signifikan pada setiap market.
Secara keseluruhan, dapat disimpulkan bahwa Total Expenses tidak berpengaruh secara signifikan terhadap Profit. dan Market bukan merupakan faktor utama yang menentukan Profit dalam dataset ini. Oleh karena itu, terdapat faktor lain yang kemungkinan memiliki peran lebih besar dalam memengaruhi profit. Dengan demikian, diperlukan analisis lanjutan dengan mempertimbangkan variabel lain serta aspek efisiensi dan kondisi eksternal untuk memperoleh pemahaman dalam meningkatkan kinerja profit.