Data yang tersedia dalam suatu perusahaan umumnya terdiri dari berbagai variabel yang menggambarkan kondisi operasional dan kinerja bisnis. Untuk memahami informasi yang terkandung dalam data tersebut, diperlukan analisis statistik yang sistematis agar dapat mengidentifikasi pola, hubungan, serta perbedaan antar variabel.
Oleh karena itu, pada penelitian ini dilakukan eksplorasi data untuk memahami karakteristik masing-masing variabel, baik numerik maupun kategorik. Melalui analisis deskriptif dan visualisasi, diharapkan dapat diidentifikasi variabel yang memiliki variasi atau pola tertentu yang menarik untuk dianalisis lebih lanjut.
Setelah variabel dengan karakteristik tertentu teridentifikasi, dilakukan analisis lanjutan untuk mengkaji hubungan dan pengaruh antar variabel guna memperoleh pemahaman yang lebih mendalam terhadap data.
Tujuan dari analisis ini adalah untuk mengeksplorasi data guna memahami karakteristik variabel yang tersedia, serta mengidentifikasi pola, hubungan, dan perbedaan antar variabel dalam dataset.
Coffee_Chain <- read_excel("D:/SIM/TUGAS 1/1. Tugas SIM 2025B - Coffee Chain Datasets.xlsx")
kable(head(Coffee_Chain)) %>%
kable_styling() %>%
scroll_box(width = "100%", height = "300px")
| Area Code | Date | Market | Market Size | Product | Product Line | Product Type | State | Type | Budget COGS | Budget Margin | Budget Profit | Budget Sales | COGS | Inventory | Margin | Marketing | Profit | Sales | Total Expenses |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 719 | 2012-01-01 | Central | Major Market | Amaretto | Beans | Coffee | Colorado | Regular | 90 | 130 | 100 | 220 | 89 | 777 | 130 | 24 | 94 | 219 | 36 |
| 970 | 2012-01-01 | Central | Major Market | Colombian | Beans | Coffee | Colorado | Regular | 80 | 110 | 80 | 190 | 83 | 623 | 107 | 27 | 68 | 190 | 39 |
| 970 | 2012-01-01 | Central | Major Market | Decaf Irish Cream | Beans | Coffee | Colorado | Decaf | 100 | 140 | 110 | 240 | 95 | 821 | 139 | 26 | 101 | 234 | 38 |
| 303 | 2012-01-01 | Central | Major Market | Green Tea | Leaves | Tea | Colorado | Regular | 30 | 50 | 30 | 80 | 44 | 623 | 56 | 14 | 30 | 100 | 26 |
| 303 | 2012-01-01 | Central | Major Market | Caffe Mocha | Beans | Espresso | Colorado | Regular | 60 | 90 | 70 | 150 | 54 | 456 | 80 | 15 | 54 | 134 | 26 |
| 720 | 2012-01-01 | Central | Major Market | Decaf Espresso | Beans | Espresso | Colorado | Decaf | 80 | 130 | 80 | 210 | 72 | 558 | 108 | 23 | 53 | 180 | 55 |
Data yang digunakan dalam penelitian ini terdiri dari 4.248 observasi dengan total 20 variabel yang mencakup variabel numerik, kategorik, dan waktu. Variabel numerik meliputi Profit, Sales, COGS, Marketing, dan Inventory, sedangkan variabel kategorik meliputi Product Type, Product Line, Market Size, dan State. Selain itu, terdapat variabel waktu berupa tanggal yang menunjukkan periode pencatatan data.
| Variabel | Keterangan |
|---|---|
| Area Code | Kode area |
| Market | Wilayah pemasaran |
| Market Size | Ukuran pasar |
| Product | Jenis produk (kopi atau teh) |
| Product Line | Bentuk produk |
| Product Type | Tipe produk |
| State | Negara bagian di Amerika Serikat |
| Type | Jenis produk (kafein/non-kafein) |
| Budget COGS | Estimasi biaya pokok penjualan |
| Budget Margin | Estimasi margin keuntungan |
| Budget Profit | Estimasi keuntungan |
| Budget Sales | Estimasi total penjualan |
| COGS | Biaya pokok penjualan aktual |
| Inventory | Jumlah stok barang |
| Margin | Margin keuntungan aktual |
| Profit | Keuntungan aktual |
| Sales | Total penjualan aktual |
| Total Expenses | Total biaya yang dikeluarkan |
Berdasarkan variabel-variabel yang telah dijelaskan, selanjutnya dilakukan analisis statistik deskriptif untuk memahami karakteristik data, khususnya pada variabel numerik yang berkaitan dengan kinerja perusahaan.
Variabel Profit menunjukkan variasi yang cukup besar dengan nilai minimum sebesar -638 dan maksimum sebesar 778. Hal ini menunjukkan bahwa dalam data terdapat kondisi kerugian maupun keuntungan yang signifikan. Rata-rata profit yang bernilai positif mengindikasikan bahwa secara umum perusahaan memperoleh keuntungan, namun rentang nilai yang lebar menunjukkan bahwa kinerja profit tidak stabil antar observasi.
Selain itu, variabel Sales memiliki nilai rata-rata yang relatif tinggi, yang mencerminkan tingkat penjualan yang cukup besar. Variabel biaya seperti COGS juga menunjukkan nilai yang signifikan, yang mengindikasikan besarnya biaya operasional dalam proses bisnis. Di sisi lain, ditemukan nilai yang tidak wajar pada variabel Inventory, termasuk nilai negatif yang cukup besar, yang mengindikasikan adanya kemungkinan anomali data atau kondisi khusus dalam pengelolaan stok.
par(mfrow=c(2,3), mar=c(4,4,2,1))
boxplot(Coffee_Chain$Profit,
main="Profit",
col="#6F4E37",
border="#3E2723")
boxplot(Coffee_Chain$Sales,
main="Sales",
col="#6F4E37",
border="#3E2723")
boxplot(Coffee_Chain$COGS,
main="COGS",
col="#6F4E37",
border="#3E2723")
boxplot(Coffee_Chain$Marketing,
main="Marketing",
col="#6F4E37",
border="#3E2723")
boxplot(Coffee_Chain$Inventory,
main="Inventory",
col="#6F4E37",
border="#3E2723")
Berdasarkan visualisasi boxplot, terlihat bahwa profit memiliki penyebaran yang luas serta terdapat beberapa nilai ekstrem dibandingkan variabel numerik lainnya. Hal ini menunjukkan bahwa profit memiliki karakteristik yang lebih kompleks dan berpotensi dipengaruhi oleh berbagai faktor. Oleh karena itu, diperlukan analisis lebih lanjut untuk mengidentifikasi faktor-faktor yang memengaruhi profit.
Dalam rangka mengidentifikasi faktor-faktor yang berhubungan dengan profit, dilakukan analisis korelasi terhadap variabel numerik yang berkaitan dengan kinerja keuangan. Analisis ini bertujuan untuk mengukur kekuatan hubungan masing-masing variabel numerik terhadap profit serta menentukan variabel yang memiliki pengaruh lebih dominan terhadap profit.
\(H_0\) : Tidak terdapat hubungan antara variabel numerik (Sales, COGS, Marketing, Inventory) dengan profit
\(H_1\) : Terdapat hubungan antara variabel numerik (Sales, COGS, Marketing, Inventory) dengan profit
\(\alpha\) = 0.05
Tolak \(H_0\) jika p-value \(< \alpha\)
vars <- c("Sales","COGS","Marketing","Inventory")
cor_results <- lapply(vars, function(var) {
test <- cor.test(Coffee_Chain$Profit, Coffee_Chain[[var]])
c(Correlation = unname(test$estimate),
P_Value = test$p.value)
})
cor_table <- do.call(rbind, cor_results)
rownames(cor_table) <- vars
cor_table
## Correlation P_Value
## Sales 0.79733091 0.000000e+00
## COGS 0.46483822 9.237429e-227
## Marketing 0.22546504 4.265018e-50
## Inventory -0.09154483 2.267450e-09
Berdasarkan hasil uji korelasi, seluruh variabel numerik memiliki nilai p-value kurang dari 0,05, sehingga \(H_0\) ditolak. Hal ini menunjukkan bahwa terdapat hubungan yang signifikan antara variabel numerik, yaitu Sales, COGS, Marketing, dan Inventory, terhadap profit.
Selanjutnya, untuk memahami kekuatan hubungan masing-masing variabel, ditampilkan visualisasi berupa bar plot nilai korelasi.
bar <- barplot(cor_table[, "Correlation"],
names.arg = rownames(cor_table),
col = "#6F4E37",
border = "#3E2723",
main = "Korelasi Variabel Numerik terhadap Profit",
ylab = "Nilai Korelasi",
ylim = c(min(cor_table[, "Correlation"]) - 0.1, 1))
# tambahin angka di atas bar
text(x = bar,
y = cor_table[, "Correlation"],
label = round(cor_table[, "Correlation"], 2),
pos = 3)
Berdasarkan visualisasi korelasi, variabel Sales menunjukkan hubungan yang paling kuat terhadap Profit dengan nilai korelasi sebesar 0,80. Hal ini menunjukkan bahwa peningkatan penjualan secara signifikan diikuti oleh peningkatan profit, sehingga Sales menjadi variabel numerik yang paling berpengaruh terhadap Profit.
Sementara itu, variabel lainnya seperti COGS, Marketing, dan Inventory menunjukkan hubungan yang lebih lemah dibandingkan Sales, sehingga pengaruhnya terhadap Profit relatif tidak dominan.
Analisis selanjutnya difokuskan pada variabel lain di luar variabel numerik, yaitu variabel kategorik, untuk mengidentifikasi faktor tambahan yang memengaruhi profit. Digunakan metode One Way ANOVA guna mengetahui apakah terdapat perbedaan rata-rata profit pada masing-masing kategori.
\(H_0\) : Tidak terdapat perbedaan rata-rata profit pada setiap kategori variabel (Market, Market Size, Product, Product Line, Product Type, State, dan Type)
\(H_1\) : Terdapat perbedaan rata-rata profit pada minimal satu kategori variabel tersebut
\(\alpha\) = 0.05
Tolak \(H_0\) jika p-value \(< \alpha\)
vars_cat <- c("Market", "Market.Size", "Product",
"Product.Line", "Product.Type",
"State", "Type")
Coffee_Chain[, vars_cat] <- lapply(Coffee_Chain[, vars_cat], as.factor)
Coffee_Chain[vars_cat] <- lapply(Coffee_Chain[vars_cat], as.factor)
results <- lapply(vars_cat, function(var) {
formula <- as.formula(paste("Profit ~", paste0("`", var, "`")))
model <- aov(formula, data = Coffee_Chain)
summary(model)
})
names(results) <- vars_cat
results
## $Market
## Df Sum Sq Mean Sq F value Pr(>F)
## Market 3 288811 96270 9.361 3.64e-06 ***
## Residuals 4244 43644825 10284
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## $Market.Size
## Df Sum Sq Mean Sq F value Pr(>F)
## Market.Size 1 2611722 2611722 268.4 <2e-16 ***
## Residuals 4246 41321915 9732
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## $Product
## Df Sum Sq Mean Sq F value Pr(>F)
## Product 12 4267412 355618 37.97 <2e-16 ***
## Residuals 4235 39666224 9366
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## $Product.Line
## Df Sum Sq Mean Sq F value Pr(>F)
## Product.Line 1 45377 45377 4.39 0.0362 *
## Residuals 4246 43888259 10336
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## $Product.Type
## Df Sum Sq Mean Sq F value Pr(>F)
## Product.Type 3 141680 47227 4.577 0.00333 **
## Residuals 4244 43791957 10319
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## $State
## Df Sum Sq Mean Sq F value Pr(>F)
## State 19 5550662 292140 32.18 <2e-16 ***
## Residuals 4228 38382975 9078
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## $Type
## Df Sum Sq Mean Sq F value Pr(>F)
## Type 1 36386 36386 3.519 0.0607 .
## Residuals 4246 43897251 10338
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
| Variable | P_Value | Significance |
|---|---|---|
| Market | < 0.001 | Signifikan |
| Market.Size | < 0.001 | Signifikan |
| Product | < 0.001 | Signifikan |
| Product.Line | 0.036 | Signifikan |
| Product.Type | 0.003 | Signifikan |
| State | < 0.001 | Signifikan |
| Type | 0.061 | Tidak Signifikan |
Berdasarkan hasil uji One Way ANOVA, diperoleh bahwa sebagian besar variabel kategorik memiliki nilai p-value kurang dari 0,05, sehingga H0 ditolak. Hal ini menunjukkan bahwa terdapat perbedaan rata-rata profit yang signifikan antar kategori pada variabel Market, Market Size, Product, Product Line, Product Type, dan State.
Sementara itu, variabel Type memiliki nilai p-value lebih dari 0,05, sehingga H0 tidak ditolak, yang berarti tidak terdapat perbedaan rata-rata profit yang signifikan antar kategori pada variabel tersebut.
Untuk memperoleh gambaran yang lebih jelas mengenai kekuatan pengaruh masing-masing variabel, dilakukan analisis lanjutan dengan membandingkan nilai F yang digunakan untuk menunjukkan besarnya variasi antar kelompok dibandingkan dengan variasi dalam kelompok, sehingga dapat digunakan untuk mengidentifikasi variabel yang paling dominan.
Berdasarkan visualisasi nilai F, terlihat bahwa variabel Market Size memiliki nilai F yang jauh lebih tinggi dibandingkan variabel kategorik lainnya. Perbedaan yang cukup signifikan ini menunjukkan bahwa variasi rata-rata profit antar kategori pada Market Size jauh lebih besar dibandingkan variabel lainnya.
Hal ini mengindikasikan bahwa Market Size merupakan faktor yang paling dominan dalam menjelaskan variasi profit. Dengan kata lain, perbedaan ukuran pasar (misalnya small market dan major market) memberikan dampak yang paling kuat terhadap perubahan nilai profit dibandingkan faktor kategorik lainnya.
Sementara itu, variabel lain seperti Product dan State juga menunjukkan pengaruh, namun kontribusinya relatif lebih kecil jika dibandingkan dengan Market Size. Variabel lainnya memiliki nilai F yang rendah, sehingga pengaruhnya terhadap variasi profit cenderung terbatas.
\(H_0a : \beta_1 = 0\) (Sales tidak berpengaruh terhadap profit) \(H_1a : \beta_1 ≠0\) (Sales berpengaruh terhadap profit)
\(H_0b : \beta_1 = 0\) (Market Size tidak berpengaruh terhadap profit) \(H_1b : \beta_1 ≠0\) (Market Size berpengaruh terhadap profit)
\(\alpha\) = 0.05
Tolak \(H_0\) jika p-value \(< \alpha\)
# cek tipe data
Coffee_Chain$Market.Size <- as.factor(Coffee_Chain$Market.Size)
# model regresi
model_reg <- lm(Profit ~ Sales + Market.Size, data = Coffee_Chain)
summary(model_reg)
##
## Call:
## lm(formula = Profit ~ Sales + Market.Size, data = Coffee_Chain)
##
## Residuals:
## Min 1Q Median 3Q Max
## -606.29 -9.17 11.80 28.30 466.85
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -42.492002 2.209420 -19.232 <2e-16 ***
## Sales 0.536628 0.006548 81.950 <2e-16 ***
## Market.SizeSmall Market 0.045542 2.018930 0.023 0.982
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 61.4 on 4245 degrees of freedom
## Multiple R-squared: 0.6357, Adjusted R-squared: 0.6356
## F-statistic: 3704 on 2 and 4245 DF, p-value: < 2.2e-16
plot(Coffee_Chain$Sales, Coffee_Chain$Profit,
col = "#6F4E37",
pch = 16,
main = "Hubungan Sales terhadap Profit",
xlab = "Sales",
ylab = "Profit")
abline(lm(Profit ~ Sales, data = Coffee_Chain),
col = "red",
lwd = 2)
Berdasarkan hasil analisis regresi, variabel Sales memiliki pengaruh yang signifikan terhadap profit (p-value < 0,05), sehingga H0 ditolak. Hal ini menunjukkan bahwa peningkatan nilai Sales akan diikuti oleh peningkatan profit.
Sementara itu, variabel Market Size tidak menunjukkan pengaruh yang signifikan terhadap profit (p-value > 0,05) setelah mempertimbangkan variabel Sales. Hal ini mengindikasikan bahwa pengaruh Market Size terhadap profit tidak bersifat langsung, melainkan kemungkinan dimediasi oleh variabel Sales.
Berdasarkan hasil analisis regresi sebelumnya, diketahui bahwa Sales merupakan faktor utama yang memengaruhi profit. Namun, analisis tersebut hanya menggambarkan hubungan antar variabel aktual tanpa mempertimbangkan pencapaian terhadap target yang telah ditetapkan. Oleh karena itu, dilakukan analisis lanjutan menggunakan pendekatan gap analysis untuk mengevaluasi kinerja profit dan penjualan terhadap budget.
Analisis ini bertujuan untuk memperkuat hasil sebelumnya dengan memberikan perspektif tambahan mengenai apakah peningkatan Sales yang signifikan benar-benar diikuti oleh pencapaian profit sesuai target.
Coffee_Chain$Profit_Gap <- Coffee_Chain$Profit - Coffee_Chain$`Budget.Profit`
Coffee_Chain$Sales_Gap <- Coffee_Chain$Sales - Coffee_Chain$`Budget.Sales`
summary(Coffee_Chain$Profit_Gap)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -369.0000 -14.0000 -4.0000 0.1843 9.0000 249.0000
summary(Coffee_Chain$Sales_Gap)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -310.00 0.00 16.00 17.34 34.00 347.00
hist(Coffee_Chain$Profit_Gap,
col = "#6F4E37",
main = "Distribusi Profit Gap",
xlab = "Profit Gap")
hist(Coffee_Chain$Sales_Gap,
col = "#A1887F",
main = "Distribusi Sales Gap",
xlab = "Sales Gap")
Distribusi menunjukkan bahwa sales secara umum melebihi target karena
nilai median dan rata-rata Sales Gap bernilai positif. Namun, profit
tidak selalu mengikuti karena median Profit Gap bernilai negatif dan
memiliki rentang yang cukup lebar. Hal ini menunjukkan bahwa meskipun
penjualan meningkat, profit tidak selalu mencapai target.
Untuk memahami fenomena tersebut secara lebih mendalam, dilakukan analisis lanjutan menggunakan regresi dengan mempertimbangkan selisih antara nilai aktual dan target, serta memasukkan variabel biaya ke dalam model.
lm(Profit_Gap ~ Sales_Gap + COGS + Marketing, data = Coffee_Chain)
##
## Call:
## lm(formula = Profit_Gap ~ Sales_Gap + COGS + Marketing, data = Coffee_Chain)
##
## Coefficients:
## (Intercept) Sales_Gap COGS Marketing
## -10.0946 0.5028 0.1974 -0.4843
plot(Coffee_Chain$Sales_Gap, Coffee_Chain$Profit_Gap,
col = "#A1887F",
pch = 16,
main = "Hubungan Sales Gap terhadap Profit Gap",
xlab = "Sales Gap",
ylab = "Profit Gap")
abline(lm(Profit_Gap ~ Sales_Gap, data = Coffee_Chain),
col = "blue",
lwd = 2)
Hasil regresi menunjukkan bahwa Sales Gap berpengaruh positif terhadap Profit Gap karena koefisiennya bernilai positif. Sementara itu, variabel Marketing berpengaruh negatif karena memiliki koefisien negatif, yang menunjukkan bahwa peningkatan biaya dapat menurunkan pencapaian profit. Oleh karena itu, meskipun penjualan meningkat, profit tetap dapat tertekan oleh biaya.
Berdasarkan hasil tersebut, dapat disimpulkan bahwa peningkatan penjualan memang berperan penting dalam meningkatkan profit, namun tidak selalu menjamin tercapainya target profit. Hal ini disebabkan oleh adanya faktor biaya yang turut memengaruhi hasil akhir. Dengan demikian, pencapaian profit tidak hanya bergantung pada peningkatan penjualan, tetapi juga pada efisiensi dalam pengelolaan biaya.
Berdasarkan hasil analisis yang telah dilakukan, diperoleh beberapa temuan utama. Pertama, hasil analisis korelasi dan regresi menunjukkan bahwa variabel Sales memiliki pengaruh positif dan signifikan terhadap profit, sehingga peningkatan penjualan menjadi faktor utama dalam meningkatkan profit. Selain itu, variabel kategorik seperti Market Size juga terbukti memiliki pengaruh terhadap profit berdasarkan hasil uji ANOVA.
Kedua, analisis gap menunjukkan bahwa secara umum penjualan cenderung melebihi target, namun pencapaian profit tidak selalu mengikuti. Hal ini terlihat dari distribusi profit gap yang masih menunjukkan adanya nilai di bawah target.
Ketiga, hasil regresi gap menunjukkan bahwa Sales Gap berpengaruh positif terhadap Profit Gap, yang berarti pencapaian penjualan terhadap target tetap berperan dalam meningkatkan profit. Namun, variabel biaya seperti Marketing memiliki pengaruh negatif terhadap Profit Gap, yang mengindikasikan bahwa peningkatan biaya dapat menurunkan pencapaian profit.
Dengan demikian, dapat disimpulkan bahwa meskipun Sales merupakan faktor utama dalam meningkatkan profit, pencapaian profit yang optimal juga sangat dipengaruhi oleh efisiensi dalam pengelolaan biaya.
Berdasarkan hasil analisis yang diperoleh, terdapat beberapa saran yang dapat diberikan. Pertama, perusahaan disarankan untuk terus meningkatkan kinerja penjualan karena terbukti memiliki pengaruh yang signifikan terhadap profit.
Kedua, perusahaan perlu lebih memperhatikan pengelolaan biaya, khususnya biaya pemasaran, agar peningkatan penjualan dapat diikuti dengan peningkatan profit yang optimal.
Ketiga, dalam pengambilan keputusan bisnis, perusahaan sebaiknya tidak hanya berfokus pada peningkatan penjualan, tetapi juga mempertimbangkan efisiensi biaya agar target profit dapat tercapai secara konsisten.
Keempat, untuk analisis selanjutnya, disarankan untuk memasukkan lebih banyak variabel biaya atau melakukan analisis lanjutan guna memahami faktor-faktor lain yang memengaruhi profit secara lebih komprehensif.