1. Pendahuluan

1.1. Latar Belakang

Data yang tersedia dalam suatu perusahaan umumnya terdiri dari berbagai variabel yang menggambarkan kondisi operasional dan kinerja bisnis. Untuk memahami informasi yang terkandung dalam data tersebut, diperlukan analisis statistik yang sistematis agar dapat mengidentifikasi pola, hubungan, serta perbedaan antar variabel.

Oleh karena itu, pada penelitian ini dilakukan eksplorasi data untuk memahami karakteristik masing-masing variabel, baik numerik maupun kategorik. Melalui analisis deskriptif dan visualisasi, diharapkan dapat diidentifikasi variabel yang memiliki variasi atau pola tertentu yang menarik untuk dianalisis lebih lanjut.

Setelah variabel dengan karakteristik tertentu teridentifikasi, dilakukan analisis lanjutan untuk mengkaji hubungan dan pengaruh antar variabel guna memperoleh pemahaman yang lebih mendalam terhadap data.

1.2. Tujuan Analisis

Tujuan dari analisis ini adalah untuk mengeksplorasi data guna memahami karakteristik variabel yang tersedia, serta mengidentifikasi pola, hubungan, dan perbedaan antar variabel dalam dataset.

1.3. Import Data

Coffee_Chain <- read_excel("D:/SIM/TUGAS 1/1. Tugas SIM 2025B - Coffee Chain Datasets.xlsx")

kable(head(Coffee_Chain)) %>%
  kable_styling() %>%
  scroll_box(width = "100%", height = "300px")
Area Code Date Market Market Size Product Product Line Product Type State Type Budget COGS Budget Margin Budget Profit Budget Sales COGS Inventory Margin Marketing Profit Sales Total Expenses
719 2012-01-01 Central Major Market Amaretto Beans Coffee Colorado Regular 90 130 100 220 89 777 130 24 94 219 36
970 2012-01-01 Central Major Market Colombian Beans Coffee Colorado Regular 80 110 80 190 83 623 107 27 68 190 39
970 2012-01-01 Central Major Market Decaf Irish Cream Beans Coffee Colorado Decaf 100 140 110 240 95 821 139 26 101 234 38
303 2012-01-01 Central Major Market Green Tea Leaves Tea Colorado Regular 30 50 30 80 44 623 56 14 30 100 26
303 2012-01-01 Central Major Market Caffe Mocha Beans Espresso Colorado Regular 60 90 70 150 54 456 80 15 54 134 26
720 2012-01-01 Central Major Market Decaf Espresso Beans Espresso Colorado Decaf 80 130 80 210 72 558 108 23 53 180 55

3.3.1. Deskripsi Data

Data yang digunakan dalam penelitian ini terdiri dari 4.248 observasi dengan total 20 variabel yang mencakup variabel numerik, kategorik, dan waktu. Variabel numerik meliputi Profit, Sales, COGS, Marketing, dan Inventory, sedangkan variabel kategorik meliputi Product Type, Product Line, Market Size, dan State. Selain itu, terdapat variabel waktu berupa tanggal yang menunjukkan periode pencatatan data.

3.3.2. Deskripsi Variabel

Deskripsi Variabel
Variabel Keterangan
Area Code Kode area
Market Wilayah pemasaran
Market Size Ukuran pasar
Product Jenis produk (kopi atau teh)
Product Line Bentuk produk
Product Type Tipe produk
State Negara bagian di Amerika Serikat
Type Jenis produk (kafein/non-kafein)
Budget COGS Estimasi biaya pokok penjualan
Budget Margin Estimasi margin keuntungan
Budget Profit Estimasi keuntungan
Budget Sales Estimasi total penjualan
COGS Biaya pokok penjualan aktual
Inventory Jumlah stok barang
Margin Margin keuntungan aktual
Profit Keuntungan aktual
Sales Total penjualan aktual
Total Expenses Total biaya yang dikeluarkan

Berdasarkan variabel-variabel yang telah dijelaskan, selanjutnya dilakukan analisis statistik deskriptif untuk memahami karakteristik data, khususnya pada variabel numerik yang berkaitan dengan kinerja perusahaan.

1.4. Rumusan Masalah

Variabel Profit menunjukkan variasi yang cukup besar dengan nilai minimum sebesar -638 dan maksimum sebesar 778. Hal ini menunjukkan bahwa dalam data terdapat kondisi kerugian maupun keuntungan yang signifikan. Rata-rata profit yang bernilai positif mengindikasikan bahwa secara umum perusahaan memperoleh keuntungan, namun rentang nilai yang lebar menunjukkan bahwa kinerja profit tidak stabil antar observasi.

Selain itu, variabel Sales memiliki nilai rata-rata yang relatif tinggi, yang mencerminkan tingkat penjualan yang cukup besar. Variabel biaya seperti COGS juga menunjukkan nilai yang signifikan, yang mengindikasikan besarnya biaya operasional dalam proses bisnis. Di sisi lain, ditemukan nilai yang tidak wajar pada variabel Inventory, termasuk nilai negatif yang cukup besar, yang mengindikasikan adanya kemungkinan anomali data atau kondisi khusus dalam pengelolaan stok.

par(mfrow=c(2,3), mar=c(4,4,2,1))

boxplot(Coffee_Chain$Profit,
        main="Profit",
        col="#6F4E37",
        border="#3E2723")

boxplot(Coffee_Chain$Sales,
        main="Sales",
        col="#6F4E37",
        border="#3E2723")

boxplot(Coffee_Chain$COGS,
        main="COGS",
        col="#6F4E37",
        border="#3E2723")

boxplot(Coffee_Chain$Marketing,
        main="Marketing",
        col="#6F4E37",
        border="#3E2723")

boxplot(Coffee_Chain$Inventory,
        main="Inventory",
        col="#6F4E37",
        border="#3E2723")

Berdasarkan visualisasi boxplot, terlihat bahwa profit memiliki penyebaran yang luas serta terdapat beberapa nilai ekstrem dibandingkan variabel numerik lainnya. Hal ini menunjukkan bahwa profit memiliki karakteristik yang lebih kompleks dan berpotensi dipengaruhi oleh berbagai faktor. Oleh karena itu, diperlukan analisis lebih lanjut untuk mengidentifikasi faktor-faktor yang memengaruhi profit.

2. Analisis Data

2.1. Analisis Hubungan Variabel Numerik terhadap Profit Menggunakan Korelasi

Dalam rangka mengidentifikasi faktor-faktor yang berhubungan dengan profit, dilakukan analisis korelasi terhadap variabel numerik yang berkaitan dengan kinerja keuangan. Analisis ini bertujuan untuk mengukur kekuatan hubungan masing-masing variabel numerik terhadap profit serta menentukan variabel yang memiliki pengaruh lebih dominan terhadap profit.

2.1.1 Uji Hipotesis

I. Hipotesis

\(H_0\) : Tidak terdapat hubungan antara variabel numerik (Sales, COGS, Marketing, Inventory) dengan profit

\(H_1\) : Terdapat hubungan antara variabel numerik (Sales, COGS, Marketing, Inventory) dengan profit

II. Taraf Signifikansi

\(\alpha\) = 0.05

III. Daerah Kritis

Tolak \(H_0\) jika p-value \(< \alpha\)

IV. Statistik Uji
vars <- c("Sales","COGS","Marketing","Inventory")

cor_results <- lapply(vars, function(var) {
  test <- cor.test(Coffee_Chain$Profit, Coffee_Chain[[var]])
  c(Correlation = unname(test$estimate),
    P_Value = test$p.value)
})

cor_table <- do.call(rbind, cor_results)
rownames(cor_table) <- vars

cor_table
##           Correlation       P_Value
## Sales      0.79733091  0.000000e+00
## COGS       0.46483822 9.237429e-227
## Marketing  0.22546504  4.265018e-50
## Inventory -0.09154483  2.267450e-09
V. Kesimpulan

Berdasarkan hasil uji korelasi, seluruh variabel numerik memiliki nilai p-value kurang dari 0,05, sehingga \(H_0\) ditolak. Hal ini menunjukkan bahwa terdapat hubungan yang signifikan antara variabel numerik, yaitu Sales, COGS, Marketing, dan Inventory, terhadap profit.

2.1.2 Visualisasi

Selanjutnya, untuk memahami kekuatan hubungan masing-masing variabel, ditampilkan visualisasi berupa bar plot nilai korelasi.

bar <- barplot(cor_table[, "Correlation"],
               names.arg = rownames(cor_table),
               col = "#6F4E37",
               border = "#3E2723",
               main = "Korelasi Variabel Numerik terhadap Profit",
               ylab = "Nilai Korelasi",
               ylim = c(min(cor_table[, "Correlation"]) - 0.1, 1))

# tambahin angka di atas bar
text(x = bar,
     y = cor_table[, "Correlation"],
     label = round(cor_table[, "Correlation"], 2),
     pos = 3)

Berdasarkan visualisasi korelasi, variabel Sales menunjukkan hubungan yang paling kuat terhadap Profit dengan nilai korelasi sebesar 0,80. Hal ini menunjukkan bahwa peningkatan penjualan secara signifikan diikuti oleh peningkatan profit, sehingga Sales menjadi variabel numerik yang paling berpengaruh terhadap Profit.

Sementara itu, variabel lainnya seperti COGS, Marketing, dan Inventory menunjukkan hubungan yang lebih lemah dibandingkan Sales, sehingga pengaruhnya terhadap Profit relatif tidak dominan.

2.2. Analisis Hubungan Variabel Kategorik terhadap Profit Menggunakan One-Way ANOVA

Analisis selanjutnya difokuskan pada variabel lain di luar variabel numerik, yaitu variabel kategorik, untuk mengidentifikasi faktor tambahan yang memengaruhi profit. Digunakan metode One Way ANOVA guna mengetahui apakah terdapat perbedaan rata-rata profit pada masing-masing kategori.

2.2.1 Uji Hipotesis

I. Hipotesis

\(H_0\) : Tidak terdapat perbedaan rata-rata profit pada setiap kategori variabel (Market, Market Size, Product, Product Line, Product Type, State, dan Type)

\(H_1\) : Terdapat perbedaan rata-rata profit pada minimal satu kategori variabel tersebut

II. Taraf Signifikansi

\(\alpha\) = 0.05

III. Daerah Kritis

Tolak \(H_0\) jika p-value \(< \alpha\)

IV. Statistik Uji
vars_cat <- c("Market", "Market.Size", "Product", 
              "Product.Line", "Product.Type", 
              "State", "Type")

Coffee_Chain[, vars_cat] <- lapply(Coffee_Chain[, vars_cat], as.factor)

Coffee_Chain[vars_cat] <- lapply(Coffee_Chain[vars_cat], as.factor)

results <- lapply(vars_cat, function(var) {
  formula <- as.formula(paste("Profit ~", paste0("`", var, "`")))
  model <- aov(formula, data = Coffee_Chain)
  summary(model)
})

names(results) <- vars_cat

results
## $Market
##               Df   Sum Sq Mean Sq F value   Pr(>F)    
## Market         3   288811   96270   9.361 3.64e-06 ***
## Residuals   4244 43644825   10284                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## $Market.Size
##               Df   Sum Sq Mean Sq F value Pr(>F)    
## Market.Size    1  2611722 2611722   268.4 <2e-16 ***
## Residuals   4246 41321915    9732                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## $Product
##               Df   Sum Sq Mean Sq F value Pr(>F)    
## Product       12  4267412  355618   37.97 <2e-16 ***
## Residuals   4235 39666224    9366                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## $Product.Line
##                Df   Sum Sq Mean Sq F value Pr(>F)  
## Product.Line    1    45377   45377    4.39 0.0362 *
## Residuals    4246 43888259   10336                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## $Product.Type
##                Df   Sum Sq Mean Sq F value  Pr(>F)   
## Product.Type    3   141680   47227   4.577 0.00333 **
## Residuals    4244 43791957   10319                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## $State
##               Df   Sum Sq Mean Sq F value Pr(>F)    
## State         19  5550662  292140   32.18 <2e-16 ***
## Residuals   4228 38382975    9078                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## $Type
##               Df   Sum Sq Mean Sq F value Pr(>F)  
## Type           1    36386   36386   3.519 0.0607 .
## Residuals   4246 43897251   10338                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Hasil Uji One Way ANOVA
Variable P_Value Significance
Market < 0.001 Signifikan
Market.Size < 0.001 Signifikan
Product < 0.001 Signifikan
Product.Line 0.036 Signifikan
Product.Type 0.003 Signifikan
State < 0.001 Signifikan
Type 0.061 Tidak Signifikan
V. Kesimpulan

Berdasarkan hasil uji One Way ANOVA, diperoleh bahwa sebagian besar variabel kategorik memiliki nilai p-value kurang dari 0,05, sehingga H0 ditolak. Hal ini menunjukkan bahwa terdapat perbedaan rata-rata profit yang signifikan antar kategori pada variabel Market, Market Size, Product, Product Line, Product Type, dan State.

Sementara itu, variabel Type memiliki nilai p-value lebih dari 0,05, sehingga H0 tidak ditolak, yang berarti tidak terdapat perbedaan rata-rata profit yang signifikan antar kategori pada variabel tersebut.

2.2.2 Visualisasi

Untuk memperoleh gambaran yang lebih jelas mengenai kekuatan pengaruh masing-masing variabel, dilakukan analisis lanjutan dengan membandingkan nilai F yang digunakan untuk menunjukkan besarnya variasi antar kelompok dibandingkan dengan variasi dalam kelompok, sehingga dapat digunakan untuk mengidentifikasi variabel yang paling dominan.

Berdasarkan visualisasi nilai F, terlihat bahwa variabel Market Size memiliki nilai F yang jauh lebih tinggi dibandingkan variabel kategorik lainnya. Perbedaan yang cukup signifikan ini menunjukkan bahwa variasi rata-rata profit antar kategori pada Market Size jauh lebih besar dibandingkan variabel lainnya.

Hal ini mengindikasikan bahwa Market Size merupakan faktor yang paling dominan dalam menjelaskan variasi profit. Dengan kata lain, perbedaan ukuran pasar (misalnya small market dan major market) memberikan dampak yang paling kuat terhadap perubahan nilai profit dibandingkan faktor kategorik lainnya.

Sementara itu, variabel lain seperti Product dan State juga menunjukkan pengaruh, namun kontribusinya relatif lebih kecil jika dibandingkan dengan Market Size. Variabel lainnya memiliki nilai F yang rendah, sehingga pengaruhnya terhadap variasi profit cenderung terbatas.

2.3. Analisis Pengaruh Sales dan Market Size terhadap Profit Menggunakan Regresi Linear

2.3.1 Uji Hipotesis

I. Hipotesis

\(H_0a : \beta_1 = 0\) (Sales tidak berpengaruh terhadap profit) \(H_1a : \beta_1 ≠ 0\) (Sales berpengaruh terhadap profit)

\(H_0b : \beta_1 = 0\) (Market Size tidak berpengaruh terhadap profit) \(H_1b : \beta_1 ≠ 0\) (Market Size berpengaruh terhadap profit)

II. Taraf Signifikansi

\(\alpha\) = 0.05

III. Daerah Kritis

Tolak \(H_0\) jika p-value \(< \alpha\)

IV. Statistik Uji
# cek tipe data 
Coffee_Chain$Market.Size <- as.factor(Coffee_Chain$Market.Size)

# model regresi
model_reg <- lm(Profit ~ Sales + Market.Size, data = Coffee_Chain)
summary(model_reg)
## 
## Call:
## lm(formula = Profit ~ Sales + Market.Size, data = Coffee_Chain)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -606.29   -9.17   11.80   28.30  466.85 
## 
## Coefficients:
##                           Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             -42.492002   2.209420 -19.232   <2e-16 ***
## Sales                     0.536628   0.006548  81.950   <2e-16 ***
## Market.SizeSmall Market   0.045542   2.018930   0.023    0.982    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 61.4 on 4245 degrees of freedom
## Multiple R-squared:  0.6357, Adjusted R-squared:  0.6356 
## F-statistic:  3704 on 2 and 4245 DF,  p-value: < 2.2e-16
plot(Coffee_Chain$Sales, Coffee_Chain$Profit,
     col = "#6F4E37",
     pch = 16,
     main = "Hubungan Sales terhadap Profit",
     xlab = "Sales",
     ylab = "Profit")

abline(lm(Profit ~ Sales, data = Coffee_Chain),
       col = "red",
       lwd = 2)

V. Kesimpulan

Berdasarkan hasil analisis regresi, variabel Sales memiliki pengaruh yang signifikan terhadap profit (p-value < 0,05), sehingga H0 ditolak. Hal ini menunjukkan bahwa peningkatan nilai Sales akan diikuti oleh peningkatan profit.

Sementara itu, variabel Market Size tidak menunjukkan pengaruh yang signifikan terhadap profit (p-value > 0,05) setelah mempertimbangkan variabel Sales. Hal ini mengindikasikan bahwa pengaruh Market Size terhadap profit tidak bersifat langsung, melainkan kemungkinan dimediasi oleh variabel Sales.

2.4. Analisis Kinerja Profit terhadap Target Menggunakan Pendekatan Gap Analysis

Berdasarkan hasil analisis regresi sebelumnya, diketahui bahwa Sales merupakan faktor utama yang memengaruhi profit. Namun, analisis tersebut hanya menggambarkan hubungan antar variabel aktual tanpa mempertimbangkan pencapaian terhadap target yang telah ditetapkan. Oleh karena itu, dilakukan analisis lanjutan menggunakan pendekatan gap analysis untuk mengevaluasi kinerja profit dan penjualan terhadap budget.

Analisis ini bertujuan untuk memperkuat hasil sebelumnya dengan memberikan perspektif tambahan mengenai apakah peningkatan Sales yang signifikan benar-benar diikuti oleh pencapaian profit sesuai target.

Coffee_Chain$Profit_Gap <- Coffee_Chain$Profit - Coffee_Chain$`Budget.Profit`
Coffee_Chain$Sales_Gap  <- Coffee_Chain$Sales  - Coffee_Chain$`Budget.Sales`

summary(Coffee_Chain$Profit_Gap)
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## -369.0000  -14.0000   -4.0000    0.1843    9.0000  249.0000
summary(Coffee_Chain$Sales_Gap)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -310.00    0.00   16.00   17.34   34.00  347.00
hist(Coffee_Chain$Profit_Gap,
     col = "#6F4E37",
     main = "Distribusi Profit Gap",
     xlab = "Profit Gap")

hist(Coffee_Chain$Sales_Gap,
     col = "#A1887F",
     main = "Distribusi Sales Gap",
     xlab = "Sales Gap")

Distribusi menunjukkan bahwa sales secara umum melebihi target karena nilai median dan rata-rata Sales Gap bernilai positif. Namun, profit tidak selalu mengikuti karena median Profit Gap bernilai negatif dan memiliki rentang yang cukup lebar. Hal ini menunjukkan bahwa meskipun penjualan meningkat, profit tidak selalu mencapai target.

Untuk memahami fenomena tersebut secara lebih mendalam, dilakukan analisis lanjutan menggunakan regresi dengan mempertimbangkan selisih antara nilai aktual dan target, serta memasukkan variabel biaya ke dalam model.

lm(Profit_Gap ~ Sales_Gap + COGS + Marketing, data = Coffee_Chain)
## 
## Call:
## lm(formula = Profit_Gap ~ Sales_Gap + COGS + Marketing, data = Coffee_Chain)
## 
## Coefficients:
## (Intercept)    Sales_Gap         COGS    Marketing  
##    -10.0946       0.5028       0.1974      -0.4843
plot(Coffee_Chain$Sales_Gap, Coffee_Chain$Profit_Gap,
     col = "#A1887F",
     pch = 16,
     main = "Hubungan Sales Gap terhadap Profit Gap",
     xlab = "Sales Gap",
     ylab = "Profit Gap")

abline(lm(Profit_Gap ~ Sales_Gap, data = Coffee_Chain),
       col = "blue",
       lwd = 2)

Hasil regresi menunjukkan bahwa Sales Gap berpengaruh positif terhadap Profit Gap karena koefisiennya bernilai positif. Sementara itu, variabel Marketing berpengaruh negatif karena memiliki koefisien negatif, yang menunjukkan bahwa peningkatan biaya dapat menurunkan pencapaian profit. Oleh karena itu, meskipun penjualan meningkat, profit tetap dapat tertekan oleh biaya.

Berdasarkan hasil tersebut, dapat disimpulkan bahwa peningkatan penjualan memang berperan penting dalam meningkatkan profit, namun tidak selalu menjamin tercapainya target profit. Hal ini disebabkan oleh adanya faktor biaya yang turut memengaruhi hasil akhir. Dengan demikian, pencapaian profit tidak hanya bergantung pada peningkatan penjualan, tetapi juga pada efisiensi dalam pengelolaan biaya.

3. Penutup

3.1. Kesimpulan

Berdasarkan hasil analisis yang telah dilakukan, diperoleh beberapa temuan utama. Pertama, hasil analisis korelasi dan regresi menunjukkan bahwa variabel Sales memiliki pengaruh positif dan signifikan terhadap profit, sehingga peningkatan penjualan menjadi faktor utama dalam meningkatkan profit. Selain itu, variabel kategorik seperti Market Size juga terbukti memiliki pengaruh terhadap profit berdasarkan hasil uji ANOVA.

Kedua, analisis gap menunjukkan bahwa secara umum penjualan cenderung melebihi target, namun pencapaian profit tidak selalu mengikuti. Hal ini terlihat dari distribusi profit gap yang masih menunjukkan adanya nilai di bawah target.

Ketiga, hasil regresi gap menunjukkan bahwa Sales Gap berpengaruh positif terhadap Profit Gap, yang berarti pencapaian penjualan terhadap target tetap berperan dalam meningkatkan profit. Namun, variabel biaya seperti Marketing memiliki pengaruh negatif terhadap Profit Gap, yang mengindikasikan bahwa peningkatan biaya dapat menurunkan pencapaian profit.

Dengan demikian, dapat disimpulkan bahwa meskipun Sales merupakan faktor utama dalam meningkatkan profit, pencapaian profit yang optimal juga sangat dipengaruhi oleh efisiensi dalam pengelolaan biaya.

3.2. Saran

Berdasarkan hasil analisis yang diperoleh, terdapat beberapa saran yang dapat diberikan. Pertama, perusahaan disarankan untuk terus meningkatkan kinerja penjualan karena terbukti memiliki pengaruh yang signifikan terhadap profit.

Kedua, perusahaan perlu lebih memperhatikan pengelolaan biaya, khususnya biaya pemasaran, agar peningkatan penjualan dapat diikuti dengan peningkatan profit yang optimal.

Ketiga, dalam pengambilan keputusan bisnis, perusahaan sebaiknya tidak hanya berfokus pada peningkatan penjualan, tetapi juga mempertimbangkan efisiensi biaya agar target profit dapat tercapai secara konsisten.

Keempat, untuk analisis selanjutnya, disarankan untuk memasukkan lebih banyak variabel biaya atau melakukan analisis lanjutan guna memahami faktor-faktor lain yang memengaruhi profit secara lebih komprehensif.