Pendahuluan

Latar Belakang

Dalam dunia bisnis, peningkatan penjualan seringkali dianggap sebagai indikator keberhasilan suatu perusahaan. Semakin tinggi nilai penjualan, semakin tinggi pula keuntungan yang diharapkan. Namun, pada praktiknya, hubungan antara penjualan dan keuntungan tidak selalu linier. Terdapat berbagai faktor lain seperti biaya produksi dan biaya operasional yang dapat memengaruhi besarnya profit yang diperoleh.

Pada industri ritel khususnya pada bisnis coffe chain, variasi kinerja antar wilayah juga menjadi faktor penting dalam menentukan keberhasilan bisnis. Setiap wilayah memiliki karakteristik pasar, tingkat penjualan, serta struktur biaya yang berbeda, sehingga dapat menghasilkan tingkat profit yang berbeda pula.

Berdasarkan hal tersebut, muncul pertanyaan apakah penjualan yang tinggi selalu menghasilkan keuntungan yang tinggi, serta bagaimana peran faktor biaya dan perbedaan wilayah dalam memengaruhi profit. Oleh karena itu, diperlakukan analisis lebih lanjut untuk memahami hubungan antara sales, profit, dan biaya pada berbagai market.

Rumusan Masalah

Berdasarkan latar belakang tersebut, rumusan masalah dalam penelitian ini adalah:

  1. Apakah terdapat hubungan antara sales dan profit pada Coffee Chain Dataset?
  2. Apakah terdapat perbedaan profit antar market?
  3. Apakah penjualan yang tinggi selalu menghasilkan profit yang tinggi?

Tujuan

Adapun tujuan dari penelitian ini adalah:

  1. Menganalisis hubungan antara sales dan profit.
  2. Mengidentifikasi perbedaan profit antar market.
  3. Mengetahui apakah penjualan yang tinggi selalu diikuti oleh peningkatan profit.

Deskripsi Data

Dataset yang digunakan dalam penelitian ini adalah Coffee Chain Dataset, yang berisi data transaksi penjualan dari jaringan kedai kopi yang memiliki banyak cabang di berbagai wilayah (market). Data ini mencakup informasi terkait penjualan, keuntungan, biaya, karakteristik pasar, serta target kinerja yang ditetapkan perusahaan. Dataset ini digunakan untuk menganalisis hubungan antara penjualan dan keuntungan, serta untuk mengidentifikasi perbedaan performa bisnis antar wilayah. Selain itu, data ini juga memungkinkan dilakukan evaluasi terhadap efisiensi operasional dan pencapaian target yang telah direncanakan.

Eksplorasi Data

Packages

R menyediakan packages yang memilki fungsi-fungsi khusus seperti analisis statistik, visualisasi, manipulasi data dan berbagai fungsi lainnya. Berikut merupakan packages yang digunakan untuk analisis.

library(openxlsx)
library(dplyr)
library(ggplot2)
library(kableExtra)

Import data

Berikut adalah 10 observasi pertama dari keseluruhan observasi:

Area.Code Date Market Market.Size Product Product.Line Product.Type State Type Budget.COGS Budget.Margin Budget.Profit Budget.Sales COGS Inventory Margin Marketing Profit Sales Total.Expenses
719 40909 Central Major Market Amaretto Beans Coffee Colorado Regular 90 130 100 220 89 777 130 24 94 219 36
970 40909 Central Major Market Colombian Beans Coffee Colorado Regular 80 110 80 190 83 623 107 27 68 190 39
970 40909 Central Major Market Decaf Irish Cream Beans Coffee Colorado Decaf 100 140 110 240 95 821 139 26 101 234 38
303 40909 Central Major Market Green Tea Leaves Tea Colorado Regular 30 50 30 80 44 623 56 14 30 100 26
303 40909 Central Major Market Caffe Mocha Beans Espresso Colorado Regular 60 90 70 150 54 456 80 15 54 134 26
720 40909 Central Major Market Decaf Espresso Beans Espresso Colorado Decaf 80 130 80 210 72 558 108 23 53 180 55
970 40909 Central Major Market Chamomile Leaves Herbal Tea Colorado Decaf 140 160 110 300 170 1091 171 47 99 341 72
719 40909 Central Major Market Lemon Leaves Herbal Tea Colorado Decaf 50 80 20 130 63 435 87 57 0 150 87
970 40909 Central Major Market Mint Leaves Herbal Tea Colorado Decaf 50 70 40 120 60 336 80 19 33 140 47
719 40909 Central Major Market Darjeeling Leaves Tea Colorado Regular 40 70 20 110 58 338 72 22 17 130 55
  • Area.Code → Kode area
  • Date → Tanggal
  • Market → Daerah atau Wilayah
  • Market.Size → Segmentasi pasar atau ukuran Market
  • Product → Jenis produk
  • Product.Line → Bentuk produk
  • Product.Type → Tipe produk
  • State → Negara bagian (AS)
  • Type → Jenis produk, kafein atau non kafein
  • Budget.COGS → Estimasi biaya pokok penjualan
  • Budget.Margin → Estimasi margin keuntungan
  • Budget.Profit → Estimasi keuntungan
  • Budget.Sales → Estimasi total penjualan
  • COGS → Biaya pokok penjualan aktual
  • Inventory → Jumlah stok barang yang tersedia
  • Margin → Margin keuntungan aktual
  • Marketing → Biaya pemasaran
  • Profit → Keuntungan aktual
  • Sales → Total penjualan aktual
  • Total.Expenses → Total seluruh biaya yang dikeluarkan

Struktur data

Berikut merupakan struktur dari masing-masing variabel pada data yang nantinya akan digunakan untuk analisis.

## 'data.frame':    4248 obs. of  20 variables:
##  $ Area.Code     : num  719 970 970 303 303 720 970 719 970 719 ...
##  $ Date          : num  40909 40909 40909 40909 40909 ...
##  $ Market        : chr  "Central" "Central" "Central" "Central" ...
##  $ Market.Size   : chr  "Major Market" "Major Market" "Major Market" "Major Market" ...
##  $ Product       : chr  "Amaretto" "Colombian" "Decaf Irish Cream" "Green Tea" ...
##  $ Product.Line  : chr  "Beans" "Beans" "Beans" "Leaves" ...
##  $ Product.Type  : chr  "Coffee" "Coffee" "Coffee" "Tea" ...
##  $ State         : chr  "Colorado" "Colorado" "Colorado" "Colorado" ...
##  $ Type          : chr  "Regular" "Regular" "Decaf" "Regular" ...
##  $ Budget.COGS   : num  90 80 100 30 60 80 140 50 50 40 ...
##  $ Budget.Margin : num  130 110 140 50 90 130 160 80 70 70 ...
##  $ Budget.Profit : num  100 80 110 30 70 80 110 20 40 20 ...
##  $ Budget.Sales  : num  220 190 240 80 150 210 300 130 120 110 ...
##  $ COGS          : num  89 83 95 44 54 72 170 63 60 58 ...
##  $ Inventory     : num  777 623 821 623 456 ...
##  $ Margin        : num  130 107 139 56 80 108 171 87 80 72 ...
##  $ Marketing     : num  24 27 26 14 15 23 47 57 19 22 ...
##  $ Profit        : num  94 68 101 30 54 53 99 0 33 17 ...
##  $ Sales         : num  219 190 234 100 134 180 341 150 140 130 ...
##  $ Total.Expenses: num  36 39 38 26 26 55 72 87 47 55 ...

Dapat dilihat dataset ini berisi total 4248 observasi dengan 20 variabel. Terdapat 7 data tipe chr dan 13 data tipe num. Kolom Date memiliki tipe data num, tetapi karena kolom date tidak akan digunakan untuk analisis kedepan maka kolom Date saya biarkan bertipe num.

Cek Missing Value

##      Area.Code           Date         Market    Market.Size        Product 
##              0              0              0              0              0 
##   Product.Line   Product.Type          State           Type    Budget.COGS 
##              0              0              0              0              0 
##  Budget.Margin  Budget.Profit   Budget.Sales           COGS      Inventory 
##              0              0              0              0              0 
##         Margin      Marketing         Profit          Sales Total.Expenses 
##              0              0              0              0              0

Setelah dilakukan pengecekan missing value, tidak ditemukan nilai yang hilang pada dataset sehingga bisa langsung dilanjutkan untuk analisis.

Metode analisis

Analisis Deskriptif

Analisis deskriptif dilakukan untuk mengetahui gambaran umum data profit dan sales pada masing-masing market. Statistik yang dihitung meliputi total dan rata-rata (mean) dari kedua variabel tersebut.

data %>%
  group_by(Market) %>% 
  summarise(total_profit = sum(Profit),
            avg_profit = mean(Profit),
            total_sales = sum(Sales),
            avg_sales = mean(Sales)
            )
## # A tibble: 4 × 5
##   Market  total_profit avg_profit total_sales avg_sales
##   <chr>          <dbl>      <dbl>       <dbl>     <dbl>
## 1 Central        93852       69.8      265045      197.
## 2 East           59217       66.7      178576      201.
## 3 South          32478       48.3      103926      155.
## 4 West           73996       55.1      272264      203.

Berdasarkan hasil analisis, market Central memiliki total dan rata-rata profit tertinggi dibandingkan market lainnya. Sementara itu, market West mencatat total dan rata-rata sales tertinggi, namun tidak diikuti oleh profit yang paling tinggi. Di sisi lain, market South memiliki nilai profit paling rendah baik secara total maupun rata-rata. Hal ini menunjukkan bahwa tingginya nilai sales tidak selalu berbanding lurus dengan profit yang dihasilkan.

Hubungan Sales dan Profit

Pada tahap ini ingin dilihat apakah ada hubungan antara Sales dengan Profit menggunakan Scatter plot dan korelasi Spearman.

Uji normalitas

Sebelum melakukan analisis hubungan antara sales dan profit, terlebih dahulu dilakukan uji normalitas untuk mengetahui distribusi data. Uji normalitas ini penting sebagai dasar dalam menentukan metode analisis yang tepat.

\(H_0:\) Data berdistribusi normal

\(H_1:\) Data tidak berdistribusi normal

\(\alpha=0.05\)

shapiro.test(data$Profit)
## 
##  Shapiro-Wilk normality test
## 
## data:  data$Profit
## W = 0.79969, p-value < 2.2e-16
shapiro.test(data$Sales)
## 
##  Shapiro-Wilk normality test
## 
## data:  data$Sales
## W = 0.78969, p-value < 2.2e-16

Karena kedua p-value \(<\alpha\) maka tolak \(H_0\) . Berarti data profit dan data sales tidak berdistribusi normal

Korelasi Spearman

Uji korelasi spearman dilakukan karena data awal tidak berdistribusi normal.

\(H_0:\) Tidak terdapat hubungan antara sales dan profit

\(H_1:\) Terdapat hubungan antara sales dan profit

\(\alpha=0.05\)

cor.test(data$Sales, data$Profit, method = "spearman", exact = FALSE)
## 
##  Spearman's rank correlation rho
## 
## data:  data$Sales and data$Profit
## S = 2909365515, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.7722827

Berdasarkan hasil uji korelasi Spearman dengan tingkat signifikansi α = 0,05, diperoleh nilai p-value < 0,05 sehingga H₀ ditolak. Hal ini menunjukkan bahwa terdapat hubungan yang signifikan antara sales dan profit. Nilai koefisien korelasi (ρ) sebesar 0,772 mengindikasikan bahwa hubungan antara kedua variabel bersifat kuat dan positif, yang berarti semakin tinggi nilai sales maka cenderung diikuti oleh peningkatan profit. Namun demikian, berdasarkan visualisasi scatter plot terlihat adanya variasi data dan beberapa outlier, sehingga hubungan tersebut tidak sepenuhnya bersifat linear dan tidak selalu konsisten pada setiap pengamatan.

Scatter Plot

Visualisasi hubungan ditampilkan melalui scatter plot untuk memperjelas pola keterkaitan antar variabel.

Berdasarkan scatter plot, terlihat adanya kecenderugan hubungan positif antara sales dan profit. Namun sebaran data yang cukup besar dan adanya outlier menunjukkan bahwa hubungan tersebut tidak sepenuhnya kuat.

Perbedaan profit antar market

Kruskal-wallis

\(H_0:\) Median profit pada semua market sama

\(H_1:\) Minimal terdapat satu market yang memiliki median profit berbeda

\(\alpha=0.05\)

kruskal.test(data$Profit~data$Market, data = data)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  data$Profit by data$Market
## Kruskal-Wallis chi-squared = 26.504, df = 3, p-value = 7.48e-06

Berdasarkan hasil uji Kruskal-Wallis dengan tingkat signifikansi α = 0,05, diperoleh p-value < 0,05 sehingga H₀ ditolak. Hal ini menunjukkan bahwa terdapat perbedaan median profit yang signifikan antar market. Dengan demikian, dapat disimpulkan bahwa tidak semua market memiliki tingkat profit yang sama, sehingga diperlukan analisis lanjutan (post hoc) untuk mengetahui pasangan market mana yang memiliki perbedaan signifikan.

Post-hoc

pairwise.wilcox.test(data$Profit, data$Market)
## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  data$Profit and data$Market 
## 
##       Central East  South
## East  0.040   -     -    
## South 7.5e-07 0.047 -    
## West  0.026   0.994 0.040
## 
## P value adjustment method: holm

Berdasarkan hasil uji post hoc menggunakan pairwise Wilcoxon dengan metode koreksi Holm, diperoleh bahwa hampir seluruh pasangan market menunjukkan perbedaan profit yang signifikan (p-value < 0,05). Namun, terdapat satu pasangan yang tidak menunjukkan perbedaan signifikan, yaitu antara market West dan East (p-value > 0,05). Hal ini menunjukkan bahwa meskipun secara umum terdapat perbedaan profit antar market, namun tidak semua market memiliki perbedaan yang signifikan satu sama lain.

ggplot(data, aes(x = Market, y = Profit)) +
  geom_boxplot()

Visualisasi menggunakan boxplot menunjukkan adanya perbedaan distribusi profit antar market. Market South memiliki median profit yang lebih rendah dibandingkan market lainnya, sedangkan market Central, East, dan West memiliki median yang relatif lebih tinggi dan tidak jauh berbeda satu sama lain. Selain itu, market East dan West menunjukkan sebaran data yang lebih besar dengan banyak outlier, yang mengindikasikan variasi profit yang tinggi. Hasil ini sejalan dengan uji post hoc yang menunjukkan bahwa sebagian besar pasangan market memiliki perbedaan signifikan, kecuali antara market West dan East yang memiliki distribusi profit yang relatif serupa.

Pengaruh biaya terhadap profit

Regresi COGS

\(H_0: \beta_1 = 0\) (COGS tidak berpengaruh terhadap profit)

\(H_1:\beta_1≠0\) (COGS berpengaruh terhadap profit)

\(\alpha=0.05\)

model3 <- lm(Profit ~ COGS, data = data)
summary(model3)
## 
## Call:
## lm(formula = Profit ~ COGS, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -852.05  -20.76    2.30   25.38  739.70 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  1.73939    2.21812   0.784    0.433    
## COGS         0.70302    0.02055  34.210   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 90.06 on 4246 degrees of freedom
## Multiple R-squared:  0.2161, Adjusted R-squared:  0.2159 
## F-statistic:  1170 on 1 and 4246 DF,  p-value: < 2.2e-16

Berdasarkan hasil analisis regresi linear sederhana, diperoleh bahwa variabel COGS memiliki pengaruh yang signifikan terhadap profit (p-value < 0,05) dengan koefisien sebesar 0,703. Hal ini menunjukkan bahwa peningkatan biaya produksi cenderung diikuti oleh peningkatan profit. Nilai koefisien determinasi (R²) sebesar 0,2161 menunjukkan bahwa model mampu menjelaskan sekitar 21,61% variasi profit. Meskipun demikian, kemampuan model ini masih terbatas dibandingkan dengan model yang melibatkan lebih dari satu variabel, sehingga dapat disimpulkan bahwa profit tidak hanya dipengaruhi oleh COGS, tetapi juga oleh faktor lain seperti biaya marketing dan variabel lainnya.

Scatter plot COGS

ggplot(data, aes(x = COGS, y = Profit)) +
  geom_point() +
  geom_smooth(method = "lm") +
  facet_wrap(~Market)
## `geom_smooth()` using formula = 'y ~ x'

Visualisasi hubungan antara COGS dan profit pada masing-masing market menunjukkan adanya kecenderungan hubungan positif di seluruh wilayah, dimana peningkatan COGS diikuti oleh peningkatan profit. Pada market Central dan South, pola hubungan terlihat lebih stabil dan konsisten dengan sebaran data yang relatif rapat. Sementara itu, pada market East dan West, terlihat variasi yang lebih besar dengan adanya beberapa nilai profit negatif pada tingkat COGS yang tinggi, yang menunjukkan bahwa peningkatan biaya produksi tidak selalu menghasilkan keuntungan yang lebih tinggi. Hal ini mengindikasikan bahwa meskipun COGS berperan dalam meningkatkan profit, efisiensi biaya dan faktor lain tetap memengaruhi hasil akhir pada masing-masing market.

Regresi total expenses

\(H_0: \beta_1 = 0\) (Total expenses tidak berpengaruh terhadap profit)

\(H_1:\beta_1≠0\) (Total expenses berpengaruh terhadap profit)

\(\alpha=0.05\)

model <- lm(Profit ~ Total.Expenses, data = data)
summary(model)
## 
## Call:
## lm(formula = Profit ~ Total.Expenses, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -757.52  -37.61   -9.44   34.14  721.97 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    27.10926    2.97820   9.103   <2e-16 ***
## Total.Expenses  0.62868    0.04727  13.299   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 99.67 on 4246 degrees of freedom
## Multiple R-squared:  0.03999,    Adjusted R-squared:  0.03976 
## F-statistic: 176.9 on 1 and 4246 DF,  p-value: < 2.2e-16

Berdasarkan hasil analisis regresi linear sederhana, diperoleh bahwa variabel total expenses memiliki pengaruh yang signifikan terhadap profit (p-value < 0,05) dengan koefisien sebesar 0,6287. Hal ini menunjukkan bahwa secara rata-rata peningkatan biaya diikuti oleh peningkatan profit. Namun, nilai koefisien determinasi (R²) yang sangat kecil yaitu sebesar 0,0399 menunjukkan bahwa kemampuan total expenses dalam menjelaskan variasi profit sangat rendah. Hal ini diperkuat oleh hasil visualisasi scatter plot yang menunjukkan sebaran data yang luas dan tidak konsisten. Dengan demikian, dapat disimpulkan bahwa meskipun terdapat hubungan yang signifikan, pengaruh total expenses terhadap profit relatif lemah dan profit lebih dipengaruhi oleh faktor lain.

Scatter plot Total Expenses

ggplot(data, aes(x = Total.Expenses, y = Profit)) +
  geom_point() +
  geom_smooth(method = "lm") +
  facet_wrap(~Market)
## `geom_smooth()` using formula = 'y ~ x'

Visualisasi hubungan antara total expenses dan profit pada masing-masing market menunjukkan pola yang berbeda antar wilayah. Pada market Central dan South, terlihat adanya kecenderungan hubungan positif yang relatif stabil, dimana peningkatan biaya diikuti oleh peningkatan profit, meskipun dengan variasi yang tidak terlalu besar. Sebaliknya, pada market East dan West, sebaran data terlihat lebih luas dan tidak konsisten, dengan adanya sejumlah observasi yang menunjukkan profit negatif pada tingkat biaya yang tinggi. Hal ini mengindikasikan bahwa pada beberapa market, peningkatan total expenses tidak selalu diikuti oleh peningkatan profit, sehingga efisiensi pengelolaan biaya menjadi faktor penting dalam menentukan kinerja profit di masing-masing market.

Regresi COGS+Marketing

\(H_0: \beta_1 = 0\) (COGS bersama Marketing tidak berpengaruh terhadap profit)

\(H_1:\beta_1≠0\) (COGS bersama Marketing berpengaruh terhadap profit)

\(\alpha=0.05\)

model2<-lm(Profit ~ COGS + Marketing, data = data)
summary(model2)
## 
## Call:
## lm(formula = Profit ~ COGS + Marketing, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -832.16  -15.37   -1.00   20.57  733.49 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  7.77809    2.13296   3.647 0.000269 ***
## COGS         1.28315    0.03406  37.676  < 2e-16 ***
## Marketing   -1.76434    0.08476 -20.817  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 85.8 on 4245 degrees of freedom
## Multiple R-squared:  0.2887, Adjusted R-squared:  0.2884 
## F-statistic: 861.4 on 2 and 4245 DF,  p-value: < 2.2e-16

Berdasarkan hasil analisis regresi linear berganda, diperoleh bahwa variabel COGS dan marketing memiliki pengaruh yang signifikan terhadap profit (p-value < 0,05). Variabel COGS memiliki koefisien positif sebesar 1,283 yang menunjukkan bahwa peningkatan biaya produksi cenderung diikuti oleh peningkatan profit, yang mengindikasikan adanya peningkatan aktivitas penjualan. Sebaliknya, variabel marketing memiliki koefisien negatif sebesar -1,764 yang menunjukkan bahwa peningkatan biaya marketing cenderung menurunkan profit. Nilai koefisien determinasi (R²) sebesar 0,2887 menunjukkan bahwa model mampu menjelaskan sekitar 28,87% variasi profit, sehingga dapat dikatakan bahwa variabel biaya memiliki pengaruh yang cukup terhadap profit, meskipun masih terdapat faktor lain yang memengaruhi.

Scatter plot COGS+Marketing

ggplot(data, aes(x = COGS, y = Profit, color = Marketing)) +
  geom_point() +
  facet_wrap(~Market)

Visualisasi hubungan antara COGS dan profit per market menunjukkan adanya perbedaan pola yang cukup jelas antar wilayah. Market Central dan South menunjukkan hubungan yang relatif stabil dan konsisten, dimana peningkatan COGS diikuti oleh peningkatan profit. Sebaliknya, market East dan West menunjukkan sebaran data yang lebih luas dengan adanya beberapa nilai profit negatif pada tingkat COGS yang tinggi, yang mengindikasikan adanya ketidakefisienan dalam pengelolaan biaya. Hal ini menunjukkan bahwa meskipun secara umum terdapat hubungan positif antara biaya dan profit, karakteristik masing-masing market memengaruhi tingkat kestabilan dan efisiensi dalam menghasilkan profit.

Regresi Sales + COGS + Marketing

\(H_0: \beta_1 = 0\) (Sales bersama COGS dan Marketing tidak berpengaruh terhadap profit)

\(H_1:\beta_1≠0\) (Sales bersama COGS dan Marketing berpengaruh terhadap profit)

\(\alpha=0.05\)

model4<-lm(Profit ~ Sales + COGS + Marketing, data = data)
summary(model4)
## 
## Call:
## lm(formula = Profit ~ Sales + COGS + Marketing, data = data)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -123.137  -11.828   -0.518    9.241  101.270 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -22.801081   0.521941  -43.69   <2e-16 ***
## Sales         1.193813   0.004503  265.12   <2e-16 ***
## COGS         -1.195341   0.012388  -96.49   <2e-16 ***
## Marketing    -1.461141   0.020260  -72.12   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.48 on 4244 degrees of freedom
## Multiple R-squared:  0.9595, Adjusted R-squared:  0.9595 
## F-statistic: 3.351e+04 on 3 and 4244 DF,  p-value: < 2.2e-16

Berdasarkan hasil regresi linear berganda yang melibatkan variabel sales, COGS, dan marketing, diperoleh nilai koefisien determinasi (R²) yang sangat tinggi yaitu sebesar 0,9595. Hal ini menunjukkan bahwa model mampu menjelaskan hampir seluruh variasi profit. Namun, hasil ini perlu diinterpretasikan dengan hati-hati karena variabel-variabel tersebut secara langsung merupakan komponen pembentuk profit. Dengan demikian, tingginya nilai R² lebih mencerminkan hubungan matematis antar variabel dibandingkan hubungan statistik yang independen. Oleh karena itu, model ini lebih tepat digunakan sebagai validasi konsep bahwa profit dipengaruhi oleh selisih antara pendapatan dan biaya, bukan sebagai model utama untuk analisis pengaruh.

Plot Sales + COGS + Marketing

plot(model4) 

Hasil analisis diagnostik model menunjukkan bahwa meskipun model memiliki nilai koefisien determinasi yang sangat tinggi, terdapat beberapa pelanggaran asumsi regresi. Plot residual menunjukkan adanya pola tertentu yang mengindikasikan hubungan yang tidak sepenuhnya linear. Selain itu, Q-Q plot menunjukkan bahwa residual tidak berdistribusi normal, serta plot scale-location mengindikasikan adanya heteroskedastisitas. Ditemukan pula beberapa titik dengan leverage tinggi yang berpotensi memengaruhi model. Hal ini menunjukkan bahwa meskipun model mampu menjelaskan sebagian besar variasi data, interpretasi hasil perlu dilakukan dengan hati-hati.

Penutup

Kesimpulan

Berdasarkan hasil analisis, dapat disimpulkan bahwa penjualan yang tinggi tidak selalu menghasilkan profit yang tinggi. Meskipun uji korelasi Spearman menunjukkan adanya hubungan yang kuat dan positif antara sales dan profit (ρ = 0,772), namun hasil visualisasi scatter plot memperlihatkan adanya variasi data yang cukup besar serta beberapa outlier, termasuk kondisi dimana sales tinggi tidak diikuti oleh profit yang tinggi bahkan bernilai negatif. Selain itu, hasil analisis deskriptif juga menunjukkan bahwa market dengan nilai sales tertinggi tidak selalu memiliki profit tertinggi.

Lebih lanjut, hasil analisis regresi menunjukkan bahwa faktor biaya juga memiliki peran penting dalam menentukan profit. Variabel COGS dan marketing terbukti berpengaruh signifikan terhadap profit, dimana COGS cenderung berhubungan positif sebagai indikator aktivitas penjualan, sedangkan biaya marketing berpengaruh negatif karena secara langsung mengurangi keuntungan. Hal ini menunjukkan bahwa meskipun penjualan meningkat, profit dapat tetap rendah apabila diikuti oleh peningkatan biaya yang tidak efisien.

Oleh karena itu, dapat disimpulkan bahwa terdapat hubungan antara sales dan profit, namun hubungan tersebut tidak bersifat mutlak karena profit dipengaruhi oleh interaksi antara penjualan dan biaya, serta perbedaan karakteristik antar market.

Saran

Berdasarkan hasil analisis yang telah dilakukan, disarankan bagi pihak manajemen untuk tidak hanya berfokus pada peningkatan penjualan, tetapi juga memperhatikan efisiensi biaya, khususnya biaya marketing yang terbukti memiliki pengaruh negatif terhadap profit. Pengendalian biaya yang baik diperlukan agar peningkatan sales dapat benar-benar memberikan dampak positif terhadap keuntungan.

Selain itu, perbedaan karakteristik antar market juga perlu menjadi perhatian dalam pengambilan keputusan bisnis, sehingga strategi yang diterapkan dapat disesuaikan dengan kondisi masing-masing wilayah.

Untuk penelitian selanjutnya, disarankan untuk mempertimbangkan variabel lain yang dapat memengaruhi profit, serta menggunakan metode analisis yang lebih kompleks agar dapat memberikan pemahaman yang lebih mendalam terkait faktor-faktor yang memengaruhi kinerja bisnis.