Deskripsi Insight Data

Dataset yang digunakan dalam penelitian ini adalah Coffee Chain Dataset, yang berisi informasi terkait aktivitas operasional dan penjualan pada suatu perusahaan kopi. Data ini mencakup berbagai variabel penting seperti Sales, Cost of Goods Sold (COGS), Marketing, Inventory, Profit, dan variabel lainnya yang merepresentasikan berbagai aspek bisnis.

Insight yang diambil dalam penelitian ini berfokus pada analisis faktor-faktor yang memengaruhi profit perusahaan. Oleh karena itu, tidak seluruh variabel dalam dataset digunakan dalam analisis. Pemilihan variabel dilakukan secara selektif dengan mempertimbangkan keterkaitannya terhadap profit serta tujuan analisis yang ingin dicapai. Variabel Profit dipilih sebagai variabel respon karena mencerminkan kinerja keuangan perusahaan, sedangkan variabel Sales, COGS, Marketing, dan Inventory digunakan sebagai variabel prediktor yang diduga memiliki pengaruh terhadap Profit.

Secara konseptual, Sales merepresentasikan total pendapatan yang diperoleh dari penjualan produk, sehingga diperkirakan memiliki pengaruh positif terhadap Profit. Sebaliknya, COGS merupakan biaya langsung yang dikeluarkan untuk menghasilkan produk, sehingga peningkatan COGS diduga dapat menurunkan Profit. Variabel Marketing mencerminkan pengeluaran untuk kegiatan pemasaran yang berpotensi meningkatkan penjualan, namun juga menambah biaya. Sementara itu, Inventory berkaitan dengan pengelolaan stok barang, yang dapat memengaruhi efisiensi operasional dan pada akhirnya berdampak pada Profit.

Sementara itu, variabel lain seperti Product Type dan Market tidak dimasukkan ke dalam model utama untuk menjaga kesederhanaan model serta menghindari kompleksitas yang berlebihan. Dengan pembatasan ini, model yang dihasilkan diharapkan lebih mudah diinterpretasikan dan tetap mampu memberikan insight yang relevan.

Dengan mempertimbangkan hubungan antar variabel tersebut, analisis dilakukan menggunakan regresi linear berganda untuk mengetahui arah dan besarnya pengaruh masing-masing variabel prediktor terhadap Profit. Melalui analisis ini, diharapkan dapat diperoleh insight yang berguna dalam memahami faktor utama yang memengaruhi keuntungan perusahaan serta sebagai dasar dalam pengambilan keputusan bisnis.

Library

# Load Library
library(readxl)
library(dplyr)
library(ggplot2)
library(car)
library(lmtest)
library(DT)
library(nortest)
library(car)
library(sandwich)

Import Data

# Import Dataset
data_coffee <- read_xlsx("D:/Meitha Qonita Aulia/KULIAH/SEMESTER 6/SIM/1. Tugas SIM 2025B - Coffee Chain Datasets/1. Tugas SIM 2025B - Coffee Chain Datasets.xlsx")

#Struktur Data
str(data_coffee)
## tibble [4,248 × 20] (S3: tbl_df/tbl/data.frame)
##  $ Area Code     : num [1:4248] 719 970 970 303 303 720 970 719 970 719 ...
##  $ Date          : POSIXct[1:4248], format: "2012-01-01" "2012-01-01" ...
##  $ Market        : chr [1:4248] "Central" "Central" "Central" "Central" ...
##  $ Market Size   : chr [1:4248] "Major Market" "Major Market" "Major Market" "Major Market" ...
##  $ Product       : chr [1:4248] "Amaretto" "Colombian" "Decaf Irish Cream" "Green Tea" ...
##  $ Product Line  : chr [1:4248] "Beans" "Beans" "Beans" "Leaves" ...
##  $ Product Type  : chr [1:4248] "Coffee" "Coffee" "Coffee" "Tea" ...
##  $ State         : chr [1:4248] "Colorado" "Colorado" "Colorado" "Colorado" ...
##  $ Type          : chr [1:4248] "Regular" "Regular" "Decaf" "Regular" ...
##  $ Budget COGS   : num [1:4248] 90 80 100 30 60 80 140 50 50 40 ...
##  $ Budget Margin : num [1:4248] 130 110 140 50 90 130 160 80 70 70 ...
##  $ Budget Profit : num [1:4248] 100 80 110 30 70 80 110 20 40 20 ...
##  $ Budget Sales  : num [1:4248] 220 190 240 80 150 210 300 130 120 110 ...
##  $ COGS          : num [1:4248] 89 83 95 44 54 72 170 63 60 58 ...
##  $ Inventory     : num [1:4248] 777 623 821 623 456 ...
##  $ Margin        : num [1:4248] 130 107 139 56 80 108 171 87 80 72 ...
##  $ Marketing     : num [1:4248] 24 27 26 14 15 23 47 57 19 22 ...
##  $ Profit        : num [1:4248] 94 68 101 30 54 53 99 0 33 17 ...
##  $ Sales         : num [1:4248] 219 190 234 100 134 180 341 150 140 130 ...
##  $ Total Expenses: num [1:4248] 36 39 38 26 26 55 72 87 47 55 ...
#Tabel Data
datatable(data_coffee, options = list(scrollX = TRUE, pageLength = 10), rownames = FALSE)

Statistik Deskriptif

# Variabel yang Digunakan
data_model <- data_coffee %>%
  select(Profit, Sales, COGS, Marketing, Inventory)
# Ringkasan
summary(data_model)
##      Profit           Sales          COGS          Marketing     
##  Min.   :-638.0   Min.   : 17   Min.   :  0.00   Min.   :  0.00  
##  1st Qu.:  17.0   1st Qu.:100   1st Qu.: 43.00   1st Qu.: 13.00  
##  Median :  40.0   Median :138   Median : 60.00   Median : 22.00  
##  Mean   :  61.1   Mean   :193   Mean   : 84.43   Mean   : 31.19  
##  3rd Qu.:  92.0   3rd Qu.:230   3rd Qu.:100.00   3rd Qu.: 39.00  
##  Max.   : 778.0   Max.   :912   Max.   :364.00   Max.   :156.00  
##    Inventory      
##  Min.   :-3534.0  
##  1st Qu.:  432.0  
##  Median :  619.0  
##  Mean   :  749.4  
##  3rd Qu.:  910.5  
##  Max.   : 8252.0

Berdasarkan hasil statistik deskriptif, variabel Profit memiliki rentang nilai yang cukup besar, yaitu dari -638 hingga 778 dengan rata-rata sebesar 61,1, yang menunjukkan bahwa meskipun secara umum perusahaan memperoleh keuntungan, terdapat beberapa kondisi kerugian pada data. Variabel Sales memiliki rata-rata 193 dengan nilai maksimum mencapai 912, yang mengindikasikan adanya variasi penjualan yang tinggi antar observasi. Hal serupa juga terlihat pada variabel COGS dan Marketing, di mana nilai rata-rata masing-masing lebih besar dari median, yang menunjukkan adanya kecenderungan distribusi yang miring ke kanan akibat beberapa nilai yang relatif tinggi.

Sementara itu, variabel Inventory memiliki rentang yang sangat lebar, yaitu dari -3534 hingga 8252, bahkan mencakup nilai negatif yang mengindikasikan kemungkinan adanya anomali atau kondisi khusus dalam pencatatan data. Secara keseluruhan, seluruh variabel menunjukkan variasi yang cukup besar dengan kecenderungan distribusi right-skewed. Hal ini menunjukkan adanya potensi nilai ekstrem (outlier) yang perlu diperhatikan karena dapat memengaruhi hasil analisis regresi yang akan dilakukan pada tahap selanjutnya.

Visualisasi Data

Scatterplot COGS vs Profit

ggplot(data_model, aes(x = COGS, y = Profit)) +
  geom_point(color = "black") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  ggtitle("COGS vs Profit")
## `geom_smooth()` using formula = 'y ~ x'

Berdasarkan scatterplot antara COGS dan Profit, terlihat adanya kecenderungan hubungan positif yang ditunjukkan oleh garis regresi yang menanjak. Hal ini mengindikasikan bahwa semakin tinggi biaya pokok penjualan (COGS), Profit cenderung meningkat, yang kemungkinan disebabkan oleh peningkatan skala penjualan. Namun demikian, sebaran data terlihat cukup luas dengan banyak titik yang menyimpang, termasuk nilai Profit negatif pada COGS tertentu, sehingga menunjukkan bahwa hubungan tersebut tidak terlalu kuat dan terdapat variabilitas yang tinggi. Kondisi ini mengindikasikan adanya faktor lain yang turut memengaruhi Profit selain COGS.

Scatterplot Inventory vs Profit

ggplot(data_model, aes(x = Inventory, y = Profit)) +
  geom_point(color = "black") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  ggtitle("Inventory vs Profit")
## `geom_smooth()` using formula = 'y ~ x'

Scatterplot antara Inventory dan Profit menunjukkan kecenderungan hubungan negatif, yang ditunjukkan oleh garis regresi yang menurun. Hal ini mengindikasikan bahwa semakin besar jumlah Inventory, Profit cenderung menurun, yang dapat disebabkan oleh tingginya biaya penyimpanan atau ketidakefisienan dalam pengelolaan stok. Selain itu, terlihat sebaran data yang cukup luas dan adanya beberapa nilai ekstrem, baik pada Inventory tinggi maupun Profit negatif, yang menunjukkan bahwa hubungan antar variabel tidak terlalu kuat. Hal ini mengindikasikan bahwa Inventory bukan satu-satunya faktor yang menentukan Profit dan perlu dikombinasikan dengan variabel lain dalam analisis lebih lanjut.

Scatterplot Marketing vs Profit

ggplot(data_model, aes(x = Marketing, y = Profit)) +
  geom_point(color = "black") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  ggtitle("Marketing vs Profit")
## `geom_smooth()` using formula = 'y ~ x'

Berdasarkan scatterplot antara Marketing dan Profit, terlihat adanya kecenderungan hubungan positif yang sangat lemah, ditunjukkan oleh garis regresi yang sedikit menanjak. Hal ini mengindikasikan bahwa peningkatan pengeluaran Marketing cenderung diikuti kenaikan Profit, namun pengaruhnya tidak terlalu signifikan. Sebaran data sangat luas dan tidak terpusat, dengan banyak titik yang menyimpang serta adanya Profit negatif pada berbagai tingkat Marketing. Kondisi ini menunjukkan bahwa hubungan antara Marketing dan Profit tidak terlalu kuat dan kemungkinan terdapat faktor lain yang lebih dominan dalam memengaruhi Profit.

Scatterplot Sales vs Profit

ggplot(data_model, aes(x = Sales, y = Profit)) +
  geom_point(color = "black") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  ggtitle("Sales vs Profit")
## `geom_smooth()` using formula = 'y ~ x'

Berdasarkan scatterplot antara Sales dan Profit, terlihat adanya hubungan positif yang cukup kuat, ditunjukkan oleh garis regresi yang jelas menanjak dan pola sebaran data yang lebih terarah. Hal ini mengindikasikan bahwa semakin tinggi nilai penjualan (Sales), Profit cenderung meningkat secara konsisten. Meskipun masih terdapat beberapa titik dengan Profit negatif, terutama pada Sales rendah hingga menengah, secara keseluruhan pola hubungan terlihat lebih jelas dibandingkan dengan Marketing. Hal ini menunjukkan bahwa Sales memiliki pengaruh yang lebih signifikan terhadap Profit, meskipun tetap ada variabilitas yang mengindikasikan peran faktor lain.

Korelasi Antar Variabel

cor(data_model)
##                Profit     Sales      COGS Marketing   Inventory
## Profit     1.00000000 0.7973309 0.4648382 0.2254650 -0.09154483
## Sales      0.79733091 1.0000000 0.8866512 0.7105149  0.32593355
## COGS       0.46483822 0.8866512 1.0000000 0.8182707  0.62108644
## Marketing  0.22546504 0.7105149 0.8182707 1.0000000  0.49776355
## Inventory -0.09154483 0.3259335 0.6210864 0.4977636  1.00000000

Berdasarkan matriks korelasi, terlihat bahwa Profit memiliki hubungan positif yang cukup kuat dengan Sales (0,797), yang menunjukkan bahwa peningkatan penjualan (Sales) cenderung diikuti kenaikan Profit. Sementara itu, korelasi Profit dengan COGS (0,465) tergolong sedang, dan dengan Marketing (0,225) tergolong lemah, sehingga pengaruh langsung keduanya terhadap Profit tidak sekuat Sales. Menariknya, Inventory memiliki korelasi negatif yang sangat lemah dengan Profit (-0,092), yang mengindikasikan bahwa perubahan Inventory hampir tidak berhubungan dengan Profit.

Di sisi lain, hubungan antar variabel independen cukup tinggi, terutama antara Sales–COGS (0,887), COGS–Marketing (0,818), dan Sales–Marketing (0,711), yang menunjukkan adanya keterkaitan erat di antara variabel-variabel tersebut. Hal ini dapat mengindikasikan potensi multikolinearitas jika digunakan dalam model regresi berganda. Selain itu, Inventory juga memiliki korelasi sedang dengan COGS (0,621) dan Marketing (0,498), namun lebih rendah dengan Sales (0,326). Secara keseluruhan, Sales tampak sebagai variabel yang paling dominan terkait Profit, sementara variabel lain saling berkorelasi cukup kuat satu sama lain.

Regresi Linear Berganda

Untuk mengetahui pengaruh dari variabel-variabel tersebut, digunakan analisis Regresi Linear Berganda. Analisis ini bertujuan untuk menguji sekaligus mengukur sejauh mana variabel independen, yaitu COGS, Inventory, Marketing, dan Sales, memengaruhi variabel dependen, yaitu Profit. Secara matematis, model regresi linear berganda dapat dinyatakan dalam bentuk persamaan berikut:

\[ Profit = \beta_0 + \beta_1 (COGS) + \beta_2 (Inventory) + \beta_3 (Marketing) + \beta_4 (Sales) + \varepsilon \]

# Model Regresi
model <- lm(Profit ~ COGS + Inventory + Marketing + Sales, data = data_model)
summary(model)
## 
## Call:
## lm(formula = Profit ~ COGS + Inventory + Marketing + Sales, data = data_model)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -129.035  -10.578    0.032    8.610  102.115 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -24.891587   0.586072 -42.472  < 2e-16 ***
## COGS         -1.289305   0.017388 -74.151  < 2e-16 ***
## Inventory     0.005890   0.000770   7.649  2.5e-14 ***
## Marketing    -1.449671   0.020179 -71.839  < 2e-16 ***
## Sales         1.221031   0.005716 213.631  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.34 on 4243 degrees of freedom
## Multiple R-squared:   0.96,  Adjusted R-squared:   0.96 
## F-statistic: 2.549e+04 on 4 and 4243 DF,  p-value: < 2.2e-16

Asumsi persamaan regresi linear berganda:

\[ Profit = -24,892 - 1,289 (COGS) + 0,006 (Inventory) - 1,449 (Marketing) + 1,221 (Sales) \]

Uji Asumsi Klasik

1. Uji Normalitas

Uji normalitas residual dalam penelitian ini dilakukan menggunakan uji Kolmogorov-Smirnov (Lilliefors). Pemilihan metode ini didasarkan pada ukuran sampel yang relatif besar (n > 50), sehingga uji ini dinilai lebih sesuai dibandingkan uji Shapiro-Wilk.

\[\begin{gather} H_0 : \text{Residual berdistribusi normal} \\ H_1 : \text{Residual tidak berdistribusi normal} \end{gather}\]

lillie.test(residuals(model))
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  residuals(model)
## D = 0.093577, p-value < 2.2e-16

Berdasarkan hasil uji normalitas menggunakan uji Kolmogorov-Smirnov (Lilliefors), diperoleh nilai \(p-value < 0,05\), sehingga \(H_0\) ditolak. Dengan demikian, dapat disimpulkan bahwa residual tidak berdistribusi normal. Meskipun demikian, pada sampel berukuran besar, pelanggaran asumsi normalitas residual umumnya tidak terlalu memengaruhi estimasi model regresi, sehingga model masih dapat digunakan untuk analisis lebih lanjut.

2. Uji Multikolinearitas

Uji multikolinearitas dalam penelitian ini dilakukan menggunakan uji Variance Inflation Factor (VIF). Uji ini bertujuan untuk mendeteksi adanya hubungan linear yang kuat antar variabel independen dalam model regresi. Model dikatakan tidak mengalami multikolinearitas apabila nilai VIF masing-masing variabel kurang dari 10.

vif(model)
##      COGS Inventory Marketing     Sales 
## 14.036858  2.659924  3.052866  7.660536

Berdasarkan hasil uji multikolinearitas menggunakan VIF, variabel COGS menunjukkan adanya indikasi multikolinearitas yang tinggi, sedangkan variabel Inventory, Marketing, dan Sales tidak mengalami masalah multikolinearitas. Dengan demikian, gejala multikolinearitas dalam model terutama terjadi pada variabel COGS. Meskipun demikian, variabel COGS tetap dipertahankan dalam model karena secara teoritis memiliki pengaruh yang kuat terhadap Profit.

3. Uji Heteroskedastisitas

Uji heteroskedastisitas dalam penelitian ini dilakukan menggunakan uji Breusch-Pagan. Uji ini digunakan untuk mendeteksi apakah varians residual bersifat konstan (homoskedastisitas) atau tidak. Model regresi yang baik adalah model yang tidak mengalami heteroskedastisitas.

\[\begin{aligned} H_0 &: \text{Tidak terjadi heteroskedastisitas (varians residual konstan)} \\ H_1 &: \text{Terjadi heteroskedastisitas (varians residual tidak konstan)} \end{aligned}\]
bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 1011.3, df = 4, p-value < 2.2e-16

Berdasarkan hasil uji heteroskedastisitas menggunakan uji Breusch-Pagan, diperoleh nilai \(p-value < 0,05\) sehingga \(H_0\) ditolak. Hal ini menunjukkan bahwa terdapat heteroskedastisitas pada model regresi, yaitu varians residual tidak konstan. Dengan demikian, asumsi homoskedastisitas tidak terpenuhi dalam model.

Untuk mengatasi masalah heteroskedastisitas, dilakukan penyesuaian menggunakan robust standard error. Hasil estimasi dengan pendekatan ini menunjukkan bahwa nilai standard error telah disesuaikan sehingga pengujian signifikansi parameter menjadi lebih reliabel meskipun terdapat pelanggaran asumsi homoskedastisitas.

coeftest(model, vcov = vcovHC(model, type = "HC1"))
## 
## t test of coefficients:
## 
##                Estimate  Std. Error  t value  Pr(>|t|)    
## (Intercept) -24.8915872   0.9766299 -25.4872 < 2.2e-16 ***
## COGS         -1.2893046   0.0422600 -30.5088 < 2.2e-16 ***
## Inventory     0.0058897   0.0018608   3.1651  0.001561 ** 
## Marketing    -1.4496709   0.0239147 -60.6184 < 2.2e-16 ***
## Sales         1.2210308   0.0169089  72.2123 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Setelah dilakukan penyesuaian menggunakan robust standard error, hasil pengujian menunjukkan bahwa seluruh variabel tetap signifikan. Hal ini mengindikasikan bahwa penggunaan robust standard error berhasil mengatasi masalah heteroskedastisitas dan menghasilkan estimasi yang lebih reliabel. Dengan demikian, hasil pengujian parameter menjadi lebih valid meskipun sebelumnya terdapat pelanggaran asumsi homoskedastisitas.

4. Uji Autokorelasi

Uji autokorelasi dalam penelitian ini dilakukan menggunakan uji Durbin-Watson. Uji ini digunakan untuk mendeteksi apakah terdapat hubungan antar residual pada model regresi.

\[\begin{aligned} H_0 &: \text{Tidak terjadi autokorelasi pada residual} \\ H_1 &: \text{Terjadi autokorelasi pada residual} \end{aligned}\]
dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 1.7014, p-value < 2.2e-16
## alternative hypothesis: true autocorrelation is greater than 0

Berdasarkan hasil uji autokorelasi menggunakan uji Durbin-Watson, diperoleh nilai \(p-value < 0,05\) sehingga \(H_0\) ditolak. Hal ini menunjukkan bahwa terdapat autokorelasi pada residual model regresi.

Uji Signifikansi

1. Uji F

Uji F digunakan untuk menguji signifikansi model regresi secara keseluruhan, yaitu untuk mengetahui apakah semua variabel independen secara bersama-sama memiliki pengaruh yang signifikan terhadap variabel dependen.

\[\begin{aligned} H_0 &: \beta_1 = \beta_2 = \beta_3 = \beta_4 = 0 \\ H_1 &: \text{Minimal terdapat satu } \beta_i \neq 0 \end{aligned}\]
summary(model)
## 
## Call:
## lm(formula = Profit ~ COGS + Inventory + Marketing + Sales, data = data_model)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -129.035  -10.578    0.032    8.610  102.115 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -24.891587   0.586072 -42.472  < 2e-16 ***
## COGS         -1.289305   0.017388 -74.151  < 2e-16 ***
## Inventory     0.005890   0.000770   7.649  2.5e-14 ***
## Marketing    -1.449671   0.020179 -71.839  < 2e-16 ***
## Sales         1.221031   0.005716 213.631  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.34 on 4243 degrees of freedom
## Multiple R-squared:   0.96,  Adjusted R-squared:   0.96 
## F-statistic: 2.549e+04 on 4 and 4243 DF,  p-value: < 2.2e-16

Berdasarkan hasil uji F pada model regresi, diperoleh nilai \(p-value < 0,05\) sehingga \(H_0\) ditolak. Hal ini menunjukkan bahwa variabel independen yaitu COGS, Inventory, Marketing, dan Sales secara simultan berpengaruh signifikan terhadap Profit. Dengan demikian, model regresi yang digunakan dalam penelitian ini layak untuk digunakan dalam analisis.

2. Koefisien Determinasi

Koefisien determinasi (\(R²\)) digunakan untuk mengetahui seberapa besar kemampuan model dalam menjelaskan variasi Profit berdasarkan variabel independen yang digunakan.

summary(model)$r.squared
## [1] 0.9600475
summary(model)$adj.r.squared
## [1] 0.9600098

Nilai koefisien determinasi (\(R²\)) sebesar 0,96 menunjukkan bahwa sebesar 96% variasi Profit dapat dijelaskan oleh variabel COGS, Inventory, Marketing, dan Sales. Sedangkan sisanya sebesar 4% dijelaskan oleh faktor lain di luar model.

Nilai Adjusted \(R²\) sebesar 0,96 menunjukkan bahwa setelah mempertimbangkan jumlah variabel dalam model, kemampuan model dalam menjelaskan variasi Profit tetap sangat tinggi.

3. Uji t

Uji t dalam penelitian ini dilakukan menggunakan robust standard error untuk menguji signifikansi pengaruh masing-masing variabel independen secara parsial terhadap variabel dependen. Penggunaan robust standard error bertujuan untuk menghasilkan estimasi yang lebih reliabel, mengingat terdapat pelanggaran asumsi heteroskedastisitas pada model regresi.

coeftest(model, vcov = vcovHC(model, type = "HC1"))
## 
## t test of coefficients:
## 
##                Estimate  Std. Error  t value  Pr(>|t|)    
## (Intercept) -24.8915872   0.9766299 -25.4872 < 2.2e-16 ***
## COGS         -1.2893046   0.0422600 -30.5088 < 2.2e-16 ***
## Inventory     0.0058897   0.0018608   3.1651  0.001561 ** 
## Marketing    -1.4496709   0.0239147 -60.6184 < 2.2e-16 ***
## Sales         1.2210308   0.0169089  72.2123 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Berdasarkan hasil uji t menggunakan robust standard error, diperoleh bahwa seluruh variabel independen yaitu COGS, Inventory, Marketing, dan Sales memiliki nilai \(p-value < 0,05\), sehingga \(H_0\) ditolak. Hal ini menunjukkan bahwa masing-masing variabel secara parsial berpengaruh signifikan terhadap Profit.

Variabel Sales dan Inventory berpengaruh positif terhadap Profit, yang berarti peningkatan pada kedua variabel tersebut akan meningkatkan Profit. Sebaliknya, variabel COGS dan Marketing berpengaruh negatif terhadap Profit, yang menunjukkan bahwa peningkatan biaya produksi dan biaya pemasaran cenderung menurunkan Profit. Dengan demikian, seluruh variabel dalam model memiliki pengaruh yang signifikan terhadap Profit setelah dilakukan penyesuaian menggunakan robust standard error.

Model Regresi Linear Berganda

Berdasarkan hasil analisis yang dilakukan melalui pendekatan regresi linear berganda, diperoleh suatu model yang dapat digunakan untuk menjelaskan pengaruh variabel COGS, Inventory, Marketing, dan Sales terhadap Profit. Model ini menggambarkan hubungan antar variabel serta kontribusi masing-masing variabel independen dalam menjelaskan variasi Profit.

\[ Profit = -24,892 - 1,289 (COGS) + 0,006 (Inventory) - 1,449 (Marketing) + 1,221 (Sales) \]

Berdasarkan model regresi yang diperoleh, nilai konstanta sebesar -24,892 menunjukkan bahwa ketika seluruh variabel independen (COGS, Inventory, Marketing, dan Sales) bernilai nol, maka Profit diperkirakan sebesar -24,892.

Variabel COGS memiliki koefisien sebesar -1,289 yang berarti setiap peningkatan COGS sebesar satu satuan akan menurunkan Profit sebesar 1,289, dengan asumsi variabel lain konstan.

Variabel Inventory memiliki koefisien sebesar 0,006, yang menunjukkan bahwa setiap peningkatan Inventory sebesar satu satuan akan meningkatkan Profit sebesar 0,006.

Selain itu, variabel Marketing memiliki koefisien sebesar -1,449 yang menunjukkan bahwa peningkatan biaya pemasaran sebesar satu satuan akan menurunkan Profit sebesar 1,449.

Sementara itu, variabel Sales memiliki koefisien sebesar 1,221, yang berarti setiap peningkatan penjualan sebesar satu satuan akan meningkatkan Profit sebesar 1,221.

Secara keseluruhan, hasil ini menunjukkan bahwa Sales dan Inventory berpengaruh positif terhadap Profit, sedangkan COGS dan Marketing berpengaruh negatif terhadap Profit, dengan interpretasi signifikansi parameter mengacu pada hasil robust standard error.

Kesimpulan

Berdasarkan hasil analisis yang telah dilakukan, dapat disimpulkan bahwa model regresi linear berganda yang digunakan mampu menjelaskan hubungan antara variabel COGS, Inventory, Marketing, dan Sales terhadap Profit dengan baik. Hal ini didukung oleh hasil uji F yang menunjukkan bahwa seluruh variabel independen secara simultan berpengaruh signifikan terhadap Profit. Selain itu, nilai koefisien determinasi (R²) sebesar 0,96 menunjukkan bahwa model mampu menjelaskan sebesar 96% variasi Profit, sedangkan sisanya dijelaskan oleh faktor lain di luar model.

Secara parsial, berdasarkan uji t dengan robust standard error, seluruh variabel independen berpengaruh signifikan terhadap Profit. Variabel Sales dan Inventory berpengaruh positif, yang berarti peningkatan pada kedua variabel tersebut akan meningkatkan Profit. Sebaliknya, variabel COGS dan Marketing berpengaruh negatif terhadap Profit, yang menunjukkan bahwa peningkatan biaya produksi dan biaya pemasaran cenderung menurunkan keuntungan.

Berdasarkan pengujian asumsi klasik, ditemukan adanya pelanggaran asumsi seperti heteroskedastisitas dan autokorelasi, serta indikasi multikolinearitas pada variabel COGS. Namun demikian, model tetap dapat digunakan karena telah dilakukan penyesuaian menggunakan robust standard error sehingga hasil estimasi menjadi lebih reliabel. Dengan demikian, model regresi yang diperoleh tetap layak digunakan sebagai dasar analisis untuk memahami faktor-faktor yang memengaruhi Profit pada Coffee Chain Dataset.