sumber: Starjogja.com
sumber: Starjogja.com

Deskripsi Data

Coffee Chain Datasets ini memuat informasi penjualan dan performa keuangan dari berbagai produk dalam jaringan kedai kopi, mencakup atribut lokasi geografis, jenis produk, ukuran pasar, dan pencapaian anggaran. Berdasarkan Coffee Chain Datasets, terdapat beberapa insight menarik terkait performa penjualan dan profitabilitas produk kopi dan teh di berbagai wilayah Amerika Serikat. Produk utama dalam data ini adalah kopi (seperti Colombian, Amaretto, Decaf Irish Cream, Caffe Mocha) dan teh (Green Tea, Earl Grey, Chamomile, Lemon, Mint, Darjeeling), dengan segmentasi lebih lanjut pada tipe produk seperti regular dan decaf, serta pembagian pasar menjadi Major Market dan Small Market di wilayah Central, East, South, dan West.

Secara keseluruhan, insight dari data ini menunjukkan pentingnya fokus pada produk-produk unggulan di wilayah Major Market, optimalisasi manajemen stok untuk menghindari over-inventory, serta penyesuaian strategi pemasaran agar lebih tepat sasaran. Selain itu, perlu dilakukan evaluasi terhadap portofolio produk di Small Market, khususnya untuk produk yang secara konsisten memberikan profit negatif, agar sumber daya dapat dialokasikan dengan lebih efisien dan profitabilitas bisnis dapat ditingkatkan. Dengan cakupan data yang luas ini, terdapat peluang untuk mengeksplorasi pola penjualan berdasarkan wilayah, tipe produk, dan ukuran pasar, serta untuk mengidentifikasi faktor-faktor yang memengaruhi profitabilitas dan efisiensi operasional.

Dataset ini memungkinkan analisis perbandingan antara anggaran dan realisasi aktual dari sisi keuangan sehingga dapat memberikan gambaran tentang efektivitas strategi bisnis yang telah dijalankan. Melalui analisis lebih mendalam nantinya, diharapkan dapat ditemukan insight terkait produk atau wilayah yang paling potensial, efisiensi penggunaan anggaran, serta area yang memerlukan perbaikan dalam rantai pasok atau pemasaran. Hal ini tentunya akan menjadi dasar untuk mengarahkan fokus analisis pada tahap selanjutnya.

🔗 Dataset yang digunakan: Coffee Chain Datasets

Landasan Teori

A. Uji Asumsi Klasik

Uji asumsi klasik dalam regresi linear digunakan untuk memastikan bahwa model regresi yang dibuat valid, andal, dan tidak bias sehingga hasilnya dapat dipercaya untuk analisis dan prediksi. Asumsi klasik ini adalah syarat yang harus dipenuhi agar metode Ordinary Least Squares (OLS) menghasilkan estimator yang Best Linear Unbiased Estimator (BLUE). Uji asumsi klasik dilakukan dengan tujuan untuk memastikan estimator regresi (koefisien) tidak bias dan menghindari kesalahan inferensi statistik, seperti kesalahan dalam uji signifikansi atau interval kepercayaan.

1. Uji Normalitas

Asumsi normalitas menyatakan bahwa error (residu) dari model regresi harus berdistribusi normal. Asumsi ini penting untuk validitas uji statistik seperti uji-t dan uji-F, terutama pada sampel kecil. Pada sampel besar, asumsi ini kurang kritis karena Central Limit Theorem memastikan distribusi estimator mendekati normal (Gujarati & Porter, 2009).

Metode Pengujian:

  • Uji Statistik: Uji Shapiro-Wilk, Kolmogorov-Smirnov, atau Jarque-Bera untuk menguji normalitas residu.
  • Pendekatan Grafis: Histogram residu atau Q-Q plot untuk memvisualisasikan distribusi residu.
  • Interpretasi: Jika p-value dari uji statistik < 0,05, maka residu tidak normal.

Jika Q-Q plot menunjukkan titik-titik menyimpang dari garis lurus, maka normalitas tidak terpenuhi.

2. Uji Homogenitas

Homoskedastisitas berarti variansi error konstan untuk semua nilai variabel independen. Jika variansi error tidak konstan (heteroskedastisitas), estimator OLS tetap tidak bias tetapi tidak efisien sehingga standard error dan uji signifikansi menjadi tidak valid (Wooldridge, 2013).

Metode Pengujian:

  • Uji Statistik: Uji Breusch-Pagan atau White Test untuk mendeteksi heteroskedastisitas.
  • Pendekatan Grafis: Scatter plot residu terhadap nilai prediksi (fitted values). Jika pola residu membentuk corong (funnel shape), maka terdapat indikasi heteroskedastisitas.
  • Interpretasi: Jika p-value uji < 0,05, maka asumsi homoskedastisitas dilanggar.

Perbaikan dapat dilakukan dengan transformasi data atau metode Weighted Least Squares (WLS).

3. Uji Non-Autokorelasi

Asumsi non-autokorelasi menyatakan bahwa error tidak boleh berkorelasi satu sama lain, terutama pada data deret waktu (time series). Autokorelasi menyebabkan standard error bias sehingga uji signifikansi tidak akurat (Gujarati & Porter, 2009).

Metode Pengujian:

  • Uji Statistik: Uji Durbin-Watson untuk mendeteksi autokorelasi orde satu. Nilai Durbin-Watson mendekati 2 menunjukkan tidak ada autokorelasi; nilai < 2 menunjukkan autokorelasi positif, dan > 2 menunjukkan autokorelasi negatif.
  • Uji Alternatif: Uji Breusch-Godfrey untuk autokorelasi orde lebih tinggi.
  • Interpretasi: Jika p-value uji < 0,05 atau nilai Durbin-Watson jauh dari 2, maka terdapat autokorelasi.

Perbaikan dapat dilakukan dengan menambahkan variabel lag atau menggunakan model seperti Cochrane-Orcutt.

4. Uji Non-Multikolinearitas

Asumsi non-multikolinearitas menyatakan bahwa variabel independen dalam regresi berganda tidak boleh memiliki korelasi sempurna atau sangat tinggi. Multikolinearitas menyebabkan koefisien regresi tidak stabil dan sulit diinterpretasikan (Wooldridge, 2013).

Metode Pengujian:

  • Uji Statistik: Variance Inflation Factor (VIF). Jika VIF > 10, ada indikasi multikolinearitas.
  • Pendekatan Alternatif: Matriks korelasi antar variabel independen. Korelasi > 0,8 menunjukkan potensi multikolinearitas.
  • Interpretasi: Jika VIF tinggi, maka variabel independen yang berkorelasi tinggi dapat dihapus, digabung, atau dianalisis dengan teknik seperti Principal Component Analysis (PCA).

5. Uji Linearitas

Asumsi linearitas menyatakan bahwa hubungan antara variabel independen dan dependen harus linear dalam parameter. Jika hubungan tidak linear, maka model regresi akan menghasilkan prediksi yang bias dan tidak akurat (Gujarati & Porter, 2009).

Metode Pengujian:

  • Pendekatan Grafis: Scatter plot antara variabel independen dan dependen, atau plot residual terhadap nilai prediksi untuk mendeteksi pola non-linear.
  • Uji Statistik: Uji Ramsey Regression Specification Error Test (RESET) untuk memeriksa apakah model mengalami misspecification (misalnya, hubungan non-linear).
  • Interpretasi: Jika scatter plot menunjukkan pola non-linear atau p-value uji Ramsey RESET < 0,05, maka asumsi linearitas dilanggar.

Perbaikan dapat dilakukan dengan transformasi variabel (misalnya, logaritma atau kuadrat) atau menggunakan model non-linear.

B. Regresi Robust Estimasi S

Metode estimasi S (S-estimation) adalah salah satu pendekatan dalam regresi robust yang dirancang untuk menghasilkan estimator yang tahan terhadap outlier baik pada variabel dependen (Y) maupun variabel independen (X). Estimasi S bertujuan untuk meminimalkan skala residu (scale of residuals) dengan cara yang robust sehingga menghasilkan koefisien regresi yang tidak terlalu dipengaruhi oleh observasi ekstrem. Pendekatan ini termasuk dalam kelompok estimator berbasis skala (scale-based estimators) dan memiliki breakdown point yang tinggi, yaitu mampu menangani hingga hampir 50% data outlier tanpa menghasilkan estimasi yang tidak valid (Rousseeuw & Leroy, 1987).

Model egresi robust estimasi S didefinisikan sebagai berikut:

\[\hat{\beta}_S = min_{\beta}\hat{\sigma}_S(e_1, e_2, ..., e_n) \tag{1.1}\]

dengan \(\hat{\beta}\) adalah estimator regresi, \(e_1, e_2, ..., e_n\) adalah residu, dan \(\hat{\sigma}_S\) adalah nilai estimator skala robust yang minimum dan memenuhi:

\[min \sum_{i=1}^{n} \rho \left(\frac{Y_i - \sum_{j=0}^{k} x_{ij}\beta}{\hat{\sigma}_S}\right) \tag{1.2}\]

Estimator parameter skala robust pada estimasi S dinyatakan sebagai berikut:

\[\hat{\sigma}_S = \begin{cases} \frac{median|e_i - median(e_i)|}{0.6745}, & \text{iterasi} = 1 \\ \sqrt{\frac{1}{nK}\sum_{i=1}^{n}w_ie_i^2}, & \text{iterasi} > 1 \end{cases} \tag{1.3}\]

dengan \(K = 0.199\). Fungsi \(\rho\) adalah fungsi objektif Tukey’s Bisquare:

\[\rho(u_{iS}) = \begin{cases} \frac{u_{iS}^2}{2} - \frac{u_{iS}^4}{2c^2} + \frac{u_{iS}^6}{6c^4}, & |u_{iS}| \leq c \\ \frac{c^2}{6}, & |u_{iS}| > c \end{cases}\]

dengan nilai \(c = 1.5470\) dan \(u_{iS} = \frac{e_i}{\hat{\sigma}_S}\)

Untuk meminimumkan persamaan (2.2) maka diturunkan secara parsial terhadap \(\beta\) sehingga didapatkan persamaan sebagai berikut:

\[\sum_{i=1}^{n}X_{ij}\psi\left(\frac{Y_i - \sum_{j=0}^{k}x_{ij}\beta}{\hat{\sigma}_S}\right) = 0, \quad j = 0,1,...,k \tag{1.4}\]

\(\psi\) adalah \(\rho'\) dan \(X_{ij}\) adalah observasi ke-\(i\) pada variabel independen ke-\(j\). Persamaan (1.4) dapat diselesaikan dengan mendefinisikan suatu fungsi pembobot:

\[ w(u_{iS}) = \left\{ \begin{array}{ll} \left\{ \begin{array}{ll} \frac{u_{iS}\left(1-\frac{u_{iS}^2}{c^2}\right)^2}{u_{iS}}, & |u_i| \leq c, \quad \text{iterasi} = 1 \\ 0, & |u_i| > c \end{array} \right. \\ \frac{\rho(u_{iS})}{u_{iS}^2}, & \text{iterasi} > 1 \end{array} \right. \tag{1.5} \]

Prinsip Regresi Robust estimasi S, yaitu dengan mencoba meminimalkan suatu fungsi skala robust (biasanya menggunakan fungsi M-estimation seperti fungsi Tukey’s biweight) dari residu. Skala ini mengukur seberapa tersebar residu secara robust, berbeda dari OLS yang meminimalkan jumlah kuadrat residu. Prosesnya melibatkan pencarian koefisien regresi yang menghasilkan skala residu terkecil dengan mempertimbangkan bobot yang lebih kecil untuk residu besar (outlier). Estimasi S menggunakan pendekatan iteratif, sering kali melalui algoritma seperti Iteratively Reweighted Least Squares (IRLS), untuk mencapai konvergensi.

Source Code

A. Library

Package yang digunakan pada analisis data Coffee Chain Datasets

library(readxl)
library(car)
library(stats)
library(knitr)
library(lmtest) 
library(robustbase)

B. Import Data

Data yang digunakan untuk analisis, yaitu profit, sales, inventory, dan marketing. Variabel-variabel tersebut dipilih karena profit adalah indikator utama kinerja finansial dalam bisnis coffee chain, sales adalah sumber utama pendapatan dalam bisnis ritel seperti rantai kopi, inventory mencakup bahan baku seperti biji kopi, susu, atau kemasan yang mengharuskan perusahaan mengelola persediaan yang efisien dapat mengurangi biaya penyimpanan atau pemborosan sehingga bertujuan meningkatkan profit, dan pengeluaran untuk marketing (iklan, promosi, maupun kampanye media sosial) dapat meningkatkan terkenalnya brand dan menarik pelanggan yang pada akhirnya meningkatkan penjualan dan profit.

data <- read_excel("C:/Users/AS/Downloads/3. CM1 - Coffee Chain Datasets.xlsx")
datafix <- data[, c("Profit", "Sales", "Inventory", "Marketing")]
kable(head(datafix))
Profit Sales Inventory Marketing
94 219 777 24
68 190 623 27
101 234 821 26
30 100 623 14
54 134 456 15
53 180 558 23

C. Statistika Deskriptif

Melihat statistika deskriptif pada Coffee Chains Dataset dengan variabel profit sebagai variabel dependen dan sales, inventory, serta marketing sebagai variabel independen untuk memberikan gambaran awal tentang distribusi, pusat data, penyebaran, dan potensi anomali seperti outlier ataupun missing values yang dapat memengaruhi validitas model regresi. Statistika deskriptif membantu memahami konteks bisnis, seperti performa penjualan rata-rata, efisiensi pengelolaan persediaan, dan variasi anggaran pemasaran sehingga mendukung interpretasi hasil regresi yang relevan dengan keputusan strategis.

kable(summary(datafix))
Profit Sales Inventory Marketing
Min. :-638.0 Min. : 17 Min. :-3534.0 Min. : 0.00
1st Qu.: 17.0 1st Qu.:100 1st Qu.: 432.0 1st Qu.: 13.00
Median : 40.0 Median :138 Median : 619.0 Median : 22.00
Mean : 61.1 Mean :193 Mean : 749.4 Mean : 31.19
3rd Qu.: 92.0 3rd Qu.:230 3rd Qu.: 910.5 3rd Qu.: 39.00
Max. : 778.0 Max. :912 Max. : 8252.0 Max. :156.00

D. Model Metode Kuadrat Terkecil

Melihat model regresi berganda berguna untuk menetapkan baseline estimasi, mengidentifikasi pelanggaran asumsi klasik dan mendeteksi observasi berpengaruh menggunakan metrik seperti DFFITS sehingga dapat diputuskan apakah regresi robust diperlukan untuk menghasilkan estimasi yang lebih andal dan relevan untuk keputusan bisnis.

mkt=lm(Profit ~ Sales + Inventory + Marketing, data = datafix)
summary(mkt)
## 
## Call:
## lm(formula = Profit ~ Sales + Inventory + Marketing, data = datafix)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -308.599  -19.175    1.727   18.420  217.205 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.185e+01  8.470e-01  -13.99   <2e-16 ***
## Sales        8.575e-01  4.451e-03  192.66   <2e-16 ***
## Inventory   -3.445e-02  8.256e-04  -41.73   <2e-16 ***
## Marketing   -2.139e+00  2.713e-02  -78.85   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 30.81 on 4244 degrees of freedom
## Multiple R-squared:  0.9083, Adjusted R-squared:  0.9082 
## F-statistic: 1.401e+04 on 3 and 4244 DF,  p-value: < 2.2e-16

Diperoleh model regresi sebagai berikut:

\[Y = -11.85361 + 0.85748X_1 - 0.03445X_2 - 2.1393X_3\]

Interpretasi estimasi model persamaan regresi:

  1. Jika semua variabel independen bernilai nol, maka nilai prediksi profit (Y) adalah -11.85361 dolar.

  1. Untuk setiap kenaikan satu unit dalam sales akan meningkatkan profit sebesar 0.85748 dolar

  1. Untuk setiap kenaikan satu unit dalam inventory akan menurunkan profit sebesar 0.03445 dolar

  1. Untuk setiap kenaikan satu dolar dalam marketing akan menurunkan profit sebesar 2.1393 dolar

Pada model metode kuadrat terkecil, diperoleh nilai Adjusted R-squared = 0.9082 yang berarti bahwa profit mampu dijelaskan oleh variabel sales, inventory, dan marketing sebesar 90.82%, sedangkan sisanya (9.18%) dijelaskan oleh faktor lain yang belum diujikan pada model.

E. Uji Signifikansi

Berdasarkan hasil dari model regresi pada bagian sebelumnya, dikarenakan p-value \(< 2.2 \times 10^{-16}\) memiliki nilai lebih kecil daripada \(\alpha\) = 0.05, maka kita memiliki cukup bukti untuk menolak \(H_0\) sehingga setidaknya terdapat pengaruh yang signifikan antara sales, inventory, dan marketing terhadap profit secara simultan.

F. Uji Parsial

Berdasarkan hasil dari model regresi pada bagian metode kuadrat terkecil, didapatkan:

  • p_value dari sales \((X_1) < 2.2 \times 10^{-16}\)
  • p_value dari inventory \((X_2) < 2.2 \times 10^{-16}\)
  • p_value dari marketing \((X_3) < 2.2 \times 10^{-16}\)

Dikarenakan semua p-value dari variabel \(X_1, X_2,dan X_3\) memiliki nilai lebih kecil daripada \(\alpha\) = 0.05, maka kita memiliki cukup bukti untuk menolak \(H_0\) sehingga sales, inventory, dan marketing berpengaruh secara signifikan terhadap profit.

G. Uji Asumsi

1. Uji Normalitas

Dalam kasus ini, kita gunakan uji Kolmogorov-Smirnov yang dikarenakan ukuran datanya yang besar (>50 data).

\(H_0\) : Residu berdistribusi normal

\(H_1\) : Residu tidak berdistribusi normal

ks.test(mkt$residuals, 'pnorm')
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  mkt$residuals
## D = 0.48749, p-value < 2.2e-16
## alternative hypothesis: two-sided

Berdasarkan output di atas, didapatkan p-value \(< 2.2 \times 10^{-16}\) yang berarti memiliki nilai lebih kecil daripada \(\alpha\) = 0.05, maka \(H_0\) ditolak sehingga residu tidak berdistribusi normal.

2. Uji Homogenitas

Dalam kasus ini, kita gunakan uji Breusch-Pagan untuk memeriksa apakah variansi residual konstan (homogen) di seluruh nilai variabel independen.

\(H_0\) : Varians residu konstan (homogen)

\(H_1\) : Varians residu tidak konstan (heterogen)

bptest(mkt)
## 
##  studentized Breusch-Pagan test
## 
## data:  mkt
## BP = 382.66, df = 3, p-value < 2.2e-16

Berdasarkan output di atas, didapatkan p-value \(< 2.2 \times 10^{-16}\) yang berarti memiliki nilai lebih kecil daripada \(\alpha\) = 0.05, maka \(H_0\) ditolak sehingga datanya tidak homogen.

3. Uji Non-Autokorelasi

Dalam kasus ini, kita gunakan uji Durbin-Watson untuk non-autokorelasi dalam residual model regresi linear, khususnya untuk mendeteksi apakah terdapat autokorelasi orde satu (korelasi antara residual pada waktu atau urutan yang berdekatan).

\(H_0\) : Tidak terdapat autokorelasi

\(H_1\) : Terdapat autokorelasi

dwtest(mkt)
## 
##  Durbin-Watson test
## 
## data:  mkt
## DW = 1.9499, p-value = 0.05059
## alternative hypothesis: true autocorrelation is greater than 0

Berdasarkan output di atas, didapatkan p-value = 0.05059 yang berarti memiliki nilai lebih besar daripada \(\alpha\) = 0.05, maka \(H_0\) gagal ditolak sehingga tidak terdapat autokorelasi.

4. Uji Non-Multikolinearitas

Dalam kasus ini, kita gunakan uji Variance Inflation Factor (VIF) yang digunakan untuk menguji non-multikolinearitas dalam model regresi linear, yaitu untuk memeriksa apakah variabel independen dalam model memiliki korelasi yang tinggi satu sama lain.

\(H_0\) : Tidak terdapat multikolinearitas

\(H_1\) : Terdapat multikolinearitas

vif(mkt)
##     Sales Inventory Marketing 
##  2.023693  1.332129  2.404461

Berdasarkan output di atas, didapatkan nilai VIF sales = 2.023693, inventory = 1.332129, dan marketing = 2.404461 yang berarti memiliki nilai \(<\) 10, maka \(H_0\) gagal ditolak sehingga tidak terdapat multikolinearitas.

5. Uji Linearitas

Dalam kasus ini, kita gunakan uji Ramsey RESET yang digunakan untuk menguji linearitas dalam model regresi linear, yaitu untuk memeriksa apakah hubungan antara variabel dependen dan variabel independen telah ditentukan dengan benar dalam bentuk linear atau apakah ada komponen non-linear yang terlewat.

\(H_0\) : Model linear sesuai

\(H_1\) : Model linear tidak sesuai

resettest(mkt, power = 2:3, type = "fitted")
## 
##  RESET test
## 
## data:  mkt
## RESET = 170.16, df1 = 2, df2 = 4242, p-value < 2.2e-16

Berdasarkan output di atas, didapatkan p-value \(< 2.2 \times 10^{-16}\) yang berarti memiliki nilai lebih kecil daripada \(\alpha\) = 0.05, maka \(H_0\) ditolak sehingga asumsi linearitas tidak terpenuhi.

H. Mendeteksi Pencilan

Menggunakan DFFITS untuk mendeteksi pencilan dari data yang dianalisis.

nilai.pembanding.dffits=2*(sqrt(4/4248))
jumlah_outlier <- sum(abs(dffits(mkt)) > nilai.pembanding.dffits)
jumlah_outlier
## [1] 371

Berdasarkan output di atas, didapatkan sebanyak 371 data dari total 4248 adalah data pencilan yang berarti sekitar 8,73% dari data termasuk observasi yang berpengaruh atau tidak biasa. Persentase ini cukup signifikan dan dapat memengaruhi hasil model regresi linear.

Setelah dilakukan uji asumsi klasik dan pendeteksian pencilan, diketahui bahwa masih terdapat asumsi yang tidak terpenuhi, yaitu asumsi normalitas, homogenitas, dan linearitas. Kondisi ini juga diperparah dengan terdapat banyaknya data pencilan yang memengaruhi model regresi linear. Treatment khusus dari data ini diperlukan agar hasil analisis diperoleh secara akurat dan relevan. Dalam hal ini, treatment yang digunakan adalah pemodelan regresi robust untuk menangani masalah asumsi yang tidak terpenuhi dan menangani masalah pencilan.

Model Regresi Robust

Membangun model regresi robust untuk menangani berbagai asumsi klasik yang tidak terpenuhi dan menangani masalah pencilan dalam Coffee Chain Datasets.

model_robust <- lmrob(Profit ~ Sales + Inventory + Marketing, data = datafix, method = "S", 
                      psi = "bisquare", tuning.chi = 3.44, k.max = 200)
summary(model_robust)
## 
## Call:
## lmrob(formula = Profit ~ Sales + Inventory + Marketing, data = datafix, method = "S", 
##     psi = "bisquare", tuning.chi = 3.44, k.max = 200)
##  \--> method = "S"
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -189.638   -4.051    2.817   17.924  383.048 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.214e+01  3.537e-01  -62.59   <2e-16 ***
## Sales        1.031e+00  4.259e-03  242.06   <2e-16 ***
## Inventory    1.050e-02  5.071e-04   20.71   <2e-16 ***
## Marketing   -4.630e+00  3.311e-02 -139.81   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Robust residual standard error: 5.906 
## Multiple R-squared:  0.9887, Adjusted R-squared:  0.9887 
## 
## Robustness weights: 
##  1218 observations c(7,8,15,28,29,35,41,44,49,51,60,67,75,76,82,89,90,92,98,101,111,128,134,135,150,154,155,159,166,171,176,184,185,192,205,206,212,218,222,226,229,237,244,252,253,259,266,267,269,275,278,289,305,311,312,327,331,332,336,343,348,353,361,362,369,382,383,389,395,399,403,406,414,421,429,430,436,443,444,446,448,456,466,483,488,489,504,508,509,513,520,525,530,540,541,547,553,554,568,572,576,580,584,590,597,606,607,612,620,621,623,625,633,643,662,665,666,682,686,687,690,691,692,707,708,717,718,724,730,731,745,749,753,757,761,767,774,783,784,789,797,798,800,803,811,820,839,842,843,858,862,863,867,868,869,884,885,894,895,900,906,907,922,926,930,934,938,944,951,960,961,966,974,975,977,980,988,997,1015,1019,1020,1035,1039,1040,1044,1045,1046,1061,1062,1063,1064,1080,1085,1086,1092,1105,1109,1113,1117,1123,1131,1138,1139,1144,1151,1153,1154,1160,1168,1172,1189,1205,1206,1209,1213,1214,1219,1220,1229,1234,1236,1240,1241,1257,1262,1263,1269,1282,1286,1290,1294,1300,1308,1315,1316,1321,1328,1330,1331,1337,1345,1349,1366,1381,1382,1383,1386,1390,1391,1396,1397,1406,1411,1413,1417,1418,1434,1439,1440,1446,1459,1463,1467,1471,1477,1486,1492,1493,1499,1505,1507,1508,1514,1522,1527,1543,1558,1559,1560,1563,1567,1568,1573,1579,1583,1588,1590,1595,1596,1610,1616,1617,1624,1636,1640,1642,1648,1654,1662,1669,1670,1675,1682,1684,1685,1691,1699,1704,1705,1718,1735,1736,1737,1739,1743,1755,1756,1760,1765,1767,1772,1773,1787,1793,1794,1801,1813,1817,1819,1825,1831,1839,1846,1847,1848,1852,1859,1860,1861,1862,1868,1876,1881,1882,1895,1912,1913,1914,1916,1920,1932,1933,1937,1942,1944,1951,1952,1965,1968,1969,1980,1990,1994,1996,2002,2008,2016,2023,2024,2025,2029,2036,2037,2038,2039,2045,2053,2058,2059,2072,2089,2090,2091,2093,2097,2109,2110,2114,2119,2121,2126,2134,2135,2136,2137,2138,2141,2144,2145,2148,2154,2155,2171,2175,2179,2185,2193,2200,2202,2206,2210,2211,2212,2215,2217,2222,2228,2230,2233,2241,2242,2244,2248,2249,2258,2259,2260,2264,2266,2267,2269,2270,2273,2275,2287,2288,2296,2301,2303,2308,2310,2311,2312,2313,2314,2315,2316,2318,2321,2322,2323,2325,2331,2332,2348,2352,2356,2362,2364,2370,2377,2379,2383,2387,2388,2389,2390,2391,2392,2393,2394,2399,2405,2407,2410,2418,2419,2421,2422,2425,2426,2435,2436,2437,2438,2439,2441,2443,2444,2446,2447,2449,2450,2452,2464,2469,2473,2478,2480,2485,2487,2488,2489,2490,2491,2492,2493,2495,2498,2499,2500,2502,2508,2509,2525,2529,2533,2539,2541,2548,2554,2556,2560,2564,2565,2566,2567,2568,2569,2570,2571,2576,2582,2584,2587,2590,2595,2596,2598,2599,2602,2603,2612,2613,2614,2615,2616,2618,2619,2620,2621,2622,2624,2626,2627,2629,2643,2646,2650,2655,2657,2662,2664,2665,2666,2667,2668,2669,2670,2672,2674,2675,2676,2677,2679,2685,2686,2697,2702,2706,2710,2716,2717,2725,2726,2731,2732,2739,2741,2742,2743,2744,2745,2746,2747,2748,2753,2761,2764,2767,2772,2773,2775,2776,2780,2789,2790,2791,2792,2793,2796,2797,2798,2799,2800,2801,2802,2803,2804,2806,2816,2820,2821,2823,2827,2832,2834,2838,2839,2841,2842,2843,2844,2845,2846,2847,2849,2850,2851,2852,2853,2854,2855,2856,2862,2869,2873,2874,2879,2883,2885,2887,2888,2889,2893,2894,2896,2901,2902,2903,2904,2908,2909,2916,2918,2919,2920,2921,2922,2923,2924,2925,2927,2930,2938,2941,2942,2944,2946,2949,2950,2952,2953,2957,2961,2965,2966,2967,2968,2969,2970,2972,2973,2974,2975,2976,2977,2978,2979,2980,2981,2982,2983,2990,2992,2993,2997,2998,3000,3004,3008,3009,3011,3016,3018,3019,3020,3021,3022,3023,3024,3026,3027,3028,3029,3030,3031,3032,3033,3039,3050,3051,3056,3060,3064,3065,3070,3071,3074,3078,3079,3080,3081,3085,3086,3093,3095,3096,3097,3098,3099,3100,3101,3102,3103,3107,3115,3118,3121,3123,3126,3127,3129,3130,3134,3143,3144,3145,3146,3147,3149,3150,3151,3152,3153,3154,3155,3156,3157,3158,3159,3160,3167,3169,3170,3174,3175,3177,3181,3185,3186,3188,3193,3194,3195,3196,3198,3199,3200,3201,3203,3204,3205,3206,3207,3208,3209,3210,3216,3227,3228,3232,3237,3238,3240,3241,3247,3250,3255,3256,3257,3258,3262,3264,3268,3272,3273,3274,3275,3276,3277,3278,3279,3280,3284,3292,3295,3298,3300,3303,3304,3306,3307,3313,3318,3320,3322,3323,3324,3325,3326,3327,3328,3329,3330,3331,3332,3333,3334,3335,3336,3337,3344,3345,3348,3349,3356,3359,3360,3361,3365,3369,3370,3371,3372,3373,3375,3376,3377,3378,3380,3381,3382,3383,3384,3385,3386,3387,3393,3394,3404,3405,3409,3412,3414,3417,3418,3419,3424,3429,3431,3432,3433,3434,3435,3439,3441,3445,3449,3450,3451,3452,3453,3454,3455,3456,3457,3460,3461,3467,3469,3472,3473,3475,3477,3480,3481,3483,3484,3485,3490,3495,3497,3498,3500,3501,3502,3503,3504,3505,3506,3507,3508,3509,3510,3511,3512,3513,3514,3521,3522,3524,3525,3533,3536,3537,3540,3542,3546,3547,3548,3549,3550,3552,3553,3554,3555,3557,3558,3559,3561,3562,3564,3570,3571,3586,3591,3594,3601,3609,3616,3618,3622,3626,3627,3628,3629,3630,3631,3632,3633,3634,3638,3644,3646,3649,3650,3652,3657,3658,3660,3661,3662,3667,3672,3674,3675,3677,3678,3679,3680,3681,3682,3684,3685,3686,3688,3689,3690,3691,3701,3702,3703,3710,3714,3719,3723,3724,3726,3728,3729,3731,3732,3734,3737,3738,3739,3741,3747,3748,3764,3768,3772,3778,3780,3786,3793,3795,3799,3803,3804,3805,3806,3807,3808,3809,3810,3811,3815,3821,3823,3826,3827,3829,3834,3837,3838,3839,3844,3845,3851,3852,3854,3855,3857,3858,3859,3860,3861,3863,3865,3866,3868,3878,3882,3883,3887,3888,3894,3896,3900,3903,3905,3906,3908,3911,3913,3914,3915,3916,3918,3924,3925,3936,3941,3945,3949,3955,3957,3963,3966,3970,3972,3976,3980,3981,3982,3983,3985,3986,3987,3988,3992,3998,4000,4003,4004,4006,4011,4013,4014,4016,4021,4022,4028,4031,4032,4034,4035,4036,4037,4038,4040,4042,4043,4044,4045,4053,4055,4059,4060,4064,4065,4071,4073,4077,4080,4082,4083,4085,4088,4090,4091,4092,4093,4095,4101,4102,4104,4113,4118,4122,4126,4132,4140,4143,4147,4149,4153,4154,4157,4158,4159,4160,4162,4163,4164,4165,4169,4175,4177,4180,4181,4183,4188,4190,4191,4193,4200,4205,4208,4209,4212,4213,4214,4215,4216,4217,4219,4220,4221,4222,4230,4232,4236,4237,4241,4248)
##   are outliers with |weight| = 0 ( < 2.4e-05); 
##  150 weights are ~= 1. The remaining 2880 ones are summarized as
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## 0.0004228 0.6219000 0.8559000 0.7517000 0.9607000 0.9990000 
## Algorithmic parameters: 
##        tuning.chi                bb        tuning.psi        refine.tol 
##         3.440e+00         5.000e-01         4.685e+00         1.000e-07 
##           rel.tol         scale.tol         solve.tol          zero.tol 
##         1.000e-07         1.000e-10         1.000e-07         1.000e-10 
##       eps.outlier             eps.x warn.limit.reject warn.limit.meanrw 
##         2.354e-05         1.501e-08         5.000e-01         5.000e-01 
##      nResample         max.it         groups        n.group       best.r.s 
##            500             50              5            400              2 
##       k.fast.s          k.max    maxit.scale      trace.lev            mts 
##              1            200            200              0           1000 
##     compute.rd fast.s.large.n 
##              0           2000 
##                   psi           subsampling                   cov 
##            "bisquare"         "nonsingular"             ".vcov.w" 
## compute.outlier.stats 
##                   "S" 
## seed : int(0)

Diperoleh model regresi sebagai berikut:

\[Y = -22.14 + 1.031X_1 + 0.0105X_2 - 4.63X_3\]

Interpretasi estimasi model persamaan regresi robust:

  1. Jika semua variabel independen bernilai nol, maka nilai prediksi profit (Y) adalah -22.14 dolar.

  1. Untuk setiap kenaikan satu unit dalam sales akan meningkatkan profit sebesar 1.031 dolar

  1. Untuk setiap kenaikan satu unit dalam inventory akan menurunkan profit sebesar 0.0105 dolar

  1. Untuk setiap kenaikan satu dolar dalam marketing akan menurunkan profit sebesar 4.63 dolar

Pada model metode kuadrat terkecil, diperoleh nilai Adjusted R-squared = 0.9887 yang berarti bahwa profit mampu dijelaskan oleh variabel sales, inventory, dan marketing sebesar 98.87%, sedangkan sisanya (1.13%) dijelaskan oleh faktor lain yang belum diujikan pada model.

Model regresi robust dengan metode S dan fungsi bisquare berhasil mengurangi pengaruh pencilan (seperti yang terdeteksi oleh DFFITS sebelumnya dengan ambang 0.06137164 untuk 4248 data) yang terlihat dari distribusi residu yang lebih terkontrol dibandingkan model OLS.

A. Uji Signifikansi Robust

Berdasarkan hasil dari model regresi pada bagian sebelumnya, dikarenakan p-value \(< 2.2 \times 10^{-16}\) memiliki nilai lebih kecil daripada \(\alpha\) = 0.05, maka kita memiliki cukup bukti untuk menolak \(H_0\) sehingga setidaknya terdapat pengaruh yang signifikan antara sales, inventory, dan marketing terhadap profit secara simultan.

B. Uji Parsial Robust

Berdasarkan hasil dari model regresi pada bagian metode kuadrat terkecil, didapatkan:

  • p_value dari sales \((X_1) < 2.2 \times 10^{-16}\)
  • p_value dari inventory \((X_2) < 2.2 \times 10^{-16}\)
  • p_value dari marketing \((X_3) < 2.2 \times 10^{-16}\)

Dikarenakan semua p-value dari variabel \(X_1, X_2,dan X_3\) memiliki nilai lebih kecil daripada \(\alpha\) = 0.05, maka kita memiliki cukup bukti untuk menolak \(H_0\) sehingga sales, inventory, dan marketing berpengaruh secara signifikan terhadap profit.

Daftar Pustaka

Gujarati, D. N., & Porter, D. C. (2009). Basic Econometrics (5th ed.). McGraw-Hill.

Minnick, C., & Holland, E. (2024). HTML, CSS, & JavaScript all-in-one for dummies. John Wiley & Sons.

Rousseeuw, P. J., & Leroy, A. M. (1987). Robust Regression and Outlier Detection. John Wiley & Sons.

Wooldridge, J. M. (2013). Introductory Econometrics: A Modern Approach (5th ed.). South-Western.

Xie, Y., Dervieux, C., & Riederer, E. (2020). R Markdown cookbook. Chapman and Hall/CRC. https://bookdown.org/yihui/rmarkdown-cookbook/