Pendahuluan

Dalam dunia bisnis, pengelolaan persediaan (inventory) memegang peranan penting dalam menentukan efisiensi operasional dan profitabilitas perusahaan. Salah satu komponen biaya utama yang sangat dipengaruhi oleh kegiatan operasional adalah Cost of Goods Sold (COGS) atau biaya pokok penjualan, yang mencerminkan total biaya yang dikeluarkan untuk memproduksi atau memperoleh barang yang dijual kepada pelanggan. Hubungan antara persediaan dan COGS menjadi menarik untuk dianalisis karena secara teoritis, perubahan pada tingkat persediaan dapat mencerminkan fluktuasi dalam aktivitas produksi, pembelian, maupun penjualan. Dalam konteks ini, analisis korelasi Spearman digunakan untuk mengevaluasi hubungan monotonic antara variabel Inventory dan COGS. Pendekatan ini dipilih karena data keuangan seperti persediaan dan biaya seringkali memiliki distribusi yang tidak normal dan mengandung outlier. Hasil dari analisis ini diharapkan dapat memberikan pemahaman lebih dalam mengenai bagaimana tingkat persediaan perusahaan berkaitan dengan biaya pokok penjualannya, yang selanjutnya dapat digunakan untuk menyusun strategi pengelolaan persediaan yang lebih efisien.

Misalkan tersedia \(n\) pasang data \(\{(X_1, Y_1), (X_2, Y_2), \dots, (X_n, Y_n)\}\). Dari pasangan ini, dibuat dua himpunan peringkat \(\{R(X_1), R(X_2), \dots, R(X_n)\}\) dan \(\{R(Y_1), R(Y_2), \dots, R(Y_n)\}\), dengan

\(R(X_i)\): rank Xi di antara observasi X1, X2, …, Xn
\(R(Y_i)\): rank Yi di antara observasi Y1, Y2, …, Yn

Koefisien korelasi rank Spearman untuk n pasang observasi \(\{(X_1, Y_1), (X_2, Y_2), \dots, (X_n, Y_n)\}\) dapat dicari menggunakan rumus :

\[\rho = 1 - \frac{6 \sum d_i^2}{n(n^2 - 1)}\] \[dimana\] \[d_i = R(X_i) - R(Y_i)\]

Deskripsi Data

Dataset Coffee Chain yang digunakan dalam analisis ini berisi informasi penjualan dari sebuah jaringan kedai kopi pada tahun 2012. Data ini mencakup berbagai variabel yang merepresentasikan aspek keuangan dan operasional dari unit bisnis kedai kopi di berbagai lokasi. Dalam analisis ini, variabel yang digunakan adalah:
\(X\)(Inventory): Jumlah barang atau produk yang dimiliki oleh suatu perusahaan.
\(Y\)(COGS) : Biaya pokok penjualan atau total biaya yang dikeluarkan untuk memproduksi barang yang dijual.

library(car)
library(MASS)
library(lmtest)
library(dplyr)
library(fit.models)
library(readxl)
library(ggplot2)
library(corrplot)
library(knitr)
library(kableExtra)

data_CM1 <- read_excel("D:/Data SIM.xlsx")
data.frame(data_CM1)

##       Y    X
## 1    89  777
## 2    83  623
## 3    95  821
## 4    44  623
## 5    54  456
## 6    72  558
## 7   170 1091
## 8    63  435
## 9    60  336
## 10   58  338
## 11   64  965
## 12  144  862
## 13   95  608
## 14  234 1310
## 15  228 1459
## 16   89  777
## 17   83  623
## 18   95  821
## 19   54  456
## 20   72  558
## 21   18  821
## 22   28  965
## 23   23  623
## 24   17  777
## 25   17  777
## 26  234 1310
## 27   95  608
## 28  228 1459
## 29  245 1419
## 30   85  494
## 31   78  965
## 32   34  197
## 33   50  821
## 34   46  777
## 35   37  261
## 36   88  525
## 37   35  196
## 38   29  169
## 39   60  336
## 40   57  364
## 41   63  435
## 42   84  500
## 43   58  338
## 44  170 1091
## 45   32  456
## 46   32  821
## 47   84  651
## 48   54  312
## 49   79  551
## 50   77  432
## 51   75  522
## 52   48  623
## 53   69  965
## 54   67  400
## 55   33  777
## 56   61  390
## 57   50  821
## 58   38  777
## 59   55  312
## 60   75  522
## 61  124  961
## 62   85  494
## 63   78  965
## 64   32  821
## 65   33  777
## 66   77  432
## 67   79  551
## 68   84  500
## 69   84  651
## 70   48  623
## 71   54  312
## 72   69  965
## 73   32  821
## 74   32  456
## 75  170 1091
## 76   63  435
## 77   72  558
## 78   58  338
## 79   18  821
## 80   17  777
## 81   29  169
## 82   37  261
## 83   38  241
## 84   48  372
## 85   34  197
## 86   95  821
## 87   89  777
## 88   54  456
## 89  228 1459
## 90  105  725
## 91  271 2101
## 92  245 1419
## 93  207  965
## 94   67  400
## 95   61  390
## 96   49  623
## 97   85  494
## 98   75  522
## 99   34  777
## 100  33  777

Statistik Deskriptif

Statistik deskriptif adalah metode analisis yang digunakan untuk menyusun dan merangkum data secara terstruktur. Melalui berbagai ukuran statistik, pendekatan ini membantu menggambarkan pola serta karakteristik utama dari data yang diteliti. Statistik deskriptif memberikan wawasan mengenai distribusi dan sifat dasar tiap variabel yang dianalisis. Beberapa ukuran yang umum digunakan meliputi nilai minimum untuk menunjukkan angka terendah, kuartil pertama (Q1) dan kuartil ketiga (Q3) yang mencerminkan penyebaran data di bagian bawah dan atas, serta median (Q2) yang menunjukkan titik tengah dari data yang telah diurutkan. Rata-rata (mean) digunakan untuk menggambarkan kecenderungan umum dari data, sedangkan nilai maksimum mencerminkan angka tertinggi dalam himpunan data tersebut.

# statistik deskriptif untuk semua variabel
summary(data_CM1)

##        Y                X         
##  Min.   : 17.00   Min.   : 169.0  
##  1st Qu.: 42.50   1st Qu.: 435.0  
##  Median : 63.50   Median : 623.0  
##  Mean   : 79.47   Mean   : 673.5  
##  3rd Qu.: 85.00   3rd Qu.: 821.0  
##  Max.   :271.00   Max.   :2101.0

Berdasarkan hasil analisis, untuk variabel Y diperoleh nilai minimum sebesar 17 dan nilai maksimum mencapai 271. Kuartil pertama (Q1) adalah 42.5, median atau kuartil kedua (Q2) sebesar 63.5, dan kuartil ketiga (Q3) sebesar 85. Rata-rata (mean) dari variabel Y adalah 79.47 yang menunjukkan bahwa secara umum nilai Y cenderung berada di sekitar angka tersebut. Sementara itu untuk variabel X, nilai minimum adalah 169 dan nilai maksimum sebesar 2101. Kuartil pertama (Q1) berada di angka 435, median sebesar 623, dan kuartil ketiga (Q3) sebesar 821. Rata-rata dari variabel X tercatat sebesar 673.5. Dari informasi ini dapat disimpulkan bahwa kedua variabel memiliki rentang nilai yang cukup lebar khususnya variabel X yang menunjukkan kemungkinan adanya variasi yang tinggi dalam data.

Model

model <- lm(Y ~ X, data = data_CM1)
summary(model)

## 
## Call:
## lm(formula = Y ~ X, data = data_CM1)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -88.50 -25.05  11.82  22.28  90.50 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -6.10304    8.72955  -0.699    0.486    
## X            0.12705    0.01158  10.969   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 39.17 on 98 degrees of freedom
## Multiple R-squared:  0.5511, Adjusted R-squared:  0.5465 
## F-statistic: 120.3 on 1 and 98 DF,  p-value: < 2.2e-16

Uji Asumsi: Normalitas

Hipotesis :
\(H_0\) = Residu berdistribusi normal
\(H_1\) = Residu tidak berdistribusi normal
Tingkat Signifikansi : \(\alpha = 0.05\)
Daerah Kritis : \(H_0\) ditolak apabila nilai p-value < \(0.05\)
Statistik uji :

# Grafik QQ Plot untuk normalitas residual
qqnorm(resid(model))
qqline(resid(model))

# Uji Normalitas Residu
shapiro.test(resid(model))

## 
##  Shapiro-Wilk normality test
## 
## data:  resid(model)
## W = 0.92823, p-value = 3.953e-05

Kesimpulan :

Karena grafik QQ Plot (Quantile-Quantile Plot) menunjukkan bahwa sebagian besar titik data tidak berada tepat di atas garis diagonal dan nilai p-value = 3.953e-05 < \(\alpha=0.05\), maka \(H_0\) ditolak sehingga residu tidak berdistribusi normal.

Scatter Plot

plot(data_CM1$X, data_CM1$Y, 
     xlab = "Inventory", ylab = "COGS", 
     main = "Scatter Plot Inventory vs COGS",
     col = "steelblue", pch = 19)

Berdasarkan visualisasi antara variabel Inventory (\(X\)) dan COGS (\(Y\)), terlihat bahwa secara umum terdapat pola hubungan positif antara kedua variabel yang berarti seiring dengan meningkatnya nilai, nilai Y juga cenderung meningkat. Titik-titik data terkonsentrasi pada kisaran nilai X antara 400 hingga 1000 dan nilai Y antara 30 hingga 100 menunjukkan bahwa sebagian besar pengamatan berada dalam rentang tersebut. Selain itu, terdapat beberapa titik ekstrem terutama satu observasi dengan nilai X lebih dari 2000 dan Y mendekati 270 yang dapat dikategorikan sebagai outlier. Pola menyebar secara tidak merata tetapi cenderung mengikuti arah naik mengindikasikan adanya potensi korelasi positif meskipun tidak sepenuhnya linier. Scatter plot ini dapat menjadi dasar awal untuk melakukan analisis korelasi lebih lanjut.

Box Plot

par(mfrow = c(1, 2))
boxplot(data_CM1$X, main = "Boxplot Inventory", col = "tan")
boxplot(data_CM1$Y, main = "Boxplot COGS", col = "skyblue")

par(mfrow = c(1,1))

Pada boxplot variabel Inventory(\(X\)) distribusi data tampak agak condong ke atas (right-skewed), dengan median berada sedikit di bawah pusat kotak yang menunjukkan bahwa sebagian besar nilai berada di bawah rata-rata. Terdapat beberapa outlier ekstrem di atas 1500 hingga lebih dari 2000 yang menunjukkan adanya nilai-nilai yang jauh lebih tinggi dibandingkan distribusi utama. Rentang antar kuartil (IQR) cukup lebar menunjukkan adanya variasi data yang relatif besar dalam variabel X.

Box plot untuk variabel COGS (\(Y\)) menunjukkan pola distribusi yang miring ke kanan. Median berada lebih dekat ke batas bawah kotak dan terdapat banyak outlier di atas nilai 150 dengan beberapa titik mencapai hampir 250. Ini menunjukkan bahwa variabel Y juga memiliki penyebaran data yang tinggi dan rentan terhadap nilai ekstrem meskipun secara umum nilai-nilainya lebih terkonsentrasi di rentang yang lebih kecil dibandingkan variabel X.

Kehadiran outlier pada kedua variabel serta distribusi yang tidak simetris menunjukkan bahwa data tidak berdistribusi normal. Hal ini mendukung penggunaan uji Spearman untuk menganalisis hubungan antar kedua variabel tersebut.

Uji Spearman

Hipotesis :
\(H_0\) = Variabel X dan Y independen
\(H_1\) = Variabel X dan Y tidak independen
Tingkat Signifikansi : \(\alpha = 0.05\)
Daerah Kritis : \(H_0\) ditolak apabila nilai p-value < \(0.05\)
Statistik uji :

cor.test(data_CM1$X, data_CM1$Y, method = "spearman")

## Warning in cor.test.default(data_CM1$X, data_CM1$Y, method = "spearman"):
## Cannot compute exact p-value with ties

## 
##  Spearman's rank correlation rho
## 
## data:  data_CM1$X and data_CM1$Y
## S = 99090, p-value = 2.862e-05
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.4053995

Kesimpulan :

Karena p-value = 2.862e-05 < \(\alpha=0.05\), maka \(H_0\) ditolak sehingga variabel X dan Y tidak independen.

Histogram

par(mfrow=c(1,2))
hist(data_CM1$X, main="Histogram Inventory", col="tan", xlab="Inventory")
hist(data_CM1$Y, main="Histogram COGS", col="skyblue", xlab="COGS")

par(mfrow=c(1,1))

Berdasarkan histogram yang ditampilkan, terlihat bahwa distribusi dari variabel Inventory menunjukkan pola yang cenderung menceng ke kanan (positively skewed). Sebagian besar nilai Inventory berkumpul pada kisaran 500 hingga 900, sementara terdapat sejumlah kecil data dengan nilai yang jauh lebih besar, bahkan melampaui 1500, yang mengindikasikan adanya potensi outlier. Demikian pula, distribusi variabel COGS (Cost of Goods Sold) juga menunjukkan karakteristik sebaran yang menceng ke kanan. Mayoritas nilai COGS berada pada rentang 0 hingga 75, dengan beberapa nilai ekstrem di atas 200 yang kemungkinan merupakan outlier.

Pola distribusi yang tidak simetris dan keberadaan nilai-nilai ekstrem ini menunjukkan bahwa kedua variabel tidak mengikuti distribusi normal. Oleh karena itu, dalam menganalisis hubungan antara Inventory dan COGS, pendekatan nonparametrik seperti uji korelasi Spearman lebih sesuai dibandingkan pendekatan parametik seperti Pearson. Dengan demikian, histogram ini tidak hanya memberikan gambaran visual mengenai sebaran data, tetapi juga menguatkan dasar pemilihan metode analisis statistik yang digunakan dalam studi ini.

Matriks Korelasi dan Heatmap

cor_matrix <- cor(data_CM1, method = "spearman")
round(cor_matrix, 2)

##      Y    X
## Y 1.00 0.41
## X 0.41 1.00

corrplot(cor(data_CM1, method = "spearman"), method = "color",
         type = "upper", tl.col = "black", tl.srt = 45,
         col=colorRampPalette(c("skyblue", "white", "salmon"))(200))

kable(round(cor_matrix, 3), caption = "Tabel Korelasi Spearman") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
                full_width = F, position = "center")

Tabel Korelasi Spearman
	Y	X
Y	1.000	0.405
X	0.405	1.000

Berdasarkan hasil analisis korelasi Spearman yang ditampilkan melalui matriks korelasi dan heatmap, diperoleh nilai koefisien korelasi sebesar 0,405 antara variabel Inventory (X) dan COGS (Y). Nilai ini menunjukkan adanya hubungan positif sedang antara kedua variabel, yang berarti ketika nilai Inventory meningkat, maka COGS juga cenderung meningkat, meskipun hubungan ini tidak terlalu kuat.

Warna pada heatmap yang cenderung merah muda ke merah menguatkan interpretasi bahwa korelasi bersifat positif, namun tidak mencapai tingkat yang sangat kuat. Ini berarti bahwa Inventory dan COGS saling terkait secara linier dalam arah yang sama, tetapi faktor lain di luar Inventory mungkin juga turut memengaruhi nilai COGS secara signifikan.

Kesimpulan

Berdasarkan analisis hubungan antara variabel Inventory (X) dan Cost of Goods Sold (COGS) (Y) pada data Coffee Chain tahun 2012, ditemukan bahwa data tidak memenuhi asumsi normalitas. Hal ini ditunjukkan oleh hasil uji Shapiro-Wilk yang menghasilkan p-value kurang dari 0.05, serta didukung oleh visualisasi boxplot yang menunjukkan distribusi data yang miring (skewed) dan mengandung pencilan (outlier). Mengingat kondisi distribusi data tersebut, digunakan analisis korelasi Spearman, yang lebih robust dan sesuai untuk data non-parametrik atau tidak berdistribusi normal.

Hasil uji korelasi Spearman menunjukkan bahwa terdapat hubungan positif yang signifikan antara variabel Inventory dan COGS, dengan koefisien korelasi sebesar 0.405 dan p-value sebesar 2.862e-05. Nilai p-value yang jauh lebih kecil dari tingkat signifikansi 0.05 menunjukkan bahwa hipotesis nol (tidak ada hubungan) ditolak. Dengan demikian, dapat disimpulkan bahwa terdapat asosiasi yang nyata antara inventory dan COGS. Artinya, perubahan pada jumlah persediaan cenderung diikuti oleh perubahan pada biaya pokok penjualan, meskipun hubungan ini tidak harus bersifat linier.

Temuan ini memiliki implikasi penting dalam konteks manajerial. Hubungan positif yang signifikan antara inventory dan COGS menunjukkan bahwa pengelolaan persediaan berdampak langsung terhadap efisiensi operasional, terutama dalam pengendalian biaya produksi. Jika persediaan dikelola secara tidak optimal, hal ini berpotensi meningkatkan biaya barang yang dijual, sehingga memengaruhi margin keuntungan. Oleh karena itu, strategi pengelolaan persediaan harus menjadi fokus utama dalam perencanaan operasional dan pengambilan keputusan manajerial.

Secara keseluruhan, analisis ini tidak hanya menunjukkan keterkaitan antara dua variabel utama dalam operasi bisnis ritel atau makanan dan minuman, tetapi juga menekankan pentingnya pendekatan statistik yang tepat ketika data tidak memenuhi asumsi klasik. Penggunaan metode Spearman memungkinkan diperoleh kesimpulan yang valid meskipun data mengandung penyimpangan dari normalitas, sehingga hasil yang diperoleh dapat diandalkan sebagai dasar untuk evaluasi dan pengambilan kebijakan

CM 1

Risvi Ragil Irawan (M0723077)