con <- DBI::dbConnect(odbc::odbc(), Driver = "MySQL ODBC 8.0 ANSI Driver", Server = "127.0.0.1", Database = "db_coffee_chain", UID = "root", PWD = "Yutayuta11", Port = 3306)

PENDAHULUAN

Laporan ini disusun untuk menganalisis data transaksi Coffee Chain guna memahami bagaimana variabel-variabel operasional memengaruhi profitabilitas perusahaan. Analisis dilakukan menggunakan integrasi database MySQL dan bahasa pemrograman R.

RUMUSAN MASALAH

Berdasarkan data yang tersedia, analisis ini dilakukan untuk menjawab beberapa poin utama:

  1. Apakah variabel Sales, COGS, Marketing, dan Inventory secara simultan berpengaruh terhadap laba bersih (Profit)?

  2. Variabel manakah yang memberikan kontribusi paling signifikan terhadap perubahan keuntungan?

  3. Bagaimana tingkat efisiensi pengelolaan biaya produksi dan pemasaran saat ini?

  4. Apakah terdapat risiko tertentu terkait kebijakan pengelolaan stok barang di gudang?

EKSPLORASI DATA

data_coffee <- dbGetQuery(con, "SELECT Sales, COGS, Marketing, Inventory, Profit FROM facttable")

# 1. cek 6 baris pertama
head(data_coffee)
##   Sales COGS Marketing Inventory Profit
## 1   219   89        24       777     94
## 2   190   83        27       623     68
## 3   234   95        26       821    101
## 4   100   44        14       623     30
## 5   134   54        15       456     54
## 6   180   72        23       558     53
# 2. cek apakah ada data yang kosong
colSums(is.na(data_coffee))
##     Sales      COGS Marketing Inventory    Profit 
##         0         0         0         0         0
# 3. statistik deskriptif
summary(data_coffee)
##      Sales          COGS          Marketing        Inventory      
##  Min.   : 17   Min.   :  0.00   Min.   :  0.00   Min.   :-3534.0  
##  1st Qu.:100   1st Qu.: 43.00   1st Qu.: 13.00   1st Qu.:  432.0  
##  Median :138   Median : 60.00   Median : 22.00   Median :  619.0  
##  Mean   :193   Mean   : 84.43   Mean   : 31.19   Mean   :  749.4  
##  3rd Qu.:230   3rd Qu.:100.00   3rd Qu.: 39.00   3rd Qu.:  910.5  
##  Max.   :912   Max.   :364.00   Max.   :156.00   Max.   : 8252.0  
##      Profit      
##  Min.   :-638.0  
##  1st Qu.:  17.0  
##  Median :  40.0  
##  Mean   :  61.1  
##  3rd Qu.:  92.0  
##  Max.   : 778.0

VISUALISASI DATA

Pada bagian ini, kita akan membedah tiga insight utama dari operasional kedai kopi untuk melihat faktor apa saja yang paling memengaruhi laba bersih (Profit) perusahaan.

### Insight 1: Hubungan Penjualan terhadap Keuntungan

Tujuan analisis ini adalah melihat apakah volume penjualan yang tinggi selalu menjamin keuntungan yang besar bagi perusahaan.

ggplot(data_coffee, aes(x = Sales, y = Profit)) +
  geom_point(color = "darkgreen", alpha = 0.5) +
  geom_smooth(method = "lm", color = "darkred") +
  theme_minimal() +
  labs(title = "Insight 1: Hubungan Penjualan terhadap Keuntungan",
       x = "Total Sales", y = "Total Profit")
## `geom_smooth()` using formula = 'y ~ x'

interpretasi:

Berdasarkan grafik di atas, garis tren berwarna merah tua menunjukkan arah pergerakan data yang menanjak. Secara umum, terlihat adanya korelasi positif yang sangat kuat antara Sales dan Profit. Hal ini sejalan dengan hasil uji T yang menunjukkan variabel Sales berpengaruh positif dan sangat signifikan (p < 0.05). Artinya, strategi penjualan perusahaan saat ini sudah berada di jalur yang benar; setiap peningkatan volume penjualan terbukti mampu meningkatkan keuntungan perusahaan secara nyata.

### Insight 2: Dampak Biaya Bahan Baku terhadap Laba

ggplot(data_coffee, aes(x = COGS, y = Profit, size = Sales)) +
  geom_point(color = "navy", alpha = 0.5) +
  scale_size(range = c(1, 8), name = "Volume Sales") +
  theme_minimal() +
  labs(title = "Insight 2: Dampak COGS terhadap Profit (Ukuran Berdasarkan Sales)",
       x = "Biaya Bahan Baku (COGS)", 
       y = "Keuntungan (Profit)")

interpretasi:

Melalui Bubble Chart ini, kita melihat visualisasi yang kompleks. Memang benar gelembung besar (Sales tinggi) cenderung berada di area atas (Profit tinggi), namun sebarannya juga melebar ke kanan (COGS tinggi). Hal yang paling krusial untuk diperhatikan adalah hasil uji T regresi yang menunjukkan COGS berpengaruh negatif secara signifikan. Visualisasinya terlihat pada banyaknya titik data yang posisinya berada di kanan bawah (COGS tinggi tapi Profit rendah/rugi). Ini adalah peringatan bagi manajemen bahwa biaya bahan baku saat ini terlalu tinggi dan menggerus margin keuntungan, sehingga diperlukan efisiensi produksi segera.

### Insight 3: Evaluasi Manajemen Stok Gudang

midstock <- median(data_coffee$Inventory, na.rm = TRUE)
data_coffee$kategori_stok <- ifelse(data_coffee$Inventory > midstock, "Tinggi", "Rendah")

ggplot(data_coffee, aes(x = kategori_stok, y = Profit, fill = kategori_stok)) +
  geom_boxplot(alpha = 0.7) +
  scale_fill_manual(values = c("Tinggi" = "forestgreen", "Rendah" = "pink")) +
  theme_minimal() +
  labs(title = "Perbandingan Keuntungan antara Stok Tinggi dengan Stok Rendah",
       x = "Kapasitas Stok di Gudang", 
       y = "Keuntungan (Profit)") +
  theme(legend.position = "none")

interpretasi:

Boxplot di atas menyajikan perbandingan risiko yang sangat jelas. Meskipun garis tengah (median) profit pada kotak hijau (Stok Tinggi) posisinya sedikit lebih tinggi daripada kotak pink (Stok Rendah), namun rentang sebaran data (whisker) dan banyaknya titik hitam (outlier) pada stok tinggi menjalar jauh hingga ke angka negatif yang dalam. Hal ini membuktikan bahwa menumpuk inventaris terlalu banyak di gudang memiliki risiko kerugian ekstrem yang jauh lebih besar. Manajemen disarankan untuk beralih ke strategi inventory yang lebih ramping (Just-In-Time) guna meminimalkan risiko tersebut.

PENGUJIAN DATA

Untuk memastikan secara ilmiah dan mengukur besaran pengaruh setiap variabel operasional terhadap Profit, kita menggunakan pemodelan regresi.

model_regresi <- lm(Profit ~ Sales + COGS + Marketing + Inventory, data = data_coffee)

1. Uji T dan Uji F

summary(model_regresi)
## 
## Call:
## lm(formula = Profit ~ Sales + COGS + Marketing + Inventory, data = data_coffee)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -129.035  -10.578    0.032    8.610  102.115 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -24.891587   0.586072 -42.472  < 2e-16 ***
## Sales         1.221031   0.005716 213.631  < 2e-16 ***
## COGS         -1.289305   0.017388 -74.151  < 2e-16 ***
## Marketing    -1.449671   0.020179 -71.839  < 2e-16 ***
## Inventory     0.005890   0.000770   7.649  2.5e-14 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.34 on 4243 degrees of freedom
## Multiple R-squared:   0.96,  Adjusted R-squared:   0.96 
## F-statistic: 2.549e+04 on 4 and 4243 DF,  p-value: < 2.2e-16

interpretasi:

  • Uji F (Simultan): Karena p-value \((< 2.2 \times 10^{-16})\) jauh lebih kecil dari 0.05, maka model regresi ini Sangat Signifikan. Artinya, Sales, COGS, Marketing, dan Inventory secara bersama-sama sangat kuat memengaruhi Profit.

  • Uji T (Parsial): Semua variabel memiliki tanda bintang tiga (***), artinya semuanya berpengaruh nyata. Namun, perhatikan arahnya jika diperhatikan dari arahnya, Sales berpengaruh positif (1.22). Setiap kenaikan penjualan akan meningkatkan keuntungan. Sedangkan untuk COGS dan Marketing justru berpengaruh negatif (-1.28 dan -1.44). Ini berarti setiap kenaikan biaya bahan baku dan biaya iklan justru menurunkan keuntungan pada dataset ini.

2. Uji Normalitas

shapiro.test(residuals(model_regresi))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model_regresi)
## W = 0.90931, p-value < 2.2e-16

interpretasi:

Berdasarkan hasil uji, didapatkan p-value \((< 2.2 \times 10^{-16})\). Secara teori, karena \(p < 0.05\), maka residual data tidak berdistribusi normal.

INSIGHT

Berdasarkan pengolahan data, ditemukan bahwa variabel Sales merupakan motor utama penggerak laba. Namun, terdapat anomali pada variabel Marketing dan COGS yang berpengaruh negatif secara signifikan, mengindikasikan bahwa pengeluaran di sektor tersebut belum optimal. Selain itu, kebijakan stok tinggi teridentifikasi membawa risiko kerugian (downside risk) yang lebih besar bagi perusahaan.

KESIMPULAN DAN SARAN

Dapat disimpulkan bahwa model regresi ini sangat layak dengan akurasi sebesar 96% (R-squared = 0.96) dalam menjelaskan fluktuasi laba. Meskipun uji Shapiro-Wilk menunjukkan data tidak berdistribusi normal (p < 0.05), hal ini dapat dimaklumi mengingat besarnya sampel data yang dianalisis. Sebagai saran bisnis, manajemen disarankan untuk segera melakukan audit terhadap biaya pemasaran dan mencari supplier bahan baku yang lebih kompetitif guna menekan nilai COGS. Perusahaan juga perlu menerapkan strategi inventory yang lebih ramping untuk meminimalkan risiko kerugian akibat penumpukan stok.