Dalam dunia bisnis, khususnya dalam industri makanan dan minuman, pemahaman terhadap kinerja produk merupakan hal yang krusial untuk mendukung pengambilan keputusan yang tepat. Salah satu indikator penting yang sering menjadi fokus utama dalam evaluasi kinerja produk adalah profitabilitas atau keuntungan yang dihasilkan dari setiap jenis produk yang ditawarkan.
Perusahaan perlu mengetahui apakah suatu kategori produk memberikan kontribusi keuntungan yang lebih tinggi dibandingkan kategori lainnya. Dalam konteks ini, lini produk seperti Beans dan Leaves merupakan dua jenis produk utama yang ditawarkan oleh perusahaan kopi. Untuk membantu perusahaan dalam merumuskan strategi penjualan, penting untuk mengetahui apakah terdapat perbedaan signifikan dalam rata-rata keuntungan yang dihasilkan oleh kedua lini produk tersebut.
Melalui pendekatan statistik, khususnya uji t dua sampel independen, analisis ini bertujuan untuk menguji apakah perbedaan profit antara produk berbasis Beans dan Leaves bersifat signifikan atau hanya terjadi secara kebetulan. Dengan hasil analisis ini, perusahaan diharapkan dapat mengambil keputusan yang lebih berbasis data dalam mengelola portofolio produknya.
Data yang digunakan dalam analisis ini berasal dari dataset berjudul “Coffee Chain Datasets” yang berisi informasi penjualan berbagai produk pada jaringan toko kopi. Data tersebut diambil dari sheet “data” dalam file Excel, yang mencakup berbagai variabel terkait kinerja penjualan dan keuangan.
Untuk keperluan analisis ini diarahkan pada dua variabel utama, yaitu:
Product Line: Merupakan kategori produk berdasarkan bentuk penyajiannya, yang terdiri dari dua jenis, yaitu “Beans” (produk berbasis biji kopi) dan “Leaves” (produk berbasis daun, seperti teh).
Profit: Merupakan jumlah keuntungan yang diperoleh dari masing-masing transaksi penjualan. Nilai ini dihitung sebagai selisih antara total penjualan dengan biaya pokok penjualan (COGS) dan pengeluaran lainnya.
Setiap baris dalam dataset merepresentasikan satu unit transaksi atau entitas penjualan, lengkap dengan informasi wilayah pemasaran, jenis produk, dan performa keuangannya. Data yang digunakan mencerminkan kondisi nyata operasional dari jaringan bisnis kopi dan teh, sehingga relevan untuk dianalisis lebih lanjut guna memahami perbedaan kinerja antar kategori produk.
#Memanggil Data dari Excell
library(readxl)
## Warning: package 'readxl' was built under R version 4.3.3
datacm <- read_excel("C:/Users/USER/Downloads/3. CM1 - Coffee Chain Datasets/3. CM1 - Coffee Chain Datasets.xlsx")
print(datacm)
## # A tibble: 4,248 × 20
## `Area Code` Date Market `Market Size` Product `Product Line`
## <dbl> <dttm> <chr> <chr> <chr> <chr>
## 1 719 2012-01-01 00:00:00 Central Major Market Amaretto Beans
## 2 970 2012-01-01 00:00:00 Central Major Market Colombi… Beans
## 3 970 2012-01-01 00:00:00 Central Major Market Decaf I… Beans
## 4 303 2012-01-01 00:00:00 Central Major Market Green T… Leaves
## 5 303 2012-01-01 00:00:00 Central Major Market Caffe M… Beans
## 6 720 2012-01-01 00:00:00 Central Major Market Decaf E… Beans
## 7 970 2012-01-01 00:00:00 Central Major Market Chamomi… Leaves
## 8 719 2012-01-01 00:00:00 Central Major Market Lemon Leaves
## 9 970 2012-01-01 00:00:00 Central Major Market Mint Leaves
## 10 719 2012-01-01 00:00:00 Central Major Market Darjeel… Leaves
## # ℹ 4,238 more rows
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## # `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## # `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## # Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
#Data yang diambil untuk dijadikan insight
datacm1 <- datacm[,c("Product Line","Profit")]
print(datacm1)
## # A tibble: 4,248 × 2
## `Product Line` Profit
## <chr> <dbl>
## 1 Beans 94
## 2 Beans 68
## 3 Beans 101
## 4 Leaves 30
## 5 Beans 54
## 6 Beans 53
## 7 Leaves 99
## 8 Leaves 0
## 9 Leaves 33
## 10 Leaves 17
## # ℹ 4,238 more rows
Untuk mengetahui apakah terdapat perbedaan yang signifikan dalam rata-rata keuntungan (Profit) antara dua kategori Product Line, yaitu Beans dan Leaves, digunakan pendekatan analisis statistik berupa uji t dua sampel independen (Independent Samples T-Test).
Uji ini bertujuan untuk membandingkan rata-rata dua kelompok yang tidak saling berhubungan (independen), dalam hal ini keuntungan dari produk Beans dan Leaves, guna mengetahui apakah perbedaan yang diamati bersifat signifikan secara statistik atau hanya terjadi secara kebetulan.
\[ \alpha = 0.05 \]
\[ \text{H₀ ditolak Jika } p\text{-value} < \alpha \]
Rumus Uji T: \[ t = \frac{x - \mu}{\frac{\sigma}{\sqrt(n)}} \]
beans_profit <- datacm1$Profit[datacm1$"Product Line" == "Beans"]
leaves_profit <- datacm1$Profit[datacm1$"Product Line" == "Leaves"]
t.test(beans_profit,leaves_profit,
alternative = "two.sided",
var.equal = FALSE)
##
## Welch Two Sample t-test
##
## data: beans_profit and leaves_profit
## t = 2.1036, df = 4243.6, p-value = 0.03547
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 0.4451093 12.6451364
## sample estimates:
## mean of x mean of y
## 64.20385 57.65873
Karena \[ p\text{-value} \text{= 0.03547 < 0.05}, \] Maka H₀ ditolak, sehingga Tidak terdapat perbedaan rata-rata profit antara produk Beans dan Leaves. (μ₁ = μ₂)