Peta New York

Pendahuluan

Dalam kegiatan bisnis, mengetahui produk mana yang lebih menguntungkan merupakan hal penting untuk pengambilan keputusan strategis. Salah satu cara untuk menilai hal ini adalah dengan membandingkan profit dari berbagai tipe produk. Pada analisis ini, akan dibandingkan profit antara dua tipe produk yang dijual, yaitu regular dan decaf di New York menggunakan uji Mann-Whitney. Tujuannya adalah untuk mengetahui apakah terdapat perbedaan profit yang signifikan antara kedua tipe produk tersebut. Hasil dari analisis ini diharapkan dapat memberikan wawasan yang berguna bagi pihak manajemen dalam menentukan strategi produk dan pemasaran yang lebih efektif.

Metode Pengujian Data

Uji Mann-Whitney

Uji Mann-Whitney adalah metode statistik nonparametrik yang digunakan untuk membandingkan dua kelompok independen. Uji ini digunakan ketika data tidak memenuhi asumsi normalitas. Uji Mann-Whitney membandingkan peringkat (ranking) dari nilai-nilai dalam dua kelompok, bukan nilai aslinya, sehingga lebih tahan terhadap data ekstrem atau distribusi tidak normal.

  1. Hipotesis
    \(H_0 :\) Tidak terdapat perbedaan signifikan antara kedua kelompok data
    \(H_1 :\) Terdapat perbedaan signifikan antara kedua kelompok data
  2. Tingkat Signifikansi (\(\alpha\))
  3. Daerah Kritis : \(H_0\) ditolak jika \(p-value < \alpha\)
  4. Statistik Uji
    Menggunakan wilcox.test() untuk menguji perbedaan antara kedua kelompok data.
  5. Kesimpulan
    Jika \(p-value < \alpha\), maka \(H_0\) ditolak artinya terdapat perbedaan signifikan antara kedua kelompok data. Sebaliknya apabila \(p-value \ge \alpha\), maka \(H_0\) tidak ditolak artinya tidak terdapat perbedaan signifikan antara kedua kelompok data.

Uji Normalitas

Uji asumsi normalitas berfungsi untuk menentukan apakah data mengikuti distribusi normal.

  1. Hipotesis
    \(H_0 :\) Data berdistribusi normal
    \(H_1 :\) Data tidak berdistribusi normal
  2. Tingkat Siginifikansi (\(\alpha\))
  3. Daerah Kritis : \(H_0\) ditolak jika \(p-value < \alpha\)
  4. Statistik Uji
    Menggunakan shaphiro.test() untuk menguji normalitas pada masing-masing variabel
  5. Kesimpulan
    Jika \(p-value < \alpha\), maka \(H_0\) ditolak sehingga data tidak berdistribusi normal. Sebaliknya apabila \(p-value \ge \alpha\), maka \(H_0\) tidak ditolak sehingga data berdistribusi normal.

Analisis Kasus

Untuk mengetahui apakah terdapat perbedaan signifikan dalam profit antara produk bertipe regular dan decaf di New York, dilakukan analisis statistik menggunakan uji Mann-Whitney. Uji ini dipilih karena tidak mengasumsikan distribusi normal dari data dan cocok digunakan untuk membandingkan dua kelompok independen.

Library

Berikut ini adalah beberapa package yang dipakai dalam pengujian ini :
library(readxl)  
library(car)  
library(dplyr)  
library(DT)
library(kableExtra)
library(ggpubr)

Data

Data diperoleh dari Coffee Chain Datasets
data <- read_excel("D:\\Tamami\\Semester 4\\Sistem Informasi Manajemen\\CM1 - Coffee Chain Datasets.xlsx")

Berikut ini merupakan data yang digunakan dalam pengujian ini :

data_newyork <- data %>%
  filter(State == "New York") %>%
  select(Type, Profit)
datatable(data_newyork, options = list(pageLength = 10, scrollX = TRUE))

Uji Normalitas

Sebelum uji Mann-Whitney, dilakukan uji normalitas terlebih dahulu untuk memastikan bahwa data tidak berditribusi normal.

ggqqplot(data_newyork$Profit)

Berdasarkan persebaran titik yang diperoleh dari hasil probability plot di atas, terlihat bahwa terdapat data yang jauh dari garis linear. Hal ini adalah satu ciri data yang tidak berditribusi normal.
Asumsi ini dapat dibuktikan lebih lanjut melalui perhitungan menggunakan shapiro test.

shapiro.test(data_newyork$Profit)
## 
##  Shapiro-Wilk normality test
## 
## data:  data_newyork$Profit
## W = 0.94667, p-value = 1.433e-06

karena \(p-value < 0.05\) maka \(H_0\) ditolak sehingga data tidak berdistribusi normal.

Uji Mann-Whitney

Setelah terbukti bahwa data tidak berdistribusi normal, maka dapat dilakukan uji lanjut menggunakan uji Mann-Whitney.
Median profit untuk masing-masing tipe produk di New York :

median_regular <- median(data_newyork$Profit[data_newyork$Type == "Regular"])
median_decaf <- median(data_newyork$Profit[data_newyork$Type == "Decaf"])
median_table <- data.frame(
  Type = c("Regular", "Decaf"),
  Median = c(median_regular, median_decaf)
)

median_table %>%
  kable() %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE, position = "center")
Type Median
Regular 137.5
Decaf -6.5

Dapat dilihat bahwa median kedua tipe produk memiliki perbedaan yang signifikan. Hal ini dapat dibuktikan lebih lanjut melalui perhitungan menggunakan wilcoxon rank sum test.

wilcox.test(Profit ~ `Type`, data = data_newyork)
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  Profit by Type
## W = 2856, p-value = 0.07216
## alternative hypothesis: true location shift is not equal to 0

karena \(p-value > 0.05\) maka \(H_0\) tidak ditolak, artinya tidak terdapat perbedaan signifikan antara produk dengan tipe regular dan decaf.

Terdapat perbedaan pada hasil dari membandingkan kedua median dengan wilcoxon rank sum test. Dalam hal ini, variabilitas yang tinggi dan banyaknya outlier menyebabkan hasil uji tidak cukup kuat untuk menolak hipotesis nol. Untuk lebih jelasnya bisa kita lihat pada boxplot.

ggplot(data_newyork, aes(x = Type, y = Profit, fill = Type)) +
  geom_boxplot() +
  labs(title = "Perbandingan Profit: Regular vs Decaf di New York") +
  scale_fill_manual(values = c("Decaf" = "#4682B4", "Regular" = "#B0C4DE")) +
  theme_minimal()

Dapat dilihat bahwa produk dengan tipe regular menunjukkan banyak nilai pencilan (outlier), yang terlihat dari titik-titik data yang berada jauh di bawah dan di atas kotak boxplot. Hal ini mengindikasikan bahwa distribusi profit untuk produk regular lebih bervariasi dan tidak simetris, yang bisa jadi disebabkan oleh faktor-faktor seperti strategi harga, biaya produksi, atau volume penjualan yang tidak konsisten. Oleh karena itu, untuk keperluan analisis lanjutan atau pemodelan statistik, dilakukan pembersihkan data tipe regular dari pencilan agar tidak mempengaruhi hasil analisis secara signifikan.

Analisis Kasus Lanjutan

Data Tanpa Pencilan

Berikut merupakan data yang sudah dibersihkan dari pencilan :

data_no_outliers <- data_newyork[data_newyork$Profit > -300 & data_newyork$Profit < 700,]
datatable(data_no_outliers, options = list(pageLength = 10, scrollX = TRUE))

Uji Normalitas

Sebelum uji Mann-Whitney, dilakukan uji normalitas terlebih dahulu untuk memastikan bahwa data tidak berditribusi normal.

ggqqplot(data_no_outliers$Profit)

Berdasarkan persebaran titik yang diperoleh dari hasil probability plot di atas, terlihat bahwa terdapat data yang jauh dari garis linear. Hal ini adalah satu ciri data yang tidak berditribusi normal.
Asumsi ini dapat dibuktikan lebih lanjut melalui perhitungan menggunakan shapiro test.

shapiro.test(data_no_outliers$Profit)
## 
##  Shapiro-Wilk normality test
## 
## data:  data_no_outliers$Profit
## W = 0.94705, p-value = 3.084e-06

karena \(p-value < 0.05\) maka \(H_0\) ditolak sehingga data tidak berdistribusi normal.

Uji Mann-Whitney

Setelah terbukti bahwa data tidak berdistribusi normal, maka dapat dilakukan uji lanjut menggunakan uji Mann-Whitney.
Median profit untuk masing-masing tipe produk di New York :

median_regular2 <- median(data_no_outliers$Profit[data_no_outliers$Type == "Regular"])
median_decaf2 <- median(data_no_outliers$Profit[data_no_outliers$Type == "Decaf"])
median_table2 <- data.frame(
  Type = c("Regular", "Decaf"),
  Median = c(median_regular2, median_decaf2)
)

median_table2 %>%
  kable() %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE, position = "center")
Type Median
Regular 146
Decaf 111

Dapat dilihat bahwa median kedua tipe produk memiliki perbedaan yang signifikan. Hal ini dapat dibuktikan lebih lanjut melalui perhitungan menggunakan wilcoxon rank sum test.

wilcox.test(Profit ~ `Type`, data = data_no_outliers)
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  Profit by Type
## W = 2443.5, p-value = 0.04991
## alternative hypothesis: true location shift is not equal to 0

karena \(p-value < 0.05\) maka \(H_0\) ditolak, artinya terdapat perbedaan signifikan antara produk dengan tipe regular dan decaf.

Terlihat bahwa Hasil perbandingan kedua median dan wilcoxon rank sum test sudah sama. Untuk lebih jelasnya bisa kita lihat pada boxplot.

ggplot(data_no_outliers, aes(x = Type, y = Profit, fill = Type)) +
  geom_boxplot() +
  labs(title = "Perbandingan Profit: Regular vs Decaf di New York") +
  scale_fill_manual(values = c("Decaf" = "#4682B4", "Regular" = "#B0C4DE")) +
  theme_minimal()

Dengan demikian, hasil dari uji Wilcoxon mendukung temuan dari analisis median, di mana keduanya menunjukkan adanya perbedaan nyata antara kedua kelompok. Boxplot yang ditampilkan memperkuat interpretasi ini dengan menunjukkan perbedaan letak dan sebaran antar tipe produk, di mana produk Regular cenderung memiliki nilai profit yang lebih tinggi dan lebih tersebar.

Kesimpulan

Berdasarkan pengujian yang telah dilakukan, diperoleh bahwa terdapat perbedaan profit yang signifikan antara produk dengan tipe regular dan decaf di New York. Produk dengan tipe regular secara konsisten menunjukkan profit yang lebih tinggi dan stabil dibandingkan decaf.

Perbedaan signifikan ini menunjukkan bahwa produk dengan tipe yang berbeda, seperti regular dan decaf, memiliki karakteristik profit yang tidak sama. Temuan ini memberikan wawasan penting bagi perusahaan untuk memahami faktor-faktor yang memengaruhi profitabilitas masing-masing tipe produk. Dengan demikian, strategi penjualan dan pemasaran dapat dirancang lebih efektif guna meningkatkan keuntungan dan efisiensi operasional, khususnya di wilayah seperti New York.

Adapun hal-hal yang perlu dilakukan perusahaan untuk meningkatkan keuntungan dan efisiensi operasional berdasarkan pengujian yang telah dilakukan yaitu dengan memfokuskan perhatian pada produk bertipe regular dalam hal stok, promosi, dan distribusi guna memaksimalkan potensi keuntungan. Sebaliknya, produk bertipe decaf memerlukan evaluasi lebih lanjut untuk memahami penyebab kurangnya profitabilitas decaf. Segmentasi pelanggan dapat diterapkan untuk menemukan ceruk pasar yang lebih potensial, seperti konsumen yang memiliki sensitivitas terhadap kafein. Selain itu, perusahaan disarankan untuk melakukan analisis profit secara berkala guna memantau perubahan tren pasar yang mungkin terjadi akibat strategi baru, perubahan musiman, atau faktor eksternal lainnya, sehingga keputusan bisnis dapat terus disesuaikan secara tepat.