Pendahuluan

Dalam era persaingan bisnis, kemampuan untuk mendapatkan dan menganalisis data menjadi aspek yang penting dalam mendukung pengambilan keputusan yang tepat, peyusunan strategi, tetapi juga memanfaatkan data sebagai dasar analisis yang objektif dan terukur. Salah satu bentuk pemanfaatan data dalam dunia bisnis adalah melalui analisis penjualan, yang bertujuan untuk memahami pola pembelian konsumen, kinerja produk, dan peluang pasar yang dapat dimaksimalkan.

Melalui penerapan analisis statistik dan visualisasi data, laporan ini membahas performa penjualan berdasarkan jenis produk (Product Type) yang tersedia dalam dataset Coffee Chain. Selain itu, laporan ini juga menyoroti pengaruh faktor eksternal seperti terhadap penjualan produk tertentu, khususnya kopi. Analisis ini bertujuan untuk memberikan gambaran yang menyeluruh mengenai bagaimana data penjualan dapat digunakan sebagai alat bantu dalam merumuskan strategi bisnis yang lebih akurat dan adaptif terhadap kebutuhan pasar.

Preview Data

Dataset Coffee Chain berisi sebanyak 4.248 entri, yang mencakup data penjualan, anggaran, dan informasi produk dari jaringan penjualan kopi selama periode Januari 2012 hingga Desember 2013. Dataset ini terdiri dari 20 variabel, yang dapat dikelompokkan ke dalam beberapa kategori utama.

## Preview Data Coffe Chain
datatable(data, options = list(pageLength = 10))

Bagian ini memberikan gambaran awal terhadap struktur data yang akan dianalisis. Pemahaman terhadap atribut-atribut tersebut sangat penting untuk mengarahkan proses analisis eksploratif, uji statistik, serta visualisasi data yang relevan dengan tujuan analisis.

Uji Normalitas

Sebelum melakukan uji statistik parametrik seperti uji ANOVA atau uji-t, penting untuk memeriksa apakah data yang akan dianalisis berdistribusi normal. Salah satu metode yang umum digunakan untuk menguji normalitas adalah Uji Shapiro-Wilk, yang dirancang untuk mendeteksi deviasi dari distribusi normal.

Pada tahap ini, Uji Shapiro-Wilk diterapkan terhadap variabel Sales untuk masing-masing kategori produk, seperti Coffee, Espresso, Herbal Tea, dan Tea. Hasil uji ini akan membantu menentukan apakah pendekatan statistik parametrik dapat digunakan dalam analisis selanjutnya, ataukah perlu mempertimbangkan metode non-parametrik.

Uji Normalitas dengan Shapiro-Wilk

  1. Hipotesis

    Untuk setiap kelompok data (misalnya: kopi, espresso, teh herbal, teh), dilakukan uji normalitas dengan hipotesis sebagai berikut:

    \(H_0: \text{Data berdistribusi normal}\)

    \(H_1: \text{Data tidak berdistribusi normal}\)

  2. Taraf Signifikansi

    \(\alpha = 5\% = 0{,}05\)

  3. Daerah Kritis

    \(H_0 \text{ ditolak jika } \textit{P-Value} < 0{,}05\)

  4. Statistik Uji

    Uji Shapiro-Wilk dilakukan pada variabel Marketing untuk masing-masing kategori produk untuk menguji apakah data berdistribusi normal. Nilai statistik W dan P-Value digunakan untuk pengambilan keputusan.

## Uji Shapiro-Wilk
shapiro_coffee <- shapiro.test(coffee_data$Marketing)
shapiro_espresso <- shapiro.test(espresso_data$Marketing)
shapiro_herbal_tea <- shapiro.test(herbal_tea_data$Marketing)
shapiro_tea <- shapiro.test(tea_data$Marketing)

## Menampilkan hasil
print("Shapiro-Wilk Test untuk Kopi:")
## [1] "Shapiro-Wilk Test untuk Kopi:"
print(shapiro_coffee)
## 
##  Shapiro-Wilk normality test
## 
## data:  coffee_data$Marketing
## W = 0.79718, p-value < 2.2e-16
print("Shapiro-Wilk Test untuk Espresso:")
## [1] "Shapiro-Wilk Test untuk Espresso:"
print(shapiro_espresso)
## 
##  Shapiro-Wilk normality test
## 
## data:  espresso_data$Marketing
## W = 0.83984, p-value < 2.2e-16
print("Shapiro-Wilk Test untuk Teh Herbal:")
## [1] "Shapiro-Wilk Test untuk Teh Herbal:"
print(shapiro_herbal_tea)
## 
##  Shapiro-Wilk normality test
## 
## data:  herbal_tea_data$Marketing
## W = 0.80417, p-value < 2.2e-16
print("Shapiro-Wilk Test untuk Teh:")
## [1] "Shapiro-Wilk Test untuk Teh:"
print(shapiro_tea)
## 
##  Shapiro-Wilk normality test
## 
## data:  tea_data$Marketing
## W = 0.80126, p-value < 2.2e-16
  1. Kesimpulan dan Interpretasi Hasil Uji Shapiro-Wilk

    Uji Shapiro-Wilk dilakukan untuk menguji apakah distribusi Marketing dari masing-masing kategori produk (Kopi, Espresso, Teh Herbal, dan Teh) mengikuti distribusi normal.

    Berikut hasil pengujian:

  • Kopi: W = 0.73718, p-value < 2.2e-16
  • Espresso: W = 0.83984, p-value < 2.2e-16
  • Teh Herbal: W = 0.80417, p-value < 2.2e-16
  • Teh: W = 0.80126, p-value < 2.2e-16

Karena semua nilai p-value < 0.05, maka kita menolak Hâ‚€ untuk setiap kategori produk. Artinya Data penjuala (Marketing) dari produk Kopi, Espresso, Teh Herbal, dan Teh tidak berdistribusi normal.

Dengan demikian, asumsi normalitas tidak terpenuhi. Oleh karena itu, jika ingin membandingkan rata-rata antar kelompok, sebaiknya digunakan uji non-parametrik seperti Kruskal-Wallis Test sebagai alternatif dari ANOVA.

Visualisasi Distribusi Penjualan

Untuk melengkapi analisis normalitas yang sebelumnya telah dilakukan menggunakan Uji Shapiro-Wilk, dilakukan juga visualisasi distribusi data menggunakan histogram dan Q-Q plot. Visualisasi ini bertujuan untuk memberikan gambaran visual mengenai bentuk distribusi penjualan (Marketing) dari masing-masing kategori produk, apakah data menyebar secara simetris dan mendekati distribusi normal atau tidak.

Histogram

ggplot(combined_data_Marketing, aes(x = Sales, fill = Product)) +
  geom_histogram(bins = 30, alpha = 0.6) +
  facet_wrap(~Product, scales = "free") +
  scale_fill_manual(values = c(
    "Coffee" = "blue",
    "Espresso" = "black",
    "Tea" = "red",
    "Herbal Tea" = "cyan"
  )) +
  labs(title = "Histogram Distribusi Marketing Produk",
       x = "Marketing", y = "Frekuensi") +
  theme_minimal()

Interpretasi:

Dari histogram masing-masing produk, terlihat bahwa distribusi penjualan cenderung tidak simetris dan memiliki kemencengan (skewness). Produk Coffee dan Espresso menunjukkan distribusi yang miring ke kanan (right-skewed).Produk Tea dan Herbal Tea juga menunjukkan penyebaran yang tidak normal, dengan puncak distribusi di sisi kiri dan rentang penjualan yang cukup panjang di sisi kanan.

Q-Q Plot

ggplot(combined_data_Marketing, aes(sample = Sales, color = Product)) +
  stat_qq() +
  stat_qq_line(color = "red") +
  facet_wrap(~Product, scales = "free") +
  scale_color_manual(values = c(
    "Coffee" = "blue",
    "Espresso" = "black",
    "Tea" = "red",
    "Herbal Tea" = "cyan"
  )) +
  labs(title = "Q-Q Plot untuk Memeriksa Normalitas Marketing") +
  theme_minimal()

Interpretasi:

Q-Q plot menunjukkan seberapa dekat distribusi data terhadap distribusi normal. Dari plot di atas seluruh jenis produk menunjukkan pola titik-titik yang menyimpang dari garis merah (garis normalitas).Hal ini memperkuat hasil uji Shapiro-Wilk sebelumnya, yaitu bahwa data penjualan dari keempat jenis produk tidak mengikuti distribusi normal.Dengan demikian, baik uji statistik maupun visualisasi menunjukkan hasil yang konsisten mengenai ketidakterpenuhan asumsi normalitas pada data Sales masing-masing produk.

Analisis Rata-rata Marketing (Product_Type)

## Rata-rata Marketing per Produk
mean_Marketing_coffee <- mean(coffee_data$Marketing, na.rm = TRUE)
mean_Marketing_espresso <- mean(espresso_data$Marketing, na.rm = TRUE)
mean_Marketing_herbal_tea <- mean(herbal_tea_data$Marketing, na.rm = TRUE)
mean_Marketing_tea <- mean(tea_data$Marketing, na.rm = TRUE)
cat("Rata-rata Marketing Kopi:", round(mean_Marketing_coffee, 2), "\n")
## Rata-rata Marketing Kopi: 31.6
cat("Rata-rata Marketing Espresso:", round(mean_Marketing_espresso, 2), "\n")
## Rata-rata Marketing Espresso: 32.5
cat("Rata-rata Marketing Teh Herbal:", round(mean_Marketing_herbal_tea, 2), "\n")
## Rata-rata Marketing Teh Herbal: 32.34
cat("Rata-rata Marketing Teh:", round(mean_Marketing_tea, 2), "\n")
## Rata-rata Marketing Teh: 27.85

Interpretasi:

Dari keempat jenis produk tersebut, produk Espresso memiliki rata-rata Marketing tertinggi sebesar 32.5, diikuti oleh Teh Herbal sebesar 32.4, lalu Coffee sebesar 31.6, dan terakhir Teh dengan rata-rata penjualan terendah sebesar 27.85. Hal ini menunjukkan bahwa secara umum, produk Espresso paling sukses dalam performa pemasaran dibandingkan produk lainnya.