Analisis Variabel Product Type dan Profit pada Dataset Coffee Chain

Nama: Faizah Leyla Bunga Mecca

NIM: M0725036

Kelas: D


1. Deskripsi Insight

Jenis produk terbukti menjadi faktor strategis yang memengaruhi profit, sehingga pengambilan keputusan bisnis perlu difokuskan pada optimalisasi product type dengan kinerja profit terbaik.

Analisis ini bertujuan untuk mengetahui apakah terdapat pengaruh antara jenis product type terhadap profit yang diperoleh. Variabel product type digunakan sebagai variabel independen yang merepresentasikan kategori produk, sedangkan profit sebagai variabel dependen yang menunjukkan keuntungan.

Dengan menggunakan pendekatan statistik, dilakukan perbandingan rata-rata profit pada masing-masing kategori product type. Selain itu, visualisasi berupa boxplot digunakan untuk melihat distribusi dan sebaran data profit pada setiap kategori. Hasil analisis menunjukkan bahwa terdapat perbedaan nilai profit antar product type, yang mengindikasikan bahwa jenis produk memiliki peran dalam menentukan besar kecilnya keuntungan. Oleh karena itu, pemilihan kategori produk yang tepat dapat menjadi faktor penting dalam meningkatkan profit perusahaan. —

2. Import Data

library(readxl)
## Warning: package 'readxl' was built under R version 4.5.2
coffee <- read_excel("C:/Users/USER/Downloads/1. Tugas SIM 2025B - Coffee Chain Datasets/1. Tugas SIM 2025B - Coffee Chain Datasets.xlsx")

head(coffee)
## # A tibble: 6 × 20
##   `Area Code` Date                Market  `Market Size` Product   `Product Line`
##         <dbl> <dttm>              <chr>   <chr>         <chr>     <chr>         
## 1         719 2012-01-01 00:00:00 Central Major Market  Amaretto  Beans         
## 2         970 2012-01-01 00:00:00 Central Major Market  Colombian Beans         
## 3         970 2012-01-01 00:00:00 Central Major Market  Decaf Ir… Beans         
## 4         303 2012-01-01 00:00:00 Central Major Market  Green Tea Leaves        
## 5         303 2012-01-01 00:00:00 Central Major Market  Caffe Mo… Beans         
## 6         720 2012-01-01 00:00:00 Central Major Market  Decaf Es… Beans         
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## #   `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## #   `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## #   Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
tail(coffee)
## # A tibble: 6 × 20
##   `Area Code` Date                Market `Market Size` Product    `Product Line`
##         <dbl> <dttm>              <chr>  <chr>         <chr>      <chr>         
## 1         425 2013-12-01 00:00:00 West   Small Market  Lemon      Leaves        
## 2         206 2013-12-01 00:00:00 West   Small Market  Caffe Lat… Beans         
## 3         509 2013-12-01 00:00:00 West   Small Market  Caffe Moc… Beans         
## 4         360 2013-12-01 00:00:00 West   Small Market  Decaf Esp… Beans         
## 5         360 2013-12-01 00:00:00 West   Small Market  Colombian  Beans         
## 6         206 2013-12-01 00:00:00 West   Small Market  Decaf Iri… Beans         
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## #   `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## #   `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## #   Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
str(coffee)
## tibble [4,248 × 20] (S3: tbl_df/tbl/data.frame)
##  $ Area Code     : num [1:4248] 719 970 970 303 303 720 970 719 970 719 ...
##  $ Date          : POSIXct[1:4248], format: "2012-01-01" "2012-01-01" ...
##  $ Market        : chr [1:4248] "Central" "Central" "Central" "Central" ...
##  $ Market Size   : chr [1:4248] "Major Market" "Major Market" "Major Market" "Major Market" ...
##  $ Product       : chr [1:4248] "Amaretto" "Colombian" "Decaf Irish Cream" "Green Tea" ...
##  $ Product Line  : chr [1:4248] "Beans" "Beans" "Beans" "Leaves" ...
##  $ Product Type  : chr [1:4248] "Coffee" "Coffee" "Coffee" "Tea" ...
##  $ State         : chr [1:4248] "Colorado" "Colorado" "Colorado" "Colorado" ...
##  $ Type          : chr [1:4248] "Regular" "Regular" "Decaf" "Regular" ...
##  $ Budget COGS   : num [1:4248] 90 80 100 30 60 80 140 50 50 40 ...
##  $ Budget Margin : num [1:4248] 130 110 140 50 90 130 160 80 70 70 ...
##  $ Budget Profit : num [1:4248] 100 80 110 30 70 80 110 20 40 20 ...
##  $ Budget Sales  : num [1:4248] 220 190 240 80 150 210 300 130 120 110 ...
##  $ COGS          : num [1:4248] 89 83 95 44 54 72 170 63 60 58 ...
##  $ Inventory     : num [1:4248] 777 623 821 623 456 ...
##  $ Margin        : num [1:4248] 130 107 139 56 80 108 171 87 80 72 ...
##  $ Marketing     : num [1:4248] 24 27 26 14 15 23 47 57 19 22 ...
##  $ Profit        : num [1:4248] 94 68 101 30 54 53 99 0 33 17 ...
##  $ Sales         : num [1:4248] 219 190 234 100 134 180 341 150 140 130 ...
##  $ Total Expenses: num [1:4248] 36 39 38 26 26 55 72 87 47 55 ...
dim(coffee)
## [1] 4248   20
names(coffee)
##  [1] "Area Code"      "Date"           "Market"         "Market Size"   
##  [5] "Product"        "Product Line"   "Product Type"   "State"         
##  [9] "Type"           "Budget COGS"    "Budget Margin"  "Budget Profit" 
## [13] "Budget Sales"   "COGS"           "Inventory"      "Margin"        
## [17] "Marketing"      "Profit"         "Sales"          "Total Expenses"
summary(coffee)
##    Area Code          Date                        Market         
##  Min.   :203.0   Min.   :2012-01-01 00:00:00   Length:4248       
##  1st Qu.:417.0   1st Qu.:2012-06-23 12:00:00   Class :character  
##  Median :573.0   Median :2012-12-16 12:00:00   Mode  :character  
##  Mean   :582.3   Mean   :2012-12-15 22:00:00                     
##  3rd Qu.:772.0   3rd Qu.:2013-06-08 12:00:00                     
##  Max.   :985.0   Max.   :2013-12-01 00:00:00                     
##  Market Size          Product          Product Line       Product Type      
##  Length:4248        Length:4248        Length:4248        Length:4248       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##     State               Type            Budget COGS     Budget Margin   
##  Length:4248        Length:4248        Min.   :  0.00   Min.   :-210.0  
##  Class :character   Class :character   1st Qu.: 30.00   1st Qu.:  50.0  
##  Mode  :character   Mode  :character   Median : 50.00   Median :  70.0  
##                                        Mean   : 74.83   Mean   : 100.8  
##                                        3rd Qu.: 90.00   3rd Qu.: 130.0  
##                                        Max.   :450.00   Max.   : 690.0  
##  Budget Profit      Budget Sales         COGS          Inventory      
##  Min.   :-320.00   Min.   :   0.0   Min.   :  0.00   Min.   :-3534.0  
##  1st Qu.:  20.00   1st Qu.:  80.0   1st Qu.: 43.00   1st Qu.:  432.0  
##  Median :  40.00   Median : 130.0   Median : 60.00   Median :  619.0  
##  Mean   :  60.91   Mean   : 175.6   Mean   : 84.43   Mean   :  749.4  
##  3rd Qu.:  80.00   3rd Qu.: 210.0   3rd Qu.:100.00   3rd Qu.:  910.5  
##  Max.   : 560.00   Max.   :1140.0   Max.   :364.00   Max.   : 8252.0  
##      Margin          Marketing          Profit           Sales    
##  Min.   :-302.00   Min.   :  0.00   Min.   :-638.0   Min.   : 17  
##  1st Qu.:  52.75   1st Qu.: 13.00   1st Qu.:  17.0   1st Qu.:100  
##  Median :  76.00   Median : 22.00   Median :  40.0   Median :138  
##  Mean   : 104.29   Mean   : 31.19   Mean   :  61.1   Mean   :193  
##  3rd Qu.: 132.00   3rd Qu.: 39.00   3rd Qu.:  92.0   3rd Qu.:230  
##  Max.   : 613.00   Max.   :156.00   Max.   : 778.0   Max.   :912  
##  Total Expenses  
##  Min.   : 10.00  
##  1st Qu.: 33.00  
##  Median : 46.00  
##  Mean   : 54.06  
##  3rd Qu.: 65.00  
##  Max.   :190.00

3. Visualisasi Data & Uji Metode Statistik

A) Jumlah Data per Product Type

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.3
ggplot(coffee, aes(x = `Product Type`,fill = `Product Type`)) +
  geom_bar() +
  labs(
    title = "Jumlah Data per Product Type",
    x = "Product Type",
    y = "Jumlah"
  )+theme_classic()

Interpretasi Bar Chart:

Bar chart tersebut menunjukkan jumlah data pada masing-masing kategori Product Type. Dari grafik terlihat bahwa setiap kategori memiliki jumlah yang berbeda-beda. Kategori dengan jumlah data terbanyak adalah Espresso, sedangkan kategori dengan jumlah paling sedikit adalah Tea

Perbedaan jumlah ini menunjukkan bahwa distribusi data tidak merata antar product type. Hal ini penting untuk diperhatikan karena jumlah data yang lebih banyak pada suatu kategori dapat mempengaruhi hasil analisis, terutama dalam perhitungan rata-rata maupun uji statistik.

Oleh karena itu, dalam analisis selanjutnya, seperti pengujian pengaruh product type terhadap profit, perlu mempertimbangkan distribusi data agar hasil yang diperoleh lebih representatif.

Analisis Metode Statistik

Hipotesis:

  • H0 : Proporsi jumlah data pada setiap product type adalah sama
  • H1 : Proporsi jumlah data pada setiap product type tidak sama

Uji Chi Square

Uji Chi-Square digunakan karena data yang dianalisis berupa frekuensi kategori product type.

freq <- table(coffee$`Product Type`)
freq
## 
##     Coffee   Espresso Herbal Tea        Tea 
##       1056       1176       1056        960
chisq.test(freq)
## 
##  Chi-squared test for given probabilities
## 
## data:  freq
## X-squared = 22.102, df = 3, p-value = 6.213e-05

Interpretasi Hasil Uji Chi-Square:

Berdasarkan hasil uji Chi-Square, diperoleh p-value < 0.05 sehingga H0 ditolak. Hal ini menunjukkan bahwa terdapat perbedaan jumlah data pada masing-masing product type. Oleh karena itu, dapat dikatakan distribusi data tidak merata antar product type.

B) Hubungan Product Type dan Profit (Boxplot)

ggplot(coffee, aes(x = `Product Type`, y = Profit,fill = `Product Type`)) +
  geom_boxplot() +
  labs(
    title = "Hubungan Product Type dan Profit",
    x = "Product Type",
    y = "Profit"
  ) +
  theme_minimal() +
  theme(legend.position = "none")

Interpretasi Boxplot:

Grafik boxplot menunjukkan distribusi profit pada masing-masing kategori product type. Dari visualisasi tersebut terlihat bahwa setiap product type memiliki nilai median profit yang berbeda-beda, yang menunjukkan adanya perbedaan tingkat keuntungan antar kategori produk.

Selain itu, terlihat juga perbedaan dalam sebaran data (variabilitas) pada masing-masing kategori. Beberapa product type memiliki rentang profit yang lebih lebar, yang menandakan variasi keuntungan yang lebih tinggi, sementara kategori lainnya lebih stabil.

Adanya titik-titik di luar box (outlier) menunjukkan bahwa terdapat beberapa nilai profit yang sangat tinggi atau sangat rendah dibandingkan data lainnya.

Secara keseluruhan, perbedaan distribusi ini mengindikasikan bahwa product type berpotensi mempengaruhi profit, sehingga analisis lebih lanjut menggunakan uji statistik seperti ANOVA diperlukan untuk memastikan apakah perbedaan tersebut signifikan.


C) Hubungan Product Type dan Profit (Bar Chart)

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.5.2
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)

# Hitung rata-rata profit
rata_profit <- coffee %>%
  group_by(`Product Type`) %>%
  summarise(mean_profit = mean(Profit, na.rm = TRUE))

# Buat bar chart
ggplot(rata_profit, aes(x = `Product Type`, y = mean_profit, fill = `Product Type`)) +
  geom_bar(stat = "identity") +
  scale_fill_brewer(palette = "Set2") +
  labs(
    title = "Rata-rata Profit per Product Type",
    x = "Product Type",
    y = "Rata-rata Profit"
  ) +
  theme_classic() +
  theme(legend.position = "none")

Interpretasi Bar Chart:

Bar chart tersebut menunjukkan rata-rata profit yang dihasilkan oleh masing-masing product type. Dari grafik terlihat bahwa terdapat perbedaan nilai rata-rata profit antar kategori produk, yang mengindikasikan bahwa setiap jenis produk memiliki tingkat keuntungan yang berbeda.

Product type dengan rata-rata profit tertinggi adalah Coffee, yang menunjukkan bahwa kategori tersebut memberikan kontribusi keuntungan paling besar secara rata-rata. Sebaliknya, product type dengan rata-rata profit terendah adalah Tea, yang menunjukkan bahwa kategori tersebut memiliki performa keuntungan yang relatif lebih rendah.

Perbedaan ini menunjukkan bahwa pemilihan jenis produk berpengaruh terhadap profit yang dihasilkan. Oleh karena itu, perusahaan dapat mempertimbangkan untuk lebih fokus pada product type dengan rata-rata profit yang lebih tinggi guna meningkatkan keuntungan secara keseluruhan.

Analisis Metode Statistik

Hipotesis:

  • H0 : Tidak ada perbedaan rata-rata profit antar product type
  • H1 : Terdapat perbedaan rata-rata profit antar product type

Uji ANOVA

Uji yang digunakan adalah ANOVA karena karena visualisasi menggunakan mean profit, variabel independen berbentuk kategori (product type) dan variabel dependen berbentuk numerik (profit).

anova_model <- aov(Profit ~ `Product Type`, data = coffee)
summary(anova_model)
##                  Df   Sum Sq Mean Sq F value  Pr(>F)   
## `Product Type`    3   141680   47227   4.577 0.00333 **
## Residuals      4244 43791957   10319                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretasi Hasil Uji ANOVA:

Berdasarkan hasil uji ANOVA, diperoleh nilai p-value < 0.05 sehingga H0 ditolak. Hal ini menunjukkan bahwa terdapat perbedaan rata-rata profit antar product type. Dengan demikian, dapat disimpulkan bahwa product type berpengaruh terhadap profit.

4. Kesimpulan

Berdasarkan analisis data Coffee Chain yang telah dilakukan, proses dimulai dari tahap import data hingga eksplorasi variabel product type dan profit. Visualisasi menggunakan bar chart menunjukkan bahwa distribusi data pada masing-masing product type tidak merata.

Selanjutnya, boxplot dan bar chart rata-rata profit menunjukkan adanya perbedaan distribusi dan nilai rata-rata profit antar kategori produk. Hal ini mengindikasikan bahwa setiap product type memiliki karakteristik keuntungan yang berbeda.

Untuk memastikan apakah perbedaan tersebut signifikan, dilakukan uji ANOVA. Berdasarkan hasil uji, diperoleh nilai p-value sebesar 0.00333 sehingga menolak hipotesis nol. Hal ini menunjukkan bahwa terdapat perbedaan rata-rata profit yang signifikan antar product type.

Dengan demikian, dapat disimpulkan bahwa product type berpengaruh signifikan terhadap profit, sehingga dapat menjadi pertimbangan dalam menentukan strategi peningkatan keuntungan perusahaan.