Library:
install.packages("knitr")
install.packages("rmarkdown")
install.packages("prettydoc")
install.packages("equatiomatic")
install.packages("kableExtra")

1 PENDAHULUAN

1.1 Latar Belakang

Parfum telah menjadi bagian integral dari budaya dan kehidupan sehari-hari manusia selama berabad-abad. Sebagai salah satu elemen penting dalam seni rupa dan personalitas, parfum tidak hanya berfungsi sebagai penanda identitas, tetapi juga sebagai alat untuk meningkatkan rasa percaya diri dan daya tarik. Dalam dunia parfum, terdapat berbagai jenis, di antaranya Eau de Parfum (EdP), Eau de Toilette (EdT), dan Eau de Cologne (EdC). Eau de Parfum, dengan konsentrasi minyak wangi yang tinggi, menawarkan aroma yang kaya dan kompleks yang tahan lama di kulit, menjadikannya pilihan utama untuk acara-acara formal atau malam hari. Sementara itu, Eau de Toilette, dengan konsentrasi minyak wangi yang lebih rendah, memberikan aroma yang lebih ringan dan segar, cocok untuk pemakaian sehari-hari atau di cuaca hangat. Eau de Cologne memiliki konsentrasi minyak wangi yang paling rendah, sekitar 2% hingga 4%, menghasilkan aroma yang sangat ringan dan segar, serta lebih cocok untuk digunakan setelah mandi atau di cuaca panas. Perbedaan dalam konsentrasi minyak wangi dan karakteristik aroma ini memungkinkan pengguna untuk memilih parfum sesuai dengan preferensi pribadi dan situasi penggunaan yang dihadapi.

2 TINJAUAN PUSTAKA

2.1 Statistika Deskriptif

Statistika deskriptif membahas cara-cara pengumpulan, peringkasan, dan penyajian data sehingga diperoleh informasi yang lebih mudah dipahami. Informasi yang dapat diperoleh dengan statistika deskriptif antara lain pemusatan data (mean, median, modus), penyebaran data (range, simpangan rata-rata, varians, dan simpangan baku), kecenderungan suatu gugus data, serta ukuran letak (kuartil, desil, dan persentil) (Muchson, 2017).

2.2 One-Way Analysis of Variance (ANOVA)

Analysis of Variance (ANOVA) atau dikenal juga sebagai analisis ragam adalah teknik statistika yang digunakan untuk mendeteksi adanya perbedaan rata-rata antarkelompok/populasi amatan (King, 2010). ANOVA secara luas digunakan untuk menganalisis data penelitian dari berbagai bidang, baik yang dilakukan melalui eksperimen maupun survei. Analisis ini tergolong dalam analisis parametrik, sehingga membutuhkan pemenuhan asumsi kenormalan data. Selain itu, variabel respon yang diamati harus bersifat kuantitatif dengan skala pengukuran interval dan rasio (Kim, 2017).

2.2.1 Jenis-Jenis ANOVA

Terdapat beberapa jenis ANOVA yang umum digunakan, yaitu:

ANOVA Satu Arah (One-Way ANOVA). ANOVA Satu Arah digunakan ketika ada satu faktor yang mempengaruhi variabel respons.
ANOVA Dua Arah (Two-Way ANOVA). ANOVA Dua Arah digunakan ketika terdapat dua faktor yang mempengaruhi variabel respons.
ANOVA Faktorial. ANOVA Faktorial digunakan ketika terdapat lebih dari dua faktor yang mempengaruhi variabel respons.

2.3 Uji ANOVA Satu Arah

Syarat-syarat yang perlu dilakukan sebelum melakukan one-way ANOVA:

Setiap observasi dalam kelompok harus independen.Berarti data dari satu kelompok tidak boleh mempengaruhi data dari kelompok lain.
Data dalam setiap kelompok harus mengikuti distribusi normal. Asumsi ini dapat diuji menggunakan tes normalitas seperti Shapiro-Wilk atau Kolmogorov-Smirnov.
Variansi data dalam setiap kelompok harus sama atau setidaknya serupa. Hal ini dapat diuji menggunakan Levene test atau Bartlett test.
Data yang digunakan harus pada skala interval atau rasio.

Hipotesis: \[ H_0: \mu_1 = \mu_2 = \mu_3 = \cdots = \mu_k \] \[ H_1: \text{Minimal terdapat satu } \mu_i \neq 0 \]

Tabel ANOVA:

library(kableExtra)
tabel_anova <- data.frame(
  `Sumber_Keragaman` = c("Perlakuan", "Galat", "Total"),
  `Derajat_Bebas` = c("p-1", "n-p", "n-1"),
  `Jumlah_Kuadrat` = c(
    "$$\\sum_{j=1}^{p} (\\bar{y}_{\\cdot j} - \\bar{y}_{\\cdot \\cdot})^2$$",
    "$$JKt - JKp$$",
    "$$\\sum_{i=1}^{n} (\\bar{y}_{ij} - \\bar{y}_{\\cdot \\cdot})^2$$"
  ),
  `Kuadrat_Tengah` = c(
    "$$\\frac{JKp}{(p-1)}$$",
    "$$\\frac{JKg}{(n-p)}$$",
    ""
  ),
  `FHitung` = c(
    "$$\\frac{KTp}{KTg}$$",
    "",
    ""
  )
)
kable(tabel_anova, escape = FALSE, booktabs = TRUE) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>%
  column_spec(1, bold = TRUE, color = "white", background = "lightblue")

Sumber_Keragaman	Derajat_Bebas	Jumlah_Kuadrat	Kuadrat_Tengah	FHitung
Perlakuan	p-1	\[\sum_{j=1}^{p} (\bar{y}_{\cdot j} - \bar{y}_{\cdot \cdot})^2\]	\[\frac{JKp}{(p-1)}\]	\[\frac{KTp}{KTg}\]
Galat	n-p	\[JKt - JKp\]	\[\frac{JKg}{(n-p)}\]
Total	n-1	\[\sum_{i=1}^{n} (\bar{y}_{ij} - \bar{y}_{\cdot \cdot})^2\]

Keputusan :

Jika \(F_{hitung} > F_{tabel}\), maka tolak \(H_0\).
Jika \(F_{hitung} \leq F_{tabel}\), maka terima \(H_0\).

Atau dapat diputuskan dalam bentuk lain:

Jika \(p\)-value \(\leq \alpha\), maka tolak \(H_0\).
Jika \(p\)-value \(> \alpha\), maka terima \(H_0\).

Keterangan :

\(F_{hitung}\) adalah nilai \(F\) yang diperoleh dari perhitungan ANOVA.
\(F_{tabel}\) adalah nilai kritis \(F\) dari tabel distribusi \(F\) berdasarkan derajat kebebasan perlakuan dan galat.
\(p\)-value adalah probabilitas mendapatkan nilai \(F\) yang sama atau lebih ekstrem jika \(H_0\) benar.
\(\alpha\) adalah tingkat signifikansi yang ditetapkan (Sebagai contoh yaitu 0.05, 0.01, dll).

2.4 Uji Lanjut

2.4.1 Uji Beda Nyata Terkecil (BNT)

Uji lanjut adalah teknik statistik yang digunakan setelah analisis varians (ANOVA) untuk menunjukkan adanya perbedaan yang signifikan antara kelompok (Montgomery, 2013). Salah satu metode yang sering digunakan dalam uji lanjut adalah Uji Beda Nyata Terkecil adalah uji LSD (Least Significant Difference). Uji LSD bertujuan untuk menentukan pasangan kelompok mana yang berbeda secara signifikan dengan membandingkan rata-rata antar kelompok setelah ANOVA menunjukkan adanya perbedaan global yang signifikan.

2.4.2 Uji Beda Nyata Jujur (BNJ)

Uji Tukey’s HSD (Honestly Significant Difference) berguna untuk melakukan perbandingan berpasangan antar rata-rata kelompok untuk menentukan kelompok mana yang berbeda secara signifikan. Metode ini mempertimbangkan tingkat kesalahan tipe I yang terakumulasi akibat melakukan banyak perbandingan, sehingga memberikan hasil yang lebih akurat dibandingkan dengan melakukan uji t secara berulang. Uji Tukey’s HSD menggunakan distribusi studentized range untuk menghitung selisih kritis antar rata-rata kelompok, yang kemudian digunakan untuk menentukan signifikan tidaknya perbedaan tersebut (Hochberg & Tamhane, 1987).

Hipotesis: \[ H_0 : \mu_i = \mu_j \text{ (Tidak terdapat perbedaan signifikan antara rata-rata dua kelompok yang dibandingkan)} \] \[ H_1 : \mu_i \neq \mu_j \text{ (Terdapat perbedaan signifikan antara rata-rata dua kelompok yang dibandingkan)} \]

Kriteria :

Apabila nilai P-Value > α, maka keputusan terima H₀. Disimpulkan bahwa hasil menunjukan tidak berbeda nyata.
Apabila nilai P-Value < α, maka keputusan tolak H₀. Disimpulkan bahwa hasil menunjukan berbeda nyata.

2.5 Asumsi ANOVA

2.5.1 Asumsi Normalitas Galat

Model regresi yang baik ialah model yang memiliki residu dan terdistribusi secara normal. Maka dari itu diperlukan uji normalitas untuk melihat apakah ada nilai residu normal atau tidak. Uji Normalitas dilakukan juga untuk mengetahui apakah variabel prediktor maupun respon berdistribusi normal atau tidak. Uji yang dapat digunakan untuk uji normalitas yaitu uji Jarque-Bera, Saphiro Wilk, Kolmogorov Smirnov ataupun menggunakan Q-Q Plot.

Hipotesis: \[ H_0 : \text{ Pengamatan berdistribusi normal} \] \[ H_1 : \text{ Pengamatan tidak berdistribusi normal} \]

Kriteria:

Apabila nilai P-Value > α, maka keputusan terima H₀. Disimpulkan bahwa data yang digunakan sudah berdistribusi normal.
Apabila nilai P-Value < α, maka keputusan tolak H₀. Disimpulkan bahwa data yang digunakan tidak berdistribusi normal.

2.5.2 Asumsi Homogenitas Ragam

Uji homogenitas adalah pengujian yang dilakukan untuk mengetahui persamaan dari variansi-variansi dua buah distribusi atau lebih (Sudjana, 2005). Uji yang digunakan untuk menguji homogenitas yaitu uji Levene, Fisher atau uji Bartlett, dan Cochran Q Test.

Hipotesis: \[ H_0: \sigma_1^2 = \sigma_2^2 = \cdots = \sigma_k^2 \] \[ H_1: \text{Setidaknya terdapat dua varians yang berbeda} \]

Kriteria:

Apabila P-Value > α, maka keputusan terima H₀. Disimpulkan bahwa data mempunyai ragam galat yang homogen.
Apabila P-Value < α, maka keputusan tolak H₀. Disimpulkan bahwa data mempunyai ragam galat yang tidak homogen.

2.5.3 Asumsi Independensi

Hipotesis: \[ H_0: \text{Data antar perlakuan bersifat independen} \] \[ H_1: \text{Data antar perlakuan tidak bersifat independen} \]

Kriteria:

Apabila P-Value > α, maka keputusan terima H₀. Disimpulkan bahwa data antar perlakuan bersifat independen.
Apabila P-Value < α, maka keputusan tolak H₀. Disimpulkan bahwa data antar perlakuan tidak bersifat independen.

3 Source Code

3.1 Library yang digunakan:

# library(knitr)
# library(dplyr)
# library(tidyr)
# library(ggplot2)
# library(AOV1R)
# library(tseries)
# library(agricole)
# library(car)
# library(kableExtra)`

3.2 Uji Anova

3.2.1 Langkah 1: Input data

perf<-c("A","B","C")
Jenis_Parfum <- rep(perf, times=6)
Jumlah_Parfum_Terjual <- c(116, 43, 38,
                           48, 159, 68,
                           39, 101, 78,
                           33, 147, 84,
                           68, 136, 87,
                           37, 111, 12)
DataP <- data.frame(Jenis_Parfum,Jumlah_Parfum_Terjual)
DataP$Jenis_Parfum <- as.factor(DataP$Jenis_Parfum)
DataP

##    Jenis_Parfum Jumlah_Parfum_Terjual
## 1             A                   116
## 2             B                    43
## 3             C                    38
## 4             A                    48
## 5             B                   159
## 6             C                    68
## 7             A                    39
## 8             B                   101
## 9             C                    78
## 10            A                    33
## 11            B                   147
## 12            C                    84
## 13            A                    68
## 14            B                   136
## 15            C                    87
## 16            A                    37
## 17            B                   111
## 18            C                    12

3.2.2 Langkah 2: Summary Data

summary(DataP)

##  Jenis_Parfum Jumlah_Parfum_Terjual
##  A:6          Min.   : 12.00       
##  B:6          1st Qu.: 40.00       
##  C:6          Median : 73.00       
##               Mean   : 78.06       
##               3rd Qu.:108.50       
##               Max.   :159.00

3.2.3 Langkah 3: Eksplorasi Data

library(ggplot2)
p1 <- ggplot(DataP) + aes(x = Jenis_Parfum, y = Jumlah_Parfum_Terjual, fill = Jenis_Parfum) + geom_boxplot() + scale_fill_hue(direction = 1) + theme_minimal() + theme(legend.position = "none")
p1

3.2.4 Langkah 4: Menghitung ANOVA

Hasil_Anova_Parfum <- aov(Jumlah_Parfum_Terjual ~ Jenis_Parfum, data=DataP)
Hasil_Anova_Parfum

## Call:
##    aov(formula = Jumlah_Parfum_Terjual ~ Jenis_Parfum, data = DataP)
## 
## Terms:
##                 Jenis_Parfum Residuals
## Sum of Squares      13128.44  18244.50
## Deg. of Freedom            2        15
## 
## Residual standard error: 34.87549
## Estimated effects may be unbalanced

3.2.5 Langkah 5: Menampilkan Hasil ANOVA

summary(Hasil_Anova_Parfum)

##              Df Sum Sq Mean Sq F value Pr(>F)  
## Jenis_Parfum  2  13128    6564   5.397 0.0172 *
## Residuals    15  18244    1216                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

3.2.6 Langkah 6: Mendapatkan Residu dari ANOVA

Residu<- residuals(Hasil_Anova_Parfum)
Residu

##          1          2          3          4          5          6          7 
##  59.166667 -73.166667 -23.166667  -8.833333  42.833333   6.833333 -17.833333 
##          8          9         10         11         12         13         14 
## -15.166667  16.833333 -23.833333  30.833333  22.833333  11.166667  19.833333 
##         15         16         17         18 
##  25.833333 -19.833333  -5.166667 -49.166667

3.3 Uji Lanjut

3.3.1 Uji Beda Nyata Terkecil (BNT)

library(agricolae)
BNT<-LSD.test(Hasil_Anova_Parfum,"Jenis_Parfum", alpha=0.05)
BNT

## $statistics
##   MSerror Df     Mean       CV t.value      LSD
##    1216.3 15 78.05556 44.68035 2.13145 42.91754
## 
## $parameters
##         test p.ajusted       name.t ntr alpha
##   Fisher-LSD      none Jenis_Parfum   3  0.05
## 
## $means
##   Jumlah_Parfum_Terjual      std r       se      LCL       UCL Min Max   Q25
## A              56.83333 31.56844 6 14.23786 26.48605  87.18061  33 116  37.5
## B             116.16667 41.92573 6 14.23786 85.81939 146.51395  43 159 103.5
## C              61.16667 29.90931 6 14.23786 30.81939  91.51395  12  87  45.5
##     Q50    Q75
## A  43.5  63.00
## B 123.5 144.25
## C  73.0  82.50
## 
## $comparison
## NULL
## 
## $groups
##   Jumlah_Parfum_Terjual groups
## B             116.16667      a
## C              61.16667      b
## A              56.83333      b
## 
## attr(,"class")
## [1] "group"

BNT$groups

##   Jumlah_Parfum_Terjual groups
## B             116.16667      a
## C              61.16667      b
## A              56.83333      b

BNT$means

##   Jumlah_Parfum_Terjual      std r       se      LCL       UCL Min Max   Q25
## A              56.83333 31.56844 6 14.23786 26.48605  87.18061  33 116  37.5
## B             116.16667 41.92573 6 14.23786 85.81939 146.51395  43 159 103.5
## C              61.16667 29.90931 6 14.23786 30.81939  91.51395  12  87  45.5
##     Q50    Q75
## A  43.5  63.00
## B 123.5 144.25
## C  73.0  82.50

3.3.2 Uji Beda Nyata Jujur (BNJ)

TukeyHSD(Hasil_Anova_Parfum,conf.level=0.95)

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Jumlah_Parfum_Terjual ~ Jenis_Parfum, data = DataP)
## 
## $Jenis_Parfum
##           diff         lwr        upr     p adj
## B-A  59.333333    7.032296 111.634371 0.0255204
## C-A   4.333333  -47.967704  56.634371 0.9748333
## C-B -55.000000 -107.301038  -2.698962 0.0387331

3.4 Memeriksa Asumsi ANOVA

3.4.1 Asumsi Normalitas Galat

library(tseries)

## Registered S3 method overwritten by 'quantmod':
##   method            from
##   as.zoo.data.frame zoo

hist(Residu)

shapiro.test(Residu)

## 
##  Shapiro-Wilk normality test
## 
## data:  Residu
## W = 0.97877, p-value = 0.9364

jarque.bera.test(Residu)

## 
##  Jarque Bera Test
## 
## data:  Residu
## X-squared = 0.35538, df = 2, p-value = 0.8372

3.4.2 Asumsi Homogenitas Ragam

library(car)

## Loading required package: carData

Homogenitas <- leveneTest(Hasil_Anova_Parfum)
Homogenitas

## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.3281 0.7253
##       15

3.4.3 Asumsi Independensi

Independensi <- durbinWatsonTest(Hasil_Anova_Parfum)
Independensi

##  lag Autocorrelation D-W Statistic p-value
##    1      -0.1217247      1.919075   0.942
##  Alternative hypothesis: rho != 0

4 HASIL DAN PEMBAHASAN

4.1 Statistika Deskriptif

Berdasarkan hasil summary data, didapatkan nilai minimal data, Q1, median, mean, Q3, dan nilai maksimum dari data masing-masing sebesar 12, 40, 73, 78.06, 108.5, dan 159.
Berdasarkan data yang digunakan, hasil Box-Plot menunjukan bahwa:Pada jenis parfum A dan C, rata-rata jumlah parfum terjual tidak berada di tengah kotak. Artinya terdapat keragaman yang cukup berarti. Selanjutnya, pada jenis parfum B, rata-rata jumlah parfum terjual berada di tengah kotak. Artinya terdapat keragaman yang kurang berarti.

4.2 One-Way Analysis of Variance (ANOVA)

Pada studi kasus ini, ingin dilakukan pengujian apakah terdapat pengaruh antara jenis parfum (EdT, EdP, EdC) terhadap jumlah parfum yang terjual. Berdasarkan hasil ANOVA, p-value sebesar 0.0172. Karena p-value < α dengan menggunakan taraf nyata 5%, maka dapat diputuskan tolak H₀. Berdasarkan hasil keputusan tolak H₀, dapat disimpulkan bahwa terdapat pengaruh antara jenis parfum (EdT, EdP, EdC) terhadap jumlah parfum yang terjual. Dikarenakan hasil uji ANOVA menghasilkan keputusan tolak H₀, maka diperlukan uji lanjut.

4.3 Uji Lanjut

4.3.1 Uji Beda Nyata Terkecil (BNT)

Berdasarkan output yang dihasilkan, pada bagian groups dapat dilihat dari masing-masing jenis parfum yaitu B dan C memiliki group yang berbeda. Artinya, jenis parfum B dan C memiliki perbedaan jumlah parfum yang terjual atau dapat dikatakan jenis parfum berbeda nyata. Sedangkan, jenis parfum C dan A termasuk ke dalam group yang sama yang artinya jenis parfum C dan A tidak memiliki perbedaan jumlah parfum yang terjual atau dapat dikatakan tidak berbeda nyata.

4.3.2 Uji Beda Nyata Jujur (BNJ)

Keputusan:

Jenis Parfum B & Jenis Parfum A : p-value(0,025) < α(0.05), maka tolak H₀.
Jenis Parfum C & Jenis Parfum A : p-value(0,974) > α(0.05), maka terima H₀.
Jenis Parfum C & Jenis Parfum B : p-value(0,038) < α(0.05), maka tolak H₀.

Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa:

Jenis Parfum B & Jenis Parfum A berbeda nyata.
Jenis Parfum C & Jenis Parfum A tidak berbeda nyata.
Jenis Parfum C & Jenis Parfum B berbeda nyata.

4.4 Asumsi Normalitas Galat

Berdasarkan hasil uji Jarque Bera, diperoleh p-value sebesar 0.8372. Karena p-value(0.8372) > α(0.05), maka diputuskan terima H₀ yang artinya pengamatan menyebar normal.
Berdasarkan hasil uji Shapiro Wilk, diperoleh p-value sebesar 0.9364. Karena p-value(0.9364) > α(0.05), maka diputuskan terima H₀ yang artinya pengamatan menyebar normal.

4.5 Asumsi Homogenitas Ragam

Ragam Berdasarkan hasil uji Levene, diperoleh p-value sebesar 0.7253. Karena p-value > α(0.05), maka diputuskan terima H₀ yang artinya data mempunyai ragam galat yang homogen. Sehingga dapat disimpulkan bahwa asumsi homogenitas varians dalam ANOVA terpenuhi.

4.6 Asumsi Independensi

Berdasarkan hasil uji Durbin Watson, diperoleh p-value 0.922, yang artinya data antar perlakuan bersifat independen.

5 KESIMPULAN

Dengan taraf nyata 5% didapatkan bahwa jenis parfum berpengaruh terhadap jumlah parfum yang terjual.

6 DAFTAR PUSTAKA

CNN Indonesia (2023, 2 Juli). Catat, Perbedaan Eau de Cologne, Eau de Toilette, dan Eau de Perfume. Diakses pada 31 Mei 2024. dari https://www.cnnindonesia.com/gaya-hidup/20230619091211-277-963595/catat-perbedaan-eau-de-cologne-eau-de-toilette-dan-eau-de-perfume.
Hochberg, Y., & Tamhane, A. C. (1987). Multiple Comparison Procedures. John Wiley & Sons.
Kaggle. (2024). Perfume E-Commerce Dataset. Diakses dari Kaggle.
Lusiana, E, D., & Mahmudi, M. (2021). ANOVA untuk PENELITIAN EKSPERIMEN.Malang:UB Press.
Montgomery, D. C. (2013). Design and Analysis of Experiments. John Wiley & Sons.
Muchson.2017.Statistik Deskriptif.Jakarta:Guepedia.