Library:
install.packages("knitr")
install.packages("rmarkdown")
install.packages("prettydoc")
install.packages("equatiomatic")
install.packages("kableExtra")
1 PENDAHULUAN
1.1 Latar Belakang
Parfum telah menjadi bagian integral dari budaya dan kehidupan sehari-hari manusia selama berabad-abad. Sebagai salah satu elemen penting dalam seni rupa dan personalitas, parfum tidak hanya berfungsi sebagai penanda identitas, tetapi juga sebagai alat untuk meningkatkan rasa percaya diri dan daya tarik. Dalam dunia parfum, terdapat berbagai jenis, di antaranya Eau de Parfum (EdP), Eau de Toilette (EdT), dan Eau de Cologne (EdC). Eau de Parfum, dengan konsentrasi minyak wangi yang tinggi, menawarkan aroma yang kaya dan kompleks yang tahan lama di kulit, menjadikannya pilihan utama untuk acara-acara formal atau malam hari. Sementara itu, Eau de Toilette, dengan konsentrasi minyak wangi yang lebih rendah, memberikan aroma yang lebih ringan dan segar, cocok untuk pemakaian sehari-hari atau di cuaca hangat. Eau de Cologne memiliki konsentrasi minyak wangi yang paling rendah, sekitar 2% hingga 4%, menghasilkan aroma yang sangat ringan dan segar, serta lebih cocok untuk digunakan setelah mandi atau di cuaca panas. Perbedaan dalam konsentrasi minyak wangi dan karakteristik aroma ini memungkinkan pengguna untuk memilih parfum sesuai dengan preferensi pribadi dan situasi penggunaan yang dihadapi.
2 TINJAUAN PUSTAKA
2.1 Statistika Deskriptif
Statistika deskriptif membahas cara-cara pengumpulan, peringkasan, dan penyajian data sehingga diperoleh informasi yang lebih mudah dipahami. Informasi yang dapat diperoleh dengan statistika deskriptif antara lain pemusatan data (mean, median, modus), penyebaran data (range, simpangan rata-rata, varians, dan simpangan baku), kecenderungan suatu gugus data, serta ukuran letak (kuartil, desil, dan persentil) (Muchson, 2017).
2.2 One-Way Analysis of Variance (ANOVA)
Analysis of Variance (ANOVA) atau dikenal juga sebagai analisis ragam adalah teknik statistika yang digunakan untuk mendeteksi adanya perbedaan rata-rata antarkelompok/populasi amatan (King, 2010). ANOVA secara luas digunakan untuk menganalisis data penelitian dari berbagai bidang, baik yang dilakukan melalui eksperimen maupun survei. Analisis ini tergolong dalam analisis parametrik, sehingga membutuhkan pemenuhan asumsi kenormalan data. Selain itu, variabel respon yang diamati harus bersifat kuantitatif dengan skala pengukuran interval dan rasio (Kim, 2017).
2.2.1 Jenis-Jenis ANOVA
Terdapat beberapa jenis ANOVA yang umum digunakan, yaitu:
ANOVA Satu Arah (One-Way ANOVA). ANOVA Satu Arah digunakan ketika ada satu faktor yang mempengaruhi variabel respons.
ANOVA Dua Arah (Two-Way ANOVA). ANOVA Dua Arah digunakan ketika terdapat dua faktor yang mempengaruhi variabel respons.
ANOVA Faktorial. ANOVA Faktorial digunakan ketika terdapat lebih dari dua faktor yang mempengaruhi variabel respons.
2.3 Uji ANOVA Satu Arah
Syarat-syarat yang perlu dilakukan sebelum melakukan one-way ANOVA:
Setiap observasi dalam kelompok harus independen.Berarti data dari satu kelompok tidak boleh mempengaruhi data dari kelompok lain.
Data dalam setiap kelompok harus mengikuti distribusi normal. Asumsi ini dapat diuji menggunakan tes normalitas seperti Shapiro-Wilk atau Kolmogorov-Smirnov.
Variansi data dalam setiap kelompok harus sama atau setidaknya serupa. Hal ini dapat diuji menggunakan Levene test atau Bartlett test.
Data yang digunakan harus pada skala interval atau rasio.
Hipotesis: \[ H_0: \mu_1 = \mu_2 = \mu_3 = \cdots = \mu_k \] \[ H_1: \text{Minimal terdapat satu } \mu_i \neq 0 \]
Tabel ANOVA:
library(kableExtra)
tabel_anova <- data.frame(
`Sumber_Keragaman` = c("Perlakuan", "Galat", "Total"),
`Derajat_Bebas` = c("p-1", "n-p", "n-1"),
`Jumlah_Kuadrat` = c(
"$$\\sum_{j=1}^{p} (\\bar{y}_{\\cdot j} - \\bar{y}_{\\cdot \\cdot})^2$$",
"$$JKt - JKp$$",
"$$\\sum_{i=1}^{n} (\\bar{y}_{ij} - \\bar{y}_{\\cdot \\cdot})^2$$"
),
`Kuadrat_Tengah` = c(
"$$\\frac{JKp}{(p-1)}$$",
"$$\\frac{JKg}{(n-p)}$$",
""
),
`FHitung` = c(
"$$\\frac{KTp}{KTg}$$",
"",
""
)
)
kable(tabel_anova, escape = FALSE, booktabs = TRUE) %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>%
column_spec(1, bold = TRUE, color = "white", background = "lightblue")| Sumber_Keragaman | Derajat_Bebas | Jumlah_Kuadrat | Kuadrat_Tengah | FHitung |
|---|---|---|---|---|
| Perlakuan | p-1 | \[\sum_{j=1}^{p} (\bar{y}_{\cdot j} - \bar{y}_{\cdot \cdot})^2\] | \[\frac{JKp}{(p-1)}\] | \[\frac{KTp}{KTg}\] |
| Galat | n-p | \[JKt - JKp\] | \[\frac{JKg}{(n-p)}\] | |
| Total | n-1 | \[\sum_{i=1}^{n} (\bar{y}_{ij} - \bar{y}_{\cdot \cdot})^2\] |
Keputusan :
Jika \(F_{hitung} > F_{tabel}\), maka tolak \(H_0\).
Jika \(F_{hitung} \leq F_{tabel}\), maka terima \(H_0\).
Atau dapat diputuskan dalam bentuk lain:
Jika \(p\)-value \(\leq \alpha\), maka tolak \(H_0\).
Jika \(p\)-value \(> \alpha\), maka terima \(H_0\).
Keterangan :
\(F_{hitung}\) adalah nilai \(F\) yang diperoleh dari perhitungan ANOVA.
\(F_{tabel}\) adalah nilai kritis \(F\) dari tabel distribusi \(F\) berdasarkan derajat kebebasan perlakuan dan galat.
\(p\)-value adalah probabilitas mendapatkan nilai \(F\) yang sama atau lebih ekstrem jika \(H_0\) benar.
\(\alpha\) adalah tingkat signifikansi yang ditetapkan (Sebagai contoh yaitu 0.05, 0.01, dll).
2.4 Uji Lanjut
2.4.1 Uji Beda Nyata Terkecil (BNT)
Uji lanjut adalah teknik statistik yang digunakan setelah analisis varians (ANOVA) untuk menunjukkan adanya perbedaan yang signifikan antara kelompok (Montgomery, 2013). Salah satu metode yang sering digunakan dalam uji lanjut adalah Uji Beda Nyata Terkecil adalah uji LSD (Least Significant Difference). Uji LSD bertujuan untuk menentukan pasangan kelompok mana yang berbeda secara signifikan dengan membandingkan rata-rata antar kelompok setelah ANOVA menunjukkan adanya perbedaan global yang signifikan.
2.4.2 Uji Beda Nyata Jujur (BNJ)
Uji Tukey’s HSD (Honestly Significant Difference) berguna untuk melakukan perbandingan berpasangan antar rata-rata kelompok untuk menentukan kelompok mana yang berbeda secara signifikan. Metode ini mempertimbangkan tingkat kesalahan tipe I yang terakumulasi akibat melakukan banyak perbandingan, sehingga memberikan hasil yang lebih akurat dibandingkan dengan melakukan uji t secara berulang. Uji Tukey’s HSD menggunakan distribusi studentized range untuk menghitung selisih kritis antar rata-rata kelompok, yang kemudian digunakan untuk menentukan signifikan tidaknya perbedaan tersebut (Hochberg & Tamhane, 1987).
Hipotesis: \[ H_0 : \mu_i = \mu_j \text{ (Tidak terdapat perbedaan signifikan antara rata-rata dua kelompok yang dibandingkan)} \] \[ H_1 : \mu_i \neq \mu_j \text{ (Terdapat perbedaan signifikan antara rata-rata dua kelompok yang dibandingkan)} \]
Kriteria :
Apabila nilai P-Value > α, maka keputusan terima H0. Disimpulkan bahwa hasil menunjukan tidak berbeda nyata.
Apabila nilai P-Value < α, maka keputusan tolak H0. Disimpulkan bahwa hasil menunjukan berbeda nyata.
2.5 Asumsi ANOVA
2.5.1 Asumsi Normalitas Galat
Model regresi yang baik ialah model yang memiliki residu dan terdistribusi secara normal. Maka dari itu diperlukan uji normalitas untuk melihat apakah ada nilai residu normal atau tidak. Uji Normalitas dilakukan juga untuk mengetahui apakah variabel prediktor maupun respon berdistribusi normal atau tidak. Uji yang dapat digunakan untuk uji normalitas yaitu uji Jarque-Bera, Saphiro Wilk, Kolmogorov Smirnov ataupun menggunakan Q-Q Plot.
Hipotesis: \[ H_0 : \text{ Pengamatan berdistribusi normal} \] \[ H_1 : \text{ Pengamatan tidak berdistribusi normal} \]
Kriteria:
Apabila nilai P-Value > α, maka keputusan terima H0. Disimpulkan bahwa data yang digunakan sudah berdistribusi normal.
Apabila nilai P-Value < α, maka keputusan tolak H0. Disimpulkan bahwa data yang digunakan tidak berdistribusi normal.
2.5.2 Asumsi Homogenitas Ragam
Uji homogenitas adalah pengujian yang dilakukan untuk mengetahui persamaan dari variansi-variansi dua buah distribusi atau lebih (Sudjana, 2005). Uji yang digunakan untuk menguji homogenitas yaitu uji Levene, Fisher atau uji Bartlett, dan Cochran Q Test.
Hipotesis: \[ H_0: \sigma_1^2 = \sigma_2^2 = \cdots = \sigma_k^2 \] \[ H_1: \text{Setidaknya terdapat dua varians yang berbeda} \]
Kriteria:
Apabila P-Value > α, maka keputusan terima H0. Disimpulkan bahwa data mempunyai ragam galat yang homogen.
Apabila P-Value < α, maka keputusan tolak H0. Disimpulkan bahwa data mempunyai ragam galat yang tidak homogen.
2.5.3 Asumsi Independensi
Hipotesis: \[ H_0: \text{Data antar perlakuan bersifat independen} \] \[ H_1: \text{Data antar perlakuan tidak bersifat independen} \]
Kriteria:
Apabila P-Value > α, maka keputusan terima H0. Disimpulkan bahwa data antar perlakuan bersifat independen.
Apabila P-Value < α, maka keputusan tolak H0. Disimpulkan bahwa data antar perlakuan tidak bersifat independen.
3 Source Code
3.1 Library yang digunakan:
3.2 Uji Anova
3.2.1 Langkah 1: Input data
perf<-c("A","B","C")
Jenis_Parfum <- rep(perf, times=6)
Jumlah_Parfum_Terjual <- c(116, 43, 38,
48, 159, 68,
39, 101, 78,
33, 147, 84,
68, 136, 87,
37, 111, 12)
DataP <- data.frame(Jenis_Parfum,Jumlah_Parfum_Terjual)
DataP$Jenis_Parfum <- as.factor(DataP$Jenis_Parfum)
DataP## Jenis_Parfum Jumlah_Parfum_Terjual
## 1 A 116
## 2 B 43
## 3 C 38
## 4 A 48
## 5 B 159
## 6 C 68
## 7 A 39
## 8 B 101
## 9 C 78
## 10 A 33
## 11 B 147
## 12 C 84
## 13 A 68
## 14 B 136
## 15 C 87
## 16 A 37
## 17 B 111
## 18 C 12
3.2.2 Langkah 2: Summary Data
## Jenis_Parfum Jumlah_Parfum_Terjual
## A:6 Min. : 12.00
## B:6 1st Qu.: 40.00
## C:6 Median : 73.00
## Mean : 78.06
## 3rd Qu.:108.50
## Max. :159.00
3.2.3 Langkah 3: Eksplorasi Data
library(ggplot2)
p1 <- ggplot(DataP) + aes(x = Jenis_Parfum, y = Jumlah_Parfum_Terjual, fill = Jenis_Parfum) + geom_boxplot() + scale_fill_hue(direction = 1) + theme_minimal() + theme(legend.position = "none")
p13.2.4 Langkah 4: Menghitung ANOVA
## Call:
## aov(formula = Jumlah_Parfum_Terjual ~ Jenis_Parfum, data = DataP)
##
## Terms:
## Jenis_Parfum Residuals
## Sum of Squares 13128.44 18244.50
## Deg. of Freedom 2 15
##
## Residual standard error: 34.87549
## Estimated effects may be unbalanced
3.2.5 Langkah 5: Menampilkan Hasil ANOVA
## Df Sum Sq Mean Sq F value Pr(>F)
## Jenis_Parfum 2 13128 6564 5.397 0.0172 *
## Residuals 15 18244 1216
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
3.2.6 Langkah 6: Mendapatkan Residu dari ANOVA
## 1 2 3 4 5 6 7
## 59.166667 -73.166667 -23.166667 -8.833333 42.833333 6.833333 -17.833333
## 8 9 10 11 12 13 14
## -15.166667 16.833333 -23.833333 30.833333 22.833333 11.166667 19.833333
## 15 16 17 18
## 25.833333 -19.833333 -5.166667 -49.166667
3.3 Uji Lanjut
3.3.1 Uji Beda Nyata Terkecil (BNT)
## $statistics
## MSerror Df Mean CV t.value LSD
## 1216.3 15 78.05556 44.68035 2.13145 42.91754
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none Jenis_Parfum 3 0.05
##
## $means
## Jumlah_Parfum_Terjual std r se LCL UCL Min Max Q25
## A 56.83333 31.56844 6 14.23786 26.48605 87.18061 33 116 37.5
## B 116.16667 41.92573 6 14.23786 85.81939 146.51395 43 159 103.5
## C 61.16667 29.90931 6 14.23786 30.81939 91.51395 12 87 45.5
## Q50 Q75
## A 43.5 63.00
## B 123.5 144.25
## C 73.0 82.50
##
## $comparison
## NULL
##
## $groups
## Jumlah_Parfum_Terjual groups
## B 116.16667 a
## C 61.16667 b
## A 56.83333 b
##
## attr(,"class")
## [1] "group"
## Jumlah_Parfum_Terjual groups
## B 116.16667 a
## C 61.16667 b
## A 56.83333 b
## Jumlah_Parfum_Terjual std r se LCL UCL Min Max Q25
## A 56.83333 31.56844 6 14.23786 26.48605 87.18061 33 116 37.5
## B 116.16667 41.92573 6 14.23786 85.81939 146.51395 43 159 103.5
## C 61.16667 29.90931 6 14.23786 30.81939 91.51395 12 87 45.5
## Q50 Q75
## A 43.5 63.00
## B 123.5 144.25
## C 73.0 82.50
3.3.2 Uji Beda Nyata Jujur (BNJ)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Jumlah_Parfum_Terjual ~ Jenis_Parfum, data = DataP)
##
## $Jenis_Parfum
## diff lwr upr p adj
## B-A 59.333333 7.032296 111.634371 0.0255204
## C-A 4.333333 -47.967704 56.634371 0.9748333
## C-B -55.000000 -107.301038 -2.698962 0.0387331
3.4 Memeriksa Asumsi ANOVA
3.4.1 Asumsi Normalitas Galat
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
##
## Shapiro-Wilk normality test
##
## data: Residu
## W = 0.97877, p-value = 0.9364
##
## Jarque Bera Test
##
## data: Residu
## X-squared = 0.35538, df = 2, p-value = 0.8372
3.4.2 Asumsi Homogenitas Ragam
## Loading required package: carData
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.3281 0.7253
## 15
4 HASIL DAN PEMBAHASAN
4.1 Statistika Deskriptif
Berdasarkan hasil summary data, didapatkan nilai minimal data, Q1, median, mean, Q3, dan nilai maksimum dari data masing-masing sebesar 12, 40, 73, 78.06, 108.5, dan 159.
Berdasarkan data yang digunakan, hasil Box-Plot menunjukan bahwa:Pada jenis parfum A dan C, rata-rata jumlah parfum terjual tidak berada di tengah kotak. Artinya terdapat keragaman yang cukup berarti. Selanjutnya, pada jenis parfum B, rata-rata jumlah parfum terjual berada di tengah kotak. Artinya terdapat keragaman yang kurang berarti.
4.2 One-Way Analysis of Variance (ANOVA)
Pada studi kasus ini, ingin dilakukan pengujian apakah terdapat pengaruh antara jenis parfum (EdT, EdP, EdC) terhadap jumlah parfum yang terjual. Berdasarkan hasil ANOVA, p-value sebesar 0.0172. Karena p-value < α dengan menggunakan taraf nyata 5%, maka dapat diputuskan tolak H0. Berdasarkan hasil keputusan tolak H0, dapat disimpulkan bahwa terdapat pengaruh antara jenis parfum (EdT, EdP, EdC) terhadap jumlah parfum yang terjual. Dikarenakan hasil uji ANOVA menghasilkan keputusan tolak H0, maka diperlukan uji lanjut.
4.3 Uji Lanjut
4.3.1 Uji Beda Nyata Terkecil (BNT)
Berdasarkan output yang dihasilkan, pada bagian groups dapat dilihat dari masing-masing jenis parfum yaitu B dan C memiliki group yang berbeda. Artinya, jenis parfum B dan C memiliki perbedaan jumlah parfum yang terjual atau dapat dikatakan jenis parfum berbeda nyata. Sedangkan, jenis parfum C dan A termasuk ke dalam group yang sama yang artinya jenis parfum C dan A tidak memiliki perbedaan jumlah parfum yang terjual atau dapat dikatakan tidak berbeda nyata.
4.3.2 Uji Beda Nyata Jujur (BNJ)
Keputusan:
Jenis Parfum B & Jenis Parfum A : p-value(0,025) < α(0.05), maka tolak H0.
Jenis Parfum C & Jenis Parfum A : p-value(0,974) > α(0.05), maka terima H0.
Jenis Parfum C & Jenis Parfum B : p-value(0,038) < α(0.05), maka tolak H0.
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa:
Jenis Parfum B & Jenis Parfum A berbeda nyata.
Jenis Parfum C & Jenis Parfum A tidak berbeda nyata.
Jenis Parfum C & Jenis Parfum B berbeda nyata.
4.4 Asumsi Normalitas Galat
Berdasarkan hasil uji Jarque Bera, diperoleh p-value sebesar 0.8372. Karena p-value(0.8372) > α(0.05), maka diputuskan terima H0 yang artinya pengamatan menyebar normal.
Berdasarkan hasil uji Shapiro Wilk, diperoleh p-value sebesar 0.9364. Karena p-value(0.9364) > α(0.05), maka diputuskan terima H0 yang artinya pengamatan menyebar normal.
4.5 Asumsi Homogenitas Ragam
Ragam Berdasarkan hasil uji Levene, diperoleh p-value sebesar 0.7253. Karena p-value > α(0.05), maka diputuskan terima H0 yang artinya data mempunyai ragam galat yang homogen. Sehingga dapat disimpulkan bahwa asumsi homogenitas varians dalam ANOVA terpenuhi.
4.6 Asumsi Independensi
Berdasarkan hasil uji Durbin Watson, diperoleh p-value 0.922, yang artinya data antar perlakuan bersifat independen.
5 KESIMPULAN
Dengan taraf nyata 5% didapatkan bahwa jenis parfum berpengaruh terhadap jumlah parfum yang terjual.
6 DAFTAR PUSTAKA
CNN Indonesia (2023, 2 Juli). Catat, Perbedaan Eau de Cologne, Eau de Toilette, dan Eau de Perfume. Diakses pada 31 Mei 2024. dari https://www.cnnindonesia.com/gaya-hidup/20230619091211-277-963595/catat-perbedaan-eau-de-cologne-eau-de-toilette-dan-eau-de-perfume.
Hochberg, Y., & Tamhane, A. C. (1987). Multiple Comparison Procedures. John Wiley & Sons.
Kaggle. (2024). Perfume E-Commerce Dataset. Diakses dari Kaggle.
Lusiana, E, D., & Mahmudi, M. (2021). ANOVA untuk PENELITIAN EKSPERIMEN.Malang:UB Press.
Montgomery, D. C. (2013). Design and Analysis of Experiments. John Wiley & Sons.
Muchson.2017.Statistik Deskriptif.Jakarta:Guepedia.