1 PENDAHULUAN
1.1 Latar Belakang
Dewasa ini, statistika sangat bermanfaat dalam segala aspek kehidupan. Statistika adalah sebuah ilmu yang mempelajari bagaimana cara merencanakan, mengumpulkan, menganalisis, lalu menginterpretasikan, dan akhirnya mempresentasikan data. Misalkan sebuah perusahaan perlu melakukan pengujian terhadap kumpulan hasil pengamatan mengenai suatu hal, misalnya hasil penjualan produk, hasil produksi produk, gaji pekerja di suatu perusahaan nilainya bervariasi antara satu dengan yang lainnya. Hal ini berhubungan dengan varian dan rata-rata yang banyak digunakan untuk membuat kesimpulan melalui penaksiran dan pengujian hipotesis mengenai parameter, maka dari itu dilakukan analisis varian yang ada dalam cabang ilmu statistika industri yaitu ANOVA. Penerapan ANOVA dalam dunia industri adalah untuk menguji rata-rata data hasil pengamatan yang dilakukan pada sebuah perusahaan ataupun bidang ilmu yang lainnya.
1.2 Statistika Deskriptif
Statistika deskriptif merupakan bagian dari statistika yang membahas cara-cara pengumpulan data, penyajian data serta pengukuran pemusatan dan penyebaran data untuk memperoleh informasi yang lebih jelas dan mudah dipahami. Ukuran pemusatan data misalnya rata-rata (mean), nilai tengah (median) dan modus. sedangkan ukuran penyebaran data, misalnya rentang (range), ragam (variance) dan simpangan baku.
Statistika deskriptif tidak menyangkut penarikan kesimpulan mengenai data, melainkan berhubungan dengan bagaimana data dapat digambarkan atau dideskripsikan baik secara numerik maupun secara grafis untuk memperoleh gambaran secara sepintas mengenai data tersebut.
1.3 Analisis Ragam Satu Arah (One Way ANOVA)
Analisis Varian (ANOVA) adalah metode analisis statistika yang menguraikan keragaman total menjadi beberapa komponen yang mengukur berbagai komponen keragaman.Anova digunakan untuk membandingkan rata-rata populasi bukan ragam populasi.
Anova dapat digolongkan kedalam beberapa kriteria, salah satunya adalah ANOVA Satu Arah (One Way ANOVA). ANOVA satu arah ialah uji hipotesis dengan memakai varian serta data hasil pengamatan terhadap satu faktor. Pada setiap populasi independen diambil sampel acak dengan ukuran n1 untuk populasi ke-1, n2 untuk populasi ke-2 dan seterusnya. Sementara data sampel dinyatakan dalam Yij. Anova satu arah (One Way ANOVA) digunakan apabila yang akan dianalisis terdiri dari satu variabel terikat dan satu variabel bebas. Dengan prosedur pengujian hipotesis: \[ H_{0}= \mu_{1}=\mu_{2}= ...=\mu_{i} \] \[ H_{1}= sekurang-kurangnya\ dua\ nilai\ tengah\ tidak\ sama \]
1.4 Data
Data yang digunakan merupakan data jumlah rokok yang terjual di sebuah supermarket pada 8 hari yang dipilih secara acak.
2 SOURCE CODE
2.1 Library yang Dibutuhkan
> # Library
> library(tseries)
> library(car)
> library(agricolae)
> library(rmarkdown)2.2 Membangkitkan Data
> j1 <- c(21,35,32,28,14,47,25,38)
> j2 <- c(35,12,27,41,19,23,31,20)
> j3 <- c(45,60,33,36,31,40,43,48)
> j4 <- c(32,53,29,42,40,23,35,42)
> j5 <- c(45,29,31,22,36,29,42,30)
> Jual <- c(j1,j2,j3,j4,j5)
> Rokok <- as.factor(c(rep("A",8),rep("B",8),rep("C",8),rep("D",8),rep("E",8)))
> data <- data.frame(Rokok, Jual)> library(rmarkdown)
> paged_table(as.data.frame(data))2.3 Plot
> #Pembentukan boxplot
> boxplot(Jual~Rokok,data=data,main="Boxplot Data Jumlah Rokok Terjual",
+ xlab="Rokok",ylab="Jumlah Terjual")
Pembentukan boxplot dilakukan menggunakan formula ‘Jual~Rokok’ untuk
menyatakan bahwa boxplot ‘Jual’ dibuat untuk setiap level yang ada di
variabel ‘Rokok’, x label dan y label untuk identitas grafik. Kemudian,
boxplot diberi nama ‘Boxplot Data Jumlah Rokok Terjual’.
2.4 ANOVA
> anova <- aov(Jual~Rokok, data=data)
> summary(anova)
Df Sum Sq Mean Sq F value Pr(>F)
Rokok 4 1226 306.40 3.591 0.0148 *
Residuals 35 2986 85.31
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Pemodelan ANOVA akan dilakukan menggunakan function ‘aov’ dimana maksud dari Jual~Rokok adalah untuk menguji apakah rata-rata 5 merk rokok di suatu supermarket terjual sama banyak.
2.5 Diagnostik Sisaan
> plot(anova, 1)
Plot residuals vs fitted digunakan untuk melihat apakah model yang
digunakan sudah tepat atau belum.
> plot(anova, 2)
Q-Q Plot digunakan untuk melihat apakah ada indikasi pelanggaran asumsi
normalitas galat atau tidak.
> plot(anova, 3)
Scale-location plot digunakan untuk melihat apakah ada indikasi
pelanggaran asumsi homogenitas ragam atau tidak.
2.6 Uji Asumsi
2.6.1 Asumsi Normalitas Galat
> sisa <- residuals(anova)
> library(tseries)
> jarque.bera.test(sisa)
Jarque Bera Test
data: sisa
X-squared = 1.063, df = 2, p-value = 0.5877Uji Jarque Bera digunakan untuk mengetahui normalitas sisaan dari data.
2.6.2 Asumsi Homogenitas Ragam
> library(car)
> leveneTest(Jual~Rokok, data=data)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 4 0.2409 0.9132
35 Uji Levene digunakan untuk mengetahui homogenitas ragam suatu data.
2.7 Uji Lanjut BNJ
> library(agricolae)
> bnj <- TukeyHSD(anova, conf.level = 0.95)
> bnj
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = Jual ~ Rokok, data = data)
$Rokok
diff lwr upr p adj
B-A -4 -17.277853 9.277853 0.9072855
C-A 12 -1.277853 25.277853 0.0925654
D-A 7 -6.277853 20.277853 0.5595297
E-A 3 -10.277853 16.277853 0.9655802
C-B 16 2.722147 29.277853 0.0116212
D-B 11 -2.277853 24.277853 0.1443007
E-B 7 -6.277853 20.277853 0.5595297
D-C -5 -18.277853 8.277853 0.8141434
E-C -9 -22.277853 4.277853 0.3116753
E-D -4 -17.277853 9.277853 0.9072855
> plot(TukeyHSD(anova))3 HASIL DAN PEMBAHASAN
3.1 Statistika Deskriptif
> summary(data)
Rokok Jual
A:8 Min. :12.00
B:8 1st Qu.:27.75
C:8 Median :32.50
D:8 Mean :33.60
E:8 3rd Qu.:41.25
Max. :60.00 Berdasarkan Data yang digunakan, diperoleh nilai rataan sebesar 33.60 dan nilai median sebesar 32.50. Jumlah rokok yang terjual paling banyak adalah 60 bungkus, sedangkan jumlah rokok yang terjual paling sedikit adalah 12 bungkus. Pembentukan boxplot menunjukkan bahwa terdapat perbedaan rata-rata penjualan rokok antar merk rokok.
3.2 ANOVA
> summary(anova)
Df Sum Sq Mean Sq F value Pr(>F)
Rokok 4 1226 306.40 3.591 0.0148 *
Residuals 35 2986 85.31
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Berdasarkan hasil ANOVA di atas, diperoleh nilai signifikansi sebesar 0.0148 < α (0.05) yang berarti bahwa rata-rata dari banyaknya rokok yang terjual berbeda untuk kelima merk rokok yang dijual di supermarket tersebut pada 8 hari yang acak.
3.3 Diagnostik sisaan
> plot(anova, 1)Berdasarkan plot residuals vs fitted di atas, menunjukkan bahwa garis merah masih terlihat datar (horizontal), sehingga model dinyatakan sudah tepat.
> plot(anova, 2)Berdasarkan Q-Q plot di atas, menunjukkan bahwa titik-titik berada tidak jauh dari garis antara sumbu X dan Y, sehingga secara grafis tidak ada indikasi pelanggaran normalitas.
> plot(anova, 3)Berdasarkan plot scale-location di atas, menunjukkan bahwa garis merah cenderung terlihat datar (horizontal), sehingga tidak ada indikasi pelanggaran homogenitas.
3.4 Uji Asumsi
3.4.1 Asumsi Normalitas Galat
> jarque.bera.test(sisa)
Jarque Bera Test
data: sisa
X-squared = 1.063, df = 2, p-value = 0.5877Berdasarkan uji Asumsi Normalitas Galat menggunakan Uji Jarque Bera diperoleh nilai signifikansi sebesar 0.5877 > α (0.05). Sehingga dapat disimpulkan sisaan atau galat sudah berdistribusi normal.
3.4.2 Asumsi Homogenitas Ragam
> leveneTest(Jual~Rokok, data=data)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 4 0.2409 0.9132
35 Berdasarkan uji Asumsi Homogenitas Galat menggunakan uji Levene diperoleh nilai signifikansi sebesar 0.9132 > α (0.05). Sehingga dapat disimpulkan bahwa Ragam dari data sudah bersifat homogen.
3.5 Uji Lanjut BNJ
> bnj
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = Jual ~ Rokok, data = data)
$Rokok
diff lwr upr p adj
B-A -4 -17.277853 9.277853 0.9072855
C-A 12 -1.277853 25.277853 0.0925654
D-A 7 -6.277853 20.277853 0.5595297
E-A 3 -10.277853 16.277853 0.9655802
C-B 16 2.722147 29.277853 0.0116212
D-B 11 -2.277853 24.277853 0.1443007
E-B 7 -6.277853 20.277853 0.5595297
D-C -5 -18.277853 8.277853 0.8141434
E-C -9 -22.277853 4.277853 0.3116753
E-D -4 -17.277853 9.277853 0.9072855
> plot(TukeyHSD(anova))
Berdasarkan hasil uji BNJ di atas, menunjukkan bahwa terdapat 5 pasangan
kelompok yang diuji dengan batas bawah dan batas atas dari selang
kepercayaan. Batas bawah dan batas atas selang kepercayaan selisih nilai
semua kelompok berbeda tanda yang artinya memuat nol. Selain itu, dapat
dilihat juga nilai p pada semua pasangan kelompok > α (0.05), kecuali
untuk pasangan kelompok C-B yang memiliki nilai p < α (0.05). Hal
tersebut dapat disimpulkan bahwa pada taraf signifikansi 5% (0.05),
terdapat 1 pasang kelompok yang berbeda signifikan.
4 DAFTAR PUSTAKA
Walpole, R.E. 1993. Pengantar Statistika. PT Gramedia Pustaka Utama: Jakarta. Edisi ke-3.
https://patrastatistika.com/analisis-variansi-satu-arah/#:~:text=ANOVA%20satu%20arah%20ialah%20uji,untuk%20populasi%202%20dan%20seterusnya.