1 PENDAHULUAN
1.1 Latar Belakang
Cukup banyak ahli yang berpendapat terkait definisi dari statistika. Statistika yang sudah umum diketahui yaitu ilmu pengetahuan yang berkaitan dengan cara-cara pengumpulan data, peolahan serta analisis, penarikan kesimpulan, hingga pembuatan keputusan berdasarkan fakta (Gasperz, 1989). Peran statistika dapat membantu meminimalkan tingkat kesalahan yang terjadi, sehingga diperoleh informasi dan kesimpulan yang tepat sesuai dengan data yang diperoleh.
Dalam menentukan keputusan dalam sebuah penelitian diberbagai bidang, uji hipotesis menjadi salah satu hal yang penting dalam mengimplementasi serta interpretasi sebuah data. Pada dasarnya uji hipotesis akan berkaitan langsung dengan proses pengambilan keputusan. Ketika akan dilakukan pengujian hipotesis statistik dengan dua atau lebih variabel maka diberlakukan uji Analisis of Varians (ANOVA). Pengujian menggunakan analisis ragam sering digunakan dan dimodifikasi diberbagai bidang, seperti keuangan, kesehatan, perdagangan, sosial, dan bidang lainnya.
2 TINJAUAN PUSTAKA
2.1 ANOVA
Analysis of Varians merupakan uji kesamaan dua rata-rata digunakan untuk mencari perbedaan atau persamaan dua rata-rata. Anova merupakan bagian dari metode analisis statistika yang tergolong analisis komparatif lebih dari dua rata-rata (Riduwan,2008). Varians atau ragam sendiri diartikan sebagai ukuran seberapa jauh sebuah kumpulan bilangan terbesar. Penggunaan ANOVA tidak hanya sebatas pengujian terhadap dua buah rata-rata populasi, melainkan dapat dilakukan dua atau lebih sekaligus.
2.1.1 One-Way ANOVA
Dinamakan analisis varians satu arah karena analisis ini menggunakan varians dan data hasil pengamatan merupakan pengaruh satu faktor. Dari setiap populasi secara independen diambil sebuah sampel acak, berukuran n1 dari populasi kesatu, n2 dari populasi kedua dan seterusnya berukuran nk dari populasi ke-k. Data sampel akan dinyatakan dengan Yij yang berarti data ke-j dalam sampel yang diambil dari populasi ke-i (Sudjana,1996). Pada sebelum dilakukan pengujian ANOVA, diasumsikan bahwa data dipilih secara acak, berdistribusi normal, dan variannya homogen.
Hipotesis:
H0: \(\mu\)1 = \(\mu\)2 = … = \(\mu\)k
H1: Paling sedikit terdapat satu pasang kelompok i dan i’ dengan \(\mu\)i \(\neq\) \(\mu\)i’
Model Linier:
Yij = \(\mu\)i + \(\epsilon\), i = 1,..,k; j = 1,..,ni
2.1.2 Pengujian Asumsi
Ghozali (2016) menjelaskan mengenai beberapa asumsi ANOVA yang harus dipenuhi:
- Uji normalitas galat:
ANOVA merupakan bagian dari statistika parametrik karena mensyaratkan adanya distribusi normal pada variabel dependen per kelompok variabel independen-between subject (atau perlakuan-within subject).
Dengan Hipotesis yang diajukan:
H0: Galat menyebar normal
H1: Galat tidak menyebar normal
Kriteria pengambilan keputusan:
Jika sig. (p value) ≤ 0,05 (5%) maka H~0 ditolak artinya Data di dalam grup atau antar grup tidak terdistribusi secara normal. Sebaliknya jika sig. (p value) > 0,05 (5%) maka H0 diterima atau artinya Data di dalam grup atau antar grup terdistribusi secara normal.
Pengujian normalitas galat dapat dilakukan dengan uji:
Uji Jarque Berra
Uji Saphiro Wilk
- Uji kehomogenan ragam:
Variabel dependen dalam tiap kategori atau kelompok atau perlakuan (dari variabel independen) harus memiliki varian yang sama. Apabila terdapat lebih dari satu variabel independen maka varian variabel dependen di dalam grup (within) atau varian antar grup (between) harus sama. Uji Kehomogenen ragam dapat dilakukan dengan uji Levene untuk melihat apakah grup memiliki varian sama atau berbeda.
Dengan hipotesis yang diajukan:
H0: \(\sigma\)12 = \(\sigma\)22 = … = \(\sigma\)k2
H1: \(\sigma\)i2 \(\neq\) \(\sigma\)j2
untuk paling tidak satu pasang i, j
Kriteria pengambilan keputusan:
Jika sig. (p value) ≤ 0,05 (5%) maka H1 diterima atau H0 gagal diterima artinya varian grup bersifat heterogen (berbeda) atau Equal variance not assumed. Sebaliknya jika sig. (p value) > 0,05 (5%) maka H0 diterima atau H1 gagal diterima artinya varian grup bersifat homogen (sama) atau Equal variance assumed.
2.1.3 Uji Lanjut
Uji lanjut diakukan ketika hasil dari ANOVA yang diperoleh menghasilkan kesimpulan Tolak H0, maka diberlakukan uji lanjut untuk mengetahui pasangan perlakuan mana yang memiliki perbedaan nilai tengah. Sehingga akan dilakukan perbandingan untuk seluruh pasang kelompok perlakuan. Uji ini dilakukan dengan syarat tidak adanya pelanggaran normalitas.
Dengan hipotesis yang diajukan:
H0 : Tidak terdapat perbedaan rata-rata antar perlakuan
H1 : Terdapat minimal sepasang rata-rata yang sama antar sepasang perlakuan
Pengujian Uji Lanjut:
Fisher’s LSD (Least Significance Difference) test atau yang lebih dikenal dengan uji BNT.
Tukey’s HSD (Honestly Significance Difference) test atau yang lebih dikenal dengan uji BNJ.
3 SOURCE CODE
3.1 Library yang digunakan
> library(ggplot2)
> library(tseries)
> library(car)
> library(agricolae)3.2 Data untuk Analisis One-Way ANOVA
Pengamatan dilakukan untuk membandingkan jumlah ekspor kendaraan roda empat. Pengamatan dilakukan di 4 Negara yang dipilih secara acak. Negara yang dipilih yakni Philipina, Arab Saudi, Thailand, dan Jepang. Dari keempat negara tersebut, diambil dari data jumlah ekspor 5 tahun terakhir. Data tersaji pada tabel berikut:
| Negara | Jumlah Kendaraan |
|---|---|
| Philipina | 134 132 135 94 99 |
| Arab Saudi | 52 42 51 49 64 |
| Thailand | 26 32 55 26 24 |
| Jepang | 19 20 17 18 23 |
Akan diuji apakah data ini memberikan bukti yag cukup untuk menyatakan bahwa ada perbedaan rata-rata jumlah ekspor kendaraan roda empat atau lebih pada 4 negara tersebut. Dengan Negara sebagai perlakuan dan jumlah kendaraan sebagai respon.
Maka, hipotesis yang terbentuk:
H0: \(\mu\)1 = \(\mu\)2 = … = \(\mu\)4 (Tidak terdapat perbedaan rata-rata jumlah ekspor kendaraan pada 4 negara tersebut)
H1: Paling sedikit terdapat satu pasang kelompok i dan i’ dengan \(\mu\)i \(\neq\) \(\mu\)i’ (Terdapat perbedaan rata-rata jumlah ekspor kendaraan pada 4 negara tersebut)
3.3 Input Data
> data <- read.csv('C:/Users/Windows10/Documents/EksporKendaraan.csv', header=TRUE, sep=";")
> data$Negara <- as.factor(data$Negara)
> data
Negara Kendaraan
1 1 134
2 1 132
3 1 135
4 1 94
5 1 99
6 2 52
7 2 42
8 2 51
9 2 49
10 2 64
11 3 26
12 3 32
13 3 55
14 3 26
15 3 24
16 4 19
17 4 20
18 4 17
19 4 18
20 4 23Data tabel jumlah ekspor kendaraan di 4 negara terlebih dahulu disimpan dalam bentuk csv Kemudian dilakukan impor data dari csv menuju software R dengan fungsi read.csv, dengan argumen yang didefinisikan sebagai path dari file csv yang akan digunakan. Dan membentuk data negara menjadi faktor. Kemudian menampilkan hasil input data dengan memanggil nama data yang sudah didefinisikan.
Dengan permisalan :
1 = Philipina 2 = Arab Saudi 3 = Thailand 4 = Jepang
3.4 Membentuk Tabel ANOVA
> anova <- aov(Kendaraan~Negara, data=data)Dengan memanfaatkan fungsi yang bersifat built-in di R, dapat langsung membentuk tabel anova dari data yang diinputkan dengan fungsi aov. Argumen Kendaraan~Negara menyatakan bahwa variabel Kendaraan dibuat untuk setiap level yang ada di variabel Negara. Sedangkan argumen data=data berfungsi untuk menyatakan objek “Data” yang telah didefinisikan sebelumnya.
3.5 Diagnostic Plots
Hasil pengujian hipotesis menggunakan ANOVA perlu dilakukan pemeriksaan asumsi guna mengetahui terpenuhinya asumsi One-Way ANOVA test atau tidak pada hasil yang pengujian yang didapat. Untuk mengawali pemeriksaan asumsi, terlebih dahulu dilakukan pemeriksaan sisaan. Pemeriksaan sisaan awal dapat dilakukan dengan tiga cara, yaitu:
Residuals VS Fitted Plot
Q-Q Plot
Scale-Location Plot
3.5.1 Residuals VS Fitted Plot
- Sisaan pada sumbu Y dan nilai duga pada sumbu X
- Plot dengan pola horizontal mengindikasikan ketepatan model
- Menggunakan fungsi plot dengan argumen anova yang merupakan hasil analisis sebelumnya dengan which = 1 untuk membentuk Residuals VS Fitted Plot
> plot(anova,1)3.5.2 Q-Q Plot
- Kuantil sebaran normal secara teori pada sumbu X, Kuantil dari sisaan yang dibakukan pada sumbu Y
- Titik-titik yang jatuh di sekitar garis dengan sudut 45 derajat antara sumbu X dan Y di kuadran I mengindikasikan terpenuhinya asumsi normalitas
- Menggunakan fungsi plot dengan argumen anova yang merupakan hasil analisis sebelumnya dengan which = 2 untuk membentuk Q-Q Plot.
> plot(anova,2)3.5.3 Scale-Location Plot
- Nilai duga (fitted value) pada sumbu X dan akar dari pembakuan sisaan pada sumbu Y
- Sebaran sisaan di setiap nilai duga menggambarkan ragam
- Ragam yang sama, dicirikan dengan pola horizontal dari plot ini
- Menggunakan fungsi plot dengan argumen anova yang merupakan hasil analisis sebelumnya dengan which = 3 untuk membentuk Scale-Location Plot.
> plot(anova,3)3.6 Pengujian Asumsi
Ketika dicurigai adanya pelanggaran asumsi berdasarkan pemeriksaan sisaan, maka pengujian asumsi secara formal harus dilakukan. Uji normalitas galat: - Uji Jarque Berra - Uji Saphiro Wilk Uji kehomogenan ragam: - Uji Levene
> sisa <- residuals(anova)Sisaan disimpan pada objek sisa dengan menggunakan fungsi residuals dengan argumen anova yang telah dibuat sebelumnya.
3.6.1 Uji Normalitas Galat
3.6.1.1 Uji Jarque Bera
> JB <- jarque.bera.test(sisa)Ket: Melakukan uji Jarque Bera dari library tseries dengan argumen sisa yang telah didefinisikan. Hasil uji disimpan dalam objek JB.
3.6.1.2 Uji Shapiro Wilk
> SW <- shapiro.test(sisa)Ket: Melakukan uji Shapiro Wilk dari library tseries dengan argumen sisa yang telah didefinisikan. Hasil uji disimpan dalam objek SW.
3.6.2 Uji Kehomogenan Ragam
3.6.2.1 Uji Levene
> levene <- leveneTest(Kendaraan~Negara, data=data)Ket: Melakukan uji levene dari library car. Dengan argumen Kendaraan untuk setiap Negara dan dataframe data sebagai data yang digunakan. Hasil uji disimpan dalam objek Levene.
3.7 Uji Lanjut
Ketika ANOVA memberikan kesimpulan untuk menolak H0 maka paling sedikit terdapat satu pasang perlakuan/kelompok yang memiliki nilai tengah yang berbeda. Dari ANOVA belum dapat ditentukan pasangan mana yang berbeda nilai tengah. Uji lanjut dapat dilakukan ketika tidak ada pelanggaran asumsi normalitas dan kehomogenan ragam. Pada uji lanjut akan dilakukan perbandingan untuk seluruh pasang kelompok/perlakuan. Perlu dilakukan uji lanjut (Post Hoc Test) sebagai berikut:
- Fisher’s LSD (Least Significance Difference) Test: Uji BNT
- Tukey’s HSD (Honestly Significance Difference) Test: Uji BNJ
3.7.1 Uji Fisher’s LSD (Uji BNT)
Hipotesis
H0: \(\mu\)i - \(\mu\)i’ = 0
H1: \(\mu\)i - \(\mu\)i’ \(\neq\) 0
untuk seluruh pasangan perlakuan i dan i’
> BNT <- LSD.test(anova,"Negara", alpha = 0,05)3.7.2 Uji Tukey’s HSD (Uji BNJ)
Hipotesis
H0: \(\mu\)i - \(\mu\)i’ = 0
H1: \(\mu\)i - \(\mu\)i’ \(\neq\) 0
untuk seluruh pasangan perlakuan i dan i’
> BNJ <- TukeyHSD(anova, conf.level = 0.95)4 HASIL DAN PEMBAHASAN
4.1 Tabel ANOVA
> summary(anova)
Df Sum Sq Mean Sq F value Pr(>F)
Negara 3 29248 9749 59.71 6.57e-09 ***
Residuals 16 2612 163
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Dalam tabel tersebut, variabel Negara bertindak sebagai perlakuan dengan derajat bebas 3. JKP (Jumlah Kuadrat Perlakuan) sebesar 29248 dan KTP(Kuadrat Tengah Perlakuan) sebesar 9749. Sementara diperoleh JKG (Jumlah Kuadrat Galat) sebesar 2612 dan KTG(Kuadrat Tengah Galat) sebesar 163.
\[ F hitung = \frac {KTP} {KTG} = \frac {9749} {163} = 59,71 \] \[ P-value = 6,57 e-09 \]
Dengan P-value yang sangat kecil, maka dapat disimpulkan terdapat bukti bahwa paling tidak ada satu Negara yang secara signifikan memiliki rata-rata jumlah ekspor kendaraan roda empat yang berbeda diantara keempat negara
4.2 Pemeriksaan Sisaan
4.2.1 Residuals VS Fitted Plot
> plot(anova,1)Interpretasi: Garis merah yang menghubungkan pusat dari 4 kelompok sisaan tidak terlihat datar (horizontal) cenderung meningkat, maka model belum dibisa dikatakan tepat sehingga diperlukan dipastikan dengan uji.
4.2.2 Q-Q Plot
> plot(anova,2)Interpretasi: titik-titik berada tidak jauh dari garis dengan sudut 45 derajat antara sumbu X dan Y di kuadran I. Secara grafis tidak ada indikasi pelanggaran normalitas.
4.2.3 Scale-Location Plot
> plot(anova,3)Interpretasi:Keterangan: Garis merah yang menghubungkan pusat dari 4 kelompok akar sisaan yang dibakukan, cenderung membentuk kurva kuadrat. Ada kecurigaan ketidaksamaan ragam, perlu dipastikan dengan uji.
4.3 Pengujian Asumsi
4.3.1 Uji Normalitas Galat
Untuk memeriksa normalitas galat diperlukan data sisaan yang terdapat pada ANOVA yang telah didapatkan sebelumnya. Dari hasil perhitungan syntax, diperoleh:
> sisa
1 2 3 4 5 6 7 8 9 10 11 12 13
15.2 13.2 16.2 -24.8 -19.8 0.4 -9.6 -0.6 -2.6 12.4 -6.6 -0.6 22.4
14 15 16 17 18 19 20
-6.6 -8.6 -0.4 0.6 -2.4 -1.4 3.6 Selanjutnya dilakukan uji lanjutan untuk menguji normalitas galat.
Hipotesis
H0: Galat menyebar normal
H1: Galat tidak menyebar normal
4.3.1.1 Uji Jarque Bera
Hasil dari perhitungan menggunakan software R yakni :
> JB
Jarque Bera Test
data: sisa
X-squared = 0.028295, df = 2, p-value = 0.986Pada hasil uji Jarque Bera diatas, P-value yang didapat cukup besar sehingga dapat disimpulkan untuk untuk uji Jarque Bera Terima H0. Artinya, galat menyebar normal.
4.3.1.2 Uji Shapiro Wilk
Hasil dari perhitungan menggunakan software R yakni :
> SW
Shapiro-Wilk normality test
data: sisa
W = 0.9547, p-value = 0.444Pada hasil uji Shapiro Wilk diatas, P-value yang didapat cukup besar sehingga dapat disimpulkan untuk untuk uji Jarque Bera Tolak H0. Artinya, galat tidak menyebar normal.
4.3.2 Uji Kehomogenan Ragam
4.3.2.1 Uji Levene
Hipotesis
H0: \(\sigma\)12 = \(\sigma\)22 = … = \(\sigma\)42
H1: \(\sigma\)i2 \(\neq\) \(\sigma\)j2
untuk paling tidak satu pasang i, j
Hasil dari perhitungan menggunakan software R yakni :
> levene
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 3 1.2502 0.3246
16 Pada hasil uji levene diatas, didapat P-value = 0,3246 < 0,05, sehingga Tolak H0. Asumsi kehomogenan ragam antar perlakuan tidak terpenuhi. Yaitu setidaknya ada satu pasang ragam antar perlakuan yang tidak sama.
4.4 Uji Lanjut
4.4.1 Uji Fisher’s LSD
Fisher’s LSD (Least Significance Difference) test atau yang lebih dikenal dengan uji BNT.
Hipotesis
H0 : Tidak terdapat perbedaan rata-rata antar perlakuan
H1 : Terdapat minimal sepasang rata-rata yang sama antar sepasang perlakuan
Dengan pemanfaatan software R diperoleh :
> BNT$groups
Kendaraan groups
1 118.8 a
2 51.6 b
3 32.6 b
4 19.4 bDari data diatas, dapat dilihat bahwa perlakuan 1 yaitu Negara Philipina dengan negara lainnya seperti Arab Saudi, Thailand, dan Jepang memiliki perbedaan rata-rata yang signifikan.
4.4.2 Uji Tukey’s HSD
Tukey’s HSD (Honestly Significance Difference) test atau yang lebih dikenal dengan uji BNJ.
Hipotesis
H0 : Tidak terdapat perbedaan rata-rata antar perlakuan
H1 : Terdapat minimal sepasang rata-rata yang sama antar sepasang perlakuan
Dengan pemanfaatan software R diperoleh :
> BNJ
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = Kendaraan ~ Negara, data = data)
$Negara
diff lwr upr p adj
2-1 -67.2 -90.32122 -44.078782 0.0000018
3-1 -86.2 -109.32122 -63.078782 0.0000001
4-1 -99.4 -122.52122 -76.278782 0.0000000
3-2 -19.0 -42.12122 4.121218 0.1277487
4-2 -32.2 -55.32122 -9.078782 0.0052880
4-3 -13.2 -36.32122 9.921218 0.3889346Interpretasi:
- Terdapat perbedaan antara pengaruh perlakuan 1 (Philipina) dengan 2, 3, dan 4 (Arab Saudi, Thailand, Jepang) terhadap hasil. Hal ini dikarenakan selang nilai lwr hingga upr antara perlakuan tersebut tidak melewati angka 0 (Tolak H0).
- Tidak terdapat perbedaan antara pengaruh perlakuan 2 (Arab Saudi) dengan 3 (Thailand) terhadap hasil. Hal ini dikarenakan selang nilai lwr hingga upr antara perlakuan tersebut melewati angka 0 (Terima H0).
- Terdapat perbedaan antara pengaruh perlakuan 2 (Arab Saudi) dengan 4 (Jepang) terhadap hasil. Hal ini dikarenakan selang nilai lwr hingga upr antara perlakuan tersebut tidak melewati angka 0 (Tolak H0).
- Tidak terdapat perbedaan antara pengaruh perlakuan 3 (Thailand) dengan 4 (Jepang) terhadap hasil. Hal ini dikarenakan selang nilai lwr hingga upr antara perlakuan tersebut melewati angka 0 (Terima H0).
5 DAFTAR PUSTAKA
Gunawan, C. (2018). Mahir Menguasai SPSS (Mudah Mengolah Data Dengan IBM SPSS Statistic 25). Deepublish.
Setiawan, K. (2019). Buku ajar metodologi penelitian (anova satu arah).
ANOVA, O. W. (2008). Analysis of Variance (ANOVA). Group, 1(4), 3.