1 PENDAHULUAN

1.1 Latar Belakang

Sejalan dengan kebutuhan analisis data diberbagai bidang dan kepentingan, uji hipotesis menjadi salah satu hal penting dalam implementasi dan interpretasi data. Hal tersebut tidak lain karena hasil dari uji hipotesis akan berkaitan langsung dengan proses pengambilan keputusan. Uji Z dan uji t menjadi uji yang paling sering digunakan. Namun, pada kenyataannya, penggunaan kedua uji tersebut akan membutuhkan waktu yang cukup lama dan perhitungan yang kompleks dalam menghadapi kasus dengan lebih dari 2 variabel, sehingga dikhawatirkan akan memperbesar kemungkinan kesalahan.

Menghadapi hal tersebut, diberlakukan uji ANOVA (Analysis of Variance) guna melakukan uji hipotesis statistik dengan dua atau lebih variabel. Uji ini merupakan bentuk uji hipotesis statistik dimana kesimpulan diambil berdasarkan data atau kelompok statistika inferensia. Teknik ini juga membandingkan secara simultan beberapa variabel sekaligus. Sehingga dengan ANOVA diharapkan bisa memperkecil resiko kesalahan, baik dalam perhitungan maupun analisisnya.

ANOVA dipandang unggul dalam penyelesaian dan analisis berbagai kasus dengan tingkat kerumitan yang kompleks. Hal ini juga berkaitan erat dengan hubungan antara ANOVA dan analisis regresi. Sehingga, teknik ini kerap diimplementasikan dan dimodifikasi sesuai kebutuhan analisa dat di berbagai bidang, seperti keuangan, kesehatan, sosial, dan bidang lainnya.

1.2 Statistika Inferensial

statistika ialah ilmu yang memelajari bagaimana mengumpulkan, mengolah, menyajikan, dan menganalisis data, serta membuat kesimpulan. Hal ini dipertegas oleh Diekhoff (1992:4) yang menyatakan “statistics are means of organized, condensed, and analyzed numerical data in ways that find order in chaos”. Berdasarkan kegiatan yang dilakukan dalam mengolah data, statistika dibagi menjadi dua, yakni statistika deskriptif dimana kegiatan yang dilakukan berupa mengumpulkan dan mengolah data guna diinterpretasikan menjadi sesuatu yang lebih mudah dipahami. Adapun statistika inferensial merupakan kegiatan yang dimaksudkan untuk menarik kesimpulan.

Dalam pengaplikasian statistika inferensial diadakan pendugaan parameter, membuat dan melakukan pengujian hipotesis.Analisis dengan statistika inferensial akan dilakukan hingga sampai pada kesimpulan yang berlaku umum. Statistika inferensial bertujuan untuk menginterpretasikan atau menafsirkan data. Metode ini umumnya disebut statistika induktif, karena kesimpulan yang ditarik berdasarkan pada penarikan sampel dari sebuah populasi.Hal tersebut menyebabkan sifat tidak pasti dan memungkinkan timbulnya kesalahan pada pengambilan keputusan. Sehingga diperlukan metode analisis pendukung guna memperkecil resiko kesalahan pada perhitungan.

1.3 ANOVA

Analysis of Variance atau yang lebih dikenal dengan sebuatan ANOVA merupakan bagian dari metode analisis statistika yang tergolong analisis komparatif lebih dari dua rata-rata(Riduwan,2008). Sedangkan varians atau ragam merupakan ukuran seberapa jauh sebuah kumpulan bilangan tersebar.ANOVA digunakan untuk menguji perbedaan antara sejumlah rata-rata populasi dengan cara membandingkan variansinya. ANOVA merupakan bentuk perluasan dari uji-t (t test) dengan penggunaannya tidak terbatas pada pengujian perbedaan dua buah rata-rata populasi saja, tetapi mencakup dua atau lebih sekaligus. Dalam menguji hipotesis nol tersebut, ANOVA meakukan perbandingan antara variansi antar kelompok (MSB) dengan variansi dalam kelompok (MSW). Jika ternyata kedua variansi itu sama (F=1) maka berarti seluruh sampel yang dianalisis berasal dari populasi yang sama, dan kita tidak memiliki dasar untuk menolak hipotesis nol. Namun, jika ada salah satu nilai rata-rata yang jauh berbeda dengan nilai rata-rata lainnya maka berarti sampel tersebut berasal dari populasi yang berbeda.

1.3.1 One-Way ANOVA

ANOVA dengan analisis Satu arah atau one-way ANOVA melibatkan hanya satu peubah bebas dengan dua kategori atau lebih yang dipilih dan ditentukan secara tidak acak, dan bertindak sebagai faktor. Data sampel akan dinyatakan dengan Yij yang berarti data ke-j dalam sampel yang diambil dari populasi ke-i dengan sifat saling bebas. Tujuan dari uji anova satu jalur adalah untuk membandingkan lebih dari dua rata-rata serta menguji kemampuan generalisasi.Anova satu jalur dapat melihat perbandingan lebih dari dua kelompok data(Riduwan.2008).

Asumsi :

  • Data random
  • Data berdistribusi normal
  • Variannya homogen

Hipotesis :

  • H0 : α1 = α2 = . . . αp
  • H1 : Paling sedikit terdapat 2 αi yang tidak sama

Model linier :

yij = µ + αj + εij

1.4 Data untuk Analaisis One-Way ANOVA

Eksperimen dilakukan untuk membandingkan harga tabung Elpiji refill ukuran 12kg. Pengamatan dilakukan di empat provinsi yang dipilih secara acak. Provinsi yang terpilih yakni Jawa Timur, Sumatera Barat, Bali, dan Papua Barat. Dari keempat provinsi tersebut, diambil masing-masing 4 warung kelontong sebagai sampel acak untuk Provinsi Jawa Timur, Sumatera Barat, Bali, dan Papua. Data tersaji pada tabel berikut:

Lokasi Harga (dalam ribu rupiah)
Jawa Timur 159 163 165 161
Sumatera Barat 158 161 164 163
Bali 154 154 155 158
Papua 169 170 171 168

Akan diuji apakah data ini memberikan bukti yang cukup untuk menyatakan bahwa ada perbedaan rata‐rata harga tabung elpiji ukuran 12kg pada 4 provinsi tersebut. Dengan lokasi dianggap sebagai perlakuan dan harga elpiji sebagai respon.

Maka, hipotesis yang terbentuk meliputi :

  • H0 : α1 = α2 = . . . αp (Tidak terdapat perbedaan rata-rata harga tabung elpiji ukuran 12kg pada 4 provinsi tersebut)
  • H1 : Paling sedikit terdapat 2 αi yang tidak sama (Terdapat perbedaan rata-rata harga tabung elpiji ukuran 12kg pada 4 provinsi tersebut))

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> library(dplyr)
> library(tidyr)
> library(ggplot2)
> library(tseries)
> library(car)
> library(agricolae)
> library(readxl)

2.2 Input Data

> p <- file.path("C:","Users", "ASUS", "Documents", "DataHarga.xlsx")
> Data <- readxl::read_excel(p)
> Data$Provinsi <- as.factor(Data$Provinsi)
> Data
# A tibble: 16 × 2
   Provinsi Harga
   <fct>    <dbl>
 1 A          159
 2 A          163
 3 A          165
 4 A          161
 5 B          158
 6 B          161
 7 B          164
 8 B          163
 9 C          154
10 C          154
11 C          155
12 C          158
13 D          169
14 D          170
15 D          171
16 D          168

Data tabel harga elpiji di 4 provinsi terlebih dahulu disimpan dalam bentuk excel. Kemudian dilakukan impor data dari excel menuju software R dengan menggunakan package readxl dan fungsi read_excel, dengan argumen p yang terlebih dahulu didefinisikan sebagai path dari file excel yang akan digunakan.

Dengan permisalan :

  • A = Jawa Timur
  • B = Sumatera Barat
  • C = Bali
  • D = Papua

2.3 Membentuk Deskripsi dari Setiap Harga di Setiap Provinsi

> plotA <- ggplot(Data) +
+   aes(x = Provinsi, y = Harga, fill = Provinsi) +
+   geom_boxplot() +
+   scale_fill_hue(direction = 2) 

Plot yang dibuat berupa boxplot dengan memanfaatkan fungsi ggplot dan argumen Data, dengan keterangan sumbu X akan memuat data Provinsi dan sumbu Y memuat data Harga. Dengan menggunakan geom_boxplot() untuk manampilkan distribusi variabel kontinu dan memvisualisasikan statistik ringkasan berupa median, hinges and whiskers, serta outlier . Pada boxplot diberikan pula warna dengan penggunaan fungsi scale_fill_hue

2.4 Membentuk tabel ANOVA

> anova <- aov (Harga~Provinsi, data=Data)

Dengan memanfaatkan fungsi yang bersifat built-in di R, dapat langsung dibentuk tabel anova dari data yang diinputkan dengan fungsi aov. Argumen Harga~Provinsi menyatakan bahwa variabel Harga dibuat untuk setiap level yang ada di variabel Provinsi. Sedangkan argumen data=Data berfungsi untuk menyatakan objek “Data” yang telah didefinisikan sebelumnya.

2.5 Diagnostic Plots

Hasil pengujian hipotesis menggunakan ANOVA perlu dilakukan pemeriksaan asumsi guna mengetahui terpenuhinya asumsi One-Way ANOVA test atau tidak pada hasil yang pengujian yang didapat. Untuk mengawali pemeriksaan asumsi, terlebih dahulu dilakukan pemeriksaan sisaan.

2.5.1 Residuals VS Fitted Plot

> plot(anova, 1)

Menggunakan fungsi plot dengan argumen anova yang merupakan hasil analisis sebelumnya dengan which = 1 untuk membentuk Residuals VS Fitted Plot.

2.5.2 Q-Q Plot

> plot(anova, 2)

Menggunakan fungsi plot dengan argumen anova yang merupakan hasil analisis sebelumnya dengan which = 2 untuk membentuk Q-Q Plot.

2.5.3 Scale-Location Plot

> plot(anova, 3)

Menggunakan fungsi plot dengan argumen anova yang merupakan hasil analisis sebelumnya dengan which = 3 untuk membentuk Scale-Location Plot.

2.6 Pengujian Asumsi

Pengujian Asumsi perlu dilakukan ketika dicurigai terdapat pelanggaran asumsi ketika melakukan pemeriksaan sisaan.

2.6.1 Uji Normalitas Galat

Terlebih dahulu mendefinisikan residuals dari ANOVA yang telah didefinisikan sebelumnya.

> sisa <- residuals(anova)

Sisaan disimpan pada objek sisa dengan menggunakan fungsi residuals dengan argumen anova yang telah dibuat sebelumnya.

2.6.1.1 Uji Jarque Berra

> JB <- jarque.bera.test(sisa)

Melakukan uji jarque bera dari library tseries dengan argumen sisa yang telah didefinisikan.Hasil uji disimpan dalam objek JB.

2.6.1.2 Uji Saphiro Wilk

> SW <- shapiro.test(sisa)

Melakukan uji shapiro test dengan argumen sisa. Hasil uji disimpan dalam objek SW.

2.6.2 Uji Kehomogenan Ragam

2.6.2.1 Uji Levene

> Levene <- leveneTest(Harga~Provinsi, data=Data)

Melakukan uji levene dari library car. Dengan argumen harga untuk setiap provinsi dan dataframe data sebagai data yang digunakan. Hasil uji disimpan dalam objek Levene.

2.7 Uji Lanjut

2.7.1 Uji Fisher’s LSD

> bnt <- LSD.test(anova, "Provinsi", alpha = 0,05)

Melakukan uji dengan fungsi LSD.test dengan argumen anova sebagai objek model dan Provinsi sebagai perlakuan, serta taraf signifikansi 0,05. Data hasil uji didimpan dalam objek bnt.

2.7.2 Uji Tukey’s HSD

> bnj <- TukeyHSD(anova, conf.level=0.95)

Melakukan uji dengan fungsi Tukey’s HSD dengan argumen anova sebagai objek dan taraf signifikansi 0,05. Hasil uji disimpan dalam objek bnj.

3 HASIL DAN PEMBAHASAN

3.1 Boxplot

Sebelum dilakukan analisis sesuai hipotesis, dapat dibentuk deskripsi dari Harga di setiap lokasi menggunakan plot.

> plotA

Berdasarkan boxplot diatas, terlihat bahwa terdapat perbedaan rata-rata harga antar provinsi. Dapat dilihat pula bahwa Provinsi Bali dan Papua memiliki harga yang relatif berbeda dengan provinsi lain.

3.2 Tabel ANOVA

> summary(anova)
            Df Sum Sq Mean Sq F value   Pr(>F)    
Provinsi     3  408.2  136.06   28.77 9.18e-06 ***
Residuals   12   56.8    4.73                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Dalam tabel tersebut, variabel Provinsi bertindak sebagai perlakuan dengan derajat bebas 3. JKP (Jumlah Kuadrat Perlakuan) sebesar 408,2 dan KTP(Kuadrat Tengah Perlakuan) sebesar 136,06. Sementara diperoleh JKG (Jumlah Kuadrat Galat) sebesar 56,8 dan KTG(Kuadrat Tengah Galat) sebesar 4,73. Maka, diperoleh :

\[ F~hit~ = \frac {KTP} {KTG}= \frac{136.06} {4,73} = 28,77 \] \[P-value = 9,18e-06\] Dengan P-value yang cukup kecil, maka dapat disimpulkan terdapat bukti bahwa paling tidak ada satu lokasi yang secara signifikan memiliki rata-rata harga tabung elpiji 12kg yang berbeda diantara keempat provinsi.

3.3 Pemeriksaan Sisaan

3.3.1 Residuals VS Fitted Plot

> plot(anova,1)

Pada plot ini, sumbu X sebagai nilai duga dan sumbu Y sebagai nilai sisaan. Garis merah menghubungkan pusat dari 4 kelompok sisaan. Pola dari garis yang terbentuk menunjukkan pola horizontal yang berarti model sudah tepat.

3.3.2 Q-Q Plot

> plot(anova,2)

Q-Q Plot merupakan representasi dari normalitas sisaan. Pada sumbu X memuat informasi kuantil sebaran normal dan pada sumbu Y memuat informasi kuantil dari sisaan yang dibakukan. Dapat dilihat bahwa titik-titik berada tidak jauh dari garis diagonoal 45o, sehingga dapat disimpulkan tidak adanya indikasi pelanggaran normalitas.

3.3.3 Scale-Location Plot

> plot(anova,3)

Plot ini berfungsi untuk melakukan pemeriksaan ragam. Pada sumbu X menjelaskan informasi nilai duga dan pada sumbu Y menjelaskan akar dari pembakuan sisaan. Sebaran dari sisaan di setiap nilai duga menggambrakan ragam. Dari plot diatas, dapat dilihat memiliki pola yang tidak horizontal, sehingga dicurigai bahwa data memiliki ketidakhomogenan ragam.

3.4 Pengujian Asumsi

3.4.1 Uji Normalitas Galat

Hipotesis :

  • H0 = Galat menyebar normal
  • H1 = Galat tidak menyebar normal

Uji ini memeriksa normalitas galat atau sisaan yang terdapat pada ANOVA yang telah didapatkan sebelumnya. Dari hasil perhitungan syntax, diperoleh :

> sisa
    1     2     3     4     5     6     7     8     9    10    11    12    13 
-3.00  1.00  3.00 -1.00 -3.50 -0.50  2.50  1.50 -1.25 -1.25 -0.25  2.75 -0.50 
   14    15    16 
 0.50  1.50 -1.50 

Selanjutnya dilakukan uji lanjutan untuk menguji normalitas galat.

3.4.1.1 Uji Jarque Bera

Statistik Jarque Bera dihitung berdasarkan koefisien skewness dan kurtosis yang diduga dari sampel teramati.Dengan rumus :

\[ JB = \frac {n} {6} (S^2 + \frac {1} {4} (K -3)^2) \] Dengan :

  • S : Skewness
  • K : Kurtosis

Sedangkan secara asimtotik Jarque Bera menyabar secara chi-square.

Hasil dari perhitungan menggunakan software R yakni :

> JB

    Jarque Bera Test

data:  sisa
X-squared = 0.5059, df = 2, p-value = 0.7765

P-value yang didapat cukup besar, sehingga dapat disimpulkan untuk Terima H0. Artinya, galat menyebar normal.

3.4.1.2 Uji Shapiro Wilk

Pada dasarnya, uji ini memiliki statistik : \[ W =\frac { (\sum^{n}_{i=1} {a_i} {x_i})^2} { \sum^{n}_{i=1} (x_i - \frac {1} {n} \sum^{n}_{i=1} {x_i})^2} \] Dengan pemanfaatan software R, didapat hasil uji sebagai berikut:

> SW

    Shapiro-Wilk normality test

data:  sisa
W = 0.96067, p-value = 0.6739

Sama halnya dengan uji sebelumnya, yakni uji Jarque Bera didapat P-value yang bernilai besar, yakni > 0,05. Sehingga dalam uji inipun gagal menolak H0. Maka, dapat disimpulkan bahwa galat menyebar normal.

3.4.2 Uji Kehomogenan Ragam

Hipotesis :

  • H0 : Ragam antar perlakuan sama
  • H1 : Setidaknya ada satu pasang ragam antar perlakuan yang tidak sama.

Berfungsi untuk menguji apakah ragam antar perlakuan terjaga kehomogenannya ataukah tidak. Digunakan uji Levene untuk menguji homogenitas antar perlakuan.

3.4.2.1 Uji Levene

> Levene
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  3  0.7183 0.5599
      12               

Pada hasil uji levene diatas, didapat P-value = 0,5599 > 0,05, sehingga gagal Tolak H0. Asumsi kehomogenan ragam antar perlakuan terpenuhi.

3.5 Uji Lanjut

Karena hasil dari ANOVA yang diperoleh menghasilkan kesimpulan Tolak H0, maka diberlakukan uji lanjut untuk mengetahui pasangan provinsi mana yang memiliki perbedaan nilai tengah. Sehingga akan dilakukan perbandingan untuk seluruh pasang kelompok perlakuan. Uji ini dilakukan dengan syarat tidak adanya pelanggaran normalitas.

3.5.1 Uji Fisher’s LSD

Fisher’s LSD (Least Significance Difference) test atau yang lebih dikenal dengan uji BNT.

Hipotesis :

  • H0 : Tidak terdapat perbedaan rata-rata antar perlakuan
  • H1 : Terdapat minimal sepasang rata-rata yang sama antar sepasang perlakuan

Dengan pemanfaatan software R diperoleh :

> bnt$group
   Harga groups
D 169.50      a
A 162.00     ab
B 161.50     ab
C 155.25      b

Dari data diatas, dapat dilihat bahwa provinsi dengan kode C dan D, yaitu provinsi Bali dan Papua memiliki perbedaan rata-rata yang signifikan.

3.5.2 Uji Tukey’s HSD

Tukey’s HSD (Honestly Significance Difference) test atau yang lebih dikenal dengan uji BNJ.

Hipotesis :

  • H0 : Tidak terdapat perbedaan rata-rata antar perlakuan
  • H1 : Terdapat minimal sepasang rata-rata yang sama antar sepasang perlakuan

Dengan pemanfaatan software R diperoleh :

> bnj
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = Harga ~ Provinsi, data = Data)

$Provinsi
     diff        lwr       upr     p adj
B-A -0.50  -5.065339  4.065339 0.9875266
C-A -6.75 -11.315339 -2.184661 0.0042232
D-A  7.50   2.934661 12.065339 0.0018600
C-B -6.25 -10.815339 -1.684661 0.0073876
D-B  8.00   3.434661 12.565339 0.0010928
D-C 14.25   9.684661 18.815339 0.0000042

Dari data tersebut, diketahui selang yang memuat nilai 0 yakni pada perlakuan A dan B (Provinsi Jawa Timur dan Sumatera Barat), dimana batas bawahnya yakni -5,065 dan batas atas 4,065. Sehingga dapat disimpulkan bahwa harga tabung gas elpiji 12kg di kedua provinsi tersebut tidak berbeda.

4 DAFTAR PUSTAKA

Usmadi. (2020). PENGUJIAN PERSYARATAN ANALISIS (UJI HOMOGENITAS DAN UJI NORMALITAS).Jurnal Inovasi Pendidikan, Vol.7.No.1.

Gunawan, I. (2017). Pengantar Statistika Inferensial. Palangkaraya.

Zach. (2021). Fisher’s Least Significant Difference: Definition + Example. Diakses pada 22 Mei 2022, dari https://www.statology.org/fishers-least-significant-difference/.

Hecke,TV. (2012). Power study of anova versus Kruskal-Wallis test. Journal of Statistics and Management Systems.

Sumarminingsih, Eny. Materi Kuliah Komputasi Statistika : ANOVA test.