1 PENDAHULUAN

1.1 Latar Belakang

Setiap perusahaan perlu melakukan evaluasi terhadap sejumlah data pengamatan yang terkait dengan berbagai aspek, seperti penjualan produk, produksi barang, atau gaji karyawan. Nilai-nilai dalam data ini seringkali bervariasi antara satu entitas dengan yang lainnya. Untuk membuat kesimpulan yang valid melalui penaksiran dan pengujian hipotesis mengenai parameter-parameter ini, perusahaan dapat menggunakan analisis varian (ANOVA), yang merupakan bagian dari ilmu statistika industri. Dalam konteks industri, penerapan ANOVA bertujuan untuk menguji perbedaan rata-rata dari data pengamatan yang diperoleh di dalam sebuah perusahaan atau industri tertentu.

2 TINJAUAN PUSTAKA

2.1 Analisis of Variance (ANOVA)

ANOVA (Analysis of Variance) adalah metode statistika yang digunakan untuk membandingkan rata-rata antara tiga kelompok atau lebih. Tujuannya adalah untuk menentukan apakah ada perbedaan yang signifikan antara kelompok-kelompok tersebut berdasarkan variasi dalam data. ANOVA memecah variasi total dalam data menjadi komponen-komponen variasi yang dijelaskan oleh faktor-faktor yang sedang diuji.

ANOVA termasuk dalam kategori statistik parametrik, yang berarti mengasumsikan distribusi data yang spesifik. Sebagai sebuah alat statistik parametrik, penggunaan rumus ANOVA membutuhkan pengujian asumsi sebelumnya, termasuk asumsi normalitas, homogenitas varians, dan pengambilan sampel acak (Ghozali,2009).

Hal ini penting untuk memastikan kecocokan data dengan asumsi dasar yang diperlukan dalam analisis ANOVA.

Menurut Montgomery, dkk.(2012), ANOVA dapat digolongkan kedalam beberapa klasifikasi, yaitu:

  1. Klasifikasi 1 arah (One Way ANOVA), Anova klasifikasi 1 arah merupakan ANOVA yang didasarkan pada pengamatan 1 kriteria atau satu faktor yang menimbulkan variasi. Misalnya, membandingkan rata-rata gaji antara tiga kelompok pekerja berdasarkan tingkat pendidikan (faktor kategorikal).

  2. Klasifikasi 2 arah (Two Way ANOVA), ANOVA kiasifikasi 2 arah merupakan ANOVA yang didasarkan pada pengamatan 2 kriteria atau 2 faktor yang menimbulkan variasi. Misalnya, membandingkan rata-rata penjualan produk antara dua kelompok penjual (faktor A) di tiga wilayah geografis yang berbeda (faktor B).

  3. Klasifikasi banyak arah, ANOVA banyak arah merupakan ANOVA yang didasarkan pada pengamatan banyak kriteria. Misalnya, membandingkan rata-rata kinerja siswa antara tiga sekolah (faktor A), dua jenis kelamin (faktor B), dan dua tingkat pendidikan orang tua (faktor C).

Dikutip dari Hair, dkk. (2014), hasil dari ANOVA klasifikasi dapat diinterpretasikan berdasarkan beberapa aspek, termasuk:

  • Signifikansi Statistik: Menentukan apakah terdapat perbedaan yang signifikan antara rata-rata kelompok. Hal ini dapat diketahui dari nilai p yang lebih kecil dari tingkat signifikansi yang ditetapkan.
  • F-ratio: Mengukur perbandingan variasi antara kelompok dengan variasi dalam kelompok. F-ratio yang tinggi menunjukkan adanya perbedaan yang signifikan antara kelompok-kelompok.
  • Confidence Interval (Interval Kepercayaan): Memberikan estimasi rentang di mana rata-rata populasi sebenarnya kemungkinan berada. Interval kepercayaan yang tidak tumpang tindih antara kelompok-kelompok menunjukkan perbedaan yang signifikan antara rata-rata kelompok tersebut.

2.2 Asumsi-asumsi ANOVA

Beberapa asumsi yang harus dipenuhi untuk menerapkan ANOVA adalah sebagai berikut:

  1. Independensi: Sampel yang dianalisis harus bersifat independen, artinya pengamatan dalam satu kelompok tidak bergantung pada pengamatan dalam kelompok lain.

  2. Normalitas: Data dalam setiap kelompok atau perlakuan harus mengikuti distribusi normal. Ini berarti distribusi frekuensi data harus simetris di sekitar nilai rata-rata.

  3. Homogenitas varian: Varians dari kelompok-kelompok yang dibandingkan harus sebanding, artinya variasi dalam setiap kelompok sekitar nilai rata-rata yang sama.

Jika asumsi-asumsi ini tidak terpenuhi, hasil dari analisis ANOVA dapat menjadi tidak valid atau tidak akurat. Oleh karena itu, sebelum menerapkan ANOVA, penting untuk memeriksa dan memastikan bahwa asumsi-asumsi tersebut terpenuhi. Jika asumsi tidak terpenuhi, ada alternatif metode analisis yang mungkin lebih sesuai untuk digunakan, seperti uji non-parametrik.

3 SOURCE CODE

Berikut ini merupakan tahapan melakukan analisis varians di Rstudio:

3.1 Library

Terlebih dahulu kita memasang packages untuk melakukan analisis varians sebagai berikut.

> library(stats)
> library(car)
> library(ggplot2)
> library(dplyr)
> library(reshape2)

3.2 Input Data

Selanjutnya, kita dapat memuat data ke dalam Rstudio dengan perintah berikut.

> # Membuat data contoh
> kelompok1 <- c(10, 15, 12, 11, 13)
> kelompok2 <- c(9, 11, 10, 14, 13)
> kelompok3 <- c(8, 7, 10, 9, 12)

3.3 Menerapkan ANOVA

Selanjutnya, kita dapat melakukan ANOVA dengan fungsi aov di Rstudio dengan perintah berikut:

> hasil_anova <- aov(c(kelompok1, kelompok2, kelompok3) ~ factor(rep(1:3, each = 5)))
> hasil_anova
Call:
   aov(formula = c(kelompok1, kelompok2, kelompok3) ~ factor(rep(1:3, 
    each = 5)))

Terms:
                factor(rep(1:3, each = 5)) Residuals
Sum of Squares                    24.13333  46.80000
Deg. of Freedom                          2        12

Residual standard error: 1.974842
Estimated effects may be unbalanced

3.4 Menampilkan hasil ANOVA

Selanjutnya, kita dapat menunjukkan hasil ANOVA di Rstudio dengan perintah berikut:

> summary(hasil_anova)
                           Df Sum Sq Mean Sq F value Pr(>F)  
factor(rep(1:3, each = 5))  2  24.13   12.07   3.094 0.0825 .
Residuals                  12  46.80    3.90                 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

3.5 Mendapatkan Residu dari ANOVA

> residu <- residuals(hasil_anova)
> residu
   1    2    3    4    5    6    7    8    9   10   11   12   13   14   15 
-2.2  2.8 -0.2 -1.2  0.8 -2.4 -0.4 -1.4  2.6  1.6 -1.2 -2.2  0.8 -0.2  2.8 

3.6 Membuat Scatter Plot Residu

> ggplot(data = data.frame(residu = residu, kelompok = factor(rep(1:3, each = 5))),
+        aes(x = kelompok, y = residu)) +
+   geom_point() +
+   labs(x = "Kelompok", y = "Residu") +
+   theme_minimal()

3.7 Memeriksa Asumsi ANOVA

  1. Asumsi Normalitas: Data dalam setiap kelompok diharapkan memiliki distribusi normal melalui Shapiro.test pada Rstudio
> shapiro.test(kelompok1)

    Shapiro-Wilk normality test

data:  kelompok1
W = 0.97872, p-value = 0.9276
> shapiro.test(kelompok2)

    Shapiro-Wilk normality test

data:  kelompok2
W = 0.95235, p-value = 0.754
> shapiro.test(kelompok3)

    Shapiro-Wilk normality test

data:  kelompok3
W = 0.97872, p-value = 0.9276
  1. Asumsi Asumsi Homogenitas Varians: Variansi dalam setiap kelompok diharapkan homogen, artinya variabilitas data sebanding di semua kelompok. Hal tersebut dapat dibuktikan dengan LeveneTest pada Rstudio
> hasil_levene <- leveneTest(hasil_anova)
> print(hasil_levene)
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  2  0.0513 0.9502
      12               
  1. Asumsi Independensi: Pengamatan dalam setiap kelompok diharapkan saling independen, tidak dipengaruhi oleh pengamatan lainnya. Dalam data ini digunakan uji Durbin-Watson untuk independensi pada Rstudio
> uji_durbin_watson <- durbinWatsonTest(hasil_anova)
> print(uji_durbin_watson)
 lag Autocorrelation D-W Statistic p-value
   1      -0.1940171      2.117094   0.754
 Alternative hypothesis: rho != 0

4 HASIL DAN PEMBAHASAN

4.1 Hasil Analisis Varians (ANOVA)

Pada analisis ANOVA yang dilakukan, kita membandingkan rata-rata antara tiga kelompok data, yaitu kelompok 1, kelompok 2, dan kelompok 3. Berdasarkan hasil ANOVA, diperoleh nilai F-statistik sebesar 3,094 dan p-value sebesar 0,0825. P-value tersebut menunjukkan rata-rata antara kelompok-kelompok tersebut tidak berbeda. Oleh karena p-value lebih dari alpha (0.05), kita dapat menyimpulkan bahwa tidak terdapat perbedaan yang signifikan antara kelompok-kelompok tersebut.

4.2 Pembahasan Analisis Varians (ANOVA)

Hasil analisis ANOVA menunjukkan bahwa tidak terdapat perbedaan yang signifikan antara rata-rata kelompok 1, kelompok 2, dan kelompok 3. Oleh karena itu, kita dapat menyimpulkan bahwa tidak ada faktor yang membedakan ketiga kelompok dan tidak ada yang memiliki dampak yang signifikan terhadap variabel tersebut.

4.3 Asumsi dalam ANOVA

Selain hasil analisis ANOVA, kita juga melakukan pemeriksaan terhadap asumsi-asumsi yang harus dipenuhi dalam penggunaan metode ini. Asumsi-asumsi tersebut meliputi normalitas, homogenitas varians, dan independensi data. Untuk menguji asumsi normalitas, dilakukan uji Shapiro-Wilk pada setiap kelompok data. Hasil uji menunjukkan bahwa data pada kelompok 1, kelompok 2, dan kelompok 3 secara signifikan tidak berdistribusi normal dengan nilai p-value masing-masing sebesar 0,9276, 0,754, dan 0,9276.

Selanjutnya, untuk menguji asumsi homogenitas varians, digunakan uji Levene’s Test. Hasil uji menunjukkan bahwa tidak terdapat perbedaan signifikan dalam variabilitas antara kelompok 1, kelompok 2, dan kelompok 3, dengan nilai p-value sebesar 0,952. Oleh karena p-value lebih besar dari alpha (0.05), kita dapat menyimpulkan bahwa asumsi homogenitas varians dalam ANOVA terpenuhi.

Terakhir, untuk asumsi independensi data, dilakukan pemeriksaan dengan menggunakan scatter plot dari residu. Dalam plot tersebut, tidak terlihat adanya pola atau tren yang jelas antara kelompok-kelompok data. Hal ini menunjukkan bahwa data dalam setiap kelompok saling independen.

Dengan demikian, hasil analisis ANOVA menunjukkan tidak adanya perbedaan yang signifikan antara kelompok-kelompok yang dibandingkan, dan asumsi-asumsi yang diperlukan dalam penggunaan metode ini, yaitu homogenitas varians, dan independensi data, terpenuhi dalam konteks penelitian ini. Tetapi, asumsi normalitas belum terpenuhi sehingga perlu dilakukan uji lanjut atau penyesuaian lanjutan.

5 KESIMPULAN

Berdasarkan hasil analisis ANOVA yang dilakukan, tidak terdapat perbedaan yang signifikan antara rata-rata kelompok 1, kelompok 2, dan kelompok 3. Oleh karena itu, kita dapat menyimpulkan bahwa tidak ada faktor yang membedakan ketiga kelompok tersebut dan tidak ada faktor yang memiliki dampak yang signifikan terhadap variabel yang diamati.

Selain itu, hasil uji asumsi menunjukkan bahwa asumsi homogenitas varians dan independensi data terpenuhi. Namun, asumsi normalitas tidak terpenuhi dalam data yang digunakan. Oleh karena itu, diperlukan langkah-langkah lanjutan atau penyesuaian lebih lanjut untuk memastikan kecocokan dengan asumsi normalitas.

6 DAFTAR PUSTAKA