Library RMarkdown:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Dalam metode analisis dependensi sering kali penelitian dihadapkan pada analisis data yang ingin melihat hubungan antara satu variabel dependen (skala metrik) dan satu atau lebih variabel independen (skala non metrik yang bersifat kategori yang memiliki kategori lebih dari 2 (dua). Maka teknik analisis data yang tepat digunakan adalah Analysis of Variance (ANOVA) (Ghozali, 2016). Analysis of Variance (ANOVA) merupakan model statistik yang digunakan untuk menganalisis perbedaan rata-rata dari beberapa populasi secara simultan (Lind, Marchal, & Wathen, 2018)

2 TINJAUAN PUSTAKA

2.1 Asumsi ANOVA

2.1.1 Uji Normalitas Galat

Uji Normalitas berarti nilai residual (εij) dalam setiap perlakuan (grup) yang terkait dengan nilai pengamatan Yi harus terdistribusi secara normal. Jika nilai residual terdistribusi secara normal, maka nilai Yi pun akan berdistribusi normal. Apabila ukuran sampel dan varians sama, maka uji ANOVA sangat tangguh terhadap asumsi ini. Dua uji yang umum digunakan adalah uji Shapiro-Wilk dan uji Jarque-Bera.

Hipotesis

Uji Shapiro-Wilk dan Uji Jarque-Bera:

  • \(H_0\): Distribusi galat (residuals) adalah normal.
  • \(H_1\): Distribusi galat (residuals) tidak normal.

Rumus Uji Shapiro-Wilk

\(T3 = \frac {1}{D} \left( \sum_{i=1}^n a_i (X_{n-i+1} - X_i) \right)^2\)

\(D = \sum_{i=1}^n (X_i - \bar{X})^2\)

\(G = b_n + c_n \ln \left( \frac{T3 - d_n}{1 - T3} \right)\)

Keterangan:

  • \(G\) = Identik dengan nilai Z distribusi normal

  • \(b_n\), \(c_n\), \(d_n\) = Konversi Statistik Shapiro-Wilk Pendekatan Distribusi Normal

  • \(a_i\) = Koefisien test Shapiro Wilk

  • \(X_{n-i+1}\) = Angka ke \(n-i+1\) pada data

  • \(X_i\) = Angka ke \(i\) pada data

  • \(\bar{X}\) = Rata-rata data

Interpretasi

Jika nilai \(T3\) lebih besar dari nilai tabel Shapiro Wilk, maka distribusi data normal

Rumus Uji Jarque-Bera

\(S = \frac{\frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^3}{\left( \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2 \right)^{3/2}}\)

\(K = \frac{\left( \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2 \right)^2}{\frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^4}\)

\(JB = \frac{n}{6} \left( S^2 + \frac{(K - 3)^2}{4} \right)\)

Keterangan:

  • \(JB\) adalah statistik uji Jarque-Bera.

  • \(n\) adalah ukuran sampel.

  • \(S\) adalah skewness dari data.

  • \(K\) adalah kurtosis dari data.

Interpretasi

Jika nilai \(JB\) lebih besar dari nilai tabel distribusi chi-squared, maka kita menolak hipotesis nol bahwa data berdistribusi normal.

2.1.2 Uji Homogenitas Ragam Galat

Uji Homogenitas berbeda dengan uji normalitas meskipun sama-sama digunakan sebagai syarat dalam uji parametris. Letak perbedannya adalah, jika uji normalitas diperlukan pada semua uji parametris, maka uji homogenitas tidak selalu digunakan. Uji homogenitas hanya digunakan pada uji parametris yang menguji perbedaan antara kedua kelompok atau beberapa kelompok yang berbeda subjeknya atau sumber datanya. Oleh karena itu, uji homogenitas diperlukan sebagai asumsi dari uji independen t test dan uji Anova. Sedangkan pada uji regresi linear, homogenitas tidak diperlukan sebagai syarat sebab uji regresi linear tidak menguji perbedaan beberapa kelompok. Ragam bernilai yang sama untuk setiap amatan pada faktor sama. Dapat duji secara grafis (Plot Fitted Value vs Res.) maupun uji statistik (Breusch-Pagan, Levene) Apabila terlanggar, pendugaan paramater menjadi bias.

Hipotesis

\(H_0: \sigma^2_1 = \sigma^2_2 = \ldots = \sigma^2_p \quad \text{(ragam galat homogen)}\)

\(H_1: \sigma^2_i \neq \sigma^2_j \quad \text{untuk paling tidak satu pasang } i,j \quad \text{(ragam galat tidak homogen)}\)

Uji Breusch-Pagan digunakan untuk menguji adanya heteroskedastisitas dalam model regresi linier. Hipotesis nol (H0) adalah bahwa varians residual adalah konstan (homoskedastisitas).

Rumus Breusch-Pagan

\(y_i = \beta_0 + \beta_1 x_{i1} + \beta_2 x_{i2} + \ldots + \beta_k x_{ik} + u_i\)

\(u_i^2 = \alpha_0 + \alpha_1 x_{i1} + \alpha_2 x_{i2} + \ldots + \alpha_k x_{ik} + v_i\)

\(LM = \frac{n \cdot R^2}{2}\)

Keterangan:

  • \(n\) adalah jumlah observasi.

  • \(R^2\) adalah koefisien determinasi dari regresi kedua.

Interpretasi

  • Nilai \(LM\) dibandingkan dengan nilai kritis dari distribusi chi-squared (χ²) dengan derajat kebebasan sebesar jumlah prediktor (k).

  • Jika \(LM\) lebih besar dari nilai kritis, tolak H0 (indikasi adanya heteroskedastisitas).

Uji Levene digunakan untuk menguji kesamaan varians di antara kelompok-kelompok dalam data. Hipotesis nol (H0) adalah bahwa semua kelompok memiliki varians yang sama.

Rumus Levene

\(Z_{ij} = |Y_{ij} - \tilde{Y}_i|\)

\(Z_{ij} = \alpha + \beta_i G_i + e_{ij}\)

\(W = \frac{(N - k)}{(k - 1)} \frac{\sum_{i=1}^{k} n_i (Z_{i\cdot} - Z_{\cdot\cdot})^2}{\sum_{i=1}^{k} \sum_{j=1}^{n_i} (Z_{ij} - Z_{i\cdot})^2}\)

Keterangan:

  • \(G_i\) adalah variabel dummy untuk kelompok ke-i.

  • \(e_{ij}\) adalah kesalahan (error) dalam regresi.

  • \(Y_{ij}\) adalah nilai ke-j dalam kelompok ke-i.

  • \(\tilde{Y}_i\) adalah median dari kelompok ke-i (atau bisa menggunakan rata-rata).

  • \(N\) adalah total jumlah observasi.

  • \(k\) adalah jumlah kelompok.

  • \(n_i\) adalah jumlah observasi dalam kelompok ke-i.

  • \(Z_{i\cdot}\) adalah rata-rata deviasi dalam kelompok ke-i.

  • \(Z_{\cdot\cdot}\) adalah rata-rata deviasi keseluruhan.

Interpretasi

  • Nilai \(W\) dibandingkan dengan nilai kritis dari distribusi F dengan derajat kebebasan \((k-1, N-k)\).
  • Jika \(W\) lebih besar dari nilai kritis, tolak H0 (indikasi adanya perbedaan varians).

2.2 Analysis of Variance(ANOVA)

2.2.1 ANOVA One-Way

ANOVA One-Way yaitu analisis yang melibatkan hanya satu peubah bebas. Dinamakan ANOVA One-Way, karena analisisnya menggunakan varians dan data hasil pengamatan merupakan pengaruh satu faktor. Tujuan dari uji analisis ini adalah untuk membandingkan lebih dari dua rata-rata.

Hipotesis

  • \(H_0\): \(\mu_1 = \mu_2 = ... =\mu_p\) (tidak ada perbedaan antara perlakuan).
  • \(H_1\): Setidaknya terdapat \(\mu_i\) yang berbeda(ada perbedaan antara perlakuan).

Perhitungan Manual

  1. Faktor Koreksi (FK)

\(FK = \frac{\left( \sum_{i=1}^{p} \sum_{j=1}^{r} Y_{ij} \right)^2}{pr}\)

  1. Jumlah Kuadrat Total (JKT)

\(JKT = \sum_{i=1}^{p} \sum_{j=1}^{r} Y_{ij}^2 - FK\)

  1. Jumlah Kuadrat Perlakuan (JKP)

\(JKP = \sum_{i=1}^{p} \frac{\sum_{j=1}^{r} Y_{ij}^2}{r} - FK\)

  1. Jumlah Kuadrat Galat (JKG)

\(JKG = JKT - JKP\)

  1. Kuadrat Tengah Perlakuan (KTP)

\(KTP = \frac{JKP}{p-1}\)

  1. Kuadrat Tengah Galat (KTG)

\(KTG = \frac{JKG}{p(r-1)}\)

  1. Statistik F Hitung (Fhit)

\(F_{hit} = \frac{KTP}{KTG}\) \(F_{tabel} = F_{db1, db2}\)

Keterangan:

  • \(p\) = perlakuan
  • \(r\) = ulangan

Tolak H0 jika:

\(F_{hit} > F_{tabel}\) atau \(\text{p-value} < \alpha\)

2.2.2 ANOVA Two-Way

ANOVA Two-Way yaitu pengujian ANOVA yang didasarkan pada pengamatan 2 kriteria. Setiap kriteria dalam pengujian ANOVA mempunyai level. Tujuan dan pengujian ANOVA dua jalur ini adalah untuk mengetahui apakah ada pengaruh dan berbagai kriteria yang diuji terhadap hasil yang diinginkan.Tujuan dari pengujian ANOVA dua jalur adalah untuk mengetahui apakah ada pengaruh dari berbagai kriteria yang diuji terhadap hasil yang diinginkan. (Furqon. 2009).

Hipotesis Perlakuan

  • \(H_0\): \(\alpha_1 = \alpha_2 = ... =\alpha_p\) (tidak ada perbedaan antara perlakuan).
  • \(H_1\): Setidaknya terdapat \(\alpha_i\) yang berbeda(ada perbedaan antara perlakuan).

Hipotesis Kelompok

  • \(H_0\): \(\beta_1 = \beta_2 = ... =\beta_p\) (tidak ada perbedaan antara perlakuan).
  • \(H_1\): Setidaknya terdapat \(\beta_i\) yang berbeda(ada perbedaan antara perlakuan).

Perhitungan Manual

  1. Faktor Koreksi (FK)

\(FK = \frac{\left( \sum_{i=1}^{p} \sum_{j=1}^{r} Y_{ij} \right)^2}{pr}\)

  1. Jumlah Kuadrat Total (JKT)

\(JKT = \sum_{i=1}^{p} \sum_{j=1}^{r} Y_{ij}^2 - FK\)

  1. Jumlah Kuadrat Perlakuan (JKP)

\(JKP = \sum_{i=1}^{p} \frac{\left( \sum_{j=1}^{r} Y_{ij} \right)^2}{r} - FK\)

  1. Jumlah Kuadrat Kelompok (JKK)

\(JKK = \sum_{j=1}^{r} \frac{\left( \sum_{i=1}^{p} Y_{ij} \right)^2}{p} - FK\)

  1. Jumlah Kuadrat Galat (JKG)

\(JKG = JKT - JKP - JKK\)

  1. Kuadrat Tengah Perlakuan (KTP)

\(KTP = \frac{JKP}{p-1}\)

  1. Kuadrat Tengah Kelompok (KTK)

\(KTK = \frac{JKK}{r-1}\)

  1. Kuadrat Tengah Galat (KTG)

\(KTG = \frac{JKG}{(p-1)(r-1)}\)

  1. Statistik F Hitung untuk Perlakuan (Fhit)

\(F_{hit(\text{perlakuan})} = \frac{KTP}{KTG}\)

  1. Statistik F Hitung untuk Kelompok (Fhit)

\(F_{hit(\text{kelompok})} = \frac{KTK}{KTG}\) \(F_{tabel} = F_{db1, db2}\)

Keterangan:

  • \(p\) = perlakuan
  • \(r\) = kelompok

Tolak H0 jika:

\(F_{hit} > F_{tabel}\) atau \(\text{p-value} < \alpha\)

2.3 Uji Lanjut

Penggunaan uji lanjut digunakan setelah uji F (Tabel ANOVA) apabila keputusannya H0 ditolak. Uji ini digunakan untuk mengetahui pasangan perlakuan mana yang mempunyai nilai tengah yang berbeda.

Beberapa metode yang dapat digunakan untuk membandingkan nilai tengah perlakuan:

1.Fisher’s LSD (Least Significance Difference) Test: Uji BNT (Beda Nyata Terkecil)

2.Tukey’s HSD (Honestly Significance Difference) Test: Uji BNJ (Beda Nyata Jujur)

Ada metode lainnya, misalnya metode Duncan, Dunnet, Newman Keuls, LSD, dll.

Hipotesis

\(H_0: \mu_i - \mu_{i'} = 0\)

\(H_1: \mu_i - \mu_{i'} \neq 0\)

Rumus BNT (Beda Nyata Terkecil)

\(BNT = t_{\alpha/2, N-k} \sqrt{KTG \left( \frac{1}{n_i} + \frac{1}{n_{i'}} \right)}\)

Rumus BNJ (Beda Nyata Jujur)

\(BNJ = q_{\alpha/2, k, N-k} \sqrt{\frac{KTG}{2} \left( \frac{1}{n_i} + \frac{1}{n_{i'}} \right)}\)

Keterangan:

  • \(\mu_i\): Rata-rata kelompok \(i\)

  • \(\mu_{i'}\): Rata-rata kelompok \(i'\)

  • \(t_{\alpha/2, N-k}\): Nilai t kritis untuk uji dua sisi dengan derajat kebebasan \(N-k\)

  • \(q_{\alpha/2, k, N-k}\): Nilai q kritis untuk uji Tukey dengan derajat kebebasan \(N-k\) dan \(k\) kelompok

  • \(KTG\): Kuadrat tengah galat (mean square error)

  • \(n_i\): Jumlah sampel dalam kelompok \(i\)

  • \(n_{i'}\): Jumlah sampel dalam kelompok \(i'\)

  • \(N\): Total jumlah observasi

  • \(k\): Jumlah kelompok

3 SOURCE CODE

3.1 Library

3.1.1 Asumsi Normalitas Galat

> library(tseries)

3.1.2 Asumsi Homogenitas Galat

> library(lmtest)
> library(car)

3.1.3 ANOVA

> library(AOV1R)

3.1.4 Uji Lanjut

> library(agricolae)

3.2 Contoh Data 1

Seorang peneliti ingin mengetahui apakah ada perbedaan yang signifikan dalam jumlah jam belajar per minggu di antara tiga kelompok siswa yang menggunakan metode pembelajaran yang berbeda. Data jumlah jam belajar per minggu dikumpulkan dari tiga kelompok siswa, masing-masing kelompok terdiri dari 10 siswa.

> grupA <- c(8, 7, 6, 9, 7, 8, 9, 8, 6, 7)
> grupB <- c(6, 5, 4, 5, 6, 5, 4, 5, 6, 5)
> grupC <- c(7, 8, 7, 8, 9, 7, 8, 9, 8, 9)
> 
> data <- data.frame(
+   nilai = c(grupA, grupB, grupC),
+   grup = factor(rep(c("A", "B", "C"), each = 10))
+ )
> modeldata <- lm(data$nilai ~ data$grup)

3.2.1 Asumsi Normalitas Galat

> shapiro.test(modeldata$residuals)

    Shapiro-Wilk normality test

data:  modeldata$residuals
W = 0.95082, p-value = 0.1778
> jarque.bera.test(modeldata$residuals)

    Jarque Bera Test

data:  modeldata$residuals
X-squared = 1.0964, df = 2, p-value = 0.578

3.2.2 Asumsi Homogenitas Ragam Galat

> bptest(modeldata)

    studentized Breusch-Pagan test

data:  modeldata
BP = 3.2491, df = 2, p-value = 0.197
> leveneTest(nilai ~ grup, data = data) 
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  2  1.6027 0.2199
      27               

3.2.3 ANOVA One-Way

> anova(modeldata)
Analysis of Variance Table

Response: data$nilai
          Df Sum Sq Mean Sq F value    Pr(>F)    
data$grup  2 48.067 24.0333  30.322 1.249e-07 ***
Residuals 27 21.400  0.7926                      
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

3.3 Contoh Data 2

> Lokasi <- c(rep("A", 15), rep("B", 15), rep("C", 15))
> Zona <- c(rep("Pinggir", 5), rep("Tengah", 5), rep("Dalam", 5), rep("Pinggir", 5), rep("Tengah", 5), rep("Dalam", 5), rep("Pinggir", 5), rep("Tengah", 5), rep("Dalam", 5))
> Kerapatan <- c(15,18,21,14,17,23,26,19,18,21,25,27,29,23,26,25,27,31,29,26,21,23,25,19,24,26,29,31,27,25,12,13,15,11,10,17,19,21,18,16,9,8,11,7,9)
> 
> Lokasi <- factor(Lokasi)
> Zona <- factor(Zona)
> 
> 
> data2 <- data.frame(Lokasi, Zona, Kerapatan)
> modeldata2 <- lm(Kerapatan ~ Lokasi + Zona, data2)

3.3.1 ANOVA Two-Way

> Kerapatan.mod <- aov(Kerapatan ~ Lokasi + Zona, data = data2)
> summary(Kerapatan.mod)
            Df Sum Sq Mean Sq F value Pr(>F)    
Lokasi       2 1268.8   634.4  36.998  8e-10 ***
Zona         2   32.5    16.3   0.949  0.396    
Residuals   40  685.9    17.1                   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

3.3.2 Uji Lanjut

> bnt1 <- LSD.test(modeldata2, "Lokasi", alpha = 0,05)
> bnt1$groups
  Kerapatan groups
B  25.86667      a
A  21.46667      a
C  13.06667      b
> bnt1$means
  Kerapatan      std  r       se  LCL UCL Min Max  Q25 Q50  Q75
A  21.46667 4.580497 15 1.069164 -Inf Inf  14  29 18.0  21 25.5
B  25.86667 3.377799 15 1.069164 -Inf Inf  19  31 24.5  26 28.0
C  13.06667 4.350151 15 1.069164 -Inf Inf   7  21  9.5  12 16.5

4 HASIL DAN PEMBAHASAN

4.1 Asumsi Normalitas Galat

Pada Contoh Data 1, berdasarkan hasil uji Shapiro Wilk dan Jarque Bera, diperoleh nilai p-value sebesar 0,1778 dan 0,578. Karena p-value > \(\alpha\), dengan \(\alpha\) = 0,05 maka keputusan terima H0 yaitu pengamatan menyebar normal.

4.2 Asumsi Homogenitas Ragam Galat

Pada Contoh Data 1, berdasarkan hasil uji Breusch Pagan dan Levene, diperoleh nilai p-value sebesar 0,197 dan 0,2199. Karena p-value > \(\alpha\), dengan \(\alpha\) = 0,05 maka keputusan terima H0 yaitu ragam galat homogen.

4.3 ANOVA One-Way

Berdasarkan hasil uji ANOVA, diperoleh nilai p-value sebesar 1.249e-07. Karena p-value < \(\alpha\), dengan \(\alpha\) = 0,05 maka keputusan tolak H0 yaitu terdapat perbedaan signifikan antara perlakuan

4.4 Anova Two-Way

Berdasarkan hasil uji ANOVA, diperoleh nilai p-value sebesar 8e-10, 0.0396. Dengan \(\alpha\) = 0,05 maka keputusan tolak H0 untuk Lokasi dan Lokasi dengan Zona yaitu terdapat perbedaan signifikan antar Lokasi, maka keputusan terima H0 untuk Zona yaitu tidak terdapat perbedaan antar Zona.

4.5 Uji Lanjut

Berdasarkan hasil uji lanjut BNT, diketahui Lokasi A dan Lokasi B tidak berbeda secara signifikan dalam hal kerapatan, sedangkan Lokasi C memiliki perbedaan yang signifikan terhadap Lokasi A dan Lokasi B terhadap kerapatan.

5 KESIMPULAN

6 DAFTAR PUSTAKA

Shaw, R. G., & Mitchell-Olds, T. (1993). ANOVA for unbalanced data: An overview. Ecology, 74(6), 1638–1645.

Elvira Mustikawati Putri Hermanto, Muhammad Athoillah, Wanda Nur Hamidah, & Dimas Pramana Putra. (2021). Pelatihan Penggunaan software R Untuk Menguji PERBANDINGAN Berganda Dan ASUMSI residual Pada Rancangan Percobaan. J-ABDI: Jurnal Pengabdian Kepada Masyarakat, 1(4), 449–458.

GeeksforGeeks. (2020, July 16). Shapiro–Wilk test in R programming.

Sign in. RPubs. (n.d.). https://rpubs.com/afifahpd/anova