Library RMarkdown:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
1 PENDAHULUAN
1.1 Latar Belakang
Dalam metode analisis dependensi sering kali penelitian dihadapkan pada analisis data yang ingin melihat hubungan antara satu variabel dependen (skala metrik) dan satu atau lebih variabel independen (skala non metrik yang bersifat kategori yang memiliki kategori lebih dari 2 (dua). Maka teknik analisis data yang tepat digunakan adalah Analysis of Variance (ANOVA) (Ghozali, 2016). Analysis of Variance (ANOVA) merupakan model statistik yang digunakan untuk menganalisis perbedaan rata-rata dari beberapa populasi secara simultan (Lind, Marchal, & Wathen, 2018)
2 TINJAUAN PUSTAKA
2.1 Asumsi ANOVA
2.1.1 Uji Normalitas Galat
Uji Normalitas berarti nilai residual (εij) dalam setiap perlakuan (grup) yang terkait dengan nilai pengamatan Yi harus terdistribusi secara normal. Jika nilai residual terdistribusi secara normal, maka nilai Yi pun akan berdistribusi normal. Apabila ukuran sampel dan varians sama, maka uji ANOVA sangat tangguh terhadap asumsi ini. Dua uji yang umum digunakan adalah uji Shapiro-Wilk dan uji Jarque-Bera.
Hipotesis
Uji Shapiro-Wilk dan Uji Jarque-Bera:
- \(H_0\): Distribusi galat (residuals) adalah normal.
- \(H_1\): Distribusi galat (residuals) tidak normal.
Rumus Uji Shapiro-Wilk
\(T3 = \frac {1}{D} \left( \sum_{i=1}^n a_i (X_{n-i+1} - X_i) \right)^2\)
\(D = \sum_{i=1}^n (X_i - \bar{X})^2\)
\(G = b_n + c_n \ln \left( \frac{T3 - d_n}{1 - T3} \right)\)
Keterangan:
\(G\) = Identik dengan nilai Z distribusi normal
\(b_n\), \(c_n\), \(d_n\) = Konversi Statistik Shapiro-Wilk Pendekatan Distribusi Normal
\(a_i\) = Koefisien test Shapiro Wilk
\(X_{n-i+1}\) = Angka ke \(n-i+1\) pada data
\(X_i\) = Angka ke \(i\) pada data
\(\bar{X}\) = Rata-rata data
Interpretasi
Jika nilai \(T3\) lebih besar dari nilai tabel Shapiro Wilk, maka distribusi data normal
Rumus Uji Jarque-Bera
\(S = \frac{\frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^3}{\left( \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2 \right)^{3/2}}\)
\(K = \frac{\left( \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2 \right)^2}{\frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^4}\)
\(JB = \frac{n}{6} \left( S^2 + \frac{(K - 3)^2}{4} \right)\)
Keterangan:
\(JB\) adalah statistik uji Jarque-Bera.
\(n\) adalah ukuran sampel.
\(S\) adalah skewness dari data.
\(K\) adalah kurtosis dari data.
Interpretasi
Jika nilai \(JB\) lebih besar dari nilai tabel distribusi chi-squared, maka kita menolak hipotesis nol bahwa data berdistribusi normal.
2.1.2 Uji Homogenitas Ragam Galat
Uji Homogenitas berbeda dengan uji normalitas meskipun sama-sama digunakan sebagai syarat dalam uji parametris. Letak perbedannya adalah, jika uji normalitas diperlukan pada semua uji parametris, maka uji homogenitas tidak selalu digunakan. Uji homogenitas hanya digunakan pada uji parametris yang menguji perbedaan antara kedua kelompok atau beberapa kelompok yang berbeda subjeknya atau sumber datanya. Oleh karena itu, uji homogenitas diperlukan sebagai asumsi dari uji independen t test dan uji Anova. Sedangkan pada uji regresi linear, homogenitas tidak diperlukan sebagai syarat sebab uji regresi linear tidak menguji perbedaan beberapa kelompok. Ragam bernilai yang sama untuk setiap amatan pada faktor sama. Dapat duji secara grafis (Plot Fitted Value vs Res.) maupun uji statistik (Breusch-Pagan, Levene) Apabila terlanggar, pendugaan paramater menjadi bias.
Hipotesis
\(H_0: \sigma^2_1 = \sigma^2_2 = \ldots = \sigma^2_p \quad \text{(ragam galat homogen)}\)
\(H_1: \sigma^2_i \neq \sigma^2_j \quad \text{untuk paling tidak satu pasang } i,j \quad \text{(ragam galat tidak homogen)}\)
Uji Breusch-Pagan digunakan untuk menguji adanya heteroskedastisitas dalam model regresi linier. Hipotesis nol (H0) adalah bahwa varians residual adalah konstan (homoskedastisitas).
Rumus Breusch-Pagan
\(y_i = \beta_0 + \beta_1 x_{i1} + \beta_2 x_{i2} + \ldots + \beta_k x_{ik} + u_i\)
\(u_i^2 = \alpha_0 + \alpha_1 x_{i1} + \alpha_2 x_{i2} + \ldots + \alpha_k x_{ik} + v_i\)
\(LM = \frac{n \cdot R^2}{2}\)
Keterangan:
\(n\) adalah jumlah observasi.
\(R^2\) adalah koefisien determinasi dari regresi kedua.
Interpretasi
Nilai \(LM\) dibandingkan dengan nilai kritis dari distribusi chi-squared (χ²) dengan derajat kebebasan sebesar jumlah prediktor (k).
Jika \(LM\) lebih besar dari nilai kritis, tolak H0 (indikasi adanya heteroskedastisitas).
Uji Levene digunakan untuk menguji kesamaan varians di antara kelompok-kelompok dalam data. Hipotesis nol (H0) adalah bahwa semua kelompok memiliki varians yang sama.
Rumus Levene
\(Z_{ij} = |Y_{ij} - \tilde{Y}_i|\)
\(Z_{ij} = \alpha + \beta_i G_i + e_{ij}\)
\(W = \frac{(N - k)}{(k - 1)} \frac{\sum_{i=1}^{k} n_i (Z_{i\cdot} - Z_{\cdot\cdot})^2}{\sum_{i=1}^{k} \sum_{j=1}^{n_i} (Z_{ij} - Z_{i\cdot})^2}\)
Keterangan:
\(G_i\) adalah variabel dummy untuk kelompok ke-i.
\(e_{ij}\) adalah kesalahan (error) dalam regresi.
\(Y_{ij}\) adalah nilai ke-j dalam kelompok ke-i.
\(\tilde{Y}_i\) adalah median dari kelompok ke-i (atau bisa menggunakan rata-rata).
\(N\) adalah total jumlah observasi.
\(k\) adalah jumlah kelompok.
\(n_i\) adalah jumlah observasi dalam kelompok ke-i.
\(Z_{i\cdot}\) adalah rata-rata deviasi dalam kelompok ke-i.
\(Z_{\cdot\cdot}\) adalah rata-rata deviasi keseluruhan.
Interpretasi
- Nilai \(W\) dibandingkan dengan nilai kritis dari distribusi F dengan derajat kebebasan \((k-1, N-k)\).
- Jika \(W\) lebih besar dari nilai kritis, tolak H0 (indikasi adanya perbedaan varians).
2.2 Analysis of Variance(ANOVA)
2.2.1 ANOVA One-Way
ANOVA One-Way yaitu analisis yang melibatkan hanya satu peubah bebas. Dinamakan ANOVA One-Way, karena analisisnya menggunakan varians dan data hasil pengamatan merupakan pengaruh satu faktor. Tujuan dari uji analisis ini adalah untuk membandingkan lebih dari dua rata-rata.
Hipotesis
- \(H_0\): \(\mu_1 = \mu_2 = ... =\mu_p\) (tidak ada perbedaan antara perlakuan).
- \(H_1\): Setidaknya terdapat \(\mu_i\) yang berbeda(ada perbedaan antara perlakuan).
Perhitungan Manual
- Faktor Koreksi (FK)
\(FK = \frac{\left( \sum_{i=1}^{p} \sum_{j=1}^{r} Y_{ij} \right)^2}{pr}\)
- Jumlah Kuadrat Total (JKT)
\(JKT = \sum_{i=1}^{p} \sum_{j=1}^{r} Y_{ij}^2 - FK\)
- Jumlah Kuadrat Perlakuan (JKP)
\(JKP = \sum_{i=1}^{p} \frac{\sum_{j=1}^{r} Y_{ij}^2}{r} - FK\)
- Jumlah Kuadrat Galat (JKG)
\(JKG = JKT - JKP\)
- Kuadrat Tengah Perlakuan (KTP)
\(KTP = \frac{JKP}{p-1}\)
- Kuadrat Tengah Galat (KTG)
\(KTG = \frac{JKG}{p(r-1)}\)
- Statistik F Hitung (Fhit)
\(F_{hit} = \frac{KTP}{KTG}\) \(F_{tabel} = F_{db1, db2}\)
Keterangan:
- \(p\) = perlakuan
- \(r\) = ulangan
Tolak H0 jika:
\(F_{hit} > F_{tabel}\) atau \(\text{p-value} < \alpha\)
2.2.2 ANOVA Two-Way
ANOVA Two-Way yaitu pengujian ANOVA yang didasarkan pada pengamatan 2 kriteria. Setiap kriteria dalam pengujian ANOVA mempunyai level. Tujuan dan pengujian ANOVA dua jalur ini adalah untuk mengetahui apakah ada pengaruh dan berbagai kriteria yang diuji terhadap hasil yang diinginkan.Tujuan dari pengujian ANOVA dua jalur adalah untuk mengetahui apakah ada pengaruh dari berbagai kriteria yang diuji terhadap hasil yang diinginkan. (Furqon. 2009).
Hipotesis Perlakuan
- \(H_0\): \(\alpha_1 = \alpha_2 = ... =\alpha_p\) (tidak ada perbedaan antara perlakuan).
- \(H_1\): Setidaknya terdapat \(\alpha_i\) yang berbeda(ada perbedaan antara perlakuan).
Hipotesis Kelompok
- \(H_0\): \(\beta_1 = \beta_2 = ... =\beta_p\) (tidak ada perbedaan antara perlakuan).
- \(H_1\): Setidaknya terdapat \(\beta_i\) yang berbeda(ada perbedaan antara perlakuan).
Perhitungan Manual
- Faktor Koreksi (FK)
\(FK = \frac{\left( \sum_{i=1}^{p} \sum_{j=1}^{r} Y_{ij} \right)^2}{pr}\)
- Jumlah Kuadrat Total (JKT)
\(JKT = \sum_{i=1}^{p} \sum_{j=1}^{r} Y_{ij}^2 - FK\)
- Jumlah Kuadrat Perlakuan (JKP)
\(JKP = \sum_{i=1}^{p} \frac{\left( \sum_{j=1}^{r} Y_{ij} \right)^2}{r} - FK\)
- Jumlah Kuadrat Kelompok (JKK)
\(JKK = \sum_{j=1}^{r} \frac{\left( \sum_{i=1}^{p} Y_{ij} \right)^2}{p} - FK\)
- Jumlah Kuadrat Galat (JKG)
\(JKG = JKT - JKP - JKK\)
- Kuadrat Tengah Perlakuan (KTP)
\(KTP = \frac{JKP}{p-1}\)
- Kuadrat Tengah Kelompok (KTK)
\(KTK = \frac{JKK}{r-1}\)
- Kuadrat Tengah Galat (KTG)
\(KTG = \frac{JKG}{(p-1)(r-1)}\)
- Statistik F Hitung untuk Perlakuan (Fhit)
\(F_{hit(\text{perlakuan})} = \frac{KTP}{KTG}\)
- Statistik F Hitung untuk Kelompok (Fhit)
\(F_{hit(\text{kelompok})} = \frac{KTK}{KTG}\) \(F_{tabel} = F_{db1, db2}\)
Keterangan:
- \(p\) = perlakuan
- \(r\) = kelompok
Tolak H0 jika:
\(F_{hit} > F_{tabel}\) atau \(\text{p-value} < \alpha\)
2.3 Uji Lanjut
Penggunaan uji lanjut digunakan setelah uji F (Tabel ANOVA) apabila keputusannya H0 ditolak. Uji ini digunakan untuk mengetahui pasangan perlakuan mana yang mempunyai nilai tengah yang berbeda.
Beberapa metode yang dapat digunakan untuk membandingkan nilai tengah perlakuan:
1.Fisher’s LSD (Least Significance Difference) Test: Uji BNT (Beda Nyata Terkecil)
2.Tukey’s HSD (Honestly Significance Difference) Test: Uji BNJ (Beda Nyata Jujur)
Ada metode lainnya, misalnya metode Duncan, Dunnet, Newman Keuls, LSD, dll.
Hipotesis
\(H_0: \mu_i - \mu_{i'} = 0\)
\(H_1: \mu_i - \mu_{i'} \neq 0\)
Rumus BNT (Beda Nyata Terkecil)
\(BNT = t_{\alpha/2, N-k} \sqrt{KTG \left( \frac{1}{n_i} + \frac{1}{n_{i'}} \right)}\)
Rumus BNJ (Beda Nyata Jujur)
\(BNJ = q_{\alpha/2, k, N-k} \sqrt{\frac{KTG}{2} \left( \frac{1}{n_i} + \frac{1}{n_{i'}} \right)}\)
Keterangan:
\(\mu_i\): Rata-rata kelompok \(i\)
\(\mu_{i'}\): Rata-rata kelompok \(i'\)
\(t_{\alpha/2, N-k}\): Nilai t kritis untuk uji dua sisi dengan derajat kebebasan \(N-k\)
\(q_{\alpha/2, k, N-k}\): Nilai q kritis untuk uji Tukey dengan derajat kebebasan \(N-k\) dan \(k\) kelompok
\(KTG\): Kuadrat tengah galat (mean square error)
\(n_i\): Jumlah sampel dalam kelompok \(i\)
\(n_{i'}\): Jumlah sampel dalam kelompok \(i'\)
\(N\): Total jumlah observasi
\(k\): Jumlah kelompok
3 SOURCE CODE
3.1 Library
3.2 Contoh Data 1
Seorang peneliti ingin mengetahui apakah ada perbedaan yang signifikan dalam jumlah jam belajar per minggu di antara tiga kelompok siswa yang menggunakan metode pembelajaran yang berbeda. Data jumlah jam belajar per minggu dikumpulkan dari tiga kelompok siswa, masing-masing kelompok terdiri dari 10 siswa.
> grupA <- c(8, 7, 6, 9, 7, 8, 9, 8, 6, 7)
> grupB <- c(6, 5, 4, 5, 6, 5, 4, 5, 6, 5)
> grupC <- c(7, 8, 7, 8, 9, 7, 8, 9, 8, 9)
>
> data <- data.frame(
+ nilai = c(grupA, grupB, grupC),
+ grup = factor(rep(c("A", "B", "C"), each = 10))
+ )
> modeldata <- lm(data$nilai ~ data$grup)
3.2.1 Asumsi Normalitas Galat
3.3 Contoh Data 2
> Lokasi <- c(rep("A", 15), rep("B", 15), rep("C", 15))
> Zona <- c(rep("Pinggir", 5), rep("Tengah", 5), rep("Dalam", 5), rep("Pinggir", 5), rep("Tengah", 5), rep("Dalam", 5), rep("Pinggir", 5), rep("Tengah", 5), rep("Dalam", 5))
> Kerapatan <- c(15,18,21,14,17,23,26,19,18,21,25,27,29,23,26,25,27,31,29,26,21,23,25,19,24,26,29,31,27,25,12,13,15,11,10,17,19,21,18,16,9,8,11,7,9)
>
> Lokasi <- factor(Lokasi)
> Zona <- factor(Zona)
>
>
> data2 <- data.frame(Lokasi, Zona, Kerapatan)
> modeldata2 <- lm(Kerapatan ~ Lokasi + Zona, data2)
3.3.1 ANOVA Two-Way
3.3.2 Uji Lanjut
> bnt1 <- LSD.test(modeldata2, "Lokasi", alpha = 0,05)
> bnt1$groups
Kerapatan groups
B 25.86667 a
A 21.46667 a
C 13.06667 b
> bnt1$means
Kerapatan std r se LCL UCL Min Max Q25 Q50 Q75
A 21.46667 4.580497 15 1.069164 -Inf Inf 14 29 18.0 21 25.5
B 25.86667 3.377799 15 1.069164 -Inf Inf 19 31 24.5 26 28.0
C 13.06667 4.350151 15 1.069164 -Inf Inf 7 21 9.5 12 16.5
4 HASIL DAN PEMBAHASAN
4.1 Asumsi Normalitas Galat
Pada Contoh Data 1, berdasarkan hasil uji Shapiro Wilk dan Jarque Bera, diperoleh nilai p-value sebesar 0,1778 dan 0,578. Karena p-value > \(\alpha\), dengan \(\alpha\) = 0,05 maka keputusan terima H0 yaitu pengamatan menyebar normal.
4.2 Asumsi Homogenitas Ragam Galat
Pada Contoh Data 1, berdasarkan hasil uji Breusch Pagan dan Levene, diperoleh nilai p-value sebesar 0,197 dan 0,2199. Karena p-value > \(\alpha\), dengan \(\alpha\) = 0,05 maka keputusan terima H0 yaitu ragam galat homogen.
4.3 ANOVA One-Way
Berdasarkan hasil uji ANOVA, diperoleh nilai p-value sebesar 1.249e-07. Karena p-value < \(\alpha\), dengan \(\alpha\) = 0,05 maka keputusan tolak H0 yaitu terdapat perbedaan signifikan antara perlakuan
4.4 Anova Two-Way
Berdasarkan hasil uji ANOVA, diperoleh nilai p-value sebesar 8e-10, 0.0396. Dengan \(\alpha\) = 0,05 maka keputusan tolak H0 untuk Lokasi dan Lokasi dengan Zona yaitu terdapat perbedaan signifikan antar Lokasi, maka keputusan terima H0 untuk Zona yaitu tidak terdapat perbedaan antar Zona.
4.5 Uji Lanjut
Berdasarkan hasil uji lanjut BNT, diketahui Lokasi A dan Lokasi B tidak berbeda secara signifikan dalam hal kerapatan, sedangkan Lokasi C memiliki perbedaan yang signifikan terhadap Lokasi A dan Lokasi B terhadap kerapatan.
5 KESIMPULAN
Dalam perhitungan contoh data 1 diketahui bahwa melalui uji Asumsi Normalitas Galat dan Asumsi Homogenitas Ragam Galat diketahui bahwa pengamatan menyebar normal dan ragam galat homogen, dan berdasarkan perhitungan ANOVA One-Way diketahui terdapat perbedaan signifikan antara perlakuan.
Dalam perhitungan contoh data 2 yaitu Anova Two-Way diketahui bahwa terdapat perbedaan signifikan antar Lokasi tetapi tidak terdapat perbedaan antar Zona, dengan melanjutkan perhitungan ke Uji Lanjut untuk Lokasi, diketahui berdasarkan perhitungan BNT diketahui bahwa Lokasi A dan Lokasi B tidak berbeda secara signifikan dalam hal kerapatan, sedangkan Lokasi C memiliki perbedaan yang signifikan terhadap Lokasi A dan Lokasi B terhadap kerapatan.
6 DAFTAR PUSTAKA
Shaw, R. G., & Mitchell-Olds, T. (1993). ANOVA for unbalanced data: An overview. Ecology, 74(6), 1638–1645.
Elvira Mustikawati Putri Hermanto, Muhammad Athoillah, Wanda Nur Hamidah, & Dimas Pramana Putra. (2021). Pelatihan Penggunaan software R Untuk Menguji PERBANDINGAN Berganda Dan ASUMSI residual Pada Rancangan Percobaan. J-ABDI: Jurnal Pengabdian Kepada Masyarakat, 1(4), 449–458.
GeeksforGeeks. (2020, July 16). Shapiro–Wilk test in R programming.
Sign in. RPubs. (n.d.). https://rpubs.com/afifahpd/anova