1 PENDAHULUAN
1.1 Latar Belakang
Dalam penelitian kesehatan, seringkali dijumpai lebih dari dua kelompok sampel yang ingin dibandingkan untuk mengetahui perbedaan rata-rata. Dalam situais seperti ini, menggunakan t-test akan merepotkan dan menghabiskan banyak tenaga, waktu, dan biaya. Jika suatu penelitian mempunyai sampel lebih dari dua, sebaiknya menggunakan Analisis Varians (ANOVA) untuk menghindari kesalahan dalam perhitungan. Terdapat dua jenis ANOVA, yaitu ANOVA satu arah (one-way ANOVA) dan ANOVA dua arah (two-way ANOVA). Anova satu arah hanya memiliki satu variabel independen. Sedangkan ANOVA dua arah memiliki dua variabel independen. Dalam tulisan ini, akan dijelaskan mengenai perhitungan-perhitungan ANOVA dan Asumsi dengan Software RStudio, khususnya pada teknik ANOVA satu arah (one-way ANOVA).
2 TINJAUAN PUSTAKA
2.1 Asumsi Analisis Varian
Uji ANOVA memiliki asumsi yang harus terpenuhi yaitu uji normalitas galat dan uji homogenitas varians
2.1.1 Uji Normalitas Galat
Uji normalitas digunakan untuk mengetahui apakah variabel independen
dan variabel dependen berdoistribusi normal atau tidak. Jika nilai
signifikansi (p-value) > , maka data berdistribusi
normal.
Hipotesis
\[H_{0}: Pengamatan~menyebar~Normal\] \[H_{1}: Pengamatan~tidak~menyebar~Normal\]
Pengujian Statistika
- Uji Shapiro-Wilk
- Uji Jarque-Bera
2.1.2 Uji Homogenitas Varians
Uji homogenitas digunakan untuk mengetahui apakah varian populasi
sama atau tidak. Jika nilai signifikansi (p-value) > , maka
varian kelompok data homogen.
Hipotesis
\[H_{0}: Sampel~berasal~dari~populasi~homogen\] \[H_{1}: Sampel~berasal~dari~populasi~tidak~homogen\]
Pengujian Statistika
- Uji Breusch Pagan
- Uji Levene’s Test
2.2 Analisis Varian Satu Arah
Analisis Varian (ANOVA) satu arah yaitu analisis yang melibatkan hanya satu peubah bebas. ANOVA pengembangan lebih lanjut dari uji-t. Uji-t atau uji-z hanya dapat digunakan untuk perbandingan dua kelompok data saja. Sedangkan ANOVA satu arah dapat digunakan untuk lebih dari dua kelompok data. Tujuan ANOVA satu arah adalah untuk membandingkan lebih dari dua rata-rata.
2.2.1 Hipotesis
\[H_{0}: \mu_{1} = \mu_{2} =~...~= \mu_{p}\] \[H_{1}: Salah~satu~pasang~\mu~berbeda\]
2.2.2 Langkah Analisis Varian Satu Arah
Menghitung Derajat Kebebasan
\[db_{p}=p-1\] \[db_{g}=p(n-1)\] \[db_{t}=pn-1\]
Menghitung Jumlah Kuadrat
\[FK=\frac{(\Sigma_{i=1}^{p}\Sigma_{j=1}^{n}Y_{ij})^2}{pn }\] \[JK_t=\Sigma_{i=1}^{p}\Sigma_{j=1}^{n}Y_{ij}^2-FK\] \[JK_p=\frac{\Sigma_{i=1}^{p}(\Sigma_{j=1}^{n}Y_{ij})^2}{n}-FK\] \[JK_{g}=JK_{t}-JK_{p}\]
Menghitung Kuadrat Tengah
\[KT_{p}=\frac{JK_{p}}{db_{p}}\] \[KT_{g}=\frac{JK_{g}}{db_{g}}\]
Menghitung Statistik Uji F
\[F_{hitung}=\frac{KT_{p}}{KT_{g}}\]
Keterangan:
p : banyaknya perlakuan
n :
banyaknya ulangan
Yij : nilai pengamatan pada perlakuan
ke-i ulangan ke-j
dbp : derajat bebas perlakuan
dbg : derajat bebas galat
JKp : jumlah
kuadrat perlakuan
JKg : jumlah kuadrat galat
JKt : jumlah kuadrat total
KTp : kudrat
tengah perlakuan
KTg : kuadrat tengah galat
Fhitung : nilai statistik uji F
2.3 Uji Lanjutan
Uji lanjut adalah uji yang dilakukan apabila keputusan ANOVA tolak
hipotesis nol. Uji lanjut merupakan metode statistik yang digunakan
untuk membandingkan rata-rata antara beberapa kelompok yang independen.
Tujuan utama uji lanjut adalah mengidentifikasi pasangan kelompok yang
memiliki perbedaan rata-rata yang signifikan. Dalam analisis statistika,
terdapat beberapa uji lanjut yang digunakan setelah analisis
varian(ANOVA) seperti Tukey’s HSD Test dan Fisher’s LSD
Test.
Hipotesis
\[H_{0}: \mu_{i}=\mu_{j}\] \[H_{1}: \mu_{i}!=\mu_{j}\]
2.3.1 Tukey’s HSD Test
\[T_{\alpha}=q_{\alpha}(a,f)\sqrt{\frac{MS_{E}}{n}}\]
2.3.2 Fisher’s LSD Test
\[LSD=t_{\alpha/2,N-a}\sqrt{MS_E{(\frac{1}{n_i}+\frac{1}{n_j})}}\]
3 SOURCE CODE
3.1 Library
> library(dplyr)
> library(tidyr)
> library(tseries)
> library(ggplot2)
> library(car)
> library(lmtest)
> library(multcomp)3.2 Data
Seorang insinyur tertarik untuk menentukan apakah pengaturan daya RF memengaruhi laju etsa, dan dia telah menjalankan eksperimen acak lengkap dengan empat tingkat daya RF (160 W, 180 W, 200 W, dan 220 W) dengan lima ulangan. Analisis Varian untuk menguji adalah \[H_{0}: \mu_{1} = \mu_{2} = \mu_{3} = \mu_{4}\] \[H_{1}: Salah~satu~pasang~\mu~berbeda\]
> dataRF <- data.frame("160" = c(575, 542, 530, 539, 570),
+ "180" = c(565, 593, 590, 579, 610),
+ "200" = c(600, 651, 610, 637, 629),
+ "220" = c(725, 700, 715, 685, 710))
> dataRF
X160 X180 X200 X220
1 575 565 600 725
2 542 593 651 700
3 530 590 610 715
4 539 579 637 685
5 570 610 629 710
> library(dplyr)
> library(tidyr)
> dataRF <- dataRF %>%
+ pivot_longer(cols = everything(),
+ names_to = "Daya.RF", values_to = "Laju.Etsa")
> dataRF$Daya.RF <- as.factor(dataRF$Daya.RF)
> dataRF
# A tibble: 20 × 2
Daya.RF Laju.Etsa
<fct> <dbl>
1 X160 575
2 X180 565
3 X200 600
4 X220 725
5 X160 542
6 X180 593
7 X200 651
8 X220 700
9 X160 530
10 X180 590
11 X200 610
12 X220 715
13 X160 539
14 X180 579
15 X200 637
16 X220 685
17 X160 570
18 X180 610
19 X200 629
20 X220 7103.3 Uji Normalitas
> shapiro.test(dataRF$Laju.Etsa)
Shapiro-Wilk normality test
data: dataRF$Laju.Etsa
W = 0.92953, p-value = 0.1512> library(tseries)
> jarque.bera.test(dataRF$Laju.Etsa)
Jarque Bera Test
data: dataRF$Laju.Etsa
X-squared = 1.4747, df = 2, p-value = 0.4784> library(ggplot2)
> ggplot(dataRF, aes(x = Laju.Etsa)) +
+ geom_histogram(aes(y = ..density..), binwidth = 10,
+ fill = "lightblue", color = "black") +
+ geom_density(color = "red") +
+ labs(x = "Laju Etsa", y = "Density", title = "Histogram dan Kurva Kepadatan")3.4 Uji Homogenitas Varians
> library(car)
> leveneTest(Laju.Etsa ~ Daya.RF, data = dataRF)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 3 0.1959 0.8977
16 > library(lmtest)
> bptest(lm(Laju.Etsa ~ Daya.RF, data = dataRF))
studentized Breusch-Pagan test
data: lm(Laju.Etsa ~ Daya.RF, data = dataRF)
BP = 1.5595, df = 3, p-value = 0.66863.5 Uji ANOVA
> # Menghitung Derajat Bebas
> N <- nrow(dataRF)
> p <- levels(dataRF$Daya.RF) %>% length()
> DBp <- p - 1
> DBg <- N - p
> DBt <- N - 1> # Menghitung Jumlah Kuadrat
> mean.perlakuan <- aggregate(Laju.Etsa ~ Daya.RF, dataRF, mean )[,2]
> n <- aggregate(Laju.Etsa ~ Daya.RF, dataRF, length)[,2]
> mean.grand <- mean(dataRF$Laju.Etsa)
>
> JKp <- sum(n*(mean.perlakuan - mean.grand)^2)
> JKt <- sum((dataRF$Laju.Etsa - mean.grand)^2)
> JKg <- JKt - JKp> # Menghitung Kuadrat Tengah
> KTp <- JKp / DBp
> KTg <- JKg / DBg> # Menghitung Statistik Uji F
> Fp <- KTp / KTg
> pV <- pf(Fp, DBp, DBg, lower.tail = FALSE)> # Interpretasi
> data.frame(SK = c("Perlakuan", "Galat", "Total"),
+ DB = c(DBp, DBg, DBt),
+ JK = c(JKp, JKg, JKt),
+ KT = c(KTp, KTg, NA),
+ SU = c(Fp, NA, NA),
+ PV = c(pV, NA, NA))
SK DB JK KT SU PV
1 Perlakuan 3 66870.55 22290.18 66.79707 2.882866e-09
2 Galat 16 5339.20 333.70 NA NA
3 Total 19 72209.75 NA NA NA3.6 Uji Lanjutan
> library(multcomp)
> TukeyHSD(aov(Laju.Etsa ~ Daya.RF, data = dataRF))
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = Laju.Etsa ~ Daya.RF, data = dataRF)
$Daya.RF
diff lwr upr p adj
X180-X160 36.2 3.145624 69.25438 0.0294279
X200-X160 74.2 41.145624 107.25438 0.0000455
X220-X160 155.8 122.745624 188.85438 0.0000000
X200-X180 38.0 4.945624 71.05438 0.0215995
X220-X180 119.6 86.545624 152.65438 0.0000001
X220-X200 81.6 48.545624 114.65438 0.00001464 HASIL DAN PEMBAHASAN
Penelitian pengetsaan plasma dengan empat tingkat daya RF 160 W, 180 W, 200 W, dan 220 W terhadap laju etsa yang dilakukan dengan lima ulangan percobaan setiap perlakuannya memberikan hasil sebagai berikut
> getwd()
[1] "C:/Users/10/Downloads"Asumsi pertama analisis of variance (ANOVA) yang harus
dipenuhi adalah uji normalitas. Hasil normalitas ditujukan pada Uji
Shapiro Wilk (Tabel 2) dan Uji Jaque Bera (Tabel 3).
Shapiro-Wilk normality test menunjukkan nilai p-value 0.1512
> 0.05, oleh karena itu dapat disimpulkan bahwa data berdistribusi
normal.
Jarque Bera Test menunjukkan nilai p-value 0.4784 > 0.05,
oleh karena itu dapat disimpulkan bahwa data berdistribusi normal.
Selanjutnya asumsi kedua analisis of variance (ANOVA) yang
harus dipenuhi adalah uji homogenitas melalui Levene’s Test
(Tabel 4) dan Breusch Pagan test (Tabel 5).
Hasil uji statistik menunjukkan nilai Pr(>F) 0.8977 >
0.05, maka dapat disimpulkan bahwa sampel berasal dari populasi homogen.
Breusch Pagan test menunjukkan nilai P-value 0.6686 > 0.05.
Hal ini menunjukkan bahwa setiap kelompok subjek telah memenuhi asumsi
ANOVA karena sampel berasal dari populasi homogen. Setelah semua asumsi
analisis of variance (ANOVA) termenuhi, dilanjutkan Uji Anova
(Tabel 6).
Apabila tingkat signifikansi eksperimen yang ditetapkan adalah = 0.05,
F0.05,3,16 = 3.24. Sehingga statistik uji F 66.79707 >
3.24, maka tolak H0 dan simpulkan bahwa rata-rata perlakuan
berbeda dan pengaturan daya RF secara signifikan memengaruhi laju etsa
rata-rata. Jika melihat P-value, jelas P-value sangat
kecil dalam kasus ini.
Hasil perbandingan antar kelompok Daya RF menunjukkan bahwa terdapat
perbedaan yang signifikan antara kelompok B dan A, C dan A, D dan A, C
dan B, D dan B, serta D dan C. Sedangkan berdasarkan masing-masing p
adj < 0.05. Dimana A, B, C, dan D merupakan masing-masing secara
berurutan daya RF 160 W, 180 W, 200 W, dan 220 W.
5 KESIMPULAN
Berdasarkan Analisis One-Way Anova dan hasil analisis Tukey, dapat disimpulkan bahwa terdapat perbedaan signifikan antara kelompok-kelompok Daya RF dalam mempengaruhi variabel respon laju Etsa pada tingkat kepercayaan 95%.
6 DAFTAR PUSTAKA
- Montgomery, Douglas, C., John Wiley. 2013. Design and Analysis of Experiments Eighth Edition. Arizona State University, McGraw-Hill Education.
- Sirait, Anna Maria. 2001. Analisis Varians (ANOVA) dalam Penelitian Kesehatan. Media Penelitian dan Pengembangan Kesehatan.
- Suntoyo Yitnosumarto. 1991. Percobaan (Perancangan, analissi, dan Interpretasinya). PT Gramedia Pustaka Utama. Jakarta