ANOVA beserta Asumsinya pada Rstudio

Dini Febrilia Putri Setyo Budi

2024-06-01


Library:

> # install.packages("car")
> # install.packages("rmarkdown")
> # install.packages("knitr")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
> # install.packages("lmtest")
> # install.packages("tseries")
> # install.packages("agricolae")
> # install.packages("dplyr")
> # install.packages("tidyr")
> # install.packages("ggplot2")
> # install.packages("reshape2")
> # install.packages("additivityTests")

1 PENDAHULUAN

1.1 Latar Belakang

ANOVA (analysis of variance) merupakan suatu metode statistik parametrik yang digunakan untuk membedakan rata-rata pada lebih dari dua kelompok data dengan membandingkan variansinya. Pada ANOVA yang dibandingkan adalah rata-rata populasi bukan ragam populasi.

Dalam percobaan berikut, peneliti ingin mengetahui pengaruh perbedaan jenis umpan yang berasal dari almunium (UB1), Serat sutera (UB2) dan Kepingan CD (UB3) dengan jumlah hasil tangkapan. Dari sini akan diketahui pengaruh fisik yaitu penglihatan ikan dalam menyambar umpan.

2 TINJAUAN PUSTAKA

2.1 ANOVA (analysis of variance)

ANOVA (analysis of variance) merupakan suatu metode statistik parametrik yang digunakan untuk membedakan rata-rata pada lebih dari dua kelompok data dengan membandingkan variansinya. Pada ANOVA yang dibandingkan adalah rata-rata populasi bukan ragam populasi. Skala data yang dapat digunakan berupa nominal dan ordinal pada variabel bebasnya. Dalam menggunakan Uji ANOVA ini, perlu dilakukan pengujian asumsi seperti uji normalitas, heteroskedastisitas, dan sampel acak. Asumsi yang harus dipenuhi yaitu random sampling, homogenitas varians, dan multivariate normality .

Hipotesis pada ANOVA adalah sebagai berikut: \[ H_0: \mu_1 = \mu_2 = \mu_3 = \cdots = \mu_k (\text{Seluruh rata-rata populasi bernilai sama}) \] \[ H_1: \text{minimal terdapat satu rata-rata populasi yang berbeda} \]Keputusan yang dapat diambil dari hasil uji ANOVA adalah:

- \(F_{hitung} > F_{tabel}\), maka tolak \(H_0\).

- \(F_{hitung} \leq F_{tabel}\), maka gagal untuk menolak \(H_0\).

atau dapat juga ditentukan berdasarkan nilai p-value, dengan syarat:

- Jika \(p\)-value \(\leq \alpha\), maka tolak \(H_0\).

- Jika \(p\)-value \(> \alpha\), maka gagal untuk menolak \(H_0\).

2.2 One Way ANOVA (Klasifikasi satu arah)

ANOVA satu arah merupakan analisis yang digunakan pada data yang terdiri dari masing-masing satu variabel bebas dan terikat. Uji ini untuk mengetahui perbedaan rata-rata dari beberapa kelompok dengan perlakuan yang berbeda. Rumus hitung yang digunakan pada Analisis Ragam satu arah adalah sebagai berikut:

SK DB JK KT Fhitung
Perlakuan k-1 JKR JKR/(k-1) KTR/KTG
Galat k(n-1) JKG JKG/k(n-1)
Total n-1 JKT

2.3 Two Way ANOVA (Klasifikasi dua arah)

ANOVA satu arah merupakan analisis yang digunakan pada data yang memiliki dua faktor. Sumber keragaman yang terjadi tidak hanya dari satu perlakuan saja. Uji ini untuk mengetahui besar pengaruh perbedaan rata-rata dari dua kriteria. Rumus hitung yang digunakan pada analisis ragam dua arah adalah sebagai berikut:

SK DB JK KT Fhitung
Baris r-1 JKB JKB/(r-1) KTB/KTG
Kolom k-1 JKK JKK/(r-1) KTK/KTG
Galat (r-1)(k-1) JKG JKG/k(n-1)
Total n-1 JKT

Keterangan :

  • JKB = Jumlah Kuadrat Baris

  • JKK = Jumlah Kuadrat Kolom

  • JKG = Jumlah Kuadrat Galat

  • r = Jumlah baris

  • k = Jumlah kolom

  • n = Jumlah data

2.4 Uji Normalitas

Uji Normalitas merupakan uji yang bertujuan untuk mengetahui apakah data menyebar dengan berdistribusi normal atau tidak. Untuk menguji normalitas data, dapat menggunakan Uji Kolmogorov-Smirnov, Uji Jarque-Bera, dan Uji Shapiro-Wilk. Selain itu, dapat diketahui berdasarkan histogram atau QQ Plot karena apabila data menyebar secara normal, maka pola grafik akan cenderung membentuk seperti lonceng.

Hipotesis pada Uji Normalitas adalah:

H0 : pengamatan berdistribusi normal

H1 : pengamatan tidak berdistribusi normal

Keputusan yang dapat diambil dari hasil Uji Normalitas adalah:

- Jika \(p\)-value \(\leq \alpha\), maka tolak \(H_0\).

- Jika \(p\)-value \(> \alpha\), maka gagal untuk menolak \(H_0\).

2.5 Homogenitas Ragam

Asumsi Homogenitas Ragam digunakan untuk mengetahui ragam dari kedua sampel sama atau tidak. Untuk menguji normalitas data, dapat menggunakan Uji Uji Levene, Uji Bartlett, dan Uji Breusch-Pagan

Hipotesis pada Homogenitas Ragam adalah: \[ H_0: \sigma_1^2 = \sigma_2^2 = \cdots = \sigma_k^2 \] \[ H_1: \text{Setidaknya ada dua varians yang berbeda} \]

Keputusan yang dapat diambil dari hasil Homogenitas Ragam adalah:

- Jika \(p\)-value \(\leq \alpha\), maka tolak \(H_0\).

- Jika \(p\)-value \(> \alpha\), maka gagal untuk menolak \(H_0\).

2.6 Asumsi Independensi

Asumsi Independensi disebabkan karena adanya ketidakbebasan galat akibat autokorelasi dari korelasi terhadap galat tersebut. Untuk menguji Independensi galat, dapat menggunakan Uji Durbin-Watson

Hipotesis pada Asumsi Independensi adalah:

H0 : data antar perlakuan bersifat independen

H1 : data antar perlakuan tidak bersifat independen

Keputusan yang dapat diambil dari hasil Asumsi Independensi adalah:

- Jika \(p\)-value \(\leq \alpha\), maka tolak \(H_0\).

- Jika \(p\)-value \(> \alpha\), maka gagal untuk menolak \(H_0\).

3 SOURCE CODE

3.1 Library

> # Library
> install.packages("car")
> install.packages("rmarkdown")
> install.packages("knitr")
> install.packages("prettydoc")
> install.packages("equatiomatic")
> install.packages("lmtest")
> install.packages("tseries")
> install.packages("agricolae")
> install.packages("dplyr")
> install.packages("tidyr")
> install.packages("ggplot2")
> install.packages("reshape2")
> install.packages("additivityTests")

3.2 Data

> Data1 <- data.frame(
+   UB1 = c(65, 37, 49, 27, 60, 78, 8, 9, 15),
+   UB2 = c(40, 64, 36, 47, 44, 18, 11, 14,18),
+   UB3 = c(25, 22, 9, 6, 16, 13, 9, 9, 19))
> Data1
  UB1 UB2 UB3
1  65  40  25
2  37  64  22
3  49  36   9
4  27  47   6
5  60  44  16
6  78  18  13
7   8  11   9
8   9  14   9
9  15  18  19

Mengubah bentuk data menjadi dua kolom

> library(dplyr)
> library(tidyr)
> Data1 = Data1 %>%
+   pivot_longer(c(UB1, UB2, UB3))
> names(Data1) = c("PerlakuanUmpan","HasilTangkapan")
> Data1$PerlakuanUmpan = as.factor(Data1$PerlakuanUmpan)
> Data1
# A tibble: 27 × 2
   PerlakuanUmpan HasilTangkapan
   <fct>                   <dbl>
 1 UB1                        65
 2 UB2                        40
 3 UB3                        25
 4 UB1                        37
 5 UB2                        64
 6 UB3                        22
 7 UB1                        49
 8 UB2                        36
 9 UB3                         9
10 UB1                        27
# ℹ 17 more rows

3.3 ANOVA One way

> hasil_anova <- aov(HasilTangkapan~PerlakuanUmpan, data=Data1)
> summary(hasil_anova)
               Df Sum Sq Mean Sq F value Pr(>F)  
PerlakuanUmpan  2   2905    1452   4.198 0.0273 *
Residuals      24   8304     346                 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

3.4 Plot

3.4.1 Boxplot

> library(ggplot2)
> ggplot(Data1, 
+        aes(x = PerlakuanUmpan, 
+            y = HasilTangkapan)) +
+   geom_boxplot() +
+   labs(title = "Jumlah Hasil Tangkapan Ikan (kg) Berdasarkan Perlakuan Umpan",
+        x = "Perlakuan Umpan",
+        y = "Hasil Tangkapan")

3.4.2 Plot residual vs fitted

> library(ggplot2)
> plot(hasil_anova,1)

3.4.3 Plot Normal QQ

> library(ggplot2)
> plot(hasil_anova,2)

3.4.4 Plot scale location

> library(tidyr)
> plot(hasil_anova,3)

3.5 Uji Asumsi

3.5.1 Normalitas Galat

> library(tseries)
> residu <- residuals(hasil_anova)
> residu
         1          2          3          4          5          6          7 
 26.333333   7.555556  10.777778  -1.666667  31.555556   7.777778  10.333333 
         8          9         10         11         12         13         14 
  3.555556  -5.222222 -11.666667  14.555556  -8.222222  21.333333  11.555556 
        15         16         17         18         19         20         21 
  1.777778  39.333333 -14.444444  -1.222222 -30.666667 -21.444444  -5.222222 
        22         23         24         25         26         27 
-29.666667 -18.444444  -5.222222 -23.666667 -14.444444   4.777778 
> library(tseries)
> jarque_bera <- jarque.bera.test(residu)
> jarque_bera

    Jarque Bera Test

data:  residu
X-squared = 0.46651, df = 2, p-value = 0.792
> library(tseries)
> shapiro <- shapiro.test(residu)
> shapiro

    Shapiro-Wilk normality test

data:  residu
W = 0.98305, p-value = 0.9237

3.5.2 Homogenitas Ragam

> library(lmtest)
> bp <- bptest(hasil_anova)
> bp

    studentized Breusch-Pagan test

data:  hasil_anova
BP = 9.2171, df = 2, p-value = 0.009966

3.5.3 Independensi Galat

> library(lmtest)
> dw <- dwtest(hasil_anova)
> dw 

    Durbin-Watson test

data:  hasil_anova
DW = 1.4469, p-value = 0.1115
alternative hypothesis: true autocorrelation is greater than 0

3.6 Uji Lanjut

3.6.1 Beda Nyata Terkecil (BNT)

> library(agricolae)
> bnt <- LSD.test(hasil_anova, "PerlakuanUmpan", alpha = 0,05)
> bnt
$statistics
   MSerror Df     Mean       CV t.value LSD
  345.9907 24 28.44444 65.39353     Inf Inf

$parameters
        test p.ajusted         name.t ntr alpha
  Fisher-LSD      none PerlakuanUmpan   3     0

$means
    HasilTangkapan      std r       se  LCL UCL Min Max Q25 Q50 Q75
UB1       38.66667 25.79244 9 6.200275 -Inf Inf   8  78  15  37  60
UB2       32.44444 18.12534 9 6.200275 -Inf Inf  11  64  18  36  44
UB3       14.22222  6.64789 9 6.200275 -Inf Inf   6  25   9  13  19

$comparison
NULL

$groups
    HasilTangkapan groups
UB1       38.66667      a
UB2       32.44444      a
UB3       14.22222      a

attr(,"class")
[1] "group"
> plot(bnt)

3.6.2 Beda Nyata Jujur (BNJ)

> bnj <- TukeyHSD(hasil_anova, conf.level=0.95)
> bnj
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = HasilTangkapan ~ PerlakuanUmpan, data = Data1)

$PerlakuanUmpan
              diff       lwr       upr     p adj
UB2-UB1  -6.222222 -28.11972 15.675274 0.7602156
UB3-UB1 -24.444444 -46.34194 -2.546948 0.0266289
UB3-UB2 -18.222222 -40.11972  3.675274 0.1157327

4 HASIL DAN PEMBAHASAN

4.1 ANOVA One Way

  • Hipotesis \[ \begin{align} & H_0:\mu_1=\mu_2=\mu_3=0\\ & H_1:\text{setidaknya ada satu }\mu_i\neq0\\ \end{align} \]
  • Taraf Signifikansi (α=5%)
  • Keputusan : \(p-value(0.0273)<\alpha(0.05)\), maka Tolak \(H_0\)
  • Kesimpulan : Dengan taraf nyata 5% sudah cukup bukti bahwa tolak \(H_0\), sehingga dapat disimpulkan jika terdapat perbedaan signifikan antara jumlah hasil tangkapan dengan perlakuan umpan.

4.2 Normal QQ plot

Berdasarkan QQ plot diatas, maka dapat disimpulkan jika data menyebarsecara normal

4.3 Uji Asumsi

4.3.1 Normalitas Galat

  • Hipotesis: \[ \begin{align} & H_0:\text{pengamatan berdistribusi normal}\\ & H_1:\text{pengamatan tidak berdistribusi normal}\\ \end{align} \]

  • Taraf Signifikansi (α=5%)

  • Keputusan : \(p\)-value (0.792) \(> \alpha\), , dan \(p\)-value(0.9237) \(> \alpha\), pat diambil keputusan jika terima \(H_0\)

  • Kesimpulan :

    Dengan taraf nyata 5% sudah cukup bukti bahwa terima \(H_0\), sehingga dapat disimpulkan jika pengamatan berdistribusi normal.

4.3.2 Homogenitas Ragam

  • Hipotesis \[ H_0: \sigma_1^2 = \sigma_2^2 = \cdots = \sigma_k^2 \] \[ H_1: \text{Setidaknya ada dua varians yang berbeda} \]
  • Taraf Signifikansi (α=5%)
  • Keputusan : \(p-value(0.009966)<\alpha(0.05)\), maka Tolak Ho
  • Kesimpulan : Dengan taraf nyata 5% sudah cukup bukti bahwa tolak \(H_0\), sehingga dapat disimpulkan jika ragam tidak homogen dan data berasal dari distribusi yang berbeda.

4.3.3 Asumsi independensi

  • Hipotesis: \[ \begin{align} & H_0:\text{data antar perlakuan bersifat independen}\\ & H_1:\text{data antar perlakuan tidak bersifat independen}\\ \end{align} \]
  • Taraf Signifikansi (α=5%)
  • Keputusan : \(p-value(0.1115)>\alpha(0.05)\), maka Terima \(H_0\)
  • Kesimpulan : Dengan taraf nyata 5% sudah cukup bukti bahwa terima \(H_0\), sehingga dapat disimpulkan jika data antar perlakuan bersifat independen.

4.4 Uji Lanjut

Kesimpulan yang didapat dari uji BNT dan BNJ:

  • Tidak terdapat perbedaan yang signifikan antara hasil tangkapan pada perlakuan umpan UB2 dan UB1.

  • Terdapat perbedaan yang signifikan secara statistik antara hasil tangkapan pada perlakuan umpan UB3 dan UB1. Perlakuan umpan UB1 memiliki hasil tangkapan yang lebih tinggi dibandingkan UB3.

  • Tidak ada perbedaan yang signifikan secara statistik antara hasil tangkapan pada perlakuan umpan UB3 dan UB2.

  • Sehingga, perlakuan umpan UB1 secara signifikan lebih efektif daripada UB3, tetapi tidak ada perbedaan signifikan antara UB2 dengan UB1 atau UB3.

5 KESIMPULAN

Berdasarkan uji ANOVA yang telah dilakukan, maka data memiliki keputusan jika tolak \(H_0\). Sesuai dengan syarat ANOVA jika harus memenuhi beberapa asumsi, maka diperlukan beberapa uji lanjut sebagai pertimbangan apakah data layak digunakan atau tidak.

6 DAFTAR PUSTAKA

  • Walpole, Ronald E. 1995. Pengantar Statistika Edisi ke-3. Jakarta : PT. Gramedia Pustaka Utama.
  • Harlan,J (2018). Analisis Variansi. Depok:Gunadarma.