1. Pengertian

Analysis of Variance atau (ANOVA) adalah sebuah metode yang digunakan untuk menguji perbedaan antara dua atau lebih kelompok. ANOVA itu digunakan untuk menguji sebuah data antara dua atau lebih kelompok yang digunakan pada sebuah penelitian dengan cepat dan akurat. Berikut adalah prosedur membuat analisis ANOVA dengan RStudio.

2. Memanggil Paket ggplot2

Pertama, saya memanggil paket R yang ada dengan ggplot2 untuk bisa melakukan analisis ini. Jika paket itu belum didownload, maka pertama install paket tersebut menggunakan argumen install.packages(“ggplot2”). Lalu jika sudah didownload paket itu, gunakan argumen library(ggplot2).

library(ggplot2) 

3. Membuat data Pupuk

Lalu, carilah atau membuat data yang kamu mau untuk melakukan analisis ANOVA tersebut. Buatlah dataframe tersebut dan print data untuk menghasilkan data di RStudio. Saya membuat data perbandingan hasil panen dari tiga jenis pupuk dengan alasan melihat apakah tiga pupuk itu memiliki efek hasil panen yang hampir sama atau jauh beda supaya kita bisa memilih pupuk yang bagus untuk tanaman.

data <- data.frame(
  Pupuk = rep(c("A", "B", "C"), each = 5),
  Hasil = c(20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34)
)
print(data)
##    Pupuk Hasil
## 1      A    20
## 2      A    21
## 3      A    22
## 4      A    23
## 5      A    24
## 6      B    25
## 7      B    26
## 8      B    27
## 9      B    28
## 10     B    29
## 11     C    30
## 12     C    31
## 13     C    32
## 14     C    33
## 15     C    34

4. Melakukan Analisis ANOVA

Dalam analisis ANOVA, gunakan fungsi aov() untuk menghasilkan derajat kebebasan dan jumlah kuadrat data yang digunakan untuk membuat Tabel ANOVA.

anova_result <- aov(Hasil ~ Pupuk, data = data)
print(anova_result)
## Call:
##    aov(formula = Hasil ~ Pupuk, data = data)
## 
## Terms:
##                 Pupuk Residuals
## Sum of Squares    250        30
## Deg. of Freedom     2        12
## 
## Residual standard error: 1.581139
## Estimated effects may be unbalanced

Hasilnya dari kode tersebut adalah sebagai berikut: 1. Degree of Freedom: df1 dan df2 berturut-turut adalah 2 dan 12. 2. Sum of squares: Jumlah kuadrat pupuk dan residuals berturut-turut adalah 250 dan 30.

5. Hasil Tabel ANOVA

Selanjutnya gunakan fungsi summary() untuk menampilkan hasil Tabel ANOVA dengan tingkat signifikan 5%.

summary(anova_result)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Pupuk        2    250   125.0      50 1.51e-06 ***
## Residuals   12     30     2.5                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Hasil dari tabel ANOVA tersebut adalah sebagai berikut: 1. Mean Square: Mean square dari pupuk dan residuals berturut-turut adalah 125 dan 2.5 2. F-Value: Nilai F-statistic adalah 50 3. P-Value: Hasil P-value adalah 1.23e-09, berarti nilai tersebut jauh lebih kecil dari tingkat signifikan 0.05.

6. Inteprestasi Data

Karena p-value itu jauh lebih kecil daripada tingkat signifikan (0.05), maka hasilnya tolak H0, yaitu menunjukkan besarnya perbedaan antara tiga pupuk tersebut.

7. Kesimpulan

Jadi, data di atas ada perbedaan yang signifikan secara statistik dalam hasil panen antara ketiga jenis pupuk dengan pupuk C merupakan pupuk yang paling efektif dalam meningkatkan hasil panen. Analisis itu bisa digunakan untuk melihat berbagai kelompok yang lebih banyak dan menentukan hasil ANOVA dengan tepat untuk menampilkan kesimpulan yang sesuai.

8. Flowchart

library(jpeg)
gambar_jpeg <- readJPEG("C:/Users/Benhard Leroy/Downloads/Flowchart ANOVA - Flowchart analisis ANOVA.jpg")
plot(1:10, type = "n", xlab = "", ylab = "", axes = FALSE)
rasterImage(gambar_jpeg, 1, 1, 10, 10)