Analysis of Variance atau (ANOVA) adalah sebuah metode yang digunakan untuk menguji perbedaan antara dua atau lebih kelompok. ANOVA itu digunakan untuk menguji sebuah data antara dua atau lebih kelompok yang digunakan pada sebuah penelitian dengan cepat dan akurat. Berikut adalah prosedur membuat analisis ANOVA dengan RStudio.
Pertama, saya memanggil paket R yang ada dengan ggplot2 untuk bisa melakukan analisis ini. Jika paket itu belum didownload, maka pertama install paket tersebut menggunakan argumen install.packages(“ggplot2”). Lalu jika sudah didownload paket itu, gunakan argumen library(ggplot2).
library(ggplot2)
Lalu, carilah atau membuat data yang kamu mau untuk melakukan analisis ANOVA tersebut. Buatlah dataframe tersebut dan print data untuk menghasilkan data di RStudio. Saya membuat data perbandingan hasil panen dari tiga jenis pupuk dengan alasan melihat apakah tiga pupuk itu memiliki efek hasil panen yang hampir sama atau jauh beda supaya kita bisa memilih pupuk yang bagus untuk tanaman.
data <- data.frame(
Pupuk = rep(c("A", "B", "C"), each = 5),
Hasil = c(20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34)
)
print(data)
## Pupuk Hasil
## 1 A 20
## 2 A 21
## 3 A 22
## 4 A 23
## 5 A 24
## 6 B 25
## 7 B 26
## 8 B 27
## 9 B 28
## 10 B 29
## 11 C 30
## 12 C 31
## 13 C 32
## 14 C 33
## 15 C 34
Dalam analisis ANOVA, gunakan fungsi aov() untuk menghasilkan derajat kebebasan dan jumlah kuadrat data yang digunakan untuk membuat Tabel ANOVA.
anova_result <- aov(Hasil ~ Pupuk, data = data)
print(anova_result)
## Call:
## aov(formula = Hasil ~ Pupuk, data = data)
##
## Terms:
## Pupuk Residuals
## Sum of Squares 250 30
## Deg. of Freedom 2 12
##
## Residual standard error: 1.581139
## Estimated effects may be unbalanced
Hasilnya dari kode tersebut adalah sebagai berikut: 1. Degree of Freedom: df1 dan df2 berturut-turut adalah 2 dan 12. 2. Sum of squares: Jumlah kuadrat pupuk dan residuals berturut-turut adalah 250 dan 30.
Selanjutnya gunakan fungsi summary() untuk menampilkan hasil Tabel ANOVA dengan tingkat signifikan 5%.
summary(anova_result)
## Df Sum Sq Mean Sq F value Pr(>F)
## Pupuk 2 250 125.0 50 1.51e-06 ***
## Residuals 12 30 2.5
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Hasil dari tabel ANOVA tersebut adalah sebagai berikut: 1. Mean Square: Mean square dari pupuk dan residuals berturut-turut adalah 125 dan 2.5 2. F-Value: Nilai F-statistic adalah 50 3. P-Value: Hasil P-value adalah 1.23e-09, berarti nilai tersebut jauh lebih kecil dari tingkat signifikan 0.05.
Karena p-value itu jauh lebih kecil daripada tingkat signifikan (0.05), maka hasilnya tolak H0, yaitu menunjukkan besarnya perbedaan antara tiga pupuk tersebut.
Jadi, data di atas ada perbedaan yang signifikan secara statistik dalam hasil panen antara ketiga jenis pupuk dengan pupuk C merupakan pupuk yang paling efektif dalam meningkatkan hasil panen. Analisis itu bisa digunakan untuk melihat berbagai kelompok yang lebih banyak dan menentukan hasil ANOVA dengan tepat untuk menampilkan kesimpulan yang sesuai.
library(jpeg)
gambar_jpeg <- readJPEG("C:/Users/Benhard Leroy/Downloads/Flowchart ANOVA - Flowchart analisis ANOVA.jpg")
plot(1:10, type = "n", xlab = "", ylab = "", axes = FALSE)
rasterImage(gambar_jpeg, 1, 1, 10, 10)