Dalam analisis data, sering muncul pertanyaan apakah terdapat perbedaan rata-rata antara beberapa kelompok yang diamati. Jika hanya terdapat dua kelompok, perbandingan rata-rata dapat dilakukan menggunakan uji t. Namun, apabila jumlah kelompok lebih dari dua, penggunaan uji t secara berulang tidak dianjurkan karena dapat meningkatkan peluang kesalahan dalam pengambilan keputusan.
Untuk mengatasi hal tersebut digunakan Analisis Varians (Analysis of Variance / ANOVA), yaitu metode statistik yang digunakan untuk menguji apakah terdapat perbedaan rata-rata antara tiga kelompok atau lebih dengan membandingkan variasi antar kelompok dan variasi di dalam kelompok.
Secara umum, analisis ini digunakan untuk menjawab pertanyaan seperti berikut:
Note
“Apakah terdapat perbedaan rata-rata antara beberapa kelompok yang diamati?”
Jika hasil uji ANOVA menunjukkan adanya perbedaan yang signifikan, maka analisis biasanya dilanjutkan dengan uji lanjut (post-hoc test) untuk mengetahui pasangan kelompok mana yang memiliki perbedaan rata-rata secara signifikan.
Contoh 1
Seorang peneliti di bidang pertanian ingin mengetahui apakah metode budidaya yang berbeda menghasilkan rata-rata hasil panen yang berbeda. Untuk itu digunakan tiga metode budidaya, yaitu Metode A, Metode B, dan Metode C. Setiap metode diterapkan pada kelompok lahan percobaan yang berbeda, masing-masing terdiri dari 5 petak lahan. Hasil panen padi yang diperoleh dari setiap petak lahan (dalam kuintal per hektar) untuk masing-masing metode adalah sebagai berikut:
Metode A
Metode B
Metode C
58
58
48
64
69
57
55
71
59
66
64
47
67
68
49
Dengan menggunakan uji ANOVA satu arah pada taraf nyata α = 0.05, tentukan apakah terdapat perbedaan rata-rata hasil panen antara ketiga metode budidaya tersebut.
library(readxl)
Warning: package 'readxl' was built under R version 4.5.2
library(dplyr)
Warning: package 'dplyr' was built under R version 4.5.1
Attaching package: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
library(ggplot2)
Warning: package 'ggplot2' was built under R version 4.5.1
# Mengubah variabel Metode menjadi faktordata1 %>%group_by(Metode) %>%summarise(Mean =round(mean(Hasil),2),SD =round(sd(Hasil),2) )
# A tibble: 3 × 3
Metode Mean SD
<fct> <dbl> <dbl>
1 A 62 5.24
2 B 66 5.15
3 C 52 5.57
# Visualisasi# Dotplotggplot(data1, aes(x = Metode, y = Hasil, color = Metode)) +geom_point(size =3) +labs(x ="Metode",y ="Hasil" ) +theme_minimal()
# Boxplotboxplot(Hasil ~ Metode,data = data1,col =c("#A8DADC","#F4A261","#E5989B"),main ="Boxplot Nilai Berdasarkan Metode",xlab ="Metode",ylab ="Hasil")
Berdasarkan scatter plot dan boxplot terlihat bahwa hasil pada setiap metode memiliki pola yang berbeda. Metode B cenderung menghasilkan nilai tertinggi, diikuti oleh Metode A, sedangkan Metode C menghasilkan nilai yang relatif lebih rendah. Secara visual terdapat indikasi perbedaan rata-rata hasil antar metode, namun perlu dilakukan uji ANOVA untuk memastikan apakah perbedaan tersebut signifikan secara statistik.
# model ANOVAmodel <-aov(Hasil ~ Metode, data = data1)summary(model)
Df Sum Sq Mean Sq F value Pr(>F)
Metode 2 520 260.00 9.176 0.00382 **
Residuals 12 340 28.33
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Karena p-value lebih kecil dari taraf nyata α = 0.05, maka H₀ ditolak. Artinya, terdapat perbedaan rata-rata hasil yang signifikan antara metode A, B, dan C. Oleh karena itu, analisis dapat dilanjutkan dengan uji lanjut (post-hoc test) seperti LSD atau Tukey HSD untuk mengetahui pasangan metode mana yang berbeda secara signifikan.
Metode A dan Metode B memiliki rata-rata hasil yang tidak berbeda secara signifikan.
Metode C memiliki rata-rata hasil yang berbeda signifikan dari kedua metode lainnya. Selain itu, rata-rata hasil Metode C lebih rendah dibandingkan Metode A dan Metode B.
Huruf “a” pada kelompok “depan” dan “tengah” Artinya, rata-rata kedua kelompok ini tidak berbeda secara signifikan.
Huruf “b” pada kelompok “belakang” Berarti kelompok ini memiliki rata-rata yang berbeda secara signifikan dari kelompok “depan” dan “tengah”.
Kesimpulan : Kelompok “depan” dan “tengah” memiliki nilai rata-rata yang mirip dan tidak berbeda secara statistik. Kelompok “belakang” memiliki perbedaan signifikan dibandingkan kelompok lainnya (lebih rendah rata-ratanya).
Huruf “a” pada barisan depan menunjukkan bahwa barisan ini memiliki rata-rata nilai tertinggi.
Huruf “b” pada barisan belakang menunjukkan bahwa barisan ini memiliki rata-rata nilai yang berbeda secara signifikan dibandingkan barisan depan.
Huruf “ab” pada barisan tengah menunjukkan bahwa rata-rata nilai barisan tengah tidak berbeda signifikan baik dengan barisan depan maupun dengan barisan belakang.
Kesimpulan:
Barisan depan dan belakang memiliki rata-rata nilai yang berbeda signifikan.
Barisan tengah tidak berbeda signifikan dengan barisan depan maupun barisan belakang.
Secara umum, barisan depan memiliki rata-rata nilai tertinggi, sedangkan barisan belakang memiliki rata-rata nilai terendah.