1 PENDAHULUAN
1.1 Latar Belakang
Menurut Kamus Besar Bahasa Indonesia (1995), statistika adalah ilmu tentang cara-cara mengumpulkan, menabulasi, menggolong-golongkan, menganalisis, dan mencari keterangan yang berarti dari data yang berupa angka atau pengetahuan yang berhubungan dengan pengumpulan data yang penyelidikan catatan bilangan (angka-angka). Berdasarkan parameternya, statistik dibagi menjadi dua macam, yaitu statistik parametrik dan statistik non-parametrik. Statistik parametrik adalah bagian statistik yang parameter dari populasi mengikuti distribusi tertentu, seperti distribusi normal dan memiliki varian yang homogen (Hasan, 2014).
Secara umum, analisis varians menguji dua ragam berdasarkan hipotesis nol bahwa kedua varians itu sama. Varians pertama adalah varians antarcontoh (among samples) dan varians kedua adalah varians di dalam masing-masing contoh (within samples). Dengan begitu, analisis varians dengan dua contoh akan memberikan hasil yang sama dengan uji t untuk dua rerata (mean). Jika uji kesamaan dua rata-rata atau uji t digunakan untuk mencari perbedaan atau persamaan dua rata-rata, maka uji beberapa rata-rata digunakan untuk mencari perbedaan atau persamaaan beberapa rata-rata. Uji ini disebut dengan nama analysis of variance (anova atau anava).
1.2 Statistika Deskriptif
Metode statistik adalah prosedur-prosedur yang digunakan dalam pengumpulan, penyajian, analisis, dan penafsiran data. Kita akan mengelompokkan metode-metode tersebut ke dalam dua kelompok besar, yaitu statistika deskriptif dan inferensia statistik. Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna, sedangkan inferensia statistik mencakup semua metode yang berhubungan dengan analisis sebagian data untuk kemudian sampai pada peramalan atau penarikan kesimpulan mengenai keseluruhan gugus data induknya (Walpole, 1993).
Menurut Sugiyono (2007), statistika deskriptif adalah statistik yang berfungsi untuk mendeskripsikan atau memberi gambaran terhadap obyek yang diteliti melalui data sampel atau populasi sebagaimana adanya, tanpa melakukan analisis dan membuat kesimpulan yang berlaku untuk umum. Pada statistika deskriptif ini, akan dikemukakan cara-cara penyajian data, dengan tabel biasa maupun distribusi frekuensi; grafik garis maupun batang; diagram lingkaran; pictogram; penjelasan kelompok melalui rentang dan simpangan baku.
1.3 Analisis Ragam Satu Arah (One-Way ANOVA)
Analisis ragam adalah suatu metode untuk menguraikan keragaman total data kita menjadi komponen-komponen yang mengukur berbagai sumber keragaman. Klasifikasi pengamatan berdasarkan satu kriterium disebut klasifikasi satu arah, sedangkan klasifikasi yang didasarkan pada dua kriteria disebut klasifikasi dua arah.
Misalkan kita mempunyai k populasi. Dari masing-masing populasi diambil contoh berukuran n. Nisalkan pula bahwa k populasi itu bebas dan menyebar normal dengan nilai tengah dan ragam sama. Kita ingin memperoleh cara bagi pengujian hipotesis.
\[ \ H_0 : \mu_1 = \mu_2 = ... = \mu_k \]
\[ \ H_1 : sekurang-kurangnya \ dua \ nilai \ tengah \ tidak \ sama \]
1.4 Data
Data yang digunakan adalah data nilai dengan empat kelompok, yaitu kelompok A, B, C, dan D. Masing-masing kelompok terdiri dari lima nilai.
2 SOURCE CODE
2.1 Library yang Dibutuhkan
> # Library(car)
> # Library(agricolae)
> # Library(tseries)
> # Library(rmarkdown)2.2 Membangkitkan Data
> x1 <- c(89,88,84,81,79)
> x2 <- c(88,84,77,87,81)
> x3 <- c(97,90,87,89,80)
> x4 <- c(94,85,79,84,88)
> Nilai <- c(x1,x2,x3,x4)
> Kelompok <- as.factor(c(rep("A",5),rep("B",5),rep("C",5),rep("D",5)))
> data <- data.frame(Kelompok, Nilai)> library(rmarkdown)
> paged_table(as.data.frame(data))Bentuk data.frame merupakan salah satu cara yang digunakan untuk menyimpan informasi. Ada banyak vektor dari berbagai tipe yang bisa disimpan dalam variabel yang sama, seperti strings, logika, numerik, dan sebagainya.
2.3 Plot
> boxplot(Nilai~Kelompok, data=data, main="Gambar 1. Boxplot Data Hasil Bangkitan",
+ xlab="Kelompok",ylab="Nilai")Pembentukan boxplot dilakukan menggunakan formula Nilai~Kelompok untuk menyatakan bahwa boxplot Nilai dibuat untuk setiap level yang ada di variabel kelompok, x label dan y label untuk identitas grafik. Kemudian, boxplot diberi nama Boxplot Data Hasil Bangkitan.
2.4 ANOVA
> anova <- aov(Nilai~Kelompok, data=data)
> summary(anova)
Df Sum Sq Mean Sq F value Pr(>F)
Kelompok 3 79.7 26.58 0.996 0.42
Residuals 16 427.2 26.70 Pemodelan anova akan dilakukan menggunakan function aov dimana maksud dari Nilai~Kelompok adalah untuk menguji hipotesis apakah Nilai dipengaruhi oleh Kelompok atau tidak.
2.5 Diagnostik Sisaan
> plot(anova, 1)> plot(anova, 2)> plot(anova, 3)2.6 Uji Asumsi
2.6.1 Uji Normalitas Galat
> sisa <- residuals(anova)
> library(tseries)
> jarque.bera.test(sisa)
Jarque Bera Test
data: sisa
X-squared = 0.42095, df = 2, p-value = 0.8102
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.97952, p-value = 0.92772.6.2 Uji Homogenitas Ragam
> library(car)
> leveneTest(Nilai~Kelompok, data=data)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 3 0.0431 0.9877
16 2.6.3 Uji Lanjut BNT dan BNJ
> library(agricolae)
> bnt <- LSD.test(anova, "Kelompok", alpha=0.05)
> bnt$groups
Nilai groups
C 88.6 a
D 86.0 a
A 84.2 a
B 83.4 a
> bnt$means
Nilai std r LCL UCL Min Max Q25 Q50 Q75
A 84.2 4.324350 5 79.30123 89.09877 79 89 81 84 88
B 83.4 4.505552 5 78.50123 88.29877 77 88 81 84 87
C 88.6 6.107373 5 83.70123 93.49877 80 97 87 89 90
D 86.0 5.522681 5 81.10123 90.89877 79 94 84 85 88
> plot(bnt)>
> bnj <- TukeyHSD(anova, conf.level = 0.95)
> bnj
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = Nilai ~ Kelompok, data = data)
$Kelompok
diff lwr upr p adj
B-A -0.8 -10.14989 8.54989 0.9946330
C-A 4.4 -4.94989 13.74989 0.5485509
D-A 1.8 -7.54989 11.14989 0.9449863
C-B 5.2 -4.14989 14.54989 0.4108542
D-B 2.6 -6.74989 11.94989 0.8554048
D-C -2.6 -11.94989 6.74989 0.8554048
> plot(TukeyHSD(anova))3 HASIL DAN PEMBAHASAN
3.1 Statistika Deskriptif
> summary(data)
Kelompok Nilai
A:5 Min. :77.00
B:5 1st Qu.:81.00
C:5 Median :86.00
D:5 Mean :85.55
3rd Qu.:88.25
Max. :97.00 Berdasarkan data yang digunakan, diperoleh nilai rataan sebesar 85.55 dan nilai median sebesar 86.00. Selain itu, diperoleh nilai minimum sebesar 77.00 dan nilai maksimum sebesar 97.00. Pembentukan boxplot pada Gambar 1 menunjukkan bahwa terdapat perbedaan rata-rata nilai antar kelompok. Kelompok C memiliki nilai yang relatif berbeda dengan kelompok yang lain.
3.2 ANOVA
> summary(anova)
Df Sum Sq Mean Sq F value Pr(>F)
Kelompok 3 79.7 26.58 0.996 0.42
Residuals 16 427.2 26.70 Berdasarkan hasil anova di atas, dapat disimpulkan bahwa pada taraf signifikansi 5% (0.05), memiliki rata-rata nilai yang sama. Hal ini dikarenakan p-value sebesar 0.42 > 0.05. Keabsahan hasil ini masih perlu dipastikan melalui pemeriksaan asumsi.
3.3 Diagnostik Sisaan
> plot(anova, 1)Berdasarkan plot residuals vs fitted di atas, menunjukkan bahwa garis merah yang menghubungkan pusat dari 4 kelompok sisaan masih terlihat datar (horizontal), sehingga model dinyatakan sudah tepat.
> plot(anova, 2)Berdasarkan Q-Q plot di atas, menunjukkan bahwa titik-titik berada tidak jauh dari garis dengan sudut 45 derajat antara sumbu X dan Y di kuadran I, sehingga secara grafis tidak ada indikasi pelanggaran normalitas.
> plot(anova, 3)Berdasarkan plot scale-location di atas, menunjukkan bahwa garis merah yang menghubungkan pusat dari 4 kelompok akar sisaan yang dibakukan cenderung terlihat datar (horizontal), sehingga tidak ada indikasi pelanggaran homogenitas.
3.4 Uji Asumsi
3.4.1 Uji Normalitas Galat
> jarque.bera.test(sisa)
Jarque Bera Test
data: sisa
X-squared = 0.42095, df = 2, p-value = 0.8102
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.97952, p-value = 0.9277Berdasarkan hasil uji normalitas galat di atas, dapat disimpulkan bahwa pada taraf signifikansi 5% (0.05), residual berdistribusi normal. Hal ini dikarenakan pada hasil uji Jarque Bera, residual memiliki p-value sebesar 0.8102 dan pada hasil uji Shapiro-Wilk, residual memiliki p-value sebesar 0.9277, dimana kedua p-value tersebut lebih dari 0.05. Olek karena itu, kita dapat melanjutkan ke uji homogenitas ragam.
3.4.2 Uji Homogenitas Ragam
> leveneTest(Nilai~Kelompok, data=data)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 3 0.0431 0.9877
16 Berdasarkan hasil uji Levene di atas, dapat disimpulkan bahwa pada taraf signifikansi 5% (0.05), asumsi kesamaan ragam antar kelompok masih terpenuhi. Hal ini dikarenakan pada hasil uji Levene, p-value sebesar 0.9877 > 0.05.
3.4.3 Uji Lanjut BNT dan BNJ
> plot(bnt)Berdasarkan plot hasil uji BNT di atas, menunjukkan bahwa nilai pada semua kelompok sama secara rata-rata.
> bnj <- TukeyHSD(anova, conf.level = 0.95)
> bnj
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = Nilai ~ Kelompok, data = data)
$Kelompok
diff lwr upr p adj
B-A -0.8 -10.14989 8.54989 0.9946330
C-A 4.4 -4.94989 13.74989 0.5485509
D-A 1.8 -7.54989 11.14989 0.9449863
C-B 5.2 -4.14989 14.54989 0.4108542
D-B 2.6 -6.74989 11.94989 0.8554048
D-C -2.6 -11.94989 6.74989 0.8554048
> plot(TukeyHSD(anova))Berdasarkan hasil uji BNJ di atas, menunjukkan bahwa terdapat 6 pasangan kelompok yang diuji dengan batas bawah dan batas atas SK. Batas bawah dan batas atas SK selisih nilai semua kelompok berbeda tanda yang artinya memuat nol. Selain itu, dapat dilihat juga p-value pada semua pasangan kelompok lebih dari α = 0.05. Hal tersebut dapat disimpulkan bahwa pada taraf signifikansi 5% (0.05), semua pasangan kelompok tidak berbeda signifikan.
Berdasarkan plot hasil uji BNJ di atas, menunjukkan bahwa dari grafik tersebut diperoleh kesimpulan, yaitu batas bawah dan batas atas SK selisih nilai pada semua kelompok berbeda tanda yang artinya memuat nol. Hal tersebut dapat disimpulkan bahwa semua kelompok diperoleh hasil bahwa H0 diterima.
4 DAFTAR PUSTAKA
- http://abdaqurha.blogspot.com/2014/05/makalah-one-way-anova-analysis-of.html?m=1
- http://pascamelisa.blogspot.com/2016/05/tugas-semester-1-pascasarjana.html?m=1
- Sugiyono. 2007. Statistika untuk penelitian. Bandung: Alfabeta.
- Walpole, R.E. 1993. Pengantar Statistika. PT Gramedia Pustaka Utama: Jakarta.