Data yang saya gunakan adalah data pengunjung perpustakaan Politeknik Harapan Bersama di tahun 2019 dan 2020, dari bulan januari sampai desember.
Berikut adalah code untuk menampilkan tabel data pengunjung perpustakaan dari file xls format sebelum dilakukannya analisa pengujian dengan metode anova.
library(readxl)
## Warning: package 'readxl' was built under R version 4.0.3
data = read_excel("Data_Pengunjung.xlsx")
data
## # A tibble: 12 x 3
## Bulan `Tahun 2019` `Tahun 2020`
## <chr> <dbl> <dbl>
## 1 Jan 825 1779
## 2 Feb 580 868
## 3 Mar 2056 2113
## 4 Apr 1266 370
## 5 Mei 1299 158
## 6 Jun 621 962
## 7 Jul 1323 1231
## 8 Agu 172 527
## 9 Sep 1992 1305
## 10 Okt 3166 567
## 11 Nop 1932 1251
## 12 Des 2071 551
View(data)
Selanjutnya adalah gunakan code seperti berikut untuk menampilkan kolom data pengunjung agar lebih mudah untuk melakukan analisa pengujian dengan metode anova.
data = data[,-1]
data
## # A tibble: 12 x 2
## `Tahun 2019` `Tahun 2020`
## <dbl> <dbl>
## 1 825 1779
## 2 580 868
## 3 2056 2113
## 4 1266 370
## 5 1299 158
## 6 621 962
## 7 1323 1231
## 8 172 527
## 9 1992 1305
## 10 3166 567
## 11 1932 1251
## 12 2071 551
Setelah itu Mengubah data dalam tabel kedalam bentuk matrix dengan cara menggabungkan baris data menjadi vektor. Dengan menggunakan fungsi t (matrix transpose) supaya data pengunjung menjadi runtut.
r = c(t(as.matrix(data)))
r
## [1] 825 1779 580 868 2056 2113 1266 370 1299 158 621 962 1323 1231 172
## [16] 527 1992 1305 3166 567 1932 1251 2071 551
Langkah selanjuthya tentukan variabel baru untuk membuat kategori, level treatment dan data treatment dari value kolom berupa jumlah kolom dan baris sesuai data.
f = c("Tahun 2019", "Tahun 2020")
k = 2 #treatment levels
n = 12 #data tiap treatment
Selanjutnya membuat data factor level sesuai anggota variabel r,dengan cara menggunakan fungsi gl
tm = gl(k, 1, n*k, factor(f))
tm
## [1] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
## [7] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
## [13] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
## [19] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
## Levels: Tahun 2019 Tahun 2020
Setelah data sudah dipersiapkan selanjutnya, gunakan fungsi aov untuk uji Anova, kemudian print out hasilnya menggukan fungsi summary.
av = aov(r~tm)
summary(av)
## Df Sum Sq Mean Sq F value Pr(>F)
## tm 1 1316485 1316485 2.508 0.128
## Residuals 22 11547794 524900
Bisa dilihat dari hasil diatas. Diperoleh hasil dari p-value dengan angka (0,128). Karena p-value(0,128) lebih besar dari level signifikan(0,05), maka hipotesis diterima (data setara), sehingga rata-rata pengunjung dari 2 tahun baru tersebut sama.