Data yang digunakan adalah data perpustakaan di tahun 2019 dan 2020 dari bulan januari sampai desember. Referensi : https://drive.google.com/file/d/1LQCRVpZvOXt37luY-KGGhKHfim9be-Vz/view?usp=sharing

Tujuannya adalah untuk mengetahui persamaan dari kedua data tersebut.

library(readxl)
## Warning: package 'readxl' was built under R version 4.0.3
data = read_excel("Data_Pengunjung.xlsx")
data
## # A tibble: 12 x 3
##    Bulan `Tahun 2019` `Tahun 2020`
##    <chr>        <dbl>        <dbl>
##  1 Jan            825         1779
##  2 Feb            580          868
##  3 Mar           2056         2113
##  4 Apr           1266          370
##  5 Mei           1299          158
##  6 Jun            621          962
##  7 Jul           1323         1231
##  8 Agu            172          527
##  9 Sep           1992         1305
## 10 Okt           3166          567
## 11 Nop           1932         1251
## 12 Des           2071          551
View(data)

Mengurangi 1 kolom

data = data[,-1]
data
## # A tibble: 12 x 2
##    `Tahun 2019` `Tahun 2020`
##           <dbl>        <dbl>
##  1          825         1779
##  2          580          868
##  3         2056         2113
##  4         1266          370
##  5         1299          158
##  6          621          962
##  7         1323         1231
##  8          172          527
##  9         1992         1305
## 10         3166          567
## 11         1932         1251
## 12         2071          551
r = c(t(as.matrix(data)))
r
##  [1]  825 1779  580  868 2056 2113 1266  370 1299  158  621  962 1323 1231  172
## [16]  527 1992 1305 3166  567 1932 1251 2071  551

Buat variabel baru untuk kategori, level tretment, dan treatment.

f = c("Tahun 2019", "Tahun 2020")
k = 2 #treatment levels
n = 12 #data tiap treatment

Buat factor level sesuai anggota variabel r, gunakan fungsi gl.

tm = gl(k, 1, n*k, factor(f))
tm
##  [1] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
##  [7] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
## [13] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
## [19] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
## Levels: Tahun 2019 Tahun 2020

Gunakan fungsi aov untuk uji Anova, kemudian print out hasilnya menggukan fungsi summary.

av = aov(r~tm)
summary(av)
##             Df   Sum Sq Mean Sq F value Pr(>F)
## tm           1  1316485 1316485   2.508  0.128
## Residuals   22 11547794  524900

Bisa dilihat dari hasil diatas. Karena p-value (0,128) maka hipotesis diterima (data setara), sehingga rata-rata pengunjung dari 2 tahun baru tersebut sama.