library(readxl)
## Warning: package 'readxl' was built under R version 4.0.3
data = read_excel("Data_Pengunjung.xlsx")
data
## # A tibble: 12 x 3
## Bulan `Tahun 2019` `Tahun 2020`
## <chr> <dbl> <dbl>
## 1 Jan 825 1779
## 2 Feb 580 868
## 3 Mar 2056 2113
## 4 Apr 1266 370
## 5 Mei 1299 158
## 6 Jun 621 962
## 7 Jul 1323 1231
## 8 Agu 172 527
## 9 Sep 1992 1305
## 10 Okt 3166 567
## 11 Nop 1932 1251
## 12 Des 2071 551
View(data)
Mengurangi 1 kolom
data = data[,-1]
data
## # A tibble: 12 x 2
## `Tahun 2019` `Tahun 2020`
## <dbl> <dbl>
## 1 825 1779
## 2 580 868
## 3 2056 2113
## 4 1266 370
## 5 1299 158
## 6 621 962
## 7 1323 1231
## 8 172 527
## 9 1992 1305
## 10 3166 567
## 11 1932 1251
## 12 2071 551
r = c(t(as.matrix(data)))
r
## [1] 825 1779 580 868 2056 2113 1266 370 1299 158 621 962 1323 1231 172
## [16] 527 1992 1305 3166 567 1932 1251 2071 551
Buat variabel baru untuk kategori, level tretment, dan treatment.
f = c("Tahun 2019", "Tahun 2020")
k = 2 #treatment levels
n = 12 #data tiap treatment
Buat factor level sesuai anggota variabel r, gunakan fungsi gl.
tm = gl(k, 1, n*k, factor(f))
tm
## [1] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
## [7] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
## [13] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
## [19] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
## Levels: Tahun 2019 Tahun 2020
Gunakan fungsi aov untuk uji Anova, kemudian print out hasilnya menggukan fungsi summary.
av = aov(r~tm)
summary(av)
## Df Sum Sq Mean Sq F value Pr(>F)
## tm 1 1316485 1316485 2.508 0.128
## Residuals 22 11547794 524900
Bisa dilihat dari hasil diatas. Karena p-value (0,128) maka hipotesis diterima (data setara), sehingga rata-rata pengunjung dari 2 tahun baru tersebut sama.