Mencari Persamaan Dari Data pengunjung perpustakaan Di Politeknik Harapan Bersama

Data yang digunakan

Data yang saya gunakan adalah data pengunjung perpustakaan Politeknik Harapan Bersama di tahun 2019 dan 2020, dari bulan januari sampai desember.

Petunjuk pengerjaan

  1. Memiliki data yang akan digunakan. Disini saya menggunakan data pengunjung perpustakaan Politeknik harapan Bersama di tahun 2019 dan 2020. Link sumber data : https://drive.google.com/file/d/1LQCRVpZvOXt37luY-KGGhKHfim9be-Vz/view?usp=sharing
  2. Kemudian data tersebut di analisa menggunakan metode ANOVA. ##Tujuan Tujuannya adalah untuk mengetahui persamaan dari kedua data tersebut.

Langkah pengerjaan

Berikut adalah code untuk menampilkan tabel data pengunjung perpustakaan dari file xls format sebelum dilakukannya analisa pengujian dengan metode anova.

library(readxl)
## Warning: package 'readxl' was built under R version 4.0.3
data = read_excel("Data_Pengunjung.xlsx")
data
## # A tibble: 12 x 3
##    Bulan `Tahun 2019` `Tahun 2020`
##    <chr>        <dbl>        <dbl>
##  1 Jan            825         1779
##  2 Feb            580          868
##  3 Mar           2056         2113
##  4 Apr           1266          370
##  5 Mei           1299          158
##  6 Jun            621          962
##  7 Jul           1323         1231
##  8 Agu            172          527
##  9 Sep           1992         1305
## 10 Okt           3166          567
## 11 Nop           1932         1251
## 12 Des           2071          551
View(data)

Selanjutnya adalah gunakan code seperti berikut untuk menampilkan kolom data pengunjung agar lebih mudah untuk melakukan analisa pengujian dengan metode anova.

data = data[,-1]
data
## # A tibble: 12 x 2
##    `Tahun 2019` `Tahun 2020`
##           <dbl>        <dbl>
##  1          825         1779
##  2          580          868
##  3         2056         2113
##  4         1266          370
##  5         1299          158
##  6          621          962
##  7         1323         1231
##  8          172          527
##  9         1992         1305
## 10         3166          567
## 11         1932         1251
## 12         2071          551

Setelah itu Mengubah data dalam tabel kedalam bentuk matrix dengan cara menggabungkan baris data menjadi vektor. Dengan menggunakan fungsi t (matrix transpose) supaya data pengunjung menjadi runtut.

r = c(t(as.matrix(data)))
r
##  [1]  825 1779  580  868 2056 2113 1266  370 1299  158  621  962 1323 1231  172
## [16]  527 1992 1305 3166  567 1932 1251 2071  551

Langkah selanjuthya tentukan variabel baru untuk membuat kategori, level treatment dan data treatment dari value kolom berupa jumlah kolom dan baris sesuai data.

f = c("Tahun 2019", "Tahun 2020")
k = 2 #treatment levels
n = 12 #data tiap treatment

Selanjutnya membuat data factor level sesuai anggota variabel r,dengan cara menggunakan fungsi gl

tm = gl(k, 1, n*k, factor(f))
tm
##  [1] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
##  [7] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
## [13] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
## [19] Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020 Tahun 2019 Tahun 2020
## Levels: Tahun 2019 Tahun 2020

Setelah data sudah dipersiapkan selanjutnya, gunakan fungsi aov untuk uji Anova, kemudian print out hasilnya menggukan fungsi summary.

av = aov(r~tm)
summary(av)
##             Df   Sum Sq Mean Sq F value Pr(>F)
## tm           1  1316485 1316485   2.508  0.128
## Residuals   22 11547794  524900

Kesimpulan

Bisa dilihat dari hasil diatas. Diperoleh hasil dari p-value dengan angka (0,128). Karena p-value(0,128) lebih besar dari level signifikan(0,05), maka hipotesis diterima (data setara), sehingga rata-rata pengunjung dari 2 tahun tersebut sama.