Perbadingan Data Kelembaban Udara Antar Tahun 2017, 2018, & 2019 Di Kabupaten Tegal Menggunakan Anova

Moh. Syaefudin Fikri 19090101

Disini saya akan membandingkan data kelembaban udara yang saya ambil dari data iklim kabupaten tegal yang tersedia selama 3 tahun yaitu tahun 2017 , 2018 dan tahun 2019 yang dijabarkan setiap bulannya.

Data iklim tersebut saya dapatkan dari publikasi website resmi BPS Kabupaten Tegal https://tegalkab.bps.go.id/ yang diterbitkan dalam format PDF yang kemudian saya pindahkan kedalam dokumen excel.

Pengujian perbandingan dilakukan untuk mengetahui apakah rata-rata data kelembaban udara setiap tahun dari ketiga tahun tersebut setara atau sama.

Pengujian dilakukan menggunakan Anova karena jumlah kelompok uji data melebihi 2 kelompok data.

Memasukan data kelembaban udara

library(readxl)
## Warning: package 'readxl' was built under R version 4.0.3
data_perbandingan = read_excel("F:/msfikri/semester3/Statistika/perbandingan kelembaban udara.xlsx")
head(data_perbandingan)
## # A tibble: 6 x 3
##   `kelembaban.udara 2017` `kelembaban.udara 2018` `kelembaban.udara 2019`
##                     <dbl>                   <dbl>                   <dbl>
## 1                      85                      80                      82
## 2                      84                      86                      81
## 3                      81                      80                      81
## 4                      79                      79                      79
## 5                      78                      76                      75
## 6                      79                      76                      73

Menggabungkan data menjadi vektor

Menggabungkan baris data menjadi vektor menggunakan fungsi t (matrix transpose) untuk mengurutkan nilai agar sesuai data kelembaban udara.

r = c(t(as.matrix(data_perbandingan)))
r
##  [1] 85 80 82 84 86 81 81 80 81 79 79 79 78 76 75 79 76 73 75 71 72 71 68 70 72
## [26] 69 70 74 69 69 79 74 71 80 76 78

Membuat variabel baru untuk menentukan kategori (kelompok) uji, Jumlah kelompok uji, jumlah data yang tersedia pada setiap kelompok uji.

f = c("kelembaban.udara 2017", "kelembaban.udara 2018", "kelembaban.udara 2019") 
k = 3 #jumlah kelompok uji 
n = 12 #jumlah data yang tersedia pada setiap kelompok uji

Membuat Factor Level

Membuat factor level sesuai anggota variabel r yang merupakan varibel yang menampung data_perbandingan yang telah diurutkan menjadi data vektor dengan menggunakan fungsi gl().

tm = gl(k, 1, n*k, factor(f)) 
tm 
##  [1] kelembaban.udara 2017 kelembaban.udara 2018 kelembaban.udara 2019
##  [4] kelembaban.udara 2017 kelembaban.udara 2018 kelembaban.udara 2019
##  [7] kelembaban.udara 2017 kelembaban.udara 2018 kelembaban.udara 2019
## [10] kelembaban.udara 2017 kelembaban.udara 2018 kelembaban.udara 2019
## [13] kelembaban.udara 2017 kelembaban.udara 2018 kelembaban.udara 2019
## [16] kelembaban.udara 2017 kelembaban.udara 2018 kelembaban.udara 2019
## [19] kelembaban.udara 2017 kelembaban.udara 2018 kelembaban.udara 2019
## [22] kelembaban.udara 2017 kelembaban.udara 2018 kelembaban.udara 2019
## [25] kelembaban.udara 2017 kelembaban.udara 2018 kelembaban.udara 2019
## [28] kelembaban.udara 2017 kelembaban.udara 2018 kelembaban.udara 2019
## [31] kelembaban.udara 2017 kelembaban.udara 2018 kelembaban.udara 2019
## [34] kelembaban.udara 2017 kelembaban.udara 2018 kelembaban.udara 2019
## 3 Levels: kelembaban.udara 2017 ... kelembaban.udara 2019

Melakukan Pengujian Anova

Menggunakan fungsi aov() untuk uji Anova pada data vektor dengan factor level kemudian menampilkan hasilnya dengan fungsi summary().

av = aov(r~tm) 
summary(av)
##             Df Sum Sq Mean Sq F value Pr(>F)
## tm           2   66.5   33.25   1.374  0.267
## Residuals   33  798.5   24.20

jadi, dari hasil pengujian Anova yang ditampilkan diatas, dapat dinyatakan bahwa rata-rata kelembaban udara dari data tiga tahun tersebut sama Karena p-value (0,267) lebih besar dari level signikan (0,05) dan hipotesis diterima.