Perbadingan data Curah Hujan Antar Tahun 2017, 2018, & 2019 Di Kabupaten Tegal Menggunakan Anova

Mohamad Rizki Pratama 19090117


Disini saya akan membandingkan data curah hujan yang saya ambil dari data iklim kabupaten tegal yang tersedia selama 3 tahun yaitu tahun 2017 , 2018 dan tahun 2019 yang dijabarkan setiap bulannya.

Data iklim tersebut saya dapatkan dari publikasi website resmi BPS Kabupaten Tegal https://tegalkab.bps.go.id/ yang diterbitkan dalam format PDF yang kemudian saya pindahkan kedalam dokumen excel.

Data Curah Hujan : https://drive.google.com/file/d/1qBlUGapNK-2YqxSNL3LxruB0MCm_RlAz/view?usp=sharing

Pengujian perbandingan dilakukan untuk mengetahui apakah rata-rata data curah hujan setiap tahun dari ketiga tahun tersebut setara atau sama.

Pengujian dilakukan menggunakan Anova karena jumlah kelompok uji data melebihi 2 kelompok data.

Pengujian dilakukan dengan level signifikan 0,05


Memasukan data curah hujan

library(readxl)
## Warning: package 'readxl' was built under R version 4.0.3
data_perbandingan = read_excel("E:/data_curah_hujan_kabtegal_2017-2019.xlsx")
head(data_perbandingan)
## # A tibble: 6 x 3
##   `curah.hujan 2017` `curah.hujan 2018` `curah.hujan 2019`
##                <dbl>              <dbl>              <dbl>
## 1              363.                83.4              492. 
## 2              394.               551.               365. 
## 3              150.               255                372. 
## 4              108.               154.               257. 
## 5               86.1               53.2                8.1
## 6               46.6               30.4                0


Menggabungkan data menjadi vektor

Menggabungkan baris data menjadi vektor menggunakan fungsi t (matrix transpose) untuk mengurutkan nilai agar sesuai menu.

r = c(t(as.matrix(data_perbandingan))) 

r    
##  [1] 363.2  83.4 492.5 394.3 551.4 365.2 149.5 255.0 372.3 108.1 154.3 257.1
## [13]  86.1  53.2   8.1  46.6  30.4   0.0  73.4   0.0   7.0   4.0   0.0   0.0
## [25]  49.8   7.2   0.0  21.6  14.8  89.1 173.7  35.0  30.3 228.2 183.7 385.0


Membuat variabel baru untuk menentukan kategori (kelompok) uji, Jumlah Kelompok Uji, jumlah data yang terdapat pada setiap kelompok uji.

f = c("curah.hujan 2017", "curah.hujan 2018", "curah.hujan 2019") 
k = 3 #jumlah kelompok uji  
n = 12 #jumlah data tiap kelompok uji


Membuat factor level

Membuat factor level sesuai anggota variabel r yang merupakan varibel yang menampung data_perbandingan yang telah diurutkan menjadi data vektor tadi dengan menggunakan fungsi gl().

tm = gl(k, 1, n*k, factor(f)) 
tm 
##  [1] curah.hujan 2017 curah.hujan 2018 curah.hujan 2019 curah.hujan 2017
##  [5] curah.hujan 2018 curah.hujan 2019 curah.hujan 2017 curah.hujan 2018
##  [9] curah.hujan 2019 curah.hujan 2017 curah.hujan 2018 curah.hujan 2019
## [13] curah.hujan 2017 curah.hujan 2018 curah.hujan 2019 curah.hujan 2017
## [17] curah.hujan 2018 curah.hujan 2019 curah.hujan 2017 curah.hujan 2018
## [21] curah.hujan 2019 curah.hujan 2017 curah.hujan 2018 curah.hujan 2019
## [25] curah.hujan 2017 curah.hujan 2018 curah.hujan 2019 curah.hujan 2017
## [29] curah.hujan 2018 curah.hujan 2019 curah.hujan 2017 curah.hujan 2018
## [33] curah.hujan 2019 curah.hujan 2017 curah.hujan 2018 curah.hujan 2019
## Levels: curah.hujan 2017 curah.hujan 2018 curah.hujan 2019


Melakukan pengujian Anova

Menggunakan fungsi aov() untuk uji Anova pada data vektor dengan factor level kemudian menampilkan hasilnya dengan fungsi summary().

av = aov(r~tm) 
summary(av)
##             Df Sum Sq Mean Sq F value Pr(>F)
## tm           2  16978    8489   0.323  0.726
## Residuals   33 866274   26251

dari hasil pengujian Anova yang ditampilkan diatas, dapat dinyatakan bahwa rata-rata curah hujan dari data tiga tahun tersebut sama Karena p-value (0,726) lebih besar dari level signikan (0,05) dan hipotesis diterima.