Mohamad Rizki Pratama 19090117
Disini saya akan membandingkan data curah hujan yang saya ambil dari data iklim kabupaten tegal yang tersedia selama 3 tahun yaitu tahun 2017 , 2018 dan tahun 2019 yang dijabarkan setiap bulannya.
Data iklim tersebut saya dapatkan dari publikasi website resmi BPS Kabupaten Tegal https://tegalkab.bps.go.id/ yang diterbitkan dalam format PDF yang kemudian saya pindahkan kedalam dokumen excel.
Data Curah Hujan : https://drive.google.com/file/d/1qBlUGapNK-2YqxSNL3LxruB0MCm_RlAz/view?usp=sharing
Pengujian perbandingan dilakukan untuk mengetahui apakah rata-rata data curah hujan setiap tahun dari ketiga tahun tersebut setara atau sama.
Pengujian dilakukan menggunakan Anova karena jumlah kelompok uji data melebihi 2 kelompok data.
Pengujian dilakukan dengan level signifikan 0,05
Memasukan data curah hujan
library(readxl)
## Warning: package 'readxl' was built under R version 4.0.3
data_perbandingan = read_excel("E:/data_curah_hujan_kabtegal_2017-2019.xlsx")
head(data_perbandingan)
## # A tibble: 6 x 3
## `curah.hujan 2017` `curah.hujan 2018` `curah.hujan 2019`
## <dbl> <dbl> <dbl>
## 1 363. 83.4 492.
## 2 394. 551. 365.
## 3 150. 255 372.
## 4 108. 154. 257.
## 5 86.1 53.2 8.1
## 6 46.6 30.4 0
Menggabungkan data menjadi vektor
Menggabungkan baris data menjadi vektor menggunakan fungsi t (matrix transpose) untuk mengurutkan nilai agar sesuai menu.
r = c(t(as.matrix(data_perbandingan)))
r
## [1] 363.2 83.4 492.5 394.3 551.4 365.2 149.5 255.0 372.3 108.1 154.3 257.1
## [13] 86.1 53.2 8.1 46.6 30.4 0.0 73.4 0.0 7.0 4.0 0.0 0.0
## [25] 49.8 7.2 0.0 21.6 14.8 89.1 173.7 35.0 30.3 228.2 183.7 385.0
Membuat variabel baru untuk menentukan kategori (kelompok) uji, Jumlah Kelompok Uji, jumlah data yang terdapat pada setiap kelompok uji.
f = c("curah.hujan 2017", "curah.hujan 2018", "curah.hujan 2019")
k = 3 #jumlah kelompok uji
n = 12 #jumlah data tiap kelompok uji
Membuat factor level
Membuat factor level sesuai anggota variabel r yang merupakan varibel yang menampung data_perbandingan yang telah diurutkan menjadi data vektor tadi dengan menggunakan fungsi gl().
tm = gl(k, 1, n*k, factor(f))
tm
## [1] curah.hujan 2017 curah.hujan 2018 curah.hujan 2019 curah.hujan 2017
## [5] curah.hujan 2018 curah.hujan 2019 curah.hujan 2017 curah.hujan 2018
## [9] curah.hujan 2019 curah.hujan 2017 curah.hujan 2018 curah.hujan 2019
## [13] curah.hujan 2017 curah.hujan 2018 curah.hujan 2019 curah.hujan 2017
## [17] curah.hujan 2018 curah.hujan 2019 curah.hujan 2017 curah.hujan 2018
## [21] curah.hujan 2019 curah.hujan 2017 curah.hujan 2018 curah.hujan 2019
## [25] curah.hujan 2017 curah.hujan 2018 curah.hujan 2019 curah.hujan 2017
## [29] curah.hujan 2018 curah.hujan 2019 curah.hujan 2017 curah.hujan 2018
## [33] curah.hujan 2019 curah.hujan 2017 curah.hujan 2018 curah.hujan 2019
## Levels: curah.hujan 2017 curah.hujan 2018 curah.hujan 2019
Melakukan pengujian Anova
Menggunakan fungsi aov() untuk uji Anova pada data vektor dengan factor level kemudian menampilkan hasilnya dengan fungsi summary().
av = aov(r~tm)
summary(av)
## Df Sum Sq Mean Sq F value Pr(>F)
## tm 2 16978 8489 0.323 0.726
## Residuals 33 866274 26251
dari hasil pengujian Anova yang ditampilkan diatas, dapat dinyatakan bahwa rata-rata curah hujan dari data tiga tahun tersebut sama Karena p-value (0,726) lebih besar dari level signikan (0,05) dan hipotesis diterima.