Di projek kali ini saya akan membandingkan suatu data, yang mana data ini adalah data iklim kabupaten Tegal. Dari data iklim tersebut, Saya mengambil data suhu yang terdiri dari suhu pada tahun 2017, 2018, dan 2019. Data yang saya gunakan adalah data sampel yang berupa data rata rata suhu udara di setiap bulannya pada tahun 2017, 2018, dan 2019.
Data iklim tersebut saya dapatkan dari publikasi website resmi BPS Kabupaten Tegal https://tegalkab.bps.go.id/ yang diterbitkan dalam format PDF yang kemudian saya pindahkan kedalam dokumen excel (https://drive.google.com/file/d/1hgqdiSmt7q1qZLMJ8ReLwmbF2AKb1nno/view?usp=sharing)
Tujuan dari projek ini adalah untuk mengetahui perbandingan tingkat rata rata suhu dari ke 3 tahun tersebut apakah sama atau setara
Dengan menggunakan level signifikansi 0,05, saya melakukan pengujian apakah rata-rata suhu dari 3 tahun tersebut sama.
Memasukan data suhu
library(readxl)
## Warning: package 'readxl' was built under R version 4.0.3
data = read_excel("C:/data-suhu.xlsx")
data
## # A tibble: 12 x 3
## `suhu udara 2017` `suhu udara 2018` `suhu udara 2019`
## <dbl> <dbl> <dbl>
## 1 27.3 27.8 27.7
## 2 27.3 26.5 27.8
## 3 27.8 27.8 27.7
## 4 28.3 28.5 28.6
## 5 28.4 28.4 28.7
## 6 28.1 27.9 27.5
## 7 27.4 26.9 27
## 8 27.5 27 26.9
## 9 27.9 28 27.4
## 10 28.6 28.8 28.7
## 11 27.9 28.7 29
## 12 27.8 28.3 28.6
terdapat data suhu selama 3 tahun
Gabungkan baris data menjadi vektor. Gunakan fungsi t (matrix transpose)agar nilai urut dengan menu
r = c(t(as.matrix(data)))
r
## [1] 27.3 27.8 27.7 27.3 26.5 27.8 27.8 27.8 27.7 28.3 28.5 28.6 28.4 28.4 28.7
## [16] 28.1 27.9 27.5 27.4 26.9 27.0 27.5 27.0 26.9 27.9 28.0 27.4 28.6 28.8 28.7
## [31] 27.9 28.7 29.0 27.8 28.3 28.6
Buat variabel baru untuk kategori, level treatment, dan data treatment
f = c("suhu udara 2017", "suhu udara 2018", "suhu udara 2019")
k = 3 #treatment levels
n = 12 #data tiap treatment
Buat factor level sesuai anggota variabel r, gunakan fungsi gl
tm = gl(k, 1, n*k, factor(f))
tm
## [1] suhu udara 2017 suhu udara 2018 suhu udara 2019 suhu udara 2017
## [5] suhu udara 2018 suhu udara 2019 suhu udara 2017 suhu udara 2018
## [9] suhu udara 2019 suhu udara 2017 suhu udara 2018 suhu udara 2019
## [13] suhu udara 2017 suhu udara 2018 suhu udara 2019 suhu udara 2017
## [17] suhu udara 2018 suhu udara 2019 suhu udara 2017 suhu udara 2018
## [21] suhu udara 2019 suhu udara 2017 suhu udara 2018 suhu udara 2019
## [25] suhu udara 2017 suhu udara 2018 suhu udara 2019 suhu udara 2017
## [29] suhu udara 2018 suhu udara 2019 suhu udara 2017 suhu udara 2018
## [33] suhu udara 2019 suhu udara 2017 suhu udara 2018 suhu udara 2019
## Levels: suhu udara 2017 suhu udara 2018 suhu udara 2019
Kemudian lakukanlah uji anova dengan menggunakan fungsi aov() pada data vektor dengan factor level kemudian menampilkan hasilnya dengan fungsi summary().
av = aov(r~tm)
summary(av)
## Df Sum Sq Mean Sq F value Pr(>F)
## tm 2 0.077 0.0386 0.092 0.912
## Residuals 33 13.813 0.4186
Kesimpulan
dari hasil pengujian Anova yang ditampilkan diatas, dapat dinyatakan bahwa rata-rata suhu dari data tiga tahun tersebut sama Karena p-value (0,912) lebih besar dari level signikan (0,05) dan hipotesis diterima