deskripsi data

data yg saya ambil di dapat dari data.go.id tapi karena server down sehingga tidak dapat diakses jadi saya upload ke https://drive.google.com/drive/folders/1wlKG9QlcRvbg634n6X3gwDch08kg53M7?usp=sharing kemudian saya ubah link: https://docs.google.com/spreadsheets/d/1dnxPJG-DOUVnBOkAW0fDM6FoqqEVVOfJ-CA-LrLSt5A/edit?usp=sharing menjadi seperti ini :

library("readxl")
## Warning: package 'readxl' was built under R version 4.0.3
uas.statistik = read.csv("uas statistik.csv")
realisasi_pajak <- uas.statistik
realisasi_pajak
##   realisasipajak     thn2019  thn2018     thn2017     thn2016
## 1    Pajak Hotel 1.76820e+12 1.74e+12 1.56068e+12 1.49980e+12
## 2 Pajak Restoran 3.61526e+12 3.15e+12 2.75038e+12 2.45344e+12
## 3  Pajak Hiburan 8.60666e+11 8.34e+11 7.54536e+11 7.69540e+11
## 4  Pajak Reklame 1.07949e+12 1.02e+12 9.55579e+11 8.94271e+11
## 5   pajak parkir 5.37128e+11 5.13e+11 4.85548e+11 4.65991e+11
## 6    pajak rokok 6.10106e+11 6.32e+11 5.82735e+11 5.31269e+11

##menghapus kolom jenis pajak

realisasi_pajak <- realisasi_pajak[,-1]
realisasi_pajak
##       thn2019  thn2018     thn2017     thn2016
## 1 1.76820e+12 1.74e+12 1.56068e+12 1.49980e+12
## 2 3.61526e+12 3.15e+12 2.75038e+12 2.45344e+12
## 3 8.60666e+11 8.34e+11 7.54536e+11 7.69540e+11
## 4 1.07949e+12 1.02e+12 9.55579e+11 8.94271e+11
## 5 5.37128e+11 5.13e+11 4.85548e+11 4.65991e+11
## 6 6.10106e+11 6.32e+11 5.82735e+11 5.31269e+11

##mengubah data menjadi metrix

baris <- c(t(as.matrix(realisasi_pajak)))
baris
##  [1] 1.76820e+12 1.74000e+12 1.56068e+12 1.49980e+12 3.61526e+12 3.15000e+12
##  [7] 2.75038e+12 2.45344e+12 8.60666e+11 8.34000e+11 7.54536e+11 7.69540e+11
## [13] 1.07949e+12 1.02000e+12 9.55579e+11 8.94271e+11 5.37128e+11 5.13000e+11
## [19] 4.85548e+11 4.65991e+11 6.10106e+11 6.32000e+11 5.82735e+11 5.31269e+11

menentukan treat level dan kolom

a <- c( "thn2019","thn2018","thn2017","thn2016")
b <- 4 #treatment levels
c <- 6 #data tiap treatment dari bulan januari - juni
kolom <- gl(b, 1,c*b, factor(a))
kolom
##  [1] thn2019 thn2018 thn2017 thn2016 thn2019 thn2018 thn2017 thn2016 thn2019
## [10] thn2018 thn2017 thn2016 thn2019 thn2018 thn2017 thn2016 thn2019 thn2018
## [19] thn2017 thn2016 thn2019 thn2018 thn2017 thn2016
## Levels: thn2019 thn2018 thn2017 thn2016

##Anova anova adalah singkatan dari Analysis of variance. Merupakan prosedur uji statistik yang mirip dengan t test. Namun kelebihan dari Anova dapat membadingkan lebih dari 2 kolom

hasil= aov(baris~kolom)
hasil
## Call:
##    aov(formula = baris ~ kolom)
## 
## Terms:
##                        kolom    Residuals
## Sum of Squares  3.409748e+23 1.833005e+25
## Deg. of Freedom            3           20
## 
## Residual standard error: 957341481856
## Estimated effects may be unbalanced
summary(hasil)
##             Df    Sum Sq   Mean Sq F value Pr(>F)
## kolom        3 3.410e+23 1.137e+23   0.124  0.945
## Residuals   20 1.833e+25 9.165e+23

##kesimpulan jadi p -value berada diatas 0.5 yaitu 0.945 yg berarti rerata antar kolom itu sama (h0 benar), maka rereata relisisasi pajak thn 2016 sampai 2019 di dki jakarta itu sama tidak ada perubahan yg signifikan.