deskripsi data

data yg saya ambil di dapat dari https://data.go.id/dataset/data-rencana-dan-realisasi-penerimaan-pajak-daerah data tersebut adalah data realisasi pajak thn 2012~2019 saya hanya mengambil thn 2019~2016 saja. kemudian saya ubah link: https://docs.google.com/spreadsheets/d/1dnxPJG-DOUVnBOkAW0fDM6FoqqEVVOfJ-CA-LrLSt5A/edit?usp=sharing menjadi seperti ini :

library("readxl")
## Warning: package 'readxl' was built under R version 4.0.3
uas.statistik = read.csv("uas statistik.csv")
realisasi_pajak <- uas.statistik
realisasi_pajak
##   data.realisasi.pajak.dearak.dki.jakarta     thn2019  thn2018     thn2017
## 1                             Pajak Hotel 1.76820e+12 1.74e+12 1.56068e+12
## 2                          Pajak Restoran 3.61526e+12 3.15e+12 2.75038e+12
## 3                           Pajak Hiburan 8.60666e+11 8.34e+11 7.54536e+11
## 4                           Pajak Reklame 1.07949e+12 1.02e+12 9.55579e+11
## 5                            pajak parkir 5.37128e+11 5.13e+11 4.85548e+11
## 6                            pajhak rokok 6.10106e+11 6.32e+11 5.82735e+11
##       thn2016
## 1 1.49980e+12
## 2 2.45344e+12
## 3 7.69540e+11
## 4 8.94271e+11
## 5 4.65991e+11
## 6 5.31269e+11

menghapus kolom realisasi pajak

karena variable realisasipajak yg berisi jenis pajak tidak digunakan maka kami perlu membuangnya dan juga agar tidak terbaca di langkah berikutnya

realisasi_pajak <- realisasi_pajak[,-1]
realisasi_pajak
##       thn2019  thn2018     thn2017     thn2016
## 1 1.76820e+12 1.74e+12 1.56068e+12 1.49980e+12
## 2 3.61526e+12 3.15e+12 2.75038e+12 2.45344e+12
## 3 8.60666e+11 8.34e+11 7.54536e+11 7.69540e+11
## 4 1.07949e+12 1.02e+12 9.55579e+11 8.94271e+11
## 5 5.37128e+11 5.13e+11 4.85548e+11 4.65991e+11
## 6 6.10106e+11 6.32e+11 5.82735e+11 5.31269e+11

mengubah data menjadi metrix

berikutnya kita akan membaca data setiap baris yg ada di objek relisasi_pajak yg telah kita buat sebelumnya, kita ubah menjadi matrix karena data matrix hanya menyimpan numerik apabila kita menggunakan data.frame itu tidak bagus data.frame nanti ketika baris dan kolom sudah digabungkan. fungsi t()digunakan agar dibaca per baris bukan per kolom, kemudian digabung dengan fungsi c() dan dimasukan ke objek baris.

baris <- c(t(as.matrix(realisasi_pajak)))
baris
##  [1] 1.76820e+12 1.74000e+12 1.56068e+12 1.49980e+12 3.61526e+12 3.15000e+12
##  [7] 2.75038e+12 2.45344e+12 8.60666e+11 8.34000e+11 7.54536e+11 7.69540e+11
## [13] 1.07949e+12 1.02000e+12 9.55579e+11 8.94271e+11 5.37128e+11 5.13000e+11
## [19] 4.85548e+11 4.65991e+11 6.10106e+11 6.32000e+11 5.82735e+11 5.31269e+11

menentukan treat level dan kolom

menetukan kolom agar bisa melihat ada berapa kolomnya dan apa saja kemudian dimasukan ke objek kolom yg nanti akan digunakan sebagai pembanding di fungsi aov

a <- c( "thn2019","thn2018","thn2017","thn2016")
b <- 4 #treatment levels
c <- 6 #data tiap treatment dari bulan januari - juni
kolom <- gl(b, 1,c*b, factor(a))
kolom
##  [1] thn2019 thn2018 thn2017 thn2016 thn2019 thn2018 thn2017 thn2016 thn2019
## [10] thn2018 thn2017 thn2016 thn2019 thn2018 thn2017 thn2016 thn2019 thn2018
## [19] thn2017 thn2016 thn2019 thn2018 thn2017 thn2016
## Levels: thn2019 thn2018 thn2017 thn2016

Anova

anova adalah singkatan dari Analysis of variance. Merupakan prosedur uji statistik yang mirip dengan t test. Namun kelebihan dari Anova dapat membadingkan lebih dari 2 kolom

hasil= aov(baris~kolom)
hasil
## Call:
##    aov(formula = baris ~ kolom)
## 
## Terms:
##                        kolom    Residuals
## Sum of Squares  3.409748e+23 1.833005e+25
## Deg. of Freedom            3           20
## 
## Residual standard error: 957341481856
## Estimated effects may be unbalanced
summary(hasil)
##             Df    Sum Sq   Mean Sq F value Pr(>F)
## kolom        3 3.410e+23 1.137e+23   0.124  0.945
## Residuals   20 1.833e+25 9.165e+23

kesimpulan

jadi p -value berada diatas 0.5 yaitu 0.945 yg berarti rerata antar kolom itu sama (h0 benar), maka rereata relisisasi pajak thn 2016 sampai 2019 di dki jakarta itu sama tidak ada perubahan yg signifikan.

Gambaran

link: https://drive.google.com/file/d/1zblOBKnZ2Xpbu6wU69P4QhSNqrJlUvLY/view?usp=sharing

library("readxl")
boxplot = read.csv("uas statistik boxplot.csv")
library(ggplot2)
ggplot(boxplot, aes(x=as.factor(Tahun), y=(RealisasiPajak))) +
geom_boxplot()

Tambahan

*note e+12 = angka nya ada 12(ratus Milyar) dapat kita lihat bahwa garis tengah (mean) berada di tengah quartil bawah(q1) dan quartil atas(q3) yg berarti reratanya sama. dan dapat kita lihat juga realisasi pajak dki jakarta selalu meningkat setiap tahunnya (kecuali 2015) dan reratanya berada di sekitar 100 milyar sampai 150 milyar