--- title: "Perbandingan Jenis pajak thn 2019" author: "Rizky Dwi Saputra- 19090107" date: "12/29/2020" output: html_document --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE) ``` ## data yg diambil saya mengambil data pajak thn 2019 kabupaten tegal dari https://www.data.go.id/dataset/data-realisasi-penerimaan-pajak-daerah-kabupaten-tegal-bulan-april-juni-tahun-2019 dan saya ringkas hanya pada data yg akan dibandingkan saja sehingga hasilnya seperti ini ```{r data pajak, echo=TRUE} penerimaan_pajak <- DATA.PAJAK penerimaan_pajak ``` ```{r data pajak, echo=false} penerimaan_pajak <- DATA.PAJAK penerimaan_pajak ``` dpt kita lihat sepertinya mereka mempunyai rata rata yg berbeda karena kolom pajak.restoran punya 9 digit angka sedangkan pajak.hotel hanya dengan menggunakan level signifikan 0,5 kita buktikan apakah rata ratanya penerimaan pajak dari 4 jenis pajak itu sama. apabila sama maka hipotesis pertama (h0) kenaikan dan penurunaan setiap jenis pajak itu sama itu benar.apabila tidak sama(<0,5) maka hipotesis alternatif(h1) kenaikan dan penurunan pajak itu berbeda beda setiap jenis pajak itu benar. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ ##mengubah data menjadi metrix mengubah data menjadi matrix bisa menggunakan fungsi as.matrix() yg akan membaca semua data numerik di dalam parameter nya apabila ada data yg bukan numerik maka fungsi as.matrix tdk dapat berjalan. fungsi t() utk membuat data yg dibaca per baris /horizontal sehingga jumlah datanya sama dengan kolom/ kelompok yaitu ada 24 yg akan dimasukan ke metode anova dan data matrix tsb akan disimpan di variable r pastikan hasilnya tidak ada tanda double quote/petik dua ("") agar terbaca sebagai numerik dan dapat dimasukan sebagai parameter pada metode aov nanti ```{r data ke matrix} weight <- c(t(as.matrix(penerimaan_pajak))) weight ``` ```{r data ke matrix echo=FALSE} weight <- c(t(as.matrix(penerimaan_pajak))) weight ``` ## menentukan treat level dan row dapat dilihat bahwa ada 4 treatment level(dilihat dari kolom) yaitu PAJAK.HOTEL = penerimaan pajak hotel daerah seperti hotel k PAJAK.RESTORAN = penerimaan pajak hotel daerah PAJAK.HIBURAN = penerimaan pajak hotel daerah PAJAK.REKLAME = penerimaan pajak hotel daerah yg akan disimpan di variable f dan jumlahnya disimpan di variable k dan ada 6 baris data yg merupakan data bulan januari sampai juni yg akan disimpan di variable n dan akan kita ubah seperti metrix sg fungsi gl() jadi fungsi gl memengulang f sampai sampai 6 kali.sehingga isinya sama dengan data yg telah kita ubah jadi matrix yaitu ada 24 (4*6) dan akan dimasukan ke dalam tm sebagai kelompok dan r sebagai bobot sehingga bisa ditetukan bobot setiap kelompok ```{r treat level } Y <- c( "PAJAK HOTEL","PAJAK RESTORAN","PAJAK HIBURAN","PAJAK REKLAME") Yn <- 4 #treatment levels en <- 6 #data tiap treatment dari bulan januari - juni group <- gl(Yn, 5,en*Yn, factor(Y)) group ``` ```{r treat level echo=FALSE} Y <- c( "PAJAK HOTEL","PAJAK RESTORAN","PAJAK HIBURAN","PAJAK REKLAME") Yn <- 4 #treatment levels en <- 6 #data tiap treatment dari bulan januari - juni group <- gl(Yn, 5,en*Yn, factor(Y)) group ``` ##Anova metode perbandingan data dalam statitstika ada banyak salah satunya metode anova hampir sama penggunaannya dengan uji t namun yg membedakan uji t hanya dapat membandingkan dua kelompok sedangkan anova bisa tiga lebih oleh karena itu saya menggunakan anova. sekarang kita sudah tau r dan rm nya kita tinggal memasukannya dalam parameter fungsi aov() sebenarnya ada banyak cara penggunan anova dan hasilnya mungkin berbeda contoh fungsi anova() berbeda dengan fungsi aov di fungsi anova harus menggunakan formula seperti lm.D9 / lm.D90 sehingga kita pelu membuat lm biasa terlebih dahulu kemudian masukan ke formula lm tsb. *note lm = linear model fungsi anova() ini lebih ke kelompok yg besar diatas 1000 bahkan sampai jutaan berikut contoh beragam penggunaan metode anova di r ```{r hasil } summary(aov(weight~group)) summary.aov(lm(weight~group)) anova(lm(weight~group)) anova(lm.D9<-lm(weight~group)) anova(lm.D90<-lm(weight~group-1)) summary(anova(lm.D9<-lm(weight~group))) summary(anova(lm.D90<-lm(weight~group-1))) ``` saya pilih fungsi aov() saja, karena saya ingin mengikuti modul yg diberikan dosen ```{r hasil } hasil_perbandingan = aov(weight~group) hasil_perbandingan summary(hasil_perbandingan) ``` ```{r hasil echo=FALSE} hasil_perbandingan = aov(weight~group) hasil_perbandingan summary(hasil_perbandingan) ``` ##kesimpulan dapat dilihat bahwa p-value (0,907) lebih besar dari level signikan (0,5) maka hipotesis0 diterima (data setara), sehingga rata-rata penerimaan pajak dari 4 jenis pajak itu sama. apa rata rata yg dimaksud ini? akan lebih apabila lihat visualisasi dibawah ##visualisasi ```{r visualisasi} #visualisasi library(ggplot2) ggplot(DATA.PAJAK.for.boxplot, aes(x=as.factor(jenispajak), y=(penerimaanpajak))) + geom_boxplot() ``` ```{r visualisasi, echo=FALSE} #visualisasi library(ggplot2) ggplot(DATA.PAJAK.for.boxplot, aes(x=as.factor(jenispajak), y=(penerimaanpajak))) + geom_boxplot() ``` *note e+08 = 0 nya ada 8(ratus juta) tapi ada juga yg dibawah 100 jt sih. dapat dilihat bahwa sebaran data hampir setara dan posisi mean/rata-rata hampir sama yaitu berada di bawah dekat quartil bawah. nah itulah rerata yg dimaksud sama ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ ##tambahan dapat dilihat penerimaan pajak restoran&reklame lebih tinggi daripada pajak hotel dan hiburan yg berarti di daerah kabupaten tegal pajak restoran dan reklame lebih besae daripada pajak hiburan dan mungkin juga dipengaruhi oleh bertambahnya usaha restoran di desa dg konsep pemandangan sawah sedangkan hotel/homestay di kabupaten tegal sedikit dan lebih banyak di kost kan daripada dibuat hotel. dan kita tahu sendiri bisnis hiburan seperti karaoke, hiburan malam dibatasi agar tidak terjadi penyimpangan masyarakat. semuanya dapat dibuktikan dg data ini