Data Pengeluaran per Kapita yang akan dianalisa merupakan data pengeluaran rata-rata per orang setiap bulannya pada setiap provinsi di Indonesia, data ini dapat menggambarkan biaya hidup pada daerah tertentu setiap tahunnya untuk setiap orang.
sumber : https://www.kaggle.com/datasets/rezkyyayang/pekerja-sejahtera/data?select=peng.df.csv
Tahap awal yang dilakukan adalah dengan membaca data yang akan
dianalisa yaitu pengeluaran.df.csv
Deskripsi kolom:
provinsi = Nama provinsidaerah = informasi daerah dari provinsi yang dibagi
berdasarkan PERDESAAN dan PERKOTAANjenis = jenis pengeluaran berdasarkan
MAKANAN atau NON MAKANANtahun = Tahun data pengeluaran 2007 -2022peng = Rata-rata pengeluaran per kapita tiap
bulannya#> 'data.frame': 3168 obs. of 5 variables:
#> $ provinsi: chr "ACEH" "ACEH" "ACEH" "ACEH" ...
#> $ daerah : chr "PERDESAAN" "PERDESAAN" "PERDESAAN" "PERDESAAN" ...
#> $ jenis : chr "MAKANAN" "MAKANAN" "MAKANAN" "MAKANAN" ...
#> $ tahun : int 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 ...
#> $ peng : int 195176 218781 247427 275749 308000 326182 337761 368080 395136 412251 ...
Berdasarkan informasi diatas masih terdapat type data yang kurang
tepat pada kolom provinsi, daerah dan jenis, maka perlu dilakukan
perubahan type data pada kolom tersebut menjadi type
factor
pengeluaran$provinsi <- as.factor(pengeluaran$provinsi)
pengeluaran$daerah <- as.factor(pengeluaran$daerah)
pengeluaran$jenis <- as.factor(pengeluaran$jenis)cek kembali struktur data setelah dilakukan perubahan type data
#> 'data.frame': 3168 obs. of 5 variables:
#> $ provinsi: Factor w/ 34 levels "ACEH","BALI",..: 1 1 1 1 1 1 1 1 1 1 ...
#> $ daerah : Factor w/ 2 levels "PERDESAAN","PERKOTAAN": 1 1 1 1 1 1 1 1 1 1 ...
#> $ jenis : Factor w/ 3 levels "MAKANAN","NONMAKANAN",..: 1 1 1 1 1 1 1 1 1 1 ...
#> $ tahun : int 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 ...
#> $ peng : int 195176 218781 247427 275749 308000 326182 337761 368080 395136 412251 ...
Type data sudah sesuai, selanjutnya mari kita lihat rangkuman dari setiap kolom menggunakan fungsi summary()
#> provinsi daerah jenis tahun
#> ACEH : 96 PERDESAAN:1560 MAKANAN :1056 Min. :2007
#> BALI : 96 PERKOTAAN:1608 NONMAKANAN:1056 1st Qu.:2011
#> BANTEN : 96 TOTAL :1056 Median :2015
#> BENGKULU : 96 Mean :2015
#> DI YOGYAKARTA: 96 3rd Qu.:2019
#> GORONTALO : 96 Max. :2022
#> (Other) :2592
#> peng
#> Min. : 59216
#> 1st Qu.: 322052
#> Median : 495074
#> Mean : 577660
#> 3rd Qu.: 739421
#> Max. :2525347
#>
peng_makanan <- pengeluaran[pengeluaran$jenis == "MAKANAN",]
peng_nmakanan <- pengeluaran[pengeluaran$jenis == "NONMAKANAN",]
peng_total <- pengeluaran[pengeluaran$jenis == "TOTAL",]#> [1] 433483
Rata-rata pengeluaran per orang di Indonesia setiap bulannya untuk membeli makanan adalah sebesar Rp 433,483
#> [1] 433008
Rata-rata pengeluaran per orang di Indonesia setiap bulannya untuk membeli non makanan adalah sebesar Rp 433,008
#> [1] 866491
Rata-rata pengeluaran per orang di Indonesia setiap bulannya untuk membeli semua kebutuhan adalah sebesar Rp 866,491
Berdasarkan plot histogram sebaran pengeluaran terbanyak ada di sekitar
Rp 500,000 per orang setiap bulannya
Berdasarkan boxplot terdapat beberapa informasi sebagai berikut :
Median dari data pengeluaran kurang lebih sebesar Rp 800,000
IQR dari data pengeluaran diantara Rp 500,000 sd Rp 1,200,000
Terdapat 4 outlier, dimana dapat dikatakan terdapat 4 provinsi yang memiliki pengeluaran diatas batas wajar
Terdapat 34 Provinsi pada dataset kita, mari kita coba lihat provinsi mana yang memiliki pengeluaran terbanyak
peng_prov <- aggregate(x= peng ~ provinsi, data = peng_makanan, FUN = mean)
peng_prov$peng <- round(peng_prov$peng)
peng_prov <- peng_prov[order(peng_prov$peng, decreasing = T),]
head(peng_prov,3)Berdasarkan informasi diatas dapat diketahui bahwa Top 3 Provinsi
dengan pengeluaran pembelian makanan terbesar tiap bulannya
terdapat pada provinsi Kalimantan Utara,
DKI Jakarta dan Bangka Belitung
peng_provn <- aggregate(x= peng ~ provinsi, data = peng_nmakanan, FUN = mean)
peng_provn$peng <- round(peng_provn$peng)
peng_provn <- peng_prov[order(peng_provn$peng, decreasing = T),]
head(peng_provn,3)Top 3 Provinsi dengan pengeluaran pembelian non makanan
terbesar tiap bulannya terdapat pada provinsi
Kalimantan Timur, Bali dan
Jambi
prov_total <- aggregate(x= peng ~ provinsi, data = peng_total, FUN = mean)
prov_total$peng <- round(prov_total$peng)
prov_total <- prov_total[order(prov_total$peng, decreasing = T),]
head(prov_total,3)Top 3 Provinsi dengan pengeluaran pembelian secara total setiap
bulannya terdapat pada provinsi DKI Jakarta,
Kalimantan Utara dan Kalimantan Timur
TOP3_prov <- pengeluaran[pengeluaran$provinsi %in% c("DKI JAKARTA", "KALIMANTAN UTARA", "KALIMANTAN TIMUR"),]
TOP3_prov$provinsi <- droplevels(TOP3_prov$provinsi)
plot(x= TOP3_prov$provinsi, y= TOP3_prov$peng )
Informasi yang dapat disampaikan atas boxplot diatas adalah sebagai
berikut :
DKI Jakartapeng_makan_tahun <- aggregate(x= peng ~ tahun , data = peng_makanan, FUN = mean)
peng_makan_tahun$peng <- round(peng_makan_tahun$peng)
peng_makan_tahun <- peng_makan_tahun[order(peng_makan_tahun$peng, decreasing = T),]
peng_makan_tahunRata-rata pengeluaran pada tahun 2022 untuk jenis makanan adalah sebesar Rp 670,449
Pertumbuhan_m <- ((peng_makan_tahun[peng_makan_tahun$tahun == 2022,2]- peng_makan_tahun[peng_makan_tahun$tahun==2007,2]) /peng_makan_tahun[peng_makan_tahun$tahun == 2007,2])*100
Pertumbuhan_m#> [1] 250.9452
#> [1] 16.72968
Pertumbuhan pengeluaran pembelian makanan per bulan selama 15 tahun dari 2007 ke 2022 adalah sebesar 251% dengan rata-rata pertumbuhan per tahun adalah 16.7%
peng_nmakan_tahun <- aggregate(x= peng ~ tahun , data = peng_nmakanan, FUN = mean)
peng_nmakan_tahun$peng <- round(peng_nmakan_tahun$peng)
peng_nmakan_tahun <- peng_nmakan_tahun[order(peng_nmakan_tahun$peng, decreasing = T),]
peng_nmakan_tahunRata-rata pengeluaran pada tahun 2022 untuk jenis bukan makanan adalah sebesar Rp 653,570
Pertumbuhan_n <- ((peng_nmakan_tahun[peng_nmakan_tahun$tahun == 2022,2]- peng_nmakan_tahun[peng_nmakan_tahun$tahun==2007,2]) /peng_nmakan_tahun[peng_nmakan_tahun$tahun == 2007,2])*100
Pertumbuhan_n#> [1] 252.4067
#> [1] 16.82712
Pertumbuhan pengeluaran pembelian bukan makanan per bulan selama 15 tahun dari 2007 ke 2022 adalah sebesar 252% dengan rata-rata pertumbuhan per tahun adalah 16.8%
peng_total_tahun <- aggregate(x= peng ~ tahun , data = peng_total, FUN = mean)
peng_total_tahun$peng <- round(peng_total_tahun$peng)
peng_total_tahun <- peng_total_tahun[order(peng_total_tahun$peng, decreasing = T),]
peng_total_tahunPertumbuhan <- ((peng_total_tahun[peng_total_tahun$tahun == 2022,2]- peng_total_tahun[peng_total_tahun$tahun==2007,2]) /peng_total_tahun[peng_total_tahun$tahun == 2007,2])*100
Pertumbuhan#> [1] 251.6657
#> [1] 16.77771
Dikarenakan pertumbuhan makanan dan bukan makanan memiliki nilai yang relatif sama maka pertumbuhan total juga sama di 16,77% per tahun
Secara line plot dapat terlihat setiap tahunnya mengalami kenaikan yang
linier
Rata-rata pengeluaran selama 15 tahun adalah sebesar Rp 866 Ribu per bulan, sedangkan pada tahun 2022 rata-rata pengeluaran per bulan adalah sebesar Rp.1,323 Ribu.
Pengeluaran untuk Makanan sedikit lebih besar dibandingkan pengeluaran bukan makanan namun tidak terlalu signifikan
Top 3 provinsi dengan pengeluaran terbesar adalah DKI Jakarta, Kalimantan Timur dan Kalimantan Utara
Berdasarkan perhitungan pertumbuhan pengeluaran per tahun dapat diprediksi untuk tahun 2023 pengeluaran per bulan akan mengalami kenaikan sebesar 16,7% dari tahun 2022.