1 Data Explanation

Data Pengeluaran per Kapita yang akan dianalisa merupakan data pengeluaran rata-rata per orang setiap bulannya pada setiap provinsi di Indonesia, data ini dapat menggambarkan biaya hidup pada daerah tertentu setiap tahunnya untuk setiap orang.

sumber : https://www.kaggle.com/datasets/rezkyyayang/pekerja-sejahtera/data?select=peng.df.csv

2 Input data

Tahap awal yang dilakukan adalah dengan membaca data yang akan dianalisa yaitu pengeluaran.df.csv

pengeluaran <- read.csv("data_input/pengeluaran.updt.csv")

pengeluaran

Deskripsi kolom:

  • provinsi = Nama provinsi
  • daerah = informasi daerah dari provinsi yang dibagi berdasarkan PERDESAAN dan PERKOTAAN
  • jenis = jenis pengeluaran berdasarkan MAKANAN atau NON MAKANAN
  • tahun = Tahun data pengeluaran 2007 -2022
  • peng = Rata-rata pengeluaran per kapita tiap bulannya

3 Data Wrangling

3.1 Cek Struktur Data

str(pengeluaran)
#> 'data.frame':    3168 obs. of  5 variables:
#>  $ provinsi: chr  "ACEH" "ACEH" "ACEH" "ACEH" ...
#>  $ daerah  : chr  "PERDESAAN" "PERDESAAN" "PERDESAAN" "PERDESAAN" ...
#>  $ jenis   : chr  "MAKANAN" "MAKANAN" "MAKANAN" "MAKANAN" ...
#>  $ tahun   : int  2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 ...
#>  $ peng    : int  195176 218781 247427 275749 308000 326182 337761 368080 395136 412251 ...

Berdasarkan informasi diatas masih terdapat type data yang kurang tepat pada kolom provinsi, daerah dan jenis, maka perlu dilakukan perubahan type data pada kolom tersebut menjadi type factor

pengeluaran$provinsi <- as.factor(pengeluaran$provinsi)
pengeluaran$daerah <- as.factor(pengeluaran$daerah)
pengeluaran$jenis <- as.factor(pengeluaran$jenis)

cek kembali struktur data setelah dilakukan perubahan type data

str(pengeluaran)
#> 'data.frame':    3168 obs. of  5 variables:
#>  $ provinsi: Factor w/ 34 levels "ACEH","BALI",..: 1 1 1 1 1 1 1 1 1 1 ...
#>  $ daerah  : Factor w/ 2 levels "PERDESAAN","PERKOTAAN": 1 1 1 1 1 1 1 1 1 1 ...
#>  $ jenis   : Factor w/ 3 levels "MAKANAN","NONMAKANAN",..: 1 1 1 1 1 1 1 1 1 1 ...
#>  $ tahun   : int  2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 ...
#>  $ peng    : int  195176 218781 247427 275749 308000 326182 337761 368080 395136 412251 ...

Type data sudah sesuai, selanjutnya mari kita lihat rangkuman dari setiap kolom menggunakan fungsi summary()

summary(pengeluaran)
#>           provinsi          daerah            jenis          tahun     
#>  ACEH         :  96   PERDESAAN:1560   MAKANAN   :1056   Min.   :2007  
#>  BALI         :  96   PERKOTAAN:1608   NONMAKANAN:1056   1st Qu.:2011  
#>  BANTEN       :  96                    TOTAL     :1056   Median :2015  
#>  BENGKULU     :  96                                      Mean   :2015  
#>  DI YOGYAKARTA:  96                                      3rd Qu.:2019  
#>  GORONTALO    :  96                                      Max.   :2022  
#>  (Other)      :2592                                                    
#>       peng        
#>  Min.   :  59216  
#>  1st Qu.: 322052  
#>  Median : 495074  
#>  Mean   : 577660  
#>  3rd Qu.: 739421  
#>  Max.   :2525347  
#> 

3.2 Cek Missing Value

colSums(is.na(pengeluaran))
#> provinsi   daerah    jenis    tahun     peng 
#>        0        0        0        0        0

Ok! data kita sudah sempurna dan siap untuk dilakukan analisa.

4 Data Analysis

4.1 Analisa pengeluaran Indonesia

peng_makanan <- pengeluaran[pengeluaran$jenis == "MAKANAN",]
peng_nmakanan <- pengeluaran[pengeluaran$jenis == "NONMAKANAN",]
peng_total <- pengeluaran[pengeluaran$jenis == "TOTAL",]

4.1.1 Pengeluaran Jenis Makanan

round(mean(peng_makanan$peng))
#> [1] 433483

Rata-rata pengeluaran per orang di Indonesia setiap bulannya untuk membeli makanan adalah sebesar Rp 433,483

4.1.2 Pengeluaran Jenis Non Makanan

round(mean(peng_nmakanan$peng))
#> [1] 433008

Rata-rata pengeluaran per orang di Indonesia setiap bulannya untuk membeli non makanan adalah sebesar Rp 433,008

4.1.3 Pengeluaran Total

round(mean(peng_total$peng))
#> [1] 866491

Rata-rata pengeluaran per orang di Indonesia setiap bulannya untuk membeli semua kebutuhan adalah sebesar Rp 866,491

hist(x = peng_total$peng, breaks = 10)

Berdasarkan plot histogram sebaran pengeluaran terbanyak ada di sekitar Rp 500,000 per orang setiap bulannya

boxplot(peng_total$peng, horizontal = T)

Berdasarkan boxplot terdapat beberapa informasi sebagai berikut :

  • Median dari data pengeluaran kurang lebih sebesar Rp 800,000

  • IQR dari data pengeluaran diantara Rp 500,000 sd Rp 1,200,000

  • Terdapat 4 outlier, dimana dapat dikatakan terdapat 4 provinsi yang memiliki pengeluaran diatas batas wajar

4.2 Analisa Pengeluaran per Provinsi

Terdapat 34 Provinsi pada dataset kita, mari kita coba lihat provinsi mana yang memiliki pengeluaran terbanyak

4.2.1 Pengeluaran berdasarkan Jenis Makanan

peng_prov <- aggregate(x= peng ~ provinsi, data = peng_makanan, FUN = mean)
peng_prov$peng <- round(peng_prov$peng)
peng_prov <- peng_prov[order(peng_prov$peng, decreasing = T),]
head(peng_prov,3)

Berdasarkan informasi diatas dapat diketahui bahwa Top 3 Provinsi dengan pengeluaran pembelian makanan terbesar tiap bulannya terdapat pada provinsi Kalimantan Utara, DKI Jakarta dan Bangka Belitung

4.2.2 Pengeluaran berdasarkan Jenis Non Makanan

peng_provn <- aggregate(x= peng ~ provinsi, data = peng_nmakanan, FUN = mean)
peng_provn$peng <- round(peng_provn$peng)
peng_provn <- peng_prov[order(peng_provn$peng, decreasing = T),]
head(peng_provn,3)

Top 3 Provinsi dengan pengeluaran pembelian non makanan terbesar tiap bulannya terdapat pada provinsi Kalimantan Timur, Bali dan Jambi

4.2.3 Pengeluaran Total

prov_total <- aggregate(x= peng ~ provinsi, data = peng_total, FUN = mean)
prov_total$peng <- round(prov_total$peng)
prov_total <- prov_total[order(prov_total$peng, decreasing = T),]
head(prov_total,3)

Top 3 Provinsi dengan pengeluaran pembelian secara total setiap bulannya terdapat pada provinsi DKI Jakarta, Kalimantan Utara dan Kalimantan Timur

4.2.4 Sebaran data Top 3 Provisi

TOP3_prov <- pengeluaran[pengeluaran$provinsi %in% c("DKI JAKARTA", "KALIMANTAN UTARA", "KALIMANTAN TIMUR"),]

TOP3_prov$provinsi <- droplevels(TOP3_prov$provinsi) 

plot(x= TOP3_prov$provinsi, y= TOP3_prov$peng )

Informasi yang dapat disampaikan atas boxplot diatas adalah sebagai berikut :

  • Median terbesar terdapat pada Provinsi DKI Jakarta
  • Pada Provinsi Kalimantan Timur terdapat outlier yang menandakan adanya pengeluaran yang lebih besar dari biasanya pada tahun tertentu

4.3 Analisa Pengeluaran per Tahun

4.3.1 Pengeluaran Jenis Makanan

peng_makan_tahun <- aggregate(x= peng ~ tahun , data = peng_makanan, FUN = mean)
peng_makan_tahun$peng <- round(peng_makan_tahun$peng)
peng_makan_tahun <- peng_makan_tahun[order(peng_makan_tahun$peng, decreasing = T),]
peng_makan_tahun

Rata-rata pengeluaran pada tahun 2022 untuk jenis makanan adalah sebesar Rp 670,449

Pertumbuhan_m <- ((peng_makan_tahun[peng_makan_tahun$tahun == 2022,2]- peng_makan_tahun[peng_makan_tahun$tahun==2007,2]) /peng_makan_tahun[peng_makan_tahun$tahun == 2007,2])*100 
Pertumbuhan_m
#> [1] 250.9452
Pertumbuhan_m/15 # Rata-rata pertumbuhan per tahun
#> [1] 16.72968

Pertumbuhan pengeluaran pembelian makanan per bulan selama 15 tahun dari 2007 ke 2022 adalah sebesar 251% dengan rata-rata pertumbuhan per tahun adalah 16.7%

4.3.2 Pengeluaran Jenis Non Makanan

peng_nmakan_tahun <- aggregate(x= peng ~ tahun , data = peng_nmakanan, FUN = mean)
peng_nmakan_tahun$peng <- round(peng_nmakan_tahun$peng)
peng_nmakan_tahun <- peng_nmakan_tahun[order(peng_nmakan_tahun$peng, decreasing = T),]
peng_nmakan_tahun

Rata-rata pengeluaran pada tahun 2022 untuk jenis bukan makanan adalah sebesar Rp 653,570

Pertumbuhan_n <- ((peng_nmakan_tahun[peng_nmakan_tahun$tahun == 2022,2]- peng_nmakan_tahun[peng_nmakan_tahun$tahun==2007,2]) /peng_nmakan_tahun[peng_nmakan_tahun$tahun == 2007,2])*100 
Pertumbuhan_n
#> [1] 252.4067
Pertumbuhan_n/15 # Rata-rata pertumbuhan per tahun
#> [1] 16.82712

Pertumbuhan pengeluaran pembelian bukan makanan per bulan selama 15 tahun dari 2007 ke 2022 adalah sebesar 252% dengan rata-rata pertumbuhan per tahun adalah 16.8%

4.3.3 Pengeluaran Total

peng_total_tahun <- aggregate(x= peng ~ tahun , data = peng_total, FUN = mean)
peng_total_tahun$peng <- round(peng_total_tahun$peng)
peng_total_tahun <- peng_total_tahun[order(peng_total_tahun$peng, decreasing = T),]
peng_total_tahun
Pertumbuhan <- ((peng_total_tahun[peng_total_tahun$tahun == 2022,2]- peng_total_tahun[peng_total_tahun$tahun==2007,2]) /peng_total_tahun[peng_total_tahun$tahun == 2007,2])*100 
Pertumbuhan
#> [1] 251.6657
Pertumbuhan/15 # Rata-rata pertumbuhan per tahun
#> [1] 16.77771

Dikarenakan pertumbuhan makanan dan bukan makanan memiliki nilai yang relatif sama maka pertumbuhan total juga sama di 16,77% per tahun

plot(x = peng_total_tahun$tahun, y = peng_total_tahun$peng, type = "o")

Secara line plot dapat terlihat setiap tahunnya mengalami kenaikan yang linier

5 Kesimpulan

  • Rata-rata pengeluaran selama 15 tahun adalah sebesar Rp 866 Ribu per bulan, sedangkan pada tahun 2022 rata-rata pengeluaran per bulan adalah sebesar Rp.1,323 Ribu.

  • Pengeluaran untuk Makanan sedikit lebih besar dibandingkan pengeluaran bukan makanan namun tidak terlalu signifikan

  • Top 3 provinsi dengan pengeluaran terbesar adalah DKI Jakarta, Kalimantan Timur dan Kalimantan Utara

  • Berdasarkan perhitungan pertumbuhan pengeluaran per tahun dapat diprediksi untuk tahun 2023 pengeluaran per bulan akan mengalami kenaikan sebesar 16,7% dari tahun 2022.