1 PENDAHULUAN

1.1 Latar Belakang

Pendapatan adalah jumlah masukan yang didapat atas jasa yang diberikan oleh perusahaan atau perorangan yang bisa meliputi penjualan produk dan atau jasa kepada pelanggan yang diperoleh dalam suatu aktivitas operasi suatu perusahaan untuk meningkatkan nilai aset serta menurunkan liabilitas yang timbul dalam penyerahan barang atau jasa. Pendapatkan dapat dibedakan menjadi 2, yaitu pendapatan bersih dan pendapatan kotor. Pendapatan bersih merupakan sisa pendapatan murni yang dikurang dengan biaya pajak, suku bunga, biaya transportasi, maupun biaya produksi. Pendapatan kotor merupakan jumlah seluruh pendapatan murni yang diterima.
Pendapatan bersih dan pendapatan kotor setiap orang berbeda, maka dari itu penelitian ini dilakukan untuk menganalisis apakah terdapat perbedaan rata rata pendapatan bersih sebulan pekerja bekerja sendiri menurut kelompok umur. Apakah pendapatan bersih pekerja berumur 15 sampai dengan 24 tahun berbeda dengan pendapatan bersih pekerja berumur 25 sampai dengan 54 tahun, dan berbeda dengan pendapatan bersih pekerja berumur 55 tahun keatas. Data diambil dari badan pusat statistik Indonesia.

1.2 Statistika

Statistika adalah ilmu yang mempelajari cara pengumpulan, penyajian, menganalisis, dan mengambil kesimpulan dari data secara umum yang berdasarkan atas hasil dari penelitian menyeluruh yang sudah dilakukan. Metode statistika yaitu prosedur yang dipakai dalam pengumpulan, penyajian, dan penafsiran data. Metode-metode tersebut dikelompokkan dalam dua kelompok, yaitu statistka deskriptif dan statistika inferensial.

1.2.1 Statistika Deskriptif

Dengan Statistika deskriptif, kumpulan data bisa tersaji dengan ringkas dan rapi serta mampu memberikan informasi inti dari kumpulan data yang ada. Informasi yang diperoleh dari statistika deskriptif ini antara lain ukuran pemusatan data, ukuran penyebaran data, serta kecenderungan suatu gugus data. Penyajian data dalam bentuk grafis yaitu :

  • Histogram
  • Pie Chart
  • Ogive
  • Poligon
  • Diagram Batang Daun (Stem and Leaf)

Penyajian data secara numerik memiliki beberapa bentuk, yaitu :

  • Central Tredency
  • Fractile
  • Skewness
  • Pengukuran Keruncingan
  • Dispersion / pencaran

1.2.2 Statistika Inferensial

Statistik inferensia yaitu sebuah sebuah metode yang mampu dipakai untuk menganalisis kelompok kecil dari data induknya atau sample yang diambil dari populasi sampai pada peramalan dan penarikan kesimpulan pada kelompok data induknya atau populasi. Berdasarkan ruang lingkup bahasannya, statistika inferensial mencakup :

  • Probabilitas atau teori kemungkinan
  • Distribusi teoritis
  • Analisis kovarians
  • Sampling dan sampling distribusi
  • Pendugaan populasi atau teori populasi
  • ANOVA
  • Uji Hipotesis
  • Analisis korelasi dan uji signifikasi
  • Analisis regresi untuk peramalan

Statistika deskriptif hanya terbatas pada menyajikan data bentuk tabel, diagram, dan grafik; sedangkan statistik inferensial mampu dipakai untuk melakukan estimasi dan penarikan kesimpulan terhadap populasi dari sampelnya. Untuk sampai pada penarikan kesimpulan statistik inferensia melalui tahap uji hipotesis dan uji statistik.

1.3 ANOVA

Varians merupakan besaran yang menunjukkan ukuran penyebaran data, serta dapat menunjukkan homogenitas data. Analisis Varians, atau lebih dikenal dengan ANOVA (Analysis of Variance), merupakan metode analisis statistika yang menguraikan keragaman total menjadi beberapa komponen yang mengukur berbagai komponen keragaman. Komponen-komponen tersebut sebisa mungkin bebas satu sama lain.

1.3.1 Perlakuan, Faktor, dan Level

  • Perlakuan merupakan sekumpulan kondisi tertentu yang diberikan kepada setiap satuan percobaan.
  • Faktor merupakan gugus perlakuan-perlakuan yang mempunyai ciri sama.
  • Tiap perlakuan dalam faktor disebut taraf atau level dari faktor tersebut.
  • Taraf dapat bersifat kualitatif maupun kuantitatif.

1.3.2 Jenis ANOVA

Jenisnya adalah berdasarkan jumlah variabel faktor (independen variable atau variabel bebas) dan jumlah variabel responsen (dependent variable atau variabel terikat). Pembagiannya adalah sebagai berikut:

Univariat :

  • Univariate One Way ANOVA : Apabila variabel bebas dan variabel terikat jumlahnya satu.
  • Univariate Two Way ANOVA : Apabila variabel bebas ada 2, sedangkan variabel terikat ada satu.
  • Univariate Multi way ANOVA : Apabila variabel bebas ada > 2, sedangkan variabel terikat ada satu.

Multivariat :

  • Multivariate One Way ANOVA : Apabila variabel bebas dan variabel terikat jumlahnya lebih dari satu.
  • Multivariate Two Way ANOVA : Apabila variabel bebas ada 2, sedangkan variabel terikat jumlahnya lebih dari satu.
  • Multivariate Multi way ANOVA : Apabila variabel bebas ada > 2, sedangkan variabel terikat jumlahnya lebih dari satu.

1.4 Asumsi Dasar

Ada beberapa asumsi yang harus dipenuhi dalam model ANOVA, yaitu :

1.4.1 Pengaruh Aditif

  • Pengaruh perlakuan dan kelompok dikatakan aditif apabila pengaruh perlakuan selalu tetap pada setiap ulangan atau kelompok.
  • Tidak ada pengaruh yang lain selain perlakuan dan pengelompokkan pada percobaan. apabila ada pengaruh lain, maka akan menjadi multiplikatif.

1.4.2 Tidak ada pencilan

Tidak ada pencilan (outlier) atau amatan yang memiliki nilai extreme dan berbeda dari amatan yang lain.

1.4.3 Normalitas Galat

  • Galat model haruslah berdistribusi normal, dengan rataan nol (εijk ∼ N(0, σε2)).
  • Normalitas galat apat duji secara grafis (menggunakan Histogram & Q-Q Plot) maupun uji statistik (Andersen-Darling, Jarque-Bera, Shapiro-Wilk, dll).
  • Apabila asumsi normalitas galat terlanggar semua pengujiann menjadi tidak sah.
  • Solusi jika galat tidak menyebar dengan normal adalah dengan transformasi data (menjadi Akar, Log, Arcsin, dll).

1.4.4 Homogenitas Ragam

  • Ragam bernilai sama untuk setiap amatan pada faktor sama (σi = σj ;i \(\neq\) j).
  • Homogenitas ragam dapat duji secara grafis (menggunakan Plot Fitted Value vs Res.) maupun uji statistik (Breusch-Pagan, Levene).
  • Apabila asumsi homogenitas ragam terlanggar, maka pendugaan paramater menjadi bias.

1.5 Uji ANOVA Satu Arah

Uji ANOVA satu arah atau One-Way ANOVA digunakan jika data amatan hasil eksperimen memenuhi persyaratan sebagai berikut :
1. Memenuhi asumsi ANOVA.
2. Mempunyai 1 variabel respons.
3. Mempunyai 1 variabel bebas yang bertindak sebagai faktor.

  • Hipotesis :
    \(H_0 : \mu_{1} = \mu_{2} = ... = \mu_{p}\)
    vs
    \(H_1\) : minimal ada satu \(\mu_{i}\) \(\neq\) \(\mu_{j}\)

  • Tabel One Way ANOVA : Misalkan terdapat data terdiri dari N amatan yang terdiri dari p perlakuan. Tiap perlakuan ke-j terdiri dari nj amatan.

Sumber Keragaman Derajat Kebebasan Jumlah Kuadrat Kuadrat Tengah F Hitung
Perlakuan p-1 \(\sum^p_{j=1}(\bar y_{.j}-\bar y_{..})^2\) \(\frac{JKp}{p-1}\) \(\frac{KTp}{KTg}\)
Galat n-p JKt - JKp \(\frac{JKg}{n-p}\)
Total n-1 \(\sum^n_{i=1}(\bar y_{ij}-\bar y_{..})^2\)

1.6 Data

Tabel: Data Pendapatan Bersih Sebulan Pekerja Bekerja Sendiri Menurut Kelompok Umur

15-24 25-54 55+
1358.0 1525.8 1203.8
1603.9 2048.7 1457.3
2339.6 2552.3 1955.4
2506.1 3406.2 2000.7
1552.6 2256.6 1497.2
1338.8 1762.0 1159.5
2586.8 2593.5 2064.7
1017.4 1249.2 950.3
1347.5 1805.0 196.8
1606.3 2188.0 1418.4

Sumber Data : Badan Pusat Statistik (BPS). 2020, Pendapatan Bersih Sebulan Pekerja Bekerja Sendiri Menurut Kelompok Umur. Badan Pusat Statistik.

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> # Library
> library(dplyr)
> library(tidyr)
> library(ggplot2)
> library(knitr)
> library(car) 
> library(lmtest)
> library(tseries)

2.2 Uji ANOVA secara manual

2.2.1 Langkah 1 - Input Data

> data = data.frame (u15.sd.24 = c(1358, 1603.9, 2339.6, 
+                                  2506.1, 1552.6, 1338.8, 
+                                  2586.8, 1017.4, 1347.5, 
+                                  1606.3), 
+                    u25.sd.54 = c(1525.8, 2048.7, 2552.3, 
+                                  3406.2, 2256.6, 1762,
+                                  2593.5, 1249.2, 1805, 
+                                  2188), 
+                    u55.keatas = c(1203.8, 1457.3, 1955.4, 
+                                   2000.7, 1497.2, 1159.5, 
+                                   2064.7, 950.3, 1196.8, 
+                                   1418.4))
> library(dplyr)
> library(tidyr)
> data = data %>% pivot_longer(c(u15.sd.24, u25.sd.54,u55.keatas))
> names(data) = c("kelompok.umur", "pendapatan.bersih")
> data$kelompok.umur = as.factor(data$kelompok.umur)
> data
# A tibble: 30 x 2
   kelompok.umur pendapatan.bersih
   <fct>                     <dbl>
 1 u15.sd.24                 1358 
 2 u25.sd.54                 1526.
 3 u55.keatas                1204.
 4 u15.sd.24                 1604.
 5 u25.sd.54                 2049.
 6 u55.keatas                1457.
 7 u15.sd.24                 2340.
 8 u25.sd.54                 2552.
 9 u55.keatas                1955.
10 u15.sd.24                 2506.
# ... with 20 more rows

Membuat data frame yang berisi data yang ingin digunakan, dan disimpan dengan nama ‘data’. Lalu mengaktifkan library dplyr dan tidyr untuk mengubah bentuk tabel. Lalu memberi nama kolom pada ‘data’, kolom pertama dengan nama ‘kelompok.umur’, dan kolom kedua dengan nama ‘pendapatan.bersih’. Lalu mendefinisikan kolom ‘kelompok.umur’ sebagai vektor faktor. Lalu mengetikkan kembali kode data untuk menampilkan data.

2.2.2 Langkah 2 - Explore Data

> library(ggplot2)
> p1 = ggplot(data) + 
+      aes(x = kelompok.umur, y = pendapatan.bersih, fill= kelompok.umur) +      geom_boxplot() +
+      theme_minimal() +
+      theme(legend.position = "none")
> p1

Gambar 1 : Boxplot pendapatan bersih menurut kelompok umur

2.2.3 Langkah 3 - Hitung DB

> N = nrow(data)
> p = data$kelompok.umur %>% unique() %>% length()
> dbt = N-1
> dbp = p-1
> dbg = N-p 
> 
> dbt; dbp; dbg
[1] 29
[1] 2
[1] 27

Mendefinisikan N sebagai banyaknya baris dalam ‘data’, p sebagai banyaknya baris dalam ‘kelompok.umur’. Lalu melakukan perhitungan DB atau derajat bebas dengan mendefinisikan dbt (derajat bebas totla) sebagai N dikurang dengan 1, dbp (derajat bebas perlakuan) sebagai p dikurang dengan 1, dan dbg (derajat bebas galat) sebagai N dikurang dengan p. Lalu mengetikkan kode dbt; dbp; dbg untuk menampilkan dbt, dbp, dan dbg yang sudah didefinisikan sebelumnya.

2.2.4 Langkah 4 - Hitung Jumlah Kuadrat

> perlakuan.mean = aggregate(data$pendapatan.bersih ~ data$ kelompok.umur, data, mean)[,2]
> n = aggregate(data$pendapatan.bersih ~ data$kelompok.umur, data, length)[,2]
> grand.mean = mean(data$pendapatan.bersih)
> jkt = sum((data$pendapatan.bersih - grand.mean)^2)
> jkp = sum(n*(perlakuan.mean - grand.mean)^2)
> jkg = jkt-jkp
> jkt; jkp; jkg
[1] 9681643
[1] 2154247
[1] 7527396

Menghitungan rata rata dari perlakuan, n dari data, rata-rata dari keseluruhan ‘data’ yang akan digunakna untuk menghitung jkt (jumlah kuadat total), jkp (jumlah kuadrat perlakuan), dan jkg (jumlah kuadrat galat). Lalu mengetikkan kode jkt; jkp; jkg untuk menampilkan jkt, jkp, dan jkg yang sudah didefinisikan sebelumnya.

2.2.5 Langkah 5 - Hitung Kuadrat Tengah

> ktp = jkp/dbp
> ktg = jkg/dbg
> ktp ; ktg
[1] 1077123
[1] 278792.4

Mendefinisikan ktp dengan menghitung kuadrat tengah perlakuan sebagai jkp dibagi dengan dbg, dan mendefinisikan ktg dengan menghitung kuadrat tengah galat sebagai jkg dibagi dengan dbg. Lalu mengetikkan kode ktp; ktg untuk menampilkan ktp dan ktg yang sudah didefinisikan sebelumnya.

2.2.6 Langkah 6 - Hitung Statistik F

> fp = ktp/ktg
> pval = pf(fp, dbp, dbg, lower.tail=F)
> fp; pval
[1] 3.863531
[1] 0.0334497

Mendefinisikan fp dengan menghitung nilai f hitung sebagai ktp dibagi dengan ktg, dan mendefinisikan pval dengan fungsi pf. Lalu mengetikkan kode fp; pval untuk menampilkan fp dan pval yang sudah didefinisikan sebelumnya.

2.2.7 Langkah 7 - Tabel ANOVA

> data.frame(
+   SK = c("Perlakuan", "Galat", "Total"),
+   DB = c(dbp, dbg, dbt),
+   JK = c(jkp, jkg, jkt),
+   KT = c(ktp, ktg, NA),
+   Fhit = c(fp, NA, NA),
+   P.Value = c(pval, NA, NA) 
+ )
         SK DB      JK        KT     Fhit   P.Value
1 Perlakuan  2 2154247 1077123.3 3.863531 0.0334497
2     Galat 27 7527396  278792.4       NA        NA
3     Total 29 9681643        NA       NA        NA

Membuat data frame yang berisi SK (sumber keragaman), DB (derajat bebas), JK (jumlah kuadrat), KT (kuadrat tengah), Fhit (f hitung), dan P.Value (p-value) agar lebih mudah dalam melihat dan mengambil keputusan dari uji yang dilakukan.

2.2.8 Effect Size

Effect size2) adalah besaran variabilitas dari respons yang dapat dijelaskan oleh sumber keragaman perlakuan. η2 = 0 artinya tidak ada hubungan antara keduanya. \(η^2\) = 1 berarti hubungan keduanya adalah sempurna. \[η^2 = \frac{JKp}{JKt} \]

> etasq = jkp/jkt
> etasq
[1] 0.2225084

Mendefinisikan etasq dengan menghitung effect size sebagai jkp dibagi dengan jkt. Lalu mengetikkan kode etasq untuk menampilkan etasq yang sudah didefinisikan sebelumnya.

2.3 Uji ANOVA menggunakan fungsi aov()

> ujianova = aov(pendapatan.bersih ~ kelompok.umur, data)
> summary(ujianova)
              Df  Sum Sq Mean Sq F value Pr(>F)  
kelompok.umur  2 2154247 1077123   3.864 0.0334 *
Residuals     27 7527396  278792                 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Uji ANOVA menggunakan fungsi aov() yang bersifat built in R, dengan variabel yang dianalisis adalah pendapatan.bersih untuk setiap kelompk.umur pada data frame ‘data’ dan disimpan dengan nama ‘ujianova’. Lalu mengetikkan kode summary(ujianova) untuk menampilkan hasil analisis secara lengkap dari ‘ujianova’ yang sudah didefinisikan sebelumnya.
Dari output, dapat terlihat bahwa nilai derajat bebas, jumlah kuadrat, kuadrat tengah, F hitung dan p-value sama dengan output yang diperoleh pada perhitungan manual.

2.4 Memeriksa Asumsi

2.4.1 Normalitas Galat

Menguji normalitas galat menggunakan uji jarque bera.

> library(car)
> sisa = residuals(ujianova)
> library(tseries)
> jarque.bera.test(sisa)

    Jarque Bera Test

data:  sisa
X-squared = 1.754, df = 2, p-value = 0.416

2.4.2 Homogenitas Ragam

Menguji normalitas galat menggunakan uji breusch pagan.

> library(lmtest)
> bptest(ujianova)

    studentized Breusch-Pagan test

data:  ujianova
BP = 1.977, df = 2, p-value = 0.3721

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

Boxplot pada Gambar 1 menunjukkan bahwa :

  • Pada kelompok umur 15 sampai dengan 24 tahun; rata rata pendapatan bersih adalah 1.600 ribu rupiah, dengan pendapatan terkecil adalah 1.017 ribu rupiah, dan pendapatan terbesar adalah 2.600 ribu rupiah.
  • Pada kelompok umur 25 sampai dengan 54 tahun; rata rata pendapatan bersih adalah 2.100 ribu rupiah, dengan pendapatan terkecil adalah 1.250 ribu rupiah, dan pendapatan terbesar adalah 3.400 ribu rupiah.
  • Pada kelompok umur 55 tahun keatas; rata rata pendapatan bersih adalah 1.400 ribu rupiah, dengan pendapatan terkecil adalah 900 ribu rupiah, dan pendapatan terbesar adalah 2.050 ribu rupiah.

3.2 Statistika Inferensial

3.2.1 Tabel ANOVA

  • Hipotesis :
    \(H_0 : \mu_{1} = \mu_{2} = ... = \mu_{p}\)
    vs
    \(H_1\) : minimal ada satu \(\mu_{i}\) \(\neq\) \(\mu_{j}\)

  • Statistik Uji : P-value = 0.0334497
    \(\alpha\) = 5%

  • Keputusan : P-value = 0.0334497 < \(\alpha\) = 5% = 0.05, maka tolak H0.

Dengan taraf nyata 5%, dapat disimpulkan bahwa terdapat perbedaan rata rata pendapatan bersih sebulan pekerja bekerja sendiri menurut kelompok umur.

3.2.2 Effect Size

Effect size yang bernilai 0.2225084 berarti pendapatan bersih sebulan pekerja bekerja sendiri dapat menjelaskan kelompok umur sebesar 22.25084%.

3.2.3 Pemeriksaan Asumsi

3.2.3.1 Perlakuan Aditif

Pengaruh perlakuan dan kelompok sudah dikatakan aditif, karena pengaruh perlakuan selalu tetap pada setiap ulangan atau kelompok. Maka asumsi aditif terpenuhi.

3.2.3.2 Pencilan

Dari boxplot pada gambar 1, dapat dilihat bahwa tidak ada amatan yang memiliki nilai extreme dan berbeda dari amatan yang lain; maka tidak ada pencilan dalam data dan asumsi terpenuhi.

3.2.3.3 Normalitas Galat : Uji Jarque Bera

  • Hipotesis :
    \(H_0\) : Galat menyebar normal. vs
    \(H_1\) : Galat tidak menyebar normal.

  • Statistik Uji : P-value = 0.416
    \(\alpha\) = 5%

  • Keputusan : P-value = 0.0416 > \(\alpha\) = 5% = 0.05, maka terima H0.

  • Kesimpulan :

Dengan taraf nyata 5%, dapat disimpulkan bahwa galat berdistribusi normal dan asumsi terpenuhi.

3.2.3.4 Homogenitas Ragam : Uji Breusch Pagan

  • Hipotesis :
    \(H_0\) : Ragam galat setiap perlakuan sama. vs
    \(H_1\) : Minimal terdapat satu perlakuan yang memiliki ragam galat berbeda.

  • Statistik Uji : P-value = 0.3721
    \(\alpha\) = 5%

  • Keputusan : P-value = 0.3721 > \(\alpha\) = 5% = 0.05, maka terima H0.

  • Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa ragam galat setiap perlakuan sama dan asumsi terpenuhi.

Semua asumsi dalam uji ANOVA sudah terpenuhi, maka hasil dan kesimpulan dari uji ANOVA yang sudah dilakukan dapat dinyatakan sah dan dapat dipublikasi.

4 KESIMPULAN

Dengan taraf nyata 5%, dapat disimpulkan bahwa terdapat perbedaan rata rata pendapatan bersih sebulan pekerja bekerja sendiri menurut kelompok umur.

5 DAFTAR PUSTAKA

Badan Pusat Statistik (BPS). 2020, Pendapatan Bersih Sebulan Pekerja Bekerja Sendiri Menurut Kelompok Umur. Badan Pusat Statistik.
Lusiana, E.D. and Mahmudi, M., 2021. ANOVA untuk Penelitian Eksperimen : Teori dan Praktik dengan R. Univeritas Brawijaya Press.
Setiawan, K. 2019. Buku Ajar Metodologi Penelitian (Anova Satu Arah).