Analisis Keragaman pada Tingkat Suku Bunga Kredit Bank untuk Pinjaman Mobil di Enam Kota di Amerika Serikat

Harrison Claudius

18 Mei 2022

1 PENDAHULUAN

1.1 Latar Belakang Kasus

Majalah Customer Reports melakukan survei pertumbuhan tingkat suku bunga untuk pinjaman pembelian mobil atas sepuluh bank terbesar di beberapa kota besar di Amerika Serikat pada 1985. Beberapa kota yang menjadi target survei yaitu Atlanta, Chicago, Houston, Memphis, New York, dan Philadelphia. Hanya Kota Philadelphia di mana kesepuluh bank tersebut melaporkan tingkat suku bunganya, sementara kota lainnya hanya sembilan dari sepuluh bank yang melaporkan. Demi simplifikasi analisis, satu data bank dari Philadelphia dikeluarkan. Data yang dikeluarkan mencatatkan tingkat suku bunga sebesar 12.25%.

Tujuan utama dari pengumpulan data ini adalah untuk menyelidiki apakah terdapat perbedaan yang signifikan akan tingkat suku bunga kredit untuk pembelian mobil di beberapa kota tersebut.

Untuk mengetahui apakah terdapat perbedaan dengan variabel prediktor (City) yang dikelompokkan menjadi faktor dan nilai respons (Rate) sebagai nilai-nilai kontinu. Hal ini menyebabkan analisis keragaman dipilih sebagai alat analisis yang dapat memberikan jawaban apakah terdapat perbedaan di antara kelompok tersebut.

1.2 Tinjauan Pustaka

1.2.1 Asumsi dan Hipotesis dalam ANOVA Satu Arah

ANOVA memerlukan beberapa asumsi dasar yang perlu dipenuhi yaitu:

  • Galat eksperimental hasil data harus berdistribusi secara normal.
  • Keragaman antarperlakuan yang sama (homogenitas ragam).
  • Antarperlakuan bersifat saling bebas (independen).

Pelanggaran terhadap salah satu asumsi tersebut akan sangat mungkin mengakibatkan hasil analisis yang tidak lagi valid dan sesuai.

Hipotesis yang digunakan di dalam analisis keragaman satu arah yaitu:

\(H_0\): \(\alpha_1 = \alpha_2 = ... = \alpha_i = 0\) vs.

\(H_1\): Setidaknya ada satu \(\alpha_i\) bernilai tidak sama dengan nol.

1.2.2 Tabel ANOVA Satu Arah

Dalam melakukan analisis keragaman, dimanfaatkan tabel ANOVA yang disusun sebagai berikut:

Bentuk Tabel Analisis Sidik Ragam
Sumber db SS MS \(F_{hitung}\)
Faktor \(db_F\) \(SSF\) \(MSF\) \(F_{db_{F},db_{G};\alpha}\)
Galat \(db_E\) \(SSE\) \(MSE\)
Total \(db_T\) \(SST\)

dengan

\(db_T\) = \(n-1\)

\(db_F\) = \(k-1\)

\(db_E\) = \(db_T - db_F\)

\(SSF\) = \(n\sum_{i=1}^{k}(\bar{y}_{i.}-\bar{y}_{..})^2\)

\(SST\) = \(\sum_{i=1}^{k}\sum_{j=1}^{n}(y_{ij}-\bar{y}_{..})^2\)

\(SSE\) = \(SST - SSF\)

\(MSF\) = \(\frac{SSF}{db_f}\)

\(MSE\) = \(\frac{SSE}{db_E}\)

\(F_{db_{F},db_{G};\alpha}\) = \(\frac{MSF}{MSE}\)

1.2.3 Identitas Jumlah Kuadrat

Identitas Jumlah Kuadrat dinyatakan sebagai \(SS_{Total} = SS_{Factor} + SS_{Error}\) yang kemudian dijabarkan menjadi: \[ \sum_{i=1}^{k}\sum_{j=1}^{n}(y_{ij}-\bar{y}_{..})^2= n\sum_{i=1}^{k}(\bar{y}_{i.}-\bar{y}_{..})^2 + \sum_{i=1}^{k}\sum_{j=1}^{n}(y_{i.}-\bar{y}_{..})^2 \]

1.3 Data

Data tingkat suku bunga kredit untuk mobil yang dihimpun oleh Customer Reports sebagai berikut:

Data Suku Bunga Kredit di Bank Terbesar di Beberapa Kota di AS
Atlanta Chicago Houston Memphis NY PH
13.75 14.25 14.00 15.00 14.50 13.50
13.75 13.00 14.00 14.00 14.00 12.25
13.50 12.75 13.51 13.75 14.00 12.25
13.50 12.50 13.50 13.59 13.90 12.00
13.00 12.50 13.50 13.25 13.75 12.00
13.00 12.40 13.25 12.97 13.25 12.00
13.00 12.30 13.00 12.50 13.00 12.00
12.75 11.90 12.50 12.25 12.50 11.90
12.50 11.90 12.50 11.89 12.45 11.90

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> library(knitr)
> library(rmarkdown)
> library(prettydoc)
> library(equatiomatic)
> library(esquisse)        # Alat bantu untuk plot
> library(ggplot2)         # Untuk plotting
> library(shiny)
> library(tseries)
> library(car)             # Uji Levene
> library(agricolae)       # Uji Lanjut Anova

2.2 Memanggil Data dan Menampilkan Struktur Data

Pemanggilan data memanfaatkan fitur impor yang tersedia di dalam RStudio. Kali ini memanfaatkan file bertipe .csv.

> p <- file.path("D:","Tugas","SEM 4","Komstat","Laprak","Data.csv")
> data = read.csv(p,header = TRUE, colClasses = c("real","factor"), sep = ";")
> str(data)
'data.frame':   54 obs. of  2 variables:
 $ Rate: num  13.8 13.8 13.5 13.5 13 ...
 $ City: Factor w/ 6 levels "AT","CH","HO",..: 1 1 1 1 1 1 1 1 1 2 ...

Terlihat struktur dari data yang merupakan suatu data frame dengan 54 observasi yang terdiri dari 2 variabel. Variabel Rate yang merupakan variabel bertipe numerik dan variabel City yang merupakan variabel bertipe faktor dengan 6 level perlakuan.

Function file.path digunakan untuk mengatur direktori tempat bekerja. Argument yang dimasukkan berupa direktori yang diinginkan dan file yang akan diakses.

Function read.csv digunakan untuk memerintahkan R untuk mengakses file berformat csv dengan argument berupa file path yang telah didefinisikan sebelumnya, header bernilai TRUE atau FALSE untuk menentukan apakah baris pertama berlaku sebagai judul, colClasses menunjukkan jenis-jenis data pada masing-masing kolom, dan sep untuk menunjukkan tanda pemisah yang sesuai pada file yang akan diimpor.

Function str digunakan untuk menunjukkan deskripsi jenis data yang tersedia. Argument yang dimasukkan adalah data yang ingin dideskripsikan.

2.3 Boxplot

> esquisser()
> ggplot(data) +
+  aes(x = City, y = Rate) +
+  geom_boxplot(fill = "#FF8C00") +
+  labs(title = "Loan Rate per City", 
+  caption = "Gambar 1. Tingkat Suku Bunga Pinjaman Mobil pada Beberapa Kota Besar di Amerika Serikat") +
+  theme_gray()

Function ggplot digunakan untuk menyusun grafik. Argument yang dimasukkan dapat beragam. Function ini tersedia di package ggplot2. Pembuatan grafik dengan ggplot dapat memanfaatkan bantuan library esquisse dan dengan perintah esquisser().

2.4 Scatterplot

> smoothScatter(data$City,data$Rate,xlab="City",ylab="Rate", main="Gambar 2. Scatterplot Data")

Function smoothScatter digunakan untuk menyusun grafik tebar yang dimuluskan. Argument yang dimasukkan berupa variabel x, variabel y, label untuk sumbu x dan sumbu y beserta judul plot apabila diperlukan.

2.5 Perhitungan ANOVA dengan fungsi aov

> anova <- aov(Rate~City, data=data)
> summary(anova)

Function aov digunakan untuk melakukan proses analisis keragaman (Analysis of Variance). Argument yang dimasukkan adalah Respons ~ Prediktor dengan data = [nama data]. Dalam kasus ini Rate berlaku sebagai variabel respons dan City berlaku sebagai variabel prediktor.

Function summary digunakan untuk menampilkan penjelasan ringkas atas suatu model. Argument yang dimasukkan adalah model yang telah didefinisikan sebelumnya.

2.6 Pemeriksaan Sisaan dengan Diagnostic Plots

> par(mfrow = c(2,2))
> plot(anova,1)
> plot(anova,2)
> plot(anova,3)
> title("Diagnostic Plots untuk ANOVA", line=-18.5, outer=TRUE)

Function par digunakan untuk mengatur tampilan grafik ke dalam susunan yang ditentukan. Argument yang dimasukkan adalah jumlah grafik pada satu baris dan jumlah grafik pada satu kolom yang diinginkan.

Function plot digunakan untuk menggambarkan plot atas suatu model yang telah ditentukan. Untuk model ANOVA, angka 1 akan menampilkan plot Residuals vs. Fitted. Angka 2 akan menampilkan Q-Q Normal Plot. Angka 3 akan menampilkan plot Scale - Location.

Function title digunakan untuk menambahkan teks judul. Argument yang diisikan berupa teks judul, posisi judul, dan pemberian izin batas margin untuk diisi teks atau tidak.

2.7 Uji Normalitas Galat

> sisa <- residuals(anova)
> jarque.bera.test(sisa)
> shapiro.test(sisa)

Function residuals digunakan untuk memerintahkan R menghitung galat atas nilai respons hasil prediktor. Argument yang dimasukkan adalah model yang akan dihitung nilai galatnya.

Function jarque.bera.test digunakan untuk melakukan uji normalitas Jarque Bera. Function ini tersedia dalam package tseries. Argument yang diisikan adalah vektor yang akan diuji. Dalam kasus ini vektor sisa yang merupakan galat dari model anova.

Function jarque.bera.test digunakan untuk melakukan uji normalitas Jarque Bera. Argument yang diisikan adalah vektor yang akan diuji. Dalam kasus ini vektor sisa yang merupakan galat dari model anova.

Function shapiro.test digunakan untuk melakukan uji normalitas Shapiro-Wilk. Argument yang diisikan adalah vektor yang akan diuji. Dalam kasus ini vektor sisa yang merupakan galat dari model anova.

2.8 Uji Homogenitas Ragam dengan Uji Levene

> leveneTest(Rate~City, data=data)

Function leveneTest digunakan untuk melakukan uji Levene untuk homogenitas keragaman. Argument yang diisikan adalah model yang akan diujikan. Dalam kasus ini Rate berlaku sebagai variabel respons dan City berlaku sebagai variabel prediktor.

2.9 Uji Lanjut BNT

> bnt <- LSD.test(anova, "City", alpha = 0.05)
> bnt$groups
> plot(bnt)

Function LSD.test digunakan untuk melakukan uji perbandingan Beda Nyata Terkecil (BNT). Function ini tersedia pada package agricolae. Argument yang diisikan berupa model yang akan dihitung perbedaannya dan nilai signifikansi (alpha).

Function bnt$groups digunakan untuk menampilkan nilai rata-rata masing-masing kelompok yang telah ditentukan serta apakah tergolong dalam satu grup yang sama atau tidak, dengan kata lain berbeda signifikan atau tidak.

Function plot digunakan untuk menggambarkan grafik. Argument yang diisikan adalah objek yang akan digambarkan.

2.10 Uji Lanjut BNJ

> bnj <- TukeyHSD(anova,conf.level=0.95)
> bnj
> plot(bnj)

Function TukeyHSD digunakan untuk melakukan uji perbandingan Beda Nyata Jujur (BNJ). Function ini tersedia pada package agricolae. Argument yang diisikan berupa model yangakan diuji.

Function plot digunakan untuk menggambarkan grafik. Argument yang diisikan adalah objek yang akan digambarkan.

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

3.1.1 Nilai Rata-Rata

Nilai rata-rata untuk setiap kelompok data ke-j didefinisikan sebagai berikut: \[ \bar{x_j}=\frac{\sum_{i=1}^{n}x_{ji}}{n} \] Sehingga, nilai rata-rata tiap kelompok data: \[ \bar{x_1}=\frac{13.75 + 13.75 + ... + 12.50}{9}=\frac{118.75}{9}=13.19 \] \[ \bar{x_2}=\frac{14.25 + 13.00 + ... + 11.90}{9}=\frac{113.50}{9}=12.61 \] \[ \bar{x_3}=\frac{14.00 + 14.00 + ... + 12.50}{9}=\frac{119.76}{9}=13.31 \] \[ \bar{x_4}=\frac{15.00 + 14.00 + ... + 11.89}{9}=\frac{119.20}{9}=13.24 \] \[ \bar{x_5}=\frac{14.50 + 14.00 + ... + 12.45}{9}=\frac{121.35}{9}=13.48 \] \[ \bar{x_6}=\frac{13.50 + 12.25 + ... + 11.90}{9}=\frac{109.80}{9}=12.20 \]

3.1.2 Nilai Keragaman Sampel

Nilai keragaman bagi sampel untuk setiap kelompok data ke-j didefinisikan sebagai berikut: \[ s^2_j = \frac{\sum_{i=1}^{n}(x_{ji}-\bar{x})^2}{n-1} \] Sehingga, nilai keragaman masing-masing kelompok data: \[ s^2_1 = \frac{(13.75-13.19)^2+...+(12.50-13.19)^2}{9-1}=\frac{1.597}{8}=0.19965 \] \[ s^2_2 = \frac{(14.25-12.61)^2+...+(11.90-12.61)^2}{9-1}=\frac{4.034}{8}=0.5042 \] \[ s^2_3 = \frac{(14.00-13.31)^2+...+(12.50-13.31)^2}{9-1}=\frac{2.476}{8}=0.3095 \] \[ s^2_4 = \frac{(15.00-13.24)^2+...+(11.89-13.24)^2}{9-1}=\frac{7.481}{8}=0.935 \] \[ s^2_5 = \frac{(14.50-13.48)^2+...+(12.45-13.48)^2}{9-1}=\frac{4.135}{8}=0.517 \] \[ s^2_6 = \frac{(13.50-12.20)^2+...+(11.90-12.20)^2}{9-1}=\frac{2.035}{8}=0.254 \]

3.2 Analisis Plot

3.2.1 Boxplot

Berdasarkan boxplot pada Gambar 1 nampak indikasi-indikasi perbedaan antar nilai tengah dari keenam kota terpilih. Nilai tengah setiap kota telah dicantumkan pada subbab sebelumnya. Pada kota Chicago dan Philadelphia bahkan terdeteksi satu pencilan.

3.2.2 Scatterplot

Berdasarkan scatterplot pada Gambar 2 nampak indikasi data yang relatif memusat, yang kemudian didukung dari nilai keragaman yang relatif kecil.

3.3 Analisis Keragaman

3.3.1 Hipotesis

\(H_0\): \(\alpha_1 = \alpha_2 = ... = \alpha_6 = 0\) vs.

\(H_1\): Setidaknya ada satu \(\alpha_i\) bernilai tidak sama dengan nol, \(i = 1,2,...,6\).

3.3.2 Taraf Signifikansi

Kita tetapkan taraf signifikansi (\(\alpha\)) sebesar 5%.

3.3.3 Hasil Analisis Sidik Ragam (ANOVA)

Hasil Analisis Variansi dari R ditampilkan sebagai berikut:

            Df Sum Sq Mean Sq F value  Pr(>F)   
City         5  10.95  2.1891   4.829 0.00117 **
Residuals   48  21.76  0.4533                   
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

yang kita tabelkan menjadi:

Analisis Sidik Ragam
Sumber db SS MS \(F_{hitung}\) P-Value
Faktor 5 10.95 2.1891 4.829 0.0017
Galat 48 21.76 0.4533
Total 53 32.71

3.3.4 Keputusan

Berdasarkan derajat kebebasan dalam tabel ANOVA, titik kritis untuk pengujian hipotesis ditentukan dengan bantuan tabel-F dan diperoleh hasil: \[ F_{5,48; 0.05}=2.409 \] Keputusan:

  1. \(P-Value < \alpha\), maka tolak \(H_0\).
  2. \(F_{hitung} > F_{5,48; 0.05}\), maka tolak \(H_0\).

3.3.5 Kesimpulan

Berdasarkan pengujian analisis ragam dengan taraf signifikansi sebesar 5%, dapat disimpulkan bahwa terdapat cukup bukti untuk mengatakan adanya perbedaan tingkat suku bunga kredit dari 10 bank terbesar yang terletak di 6 kota di Amerika Serikat.

3.4 Asumsi dalam ANOVA

Pengecekan asumsi dalam ANOVA dapat ditempuh dengan beberapa cara untuk masing-masing asumsinya. Pengujian asumsi pada ANOVA memanfaatkan sisaan masing-masing pengamatan yang didefinisikan sebagai: \[ e_i = |\hat{Y_i}-Y_i| \]

3.4.1 Diagnostic Plots

Kumpulan plot diagnostik sisaan dari model ANOVA yang sudah dibentuk ditampilkan di bawah ini.

Gambar 3 Kumpulan Diagnostic Plot

Gambar 3 Kumpulan Diagnostic Plot

Pada plot Residuals vs Fitted terlihat sisaan hasil model ANOVA menyebar secara acak. Garis tengah merah yang terbentuk masih relatif linier horizontal. Model dapat diyakini sudah tepat.

Pada plot Normal Q-Q terlihat sisaan yang dibakukan masih terkumpul di garis tengah diagonal yang membagi plot. Hanya saja ada indikasi beberapa titik sisaan yang relatif jauh dari garis tengah diagonal. Secara grafis, terdapat indikasi lemah pelanggaran asumsi normalitas. Uji formal normalitas diperlukan untuk memastikan kecurigaan ini.

Pada plot Scale-Location terlihat akar kuadrat dari sisaan yang dibakukan relatif membentuk kurva tertentu sehingga tidak terlalu linier. Terdapat indikasi pelanggaran asumsi homoskedastisitas yang perlu dipastikan lewat uji formal homoskedastisitas.

3.4.2 Uji Normalitas Galat

3.4.2.1 Uji Jarque-Bera

Hipotesis dalam Uji Jarque-Bera sebagai berikut:

\(H_0\): Galat berdistribusi normal vs.

\(H_1\): Galat tidak berdistribusi normal

Statistik Jarque-Bera didefinisikan sebagai: \[ JB = \frac{n}{6}(S^2 \frac{1}{4}(K-3)^2) \]

di mana \(S\) merupakan statistik kemencengan (skewness): \[ S = \frac{\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^3}{(\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^2)^{3/2}} \]

dan \(K\) merupakan statistik keruncingan (kurtosis): \[ K = \frac{\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^4}{(\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^2)^{2}} \]

Pengambilan Keputusan:

Ketika data menyebar normal, nilai statistik \(JB\) akan mendekati 0, di mana nilai \(S\) bernilai mendekati 0 dan \(K\) bernilai mendekati 3. Secara asimtotik statistik \(JB\) akan menyebar mengikuti statistik \(\chi^2_2\). Penolakan terhadap \(H_0\) dilakukan pada statistik \(JB\) yang bernilai besar.

Hasil output statistik \(JB\) ditampilkan sebagai berikut:


    Jarque Bera Test

data:  sisa
X-squared = 2.6241, df = 2, p-value = 0.2693

Berdasarkan output di atas, kita peroleh nilai p-value = 0.2693.

Keputusan: \(P-Value > \alpha\), maka terima \(H_0\). Dapat disimpulkan dengan taraf signifikansi 5% dengan uji Jarque Bera, galat hasil model ANOVA masih menyebar normal.

3.4.3 Uji Shapiro-Wilk

Hipotesis dalam Uji Shapiro-Wilk yaitu:

\(H_0\): Pengamatan menyebar normal vs.

\(H_1\): Pengamatan tidak menyebar normal

Statistik uji bagi Uji Shapiro-Wilk dirumuskan sebagai: \[ W = \frac{(\sum_{i=1}^{n}a_ix_{(i)})^2}{\sum_{i=1}^{n}(x_i-\bar{x})^2} \]

dengan \(x_{(i)}\) menyatakan pengamatan urutan ke-i dan \(a_i\) menyatakan koefisien yang dibentuk dari nilai harapan dan matriks kovarians statistika urutan.

Pengambilan keputusan bagi uji Shapiro-Wilk memanfaatkan simulasi nilai-nilai Shapiro-Wilk (dalam bentuk tabel khusus).

Hasil output uji Shapiro pada R dinyatakan sebagai berikut:


    Shapiro-Wilk normality test

data:  sisa
W = 0.97156, p-value = 0.2257

Berdasarkan output di atas, kita peroleh nilai p-value = 0.2257.

Keputusan: \(P-Value > \alpha\), maka terima \(H_0\). Dapat disimpulkan dengan taraf signifikansi 5% dengan uji Shapiro Wilk, galat hasil model ANOVA masih menyebar normal.

Sehingga, asumsi normalitas pada model ANOVA masih terpenuhi.

3.4.4 Uji Homogenitas Ragam dengan Uji Levene

Hipotesis yang digunakan dalam Uji Levene:

\(H_0\): \(\sigma_1 = \sigma_2 = ... = \sigma_6\) vs.

\(H_1\): \(\sigma_i \ne \sigma_j\) setidaknya untuk satu pasang \(i\) dan \(j\) dengan catatan \(i \ne j\) dan \(i,j = 1,2,...,6\).

Statistik Uji Levene: \[ W = \frac{(N-k)\sum_{i=1}^{k}n_i(\bar{Z_{i.}}-\bar{Z_{..}})^2}{(k-1)\sum_{i=1}^{k}\sum_{j=1}^{n_i}(Z_{ij}-\bar{Z{i.}})^2} \]

dengan \(N\) menyatakan jumlah observasi, \(k\) menyatakan jumlah level perlakuan, \(Z_{ij}\) didefinisikan sebagai: \[ Z_{ij}=|Y_{ij}-\tilde{Y}_{i.}| \]

di mana \(\tilde{Y}_{i.}\) menunjukkan median pada perlakuan ke-i dan \[ \bar{Z_{i.}}=\frac{\sum_{j=1}^{n_i}z_{ij}}{n_i} \] \[ \bar{Z_{..}}=\frac{\sum_{j=1}^{n_i}\sum_{i=1}^{k}z_{ij}}{N} \]

Pengambilan keputusan memanfaatkan statistik \(F\) dengan derajat bebas \(k-1\) dan \(N-k\)

Hasil output uji Levene pada R dinyatakan sebagai berikut:

Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  5  1.2797 0.2882
      48               

Berdasarkan output di atas, kita peroleh nilai p-value = 0.2882.

Keputusan: \(P-Value > \alpha\), maka terima \(H_0\). Dapat disimpulkan dengan taraf signifikansi 5% dengan uji Leven, tidak terdapat cukup bukti setidaknya ada satu ragam populasi kelompok model yang berbeda.

Sehingga, asumsi homogenitas ragam pada model ANOVA masih terpenuhi.

3.4.5 Uji Lanjut

Uji lanjut setelah pengujian simultan apabila menghasilkan kesimpulan menolak \(H_0\) diperlukan. Hal ini untuk mencari perlakuan mana yang berbeda karena uji simultan hanya memberikan informasi mengenai ada/tidaknya perbedaan. Uji lanjut yang biasanya digunakan yaitu Uji Beda Nyata Terkecil (BNT) dan Uji Beda Nyata Jujur (BNJ).

3.4.5.1 Beda Nyata Terkecil (BNT)

Hipotesis yang digunakan dalam uji Lanjut yaitu:

\(H_0\) : \(\mu_i - \mu_{i'} = 0\)

\(H_1\) : \(\mu_i - \mu_{i'} \ne 0\)

Nilai statistik uji untuk Uji Beda Nyata Terkecil (BNT) adalah: \[ BNT = t_{\alpha_2,N-k}\sqrt{KTG(\frac{1}{n_1}+\frac{1}{n_{i'}})} \]

Pasangan perlakuan \(i\) dan \(i'\) dinyatakan memiliki nilai rata-rata yang berbeda jika: \[ |\bar{Y_i}-\bar{Y_{i'}}| \geq BNT \]

Hasil output uji BNT dari R ditampilkan sebagai berikut

       Rate groups
NY 13.48333      a
HO 13.30667      a
ME 13.24444     ab
AT 13.19444     ab
CH 12.61111     bc
PH 12.20000      c
Gambar 4. Plot Hasil BNT

Gambar 4. Plot Hasil BNT

Pada tabel dan plot yang digambarkan di atas dapat kita ketahui urutan nilai Rate tertinggi ada di Kota New York dan nilai Rate terendah di Kota Philadelphia.

Nampak juga bahwa nilai Rate di Kota New York, Houston, Memphis, dan Atlanta dinyatakan tidak berbeda signifikan. Nilai Rate pada Memphis, Atlanta, dan Chicago juga tidak berbeda signifikan. Begitupun nilai Rate pada Kota Chicago dan Philadelphia.

Dapat disimpulkan dari uji BNT bahwa memang terdapat perbedaan signifikan atas nilai suku bunga kredit bank untuk pinjaman mobil di keenam kota tersebut. Nilai suku bunga kredit terendah berada di Kota Philadelphia dan Chicago yang dinyatakan tidak berbeda secara signifikan.

3.4.5.2 Uji Beda Nyata Jujur (BNJ)

Hipotesis yang digunakan dalam uji Lanjut yaitu:

\(H_0\) : \(\mu_i - \mu_{i'} = 0\)

\(H_1\) : \(\mu_i - \mu_{i'} \ne 0\)

Nilai statistik uji untuk Uji Beda Nyata Jujur (BNJ) adalah: \[ q_{hit}=\frac{|\bar{Y_i}-\bar{Y_{i'}}|}{\sqrt{KTG(\frac{1}{n_i}+\frac{1}{n_{i'}})}} \]

Penolakan \(H_0\) berdasarkan nilai-p yang diperoleh dari tabel \(q\) dengan titik kritis yang berderajat bebas \(k\) dan \(N-k\)

Hasil output uji BNJ dari R ditampilkan sebagai berikut

  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = Rate ~ City, data = data)

$City
             diff         lwr         upr     p adj
CH-AT -0.58333333 -1.52529329  0.35862662 0.4520106
HO-AT  0.11222222 -0.82973773  1.05418218 0.9992262
ME-AT  0.05000000 -0.89195995  0.99195995 0.9999856
NY-AT  0.28888889 -0.65307106  1.23084884 0.9420131
PH-AT -0.99444444 -1.93640440 -0.05248449 0.0329734
HO-CH  0.69555556 -0.24640440  1.63751551 0.2606185
ME-CH  0.63333333 -0.30862662  1.57529329 0.3599444
NY-CH  0.87222222 -0.06973773  1.81418218 0.0842029
PH-CH -0.41111111 -1.35307106  0.53084884 0.7860914
ME-HO -0.06222222 -1.00418218  0.87973773 0.9999573
NY-HO  0.17666667 -0.76529329  1.11862662 0.9933038
PH-HO -1.10666667 -2.04862662 -0.16470671 0.0127365
NY-ME  0.23888889 -0.70307106  1.18084884 0.9739595
PH-ME -1.04444444 -1.98640440 -0.10248449 0.0217928
PH-NY -1.28333333 -2.22529329 -0.34137338 0.0024794
Gambar 5. Plot Hasil BNJ

Gambar 5. Plot Hasil BNJ

Hasil output pada R menampilkan seluruh pasangan-pasangan yang mungkin dibandingkan. Pada selang kepercayaan 95%, perbandingan yang dinyatakan berbeda adalah pasangan yang memiliki nilai rentang batas bawah (lwr) dan batas atas (upr) yang tidak melewati nilai 0 dan diperkuat dari nilai p adj yang kurang dari 0.05.

Pada perbandingan tersebut, kita ketahui pasangan yang dinyatakan berbeda yaitu PH-AT, PH-HO, PH-ME, dan PH-NY. Pada kasus ini terlihat nilai rata-rata Rate yang paling berbeda terletak di Kota Philadelphia.

4 DAFTAR PUSTAKA

Bluman, A.G. 2018. Elementary Statistics: A Step By Step Approach, Tenth Edition. McGraw-Hill: New York.

Triola, M.F. 2019. Essentials of Statistics, Sixth Edition. Pearson: New York.

Moore, D.S., G.P. McCabe, dan B.A. Craig. 2009. Introduction to the Practice of Statistics. W.H. Freeman and Co: New York.