1 PENDAHULUAN
1.1 Latar Belakang Kasus
Majalah Customer Reports melakukan survei pertumbuhan tingkat suku bunga untuk pinjaman pembelian mobil atas sepuluh bank terbesar di beberapa kota besar di Amerika Serikat pada 1985. Beberapa kota yang menjadi target survei yaitu Atlanta, Chicago, Houston, Memphis, New York, dan Philadelphia. Hanya Kota Philadelphia di mana kesepuluh bank tersebut melaporkan tingkat suku bunganya, sementara kota lainnya hanya sembilan dari sepuluh bank yang melaporkan. Demi simplifikasi analisis, satu data bank dari Philadelphia dikeluarkan. Data yang dikeluarkan mencatatkan tingkat suku bunga sebesar 12.25%.
Tujuan utama dari pengumpulan data ini adalah untuk menyelidiki apakah terdapat perbedaan yang signifikan akan tingkat suku bunga kredit untuk pembelian mobil di beberapa kota tersebut.
Untuk mengetahui apakah terdapat perbedaan dengan variabel prediktor (City) yang dikelompokkan menjadi faktor dan nilai respons (Rate) sebagai nilai-nilai kontinu. Hal ini menyebabkan analisis keragaman dipilih sebagai alat analisis yang dapat memberikan jawaban apakah terdapat perbedaan di antara kelompok tersebut.
1.2 Tinjauan Pustaka
1.2.1 Asumsi dan Hipotesis dalam ANOVA Satu Arah
ANOVA memerlukan beberapa asumsi dasar yang perlu dipenuhi yaitu:
- Galat eksperimental hasil data harus berdistribusi secara normal.
- Keragaman antarperlakuan yang sama (homogenitas ragam).
- Antarperlakuan bersifat saling bebas (independen).
Pelanggaran terhadap salah satu asumsi tersebut akan sangat mungkin mengakibatkan hasil analisis yang tidak lagi valid dan sesuai.
Hipotesis yang digunakan di dalam analisis keragaman satu arah yaitu:
\(H_0\): \(\alpha_1 = \alpha_2 = ... = \alpha_i = 0\) vs.
\(H_1\): Setidaknya ada satu \(\alpha_i\) bernilai tidak sama dengan nol.
1.2.2 Tabel ANOVA Satu Arah
Dalam melakukan analisis keragaman, dimanfaatkan tabel ANOVA yang disusun sebagai berikut:
Sumber | db | SS | MS | \(F_{hitung}\) |
---|---|---|---|---|
Faktor | \(db_F\) | \(SSF\) | \(MSF\) | \(F_{db_{F},db_{G};\alpha}\) |
Galat | \(db_E\) | \(SSE\) | \(MSE\) | |
Total | \(db_T\) | \(SST\) |
dengan
\(db_T\) = \(n-1\)
\(db_F\) = \(k-1\)
\(db_E\) = \(db_T - db_F\)
\(SSF\) = \(n\sum_{i=1}^{k}(\bar{y}_{i.}-\bar{y}_{..})^2\)
\(SST\) = \(\sum_{i=1}^{k}\sum_{j=1}^{n}(y_{ij}-\bar{y}_{..})^2\)
\(SSE\) = \(SST - SSF\)
\(MSF\) = \(\frac{SSF}{db_f}\)
\(MSE\) = \(\frac{SSE}{db_E}\)
\(F_{db_{F},db_{G};\alpha}\) = \(\frac{MSF}{MSE}\)
1.2.3 Identitas Jumlah Kuadrat
Identitas Jumlah Kuadrat dinyatakan sebagai \(SS_{Total} = SS_{Factor} + SS_{Error}\) yang kemudian dijabarkan menjadi: \[ \sum_{i=1}^{k}\sum_{j=1}^{n}(y_{ij}-\bar{y}_{..})^2= n\sum_{i=1}^{k}(\bar{y}_{i.}-\bar{y}_{..})^2 + \sum_{i=1}^{k}\sum_{j=1}^{n}(y_{i.}-\bar{y}_{..})^2 \]
1.3 Data
Data tingkat suku bunga kredit untuk mobil yang dihimpun oleh Customer Reports sebagai berikut:
Atlanta | Chicago | Houston | Memphis | NY | PH |
---|---|---|---|---|---|
13.75 | 14.25 | 14.00 | 15.00 | 14.50 | 13.50 |
13.75 | 13.00 | 14.00 | 14.00 | 14.00 | 12.25 |
13.50 | 12.75 | 13.51 | 13.75 | 14.00 | 12.25 |
13.50 | 12.50 | 13.50 | 13.59 | 13.90 | 12.00 |
13.00 | 12.50 | 13.50 | 13.25 | 13.75 | 12.00 |
13.00 | 12.40 | 13.25 | 12.97 | 13.25 | 12.00 |
13.00 | 12.30 | 13.00 | 12.50 | 13.00 | 12.00 |
12.75 | 11.90 | 12.50 | 12.25 | 12.50 | 11.90 |
12.50 | 11.90 | 12.50 | 11.89 | 12.45 | 11.90 |
2 SOURCE CODE
2.1 Library yang Dibutuhkan
> library(knitr)
> library(rmarkdown)
> library(prettydoc)
> library(equatiomatic)
> library(esquisse) # Alat bantu untuk plot
> library(ggplot2) # Untuk plotting
> library(shiny)
> library(tseries)
> library(car) # Uji Levene
> library(agricolae) # Uji Lanjut Anova
2.2 Memanggil Data dan Menampilkan Struktur Data
Pemanggilan data memanfaatkan fitur impor yang tersedia di dalam RStudio. Kali ini memanfaatkan file bertipe .csv
.
> p <- file.path("D:","Tugas","SEM 4","Komstat","Laprak","Data.csv")
> data = read.csv(p,header = TRUE, colClasses = c("real","factor"), sep = ";")
> str(data)
'data.frame': 54 obs. of 2 variables:
$ Rate: num 13.8 13.8 13.5 13.5 13 ...
$ City: Factor w/ 6 levels "AT","CH","HO",..: 1 1 1 1 1 1 1 1 1 2 ...
Terlihat struktur dari data yang merupakan suatu data frame dengan 54 observasi yang terdiri dari 2 variabel. Variabel Rate yang merupakan variabel bertipe numerik dan variabel City yang merupakan variabel bertipe faktor dengan 6 level perlakuan.
Function file.path
digunakan untuk mengatur direktori tempat bekerja. Argument yang dimasukkan berupa direktori yang diinginkan dan file yang akan diakses.
Function read.csv
digunakan untuk memerintahkan R untuk mengakses file berformat csv dengan argument berupa file path yang telah didefinisikan sebelumnya, header bernilai TRUE atau FALSE untuk menentukan apakah baris pertama berlaku sebagai judul, colClasses menunjukkan jenis-jenis data pada masing-masing kolom, dan sep untuk menunjukkan tanda pemisah yang sesuai pada file yang akan diimpor.
Function str
digunakan untuk menunjukkan deskripsi jenis data yang tersedia. Argument yang dimasukkan adalah data yang ingin dideskripsikan.
2.3 Boxplot
> esquisser()
> ggplot(data) +
+ aes(x = City, y = Rate) +
+ geom_boxplot(fill = "#FF8C00") +
+ labs(title = "Loan Rate per City",
+ caption = "Gambar 1. Tingkat Suku Bunga Pinjaman Mobil pada Beberapa Kota Besar di Amerika Serikat") +
+ theme_gray()
Function ggplot
digunakan untuk menyusun grafik. Argument yang dimasukkan dapat beragam. Function ini tersedia di package ggplot2
. Pembuatan grafik dengan ggplot
dapat memanfaatkan bantuan library esquisse
dan dengan perintah esquisser()
.
2.4 Scatterplot
> smoothScatter(data$City,data$Rate,xlab="City",ylab="Rate", main="Gambar 2. Scatterplot Data")
Function smoothScatter
digunakan untuk menyusun grafik tebar yang dimuluskan. Argument yang dimasukkan berupa variabel x, variabel y, label untuk sumbu x dan sumbu y beserta judul plot apabila diperlukan.
2.5 Perhitungan ANOVA dengan fungsi aov
> anova <- aov(Rate~City, data=data)
> summary(anova)
Function aov
digunakan untuk melakukan proses analisis keragaman (Analysis of Variance). Argument yang dimasukkan adalah Respons ~ Prediktor
dengan data = [nama data]
. Dalam kasus ini Rate
berlaku sebagai variabel respons dan City
berlaku sebagai variabel prediktor.
Function summary
digunakan untuk menampilkan penjelasan ringkas atas suatu model. Argument yang dimasukkan adalah model yang telah didefinisikan sebelumnya.
2.6 Pemeriksaan Sisaan dengan Diagnostic Plots
> par(mfrow = c(2,2))
> plot(anova,1)
> plot(anova,2)
> plot(anova,3)
> title("Diagnostic Plots untuk ANOVA", line=-18.5, outer=TRUE)
Function par
digunakan untuk mengatur tampilan grafik ke dalam susunan yang ditentukan. Argument yang dimasukkan adalah jumlah grafik pada satu baris dan jumlah grafik pada satu kolom yang diinginkan.
Function plot
digunakan untuk menggambarkan plot atas suatu model yang telah ditentukan. Untuk model ANOVA, angka 1 akan menampilkan plot Residuals vs. Fitted. Angka 2 akan menampilkan Q-Q Normal Plot. Angka 3 akan menampilkan plot Scale - Location.
Function title
digunakan untuk menambahkan teks judul. Argument yang diisikan berupa teks judul, posisi judul, dan pemberian izin batas margin untuk diisi teks atau tidak.
2.7 Uji Normalitas Galat
> sisa <- residuals(anova)
> jarque.bera.test(sisa)
> shapiro.test(sisa)
Function residuals
digunakan untuk memerintahkan R menghitung galat atas nilai respons hasil prediktor. Argument yang dimasukkan adalah model yang akan dihitung nilai galatnya.
Function jarque.bera.test
digunakan untuk melakukan uji normalitas Jarque Bera. Function ini tersedia dalam package tseries
. Argument yang diisikan adalah vektor yang akan diuji. Dalam kasus ini vektor sisa
yang merupakan galat dari model anova.
Function jarque.bera.test
digunakan untuk melakukan uji normalitas Jarque Bera. Argument yang diisikan adalah vektor yang akan diuji. Dalam kasus ini vektor sisa
yang merupakan galat dari model anova.
Function shapiro.test
digunakan untuk melakukan uji normalitas Shapiro-Wilk. Argument yang diisikan adalah vektor yang akan diuji. Dalam kasus ini vektor sisa
yang merupakan galat dari model anova.
2.8 Uji Homogenitas Ragam dengan Uji Levene
> leveneTest(Rate~City, data=data)
Function leveneTest
digunakan untuk melakukan uji Levene untuk homogenitas keragaman. Argument yang diisikan adalah model yang akan diujikan. Dalam kasus ini Rate
berlaku sebagai variabel respons dan City
berlaku sebagai variabel prediktor.
2.9 Uji Lanjut BNT
> bnt <- LSD.test(anova, "City", alpha = 0.05)
> bnt$groups
> plot(bnt)
Function LSD.test
digunakan untuk melakukan uji perbandingan Beda Nyata Terkecil (BNT). Function ini tersedia pada package agricolae
. Argument yang diisikan berupa model yang akan dihitung perbedaannya dan nilai signifikansi (alpha).
Function bnt$groups
digunakan untuk menampilkan nilai rata-rata masing-masing kelompok yang telah ditentukan serta apakah tergolong dalam satu grup yang sama atau tidak, dengan kata lain berbeda signifikan atau tidak.
Function plot
digunakan untuk menggambarkan grafik. Argument yang diisikan adalah objek yang akan digambarkan.
2.10 Uji Lanjut BNJ
> bnj <- TukeyHSD(anova,conf.level=0.95)
> bnj
> plot(bnj)
Function TukeyHSD
digunakan untuk melakukan uji perbandingan Beda Nyata Jujur (BNJ). Function ini tersedia pada package agricolae
. Argument yang diisikan berupa model yangakan diuji.
Function plot
digunakan untuk menggambarkan grafik. Argument yang diisikan adalah objek yang akan digambarkan.
3 HASIL DAN PEMBAHASAN
3.1 Statistika Deskriptif
3.1.1 Nilai Rata-Rata
Nilai rata-rata untuk setiap kelompok data ke-j didefinisikan sebagai berikut: \[ \bar{x_j}=\frac{\sum_{i=1}^{n}x_{ji}}{n} \] Sehingga, nilai rata-rata tiap kelompok data: \[ \bar{x_1}=\frac{13.75 + 13.75 + ... + 12.50}{9}=\frac{118.75}{9}=13.19 \] \[ \bar{x_2}=\frac{14.25 + 13.00 + ... + 11.90}{9}=\frac{113.50}{9}=12.61 \] \[ \bar{x_3}=\frac{14.00 + 14.00 + ... + 12.50}{9}=\frac{119.76}{9}=13.31 \] \[ \bar{x_4}=\frac{15.00 + 14.00 + ... + 11.89}{9}=\frac{119.20}{9}=13.24 \] \[ \bar{x_5}=\frac{14.50 + 14.00 + ... + 12.45}{9}=\frac{121.35}{9}=13.48 \] \[ \bar{x_6}=\frac{13.50 + 12.25 + ... + 11.90}{9}=\frac{109.80}{9}=12.20 \]
3.1.2 Nilai Keragaman Sampel
Nilai keragaman bagi sampel untuk setiap kelompok data ke-j didefinisikan sebagai berikut: \[ s^2_j = \frac{\sum_{i=1}^{n}(x_{ji}-\bar{x})^2}{n-1} \] Sehingga, nilai keragaman masing-masing kelompok data: \[ s^2_1 = \frac{(13.75-13.19)^2+...+(12.50-13.19)^2}{9-1}=\frac{1.597}{8}=0.19965 \] \[ s^2_2 = \frac{(14.25-12.61)^2+...+(11.90-12.61)^2}{9-1}=\frac{4.034}{8}=0.5042 \] \[ s^2_3 = \frac{(14.00-13.31)^2+...+(12.50-13.31)^2}{9-1}=\frac{2.476}{8}=0.3095 \] \[ s^2_4 = \frac{(15.00-13.24)^2+...+(11.89-13.24)^2}{9-1}=\frac{7.481}{8}=0.935 \] \[ s^2_5 = \frac{(14.50-13.48)^2+...+(12.45-13.48)^2}{9-1}=\frac{4.135}{8}=0.517 \] \[ s^2_6 = \frac{(13.50-12.20)^2+...+(11.90-12.20)^2}{9-1}=\frac{2.035}{8}=0.254 \]
3.2 Analisis Plot
3.2.1 Boxplot
Berdasarkan boxplot pada Gambar 1 nampak indikasi-indikasi perbedaan antar nilai tengah dari keenam kota terpilih. Nilai tengah setiap kota telah dicantumkan pada subbab sebelumnya. Pada kota Chicago dan Philadelphia bahkan terdeteksi satu pencilan.
3.2.2 Scatterplot
Berdasarkan scatterplot pada Gambar 2 nampak indikasi data yang relatif memusat, yang kemudian didukung dari nilai keragaman yang relatif kecil.
3.3 Analisis Keragaman
3.3.1 Hipotesis
\(H_0\): \(\alpha_1 = \alpha_2 = ... = \alpha_6 = 0\) vs.
\(H_1\): Setidaknya ada satu \(\alpha_i\) bernilai tidak sama dengan nol, \(i = 1,2,...,6\).
3.3.2 Taraf Signifikansi
Kita tetapkan taraf signifikansi (\(\alpha\)) sebesar 5%.
3.3.3 Hasil Analisis Sidik Ragam (ANOVA)
Hasil Analisis Variansi dari R ditampilkan sebagai berikut:
Df Sum Sq Mean Sq F value Pr(>F)
City 5 10.95 2.1891 4.829 0.00117 **
Residuals 48 21.76 0.4533
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
yang kita tabelkan menjadi:
Sumber | db | SS | MS | \(F_{hitung}\) | P-Value |
---|---|---|---|---|---|
Faktor | 5 | 10.95 | 2.1891 | 4.829 | 0.0017 |
Galat | 48 | 21.76 | 0.4533 | ||
Total | 53 | 32.71 |
3.3.4 Keputusan
Berdasarkan derajat kebebasan dalam tabel ANOVA, titik kritis untuk pengujian hipotesis ditentukan dengan bantuan tabel-F dan diperoleh hasil: \[ F_{5,48; 0.05}=2.409 \] Keputusan:
- \(P-Value < \alpha\), maka tolak \(H_0\).
- \(F_{hitung} > F_{5,48; 0.05}\), maka tolak \(H_0\).
3.3.5 Kesimpulan
Berdasarkan pengujian analisis ragam dengan taraf signifikansi sebesar 5%, dapat disimpulkan bahwa terdapat cukup bukti untuk mengatakan adanya perbedaan tingkat suku bunga kredit dari 10 bank terbesar yang terletak di 6 kota di Amerika Serikat.
3.4 Asumsi dalam ANOVA
Pengecekan asumsi dalam ANOVA dapat ditempuh dengan beberapa cara untuk masing-masing asumsinya. Pengujian asumsi pada ANOVA memanfaatkan sisaan masing-masing pengamatan yang didefinisikan sebagai: \[ e_i = |\hat{Y_i}-Y_i| \]
3.4.1 Diagnostic Plots
Kumpulan plot diagnostik sisaan dari model ANOVA yang sudah dibentuk ditampilkan di bawah ini.
Gambar 3 Kumpulan Diagnostic Plot
Pada plot Residuals vs Fitted terlihat sisaan hasil model ANOVA menyebar secara acak. Garis tengah merah yang terbentuk masih relatif linier horizontal. Model dapat diyakini sudah tepat.
Pada plot Normal Q-Q terlihat sisaan yang dibakukan masih terkumpul di garis tengah diagonal yang membagi plot. Hanya saja ada indikasi beberapa titik sisaan yang relatif jauh dari garis tengah diagonal. Secara grafis, terdapat indikasi lemah pelanggaran asumsi normalitas. Uji formal normalitas diperlukan untuk memastikan kecurigaan ini.
Pada plot Scale-Location terlihat akar kuadrat dari sisaan yang dibakukan relatif membentuk kurva tertentu sehingga tidak terlalu linier. Terdapat indikasi pelanggaran asumsi homoskedastisitas yang perlu dipastikan lewat uji formal homoskedastisitas.
3.4.2 Uji Normalitas Galat
3.4.2.1 Uji Jarque-Bera
Hipotesis dalam Uji Jarque-Bera sebagai berikut:
\(H_0\): Galat berdistribusi normal vs.
\(H_1\): Galat tidak berdistribusi normal
Statistik Jarque-Bera didefinisikan sebagai: \[ JB = \frac{n}{6}(S^2 \frac{1}{4}(K-3)^2) \]
di mana \(S\) merupakan statistik kemencengan (skewness): \[ S = \frac{\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^3}{(\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^2)^{3/2}} \]
dan \(K\) merupakan statistik keruncingan (kurtosis): \[ K = \frac{\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^4}{(\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^2)^{2}} \]
Pengambilan Keputusan:
Ketika data menyebar normal, nilai statistik \(JB\) akan mendekati 0, di mana nilai \(S\) bernilai mendekati 0 dan \(K\) bernilai mendekati 3. Secara asimtotik statistik \(JB\) akan menyebar mengikuti statistik \(\chi^2_2\). Penolakan terhadap \(H_0\) dilakukan pada statistik \(JB\) yang bernilai besar.
Hasil output statistik \(JB\) ditampilkan sebagai berikut:
Jarque Bera Test
data: sisa
X-squared = 2.6241, df = 2, p-value = 0.2693
Berdasarkan output di atas, kita peroleh nilai p-value = 0.2693.
Keputusan: \(P-Value > \alpha\), maka terima \(H_0\). Dapat disimpulkan dengan taraf signifikansi 5% dengan uji Jarque Bera, galat hasil model ANOVA masih menyebar normal.
3.4.3 Uji Shapiro-Wilk
Hipotesis dalam Uji Shapiro-Wilk yaitu:
\(H_0\): Pengamatan menyebar normal vs.
\(H_1\): Pengamatan tidak menyebar normal
Statistik uji bagi Uji Shapiro-Wilk dirumuskan sebagai: \[ W = \frac{(\sum_{i=1}^{n}a_ix_{(i)})^2}{\sum_{i=1}^{n}(x_i-\bar{x})^2} \]
dengan \(x_{(i)}\) menyatakan pengamatan urutan ke-i dan \(a_i\) menyatakan koefisien yang dibentuk dari nilai harapan dan matriks kovarians statistika urutan.
Pengambilan keputusan bagi uji Shapiro-Wilk memanfaatkan simulasi nilai-nilai Shapiro-Wilk (dalam bentuk tabel khusus).
Hasil output uji Shapiro pada R dinyatakan sebagai berikut:
Shapiro-Wilk normality test
data: sisa
W = 0.97156, p-value = 0.2257
Berdasarkan output di atas, kita peroleh nilai p-value = 0.2257.
Keputusan: \(P-Value > \alpha\), maka terima \(H_0\). Dapat disimpulkan dengan taraf signifikansi 5% dengan uji Shapiro Wilk, galat hasil model ANOVA masih menyebar normal.
Sehingga, asumsi normalitas pada model ANOVA masih terpenuhi.
3.4.4 Uji Homogenitas Ragam dengan Uji Levene
Hipotesis yang digunakan dalam Uji Levene:
\(H_0\): \(\sigma_1 = \sigma_2 = ... = \sigma_6\) vs.
\(H_1\): \(\sigma_i \ne \sigma_j\) setidaknya untuk satu pasang \(i\) dan \(j\) dengan catatan \(i \ne j\) dan \(i,j = 1,2,...,6\).
Statistik Uji Levene: \[ W = \frac{(N-k)\sum_{i=1}^{k}n_i(\bar{Z_{i.}}-\bar{Z_{..}})^2}{(k-1)\sum_{i=1}^{k}\sum_{j=1}^{n_i}(Z_{ij}-\bar{Z{i.}})^2} \]
dengan \(N\) menyatakan jumlah observasi, \(k\) menyatakan jumlah level perlakuan, \(Z_{ij}\) didefinisikan sebagai: \[ Z_{ij}=|Y_{ij}-\tilde{Y}_{i.}| \]
di mana \(\tilde{Y}_{i.}\) menunjukkan median pada perlakuan ke-i dan \[ \bar{Z_{i.}}=\frac{\sum_{j=1}^{n_i}z_{ij}}{n_i} \] \[ \bar{Z_{..}}=\frac{\sum_{j=1}^{n_i}\sum_{i=1}^{k}z_{ij}}{N} \]
Pengambilan keputusan memanfaatkan statistik \(F\) dengan derajat bebas \(k-1\) dan \(N-k\)
Hasil output uji Levene pada R dinyatakan sebagai berikut:
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 5 1.2797 0.2882
48
Berdasarkan output di atas, kita peroleh nilai p-value = 0.2882.
Keputusan: \(P-Value > \alpha\), maka terima \(H_0\). Dapat disimpulkan dengan taraf signifikansi 5% dengan uji Leven, tidak terdapat cukup bukti setidaknya ada satu ragam populasi kelompok model yang berbeda.
Sehingga, asumsi homogenitas ragam pada model ANOVA masih terpenuhi.
3.4.5 Uji Lanjut
Uji lanjut setelah pengujian simultan apabila menghasilkan kesimpulan menolak \(H_0\) diperlukan. Hal ini untuk mencari perlakuan mana yang berbeda karena uji simultan hanya memberikan informasi mengenai ada/tidaknya perbedaan. Uji lanjut yang biasanya digunakan yaitu Uji Beda Nyata Terkecil (BNT) dan Uji Beda Nyata Jujur (BNJ).
3.4.5.1 Beda Nyata Terkecil (BNT)
Hipotesis yang digunakan dalam uji Lanjut yaitu:
\(H_0\) : \(\mu_i - \mu_{i'} = 0\)
\(H_1\) : \(\mu_i - \mu_{i'} \ne 0\)
Nilai statistik uji untuk Uji Beda Nyata Terkecil (BNT) adalah: \[ BNT = t_{\alpha_2,N-k}\sqrt{KTG(\frac{1}{n_1}+\frac{1}{n_{i'}})} \]
Pasangan perlakuan \(i\) dan \(i'\) dinyatakan memiliki nilai rata-rata yang berbeda jika: \[ |\bar{Y_i}-\bar{Y_{i'}}| \geq BNT \]
Hasil output uji BNT dari R ditampilkan sebagai berikut
Rate groups
NY 13.48333 a
HO 13.30667 a
ME 13.24444 ab
AT 13.19444 ab
CH 12.61111 bc
PH 12.20000 c
Gambar 4. Plot Hasil BNT
Pada tabel dan plot yang digambarkan di atas dapat kita ketahui urutan nilai Rate tertinggi ada di Kota New York dan nilai Rate terendah di Kota Philadelphia.
Nampak juga bahwa nilai Rate di Kota New York, Houston, Memphis, dan Atlanta dinyatakan tidak berbeda signifikan. Nilai Rate pada Memphis, Atlanta, dan Chicago juga tidak berbeda signifikan. Begitupun nilai Rate pada Kota Chicago dan Philadelphia.
Dapat disimpulkan dari uji BNT bahwa memang terdapat perbedaan signifikan atas nilai suku bunga kredit bank untuk pinjaman mobil di keenam kota tersebut. Nilai suku bunga kredit terendah berada di Kota Philadelphia dan Chicago yang dinyatakan tidak berbeda secara signifikan.
3.4.5.2 Uji Beda Nyata Jujur (BNJ)
Hipotesis yang digunakan dalam uji Lanjut yaitu:
\(H_0\) : \(\mu_i - \mu_{i'} = 0\)
\(H_1\) : \(\mu_i - \mu_{i'} \ne 0\)
Nilai statistik uji untuk Uji Beda Nyata Jujur (BNJ) adalah: \[ q_{hit}=\frac{|\bar{Y_i}-\bar{Y_{i'}}|}{\sqrt{KTG(\frac{1}{n_i}+\frac{1}{n_{i'}})}} \]
Penolakan \(H_0\) berdasarkan nilai-p yang diperoleh dari tabel \(q\) dengan titik kritis yang berderajat bebas \(k\) dan \(N-k\)
Hasil output uji BNJ dari R ditampilkan sebagai berikut
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = Rate ~ City, data = data)
$City
diff lwr upr p adj
CH-AT -0.58333333 -1.52529329 0.35862662 0.4520106
HO-AT 0.11222222 -0.82973773 1.05418218 0.9992262
ME-AT 0.05000000 -0.89195995 0.99195995 0.9999856
NY-AT 0.28888889 -0.65307106 1.23084884 0.9420131
PH-AT -0.99444444 -1.93640440 -0.05248449 0.0329734
HO-CH 0.69555556 -0.24640440 1.63751551 0.2606185
ME-CH 0.63333333 -0.30862662 1.57529329 0.3599444
NY-CH 0.87222222 -0.06973773 1.81418218 0.0842029
PH-CH -0.41111111 -1.35307106 0.53084884 0.7860914
ME-HO -0.06222222 -1.00418218 0.87973773 0.9999573
NY-HO 0.17666667 -0.76529329 1.11862662 0.9933038
PH-HO -1.10666667 -2.04862662 -0.16470671 0.0127365
NY-ME 0.23888889 -0.70307106 1.18084884 0.9739595
PH-ME -1.04444444 -1.98640440 -0.10248449 0.0217928
PH-NY -1.28333333 -2.22529329 -0.34137338 0.0024794
Gambar 5. Plot Hasil BNJ
Hasil output pada R menampilkan seluruh pasangan-pasangan yang mungkin dibandingkan. Pada selang kepercayaan 95%, perbandingan yang dinyatakan berbeda adalah pasangan yang memiliki nilai rentang batas bawah (lwr) dan batas atas (upr) yang tidak melewati nilai 0 dan diperkuat dari nilai p adj yang kurang dari 0.05.
Pada perbandingan tersebut, kita ketahui pasangan yang dinyatakan berbeda yaitu PH-AT, PH-HO, PH-ME, dan PH-NY. Pada kasus ini terlihat nilai rata-rata Rate yang paling berbeda terletak di Kota Philadelphia.
4 DAFTAR PUSTAKA
Bluman, A.G. 2018. Elementary Statistics: A Step By Step Approach, Tenth Edition. McGraw-Hill: New York.
Triola, M.F. 2019. Essentials of Statistics, Sixth Edition. Pearson: New York.
Moore, D.S., G.P. McCabe, dan B.A. Craig. 2009. Introduction to the Practice of Statistics. W.H. Freeman and Co: New York.