PML - Hipotesis linier One-Way Classification
Video Pembelajaran - P10
Video Pembelajaran dapat diakses melalui link berikut : https://ipb.link/materipml
Model Linier Umum dalam Klasifikasi Satu Arah
Pada model linier satu arah (one-way classification), kita mencoba menganalisis apakah ada perbedaan signifikan antara beberapa perlakuan. Model ini sering digunakan dalam eksperimen di mana perlakuan-perlakuan diuji pada berbagai objek, seperti dalam rancangan percobaan sederhana.
Model liniernya adalah:
\[ y_{ij} = \mu + \tau_i + \epsilon_{ij}, \quad i = 1, \dots, k \quad j = 1, \dots, n_i \]
- \(y_{ij}\): pengamatan ke-\(j\) pada perlakuan ke-\(i\),
- \(\mu\): rataan umum,
- \(\tau_i\): efek dari perlakuan ke-\(i\),
- \(\epsilon_{ij}\): kesalahan acak (\(\epsilon_{ij} \sim N(0, \sigma^2)\)).
Asumsi Utama:
Kesalahan \(\epsilon_{ij}\) berdistribusi normal dengan rata-rata nol dan variansi homogen.
Perlakuan \(\tau_i\) adalah pengaruh tetap dari perlakuan ke-\(i\) terhadap respons \(y_{ij}\).
Model dalam Bentuk Matriks
Model di atas dapat dituliskan dalam bentuk matriks sebagai:
\[ \mathbf{y} = X \boldsymbol{\beta} + \boldsymbol{\epsilon} \]
- \(\mathbf{y}\) adalah vektor pengamatan,
- \(X\) adalah matriks desain yang mengkode perlakuan (sering disebut sebagai matriks model atau desain),
- \(\boldsymbol{\beta}\) adalah vektor parameter yang akan diestimasi (terdiri dari \(\mu\) dan efek perlakuan \(\tau_i\)),
- \(\boldsymbol{\epsilon}\) adalah vektor kesalahan acak.
Matriks desain \(X\) pada model ini mengandung kolom yang mengkodekan perlakuan-perlakuan. Pada umumnya, model ini adalah model linier aditif.
Hipotesis yang Diuji
Pengujian hipotesis dilakukan untuk mengevaluasi apakah semua perlakuan memiliki efek yang sama. Hipotesis nol (\(H_0\)) yang diuji adalah:
\[ H_0: \tau_1 = \tau_2 = \dots = \tau_k \]
Artinya, tidak ada perbedaan antara efek dari masing-masing perlakuan. Hipotesis ini juga bisa dituliskan dalam bentuk matriks sebagai:
\[ H_0: C \beta = 0 \]
di mana:
\(C\) adalah matriks kontras yang mendefinisikan hubungan antar parameter (dalam hal ini perbedaan antar perlakuan),
\(\beta\) adalah vektor parameter.
Contoh untuk tiga perlakuan (\(\tau_1\), \(\tau_2\), dan \(\tau_3\)), matriks kontras \(C\) yang digunakan untuk menguji apakah ada perbedaan antara perlakuan 1, 2, dan 3 bisa dituliskan sebagai:
\[ C = \begin{pmatrix} 1 & -1 & 0 \\ 0 & 1 & -1 \end{pmatrix} \]
Proses Pengujian Hipotesis
Estimasi Parameter dengan Least Squares
Untuk mengestimasi parameter (\(\beta\)), kita menggunakan metode Least Squares. Estimasi parameter \(\hat{\beta}\) diberikan oleh:
\[ \hat{\beta} = (X'X)^{-1} X'y \]
di mana:
\(X'\) adalah transpos dari matriks desain,
\(y\) adalah vektor pengamatan.
Matriks Kontras
Matriks kontras \(C\) digunakan untuk mendefinisikan hipotesis yang ingin diuji. Matriks ini menentukan perbedaan antar parameter (misalnya antar perlakuan). Dalam konteks ini, \(C\) merumuskan perbedaan antara efek perlakuan.
Statistik Uji F
Statistik uji yang digunakan adalah statistik F yang mengikuti distribusi F. Formula statistik uji F diberikan oleh:
\[ F = \frac{C \hat{\beta}' (C (X'X)^{-1} C')^{-1} C \hat{\beta}}{s^2} \]
di mana:
\(C \hat{\beta}\) adalah hasil estimasi dari kontras-kontras parameter,
\((X'X)^{-1}\) adalah invers dari matriks informasi \(X'X\),
\(s^2\) adalah varians residual yang dihitung sebagai:
\[ s^2 = \frac{\sum \text{residual}^2}{n - r} \]
Keputusan Uji Hipotesis
Setelah menghitung nilai \(F\), kita bandingkan dengan nilai kritis dari distribusi F (\(F_{\text{tabel}}\)) untuk tingkat signifikansi yang diberikan (\(\alpha = 0.05\)):
- Jika \(F_{\text{hitung}} > F_{\text{tabel}}\), kita tolak hipotesis nol dan menyimpulkan bahwa ada perbedaan signifikan antar perlakuan.
- Jika \(F_{\text{hitung}} \leq F_{\text{tabel}}\), kita gagal menolak hipotesis nol, yang berarti tidak ada bukti yang cukup untuk menyimpulkan adanya perbedaan antar perlakuan.
Implementasi dalam R
Membuat Data dan Model Linier
Berikut contoh implementasi dalam R untuk membangun model linier dan melakukan pengujian hipotesis menggunakan data simulasi:
# Data Observasi
y <- c(3, 2, 4, 7, 6, 5) # Observasi
treatment <- factor(rep(1:3, each = 2)) # Faktor Perlakuan (1, 2, 3 dengan 2 ulangan)
# Membuat model linier
model <- lm(y ~ treatment)
# Ringkasan dari model
summary(model)##
## Call:
## lm(formula = y ~ treatment)
##
## Residuals:
## 1 2 3 4 5 6
## 0.5 -0.5 -1.5 1.5 0.5 -0.5
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.5000 0.9574 2.611 0.0796 .
## treatment2 3.0000 1.3540 2.216 0.1135
## treatment3 3.0000 1.3540 2.216 0.1135
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.354 on 3 degrees of freedom
## Multiple R-squared: 0.6857, Adjusted R-squared: 0.4762
## F-statistic: 3.273 on 2 and 3 DF, p-value: 0.1762
ANOVA untuk Pengujian Hipotesis
Untuk menguji hipotesis nol menggunakan ANOVA, kita bisa menjalankan
fungsi anova():
## Analysis of Variance Table
##
## Response: y
## Df Sum Sq Mean Sq F value Pr(>F)
## treatment 2 12.0 6.0000 3.2727 0.1762
## Residuals 3 5.5 1.8333
Hasil ANOVA akan memberikan statistik F, nilai p, dan apakah kita bisa menolak atau menerima hipotesis nol.
Pengujian Kontras dengan
linearHypothesis()
Untuk menguji hipotesis kontras spesifik, misalnya apakah \(\tau_1 = \tau_2\) dan \(\tau_2 = \tau_3\), kita bisa menggunakan
fungsi linearHypothesis() dari paket car:
# Install dan load paket 'car' jika belum terpasang
# install.packages("car")
library(car)
# Matriks kontras untuk menguji H0: tau1 = tau2 dan tau2 = tau3
C <- rbind(c(1, -1, 0), c(0, 1, -1))
# Menguji hipotesis kontras
linearHypothesis(model, C)## Linear hypothesis test
##
## Hypothesis:
## (Intercept) - treatment2 = 0
## treatment2 - treatment3 = 0
##
## Model 1: restricted model
## Model 2: y ~ treatment
##
## Res.Df RSS Df Sum of Sq F Pr(>F)
## 1 5 5.6111
## 2 3 5.5000 2 0.11111 0.0303 0.9704
Fungsi ini akan menghitung statistik uji untuk hipotesis kontras dan memberikan hasil apakah hipotesis bisa ditolak atau tidak.
Menghitung F-Hitung Secara Manual
Jika kita ingin menghitung \(F_{\text{hitung}}\) secara manual seperti dijelaskan dalam dokumen, berikut sintaks R-nya:
# Menghitung matriks XtX dan XtY
XtX <- t(model.matrix(model)) %*% model.matrix(model)
XtY <- t(model.matrix(model)) %*% y
# Estimasi parameter (beta)
beta_hat <- solve(XtX) %*% XtY
# Matriks kontras
C <- matrix(c(1, -1, 0, 0, 1, -1), nrow = 2, byrow = TRUE)
# Menghitung F-hitung
s2 <- sum(resid(model)^2) / model$df.residual
F_value <- t(C %*% beta_hat) %*% solve(C %*% solve(XtX) %*% t(C)) %*% (C %*% beta_hat) / s2
F_value## [,1]
## [1,] 0.06060606
Contoh Soal
Pertimbangkan model klasifikasi satu arah dengan efek tetap dan \(k = 3\). Periksa setiap hipotesis nol berikut untuk testability.
\(H_0: \tau_1 = \tau_3 \text{ dan } \tau_1 - 2\tau_2 + \tau_3 = 0\)
\(H_0: \tau_1 = \tau_2 \text{ dan } \tau_1 = \tau_3 \text{ dan } 2\tau_1 - \tau_2 - \tau_3 = 0\)
- \(H_0: \tau_1 = \tau_3\) dan \(H_0: \tau_1 - 2\tau_2 + \tau_3 = 0\) apakah testable?
Jawaban:
Model statistik:
\[ y_{ij} = \mu + \tau_i + \varepsilon_{ij} \quad i = 1,2,3 \quad j = 1,2,...,n_i \]
\[ \tau_1 - 2\tau_2 + \tau_3 = 0 \]
\[ C_2 = \begin{bmatrix} 0 & 1 & -2 & 1 \end{bmatrix} \]
\[ \tau_1 = \tau_3 \]
\[ C_1 = \begin{bmatrix} 0 & 1 & 0 & -1 \end{bmatrix} \]
\[ C = \begin{bmatrix} 0 & 1 & -2 & 1 \\ 0 & 1 & 0 & -1 \end{bmatrix} \]
\[ \alpha_1 \begin{bmatrix} 0 & 1 & -2 & 1 \end{bmatrix} + \alpha_2 \begin{bmatrix} 0 & 1 & 0 & -1 \end{bmatrix} = 0 \]
\[ \Rightarrow \alpha_1 + \alpha_2 = 0 \] \[ \Rightarrow -2\alpha_1 + 0 = 0 \] \[ \Rightarrow \alpha_1 - \alpha_2 = 0 \]
Maka, kesimpulannya:
\[ \alpha_1 = \alpha_2 = 0 \]
Sehingga \(C\) independen dan \(H_0\) testable.
- \[ H_0: \tau_1 = \tau_2 \quad \text{dan} \quad \tau_1 = \tau_3 \quad \text{dan} \quad 2\tau_1 - \tau_2 - \tau_3 = 0 \]
\[ C = \begin{bmatrix} 0 & 1 & -1 & 0 \\ 0 & 1 & 0 & -1 \\ 0 & 2 & -1 & -1 \end{bmatrix} \quad \beta = \begin{bmatrix} \mu \\ \tau_1 \\ \tau_2 \\ \tau_3 \end{bmatrix} \]
\[ c_1\beta = \begin{bmatrix} 0 & 1 & -1 & 0 \end{bmatrix} \beta = \tau_1 - \tau_2 \] \[ c_2\beta = \begin{bmatrix} 0 & 1 & 0 & -1 \end{bmatrix} \beta = \tau_1 - \tau_3 \] \[ c_3\beta = \begin{bmatrix} 0 & 2 & -1 & -1 \end{bmatrix} \beta = 2\tau_1 - \tau_2 - \tau_3 \]
\[ \alpha_1 \begin{bmatrix} 0 & 1 & -1 & 0 \end{bmatrix} + \alpha_2 \begin{bmatrix} 0 & 1 & 0 & -1 \end{bmatrix} + \alpha_3 \begin{bmatrix} 0 & 2 & -1 & -1 \end{bmatrix} = 0 \]
\[ \Rightarrow \alpha_1 + \alpha_2 + 2\alpha_3 = 0 \] \[ \Rightarrow - \alpha_1 + 0 - \alpha_3 = 0 \] \[ \Rightarrow 0 - \alpha_2 - \alpha_3 = 0 \]
Maka:
\[ \alpha_1 = 0 \] \[ \alpha_1 = \alpha_2 = -\alpha_3 = 0 \] \[ \alpha_1 = \alpha_2 = \alpha_3 = 0 \]
Sehingga \(C\) independen dan \(H_0\) testable ✓.
Latihan Soal
Pertimbangkan model klasifikasi satu arah dengan efek tetap dan \(k = 3\). Periksa setiap hipotesis nol berikut untuk testability.
\(H_0: \tau_1 + \tau_2 = 2\tau_3 \text{ dan } \tau_1 - \tau_2 = 0\)
\(H_0: \tau_1 = \tau_2 \text{ dan } \tau_3 = \tau_2 - \tau_1 \text{ dan } \tau_1 + \tau_3 = 0\)
Pertimbangkan model klasifikasi satu arah dengan efek tetap dan \(k = 3\). Periksa setiap hipotesis nol berikut untuk testability.
\(H_0: \tau_1 = \tau_3 \text{ dan } 3\tau_2 - \tau_1 = \tau_3\)
\(H_0: \tau_1 = 2\tau_2 - \tau_3 \text{ dan } \tau_1 + \tau_2 = \tau_3\)
Pertimbangkan model klasifikasi satu arah dengan efek tetap dan \(k = 3\). Periksa setiap hipotesis nol berikut untuk testability.
\(H_0: \tau_1 + \tau_2 = 3\tau_3 \text{ dan } \tau_1 - \tau_3 = \tau_2\)
\(H_0: \tau_2 = \tau_1 - \tau_3 \text{ dan } \tau_1 + \tau_2 = 0\)
Pertimbangkan model klasifikasi satu arah dengan efek tetap dan \(k = 3\). Periksa setiap hipotesis nol berikut untuk testability.
\(H_0: \tau_1 = 2\tau_3 \text{ dan } \tau_1 - \tau_2 = \tau_3\)
\(H_0: 3\tau_1 = \tau_2 \text{ dan } \tau_1 + \tau_3 = 2\tau_2\)
Pertimbangkan model klasifikasi satu arah dengan efek tetap dan \(k = 3\). Periksa setiap hipotesis nol berikut untuk testability.
\(H_0: 2\tau_1 - \tau_2 = \tau_3 \text{ dan } \tau_1 = \tau_2\)
\(H_0: \tau_1 = \tau_3 \text{ dan } \tau_2 - \tau_3 = \tau_1 - \tau_2\)
Pertimbangkan model klasifikasi satu arah dengan efek tetap dan \(k = 3\). Periksa setiap hipotesis nol berikut untuk testability.
\(H_0: \tau_1 + 2\tau_2 = \tau_3 \text{ dan } \tau_2 = \tau_1 + \tau_3\)
\(H_0: \tau_1 - \tau_3 = \tau_2 \text{ dan } 2\tau_1 = \tau_3\)
Pertimbangkan model klasifikasi satu arah dengan efek tetap dan \(k = 3\). Periksa setiap hipotesis nol berikut untuk testability.
\(H_0: \tau_1 = \tau_2 = \tau_3\)
\(H_0: 2\tau_1 + \tau_3 = \tau_2 \text{ dan } \tau_1 = \tau_2 - \tau_3\)
Pertimbangkan model klasifikasi satu arah dengan efek tetap dan \(k = 3\). Periksa setiap hipotesis nol berikut untuk testability.
\(H_0: \tau_1 + \tau_3 = 2\tau_2 \text{ dan } \tau_1 = 2\tau_3\)
\(H_0: \tau_2 = 2\tau_1 - \tau_3 \text{ dan } \tau_3 = \tau_2 + \tau_1\)
Pertimbangkan model klasifikasi satu arah dengan efek tetap dan \(k = 3\). Periksa setiap hipotesis nol berikut untuk testability.
\(H_0: \tau_1 + \tau_3 = \tau_2 \text{ dan } 3\tau_1 - 2\tau_2 = \tau_3\)
\(H_0: \tau_2 = \tau_3 \text{ dan } \tau_1 + \tau_2 = 3\tau_3\)
- Pertimbangkan model klasifikasi satu arah dengan efek tetap dan \(k = 3\). Periksa setiap hipotesis nol berikut untuk testability.
\(H_0: 2\tau_1 = \tau_3 \text{ dan } \tau_2 + \tau_3 = \tau_1\)
\(H_0: \tau_1 = \tau_3 \text{ dan } \tau_1 + \tau_2 = 3\tau_3\)