1 Praktek 12: Ekspektasi Maksimalisasi

Dalam kelas ini kita akan menggunakan algoritma Ekspektasi Maksimalisasi untuk mengestimasi parameter Campuran Gaussian. Metode ini menyediakan pengklasifikasi yang tidak terjaga dan sangat berguna ketika distribusi Gaussian diasumsikan.

Misalkan kita ingin memodelkan parameter populasi yang diasumsikan menjadi salah satu dari dua populasi normal gaussian dengan probabilitas pencampuran \(\pi\). Artinya, \(x_i\sim N(\mu_1, \Sigma_1)\) dengan probabilitas \(\pi\), \(x_i\sim N(\mu_2, \Sigma_2)\) dengan probabilitas \((1-\pi)\). Dinotasikan \(\theta_1= (\mu_1, \Sigma_1)\) dan \(\theta_2= (\mu_2, \Sigma_2)\) parameter untuk tiap populasi dan \(\pi\) sebagai parameter pencampuran, \(\phi_1\) dan \(\phi_2\) untuk densitas tiap distribusi. Algoritma Ekspektasi Maksimalisasi dapat disimpulkan di langkah berikut.

  1. Ambil tebakan awal untuk parameter \(\hat{\mu}_1, \hat{\mu}_2, \hat{\Sigma}_1, \hat{\Sigma}_2, \hat{\pi}\)

  2. Langkah ekspektasi: Menghitung \[\hat{\gamma}_i=\dfrac{\hat{\pi}\phi_1(y_i)}{\hat{\pi}\phi_1(y_i)+(1-\hat{\pi})\phi_2(y_i)}\]

  3. Langkah memaksimumkan: Menghitung Mean dan Varians \[\begin{align*} \hat{\mu_1} &= \dfrac{\sum_{i=1}^n\hat{\gamma}_ix_i}{\sum_{i=1}^n\hat{\gamma}_i} & \hat{\Sigma_1} = \dfrac{1}{n}\dfrac{\sum_{i=1}^n\hat{\gamma}_i(x_i-\mu_1)(x_i-\mu_1)^T}{\sum_{i=1}^n\hat{\gamma}_i}\\ \hat{\mu_2}& = \dfrac{\sum_{i=1}^n(1-\hat{\gamma}_i)x_i}{\sum_{i=1}^n(1-\hat{\gamma}_i)} & \hat{\Sigma_2} = \dfrac{1}{n}\dfrac{\sum_{i=1}^n\hat{\gamma}_i(x_i-\mu_2)(x_i-\mu_2)^T}{\sum_{i=1}^n(1-\hat{\gamma}_i)} \end{align*}\] dan probabilitas campuran \(\hat{\pi} = \dfrac{1}{n}\sum_{i=1}^n\hat{\gamma}_i\).

  4. Iterasikan langkah 2 dan 3 hingga konvergen.

1.1 Latihan 1:

Simulasikan 300 sample dari Gaussian Mixture dengan probabilitas pencampuran setara dengan \(1/3\) sebagai berikut: \[\begin{equation*} Y_1 \sim N\bigg(\begin{bmatrix}1\\1\end{bmatrix},\begin{bmatrix}2&1\\1&1\end{bmatrix} \bigg) \qquad Y_2 \sim N\bigg(\begin{bmatrix}7\\7\end{bmatrix},\begin{bmatrix}2&2\\2&5\end{bmatrix} \bigg) \end{equation*}\]

  1. Visualisasikan distribusinya dengan menggunakan scatter plot dan gunakan skala kontinu untuk memisahkan warna berdasarkan populasinya.

  1. Mengimplementasikan algoritma EM untuk memperkirakan parameternya.

Bantuan: Buat tebakan untuk \(\mu_1\) dan \(\mu_2\) hanya dengan dua dari \(y_i\) dengan acak. Mulai \(\Sigma_1\) dan \(\Sigma_2\) sebagai sample matriks kovarians dan \(\pi\) dengan nilai \(0.5\). Kriteria berhenti dimana perbedaan antara dua nilai berturut-turut dari log ekspektasi lengkap kurang dari toleransi yang diinginkan \(|l_k-l_{k-1}|<\text{tol}\).

  1. Visualisasikan nilai yang diperoleh untuk probabilitas tiap poin iterasi terawal ke-8.
## Warning: package 'reshape' was built under R version 4.0.2

1.2 Latihan 2

Mari gunakan Algoritma EM untuk mengsegmentasikan sebuah gambar. Dalam kasus ini kita akan gunakan gambar melanoma.

## Warning: package 'OpenImageR' was built under R version 4.0.2

Algoritme segmentasi gambar biasa mengubah larik tiga dimensi yaitu gambar menjadi matriks 3 kolom dengan jumlah baris sebanyak jumlah piksel.

## [1] 737280      3

Dalam kasus ini kita akan mencari proyeksi 1 dimensi dari matriks agar algoritma EM dapat digunakan untuk mengestimasi parameter distribusi yang menghasilkan proyeksi.

  1. Implentasikan sebuah fungsi yang dapat memperkirakan parameter dari Gaussian dalam kasus 1 dimensi.
  1. Diketahui dalam literatur bahwa pola melanoma biasanya diekspresikan dalam warna biru. Jalankan algoritma EM menggunakan informasi tersebut dan tampilkan hasil akhirnya.

  1. Gunakan proyeksi yang mempertahankan variabilitas data sebanyak mungkin (komponen pertama di PCA) dan terapkan EM. Visualisasikan hasilnya.

  1. Gunakan proyeksi Pencahayaan \(L = (0.229, 0.588. 0.114)\) dan tampilkan hasil menerapkan algoritma EM.

  1. Pada akhirnya, kita akan gunakan varian dari algoritma Independent Histogram Pursuit. Algoritma ini menemukan proyeksi yang memaksimumkan amplitudo bimodal. sekali proyeksi ditemukan, kita lanjut ke contoh latihan sebelumnya.
