Code
6.5 Monte Carlo Markov Chain (MCMC)
Teori Resiko
Sebenarnya materi yang dari web untuk 6.5 itu masih sedang dalam penulisan dan belum selesai dalam pengeditan. Jadi apa yang ditulis disini hanya memberikan gambaran besarnya saja.
Ide dari teknik Monte Carlo bergantung pada hukum bilangan besar (yang menjamin konvergensi rata-rata terhadap integral) dan teorema limit pusat (yang digunakan untuk mengukur ketidakpastian dalam perhitungan). Perlu diingat kembali jika (\(X_i\) ) adalah urutan ke-i dari variabel acak dengan distribusi F, maka
\[
\frac{1}{\sqrt{n}}\left(\sum_{i=1}^n h(X_i)-\int h(x)dF(x)\right)\overset{\mathcal{L}}{\rightarrow }\mathcal{N}(0,\sigma^2),\text{ as }n\rightarrow\infty ,
\]
atau beberapa varian \(σ^2>0\) . Namun sebenarnya, teorema ergodik dapat digunakan untuk melemahkan hasil sebelumnya, karena independensi variabel tidak diperlukan. Lebih tepatnya, jika (\(X_i\) ) adalah Proses Markov dengan ukuran invarian \(μ\) , di bawah beberapa asumsi teknis tambahan, maka dapat diperoleh
\[
\frac{1}{\sqrt{n}}\left(\sum_{i=1}^n h(X_i)-\int h(x)d\mu(x)\right)\overset{\mathcal{L}}{\rightarrow }\mathcal{N}(0,\sigma_\star^2),\text{ as }n\rightarrow\infty.
\]
untuk beberapa varian \(σ^2_⋆>0\) .
Oleh karena itu, dari sifat ini, dapat melihat bahwa tidak selalu mungkin untuk menghasilkan nilai-nilai independen dari F , tetapi untuk menghasilkan proses Markov dengan ukuran invarian F , dan untuk mempertimbangkan rata-rata dari proses (tidak harus independen).
Dengan mempertimbangkan kasus vektor Gaussian terkendala: kami ingin menghasilkan pasangan acak dari vektor acak \(X\) , tetapi kami hanya tertarik pada kasus di mana jumlah komposisinya cukup besar, yang dapat ditulis \(X^T1>m\) untuk nilai nyata \(m\) . Tentu saja, dimungkinkan untuk menggunakan algoritme terima-tolak, tetapi kami telah melihat bahwa ini mungkin sangat tidak efisien. Satu dapat menggunakan Metropolis Hastingsand Gibbs sampler untuk menghasilkan proses Markov dengan ukuran invarian tersebut.
6.5.1 Metropolis Hastings
Algoritma agak sederhana untuk dihasilkan dari \(f\) : dapat dimulai dengan nilai layak \(x_1\) . Kemudian, pada langkah \(t\) , kita perlu menentukan kernel transisi : diberikan \(x_t\) , kita memerlukan distribusi bersyarat untuk \(X_{t+1}\) diberikan \(x_t\) . Algoritme akan bekerja dengan baik jika distribusi bersyarat itu dapat dengan mudah disimulasikan. dengan \(Ï€(â‹…|xt)\) menunjukkan probabilitas itu.
Gambarkan nilai potensial \(x^⋆_{t+1}\) , dan \(u\) , dari distribusi seragam. Selanjutnya Menghitung
\(R= \frac{f(x_{t+1}^\star)}{f(x_t)}\)
jika \(u<r\) , lalu atur \(x_{t+1}=x^⋆_t\) jika \(u≤r\) , maka atur \(x_{t+1}=x_t\)
Di sini r disebut rasio penerimaan selanjutnya menerima nilai baru dengan probabilitas r (atau sebenarnya yang terkecil antara 1 dan r karena r dapat melebihi 1 ).
Misalnya, asumsikan bahwa \(f(⋅|xt)\) seragam pada \([x_t−ε,x_t+ε]\) untuk beberapa \(ε>0\) , dan di mana$ $f (distribusi target kita) adalah \(N(0,1)\) . Kami tidak akan pernah menarik dari \(f\) , tetapi kami akan menggunakannya untuk menghitung rasio penerimaan kami di setiap langkah.
metrop1 <- function (n= 1000 ,eps= 0.5 ){
vec <- matrix (NA , n, 3 )
x= 0
vec[1 ] <- x
for (i in 2 : n) {
innov <- runif (1 ,- eps,eps)
mov <- x+ innov
R <- min (1 ,dnorm (mov)/ dnorm (x))
u <- runif (1 )
if (u < R) x <- mov
vec[i,] <- c (x,mov,R)
}
return (vec)}
#install.packages('gifski')
#if (packageVersion('knitr') < '1.20.14') {
# remotes::install_github('yihui/knitr')
#}
vec <- metrop1 (25 )
u= seq (- 3 ,3 ,by= .01 )
pic_ani = function (k){
plot (1 : k,vec[1 : k,1 ],pch= 19 ,xlim= c (0 ,25 ),ylim= c (- 2 ,2 ),xlab= "" ,ylab= "" )
if (vec[k+ 1 ,1 ]== vec[k+ 1 ,2 ]) points (k+ 1 ,vec[k+ 1 ,1 ],col= "blue" ,pch= 19 )
if (vec[k+ 1 ,1 ]!= vec[k+ 1 ,2 ]) points (k+ 1 ,vec[k+ 1 ,1 ],col= "red" ,pch= 19 )
points (k+ 1 ,vec[k+ 1 ,2 ],cex= 1.5 )
arrows (k+ 1 ,vec[k,1 ]- .5 ,k+ 1 ,vec[k,1 ]+ .5 ,col= "green" ,angle= 90 ,code = 3 ,length= .1 )
polygon (c (k+ dnorm (u)* 10 ,rep (k,length (u))),c (u,rev (u)),col= rgb (0 ,1 ,0 ,.3 ),
border= NA )
segments (k,vec[k,1 ],k+ dnorm (vec[k,1 ])* 10 ,vec[k,1 ])
segments (k,vec[k+ 1 ,2 ],k+ dnorm (vec[k+ 1 ,2 ])* 10 ,vec[k+ 1 ,2 ])
text (k,2 ,round (vec[k+ 1 ,3 ],digits= 3 ))
}
for (k in 2 : 23 ) {pic_ani (k)}
Selanjutnya dapat menggunakan simulasi, maka didapat
vec <- metrop1 (10000 )
simx <- vec[1000 : 10000 ,1 ]
par (mfrow= c (1 ,4 ))
plot (simx,type= "l" )
hist (simx,probability = TRUE ,col= "light blue" ,border= "white" )
lines (u,dnorm (u),col= "red" )
qqnorm (simx)
acf (simx,lag= 100 ,lwd= 2 ,col= "light blue" )
6.5.2 Gibbs Sampler
Dapat mempertimbangkan beberapa vektor \(X=(X_1,⋯,X_d)\) dengan komponen independen, \(X_i∼E(λ_i)\) . Selanjutnya mengambil sampel untuk sampel dari \(X\) yang diberikan \(X^T1>s\) untuk beberapa ambang batas \(s>0\) .
beberapa titik awal x0 ,
Mengambil secara acak \(i∈{1,⋯,d}\)
\(X_i\) mengingat \(X_i>s−x^T_{(−i)}1\) berdistribusi Eksponensial \(E(λ_i)\)
Menggambar \(Y∼E(λ_i)\) dan atur \(x_i=y+(s−x^T_{(−i)}1)_+\) hingga \(x^T_{(−i)}1+x_i>s\)
sim <- NULL
lambda <- c (1 ,2 )
X <- c (3 ,3 )
s <- 5
for (k in 1 : 1000 ){
i <- sample (1 : 2 ,1 )
X[i] <- rexp (1 ,lambda[i])+ max (0 ,s- sum (X[- i]))
while (sum (X)< s){
X[i] <- rexp (1 ,lambda[i])+ max (0 ,s- sum (X[- i])) }
sim <- rbind (sim,X) }
plot (sim,xlim= c (1 ,11 ),ylim= c (0 ,4.3 ))
polygon (c (- 1 ,- 1 ,6 ),c (- 1 ,6 ,- 1 ),col= "red" ,density= 15 ,border= NA )
abline (5 ,- 1 ,col= "red" )
Konstruksi urutan (algoritma MCMC bersifat iteratif) dapat divisualisasikan di bawah ini
lambda <- c (1 ,2 )
X <- c (3 ,3 )
sim <- X
s <- 5
for (k in 1 : 100 ){
set.seed (k)
i <- sample (1 : 2 ,1 )
X[i] <- rexp (1 ,lambda[i])+ max (0 ,s- sum (X[- i]))
while (sum (X)< s){
X[i] <- rexp (1 ,lambda[i])+ max (0 ,s- sum (X[- i])) }
sim <- rbind (sim,X) }
pic_ani = function (n){
plot (sim[1 : n,],xlim= c (1 ,11 ),ylim= c (0 ,5 ),xlab= "" ,ylab= "" )
i= which (apply (sim[(n-1 ): n,],2 ,diff)== 0 )
if (i== 1 ) abline (v= sim[n,1 ],col= "grey" )
if (i== 2 ) abline (h= sim[n,2 ],col= "grey" )
if (n>= 1 ) points (sim[n,1 ],sim[n,2 ],pch= 19 ,col= "blue" ,cex= 1.4 )
if (n>= 2 ) points (sim[n-1 ,1 ],sim[n-1 ,2 ],pch= 19 ,col= "red" ,cex= 1.4 )
polygon (c (- 1 ,- 1 ,6 ),c (- 1 ,6 ,- 1 ),col= "red" ,density= 15 ,border= NA )
abline (5 ,- 1 ,col= "red" )
}
for (i in 2 : 100 ) {pic_ani (i)}
