Nama : Fairuz Ardhan Haunan

NIM : 220605110038

Kelas : Linear Algebra A

Dosen Pengampu : Prof. Dr. Suhartono, M.Kom.

Jurusan : Teknik Informatika

Universitas : UIN Maulana Malik Ibrahim Malang

Mencari Peluang dari Urutan DNA

Terdapat sebuah peluang transisi dari urutan DNA yang ditunjukkan dalam sebuah matrix :

Terdapat juga sebuah urutan yang diamati yakni : ACTGTTC.

Kita uraikan matrix tersebut sehingga mereka memiliki empat elemen, yakni A, C, G, dan T. Kita akan mengkomputasikan peluang dari mengobservasikan urutan ini setelah adanya evolusi yang sangat lama. Untuk memudahkan persoalan ini kita menggunakan waktu diskrit rantai Markov daripada menggunakan waktu kontinu. Kita juga dapat mengasumsikan bahwasannya setiap posisi dari kata tersebut adalah independent, sehingga kita dapat mengkomputasikan peluang empat variable, yakni A, C, G, atau T. Untuk dapat mengkomputasikannya kita dapat menggunakan distribusi yang terbatas. Distribusi terbatas tersebut dapat dikomputasikan dengan

phi merupakan distribusi dari A, C, G, dan T.

Untuk dapat mengkomputasikan limit ini, langkah pertama yang dapat kita lakukan adalah untuk mendiagonalisasikan P. Dalam bahasa pemograman R kita menggunakan fungsi eigen() untuk mendiagonalisasikan transisi matrix P. Kita definisikan terlebih dahulu matrix tersebut :

A <- matrix(c(1/4, 1/5, 1/3, 1/6, 1/4, 1/5, 1/3,
1/3, 1/4, 2/5, 1/6, 1/3, 1/4, 1/5, 1/6, 1/6), 4, 4)

Fungsi solve() digunakan untuk mengkomputasikan inverse dari matrix p.

p <- eigen(A)$vectors
D <- diag(eigen(A)$values)
p %*% D %*% solve(p)
##              [,1]         [,2]         [,3]         [,4]
## [1,] 0.2500000+0i 0.2500000+0i 0.2500000+0i 0.2500000+0i
## [2,] 0.2000000-0i 0.2000000+0i 0.4000000+0i 0.2000000+0i
## [3,] 0.3333333+0i 0.3333333-0i 0.1666667-0i 0.1666667+0i
## [4,] 0.1666667+0i 0.3333333+0i 0.3333333+0i 0.1666667+0i

simbol “i” menunjukkan adanya angka yang komplex. Langkah selanjutnya adalah mendefinisikan phi sebagai atribut distribusi.

kita kodekan matrix tersebut dengan :

ini <- c(1/4, 1/4, 1/4, 1/4)

kemudian kita ambil n sebagai angka yang luas

ini %*% p %*% D^(10000) %*% solve(p)
##              [,1]        [,2]         [,3]         [,4]
## [1,] 0.2435175+0i 0.276212+0i 0.2841037+0i 0.1961669+0i

Kemudian kita dapatkan probabilitas dari mengobservasikan A, C, G, atau T dengan