Preparation

Background

Plastik merupakan masalah pada abad ini. Plastik merupakan material yang tidak bisa diuraikan secara cepat sehingga plastik menjadi limbah yang tidak bisa diuraikan dan mencemarkan lingkungan. Para peneliti menemukan bakteri yang bisa digunakan sebagai bahan dasar pengganti plastik yaitu bakteri Komagataeibacter xylinus. sayangnya bakteri Komagataeibacter xylinus sangatlah mahal sehingga perlu dicari bakteri yang mirip dengan bakteri tersebut untuk menekan biaya produksi.

Exploratory Data Analysis

Data yang digunakan adalah data b_cellulose.txt yang berisi data bakteri cellulose. Data ini terdiri dari 14 observasi dimana 4 diantaranya masih tidak ketahui nama bakterinya (sample).

dari data diatas bisa dilihat bahwa terdapat 3 kolom yaitu:
name sebagai nama bakteri
length sebagai panjang DNA
x sebagai DNA

Multiple Alignment

terdapat 2 jenis Alignment yaitu partial alignment (membandingkan dna acuan dengan dna sample secara 1 per 1) dan multiple alignment (membandingkan beberapa dna secara langsung dengan dna acuan). Tujuan dilakukan multiple aligment adalah mensejajarkan setiap sequence dna terhadap dna yang dijadikan acuan (Komagataeibacter xylinus).

## use default substitution matrix
## CLUSTAL 2.1  
## 
## Call:
##    msa(cel_dna)
## 
## MsaDNAMultipleAlignment with 14 rows and 1497 columns
##      aln                                              names
##  [1] ---------AGAGTTTGATCCTG...CGGCTGGATCACCTCCTT---- Komagataeibacter ...
##  [2] -----------------------...C--------------------- Komagataeibacter ...
##  [3] ----------GAGTTTGATCMTG...CGGCTGGATCACCTCCTTT--- Komagataeibacter ...
##  [4] ---------TGAGTTTGATCCTG...---------------------- Komagataeibacter ...
##  [5] ATGAACCTGAGAGTTTGATCCTG...CGGCTGGATCACCTCCTTT--- Komagataeibacter ...
##  [6] ---------TGAGTTTGATCCTG...---------------------- Sample3
##  [7] --------TTGAGTTTGATCCTG...---------------------- Komagataeibacter ...
##  [8] ---------TGAGTTTGATCCTG...----------------------  Sample2
##  [9] ----------GAGTTTGATCATG...CGGCTGGATCACCTCCTTT--- Komagataeibacter ...
## [10] ----------GAGTTTCATCCTG...CGGCTGGATCACCTCCTTT--- Komagataeibacter ...
## [11] -----------------------...CGGC------------------ Komagataeibacter ...
## [12] -----------------ATCCTG...CGGCTGGA-------------- Sample
## [13] ----------GAGTTTGATNNTG...CGGCTGGATCACCTCCTTTCAA Gluconacetobacter...
## [14] ----------GAGTTTGATTATG...CGGCTGGATCACCTCCTTT--- Sample4
##  Con ----------GAGTTTGATCCTG...CGGCTGGA??????????---- Consensus

bila dilihat sekarang setiap DNA sudah sejajar, sejajar disini diartikan setiap kolom diisi oleh basa nitrogen yang sama (A,T,G,C). data diatas bisa ditampilkan dalam visualisasi sebagai berikut.

Clustering

untuk mencari kemiripan dari setiap dna perlu dilakukan perhitungan jarak setiap dna terhadap dna yang lain untuk mengetahui kemiripan DNA tersebut.

bila dilihat dari hasil visualisasi dibawah sample4 merupakan bakteri yang paling jauh dengan Komagataeibacter xylinus.

Dari plot diatas kita tidak bisa mengetahui setiap bakteri mirip dengan bakteri apa, oleh sebab itu perlu dibuat visualisasi dalam bentuk phylogenetic tree

Conclution

Dari pylogenetic tree diatas bisa diketahui bahwa sample, sample3, dan sample memiliki kedekatan dengan Komagataeibacter xylinus dikarenakan masih dalam 1 sub-tree. Dari hasil penelitian ini bisa dikatakan bahwa bakteri tersebut berpotensi untuk menggantikan bakteri Komagataeibacter xylinus. namu perlu dilakukan pengujian lab terlebih dahulu untuk memastikan ketepatan perhitungan ini.