BIoconductor |Bioinformatics Basics

# This R environment comes with many helpful analytics packages installed
# It is defined by the kaggle/rstats Docker image: https://github.com/kaggle/docker-rstats
# For example, here's a helpful package to load

library(tidyverse) # metapackage of all tidyverse packages

# Input data files are available in the read-only "../input/" directory
# For example, running this (by clicking run or pressing Shift+Enter) will list all files under the input directory

list.files(path = "C:/Users/samen/Desktop/Bioinformatics Projects/Bioconductor tools for Mass Spectrometry/Bioconductor")

 [1] "alignments"                      "bioconductor-introduction.ipynb"
 [3] "Bioconductor.Rproj"              "blast_queries"                  
 [5] "machine_learning"                "output"                         
 [7] "renv"                            "renv.lock"                      
 [9] "SCE"                             "sequences"                      
[11] "substitution_matrices"

# You can write up to 20GB to the current directory (/kaggle/working/) that gets preserved as output when you create a version using "Save & Run All" 
# You can also write temporary files to /kaggle/temp/, but they won't be saved outside of the current session

suppressWarnings(expr)

function (expr) 
{
    enexpr(expr)
}
<bytecode: 0x0000024846035978>
<environment: namespace:rlang>

Try executing this chunk by clicking the Run button within the chunk or by placing your cursor inside it and pressing Ctrl+Shift+Enter.

#packages installation
if (!requireNamespace("BiocManager", quietly= TRUE))
    install.packages("BioManager")
BiocManager:: install("Biostrings")

'getOption("repos")' replaces Bioconductor standard repositories, see
'?repositories' for details

replacement repositories:
    CRAN: https://cran.rstudio.com

Bioconductor version 3.14 (BiocManager 1.30.17), R 4.1.2 (2021-11-01)
Warning: package(s) not installed when version(s) same as current; use `force =
  TRUE` to re-install: 'Biostrings'
Installation paths not writeable, unable to update packages
  path: C:/Program Files/R/R-4.1.2/library
  packages:
    class, cluster, foreign, MASS, Matrix, mgcv, nlme, nnet, rpart,
    spatial, survival
Old packages: 'cli', 'dplyr', 'MSnbase', 'RSQLite'

Update all/some/none? [a/s/n]:

n
BiocManager:: install("msa")

'getOption("repos")' replaces Bioconductor standard repositories, see
'?repositories' for details

replacement repositories:
    CRAN: https://cran.rstudio.com

Bioconductor version 3.14 (BiocManager 1.30.17), R 4.1.2 (2021-11-01)
Warning: package(s) not installed when version(s) same as current; use `force =
  TRUE` to re-install: 'msa'
Installation paths not writeable, unable to update packages
  path: C:/Program Files/R/R-4.1.2/library
  packages:
    class, cluster, foreign, MASS, Matrix, mgcv, nlme, nnet, rpart,
    spatial, survival
Old packages: 'cli', 'dplyr', 'MSnbase', 'RSQLite'

Update all/some/none? [a/s/n]:

BIOCONDUCTOR¶ Bioconductor is quite more advanced compared to say Biopython & requires minimal programming on the user end. I have covered some basic sequence operations in a biopython notebook or Working with Sequences noteobook on a relatable topic. The libraries used in this notebook:

Biostrings ( General base library for work with strings, uses FASTA for imports ) (II) msa ( Library for multiple sequence alignment, containing more advanced methods than the progressive approach covered in biological sequence alignment )

#Bioconductor:: Biostrings
#import library without messages

suppressPackageStartupMessages(library(Biostrings))

#Sequence Operations

#1 Defining characters of DNA and amino acids
chr_n1 = "ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAAC"
chr_n2 = "TTTCGGGTAAGTAAATATATGTTTCACTACTTCCTTTCGG"

chr_aa1 = 'PAWHEAE'
chr_aa2 = 'HEAGAWGHEE'


# Nucleotide String
s1_n <- DNAString(chr_n1) #DNAString
s2_n <- DNAString(chr_n2)
s2_n

40-letter DNAString object
seq: TTTCGGGTAAGTAAATATATGTTTCACTACTTCCTTTCGG

#Amino Acid String
s1_aa = AAString(chr_aa1)
s2_aa = AAString(chr_aa2)
s2_aa

10-letter AAString object
seq: HEAGAWGHEE

#Define a new XstringSet from characters (3 sequences)

#concat to make vector with c()
str_concat = c("ACGT","GTCA","GCTA")
n_set <- AAStringSet(str_concat)
n_set

AAStringSet object of length 3:
    width seq
[1]     4 ACGT
[2]     4 GTCA
[3]     4 GCTA

#Define a new XStringSet from characters (1 sequence)

n_set_1 <- DNAStringSet(c("ACGT"))
n_set_1

DNAStringSet object of length 1:
    width seq
[1]     4 ACGT

#Create a stringset from a sequence string
#Using DNAString -> DNAStringSet

str_strset = DNAStringSet(s1_n)

# Start with set (just the one)
string = n_set[1]
string

AAStringSet object of length 1:
    width seq
[1]     4 ACGT

#Convert XStringSet to Character
dna_char <- toString(n_set[1])
class(dna_char) #check the class type

[1] "character"

dna_char #print character

[1] "ACGT"

#start with many strings in a stringset
print(n_set)

AAStringSet object of length 3:
    width seq
[1]     4 ACGT
[2]     4 GTCA
[3]     4 GCTA

lst <- list() #defines an empty list

#loop through allin n_set
for(i in 1:length(n_set)) {
    lst <- c(lst, toString(n_set[i]))
}

lst  #list containing characters

[[1]]
[1] "ACGT"

[[2]]
[1] "GTCA"

[[3]]
[1] "GCTA"

# Set - > Single sequence
string = n_set[[1]] # extract single sequence 
string # print string

4-letter AAString object
seq: ACGT

# use toString
char = toString(string)
char  # print character

[1] "ACGT"

class(char) # print char type

[1] "character"

’‘’READING SEQUENCES FROM FASTA FILE¶ Usually when working with realistic sequences formats such as FASTA & GenBank are used Biostrings uses the FASTA format for operations, loading & saving. The two class formats used upon the sequence(s) being read: DNAStringSet for nucleotide sequence set (even just the one) AAStringSet for amino acid sequences’’’

# File Containing One Sequence
fasta_n = readDNAStringSet('C:/Users/samen/Desktop/Bioinformatics Projects/Bioconductor tools for Mass Spectrometry/Bioconductor/sequences/example.fasta')
fasta_n # print read data

DNAStringSet object of length 1:
    width seq                                       names               
[1]  1231 GGCAGATTCCCCCTAGACC...CCCAAATAAACTCCAGAAG HSBGPG Human gene...

class(fasta_n) # print read class format

[1] "DNAStringSet"
attr(,"package")
[1] "Biostrings"

names(fasta_n) # print name of sequence

[1] "HSBGPG Human gene for bone gla protein (BGP)"

# can use (Biostrings::) prefix as well
fasta_aa = Biostrings::readAAStringSet('C:/Users/samen/Desktop/Bioinformatics Projects/Bioconductor tools for Mass Spectrometry/Bioconductor/sequences/NC_005816.faa')
fasta_aa

AAStringSet object of length 10:
     width seq                                      names               
 [1]   340 MVTFETVMEIKILHKQGMS...HPLHHPLSIYDSFCRGVA gi|45478712|ref|N...
 [2]   260 MMMELQHQRLMALAGQLQL...YRLRQKRKAGVIAEANPE gi|45478713|ref|N...
 [3]    64 MNKQQQTALNMARFIRSQS...ELQNSIQARFEAESETGT gi|45478714|ref|N...
 [4]   123 MSKKRRPQKRPRRRRFFHR...FSPTTAPYPVTIVLSPTR gi|45478715|ref|N...
 [5]   145 MGGGMISKLFCLALIFLSS...IVVKEIKKSIPGCTVYYH gi|45478716|ref|N...
 [6]   357 MSDTMVVNGSGGVPAFLFS...RKREGALVQKDIDSGLLK gi|45478717|ref|N...
 [7]   138 MKFHFCDLNHSYKNQEGKI...KKPEGVEPREGQEREDLP gi|45478718|ref|N...
 [8]   312 MKKSSIVATIITILSGSAN...AGISNKNYTVTAGLQYRF gi|45478719|ref|N...
 [9]    99 MRTLDEVIASRSPESQTRI...KLSLDVELPTGRRVAFHV gi|45478720|ref|N...
[10]    90 MADLKKLQVYGPELPRPYA...VRIAEDEFTAHLNTLESK gi|45478721|ref|N...

class(fasta_aa) # AAStringSet object

[1] "AAStringSet"
attr(,"package")
[1] "Biostrings"

#always start with 1, not a 0 like python
fasta_aa[1] #Still AA stringset object but length of 1

AAStringSet object of length 1:
    width seq                                       names               
[1]   340 MVTFETVMEIKILHKQGMS...KHPLHHPLSIYDSFCRGVA gi|45478712|ref|N...

#Other operations of fast.aa files
width(fasta_aa[1]) #get length of sequence

[1] 340

seq(fasta_aa[1]) #sequence number

[1] 1

names (fasta_aa[1]) #get the character object type of the sequence

[1] "gi|45478712|ref|NP_995567.1| putative transposase [Yersinia pestis biovar Microtus str. 91001]"

class(char) #show object class

[1] "character"

’‘’SAVING SEQUENCES TO FASTA FORMAT writeXStringSet is used to save a StringSet, which has the option to save in FASTA format’’’

n_set #an aastringset we wish to save

AAStringSet object of length 3:
    width seq
[1]     4 ACGT
[2]     4 GTCA
[3]     4 GCTA

#Save XStringSet
writeXStringSet(n_set, filepath = 'C:/Users/samen/Desktop/Bioinformatics Projects/Bioconductor tools for Mass Spectrometry/Bioconductor/output/dna_list.fasta', format = 'fasta' )

#confirmation only (read the file)
confirm_dna_xstrset = readDNAStringSet ('C:/Users/samen/Desktop/Bioinformatics Projects/Bioconductor tools for Mass Spectrometry/Bioconductor/output/dna_list.fasta')

confirm_dna_xstrset

DNAStringSet object of length 3:
    width seq                                       names               
[1]     4 ACGT                                      
[2]     4 GTCA                                      
[3]     4 GCTA

# combine characters 
x0 <- DNAStringSet(c("CTCCCAGTAT", "TTCCCGA", "TACCTAGAG"))  # String Set #1
x1 <- DNAStringSet(c("AGGTCGT", "GTCAGTGGTCCCC", "CATTTTAGG")) # String Set #2
x2 <- DNAStringSet(c("TGCTAGCTA", "AGTCTTGC", "AGCTTTCGAG")) # String Set #3

dna_list <- list(x0, x1, x2) # create a list of String Sets
dna_xstrset = do.call(c, dna_list) # concentrate 
dna_xstrset

DNAStringSet object of length 9:
    width seq
[1]    10 CTCCCAGTAT
[2]     7 TTCCCGA
[3]     9 TACCTAGAG
[4]     7 AGGTCGT
[5]    13 GTCAGTGGTCCCC
[6]     9 CATTTTAGG
[7]     9 TGCTAGCTA
[8]     8 AGTCTTGC
[9]    10 AGCTTTCGAG

#Select only specific sequences from Set
dna_xstrset[1:2] #indexing a Set -> selecting sequences

DNAStringSet object of length 2:
    width seq
[1]    10 CTCCCAGTAT
[2]     7 TTCCCGA

new_set <- dna_xstrset[9] #set to new variable

# Selecting Sequence Subset w/ range
subseq_aa = subseq(s2_aa, start=1,end=5)
subseq_aa

5-letter AAString object
seq: HEAGA

’’’1.4 | BASIC FUNCTIONALITY

Some basic functions appliable to StringSet, some of which have not been used yet, mainly to do with ordering or visualisation inside the set ’’’




<!-- rnb-text-end -->


<!-- rnb-chunk-begin -->


<!-- rnb-source-begin eyJkYXRhIjoiYGBgclxuI29wZXJhdGlvbnMgdXNpbmcgRE5BU3RyaW5nIGFuZCBBQVN0cmluZyBPYmplY3RzXG5zMV9yZXZlcnNlIDwtIHJldmVyc2UoczFfbilcbnMxX2NvbXBsZW1lbnQgPC0gY29tcGxlbWVudChzMV9uKVxuczFfcmV2ZXJzZWNvbXBsZW1lbnQgPSByZXZlcnNlQ29tcGxlbWVudChzMV9uKVxuXG5jKHMxX3JldmVyc2UpXG5gYGAifQ== -->

```r
#operations using DNAString and AAString Objects
s1_reverse <- reverse(s1_n)
s1_complement <- complement(s1_n)
s1_reversecomplement = reverseComplement(s1_n)

c(s1_reverse)

40-letter DNAString object
seq: CAAAGGAAACTAGTTGAATGGCGGTCCCTCGACCACTTCA

c(s1_complement)

40-letter DNAString object
seq: TGAAGTGGTCGAGGGACCGCCATTCAACTAGTTTCCTTTG

c(s1_reversecomplement)

40-letter DNAString object
seq: GTTTCCTTTGATCAACTTACCGCCAGGGAGCTGGTGAAGT

#Same goes for DNAStringSet class sequences
class(fasta_n) #check class

[1] "DNAStringSet"
attr(,"package")
[1] "Biostrings"

s1_reverse_xstr = reverse(fasta_n)
s1_reverse_xstr

DNAStringSet object of length 1:
    width seq                                       names               
[1]  1231 GAAGACCTCAAATAAACCC...CCAGATCCCCCTTAGACGG HSBGPG Human gene...

# Translation works w/ Sets or just the XString
s1_translate <- translate(dna_xstrset[[3]], no.init.codon=TRUE)
s1_translate

3-letter AAString object
seq: YLE

alphabetFrequency(DNAString(s1_complement))

 A  C  G  T  M  R  W  S  Y  K  V  H  D  B  N  -  +  . 
 8  9 11 12  0  0  0  0  0  0  0  0  0  0  0  0  0  0

#calculate the alphabet frequency of a DNA sequence

uniqueLetters(dna_xstrset[1])

[1] "A" "C" "G" "T"

#show all unique characters in a sequence

’’’ 1.5 | BIOLOGICAL FUNCTIONS

Biological functality relating to DNA is found in Biostrings as well Having one of the strands, we can get its reverse, complement & reverse complement, similar to that was shown in notebook Biological Sequence Operations Translation from DNA (or RNA) to chains of amino acids / proteins can be done via translate Translation works with both strings & string set objects ’’’




<!-- rnb-text-end -->


<!-- rnb-chunk-begin -->


<!-- rnb-source-begin eyJkYXRhIjoiYGBgclxuIyBDaGFyYWN0ZXIgZnJlcXVlbmN5IGZ1bmN0aW9uc1xuc2VxdWVuY2UgPC0gZG5hX3hzdHJzZXRbMV1cbnNlcXVlbmNlXG5gYGAifQ== -->

```r
# Character frequency functions
sequence <- dna_xstrset[1]
sequence

DNAStringSet object of length 1:
    width seq
[1]    10 CTCCCAGTAT

dinucleotideFrequency(sequence)

     AA AC AG AT CA CC CG CT GA GC GG GT TA TC TG TT
[1,]  0  0  1  1  1  2  0  1  0  0  0  1  1  1  0  0

trinucleotideFrequency(sequence)

     AAA AAC AAG AAT ACA ACC ACG ACT AGA AGC AGG AGT ATA ATC ATG ATT
[1,]   0   0   0   0   0   0   0   0   0   0   0   1   0   0   0   0
     CAA CAC CAG CAT CCA CCC CCG CCT CGA CGC CGG CGT CTA CTC CTG CTT
[1,]   0   0   1   0   1   1   0   0   0   0   0   0   0   1   0   0
     GAA GAC GAG GAT GCA GCC GCG GCT GGA GGC GGG GGT GTA GTC GTG GTT
[1,]   0   0   0   0   0   0   0   0   0   0   0   0   1   0   0   0
     TAA TAC TAG TAT TCA TCC TCG TCT TGA TGC TGG TGT TTA TTC TTG TTT
[1,]   0   0   0   1   0   1   0   0   0   0   0   0   0   0   0   0

oligonucleotideFrequency(sequence,width=2)

     AA AC AG AT CA CC CG CT GA GC GG GT TA TC TG TT
[1,]  0  0  1  1  1  2  0  1  0  0  0  1  1  1  0  0

oligonucleotideFrequency(sequence,width=4)

     AAAA AAAC AAAG AAAT AACA AACC AACG AACT AAGA AAGC AAGG AAGT AATA
[1,]    0    0    0    0    0    0    0    0    0    0    0    0    0
     AATC AATG AATT ACAA ACAC ACAG ACAT ACCA ACCC ACCG ACCT ACGA ACGC
[1,]    0    0    0    0    0    0    0    0    0    0    0    0    0
     ACGG ACGT ACTA ACTC ACTG ACTT AGAA AGAC AGAG AGAT AGCA AGCC AGCG
[1,]    0    0    0    0    0    0    0    0    0    0    0    0    0
     AGCT AGGA AGGC AGGG AGGT AGTA AGTC AGTG AGTT ATAA ATAC ATAG ATAT
[1,]    0    0    0    0    0    1    0    0    0    0    0    0    0
     ATCA ATCC ATCG ATCT ATGA ATGC ATGG ATGT ATTA ATTC ATTG ATTT CAAA
[1,]    0    0    0    0    0    0    0    0    0    0    0    0    0
     CAAC CAAG CAAT CACA CACC CACG CACT CAGA CAGC CAGG CAGT CATA CATC
[1,]    0    0    0    0    0    0    0    0    0    0    1    0    0
     CATG CATT CCAA CCAC CCAG CCAT CCCA CCCC CCCG CCCT CCGA CCGC CCGG
[1,]    0    0    0    0    1    0    1    0    0    0    0    0    0
     CCGT CCTA CCTC CCTG CCTT CGAA CGAC CGAG CGAT CGCA CGCC CGCG CGCT
[1,]    0    0    0    0    0    0    0    0    0    0    0    0    0
     CGGA CGGC CGGG CGGT CGTA CGTC CGTG CGTT CTAA CTAC CTAG CTAT CTCA
[1,]    0    0    0    0    0    0    0    0    0    0    0    0    0
     CTCC CTCG CTCT CTGA CTGC CTGG CTGT CTTA CTTC CTTG CTTT GAAA GAAC
[1,]    1    0    0    0    0    0    0    0    0    0    0    0    0
     GAAG GAAT GACA GACC GACG GACT GAGA GAGC GAGG GAGT GATA GATC GATG
[1,]    0    0    0    0    0    0    0    0    0    0    0    0    0
     GATT GCAA GCAC GCAG GCAT GCCA GCCC GCCG GCCT GCGA GCGC GCGG GCGT
[1,]    0    0    0    0    0    0    0    0    0    0    0    0    0
     GCTA GCTC GCTG GCTT GGAA GGAC GGAG GGAT GGCA GGCC GGCG GGCT GGGA
[1,]    0    0    0    0    0    0    0    0    0    0    0    0    0
     GGGC GGGG GGGT GGTA GGTC GGTG GGTT GTAA GTAC GTAG GTAT GTCA GTCC
[1,]    0    0    0    0    0    0    0    0    0    0    1    0    0
     GTCG GTCT GTGA GTGC GTGG GTGT GTTA GTTC GTTG GTTT TAAA TAAC TAAG
[1,]    0    0    0    0    0    0    0    0    0    0    0    0    0
     TAAT TACA TACC TACG TACT TAGA TAGC TAGG TAGT TATA TATC TATG TATT
[1,]    0    0    0    0    0    0    0    0    0    0    0    0    0
     TCAA TCAC TCAG TCAT TCCA TCCC TCCG TCCT TCGA TCGC TCGG TCGT TCTA
[1,]    0    0    0    0    0    1    0    0    0    0    0    0    0
     TCTC TCTG TCTT TGAA TGAC TGAG TGAT TGCA TGCC TGCG TGCT TGGA TGGC
[1,]    0    0    0    0    0    0    0    0    0    0    0    0    0
     TGGG TGGT TGTA TGTC TGTG TGTT TTAA TTAC TTAG TTAT TTCA TTCC TTCG
[1,]    0    0    0    0    0    0    0    0    0    0    0    0    0
     TTCT TTGA TTGC TTGG TTGT TTTA TTTC TTTG TTTT
[1,]    0    0    0    0    0    0    0    0    0

#Similar to Pandas, if the list is too long,the default view will ...
#'options' can be used to change the maximum column count

options(repr.matrix.max.cols = 70,
        repr.matrix.max.rows = 100)

’’’1.6 | COUNTING CHARACTERS

Sequence alphabet counts are quite relevant in bioinformatics, eg. GC Content is the dinucleotide count Other sequence alphabet counters:

alphabetFrequency - For a general alphabet count of the sequence/set dinucleotideFrequency - For two character pair counts trinucleotideFrequency - For three character pair counts (codons) oligonucleotideFrequency - General form of the three above & beyond, description below: Oligonucleotides | ScienceDirect

Oligonucleotides are small molecules 8–50 nucleotides in length that bind via Watson-Crick base pairing to enhance or repress the expression of target RNA ’’’’


trinucleotideFrequency(dna_xstrset[1])

     AAA AAC AAG AAT ACA ACC ACG ACT AGA AGC AGG AGT ATA ATC ATG ATT
[1,]   0   0   0   0   0   0   0   0   0   0   0   1   0   0   0   0
     CAA CAC CAG CAT CCA CCC CCG CCT CGA CGC CGG CGT CTA CTC CTG CTT
[1,]   0   0   1   0   1   1   0   0   0   0   0   0   0   1   0   0
     GAA GAC GAG GAT GCA GCC GCG GCT GGA GGC GGG GGT GTA GTC GTG GTT
[1,]   0   0   0   0   0   0   0   0   0   0   0   0   1   0   0   0
     TAA TAC TAG TAT TCA TCC TCG TCT TGA TGC TGG TGT TTA TTC TTG TTT
[1,]   0   0   0   1   0   1   0   0   0   0   0   0   0   0   0   0

#calculating consensus matrix for a string set
dna_xstrset

DNAStringSet object of length 9:
    width seq
[1]    10 CTCCCAGTAT
[2]     7 TTCCCGA
[3]     9 TACCTAGAG
[4]     7 AGGTCGT
[5]    13 GTCAGTGGTCCCC
[6]     9 CATTTTAGG
[7]     9 TGCTAGCTA
[8]     8 AGTCTTGC
[9]    10 AGCTTTCGAG

consensusMatrix(dna_xstrset, as.prob = FALSE)

  [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13]
A    3    2    0    1    1    2    2    1    3     0     0     0     0
C    2    0    6    4    3    0    2    1    0     1     1     1     1
G    1    4    1    0    1    3    4    3    2     1     0     0     0
T    3    3    2    4    4    4    1    2    1     1     0     0     0
M    0    0    0    0    0    0    0    0    0     0     0     0     0
R    0    0    0    0    0    0    0    0    0     0     0     0     0
W    0    0    0    0    0    0    0    0    0     0     0     0     0
S    0    0    0    0    0    0    0    0    0     0     0     0     0
Y    0    0    0    0    0    0    0    0    0     0     0     0     0
K    0    0    0    0    0    0    0    0    0     0     0     0     0
V    0    0    0    0    0    0    0    0    0     0     0     0     0
H    0    0    0    0    0    0    0    0    0     0     0     0     0
D    0    0    0    0    0    0    0    0    0     0     0     0     0
B    0    0    0    0    0    0    0    0    0     0     0     0     0
N    0    0    0    0    0    0    0    0    0     0     0     0     0
-    0    0    0    0    0    0    0    0    0     0     0     0     0
+    0    0    0    0    0    0    0    0    0     0     0     0     0
.    0    0    0    0    0    0    0    0    0     0     0     0     0

#Two sequences to be globally aligned

s1_n

40-letter DNAString object
seq: ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAAC

s2_n

40-letter DNAString object
seq: TTTCGGGTAAGTAAATATATGTTTCACTACTTCCTTTCGG

# Nucleotide Global Alignment

#Define our own substition matrix (nucleotide)

mat <- nucleotideSubstitutionMatrix(match = 1, mismatch = -3, 
                                    baseOnly = TRUE)

mat

   A  C  G  T
A  1 -3 -3 -3
C -3  1 -3 -3
G -3 -3  1 -3
T -3 -3 -3  1

class(mat)

[1] "matrix" "array"

#Global Alignment (Needleman Wunsch)
globalAlign <- pairwiseAlignment(s1_n, s2_n, #sequences we want to align
                                 type = 'global', #type of alignment
                                 substitutionMatrix = mat, #substitution matrix
                                gapOpening = 5, gapExtension =2 
                                #gap penalty arguments
                                )

globalAlign

Global PairwiseAlignmentsSingleSubject (1 of 1)
pattern: ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAAC------
subject: TTT----CGGGTAAGTAAATATATGTT--TCACTACTTCCTTTCGG
score: -85

#NUCLEOTIDE LOCAL SEQUENCE ALIGNMENT
#Smith-Waterman local sequence alignment between two nucleotide sequences s1_n & s2_n 

#Nucleotide Local Sequence Alignment (Smith-Waterman)

localAlign <- pairwiseAlignment(s1_n, s2_n, type = "local",
                                substitutionMatrix = mat,
                                gapOpening= 5, gapExtension = 2)

localAlign

Local PairwiseAlignmentsSingleSubject (1 of 1)
pattern: [20] GGTAAGT
subject:  [6] GGTAAGT
score: 7

#Protein Global Alignment
#Needleman-Wunsch global sequence alignment between two amino acid chain sequences
#s1_aa and s2_aa
#global alignment(default type) using BLOSUM Substitution mAtrix

#45, 50,62, 80,100

pairwiseAlignment(s1_aa, s2_aa, substitutionMatrix = "BLOSUM62",
                  gapOpening = 0, gapExtension = 8)

Global PairwiseAlignmentsSingleSubject (1 of 1)
pattern: -PA--WHEAE
subject: HEAGAWGHEE
score: -8

’’’2 | PAIRWISE SEQUENCE ALIGNMENT¶ Given the significance of PSA in various application of bioinformatics, we will look at quite a few things that are associated with this part of the library.

The gap penalties are regulated by the gapOpening and gapExtension arguments First we need to define aspects of our objective function; substitution matrix & gap penalties Gap penalties are specified in pairwiseAlignment, whilst the substitution matrix is created or called separately nucleotideSubstitutionMatrix - Create a substitution matrix w/ a match & mismatches in a nucleotide sequence or use strings to call preset aa matrices pairwiseAlignment - sequence alignment, by default global option is set Similar to python, long strings will contain …: To display the whole sequence we can use alignedPattern & alignedSubject together with c() ’’’


'''2.1 | ALIGNMENT EXAMPLES

NUCLEOTIDE GLOBAL SEQUENCE ALIGNMENT
Nucleotide global sequence alignment using the Needleman Wunsch algorithm
We can set a self defined substitution matrix (constant match/mismatch) using nucleotideSubstitutionMatrix
pairwiseAlignment requires arguments type= ''global'', substitutionMatrix (mat) & gap model settings (gapOpening,gapExtension) '''

#global alignment (default type) using PAM substituion Matrix

#30,40,70,120,250
pairwiseAlignment(s1_aa, s2_aa,
                  substitutionMatrix = 'PAM250',
                  gapOpening = 0, gapExtension = 1)

Global PairwiseAlignmentsSingleSubject (1 of 1)
pattern: --P-AW-HEAE
subject: HEAGAWGHE-E
score: 29

#Extracting Data from Alignments
#getting individual sequence in the alignment, alignedPattern and alignedSubject in StringSet object format

#sequence extraction 
s1_nset = DNAStringSet(chr_n1)
s2_nset = DNAStringSet(chr_n2)

#Pairwise Sequence Alignment operation
alg <- pairwiseAlignment(s1_nset, s2_nset)

#recalling the sequences in a pairwise alignment
alignedPattern(alg)

DNAStringSet object of length 1:
    width seq
[1]    46 ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAAC------

toString(alignedSubject(alg)) #convert string

[1] "TTT----CGGGTAAGTAAATATATGTT--TCACTACTTCCTTTCGG"

#summary of alignment
summary(alg)

Global Single Subject Pairwise Alignments
Number of Alignments:  1

Scores:
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
 -168.2  -168.2  -168.2  -168.2  -168.2  -168.2 

Number of matches:
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
     14      14      14      14      14      14 

Top 10 Mismatch Counts:

globalAlign

Global PairwiseAlignmentsSingleSubject (1 of 1)
pattern: ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAAC------
subject: TTT----CGGGTAAGTAAATATATGTT--TCACTACTTCCTTTCGG
score: -85

# Other alignment related functions

alphabet(globalAlign) # show characters of alignment sequences

 [1] "A" "C" "G" "T" "M" "R" "W" "S" "Y" "K" "V" "H" "D" "B" "N" "-" "+"
[18] "."

compareStrings(globalAlign) # compare strings of sequences

[1] "??T++++C?G?T???T?????TA?GTT++TCA???????C"

deletion(globalAlign)

IRangesList object of length 1:
[[1]]
IRanges object with 0 ranges and 0 metadata columns:
       start       end     width
   <integer> <integer> <integer>

mismatchTable(globalAlign)

nchar(globalAlign)

[1] 40

nedit(globalAlign)

[1] 26

indel(globalAlign)

An object of class "InDel"
Slot "insertion":
IRangesList object of length 1:
[[1]]
IRanges object with 2 ranges and 0 metadata columns:
          start       end     width
      <integer> <integer> <integer>
  [1]         4         7         4
  [2]        24        25         2


Slot "deletion":
IRangesList object of length 1:
[[1]]
IRanges object with 0 ranges and 0 metadata columns:
       start       end     width
   <integer> <integer> <integer>

insertion(globalAlign)

IRangesList object of length 1:
[[1]]
IRanges object with 2 ranges and 0 metadata columns:
          start       end     width
      <integer> <integer> <integer>
  [1]         4         7         4
  [2]        24        25         2

nindel(globalAlign)

An object of class "InDel"
Slot "insertion":
     Length WidthSum
[1,]      2        6

Slot "deletion":
     Length WidthSum
[1,]      0        0

nmatch(globalAlign)

[1] 14

nmismatch(globalAlign)

[1] 20

pattern(globalAlign) # show only pattern sequence

[1] ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAAC

subject(globalAlign) # show only subject sequence

[1] TTT----CGGGTAAGTAAATATATGTT--TCACTACTTCC

pid(globalAlign)

[1] 35

rep(globalAlign)

Global PairwiseAlignmentsSingleSubject (1 of 1)
pattern: ACTTCACCAGCTCCCTGGCGGTAAGTTGATCAAAGGAAAC------
subject: TTT----CGGGTAAGTAAATATATGTT--TCACTACTTCCTTTCGG
score: -85

score(globalAlign) # alignment score

[1] -85

type(globalAlign) # alignment type

[1] "global"

DNA_ALPHABET # show full nucleotide alphabet

 [1] "A" "C" "G" "T" "M" "R" "W" "S" "Y" "K" "V" "H" "D" "B" "N" "-" "+"
[18] "."

N <- 1000 # number of desired sequences

# strings have 0-36 characters from the adapters attached to each end
adapter <- DNAString("GATCGGAAGAGCTCGTATGCCGTCTTCTGCTTGAAA")
adapter

36-letter DNAString object
seq: GATCGGAAGAGCTCGTATGCCGTCTTCTGCTTGAAA

set.seed(123)
# used for function input
experiment <- list(side = rbinom(N,1,0.5),
                   width = sample(0:36,N,replace = TRUE))

# 2.3 | SEQUENCE ALIGNMENT SUMMARY

#Functions related to alignment summary

#summary alphabet() compareStrings()
#deletion() mismatchTable()
#nchar() nedit() indel()
#insertion() nindel()
#nmatch() nmismatch()
#pattern() subject()
#pid() rep() score() type()

# ''' Function to Generate DNA sequences /w these fragments '''
# The following code simulates what sequences with adapter fragments at either end could look like during an experiment
# https://www.bioconductor.org/packages/devel/bioc/vignettes/Biostrings/inst/doc/PairwiseAlignments.pdf

simulateReads <-
function(N, adapter, experiment, substitutionRate = 0.01, gapRate = 0.001) {
    
    chars <- strsplit(as.character(adapter), "")[[1]]
    sapply(seq_len(N), function(i, experiment, substitutionRate, gapRate) {
        
        width <- experiment[["width"]][i]
        side <- experiment[["side"]][i]
        randomLetters <- function(n) sample(DNA_ALPHABET[1:4], n, replace = TRUE)
        
        randomLettersWithEmpty <- function(n) 
            sample(c("", DNA_ALPHABET[1:4]), n, replace = TRUE,
                   prob = c(1 - gapRate, rep(gapRate/4, 4)))
        
        nChars <- length(chars)
        value <- paste(ifelse(rbinom(nChars,1,substitutionRate), 
                              randomLetters(nChars), chars),
                       randomLettersWithEmpty(nChars),sep = "", collapse = "")
        if (side) 
            value <- paste(c(randomLetters(36 - width), 
                             substring(value, 1, width)),
                           sep = "", collapse = "")
        else
            value <- paste(c(substring(value, 37 - width, 36), 
                             randomLetters(36 - width)),
                           sep = "", collapse = "") 
        value }, experiment = experiment, substitutionRate = substitutionRate, gapRate = gapRate)
}

# Generate Sequences w/ adapters from predefined function
adapterStrings <- simulateReads(N,
                                adapter,
                                experiment,
                                substitutionRate = 0.01, 
                                gapRate = 0.001)

# 1000 sequences of 36 signal length intervals
adapterStrings <- DNAStringSet(adapterStrings)
adapterStrings # strings that contain adapters

DNAStringSet object of length 1000:
       width seq
   [1]    36 TTCTGCTTGAAAGTTCGCGAGAACAACTAGTCCGCA
   [2]    36 ATAACTACACTGGGTAACACAAACCTTTGGATCGGA
   [3]    36 AAGTGCGGTAGATGCTCTGAATGCTAGCCCGTCGCA
   [4]    36 TGGACGTGCGAATGCCAAATTGTAAGCGCGGGATCG
   [5]    36 ACCTGCAGAGTACGGATCGGAAGAGCTCGTATGCCG
   ...   ... ...
 [996]    36 TCCCTGACACGATAGATAACTCATTAGATTGGATCG
 [997]    36 TCAGGTGATGAAAGCATCTTTGGATCGGAAGAGCTC
 [998]    36 CGGAAGAGCTCGTATGCCGTCTTCTGCTTGAAAAGC
 [999]    36 ACGATCGGAAGAGCTCGTATGCCGTCTTGTGCTTGA
[1000]    36 TGCTTGAAATAAAGACTACACAGCAGCTGCAGTATT

# Generate Random DNA samples

M <- 5000
samples <- sample(DNA_ALPHABET[1:4], #Only 4 main nucleotides
                  36*M,
                  replace = TRUE)

typeof(samples) #check type

[1] "character"

#generate matrix of samples
sample_mat <- matrix(samples, nrow = M)
typeof(sample_mat)

[1] "character"

randomStrings <- apply(sample_mat, 1, paste, collapse = "")

randomStrings<- DNAStringSet(randomStrings)
randomStrings

DNAStringSet object of length 5000:
       width seq
   [1]    36 TAGTTATAAGCGGTCTCCTTTGCCAGATGAAAAATA
   [2]    36 ACAATCCGAGTTGTTTGCTCGGAGAGAATGCCGTCC
   [3]    36 AATATAACAGTCGTTTTGACCTATGTGCTACCGTTA
   [4]    36 ACAGTTGAAACAATCATAGGACGGGGAGTGTGTATT
   [5]    36 TCAATAACGATTCTTTTTCCATCAGTCTACAGATGC
   ...   ... ...
[4996]    36 CCCGTATTCGCGATCGGCAGCTCGTGGACACGGAGG
[4997]    36 GCGAGTGCTGTCGCCAGCATGCGCAACATTTTCAAT
[4998]    36 TAGGCTGTCGGAAGATAAGCCTCGCCATCGTGCCAT
[4999]    36 TTACGATCGTTCAGTCGATTATAACGGCACGCATCA
[5000]    36 CCTCCGTCGAGTCACCTGTTGAAACTATATGAGAAT

2.4 | SEQUENCE ALIGNMENT APPLICATION

REMOVING ADAPTERS FROM SEQUENCE READINGS An interesting PSA example was shown in the Pairwise Sequence Reference & is related to experimentally processed DNA sequences Trimming adapter sequences - is it necessary?

Removal of adapter sequences in a process called read trimming, or clipping, is one of the first steps in analyzing NGS data. With more than 30 published adapter trimming tools there is a more than large choice for the appropriate tool. Yet, there is a debate whether this step really is as important as the number of tools suggests, or whether it is possible to skip this time-consuming step for many NGS applications.

Finding and removing uninteresting experiment process-related fragments like adapters is a common problem in genetic sequencing Pairwise Sequence Alignment is well suited to address this sort of issue, as this problem relates to sequence similarity When adapters are used to anchor or extend a sequence during the experiment process, they either intentionally or unintentionally become sequenced during the read process & thus are present in the sequence

#Substitution MAtrix
submat1 <- nucleotideSubstitutionMatrix(match =0, mismatch = -1, baseOnly = 
                                          TRUE)
# adapter strings DNA & adapter (0-36 characters attached to either end)
# should have higher hit rate 

adapterAligns1 <- pairwiseAlignment(adapterStrings,
                                    adapter, 
                                    substitutionMatrix = submat1,
                                    gapOpening = 0, gapExtension = 1)

adapterAligns1 # PairwiseAlignmentsSingleSubject (contains multiple PSA)]

Global PairwiseAlignmentsSingleSubject (1 of 1000)
pattern: TTCTGCTTGAA-AGTTCGCGAGAACAACTAGTCC--GCA-
subject: GA-T-CG-GAAGAGCTCGTATGC-CGTCTTCTGCTTGAAA
score: -22

adapterAligns1_score <- score(adapterAligns1)

# random DNA & adapter (baseline for comparison only)
randomScores1 <- pairwiseAlignment(randomStrings,
                                   adapter, 
                                   substitutionMatrix = submat1,
                                   gapOpening = 0, gapExtension = 1,
                                   scoreOnly = TRUE) # get the final alignment score only

# show the quantile data 99%+ score
quantile(randomScores1, seq(0.99,1,0.001))

  99% 99.1% 99.2% 99.3% 99.4% 99.5% 99.6% 99.7% 99.8% 99.9%  100% 
  -16   -16   -16   -16   -16   -16   -16   -16   -15   -15   -14

Using completely random strings as a baseline for any PSA methodology we develop to remove the adapter characters So let’s create randomised DNA sequences using the DNA_ALPHABET using sample()

# find places where the adapter scores are higher than in baseline (using onlu 99.9% quartile data only) 
# 29th character += 
table(adapterAligns1_score > quantile(randomScores1,0.999), experiment[["width"]])

       
         0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20
  FALSE 18 26 21 17 31 25 27 29 30 30 37 26 29 25 30 27 32 29 36 16 23
  TRUE   0  0  0  0  0  0  0  0  0  0  0  0  0  0  0  0  0  0  0  0  0
       
        21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
  FALSE 23 32 27 31 24 25 28 31  4  0  0  0  0  0  0  0
  TRUE   0  0  0  0  0  0  0  0 23 26 25 28 25 34 23 27

METHOD 1 For the first approach, we’ll use a match/mismatch of 0/-1 for the substitution matrix gap opening of 0 & gapEXtension of 1

# [1] read clustaw format (.aln)
origMAlign <- readDNAMultipleAlignment(filepath = system.file("extdata","msx2_mRNA.aln",
                                                              package="Biostrings"),
                                                              format="clustal")
# [1] read phylip format (.txt)
phylipMAlign <- readAAMultipleAlignment(filepath = system.file("extdata","Phylip.txt",
                                                               package="Biostrings"),
                                                               format="phylip")

origMAlign

DNAMultipleAlignment with 8 rows and 2343 columns
     aln                                            names               
[1] -----TCCCGTCTCCGCAGCAA...AATTAAAAAAAAAAAAAAAAA gi|84452153|ref|N...
[2] ----------------------...--------------------- gi|208431713|ref|...
[3] ----------------------...--------------------- gi|118601823|ref|...
[4] ----------------------...--------------------- gi|114326503|ref|...
[5] ----------------------...--------------------- gi|119220589|ref|...
[6] ----------------------...--------------------- gi|148540149|ref|...
[7] --------------CGGCTCCG...--------------------- gi|45383056|ref|N...
[8] GGGGGAGACTTCAGAAGTTGTT...--------------------- gi|213515133|ref|...

DNAStr = as(origMAlign, "DNAStringSet") #change DNAMultipleAlignment ->DNAStringset

#Write to files
writeXStringSet(DNAStr, file="DNAStr.fasta" ) #write in fasta format

write.phylip(phylipMAlign, filepath = "phylipMalign.txt") #write in Phylip format

#Display an alignment
origMAlign

DNAMultipleAlignment with 8 rows and 2343 columns
     aln                                            names               
[1] -----TCCCGTCTCCGCAGCAA...AATTAAAAAAAAAAAAAAAAA gi|84452153|ref|N...
[2] ----------------------...--------------------- gi|208431713|ref|...
[3] ----------------------...--------------------- gi|118601823|ref|...
[4] ----------------------...--------------------- gi|114326503|ref|...
[5] ----------------------...--------------------- gi|119220589|ref|...
[6] ----------------------...--------------------- gi|148540149|ref|...
[7] --------------CGGCTCCG...--------------------- gi|45383056|ref|N...
[8] GGGGGAGACTTCAGAAGTTGTT...--------------------- gi|213515133|ref|...

3 | ALIGNMENT OBJECTS Quite a number of application in Bioinformatics involve the use of biological sequence alignment We can read an alignment file using readDNAMultipleAlignment(filepath), examples shown below Masking is also used for various operations surrounding sequence alignments, in particular when we have lots of gaps in our alignments & want to remove them before using the data for analysis 3.1 | IO ALIGNMENT

READ ALIGNMENT Read Alignment | Two formats used for alignment: clustal, phylip

#display alignment
phylipMAlign

AAMultipleAlignment with 24 rows and 181 columns
      aln                                           names               
 [1] YVID-QMISAKAIAARVEALG...GLDYAQNHRNLPFIGTVRFTD hprt_rhoca
 [2] HHVD-VLISENDVHARIAELG...GIDYAQRHRNLGYIGKVVLEE hprt_haein
 [3] HHVD-VLISENDVHARIAELG...GIDYAQRHRNLGYIGKVVLEE hprt_haein
 [4] HTVE-VMISEQEVQERIRELG...GIDYAQKYRDLPFIGKVVPQE hprt_vibha
 [5] HTVE-VMIPEAEIKARIAELG...GIDYAQRYRHLPYIGKVILLD hprt_ecoli
 [6] EDLEKVFIPHGLIMDRTERLA...ALDYNEYFRDLNHVCVISESG hprt_merun
 [7] EDLERVFIPHGLIMDRTERLA...ALDYNEYFRDLNHVCVISETG hprt_monke
 [8] EDLERVFIPHGLIMDRTERLA...ALDYNEYFRDLNHVCVISETG hprt_human
 [9] EDLEKVFIPHGLIMDRTERLA...ALDYNEHFRDLNHVCVISESG hprt_rat
 ... ...
[16] DVLESLLATFEECKALAADTA...GLDDNGLRRGWAHLFDINLSE gprt_giard
[17] DFATSVLFTEAELHTRMRGVA...GLDYDQSYREVRDVVILKPSV hprt_trybb
[18] EFAEKILFTEEEIRTRIMEVA...GLDYDDTYRELRDIVVLRPEV hprt_tcruz
[19] PMSAHTLVTQEQVWAATAKCA...GMDYAESYRELRDICVLKKEY hprt_leido
[20] PMSCRTLATQEQIWSATAKCA...GMDFAEAYRELRDVCVLKKEY hprt_crifa
[21] DDLERVLYNQDDIQKRIRELA...GFDFHNKYRNLPVIGILKESV hgxr_trifp
[22] KAIEKVLVSEEEIIEKSKELG...GLDYEENYRNLPYVGVLKPEV hprt_lacla
[23] HDIEKVLISEEEIQKKVKELG...GLDYAERYRNLPYIGVLKPAV hprt_bacsu
[24] MGIKSIVINEQQIEEGCQKAV...GLDYDGFYRNLPYVGVFEPDN hprt_mycge

WRITING ALIGNMENT TO FILE We can write alignments using two different formats; FASTA & Phylip formats

rownames (origMAlign) #show all

[1] "gi|84452153|ref|NM_002449.4|"   "gi|208431713|ref|NM_001135625."
[3] "gi|118601823|ref|NM_001079614." "gi|114326503|ref|NM_013601.2|" 
[5] "gi|119220589|ref|NM_012982.3|"  "gi|148540149|ref|NM_001003098."
[7] "gi|45383056|ref|NM_204559.1|"   "gi|213515133|ref|NM_001141603."

rownames(origMAlign)[1]  #show just the one

[1] "gi|84452153|ref|NM_002449.4|"

# [3] Make our own list of names & assign it to alignment rownames
# These names are more are more easily interpretable
rownames(origMAlign) <- c("Human","Chimp","Cow","Mouse","Rat","Dog","Chicken","Salmon") # concat characters
origMAlign

DNAMultipleAlignment with 8 rows and 2343 columns
     aln                                            names               
[1] -----TCCCGTCTCCGCAGCAA...AATTAAAAAAAAAAAAAAAAA Human
[2] ----------------------...--------------------- Chimp
[3] ----------------------...--------------------- Cow
[4] ----------------------...--------------------- Mouse
[5] ----------------------...--------------------- Rat
[6] ----------------------...--------------------- Dog
[7] --------------CGGCTCCG...--------------------- Chicken
[8] GGGGGAGACTTCAGAAGTTGTT...--------------------- Salmon

DISPLAY ALIGNMENT We can display the alignment via the object instance & the get the corresponding individual alignment name using rownames

# [4] Detail provides a view for all of the alignment
 detail(origMAlign)

# [5] We can set rowmask w/ IRanges to hide some rows in alignment
# let's mask the first three rows

Test <- origMAlign
rowmask(Test) <- IRanges(start=1,end=3) # set int range function
Test

DNAMultipleAlignment with 8 rows and 2343 columns
     aln                                            names               
[1] ######################...##################### Human
[2] ######################...##################### Chimp
[3] ######################...##################### Cow
[4] ----------------------...--------------------- Mouse
[5] ----------------------...--------------------- Rat
[6] ----------------------...--------------------- Dog
[7] --------------CGGCTCCG...--------------------- Chicken
[8] GGGGGAGACTTCAGAAGTTGTT...--------------------- Salmon

# remove rowmask
rowmask(Test) <- NULL

# [6] We can also use column masking
# concat can be used to select multiple locations
# let's mask the columns -> 1-500 & 1000-2343

Test <- origMAlign
colmask(Test) <- IRanges(2,4)
colmask(Test) <- IRanges(6,8) # You can add multiple masks as well
Test

DNAMultipleAlignment with 8 rows and 2343 columns
     aln                                            names               
[1] -###-###CGTCTCCGCAGCAA...AATTAAAAAAAAAAAAAAAAA Human
[2] -###-###--------------...--------------------- Chimp
[3] -###-###--------------...--------------------- Cow
[4] -###-###--------------...--------------------- Mouse
[5] -###-###--------------...--------------------- Rat
[6] -###-###--------------...--------------------- Dog
[7] -###-###------CGGCTCCG...--------------------- Chicken
[8] G###G###CTTCAGAAGTTGTT...--------------------- Salmon

# remove column mask
colmask(Test) <- NULL

CHANGE ALIGNMENT NAMES Set Alignment Names | rownames(aln) - Replace alignment names if we need to make it more clear for interpretation

origMAlign

DNAMultipleAlignment with 8 rows and 2343 columns
     aln                                            names               
[1] -----TCCCGTCTCCGCAGCAA...AATTAAAAAAAAAAAAAAAAA Human
[2] ----------------------...--------------------- Chimp
[3] ----------------------...--------------------- Cow
[4] ----------------------...--------------------- Mouse
[5] ----------------------...--------------------- Rat
[6] ----------------------...--------------------- Dog
[7] --------------CGGCTCCG...--------------------- Chicken
[8] GGGGGAGACTTCAGAAGTTGTT...--------------------- Salmon

SHOW DETAILED ALIGNMENT Show entire alignment | detail(aln) - can be used to display the entire sequence alignment

#a mask was found @1232 - 1236 of first row

tata_mask <- maskMotif(origMAlign, "AAAA")
colmask(tata_mask)

NormalIRanges object with 3 ranges and 0 metadata columns:
          start       end     width
      <integer> <integer> <integer>
  [1]       666       669         4
  [2]      1200      1203         4
  [3]      1232      1236         5

3.2 | ALIGNMENT MASKING

We’ll look at several types of alignment masking; basic masking, motif masking & gap masking

BASIC MASKING Hiding Rows | rowmask(aln) - used for hiding some of the row content in an alignment Hiding Columns | colmask(aln) - used for hiding some of the column content in an alignment

autoMasked <- maskGaps(origMAlign, min.fraction = 0.5, min.block.width =4)

autoMasked

DNAMultipleAlignment with 8 rows and 2343 columns
     aln                                            names               
[1] ######################...##################### Human
[2] ######################...##################### Chimp
[3] ######################...##################### Cow
[4] ######################...##################### Mouse
[5] ######################...##################### Rat
[6] ######################...##################### Dog
[7] ######################...##################### Chicken
[8] ######################...##################### Salmon

# Multiple sequence alignment in matrix format
full = as.matrix(origMAlign)
dim(full)

[1]    8 2343

MOTIF MASKING Masking with Motifs | Useful for masking subsequence occurences of a string from columns where it is present in the consensus sequence

#if we mask the entire row, we get NA
Test <- origMAlign

rowmask(Test) <- IRanges(start = 1, end = 3) #set int range function

alphabetFrequency(Test)

       A   C   G   T  M  R  W  S  Y  K  V  H  D  B  N    -  +  .
[1,]  NA  NA  NA  NA NA NA NA NA NA NA NA NA NA NA NA   NA NA NA
[2,]  NA  NA  NA  NA NA NA NA NA NA NA NA NA NA NA NA   NA NA NA
[3,]  NA  NA  NA  NA NA NA NA NA NA NA NA NA NA NA NA   NA NA NA
[4,] 538 519 501 604  0  0  0  0  0  0  0  0  0  0  0  181  0  0
[5,] 494 483 477 522  0  0  0  0  0  0  0  0  0  0  0  367  0  0
[6,] 160 285 241 118  0  0  0  0  0  0  0  0  0  0  0 1539  0  0
[7,] 235 376 300 196  0  0  0  0  0  0  0  0  0  0  0 1236  0  0
[8,] 311 326 314 321  0  0  0  0  0  0  0  0  0  0  0 1071  0  0

# [1] If we masked only parts of the row content, we'll get freq of only those that aren't masked
autoMasked <- maskGaps(origMAlign,
                       min.fraction=0.5,
                       min.block.width=4)
alphabetFrequency(autoMasked)

       A   C   G   T M R W S Y K V H D B N   - + .
[1,] 260 351 296 218 0 0 0 0 0 0 0 0 0 0 0  18 0 0
[2,] 171 271 231 128 0 0 0 0 0 0 0 0 0 0 3 339 0 0
[3,] 277 360 275 209 0 0 0 0 0 0 0 0 0 0 0  22 0 0
[4,] 265 343 277 226 0 0 0 0 0 0 0 0 0 0 0  32 0 0
[5,] 251 345 287 229 0 0 0 0 0 0 0 0 0 0 0  31 0 0
[6,] 160 285 241 118 0 0 0 0 0 0 0 0 0 0 0 339 0 0
[7,] 224 342 273 190 0 0 0 0 0 0 0 0 0 0 0 114 0 0
[8,] 268 289 273 262 0 0 0 0 0 0 0 0 0 0 0  51 0 0

GAP MASKING Masking alignments with gaps | Useful for when we need to mask gaps that are present in the alignment

MaskGaps also operate on columns & will mask columns based on the fraction of each column that contains gaps; min.fraction along with the width of columns that contain this fraction of gaps min.block.width

# ''' Bad Cluster Case '''

# Calculate the distance to eachother (alignments)

str_set <- as(origMAlign, "DNAStringSet") #convert/use alignment to/as string set

class(str_set) #DNAStringSet

[1] "DNAStringSet"
attr(,"package")
[1] "Biostrings"

str_set #the stringset only contains those present in the mask

DNAStringSet object of length 8:
    width seq                                       names               
[1]  2343 -----TCCCGTCTCCGCAG...TTAAAAAAAAAAAAAAAAA Human
[2]  2343 -------------------...------------------- Chimp
[3]  2343 -------------------...------------------- Cow
[4]  2343 -------------------...------------------- Mouse
[5]  2343 -------------------...------------------- Rat
[6]  2343 -------------------...------------------- Dog
[7]  2343 --------------CGGCT...------------------- Chicken
[8]  2343 GGGGGAGACTTCAGAAGTT...------------------- Salmon

#Calculate Distance
sdist <- stringDist(str_set, method = 'hamming')

sdist

        Human Chimp  Cow Mouse  Rat  Dog Chicken
Chimp    1424                                   
Cow      1225   382                             
Mouse     772  1457 1257                        
Rat       783  1267 1080   431                  
Dog      1497    79  392  1463 1276             
Chicken  1504   514  524  1489 1379  526        
Salmon   1691   904  808  1651 1550  916     816

# cluster using Hierarchical clustering, hclust
clust <- hclust(sdist,
                method = "single")
clust


Call:
hclust(d = sdist, method = "single")

Cluster method   : single 
Distance         : hamming 
Number of objects: 8

pdf(file="tree1.pdf") # plot the clustering
plot(clust) # plot dendogram of the clustering
dev.off()

null device 
          1

# Cut the tree into four groups
fourgroups <- cutree(clust, 4)
fourgroups

  Human   Chimp     Cow   Mouse     Rat     Dog Chicken  Salmon 
      1       2       2       3       3       2       2       4

# ''' Better Cluster Case '''

# suppose we have created some mask for our alignment
autoMasked

DNAMultipleAlignment with 8 rows and 2343 columns
     aln                                            names               
[1] ######################...##################### Human
[2] ######################...##################### Chimp
[3] ######################...##################### Cow
[4] ######################...##################### Mouse
[5] ######################...##################### Rat
[6] ######################...##################### Dog
[7] ######################...##################### Chicken
[8] ######################...##################### Salmon

# Calculate the distance to eachother (alignments)
class(autoMasked) # DNAMultipleAlignment class

[1] "DNAMultipleAlignment"
attr(,"package")
[1] "Biostrings"

str_set <- as(autoMasked,"DNAStringSet") # convert/use alignment to/as string set
class(str_set) # DNAStringSet

[1] "DNAStringSet"
attr(,"package")
[1] "Biostrings"

str_set # the stringset only contains those present in the mask

DNAStringSet object of length 8:
    width seq                                       names               
[1]  1143 CAGAGAAGTCA-TGGCTTC...AGCAGACGTAAAAATTCAA Human
[2]  1143 ----------A-TGGCTTC...------------------- Chimp
[3]  1143 GAGAGAAGTCA-TGGCTTC...AGCAAAAAAAAAAAAAAAA Cow
[4]  1143 CAGA-AAGTCA-TGGCTTC...GCCAGATGTAAAAATTCAA Mouse
[5]  1143 ----------A-TGGCTTC...GCCAGATGTAAAAATTCAA Rat
[6]  1143 ----------A-TGGCTTC...------------------- Dog
[7]  1143 CGGCCCCGCTC-CAGCCAC...------------------- Chicken
[8]  1143 TGTGTTCGTCAACATCTGA...ATTTATTCTATAGCCCTGA Salmon

# Calculate distance
sdist <- stringDist(str_set,
                    method="hamming")
sdist

        Human Chimp Cow Mouse Rat Dog Chicken
Chimp     325                                
Cow       130   378                          
Mouse     178   406 202                      
Rat       186   403 212    77                
Dog       398    79 388   412 412            
Chicken   422   436 442   439 437 448        
Salmon    625   724 630   619 616 736     639

# cluster using Hierarchical clustering, hclust
clust <- hclust(sdist,
                method = "single")
clust


Call:
hclust(d = sdist, method = "single")

Cluster method   : single 
Distance         : hamming 
Number of objects: 8

pdf(file="tree2.pdf") # plot the clustering
plot(clust) # plot dendogram of the clustering
dev.off()

null device 
          1

# Cut the tree into four groups
fourgroups <- cutree(clust, 4)
fourgroups

  Human   Chimp     Cow   Mouse     Rat     Dog Chicken  Salmon 
      1       2       1       1       1       2       3       4

3.3 | ALIGNMENT MASKING APPLICATIONS

ALPHABET FREQUENCY w/ MASKING Having created masks for parts of the alignment which is of interest to us, we can conduct some form of investigation When using masks, operations will only include the non masked sequence characters, eg. alphabetFrequency.

suppressPackageStartupMessages(library(msa))

# Load Example File
mySequenceFile <- system.file("examples",
                              "exampleAA.fasta",
                              package="msa")

# Read Amino acid string set
mySequences <- readAAStringSet(mySequenceFile) # read stringset (same as biostrings library)
mySequences

AAStringSet object of length 9:
    width seq                                       names               
[1]   452 MSTAVLENPGLGRKLSDFG...ADSINSEIGILCSALQKIK PH4H_Homo_sapiens
[2]   453 MAAVVLENGVLSRKLSDFG...DSINSEVGILCNALQKIKS PH4H_Rattus_norve...
[3]   453 MAAVVLENGVLSRKLSDFG...DSINSEVGILCHALQKIKS PH4H_Mus_musculus
[4]   297 MNDRADFVVPDITTRKNVG...DDLVLNAGDRQGWADTEDV PH4H_Chromobacter...
[5]   262 MKTTQYVARQPDDNGFIHY...HEAMRLGLHAPLFPPKQAA PH4H_Pseudomonas_...
[6]   451 MSALVLESRALGRKLSDFG...ADSISSEVEILCSALQKLK PH4H_Bos_taurus
[7]   313 MAIATPTSAAPTPAPAGFT...GDAVLNAGTREGWADTADI PH4H_Ralstonia_so...
[8]   294 MSGDGLSNGPPPGARPDWT...RGTQAYATAGGRLAGAAAG PH4H_Caulobacter_...
[9]   275 MSVAEYARDCAAQGLRGDY...FEAIVARRKDQKALDPATV PH4H_Rhizobium_loti

SEQUENCE SET CLUSTERING w/ MASKING We can also cluster the alignments in a StringSet based on their distance (stringDist) to each other | hclust Passing a DNAStringSet, the clustering will also take into account only those alphabet in the created masking | String Distance & Clustering Video Here we’ll look at two cases, unmasked alignments & masked alginments, the benefit of masking being that the alignments contain lots of gaps (origMAlign)

#Multiple Sequence Alignment
aln <- msa(mySequences) #ClustalW used by default

use default substitution matrix

#same masking used in biostrings can be used

rowmask(aln, invert= TRUE) <- IRanges(start = 1, end = 3)
#print (aln, show= "complete") #show full alignment

print(aln)

CLUSTAL 2.1  

Call:
   msa(mySequences)

MsaAAMultipleAlignment with 9 rows and 456 columns
    aln                                            names
[1] MAAVVLENGVLSRKLSDFGQET...LADSINSEVGILCNALQKIKS PH4H_Rattus_norve...
[2] MAAVVLENGVLSRKLSDFGQET...LADSINSEVGILCHALQKIKS PH4H_Mus_musculus
[3] MSTAVLENPGLGRKLSDFGQET...LADSINSEIGILCSALQKIK- PH4H_Homo_sapiens
[4] ######################...##################### PH4H_Bos_taurus
[5] ######################...##################### PH4H_Chromobacter...
[6] ######################...##################### PH4H_Ralstonia_so...
[7] ######################...##################### PH4H_Caulobacter_...
[8] ######################...##################### PH4H_Pseudomonas_...
[9] ######################...##################### PH4H_Rhizobium_loti
Con MAAVVLENGVLSRKLSDFGQET...LADSINSEVGILC?ALQKIKS Consensus

#MSA approach options
myClustalWAlignment <- msa(mySequences, "ClustalW")

use default substitution matrix

myClustalOmegaAlignment <- msa(mySequences, "ClustalOmega")

using Gonnet

myMuscleAlignment <- msa(mySequences, "Muscle")

BIOCONDUCTOR :: msa The method used in biological sequence alignment can’t handle lots of alignments described in snipplet: Most alignments are computed using the progressive alignment heuristic These methods are starting to become a bottleneck in some analysis pipelines when faced with data sets of the size of many thousands of sequences CLUSTALW, CLUSTALOMEGA, MUSCLE are all more advanced methods of multiple sequence alignment, varying in algorithm, but achieving the same goal So for realistic problems, we may have to compare lots of sequences togther, thus the above three algorithms are more preferable, to keep computational cost low Upon msa, we get MsaAAMultipleAlignment objects, which we already used in Section 3; the same alignment related operations used in Biostrings can be used (eg. masking)

# using as() to change msa alignment type to StringSet
AAStr = as(myMuscleAlignment, "AAStringSet") # output as String Set
writeXStringSet(AAStr, file="AAStr.fasta") # write in FASTA format

# Load Example File
mySequenceFile <- system.file("examples",
                              "exampleAA.fasta",
                              package="msa")

# Read Amino acid string set
mySequences <- readAAStringSet(mySequenceFile) # read stringset (same as biostrings library)
mySequences

#Multiple Sequence Alignment
aln <- msa(mySequences) #ClustalW used by default

#same masking used in biostrings can be used

rowmask(aln, invert= TRUE) <- IRanges(start = 1, end = 3)
#print (aln, show= "complete") #show full alignment

print(aln)

#MSA approach options
myClustalWAlignment <- msa(mySequences, "ClustalW")
myClustalOmegaAlignment <- msa(mySequences, "ClustalOmega")
myMuscleAlignment <- msa(mySequences, "Muscle")

# using as() to change msa alignment type to StringSet
AAStr = as(myMuscleAlignment, "AAStringSet") # output as String Set
writeXStringSet(AAStr, file="AAStr.fasta") # write in FASTA format

Project Files & template from Andrey Shtrauss

LS0tDQp0aXRsZTogIkJJb2NvbmR1Y3RvciB8QmlvaW5mb3JtYXRpY3MgQmFzaWNzIg0Kb3V0cHV0OiBodG1sX25vdGVib29rDQotLS0NCg0KDQpgYGB7cn0NCiMgVGhpcyBSIGVudmlyb25tZW50IGNvbWVzIHdpdGggbWFueSBoZWxwZnVsIGFuYWx5dGljcyBwYWNrYWdlcyBpbnN0YWxsZWQNCiMgSXQgaXMgZGVmaW5lZCBieSB0aGUga2FnZ2xlL3JzdGF0cyBEb2NrZXIgaW1hZ2U6IGh0dHBzOi8vZ2l0aHViLmNvbS9rYWdnbGUvZG9ja2VyLXJzdGF0cw0KIyBGb3IgZXhhbXBsZSwgaGVyZSdzIGEgaGVscGZ1bCBwYWNrYWdlIHRvIGxvYWQNCg0KbGlicmFyeSh0aWR5dmVyc2UpICMgbWV0YXBhY2thZ2Ugb2YgYWxsIHRpZHl2ZXJzZSBwYWNrYWdlcw0KDQojIElucHV0IGRhdGEgZmlsZXMgYXJlIGF2YWlsYWJsZSBpbiB0aGUgcmVhZC1vbmx5ICIuLi9pbnB1dC8iIGRpcmVjdG9yeQ0KIyBGb3IgZXhhbXBsZSwgcnVubmluZyB0aGlzIChieSBjbGlja2luZyBydW4gb3IgcHJlc3NpbmcgU2hpZnQrRW50ZXIpIHdpbGwgbGlzdCBhbGwgZmlsZXMgdW5kZXIgdGhlIGlucHV0IGRpcmVjdG9yeQ0KDQpsaXN0LmZpbGVzKHBhdGggPSAiQzovVXNlcnMvc2FtZW4vRGVza3RvcC9CaW9pbmZvcm1hdGljcyBQcm9qZWN0cy9CaW9jb25kdWN0b3IgdG9vbHMgZm9yIE1hc3MgU3BlY3Ryb21ldHJ5L0Jpb2NvbmR1Y3RvciIpDQoNCiMgWW91IGNhbiB3cml0ZSB1cCB0byAyMEdCIHRvIHRoZSBjdXJyZW50IGRpcmVjdG9yeSAoL2thZ2dsZS93b3JraW5nLykgdGhhdCBnZXRzIHByZXNlcnZlZCBhcyBvdXRwdXQgd2hlbiB5b3UgY3JlYXRlIGEgdmVyc2lvbiB1c2luZyAiU2F2ZSAmIFJ1biBBbGwiIA0KIyBZb3UgY2FuIGFsc28gd3JpdGUgdGVtcG9yYXJ5IGZpbGVzIHRvIC9rYWdnbGUvdGVtcC8sIGJ1dCB0aGV5IHdvbid0IGJlIHNhdmVkIG91dHNpZGUgb2YgdGhlIGN1cnJlbnQgc2Vzc2lvbg0KYGBgDQoNCmBgYHtyfQ0Kc3VwcHJlc3NXYXJuaW5ncyhleHByKQ0KYGBgDQoNCg0KVHJ5IGV4ZWN1dGluZyB0aGlzIGNodW5rIGJ5IGNsaWNraW5nIHRoZSAqUnVuKiBidXR0b24gd2l0aGluIHRoZSBjaHVuayBvciBieSBwbGFjaW5nIHlvdXIgY3Vyc29yIGluc2lkZSBpdCBhbmQgcHJlc3NpbmcgKkN0cmwrU2hpZnQrRW50ZXIqLiANCg0KYGBge3J9DQojcGFja2FnZXMgaW5zdGFsbGF0aW9uDQppZiAoIXJlcXVpcmVOYW1lc3BhY2UoIkJpb2NNYW5hZ2VyIiwgcXVpZXRseT0gVFJVRSkpDQogICAgaW5zdGFsbC5wYWNrYWdlcygiQmlvTWFuYWdlciIpDQpCaW9jTWFuYWdlcjo6IGluc3RhbGwoIkJpb3N0cmluZ3MiKQ0KQmlvY01hbmFnZXI6OiBpbnN0YWxsKCJtc2EiKQ0KYGBgDQpCSU9DT05EVUNUT1LCtiBCaW9jb25kdWN0b3IgaXMgcXVpdGUgbW9yZSBhZHZhbmNlZCBjb21wYXJlZCB0byBzYXkgQmlvcHl0aG9uICYgcmVxdWlyZXMgbWluaW1hbCBwcm9ncmFtbWluZyBvbiB0aGUgdXNlciBlbmQuIEkgaGF2ZSBjb3ZlcmVkIHNvbWUgYmFzaWMgc2VxdWVuY2Ugb3BlcmF0aW9ucyBpbiBhIGJpb3B5dGhvbiBub3RlYm9vayBvciBXb3JraW5nIHdpdGggU2VxdWVuY2VzIG5vdGVvYm9vayBvbiBhIHJlbGF0YWJsZSB0b3BpYy4gVGhlIGxpYnJhcmllcyB1c2VkIGluIHRoaXMgbm90ZWJvb2s6DQoNCihJKSBCaW9zdHJpbmdzICggR2VuZXJhbCBiYXNlIGxpYnJhcnkgZm9yIHdvcmsgd2l0aCBzdHJpbmdzLCB1c2VzIEZBU1RBIGZvciBpbXBvcnRzICkgKElJKSBtc2EgKCBMaWJyYXJ5IGZvciBtdWx0aXBsZSBzZXF1ZW5jZSBhbGlnbm1lbnQsIGNvbnRhaW5pbmcgbW9yZSBhZHZhbmNlZCBtZXRob2RzIHRoYW4gdGhlIHByb2dyZXNzaXZlIGFwcHJvYWNoIGNvdmVyZWQgaW4gYmlvbG9naWNhbCBzZXF1ZW5jZSBhbGlnbm1lbnQgKSANCg0KDQoNCmBgYHtyfQ0KI0Jpb2NvbmR1Y3Rvcjo6IEJpb3N0cmluZ3MNCiNpbXBvcnQgbGlicmFyeSB3aXRob3V0IG1lc3NhZ2VzDQoNCnN1cHByZXNzUGFja2FnZVN0YXJ0dXBNZXNzYWdlcyhsaWJyYXJ5KEJpb3N0cmluZ3MpKQ0KYGBgDQoNCmBgYHtyfQ0KI1NlcXVlbmNlIE9wZXJhdGlvbnMNCg0KIzEgRGVmaW5pbmcgY2hhcmFjdGVycyBvZiBETkEgYW5kIGFtaW5vIGFjaWRzDQpjaHJfbjEgPSAiQUNUVENBQ0NBR0NUQ0NDVEdHQ0dHVEFBR1RUR0FUQ0FBQUdHQUFBQyINCmNocl9uMiA9ICJUVFRDR0dHVEFBR1RBQUFUQVRBVEdUVFRDQUNUQUNUVENDVFRUQ0dHIg0KDQpjaHJfYWExID0gJ1BBV0hFQUUnDQpjaHJfYWEyID0gJ0hFQUdBV0dIRUUnDQoNCg0KIyBOdWNsZW90aWRlIFN0cmluZw0KczFfbiA8LSBETkFTdHJpbmcoY2hyX24xKSAjRE5BU3RyaW5nDQpzMl9uIDwtIEROQVN0cmluZyhjaHJfbjIpDQpzMl9uDQoNCiNBbWlubyBBY2lkIFN0cmluZw0KczFfYWEgPSBBQVN0cmluZyhjaHJfYWExKQ0KczJfYWEgPSBBQVN0cmluZyhjaHJfYWEyKQ0KczJfYWENCmBgYA0KDQpgYGB7cn0NCiNEZWZpbmUgYSBuZXcgWHN0cmluZ1NldCBmcm9tIGNoYXJhY3RlcnMgKDMgc2VxdWVuY2VzKQ0KDQojY29uY2F0IHRvIG1ha2UgdmVjdG9yIHdpdGggYygpDQpzdHJfY29uY2F0ID0gYygiQUNHVCIsIkdUQ0EiLCJHQ1RBIikNCm5fc2V0IDwtIEFBU3RyaW5nU2V0KHN0cl9jb25jYXQpDQpuX3NldA0KDQojRGVmaW5lIGEgbmV3IFhTdHJpbmdTZXQgZnJvbSBjaGFyYWN0ZXJzICgxIHNlcXVlbmNlKQ0KDQpuX3NldF8xIDwtIEROQVN0cmluZ1NldChjKCJBQ0dUIikpDQpuX3NldF8xIA0KYGBgDQpgYGB7cn0NCiNDcmVhdGUgYSBzdHJpbmdzZXQgZnJvbSBhIHNlcXVlbmNlIHN0cmluZw0KI1VzaW5nIEROQVN0cmluZyAtPiBETkFTdHJpbmdTZXQNCg0Kc3RyX3N0cnNldCA9IEROQVN0cmluZ1NldChzMV9uKQ0KYGBgDQoNCg0KYGBge3J9DQojIFN0YXJ0IHdpdGggc2V0IChqdXN0IHRoZSBvbmUpDQpzdHJpbmcgPSBuX3NldFsxXQ0Kc3RyaW5nDQpgYGANCg0KDQpgYGB7cn0NCiNDb252ZXJ0IFhTdHJpbmdTZXQgdG8gQ2hhcmFjdGVyDQpkbmFfY2hhciA8LSB0b1N0cmluZyhuX3NldFsxXSkNCmNsYXNzKGRuYV9jaGFyKSAjY2hlY2sgdGhlIGNsYXNzIHR5cGUNCmRuYV9jaGFyICNwcmludCBjaGFyYWN0ZXINCmBgYA0KYGBge3J9DQojc3RhcnQgd2l0aCBtYW55IHN0cmluZ3MgaW4gYSBzdHJpbmdzZXQNCnByaW50KG5fc2V0KQ0KYGBgDQpgYGB7cn0NCmxzdCA8LSBsaXN0KCkgI2RlZmluZXMgYW4gZW1wdHkgbGlzdA0KDQojbG9vcCB0aHJvdWdoIGFsbGluIG5fc2V0DQpmb3IoaSBpbiAxOmxlbmd0aChuX3NldCkpIHsNCiAgICBsc3QgPC0gYyhsc3QsIHRvU3RyaW5nKG5fc2V0W2ldKSkNCn0NCg0KbHN0ICAjbGlzdCBjb250YWluaW5nIGNoYXJhY3RlcnMNCmBgYA0KDQpgYGB7cn0NCiMgU2V0IC0gPiBTaW5nbGUgc2VxdWVuY2UNCnN0cmluZyA9IG5fc2V0W1sxXV0gIyBleHRyYWN0IHNpbmdsZSBzZXF1ZW5jZSANCnN0cmluZyAjIHByaW50IHN0cmluZw0KDQojIHVzZSB0b1N0cmluZw0KY2hhciA9IHRvU3RyaW5nKHN0cmluZykNCmNoYXIgICMgcHJpbnQgY2hhcmFjdGVyDQpjbGFzcyhjaGFyKSAjIHByaW50IGNoYXIgdHlwZQ0KYGBgDQoNCg0KJycnUkVBRElORyBTRVFVRU5DRVMgRlJPTSBGQVNUQSBGSUxFwrYgVXN1YWxseSB3aGVuIHdvcmtpbmcgd2l0aCByZWFsaXN0aWMgc2VxdWVuY2VzIGZvcm1hdHMgc3VjaCBhcyBGQVNUQSAmIEdlbkJhbmsgYXJlIHVzZWQgQmlvc3RyaW5ncyB1c2VzIHRoZSBGQVNUQSBmb3JtYXQgZm9yIG9wZXJhdGlvbnMsIGxvYWRpbmcgJiBzYXZpbmcuIFRoZSB0d28gY2xhc3MgZm9ybWF0cyB1c2VkIHVwb24gdGhlIHNlcXVlbmNlKHMpIGJlaW5nIHJlYWQ6IEROQVN0cmluZ1NldCBmb3IgbnVjbGVvdGlkZSBzZXF1ZW5jZSBzZXQgKGV2ZW4ganVzdCB0aGUgb25lKSBBQVN0cmluZ1NldCBmb3IgYW1pbm8gYWNpZCBzZXF1ZW5jZXMnJycNCg0KDQpgYGB7cn0NCiMgRmlsZSBDb250YWluaW5nIE9uZSBTZXF1ZW5jZQ0KZmFzdGFfbiA9IHJlYWRETkFTdHJpbmdTZXQoJ0M6L1VzZXJzL3NhbWVuL0Rlc2t0b3AvQmlvaW5mb3JtYXRpY3MgUHJvamVjdHMvQmlvY29uZHVjdG9yIHRvb2xzIGZvciBNYXNzIFNwZWN0cm9tZXRyeS9CaW9jb25kdWN0b3Ivc2VxdWVuY2VzL2V4YW1wbGUuZmFzdGEnKQ0KZmFzdGFfbiAjIHByaW50IHJlYWQgZGF0YSANCmNsYXNzKGZhc3RhX24pICMgcHJpbnQgcmVhZCBjbGFzcyBmb3JtYXQNCm5hbWVzKGZhc3RhX24pICMgcHJpbnQgbmFtZSBvZiBzZXF1ZW5jZQ0KYGBgDQpgYGB7cn0NCiMgY2FuIHVzZSAoQmlvc3RyaW5nczo6KSBwcmVmaXggYXMgd2VsbA0KZmFzdGFfYWEgPSBCaW9zdHJpbmdzOjpyZWFkQUFTdHJpbmdTZXQoJ0M6L1VzZXJzL3NhbWVuL0Rlc2t0b3AvQmlvaW5mb3JtYXRpY3MgUHJvamVjdHMvQmlvY29uZHVjdG9yIHRvb2xzIGZvciBNYXNzIFNwZWN0cm9tZXRyeS9CaW9jb25kdWN0b3Ivc2VxdWVuY2VzL05DXzAwNTgxNi5mYWEnKQ0KZmFzdGFfYWENCmNsYXNzKGZhc3RhX2FhKSAjIEFBU3RyaW5nU2V0IG9iamVjdA0KYGBgDQpgYGB7cn0NCiNhbHdheXMgc3RhcnQgd2l0aCAxLCBub3QgYSAwIGxpa2UgcHl0aG9uDQpmYXN0YV9hYVsxXSAjU3RpbGwgQUEgc3RyaW5nc2V0IG9iamVjdCBidXQgbGVuZ3RoIG9mIDENCmBgYA0KYGBge3J9DQojT3RoZXIgb3BlcmF0aW9ucyBvZiBmYXN0LmFhIGZpbGVzDQp3aWR0aChmYXN0YV9hYVsxXSkgI2dldCBsZW5ndGggb2Ygc2VxdWVuY2UNCnNlcShmYXN0YV9hYVsxXSkgI3NlcXVlbmNlIG51bWJlcg0KbmFtZXMgKGZhc3RhX2FhWzFdKSAjZ2V0IHRoZSBjaGFyYWN0ZXIgb2JqZWN0IHR5cGUgb2YgdGhlIHNlcXVlbmNlDQpjbGFzcyhjaGFyKSAjc2hvdyBvYmplY3QgY2xhc3MNCmBgYA0KDQonJydTQVZJTkcgU0VRVUVOQ0VTIFRPIEZBU1RBIEZPUk1BVCB3cml0ZVhTdHJpbmdTZXQgaXMgdXNlZCB0byBzYXZlIGEgU3RyaW5nU2V0LCB3aGljaCBoYXMgdGhlIG9wdGlvbiB0byBzYXZlIGluIEZBU1RBIGZvcm1hdCcnJw0KDQoNCmBgYHtyfQ0Kbl9zZXQgI2FuIGFhc3RyaW5nc2V0IHdlIHdpc2ggdG8gc2F2ZQ0KDQoNCmBgYA0KDQoNCmBgYHtyfQ0KI1NhdmUgWFN0cmluZ1NldA0Kd3JpdGVYU3RyaW5nU2V0KG5fc2V0LCBmaWxlcGF0aCA9ICdDOi9Vc2Vycy9zYW1lbi9EZXNrdG9wL0Jpb2luZm9ybWF0aWNzIFByb2plY3RzL0Jpb2NvbmR1Y3RvciB0b29scyBmb3IgTWFzcyBTcGVjdHJvbWV0cnkvQmlvY29uZHVjdG9yL291dHB1dC9kbmFfbGlzdC5mYXN0YScsIGZvcm1hdCA9ICdmYXN0YScgKQ0KYGBgDQoNCmBgYHtyfQ0KI2NvbmZpcm1hdGlvbiBvbmx5IChyZWFkIHRoZSBmaWxlKQ0KY29uZmlybV9kbmFfeHN0cnNldCA9IHJlYWRETkFTdHJpbmdTZXQgKCdDOi9Vc2Vycy9zYW1lbi9EZXNrdG9wL0Jpb2luZm9ybWF0aWNzIFByb2plY3RzL0Jpb2NvbmR1Y3RvciB0b29scyBmb3IgTWFzcyBTcGVjdHJvbWV0cnkvQmlvY29uZHVjdG9yL291dHB1dC9kbmFfbGlzdC5mYXN0YScpDQoNCmNvbmZpcm1fZG5hX3hzdHJzZXQNCmBgYA0KDQpgYGB7cn0NCiMgY29tYmluZSBjaGFyYWN0ZXJzIA0KeDAgPC0gRE5BU3RyaW5nU2V0KGMoIkNUQ0NDQUdUQVQiLCAiVFRDQ0NHQSIsICJUQUNDVEFHQUciKSkgICMgU3RyaW5nIFNldCAjMQ0KeDEgPC0gRE5BU3RyaW5nU2V0KGMoIkFHR1RDR1QiLCAiR1RDQUdUR0dUQ0NDQyIsICJDQVRUVFRBR0ciKSkgIyBTdHJpbmcgU2V0ICMyDQp4MiA8LSBETkFTdHJpbmdTZXQoYygiVEdDVEFHQ1RBIiwgIkFHVENUVEdDIiwgIkFHQ1RUVENHQUciKSkgIyBTdHJpbmcgU2V0ICMzDQoNCmRuYV9saXN0IDwtIGxpc3QoeDAsIHgxLCB4MikgIyBjcmVhdGUgYSBsaXN0IG9mIFN0cmluZyBTZXRzDQpkbmFfeHN0cnNldCA9IGRvLmNhbGwoYywgZG5hX2xpc3QpICMgY29uY2VudHJhdGUgDQpkbmFfeHN0cnNldA0KYGBgDQoNCmBgYHtyfQ0KI1NlbGVjdCBvbmx5IHNwZWNpZmljIHNlcXVlbmNlcyBmcm9tIFNldA0KZG5hX3hzdHJzZXRbMToyXSAjaW5kZXhpbmcgYSBTZXQgLT4gc2VsZWN0aW5nIHNlcXVlbmNlcw0KDQpuZXdfc2V0IDwtIGRuYV94c3Ryc2V0WzldICNzZXQgdG8gbmV3IHZhcmlhYmxlDQpgYGANCg0KYGBge3J9DQojIFNlbGVjdGluZyBTZXF1ZW5jZSBTdWJzZXQgdy8gcmFuZ2UNCnN1YnNlcV9hYSA9IHN1YnNlcShzMl9hYSwgc3RhcnQ9MSxlbmQ9NSkNCnN1YnNlcV9hYQ0KYGBgDQoNCicnJzEuNCB8IEJBU0lDIEZVTkNUSU9OQUxJVFkNCg0KU29tZSBiYXNpYyBmdW5jdGlvbnMgYXBwbGlhYmxlIHRvIFN0cmluZ1NldCwgc29tZSBvZiB3aGljaCBoYXZlIG5vdCBiZWVuIHVzZWQgeWV0LCBtYWlubHkgdG8gZG8gd2l0aCBvcmRlcmluZyBvciB2aXN1YWxpc2F0aW9uIGluc2lkZSB0aGUgc2V0ICcnJw0KYGBgDQoNCg0KYGBge3J9DQojIFsxXSBiYXNpYyBvcGVyYXRpb25zDQoNCmxlbmd0aChkbmFfeHN0cnNldCkgIyBudW1iZXIgb2Ygc2VxdWVuY2VzDQpuYW1lcyhkbmFfeHN0cnNldCkgIyBzZXF1ZW5jZSBuYW1lcyBpbiBzZXQNCmhlYWQoZG5hX3hzdHJzZXQpICMgc2hvdyB0b3Agc2VxdWVuY2VzICANCnRhaWwoZG5hX3hzdHJzZXQpICMgc2hvdyBib3R0b20gc2VxdWVuY2VzDQp3aWR0aChkbmFfeHN0cnNldCkgIyBsZW5ndGggb2Ygc2VxdWVuY2VzIGluIHNldA0KYGBgDQoNCg0KYGBge3J9DQojc29ydCAmIHJldiBhcmUgc29ydGVycyBvZiBTdHJpbmcgU2V0cywgYnkgdXNpbmcgdGhlIHNlcXVlbmNlIGFscGhhYmV0DQpzb3J0KGRuYV94c3Ryc2V0KSAjc29ydCBieSBzZXF1ZW5jZSBhbHBoYWJldA0KcmV2KGRuYV94c3Ryc2V0KSAjcmV2ZXJzZSBzZXF1ZW5jZSBvcmRlcg0KYGBgDQoNCg0KDQpgYGB7cn0NCiNjaGFydHIgdXNlZCB0byByZXBsYWNlIGNoYXJhY3RlcnMgaW4gYSBzZXF1ZW5jZSBzZXQNCiMgWzNdIHJlcGxhY2UgcGFydHMgb2YgYSBzZXF1ZW5lIGluIGEgc2V0DQojIFJlcGxhY2UgQ2VydGFpbiBwYXJ0cyBvZiB0aGUgc2VxdWVuY2UNCiMgbGV0J3MgcmVwbGFjZSBDIHdpdGggVA0KDQpkbmFfeHN0cnNldFsxXSAjZG5hIHN0cmluZyBzZXQgb2JqZWN0DQoNCmRuYV9jaGFydHIgPC0gY2hhcnRyKCJDIiwgI2Zyb20NCiAgICAgICAgICAgICAgICAgICAgICJUIiwgI3RvDQogICAgICAgICAgICAgICAgICAgICBkbmFfeHN0cnNldFsxXSkgI2luIHN0cmluZyBzZXQNCg0KZG5hX2NoYXJ0cg0KYGBgDQoNCmBgYHtyfQ0KI2ZpbmRQYWxpbmRyb21lcyBjYW4gYmUgdXNlZCB0byBmaW5kIHBhbGluZHJvbWVzIGluIGEgc2VxdWVuY2UNCiMgT24gYSBETkEgb3IgUk5BIHNlcXVlbmNlOg0KZG5hX3NlcSA8LSBETkFTdHJpbmcoIkNDR0FBQUFDQ0FUR0FUR0dUVEdDQ0FHIikNCmZpbmRQYWxpbmRyb21lcyhkbmFfc2VxKQ0KYGBgDQoNCicnJyAxLjUgfCBCSU9MT0dJQ0FMIEZVTkNUSU9OUw0KDQpCaW9sb2dpY2FsIGZ1bmN0YWxpdHkgcmVsYXRpbmcgdG8gRE5BIGlzIGZvdW5kIGluIEJpb3N0cmluZ3MgYXMgd2VsbA0KSGF2aW5nIG9uZSBvZiB0aGUgc3RyYW5kcywgd2UgY2FuIGdldCBpdHMgcmV2ZXJzZSwgY29tcGxlbWVudCAmIHJldmVyc2UgY29tcGxlbWVudCwgc2ltaWxhciB0byB0aGF0IHdhcyBzaG93biBpbiBub3RlYm9vayBCaW9sb2dpY2FsIFNlcXVlbmNlIE9wZXJhdGlvbnMNClRyYW5zbGF0aW9uIGZyb20gRE5BIChvciBSTkEpIHRvIGNoYWlucyBvZiBhbWlubyBhY2lkcyAvIHByb3RlaW5zIGNhbiBiZSBkb25lIHZpYSB0cmFuc2xhdGUNClRyYW5zbGF0aW9uIHdvcmtzIHdpdGggYm90aCBzdHJpbmdzICYgc3RyaW5nIHNldCBvYmplY3RzICcnJw0KYGBgDQoNCg0KYGBge3J9DQojb3BlcmF0aW9ucyB1c2luZyBETkFTdHJpbmcgYW5kIEFBU3RyaW5nIE9iamVjdHMNCnMxX3JldmVyc2UgPC0gcmV2ZXJzZShzMV9uKQ0KczFfY29tcGxlbWVudCA8LSBjb21wbGVtZW50KHMxX24pDQpzMV9yZXZlcnNlY29tcGxlbWVudCA9IHJldmVyc2VDb21wbGVtZW50KHMxX24pDQoNCmMoczFfcmV2ZXJzZSkNCmMoczFfY29tcGxlbWVudCkNCmMoczFfcmV2ZXJzZWNvbXBsZW1lbnQpDQoNCiNTYW1lIGdvZXMgZm9yIEROQVN0cmluZ1NldCBjbGFzcyBzZXF1ZW5jZXMNCmNsYXNzKGZhc3RhX24pICNjaGVjayBjbGFzcw0KczFfcmV2ZXJzZV94c3RyID0gcmV2ZXJzZShmYXN0YV9uKQ0KczFfcmV2ZXJzZV94c3RyDQpgYGANCg0KYGBge3J9DQojIFRyYW5zbGF0aW9uIHdvcmtzIHcvIFNldHMgb3IganVzdCB0aGUgWFN0cmluZw0KczFfdHJhbnNsYXRlIDwtIHRyYW5zbGF0ZShkbmFfeHN0cnNldFtbM11dLCBuby5pbml0LmNvZG9uPVRSVUUpDQpzMV90cmFuc2xhdGUNCmBgYA0KDQoNCicnJzEuNiB8IENPVU5USU5HIENIQVJBQ1RFUlMNCg0KU2VxdWVuY2UgYWxwaGFiZXQgY291bnRzIGFyZSBxdWl0ZSByZWxldmFudCBpbiBiaW9pbmZvcm1hdGljcywgZWcuIEdDIENvbnRlbnQgaXMgdGhlIGRpbnVjbGVvdGlkZSBjb3VudA0KT3RoZXIgc2VxdWVuY2UgYWxwaGFiZXQgY291bnRlcnM6DQoNCmFscGhhYmV0RnJlcXVlbmN5IC0gRm9yIGEgZ2VuZXJhbCBhbHBoYWJldCBjb3VudCBvZiB0aGUgc2VxdWVuY2Uvc2V0DQpkaW51Y2xlb3RpZGVGcmVxdWVuY3kgLSBGb3IgdHdvIGNoYXJhY3RlciBwYWlyIGNvdW50cw0KdHJpbnVjbGVvdGlkZUZyZXF1ZW5jeSAtIEZvciB0aHJlZSBjaGFyYWN0ZXIgcGFpciBjb3VudHMgKGNvZG9ucykNCm9saWdvbnVjbGVvdGlkZUZyZXF1ZW5jeSAtIEdlbmVyYWwgZm9ybSBvZiB0aGUgdGhyZWUgYWJvdmUgJiBiZXlvbmQsIGRlc2NyaXB0aW9uIGJlbG93Og0KT2xpZ29udWNsZW90aWRlcyB8IFNjaWVuY2VEaXJlY3QNCg0KT2xpZ29udWNsZW90aWRlcyBhcmUgc21hbGwgbW9sZWN1bGVzIDjigJM1MCBudWNsZW90aWRlcyBpbiBsZW5ndGggdGhhdCBiaW5kIHZpYSBXYXRzb24tQ3JpY2sgYmFzZSBwYWlyaW5nIHRvIGVuaGFuY2Ugb3IgcmVwcmVzcyB0aGUgZXhwcmVzc2lvbiBvZiB0YXJnZXQgUk5BICcnJycNCg0KDQpgYGB7cn0NCmFscGhhYmV0RnJlcXVlbmN5KEROQVN0cmluZyhzMV9jb21wbGVtZW50KSkNCiNjYWxjdWxhdGUgdGhlIGFscGhhYmV0IGZyZXF1ZW5jeSBvZiBhIEROQSBzZXF1ZW5jZQ0KYGBgDQpgYGB7cn0NCnVuaXF1ZUxldHRlcnMoZG5hX3hzdHJzZXRbMV0pDQojc2hvdyBhbGwgdW5pcXVlIGNoYXJhY3RlcnMgaW4gYSBzZXF1ZW5jZQ0KYGBgDQpgYGB7cn0NCiMgQ2hhcmFjdGVyIGZyZXF1ZW5jeSBmdW5jdGlvbnMNCnNlcXVlbmNlIDwtIGRuYV94c3Ryc2V0WzFdDQpzZXF1ZW5jZQ0KDQpkaW51Y2xlb3RpZGVGcmVxdWVuY3koc2VxdWVuY2UpDQp0cmludWNsZW90aWRlRnJlcXVlbmN5KHNlcXVlbmNlKQ0Kb2xpZ29udWNsZW90aWRlRnJlcXVlbmN5KHNlcXVlbmNlLHdpZHRoPTIpDQpvbGlnb251Y2xlb3RpZGVGcmVxdWVuY3koc2VxdWVuY2Usd2lkdGg9NCkNCmBgYA0KDQpgYGB7cn0NCiNTaW1pbGFyIHRvIFBhbmRhcywgaWYgdGhlIGxpc3QgaXMgdG9vIGxvbmcsdGhlIGRlZmF1bHQgdmlldyB3aWxsIC4uLg0KIydvcHRpb25zJyBjYW4gYmUgdXNlZCB0byBjaGFuZ2UgdGhlIG1heGltdW0gY29sdW1uIGNvdW50DQoNCm9wdGlvbnMocmVwci5tYXRyaXgubWF4LmNvbHMgPSA3MCwNCiAgICAgICAgcmVwci5tYXRyaXgubWF4LnJvd3MgPSAxMDApDQpgYGANCg0KYGBge3J9DQoNCnRyaW51Y2xlb3RpZGVGcmVxdWVuY3koZG5hX3hzdHJzZXRbMV0pDQpgYGANCg0KDQpgYGB7cn0NCiNjYWxjdWxhdGluZyBjb25zZW5zdXMgbWF0cml4IGZvciBhIHN0cmluZyBzZXQNCmRuYV94c3Ryc2V0DQpgYGANCg0KYGBge3J9DQpjb25zZW5zdXNNYXRyaXgoZG5hX3hzdHJzZXQsIGFzLnByb2IgPSBGQUxTRSkNCmBgYA0KDQonJycyIHwgUEFJUldJU0UgU0VRVUVOQ0UgQUxJR05NRU5UwrYNCkdpdmVuIHRoZSBzaWduaWZpY2FuY2Ugb2YgUFNBIGluIHZhcmlvdXMgYXBwbGljYXRpb24gb2YgYmlvaW5mb3JtYXRpY3MsIHdlIHdpbGwgbG9vayBhdCBxdWl0ZSBhIGZldyB0aGluZ3MgdGhhdCBhcmUgYXNzb2NpYXRlZCB3aXRoIHRoaXMgcGFydCBvZiB0aGUgbGlicmFyeS4NCg0KVGhlIGdhcCBwZW5hbHRpZXMgYXJlIHJlZ3VsYXRlZCBieSB0aGUgZ2FwT3BlbmluZyBhbmQgZ2FwRXh0ZW5zaW9uIGFyZ3VtZW50cw0KRmlyc3Qgd2UgbmVlZCB0byBkZWZpbmUgYXNwZWN0cyBvZiBvdXIgb2JqZWN0aXZlIGZ1bmN0aW9uOyBzdWJzdGl0dXRpb24gbWF0cml4ICYgZ2FwIHBlbmFsdGllcw0KR2FwIHBlbmFsdGllcyBhcmUgc3BlY2lmaWVkIGluIHBhaXJ3aXNlQWxpZ25tZW50LCB3aGlsc3QgdGhlIHN1YnN0aXR1dGlvbiBtYXRyaXggaXMgY3JlYXRlZCBvciBjYWxsZWQgc2VwYXJhdGVseQ0KbnVjbGVvdGlkZVN1YnN0aXR1dGlvbk1hdHJpeCAtIENyZWF0ZSBhIHN1YnN0aXR1dGlvbiBtYXRyaXggdy8gYSBtYXRjaCAmIG1pc21hdGNoZXMgaW4gYSBudWNsZW90aWRlIHNlcXVlbmNlIG9yIHVzZSBzdHJpbmdzIHRvIGNhbGwgcHJlc2V0IGFhIG1hdHJpY2VzDQpwYWlyd2lzZUFsaWdubWVudCAtIHNlcXVlbmNlIGFsaWdubWVudCwgYnkgZGVmYXVsdCBnbG9iYWwgb3B0aW9uIGlzIHNldA0KU2ltaWxhciB0byBweXRob24sIGxvbmcgc3RyaW5ncyB3aWxsIGNvbnRhaW4gLi4uOg0KVG8gZGlzcGxheSB0aGUgd2hvbGUgc2VxdWVuY2Ugd2UgY2FuIHVzZSBhbGlnbmVkUGF0dGVybiAmIGFsaWduZWRTdWJqZWN0IHRvZ2V0aGVyIHdpdGggYygpICcnJw0KYGBgDQoNCicnJzIuMSB8IEFMSUdOTUVOVCBFWEFNUExFUw0KDQpOVUNMRU9USURFIEdMT0JBTCBTRVFVRU5DRSBBTElHTk1FTlQNCk51Y2xlb3RpZGUgZ2xvYmFsIHNlcXVlbmNlIGFsaWdubWVudCB1c2luZyB0aGUgTmVlZGxlbWFuIFd1bnNjaCBhbGdvcml0aG0NCldlIGNhbiBzZXQgYSBzZWxmIGRlZmluZWQgc3Vic3RpdHV0aW9uIG1hdHJpeCAoY29uc3RhbnQgbWF0Y2gvbWlzbWF0Y2gpIHVzaW5nIG51Y2xlb3RpZGVTdWJzdGl0dXRpb25NYXRyaXgNCnBhaXJ3aXNlQWxpZ25tZW50IHJlcXVpcmVzIGFyZ3VtZW50cyB0eXBlPSAnJ2dsb2JhbCcnLCBzdWJzdGl0dXRpb25NYXRyaXggKG1hdCkgJiBnYXAgbW9kZWwgc2V0dGluZ3MgKGdhcE9wZW5pbmcsZ2FwRXh0ZW5zaW9uKSAnJycNCmBgYA0KDQpgYGB7cn0NCiNUd28gc2VxdWVuY2VzIHRvIGJlIGdsb2JhbGx5IGFsaWduZWQNCg0KczFfbg0KczJfbg0KYGBgDQoNCmBgYHtyfQ0KIyBOdWNsZW90aWRlIEdsb2JhbCBBbGlnbm1lbnQNCg0KI0RlZmluZSBvdXIgb3duIHN1YnN0aXRpb24gbWF0cml4IChudWNsZW90aWRlKQ0KDQptYXQgPC0gbnVjbGVvdGlkZVN1YnN0aXR1dGlvbk1hdHJpeChtYXRjaCA9IDEsIG1pc21hdGNoID0gLTMsIA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgYmFzZU9ubHkgPSBUUlVFKQ0KDQptYXQNCmNsYXNzKG1hdCkNCg0KI0dsb2JhbCBBbGlnbm1lbnQgKE5lZWRsZW1hbiBXdW5zY2gpDQpnbG9iYWxBbGlnbiA8LSBwYWlyd2lzZUFsaWdubWVudChzMV9uLCBzMl9uLCAjc2VxdWVuY2VzIHdlIHdhbnQgdG8gYWxpZ24NCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIHR5cGUgPSAnZ2xvYmFsJywgI3R5cGUgb2YgYWxpZ25tZW50DQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBzdWJzdGl0dXRpb25NYXRyaXggPSBtYXQsICNzdWJzdGl0dXRpb24gbWF0cml4DQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIGdhcE9wZW5pbmcgPSA1LCBnYXBFeHRlbnNpb24gPTIgDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICNnYXAgcGVuYWx0eSBhcmd1bWVudHMNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgKQ0KDQpnbG9iYWxBbGlnbg0KDQpgYGANCg0KYGBge3J9DQojTlVDTEVPVElERSBMT0NBTCBTRVFVRU5DRSBBTElHTk1FTlQNCiNTbWl0aC1XYXRlcm1hbiBsb2NhbCBzZXF1ZW5jZSBhbGlnbm1lbnQgYmV0d2VlbiB0d28gbnVjbGVvdGlkZSBzZXF1ZW5jZXMgczFfbiAmIHMyX24gDQoNCiNOdWNsZW90aWRlIExvY2FsIFNlcXVlbmNlIEFsaWdubWVudCAoU21pdGgtV2F0ZXJtYW4pDQoNCmxvY2FsQWxpZ24gPC0gcGFpcndpc2VBbGlnbm1lbnQoczFfbiwgczJfbiwgdHlwZSA9ICJsb2NhbCIsDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIHN1YnN0aXR1dGlvbk1hdHJpeCA9IG1hdCwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgZ2FwT3BlbmluZz0gNSwgZ2FwRXh0ZW5zaW9uID0gMikNCg0KbG9jYWxBbGlnbg0KYGBgDQoNCmBgYHtyfQ0KI1Byb3RlaW4gR2xvYmFsIEFsaWdubWVudA0KI05lZWRsZW1hbi1XdW5zY2ggZ2xvYmFsIHNlcXVlbmNlIGFsaWdubWVudCBiZXR3ZWVuIHR3byBhbWlubyBhY2lkIGNoYWluIHNlcXVlbmNlcw0KI3MxX2FhIGFuZCBzMl9hYQ0KI2dsb2JhbCBhbGlnbm1lbnQoZGVmYXVsdCB0eXBlKSB1c2luZyBCTE9TVU0gU3Vic3RpdHV0aW9uIG1BdHJpeA0KDQojNDUsIDUwLDYyLCA4MCwxMDANCg0KcGFpcndpc2VBbGlnbm1lbnQoczFfYWEsIHMyX2FhLCBzdWJzdGl0dXRpb25NYXRyaXggPSAiQkxPU1VNNjIiLA0KICAgICAgICAgICAgICAgICAgZ2FwT3BlbmluZyA9IDAsIGdhcEV4dGVuc2lvbiA9IDgpDQpgYGANCg0KYGBge3J9DQojZ2xvYmFsIGFsaWdubWVudCAoZGVmYXVsdCB0eXBlKSB1c2luZyBQQU0gc3Vic3RpdHVpb24gTWF0cml4DQoNCiMzMCw0MCw3MCwxMjAsMjUwDQpwYWlyd2lzZUFsaWdubWVudChzMV9hYSwgczJfYWEsDQogICAgICAgICAgICAgICAgICBzdWJzdGl0dXRpb25NYXRyaXggPSAnUEFNMjUwJywNCiAgICAgICAgICAgICAgICAgIGdhcE9wZW5pbmcgPSAwLCBnYXBFeHRlbnNpb24gPSAxKQ0KYGBgDQoNCmBgYHtyfQ0KI0V4dHJhY3RpbmcgRGF0YSBmcm9tIEFsaWdubWVudHMNCiNnZXR0aW5nIGluZGl2aWR1YWwgc2VxdWVuY2UgaW4gdGhlIGFsaWdubWVudCwgYWxpZ25lZFBhdHRlcm4gYW5kIGFsaWduZWRTdWJqZWN0IGluIFN0cmluZ1NldCBvYmplY3QgZm9ybWF0DQoNCiNzZXF1ZW5jZSBleHRyYWN0aW9uIA0KczFfbnNldCA9IEROQVN0cmluZ1NldChjaHJfbjEpDQpzMl9uc2V0ID0gRE5BU3RyaW5nU2V0KGNocl9uMikNCg0KI1BhaXJ3aXNlIFNlcXVlbmNlIEFsaWdubWVudCBvcGVyYXRpb24NCmFsZyA8LSBwYWlyd2lzZUFsaWdubWVudChzMV9uc2V0LCBzMl9uc2V0KQ0KDQojcmVjYWxsaW5nIHRoZSBzZXF1ZW5jZXMgaW4gYSBwYWlyd2lzZSBhbGlnbm1lbnQNCmFsaWduZWRQYXR0ZXJuKGFsZykNCnRvU3RyaW5nKGFsaWduZWRTdWJqZWN0KGFsZykpICNjb252ZXJ0IHN0cmluZw0KDQpgYGANCg0KYGBgDQojIDIuMyB8IFNFUVVFTkNFIEFMSUdOTUVOVCBTVU1NQVJZDQoNCiNGdW5jdGlvbnMgcmVsYXRlZCB0byBhbGlnbm1lbnQgc3VtbWFyeQ0KDQojc3VtbWFyeSBhbHBoYWJldCgpIGNvbXBhcmVTdHJpbmdzKCkNCiNkZWxldGlvbigpIG1pc21hdGNoVGFibGUoKQ0KI25jaGFyKCkgbmVkaXQoKSBpbmRlbCgpDQojaW5zZXJ0aW9uKCkgbmluZGVsKCkNCiNubWF0Y2goKSBubWlzbWF0Y2goKQ0KI3BhdHRlcm4oKSBzdWJqZWN0KCkNCiNwaWQoKSByZXAoKSBzY29yZSgpIHR5cGUoKQ0KDQpgYGANCg0KYGBge3J9DQojc3VtbWFyeSBvZiBhbGlnbm1lbnQNCnN1bW1hcnkoYWxnKQ0KYGBgDQoNCmBgYHtyfQ0KZ2xvYmFsQWxpZ24NCmBgYA0KDQpgYGB7cn0NCiMgT3RoZXIgYWxpZ25tZW50IHJlbGF0ZWQgZnVuY3Rpb25zDQoNCmFscGhhYmV0KGdsb2JhbEFsaWduKSAjIHNob3cgY2hhcmFjdGVycyBvZiBhbGlnbm1lbnQgc2VxdWVuY2VzDQpjb21wYXJlU3RyaW5ncyhnbG9iYWxBbGlnbikgIyBjb21wYXJlIHN0cmluZ3Mgb2Ygc2VxdWVuY2VzDQpkZWxldGlvbihnbG9iYWxBbGlnbikNCm1pc21hdGNoVGFibGUoZ2xvYmFsQWxpZ24pDQpuY2hhcihnbG9iYWxBbGlnbikNCm5lZGl0KGdsb2JhbEFsaWduKQ0KaW5kZWwoZ2xvYmFsQWxpZ24pDQppbnNlcnRpb24oZ2xvYmFsQWxpZ24pDQpuaW5kZWwoZ2xvYmFsQWxpZ24pDQpubWF0Y2goZ2xvYmFsQWxpZ24pDQpubWlzbWF0Y2goZ2xvYmFsQWxpZ24pIA0KcGF0dGVybihnbG9iYWxBbGlnbikgIyBzaG93IG9ubHkgcGF0dGVybiBzZXF1ZW5jZQ0Kc3ViamVjdChnbG9iYWxBbGlnbikgIyBzaG93IG9ubHkgc3ViamVjdCBzZXF1ZW5jZQ0KcGlkKGdsb2JhbEFsaWduKQ0KcmVwKGdsb2JhbEFsaWduKQ0Kc2NvcmUoZ2xvYmFsQWxpZ24pICMgYWxpZ25tZW50IHNjb3JlDQp0eXBlKGdsb2JhbEFsaWduKSAjIGFsaWdubWVudCB0eXBlDQpgYGANCg0KDQoyLjQgfCBTRVFVRU5DRSBBTElHTk1FTlQgQVBQTElDQVRJT04NCg0KUkVNT1ZJTkcgQURBUFRFUlMgRlJPTSBTRVFVRU5DRSBSRUFESU5HUw0KQW4gaW50ZXJlc3RpbmcgUFNBIGV4YW1wbGUgd2FzIHNob3duIGluIHRoZSBQYWlyd2lzZSBTZXF1ZW5jZSBSZWZlcmVuY2UgJiBpcyByZWxhdGVkIHRvIGV4cGVyaW1lbnRhbGx5IHByb2Nlc3NlZCBETkEgc2VxdWVuY2VzDQpUcmltbWluZyBhZGFwdGVyIHNlcXVlbmNlcyAtIGlzIGl0IG5lY2Vzc2FyeT8NCg0KUmVtb3ZhbCBvZiBhZGFwdGVyIHNlcXVlbmNlcyBpbiBhIHByb2Nlc3MgY2FsbGVkIHJlYWQgdHJpbW1pbmcsIG9yIGNsaXBwaW5nLCBpcyBvbmUgb2YgdGhlIGZpcnN0IHN0ZXBzIGluIGFuYWx5emluZyBOR1MgZGF0YS4gV2l0aCBtb3JlIHRoYW4gMzAgcHVibGlzaGVkIGFkYXB0ZXIgdHJpbW1pbmcgdG9vbHMgdGhlcmUgaXMgYSBtb3JlIHRoYW4gbGFyZ2UgY2hvaWNlIGZvciB0aGUgYXBwcm9wcmlhdGUgdG9vbC4gWWV0LCB0aGVyZSBpcyBhIGRlYmF0ZSB3aGV0aGVyIHRoaXMgc3RlcCByZWFsbHkgaXMgYXMgaW1wb3J0YW50IGFzIHRoZSBudW1iZXIgb2YgdG9vbHMgc3VnZ2VzdHMsIG9yIHdoZXRoZXIgaXQgaXMgcG9zc2libGUgdG8gc2tpcCB0aGlzIHRpbWUtY29uc3VtaW5nIHN0ZXAgZm9yIG1hbnkgTkdTIGFwcGxpY2F0aW9ucy4NCg0KRmluZGluZyBhbmQgcmVtb3ZpbmcgdW5pbnRlcmVzdGluZyBleHBlcmltZW50IHByb2Nlc3MtcmVsYXRlZCBmcmFnbWVudHMgbGlrZSBhZGFwdGVycyBpcyBhIGNvbW1vbiBwcm9ibGVtIGluIGdlbmV0aWMgc2VxdWVuY2luZw0KUGFpcndpc2UgU2VxdWVuY2UgQWxpZ25tZW50IGlzIHdlbGwgc3VpdGVkIHRvIGFkZHJlc3MgdGhpcyBzb3J0IG9mIGlzc3VlLCBhcyB0aGlzIHByb2JsZW0gcmVsYXRlcyB0byBzZXF1ZW5jZSBzaW1pbGFyaXR5DQpXaGVuIGFkYXB0ZXJzIGFyZSB1c2VkIHRvIGFuY2hvciBvciBleHRlbmQgYSBzZXF1ZW5jZSBkdXJpbmcgdGhlIGV4cGVyaW1lbnQgcHJvY2VzcywgdGhleSBlaXRoZXIgaW50ZW50aW9uYWxseSBvciB1bmludGVudGlvbmFsbHkgYmVjb21lIHNlcXVlbmNlZCBkdXJpbmcgdGhlIHJlYWQgcHJvY2VzcyAmIHRodXMgYXJlIHByZXNlbnQgaW4gdGhlIHNlcXVlbmNlDQpgYGB7cn0NCkROQV9BTFBIQUJFVCAjIHNob3cgZnVsbCBudWNsZW90aWRlIGFscGhhYmV0DQpOIDwtIDEwMDAgIyBudW1iZXIgb2YgZGVzaXJlZCBzZXF1ZW5jZXMNCg0KIyBzdHJpbmdzIGhhdmUgMC0zNiBjaGFyYWN0ZXJzIGZyb20gdGhlIGFkYXB0ZXJzIGF0dGFjaGVkIHRvIGVhY2ggZW5kDQphZGFwdGVyIDwtIEROQVN0cmluZygiR0FUQ0dHQUFHQUdDVENHVEFUR0NDR1RDVFRDVEdDVFRHQUFBIikNCmFkYXB0ZXINCg0Kc2V0LnNlZWQoMTIzKQ0KIyB1c2VkIGZvciBmdW5jdGlvbiBpbnB1dA0KZXhwZXJpbWVudCA8LSBsaXN0KHNpZGUgPSByYmlub20oTiwxLDAuNSksDQogICAgICAgICAgICAgICAgICAgd2lkdGggPSBzYW1wbGUoMDozNixOLHJlcGxhY2UgPSBUUlVFKSkNCmBgYA0KYGBge3J9DQojICcnJyBGdW5jdGlvbiB0byBHZW5lcmF0ZSBETkEgc2VxdWVuY2VzIC93IHRoZXNlIGZyYWdtZW50cyAnJycNCiMgVGhlIGZvbGxvd2luZyBjb2RlIHNpbXVsYXRlcyB3aGF0IHNlcXVlbmNlcyB3aXRoIGFkYXB0ZXIgZnJhZ21lbnRzIGF0IGVpdGhlciBlbmQgY291bGQgbG9vayBsaWtlIGR1cmluZyBhbiBleHBlcmltZW50DQojIGh0dHBzOi8vd3d3LmJpb2NvbmR1Y3Rvci5vcmcvcGFja2FnZXMvZGV2ZWwvYmlvYy92aWduZXR0ZXMvQmlvc3RyaW5ncy9pbnN0L2RvYy9QYWlyd2lzZUFsaWdubWVudHMucGRmDQoNCnNpbXVsYXRlUmVhZHMgPC0NCmZ1bmN0aW9uKE4sIGFkYXB0ZXIsIGV4cGVyaW1lbnQsIHN1YnN0aXR1dGlvblJhdGUgPSAwLjAxLCBnYXBSYXRlID0gMC4wMDEpIHsNCiAgICANCiAgICBjaGFycyA8LSBzdHJzcGxpdChhcy5jaGFyYWN0ZXIoYWRhcHRlciksICIiKVtbMV1dDQogICAgc2FwcGx5KHNlcV9sZW4oTiksIGZ1bmN0aW9uKGksIGV4cGVyaW1lbnQsIHN1YnN0aXR1dGlvblJhdGUsIGdhcFJhdGUpIHsNCiAgICAgICAgDQogICAgICAgIHdpZHRoIDwtIGV4cGVyaW1lbnRbWyJ3aWR0aCJdXVtpXQ0KICAgICAgICBzaWRlIDwtIGV4cGVyaW1lbnRbWyJzaWRlIl1dW2ldDQogICAgICAgIHJhbmRvbUxldHRlcnMgPC0gZnVuY3Rpb24obikgc2FtcGxlKEROQV9BTFBIQUJFVFsxOjRdLCBuLCByZXBsYWNlID0gVFJVRSkNCiAgICAgICAgDQogICAgICAgIHJhbmRvbUxldHRlcnNXaXRoRW1wdHkgPC0gZnVuY3Rpb24obikgDQogICAgICAgICAgICBzYW1wbGUoYygiIiwgRE5BX0FMUEhBQkVUWzE6NF0pLCBuLCByZXBsYWNlID0gVFJVRSwNCiAgICAgICAgICAgICAgICAgICBwcm9iID0gYygxIC0gZ2FwUmF0ZSwgcmVwKGdhcFJhdGUvNCwgNCkpKQ0KICAgICAgICANCiAgICAgICAgbkNoYXJzIDwtIGxlbmd0aChjaGFycykNCiAgICAgICAgdmFsdWUgPC0gcGFzdGUoaWZlbHNlKHJiaW5vbShuQ2hhcnMsMSxzdWJzdGl0dXRpb25SYXRlKSwgDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICByYW5kb21MZXR0ZXJzKG5DaGFycyksIGNoYXJzKSwNCiAgICAgICAgICAgICAgICAgICAgICAgcmFuZG9tTGV0dGVyc1dpdGhFbXB0eShuQ2hhcnMpLHNlcCA9ICIiLCBjb2xsYXBzZSA9ICIiKQ0KICAgICAgICBpZiAoc2lkZSkgDQogICAgICAgICAgICB2YWx1ZSA8LSBwYXN0ZShjKHJhbmRvbUxldHRlcnMoMzYgLSB3aWR0aCksIA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgICBzdWJzdHJpbmcodmFsdWUsIDEsIHdpZHRoKSksDQogICAgICAgICAgICAgICAgICAgICAgICAgICBzZXAgPSAiIiwgY29sbGFwc2UgPSAiIikNCiAgICAgICAgZWxzZQ0KICAgICAgICAgICAgdmFsdWUgPC0gcGFzdGUoYyhzdWJzdHJpbmcodmFsdWUsIDM3IC0gd2lkdGgsIDM2KSwgDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgIHJhbmRvbUxldHRlcnMoMzYgLSB3aWR0aCkpLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgc2VwID0gIiIsIGNvbGxhcHNlID0gIiIpIA0KICAgICAgICB2YWx1ZSB9LCBleHBlcmltZW50ID0gZXhwZXJpbWVudCwgc3Vic3RpdHV0aW9uUmF0ZSA9IHN1YnN0aXR1dGlvblJhdGUsIGdhcFJhdGUgPSBnYXBSYXRlKQ0KfQ0KYGBgDQoNCg0KYGBge3J9DQojIEdlbmVyYXRlIFNlcXVlbmNlcyB3LyBhZGFwdGVycyBmcm9tIHByZWRlZmluZWQgZnVuY3Rpb24NCmFkYXB0ZXJTdHJpbmdzIDwtIHNpbXVsYXRlUmVhZHMoTiwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgYWRhcHRlciwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgZXhwZXJpbWVudCwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgc3Vic3RpdHV0aW9uUmF0ZSA9IDAuMDEsIA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBnYXBSYXRlID0gMC4wMDEpDQoNCiMgMTAwMCBzZXF1ZW5jZXMgb2YgMzYgc2lnbmFsIGxlbmd0aCBpbnRlcnZhbHMNCmFkYXB0ZXJTdHJpbmdzIDwtIEROQVN0cmluZ1NldChhZGFwdGVyU3RyaW5ncykNCmFkYXB0ZXJTdHJpbmdzICMgc3RyaW5ncyB0aGF0IGNvbnRhaW4gYWRhcHRlcnMNCmBgYA0KDQpVc2luZyBjb21wbGV0ZWx5IHJhbmRvbSBzdHJpbmdzIGFzIGEgYmFzZWxpbmUgZm9yIGFueSBQU0EgbWV0aG9kb2xvZ3kgd2UgZGV2ZWxvcCB0byByZW1vdmUgdGhlIGFkYXB0ZXIgY2hhcmFjdGVycw0KU28gbGV0J3MgY3JlYXRlIHJhbmRvbWlzZWQgRE5BIHNlcXVlbmNlcyB1c2luZyB0aGUgRE5BX0FMUEhBQkVUIHVzaW5nIHNhbXBsZSgpDQoNCmBgYHtyfQ0KIyBHZW5lcmF0ZSBSYW5kb20gRE5BIHNhbXBsZXMNCg0KTSA8LSA1MDAwDQpzYW1wbGVzIDwtIHNhbXBsZShETkFfQUxQSEFCRVRbMTo0XSwgI09ubHkgNCBtYWluIG51Y2xlb3RpZGVzDQogICAgICAgICAgICAgICAgICAzNipNLA0KICAgICAgICAgICAgICAgICAgcmVwbGFjZSA9IFRSVUUpDQoNCnR5cGVvZihzYW1wbGVzKSAjY2hlY2sgdHlwZQ0KDQojZ2VuZXJhdGUgbWF0cml4IG9mIHNhbXBsZXMNCnNhbXBsZV9tYXQgPC0gbWF0cml4KHNhbXBsZXMsIG5yb3cgPSBNKQ0KdHlwZW9mKHNhbXBsZV9tYXQpDQoNCnJhbmRvbVN0cmluZ3MgPC0gYXBwbHkoc2FtcGxlX21hdCwgMSwgcGFzdGUsIGNvbGxhcHNlID0gIiIpDQoNCnJhbmRvbVN0cmluZ3M8LSBETkFTdHJpbmdTZXQocmFuZG9tU3RyaW5ncykNCnJhbmRvbVN0cmluZ3MNCmBgYA0KDQpNRVRIT0QgMQ0KRm9yIHRoZSBmaXJzdCBhcHByb2FjaCwgd2UnbGwgdXNlIGEgbWF0Y2gvbWlzbWF0Y2ggb2YgMC8tMSBmb3IgdGhlIHN1YnN0aXR1dGlvbiBtYXRyaXgNCmdhcCBvcGVuaW5nIG9mIDAgJiBnYXBFWHRlbnNpb24gb2YgMQ0KDQpgYGB7cn0NCiNTdWJzdGl0dXRpb24gTUF0cml4DQpzdWJtYXQxIDwtIG51Y2xlb3RpZGVTdWJzdGl0dXRpb25NYXRyaXgobWF0Y2ggPTAsIG1pc21hdGNoID0gLTEsIGJhc2VPbmx5ID0gDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBUUlVFKQ0KIyBhZGFwdGVyIHN0cmluZ3MgRE5BICYgYWRhcHRlciAoMC0zNiBjaGFyYWN0ZXJzIGF0dGFjaGVkIHRvIGVpdGhlciBlbmQpDQojIHNob3VsZCBoYXZlIGhpZ2hlciBoaXQgcmF0ZSANCg0KYWRhcHRlckFsaWduczEgPC0gcGFpcndpc2VBbGlnbm1lbnQoYWRhcHRlclN0cmluZ3MsDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBhZGFwdGVyLCANCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIHN1YnN0aXR1dGlvbk1hdHJpeCA9IHN1Ym1hdDEsDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBnYXBPcGVuaW5nID0gMCwgZ2FwRXh0ZW5zaW9uID0gMSkNCg0KYWRhcHRlckFsaWduczEgIyBQYWlyd2lzZUFsaWdubWVudHNTaW5nbGVTdWJqZWN0IChjb250YWlucyBtdWx0aXBsZSBQU0EpXQ0KYWRhcHRlckFsaWduczFfc2NvcmUgPC0gc2NvcmUoYWRhcHRlckFsaWduczEpDQoNCg0KYGBgDQpgYGB7cn0NCiMgcmFuZG9tIEROQSAmIGFkYXB0ZXIgKGJhc2VsaW5lIGZvciBjb21wYXJpc29uIG9ubHkpDQpyYW5kb21TY29yZXMxIDwtIHBhaXJ3aXNlQWxpZ25tZW50KHJhbmRvbVN0cmluZ3MsDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIGFkYXB0ZXIsIA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBzdWJzdGl0dXRpb25NYXRyaXggPSBzdWJtYXQxLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBnYXBPcGVuaW5nID0gMCwgZ2FwRXh0ZW5zaW9uID0gMSwNCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgc2NvcmVPbmx5ID0gVFJVRSkgIyBnZXQgdGhlIGZpbmFsIGFsaWdubWVudCBzY29yZSBvbmx5DQpgYGANCg0KDQpgYGB7cn0NCiMgc2hvdyB0aGUgcXVhbnRpbGUgZGF0YSA5OSUrIHNjb3JlDQpxdWFudGlsZShyYW5kb21TY29yZXMxLCBzZXEoMC45OSwxLDAuMDAxKSkNCmBgYA0KYGBge3J9DQojIGZpbmQgcGxhY2VzIHdoZXJlIHRoZSBhZGFwdGVyIHNjb3JlcyBhcmUgaGlnaGVyIHRoYW4gaW4gYmFzZWxpbmUgKHVzaW5nIG9ubHUgOTkuOSUgcXVhcnRpbGUgZGF0YSBvbmx5KSANCiMgMjl0aCBjaGFyYWN0ZXIgKz0gDQp0YWJsZShhZGFwdGVyQWxpZ25zMV9zY29yZSA+IHF1YW50aWxlKHJhbmRvbVNjb3JlczEsMC45OTkpLCBleHBlcmltZW50W1sid2lkdGgiXV0pDQpgYGANCg0KMyB8IEFMSUdOTUVOVCBPQkpFQ1RTDQpRdWl0ZSBhIG51bWJlciBvZiBhcHBsaWNhdGlvbiBpbiBCaW9pbmZvcm1hdGljcyBpbnZvbHZlIHRoZSB1c2Ugb2YgYmlvbG9naWNhbCBzZXF1ZW5jZSBhbGlnbm1lbnQNCldlIGNhbiByZWFkIGFuIGFsaWdubWVudCBmaWxlIHVzaW5nIHJlYWRETkFNdWx0aXBsZUFsaWdubWVudChmaWxlcGF0aCksIGV4YW1wbGVzIHNob3duIGJlbG93DQpNYXNraW5nIGlzIGFsc28gdXNlZCBmb3IgdmFyaW91cyBvcGVyYXRpb25zIHN1cnJvdW5kaW5nIHNlcXVlbmNlIGFsaWdubWVudHMsIGluIHBhcnRpY3VsYXIgd2hlbiB3ZSBoYXZlIGxvdHMgb2YgZ2FwcyBpbiBvdXIgYWxpZ25tZW50cyAmIHdhbnQgdG8gcmVtb3ZlIHRoZW0gYmVmb3JlIHVzaW5nIHRoZSBkYXRhIGZvciBhbmFseXNpcw0KMy4xIHwgSU8gQUxJR05NRU5UDQoNClJFQUQgQUxJR05NRU5UDQpSZWFkIEFsaWdubWVudCB8IFR3byBmb3JtYXRzIHVzZWQgZm9yIGFsaWdubWVudDogY2x1c3RhbCwgcGh5bGlwDQoNCg0KYGBge3J9DQojIFsxXSByZWFkIGNsdXN0YXcgZm9ybWF0ICguYWxuKQ0Kb3JpZ01BbGlnbiA8LSByZWFkRE5BTXVsdGlwbGVBbGlnbm1lbnQoZmlsZXBhdGggPSBzeXN0ZW0uZmlsZSgiZXh0ZGF0YSIsIm1zeDJfbVJOQS5hbG4iLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBwYWNrYWdlPSJCaW9zdHJpbmdzIiksDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIGZvcm1hdD0iY2x1c3RhbCIpDQojIFsxXSByZWFkIHBoeWxpcCBmb3JtYXQgKC50eHQpDQpwaHlsaXBNQWxpZ24gPC0gcmVhZEFBTXVsdGlwbGVBbGlnbm1lbnQoZmlsZXBhdGggPSBzeXN0ZW0uZmlsZSgiZXh0ZGF0YSIsIlBoeWxpcC50eHQiLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgcGFja2FnZT0iQmlvc3RyaW5ncyIpLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgZm9ybWF0PSJwaHlsaXAiKQ0KYGBgDQoNCg0KV1JJVElORyBBTElHTk1FTlQgVE8gRklMRQ0KV2UgY2FuIHdyaXRlIGFsaWdubWVudHMgdXNpbmcgdHdvIGRpZmZlcmVudCBmb3JtYXRzOyBGQVNUQSAmIFBoeWxpcCBmb3JtYXRzDQoNCmBgYHtyfQ0Kb3JpZ01BbGlnbg0KYGBgDQoNCmBgYHtyfQ0KRE5BU3RyID0gYXMob3JpZ01BbGlnbiwgIkROQVN0cmluZ1NldCIpICNjaGFuZ2UgRE5BTXVsdGlwbGVBbGlnbm1lbnQgLT5ETkFTdHJpbmdzZXQNCg0KI1dyaXRlIHRvIGZpbGVzDQp3cml0ZVhTdHJpbmdTZXQoRE5BU3RyLCBmaWxlPSJETkFTdHIuZmFzdGEiICkgI3dyaXRlIGluIGZhc3RhIGZvcm1hdA0KDQp3cml0ZS5waHlsaXAocGh5bGlwTUFsaWduLCBmaWxlcGF0aCA9ICJwaHlsaXBNYWxpZ24udHh0IikgI3dyaXRlIGluIFBoeWxpcCBmb3JtYXQNCmBgYA0KDQpESVNQTEFZIEFMSUdOTUVOVA0KV2UgY2FuIGRpc3BsYXkgdGhlIGFsaWdubWVudCB2aWEgdGhlIG9iamVjdCBpbnN0YW5jZSAmIHRoZSBnZXQgdGhlIGNvcnJlc3BvbmRpbmcgaW5kaXZpZHVhbCBhbGlnbm1lbnQgbmFtZSB1c2luZyByb3duYW1lcw0KDQpgYGB7cn0NCiNEaXNwbGF5IGFuIGFsaWdubWVudA0Kb3JpZ01BbGlnbg0KYGBgDQoNCmBgYHtyfQ0KI2Rpc3BsYXkgYWxpZ25tZW50DQpwaHlsaXBNQWxpZ24NCmBgYA0KDQpgYGB7cn0NCnJvd25hbWVzIChvcmlnTUFsaWduKSAjc2hvdyBhbGwNCnJvd25hbWVzKG9yaWdNQWxpZ24pWzFdICAjc2hvdyBqdXN0IHRoZSBvbmUNCmBgYA0KQ0hBTkdFIEFMSUdOTUVOVCBOQU1FUw0KU2V0IEFsaWdubWVudCBOYW1lcyB8IHJvd25hbWVzKGFsbikgLSBSZXBsYWNlIGFsaWdubWVudCBuYW1lcyBpZiB3ZSBuZWVkIHRvIG1ha2UgaXQgbW9yZSBjbGVhciBmb3IgaW50ZXJwcmV0YXRpb24NCg0KYGBge3J9DQojIFszXSBNYWtlIG91ciBvd24gbGlzdCBvZiBuYW1lcyAmIGFzc2lnbiBpdCB0byBhbGlnbm1lbnQgcm93bmFtZXMNCiMgVGhlc2UgbmFtZXMgYXJlIG1vcmUgYXJlIG1vcmUgZWFzaWx5IGludGVycHJldGFibGUNCnJvd25hbWVzKG9yaWdNQWxpZ24pIDwtIGMoIkh1bWFuIiwiQ2hpbXAiLCJDb3ciLCJNb3VzZSIsIlJhdCIsIkRvZyIsIkNoaWNrZW4iLCJTYWxtb24iKSAjIGNvbmNhdCBjaGFyYWN0ZXJzDQpvcmlnTUFsaWduDQpgYGANCg0KU0hPVyBERVRBSUxFRCBBTElHTk1FTlQNClNob3cgZW50aXJlIGFsaWdubWVudCB8IGRldGFpbChhbG4pIC0gY2FuIGJlIHVzZWQgdG8gZGlzcGxheSB0aGUgZW50aXJlIHNlcXVlbmNlIGFsaWdubWVudA0KYGBge3J9DQojIFs0XSBEZXRhaWwgcHJvdmlkZXMgYSB2aWV3IGZvciBhbGwgb2YgdGhlIGFsaWdubWVudA0KIyBkZXRhaWwob3JpZ01BbGlnbikNCmBgYA0KDQozLjIgfCBBTElHTk1FTlQgTUFTS0lORw0KDQpXZSdsbCBsb29rIGF0IHNldmVyYWwgdHlwZXMgb2YgYWxpZ25tZW50IG1hc2tpbmc7IGJhc2ljIG1hc2tpbmcsIG1vdGlmIG1hc2tpbmcgJiBnYXAgbWFza2luZw0KDQpCQVNJQyBNQVNLSU5HDQpIaWRpbmcgUm93cyB8IHJvd21hc2soYWxuKSAtIHVzZWQgZm9yIGhpZGluZyBzb21lIG9mIHRoZSByb3cgY29udGVudCBpbiBhbiBhbGlnbm1lbnQNCkhpZGluZyBDb2x1bW5zIHwgY29sbWFzayhhbG4pIC0gdXNlZCBmb3IgaGlkaW5nIHNvbWUgb2YgdGhlIGNvbHVtbiBjb250ZW50IGluIGFuIGFsaWdubWVudA0KDQpgYGB7cn0NCiMgWzVdIFdlIGNhbiBzZXQgcm93bWFzayB3LyBJUmFuZ2VzIHRvIGhpZGUgc29tZSByb3dzIGluIGFsaWdubWVudA0KIyBsZXQncyBtYXNrIHRoZSBmaXJzdCB0aHJlZSByb3dzDQoNClRlc3QgPC0gb3JpZ01BbGlnbg0Kcm93bWFzayhUZXN0KSA8LSBJUmFuZ2VzKHN0YXJ0PTEsZW5kPTMpICMgc2V0IGludCByYW5nZSBmdW5jdGlvbg0KVGVzdA0KDQojIHJlbW92ZSByb3dtYXNrDQpyb3dtYXNrKFRlc3QpIDwtIE5VTEwNCmBgYA0KDQpgYGB7cn0NCiMgWzZdIFdlIGNhbiBhbHNvIHVzZSBjb2x1bW4gbWFza2luZw0KIyBjb25jYXQgY2FuIGJlIHVzZWQgdG8gc2VsZWN0IG11bHRpcGxlIGxvY2F0aW9ucw0KIyBsZXQncyBtYXNrIHRoZSBjb2x1bW5zIC0+IDEtNTAwICYgMTAwMC0yMzQzDQoNClRlc3QgPC0gb3JpZ01BbGlnbg0KY29sbWFzayhUZXN0KSA8LSBJUmFuZ2VzKDIsNCkNCmNvbG1hc2soVGVzdCkgPC0gSVJhbmdlcyg2LDgpICMgWW91IGNhbiBhZGQgbXVsdGlwbGUgbWFza3MgYXMgd2VsbA0KVGVzdA0KDQojIHJlbW92ZSBjb2x1bW4gbWFzaw0KY29sbWFzayhUZXN0KSA8LSBOVUxMDQpgYGANCg0KDQpNT1RJRiBNQVNLSU5HDQpNYXNraW5nIHdpdGggTW90aWZzIHwgVXNlZnVsIGZvciBtYXNraW5nIHN1YnNlcXVlbmNlIG9jY3VyZW5jZXMgb2YgYSBzdHJpbmcgZnJvbSBjb2x1bW5zIHdoZXJlIGl0IGlzIHByZXNlbnQgaW4gdGhlIGNvbnNlbnN1cyBzZXF1ZW5jZQ0KDQpgYGB7cn0NCm9yaWdNQWxpZ24NCmBgYA0KDQpgYGB7cn0NCiNhIG1hc2sgd2FzIGZvdW5kIEAxMjMyIC0gMTIzNiBvZiBmaXJzdCByb3cNCg0KdGF0YV9tYXNrIDwtIG1hc2tNb3RpZihvcmlnTUFsaWduLCAiQUFBQSIpDQpjb2xtYXNrKHRhdGFfbWFzaykNCmBgYA0KDQpHQVAgTUFTS0lORw0KTWFza2luZyBhbGlnbm1lbnRzIHdpdGggZ2FwcyB8IFVzZWZ1bCBmb3Igd2hlbiB3ZSBuZWVkIHRvIG1hc2sgZ2FwcyB0aGF0IGFyZSBwcmVzZW50IGluIHRoZSBhbGlnbm1lbnQNCg0KTWFza0dhcHMgYWxzbyBvcGVyYXRlIG9uIGNvbHVtbnMgJiB3aWxsIG1hc2sgY29sdW1ucyBiYXNlZCBvbiB0aGUgZnJhY3Rpb24gb2YgZWFjaCBjb2x1bW4gdGhhdCBjb250YWlucyBnYXBzOw0KbWluLmZyYWN0aW9uIGFsb25nIHdpdGggdGhlIHdpZHRoIG9mIGNvbHVtbnMgdGhhdCBjb250YWluIHRoaXMgZnJhY3Rpb24gb2YgZ2FwcyBtaW4uYmxvY2sud2lkdGgNCg0KYGBge3J9DQphdXRvTWFza2VkIDwtIG1hc2tHYXBzKG9yaWdNQWxpZ24sIG1pbi5mcmFjdGlvbiA9IDAuNSwgbWluLmJsb2NrLndpZHRoID00KQ0KDQphdXRvTWFza2VkDQpgYGANCg0KYGBge3J9DQojIE11bHRpcGxlIHNlcXVlbmNlIGFsaWdubWVudCBpbiBtYXRyaXggZm9ybWF0DQpmdWxsID0gYXMubWF0cml4KG9yaWdNQWxpZ24pDQpkaW0oZnVsbCkNCmBgYA0KMy4zIHwgQUxJR05NRU5UIE1BU0tJTkcgQVBQTElDQVRJT05TDQoNCkFMUEhBQkVUIEZSRVFVRU5DWSB3LyBNQVNLSU5HDQpIYXZpbmcgY3JlYXRlZCBtYXNrcyBmb3IgcGFydHMgb2YgdGhlIGFsaWdubWVudCB3aGljaCBpcyBvZiBpbnRlcmVzdCB0byB1cywgd2UgY2FuIGNvbmR1Y3Qgc29tZSBmb3JtIG9mIGludmVzdGlnYXRpb24NCldoZW4gdXNpbmcgbWFza3MsIG9wZXJhdGlvbnMgd2lsbCBvbmx5IGluY2x1ZGUgdGhlIG5vbiBtYXNrZWQgc2VxdWVuY2UgY2hhcmFjdGVycywgZWcuIGFscGhhYmV0RnJlcXVlbmN5Lg0KDQpgYGB7cn0NCiNpZiB3ZSBtYXNrIHRoZSBlbnRpcmUgcm93LCB3ZSBnZXQgTkENClRlc3QgPC0gb3JpZ01BbGlnbg0KDQpyb3dtYXNrKFRlc3QpIDwtIElSYW5nZXMoc3RhcnQgPSAxLCBlbmQgPSAzKSAjc2V0IGludCByYW5nZSBmdW5jdGlvbg0KDQphbHBoYWJldEZyZXF1ZW5jeShUZXN0KQ0KYGBgDQoNCmBgYHtyfQ0KIyBbMV0gSWYgd2UgbWFza2VkIG9ubHkgcGFydHMgb2YgdGhlIHJvdyBjb250ZW50LCB3ZSdsbCBnZXQgZnJlcSBvZiBvbmx5IHRob3NlIHRoYXQgYXJlbid0IG1hc2tlZA0KYXV0b01hc2tlZCA8LSBtYXNrR2FwcyhvcmlnTUFsaWduLA0KICAgICAgICAgICAgICAgICAgICAgICBtaW4uZnJhY3Rpb249MC41LA0KICAgICAgICAgICAgICAgICAgICAgICBtaW4uYmxvY2sud2lkdGg9NCkNCmFscGhhYmV0RnJlcXVlbmN5KGF1dG9NYXNrZWQpDQpgYGANCg0KDQpTRVFVRU5DRSBTRVQgQ0xVU1RFUklORyB3LyBNQVNLSU5HDQpXZSBjYW4gYWxzbyBjbHVzdGVyIHRoZSBhbGlnbm1lbnRzIGluIGEgU3RyaW5nU2V0IGJhc2VkIG9uIHRoZWlyIGRpc3RhbmNlIChzdHJpbmdEaXN0KSB0byBlYWNoIG90aGVyIHwgaGNsdXN0DQpQYXNzaW5nIGEgRE5BU3RyaW5nU2V0LCB0aGUgY2x1c3RlcmluZyB3aWxsIGFsc28gdGFrZSBpbnRvIGFjY291bnQgb25seSB0aG9zZSBhbHBoYWJldCBpbiB0aGUgY3JlYXRlZCBtYXNraW5nIHwgU3RyaW5nIERpc3RhbmNlICYgQ2x1c3RlcmluZyBWaWRlbw0KSGVyZSB3ZSdsbCBsb29rIGF0IHR3byBjYXNlcywgdW5tYXNrZWQgYWxpZ25tZW50cyAmIG1hc2tlZCBhbGdpbm1lbnRzLCB0aGUgYmVuZWZpdCBvZiBtYXNraW5nIGJlaW5nIHRoYXQgdGhlIGFsaWdubWVudHMgY29udGFpbiBsb3RzIG9mIGdhcHMgKG9yaWdNQWxpZ24pDQoNCmBgYHtyfQ0KIyAnJycgQmFkIENsdXN0ZXIgQ2FzZSAnJycNCg0KIyBDYWxjdWxhdGUgdGhlIGRpc3RhbmNlIHRvIGVhY2hvdGhlciAoYWxpZ25tZW50cykNCg0Kc3RyX3NldCA8LSBhcyhvcmlnTUFsaWduLCAiRE5BU3RyaW5nU2V0IikgI2NvbnZlcnQvdXNlIGFsaWdubWVudCB0by9hcyBzdHJpbmcgc2V0DQoNCmNsYXNzKHN0cl9zZXQpICNETkFTdHJpbmdTZXQNCnN0cl9zZXQgI3RoZSBzdHJpbmdzZXQgb25seSBjb250YWlucyB0aG9zZSBwcmVzZW50IGluIHRoZSBtYXNrDQoNCiNDYWxjdWxhdGUgRGlzdGFuY2UNCnNkaXN0IDwtIHN0cmluZ0Rpc3Qoc3RyX3NldCwgbWV0aG9kID0gJ2hhbW1pbmcnKQ0KDQpzZGlzdA0KDQojIGNsdXN0ZXIgdXNpbmcgSGllcmFyY2hpY2FsIGNsdXN0ZXJpbmcsIGhjbHVzdA0KY2x1c3QgPC0gaGNsdXN0KHNkaXN0LA0KICAgICAgICAgICAgICAgIG1ldGhvZCA9ICJzaW5nbGUiKQ0KY2x1c3QNCg0KcGRmKGZpbGU9InRyZWUxLnBkZiIpICMgcGxvdCB0aGUgY2x1c3RlcmluZw0KcGxvdChjbHVzdCkgIyBwbG90IGRlbmRvZ3JhbSBvZiB0aGUgY2x1c3RlcmluZw0KZGV2Lm9mZigpDQoNCiMgQ3V0IHRoZSB0cmVlIGludG8gZm91ciBncm91cHMNCmZvdXJncm91cHMgPC0gY3V0cmVlKGNsdXN0LCA0KQ0KZm91cmdyb3Vwcw0KYGBgDQoNCmBgYHtyfQ0KIyAnJycgQmV0dGVyIENsdXN0ZXIgQ2FzZSAnJycNCg0KIyBzdXBwb3NlIHdlIGhhdmUgY3JlYXRlZCBzb21lIG1hc2sgZm9yIG91ciBhbGlnbm1lbnQNCmF1dG9NYXNrZWQgDQoNCiMgQ2FsY3VsYXRlIHRoZSBkaXN0YW5jZSB0byBlYWNob3RoZXIgKGFsaWdubWVudHMpDQpjbGFzcyhhdXRvTWFza2VkKSAjIEROQU11bHRpcGxlQWxpZ25tZW50IGNsYXNzDQpzdHJfc2V0IDwtIGFzKGF1dG9NYXNrZWQsIkROQVN0cmluZ1NldCIpICMgY29udmVydC91c2UgYWxpZ25tZW50IHRvL2FzIHN0cmluZyBzZXQNCmNsYXNzKHN0cl9zZXQpICMgRE5BU3RyaW5nU2V0DQpzdHJfc2V0ICMgdGhlIHN0cmluZ3NldCBvbmx5IGNvbnRhaW5zIHRob3NlIHByZXNlbnQgaW4gdGhlIG1hc2sNCg0KIyBDYWxjdWxhdGUgZGlzdGFuY2UNCnNkaXN0IDwtIHN0cmluZ0Rpc3Qoc3RyX3NldCwNCiAgICAgICAgICAgICAgICAgICAgbWV0aG9kPSJoYW1taW5nIikNCnNkaXN0DQoNCiMgY2x1c3RlciB1c2luZyBIaWVyYXJjaGljYWwgY2x1c3RlcmluZywgaGNsdXN0DQpjbHVzdCA8LSBoY2x1c3Qoc2Rpc3QsDQogICAgICAgICAgICAgICAgbWV0aG9kID0gInNpbmdsZSIpDQpjbHVzdA0KDQpwZGYoZmlsZT0idHJlZTIucGRmIikgIyBwbG90IHRoZSBjbHVzdGVyaW5nDQpwbG90KGNsdXN0KSAjIHBsb3QgZGVuZG9ncmFtIG9mIHRoZSBjbHVzdGVyaW5nDQpkZXYub2ZmKCkNCg0KIyBDdXQgdGhlIHRyZWUgaW50byBmb3VyIGdyb3Vwcw0KZm91cmdyb3VwcyA8LSBjdXRyZWUoY2x1c3QsIDQpDQpmb3VyZ3JvdXBzDQoNCmBgYA0KDQpCSU9DT05EVUNUT1IgOjogbXNhDQpUaGUgbWV0aG9kIHVzZWQgaW4gYmlvbG9naWNhbCBzZXF1ZW5jZSBhbGlnbm1lbnQgY2FuJ3QgaGFuZGxlIGxvdHMgb2YgYWxpZ25tZW50cyBkZXNjcmliZWQgaW4gc25pcHBsZXQ6DQpNb3N0IGFsaWdubWVudHMgYXJlIGNvbXB1dGVkIHVzaW5nIHRoZSBwcm9ncmVzc2l2ZSBhbGlnbm1lbnQgaGV1cmlzdGljDQpUaGVzZSBtZXRob2RzIGFyZSBzdGFydGluZyB0byBiZWNvbWUgYSBib3R0bGVuZWNrIGluIHNvbWUgYW5hbHlzaXMgcGlwZWxpbmVzIHdoZW4gZmFjZWQgd2l0aCBkYXRhIHNldHMgb2YgdGhlIHNpemUgb2YgbWFueSB0aG91c2FuZHMgb2Ygc2VxdWVuY2VzDQpDTFVTVEFMVywgQ0xVU1RBTE9NRUdBLCBNVVNDTEUgYXJlIGFsbCBtb3JlIGFkdmFuY2VkIG1ldGhvZHMgb2YgbXVsdGlwbGUgc2VxdWVuY2UgYWxpZ25tZW50LCB2YXJ5aW5nIGluIGFsZ29yaXRobSwgYnV0IGFjaGlldmluZyB0aGUgc2FtZSBnb2FsDQpTbyBmb3IgcmVhbGlzdGljIHByb2JsZW1zLCB3ZSBtYXkgaGF2ZSB0byBjb21wYXJlIGxvdHMgb2Ygc2VxdWVuY2VzIHRvZ3RoZXIsIHRodXMgdGhlIGFib3ZlIHRocmVlIGFsZ29yaXRobXMgYXJlIG1vcmUgcHJlZmVyYWJsZSwgdG8ga2VlcCBjb21wdXRhdGlvbmFsIGNvc3QgbG93DQpVcG9uIG1zYSwgd2UgZ2V0IE1zYUFBTXVsdGlwbGVBbGlnbm1lbnQgb2JqZWN0cywgd2hpY2ggd2UgYWxyZWFkeSB1c2VkIGluIFNlY3Rpb24gMzsgdGhlIHNhbWUgYWxpZ25tZW50IHJlbGF0ZWQgb3BlcmF0aW9ucyB1c2VkIGluIEJpb3N0cmluZ3MgY2FuIGJlIHVzZWQgKGVnLiBtYXNraW5nKQ0KDQpgYGB7cn0NCnN1cHByZXNzUGFja2FnZVN0YXJ0dXBNZXNzYWdlcyhsaWJyYXJ5KG1zYSkpDQpgYGANCg0KYGBge3J9DQojIExvYWQgRXhhbXBsZSBGaWxlDQpteVNlcXVlbmNlRmlsZSA8LSBzeXN0ZW0uZmlsZSgiZXhhbXBsZXMiLA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgImV4YW1wbGVBQS5mYXN0YSIsDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICBwYWNrYWdlPSJtc2EiKQ0KDQojIFJlYWQgQW1pbm8gYWNpZCBzdHJpbmcgc2V0DQpteVNlcXVlbmNlcyA8LSByZWFkQUFTdHJpbmdTZXQobXlTZXF1ZW5jZUZpbGUpICMgcmVhZCBzdHJpbmdzZXQgKHNhbWUgYXMgYmlvc3RyaW5ncyBsaWJyYXJ5KQ0KbXlTZXF1ZW5jZXMNCmBgYA0KDQpgYGB7cn0NCiNNdWx0aXBsZSBTZXF1ZW5jZSBBbGlnbm1lbnQNCmFsbiA8LSBtc2EobXlTZXF1ZW5jZXMpICNDbHVzdGFsVyB1c2VkIGJ5IGRlZmF1bHQNCg0KI3NhbWUgbWFza2luZyB1c2VkIGluIGJpb3N0cmluZ3MgY2FuIGJlIHVzZWQNCg0Kcm93bWFzayhhbG4sIGludmVydD0gVFJVRSkgPC0gSVJhbmdlcyhzdGFydCA9IDEsIGVuZCA9IDMpDQojcHJpbnQgKGFsbiwgc2hvdz0gImNvbXBsZXRlIikgI3Nob3cgZnVsbCBhbGlnbm1lbnQNCg0KcHJpbnQoYWxuKQ0KYGBgDQoNCmBgYHtyfQ0KI01TQSBhcHByb2FjaCBvcHRpb25zDQpteUNsdXN0YWxXQWxpZ25tZW50IDwtIG1zYShteVNlcXVlbmNlcywgIkNsdXN0YWxXIikNCm15Q2x1c3RhbE9tZWdhQWxpZ25tZW50IDwtIG1zYShteVNlcXVlbmNlcywgIkNsdXN0YWxPbWVnYSIpDQpteU11c2NsZUFsaWdubWVudCA8LSBtc2EobXlTZXF1ZW5jZXMsICJNdXNjbGUiKQ0KDQpgYGANCg0KYGBge3J9DQojIHVzaW5nIGFzKCkgdG8gY2hhbmdlIG1zYSBhbGlnbm1lbnQgdHlwZSB0byBTdHJpbmdTZXQNCkFBU3RyID0gYXMobXlNdXNjbGVBbGlnbm1lbnQsICJBQVN0cmluZ1NldCIpICMgb3V0cHV0IGFzIFN0cmluZyBTZXQNCndyaXRlWFN0cmluZ1NldChBQVN0ciwgZmlsZT0iQUFTdHIuZmFzdGEiKSAjIHdyaXRlIGluIEZBU1RBIGZvcm1hdA0KYGBgDQoNCg0KUHJvamVjdCBGaWxlcyAmIHRlbXBsYXRlIGZyb20gQW5kcmV5IFNodHJhdXNzIA0KDQoNCg0K