Laboratorio 9.6: Support Vector Machines

Paula Cazali

Fiabilidad

Se usará la librería e1071 para demostrar los vectores de clasificación y y SVM.

9.6.1 Support Vector Classifier

La función svm() puede ser usada para crear un modelo de clasificación con vectores de soporte cuando el parámetro kernel = 'lienar'. Esta función usa diferentes formulaciones de ciertas ecuaciones.

También se usa la función svm() para crear un support vector classifier para la función dada por el parámetro costo. Se comenzará generando las observaciones que perteneces a dos clases.

set.seed(1)
x <- matrix(rnorm(20*2), ncol = 2)
y <- c(rep(-1,10), rep(1,10))
x[y == 1] <- x[y == 1,] + 1

Se comienza verificando cuales clases son linealmente separables

plot(x, col = (3-y))

Las clases no son separables. Por lo tanto se usara support vector classifier. Ahora se crea un data frame con la respuesta como factor.

dat <- data.frame(x = x, y = as.factor(y))
library(e1071)
svmfit <- svm(y ~ ., data = dat, kernel = "linear", cost = 10, scale = FALSE)

El parámetro scale = FALSE indica a la función svm() que no escale cada variable para que tengan media igual a cero o desviación estandar igual a \(1\), dependiendo de la aplicación este parámetro puede tener TRUE o FALSE. Ahora se puede obtener el support vector classifier obtenido:

plot (svmfit, dat)

Notar que los dos argumentos graficar el SVM, es la salida de la función svm(). El límite entre las dos clases es lineal ya que se uso el argumento kernel = "linear".

svmfit$index

[1]  1  2  5  7 14 16 17

Se puede obtener información basica de la regresión del support vector classifier usando summary():

summary(svmfit)


Call:
svm(formula = y ~ ., data = dat, kernel = "linear", 
    cost = 10, scale = FALSE)


Parameters:
   SVM-Type:  C-classification 
 SVM-Kernel:  linear 
       cost:  10 
      gamma:  0.5 

Number of Support Vectors:  7

 ( 4 3 )


Number of Classes:  2 

Levels: 
 -1 1

Esto nos dice que un kernel lineal fue usado con cost = 10 y que hay siete support vectors, tres en una clase y cuatro en la otra. Que pasa si usamos un valor más pequeño para el parámetro cost:

svmfit <- svm(y ~ ., data = dat, kernel = "linear", cost = 0.1, scale = FALSE)
plot(svmfit, dat)

svmfit$index

 [1]  1  2  3  4  5  7  9 10 12 13 14 15 16 17 18 20

Mientras se usa un valor más pequeño para ese parámetro, se obtiene un número mayor de support vectors, ya que el margen es más amplio. La función tune() crea \(10\) folds para realizar cross-validation en un set de modelos de interes.

set.seed(1)
tune.out <- tune(svm, y~ ., data = dat, kernel = "linear", ranges = list(cost = c(0.001, 0.01, 1, 5, 10, 100)))

Ahora se puede acceder a los errores de cross-validation para cada uno de esos modelos usando summary():

summary(tune.out)


Parameter tuning of ‘svm’:

- sampling method: 10-fold cross validation 

- best parameters:
 cost
    1

- best performance: 0.15 

- Detailed performance results:
   cost error dispersion
1 1e-03  0.70  0.4216370
2 1e-02  0.70  0.4216370
3 1e+00  0.15  0.2415229
4 5e+00  0.15  0.2415229
5 1e+01  0.15  0.2415229
6 1e+02  0.15  0.2415229

Ahora se puede ver que al utilizar cost = 0.1 se obtiene el error más pequeño de cross-validation. Por lo tanto la función tune() puede obtener el mejor modelo, al cual se puede acceder:

bestmod <- tune.out$best.model
summary(bestmod)


Call:
best.tune(method = svm, train.x = y ~ ., data = dat, 
    ranges = list(cost = c(0.001, 0.01, 1, 5, 10, 
        100)), kernel = "linear")


Parameters:
   SVM-Type:  C-classification 
 SVM-Kernel:  linear 
       cost:  1 
      gamma:  0.5 

Number of Support Vectors:  11

 ( 6 5 )


Number of Classes:  2 

Levels: 
 -1 1

Usando la función predict() se puede predecir la etiqueta de la clase en un set de observaciones de prueba. Se generará un test:

xtest <- matrix(rnorm(20*2), ncol = 2)
ytest <- sample(c(-1,1), 20, rep = TRUE)
xtest[ytest == 1,] <- xtest[ytest == 1,] + 1
testdat <- data.frame(x = xtest, y = as.factor(ytest))
ypred <- predict(bestmod, testdat)
table(predict = ypred, truth = testdat$y)

       truth
predict -1  1
     -1 11  1
     1   0  8

Por lo que usando ese valor para el parámetro cost se pueden clasificar \(19\) observaciones de manera correcta. Qué hubiera pasado si se usara ahora \(cost = 0.01\)

svmfit <- svm(y ~ ., data = dat, kernel = "linear", cost = 0.01, scale = FALSE)
ypred <- predict(svmfit, testdat)
table(predict = ypred, truth = testdat$y)

       truth
predict -1  1
     -1 11  2
     1   0  7

En este caso una observación se pierde. Ahora considerando que dos clases son linealmente separables. Ahora se crearan dos clases que serán linealmente separables:

x[y == 1,] <- x[y == 1,] + 0.5
plot(x, col = (y + 5)/2, pch = 19)

Ahora las observaciones son casi separables linealmente.

dat <- data.frame(x = x, y = as.factor(y))
svmfit <- svm(y ~ ., data=dat, kernel ="linear", cost =1e+05)
summary(svmfit)


Call:
svm(formula = y ~ ., data = dat, kernel = "linear", 
    cost = 1e+05)


Parameters:
   SVM-Type:  C-classification 
 SVM-Kernel:  linear 
       cost:  1e+05 
      gamma:  0.5 

Number of Support Vectors:  3

 ( 1 2 )


Number of Classes:  2 

Levels: 
 -1 1

Ahora con un menor valor para cost:

svmfit <- svm(y ~ ., data = dat, kernel = "linear", cost = 1)
summary(svmfit)


Call:
svm(formula = y ~ ., data = dat, kernel = "linear", 
    cost = 1)


Parameters:
   SVM-Type:  C-classification 
 SVM-Kernel:  linear 
       cost:  1 
      gamma:  0.5 

Number of Support Vectors:  7

 ( 4 3 )


Number of Classes:  2 

Levels: 
 -1 1

plot(svmfit, dat)

9.6.2 Support Vector Machine

Para usar un kernel que no sea lineal también se usa la función svm() solo que ahora se usa un valor diferente para el parámetro kernel. Para un SVM polinomial usamos kernel = "polynomial" y para un kernel radial kernel = "radial", con el parámetro degree se especifica el grado para el kernel. Se genera data para aplicar un limite no lineal:

set.seed(1)
x <- matrix(rnorm(200*2), ncol = 2)
x[1:100 ,] <- x[1:100,] + 2
x[101:150,] <- x[101:150,] -2
y <- c(rep(1, 150), rep(2, 50))
dat <- data.frame(x = x, y = as.factor(y))

Graficamos:

plot(x, col = y)

Se separará la data en test y train:

train <- sample(200, 100)
svmfit <- svm(y ~ ., data = dat[train,], kernel = "radial", gamma = 1, cost = 1)
plot(svmfit, dat[train,])

La grafica muestra el limite no lineal creado.

summary(svmfit)


Call:
svm(formula = y ~ ., data = dat[train, ], kernel = "radial", 
    gamma = 1, cost = 1)


Parameters:
   SVM-Type:  C-classification 
 SVM-Kernel:  radial 
       cost:  1 
      gamma:  1 

Number of Support Vectors:  37

 ( 17 20 )


Number of Classes:  2 

Levels: 
 1 2

Si se incrementa el valor para cost se pueden reducir el número de errores de training.

svmfit <- svm(y ~ ., data = dat[train,], kernel = "radial", gamma = 1, cost = 1e5)
plot(svmfit, dat[train,])

También se puede hacer cross-validation usando la función tune():

set.seed(1)
tune.out <- tune(svm, y ~ ., data = dat[train,], kernel = "radial", ranges = list(cost = c(0.1, 1, 10, 100, 1000), gamma = c(0.5,1,2,3,4)))
summary(tune.out)


Parameter tuning of ‘svm’:

- sampling method: 10-fold cross validation 

- best parameters:
 cost gamma
    1     2

- best performance: 0.12 

- Detailed performance results:
    cost gamma error dispersion
1  1e-01   0.5  0.27 0.11595018
2  1e+00   0.5  0.13 0.08232726
3  1e+01   0.5  0.15 0.07071068
4  1e+02   0.5  0.17 0.08232726
5  1e+03   0.5  0.21 0.09944289
6  1e-01   1.0  0.25 0.13540064
7  1e+00   1.0  0.13 0.08232726
8  1e+01   1.0  0.16 0.06992059
9  1e+02   1.0  0.20 0.09428090
10 1e+03   1.0  0.20 0.08164966
11 1e-01   2.0  0.25 0.12692955
12 1e+00   2.0  0.12 0.09189366
13 1e+01   2.0  0.17 0.09486833
14 1e+02   2.0  0.19 0.09944289
15 1e+03   2.0  0.20 0.09428090
16 1e-01   3.0  0.27 0.11595018
17 1e+00   3.0  0.13 0.09486833
18 1e+01   3.0  0.18 0.10327956
19 1e+02   3.0  0.21 0.08755950
20 1e+03   3.0  0.22 0.10327956
21 1e-01   4.0  0.27 0.11595018
22 1e+00   4.0  0.15 0.10801234
23 1e+01   4.0  0.18 0.11352924
24 1e+02   4.0  0.21 0.08755950
25 1e+03   4.0  0.24 0.10749677

Por lo tanto la mejor selección de parámetros se hace cuando \(cost = 1\) y \(gamma = 2\) Ahora se creará la matriz de confusión:

table(true = dat[-train,"y"], pred = predict(tune.out$best.model, newx = dat[-train,]))

9.6.3 ROC Curves

library(ROCR)

Se creará una función para graficar la curva ROC dado un vector que contenga un puntaje numérico para cada observación:

rocplot <- function(pred, truth, ...){
  predob <- prediction(pred, truth)
  perf <- performance(predob, "tpr", "fpr")
  plot(perf, ...)
}

La función predict() devolverá los valores de salida del modelo:

svmfit.opt <- svm(y ~ ., data = dat[train,], kernel = "radial", gamma = 2, cost = 1, decision.values = T)
fitted <- attributes(predict(svmfit.opt, dat[train,], decision.values = TRUE))$decision.values

Ahora se puede producir la gráfica:

par(mfrow = c(1,2))
rocplot(fitted, dat[train,"y"], main = " Training Data")

El SVM parece que produce predicciones exactas. Si aumentamos el valor de gamma se puede producir un modelo más flexible para mejorar la precision:

svmfit.flex <- svm(y ~ ., data = dat[train,], kernel = "radial", gamma = 50, cost = 1, decision.values = T)
fitted <- attributes(predict(svmfit.flex, dat[train,], decision.values = T))$decision.values
rocplot(fitted, dat[train,"y"], col = "red")

Estas curvas ROC son sobre el training set. Ahora nos interesa en el nivel de exactitud de las predicciones del test set. Cuando se obtiene la curva ROC con \(gamma = 2\) parece que provee resultados más exactos.

fitted <- attributes(predict(svmfit.opt, dat[-train,], decision.values = T))$decision.values
rocplot(fitted, dat[-train,"y"], main = "Test Data")

fitted <- attributes(predict(svmfit.flex, dat[-train,], decision.values = T))$decision.values
rocplot(fitted, dat[-train,"y"], col = "red")

9.6.4 SVM with Multiple Classes

Si la respuesta es un factor que contiene más de dos niveles, entonces la función svm() puede realizar una clasificación multi-class usando el enfoque one-versus-one. Se genera una nueva clase de observaciones:

set.seed(1)
x <- rbind(x, matrix(rnorm(50*2), ncol = 2))
y <- c(y, rep(0,50))
x[y == 0, 2] <- x[y == 0, 2] + 2
dat <- data.frame(x = x, y = as.factor(y))
par(mfrow = c(1,1))
plot(x, col = (y + 1))

Ahora se ajustará un SVM a la data:

svmfit <- svm(y ~ ., data = dat, kernel = "radial", cost = 10, gamma = 1)
plot(svmfit, dat)

La libreria e1071 puede ser usada para crear regresiones SV si el vector de respuesta que se para a la función svm() es numerica.

9.6.5 Application to Gene Expression Data

Ahora se examinara el dataset Khan que corresponden a tumores azules de una célula. El dataset consiste de data para train, xtrain y ytrain. y testing data xtest y ytest.

library(ISLR)
names(Khan)

[1] "xtrain" "xtest"  "ytrain" "ytest"

dim(Khan$xtrain)

[1]   63 2308

dim(Khan$xtest)

[1]   20 2308

length(Khan$ytrain)

[1] 63

length(Khan$ytest)

[1] 20

El dataset consiste de mediciones para \(2,308\) genes. el training consiste de \(63\) observaciones y el testing consiste de \(20\).

table(Khan$ytrain)


 1  2  3  4 
 8 23 12 20

table(Khan$ytest)


1 2 3 4 
3 6 6 5

Se usará el enfoque de Support vector para predecir cancer usando la medición de los genes. En este dataset son muchas variables para pocas observaciones. Se usará un kernel lineal porque la flexibilidad adicional de usar un kernel polinomial o radial es innecesaria.

dat <- data.frame(x = Khan$xtrain, y = as.factor(Khan$ytrain))
out <- svm(y ~ ., data = dat, kernel = "linear", cost = 10)
summary(out)


Call:
svm(formula = y ~ ., data = dat, kernel = "linear", 
    cost = 10)


Parameters:
   SVM-Type:  C-classification 
 SVM-Kernel:  linear 
       cost:  10 
      gamma:  0.0004332756 

Number of Support Vectors:  58

 ( 20 20 11 7 )


Number of Classes:  4 

Levels: 
 1 2 3 4

table(out$fitted, dat$y)

   
     1  2  3  4
  1  8  0  0  0
  2  0 23  0  0
  3  0  0 12  0
  4  0  0  0 20

Por lo que se puede ver que no hay errores del training. Esto se puede deducir ya que el número de variables con las pocas observaciones pueden hacer que las clases se separen totalmente. Ahora se probará en el test set.

dat.te <- data.frame(x = Khan$xtest , y = as.factor(Khan$ytest))
pred.te <- predict(out, newdata = dat.te)
table(pred.te, dat.te$y)

       
pred.te 1 2 3 4
      1 3 0 0 0
      2 0 6 2 0
      3 0 0 4 0
      4 0 0 0 5

Se puede ver que usando \(cost = 10\) se produce un error de \(2\) en estos datos.

LS0tDQp0aXRsZTogIkxhYm9yYXRvcmlvIDkuNjogU3VwcG9ydCBWZWN0b3IgTWFjaGluZXMiDQpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sNCi0tLQ0KDQojIyBQYXVsYSBDYXphbGkNCiMjIyBGaWFiaWxpZGFkDQoNCg0KU2UgdXNhcuEgbGEgbGlicmVy7WEgYGUxMDcxYCBwYXJhIGRlbW9zdHJhciBsb3MgdmVjdG9yZXMgZGUgY2xhc2lmaWNhY2nzbiB5IHkgU1ZNLg0KDQojIyMgOS42LjEgU3VwcG9ydCBWZWN0b3IgQ2xhc3NpZmllcg0KDQpMYSBmdW5jafNuIGBzdm0oKWAgcHVlZGUgc2VyIHVzYWRhIHBhcmEgY3JlYXIgdW4gbW9kZWxvIGRlIGNsYXNpZmljYWNp824gY29uIHZlY3RvcmVzIGRlIHNvcG9ydGUgY3VhbmRvIGVsIHBhcuFtZXRybyBga2VybmVsID0gJ2xpZW5hcidgLiBFc3RhIGZ1bmNp824gdXNhIGRpZmVyZW50ZXMgZm9ybXVsYWNpb25lcyBkZSBjaWVydGFzIGVjdWFjaW9uZXMuIA0KDQpUYW1iaeluIHNlIHVzYSBsYSBmdW5jafNuIGBzdm0oKWAgcGFyYSBjcmVhciB1biBzdXBwb3J0IHZlY3RvciBjbGFzc2lmaWVyIHBhcmEgbGEgZnVuY2nzbiBkYWRhIHBvciBlbCBwYXLhbWV0cm8gYGNvc3RvYC4gDQpTZSBjb21lbnphcuEgZ2VuZXJhbmRvIGxhcyBvYnNlcnZhY2lvbmVzIHF1ZSBwZXJ0ZW5lY2VzIGEgZG9zIGNsYXNlcy4NCmBgYHtyfQ0Kc2V0LnNlZWQoMSkNCnggPC0gbWF0cml4KHJub3JtKDIwKjIpLCBuY29sID0gMikNCnkgPC0gYyhyZXAoLTEsMTApLCByZXAoMSwxMCkpDQp4W3kgPT0gMV0gPC0geFt5ID09IDEsXSArIDENCmBgYA0KDQpTZSBjb21pZW56YSB2ZXJpZmljYW5kbyBjdWFsZXMgY2xhc2VzIHNvbiBsaW5lYWxtZW50ZSBzZXBhcmFibGVzDQpgYGB7cn0NCnBsb3QoeCwgY29sID0gKDMteSkpDQpgYGANCiBMYXMgY2xhc2VzIG5vIHNvbiBzZXBhcmFibGVzLiBQb3IgbG8gdGFudG8gc2UgdXNhcmEgc3VwcG9ydCB2ZWN0b3IgY2xhc3NpZmllci4gQWhvcmEgc2UgY3JlYSB1biBkYXRhIGZyYW1lIGNvbiBsYSByZXNwdWVzdGEgY29tbyBmYWN0b3IuDQpgYGB7cn0NCmRhdCA8LSBkYXRhLmZyYW1lKHggPSB4LCB5ID0gYXMuZmFjdG9yKHkpKQ0KbGlicmFyeShlMTA3MSkNCnN2bWZpdCA8LSBzdm0oeSB+IC4sIGRhdGEgPSBkYXQsIGtlcm5lbCA9ICJsaW5lYXIiLCBjb3N0ID0gMTAsIHNjYWxlID0gRkFMU0UpDQpgYGANCiANCkVsIHBhcuFtZXRybyBgc2NhbGUgPSBGQUxTRWAgaW5kaWNhIGEgbGEgZnVuY2nzbiBgc3ZtKClgIHF1ZSBubyBlc2NhbGUgY2FkYSB2YXJpYWJsZSBwYXJhIHF1ZSB0ZW5nYW4gbWVkaWEgaWd1YWwgYSBjZXJvIG8gZGVzdmlhY2nzbiBlc3RhbmRhciBpZ3VhbCBhICQxJCwgZGVwZW5kaWVuZG8gZGUgbGEgYXBsaWNhY2nzbiBlc3RlIHBhcuFtZXRybyBwdWVkZSB0ZW5lciBgVFJVRWAgbyBgRkFMU0VgLg0KQWhvcmEgc2UgcHVlZGUgb2J0ZW5lciBlbCBzdXBwb3J0IHZlY3RvciBjbGFzc2lmaWVyIG9idGVuaWRvOg0KYGBge3J9DQpwbG90IChzdm1maXQsIGRhdCkNCmBgYA0KTm90YXIgcXVlIGxvcyBkb3MgYXJndW1lbnRvcyBncmFmaWNhciBlbCBTVk0sIGVzIGxhIHNhbGlkYSBkZSBsYSBmdW5jafNuIGBzdm0oKWAuIEVsIGztbWl0ZSBlbnRyZSBsYXMgZG9zIGNsYXNlcyBlcyBsaW5lYWwgeWEgcXVlIHNlIHVzbyBlbCBhcmd1bWVudG8gYGtlcm5lbCA9ICJsaW5lYXIiYC4NCmBgYHtyfQ0Kc3ZtZml0JGluZGV4DQpgYGANClNlIHB1ZWRlIG9idGVuZXIgaW5mb3JtYWNp824gYmFzaWNhIGRlIGxhIHJlZ3Jlc2nzbiBkZWwgc3VwcG9ydCB2ZWN0b3IgY2xhc3NpZmllciB1c2FuZG8gYHN1bW1hcnkoKWA6DQpgYGB7cn0NCnN1bW1hcnkoc3ZtZml0KQ0KYGBgDQoNCkVzdG8gbm9zIGRpY2UgcXVlIHVuIGtlcm5lbCBsaW5lYWwgZnVlIHVzYWRvIGNvbiBgY29zdCA9IDEwYCB5IHF1ZSBoYXkgc2lldGUgc3VwcG9ydCB2ZWN0b3JzLCB0cmVzIGVuIHVuYSBjbGFzZSB5IGN1YXRybyBlbiBsYSBvdHJhLg0KUXVlIHBhc2Egc2kgdXNhbW9zIHVuIHZhbG9yIG3hcyBwZXF1ZfFvIHBhcmEgZWwgcGFy4W1ldHJvIGBjb3N0YDoNCmBgYHtyfQ0Kc3ZtZml0IDwtIHN2bSh5IH4gLiwgZGF0YSA9IGRhdCwga2VybmVsID0gImxpbmVhciIsIGNvc3QgPSAwLjEsIHNjYWxlID0gRkFMU0UpDQpwbG90KHN2bWZpdCwgZGF0KQ0KYGBgDQoNCmBgYHtyfQ0Kc3ZtZml0JGluZGV4DQpgYGANCg0KTWllbnRyYXMgc2UgdXNhIHVuIHZhbG9yIG3hcyBwZXF1ZfFvIHBhcmEgZXNlIHBhcuFtZXRybywgc2Ugb2J0aWVuZSB1biBu+m1lcm8gbWF5b3IgZGUgc3VwcG9ydCB2ZWN0b3JzLCB5YSBxdWUgZWwgbWFyZ2VuIGVzIG3hcyBhbXBsaW8uDQpMYSBmdW5jafNuIGB0dW5lKClgIGNyZWEgJDEwJCBmb2xkcyBwYXJhIHJlYWxpemFyIGNyb3NzLXZhbGlkYXRpb24gZW4gdW4gc2V0IGRlIG1vZGVsb3MgZGUgaW50ZXJlcy4gDQpgYGB7cn0NCnNldC5zZWVkKDEpDQp0dW5lLm91dCA8LSB0dW5lKHN2bSwgeX4gLiwgZGF0YSA9IGRhdCwga2VybmVsID0gImxpbmVhciIsIHJhbmdlcyA9IGxpc3QoY29zdCA9IGMoMC4wMDEsIDAuMDEsIDEsIDUsIDEwLCAxMDApKSkNCmBgYA0KDQpBaG9yYSBzZSBwdWVkZSBhY2NlZGVyIGEgbG9zIGVycm9yZXMgZGUgY3Jvc3MtdmFsaWRhdGlvbiBwYXJhIGNhZGEgdW5vIGRlIGVzb3MgbW9kZWxvcyB1c2FuZG8gYHN1bW1hcnkoKWA6DQpgYGB7cn0NCnN1bW1hcnkodHVuZS5vdXQpDQpgYGANCg0KQWhvcmEgc2UgcHVlZGUgdmVyIHF1ZSBhbCB1dGlsaXphciBgY29zdCA9IDAuMWAgc2Ugb2J0aWVuZSBlbCBlcnJvciBt4XMgcGVxdWXxbyBkZSBjcm9zcy12YWxpZGF0aW9uLiBQb3IgbG8gdGFudG8gbGEgZnVuY2nzbiBgdHVuZSgpYCBwdWVkZSBvYnRlbmVyIGVsIG1lam9yIG1vZGVsbywgYWwgY3VhbCBzZSBwdWVkZSBhY2NlZGVyOg0KYGBge3J9DQpiZXN0bW9kIDwtIHR1bmUub3V0JGJlc3QubW9kZWwNCnN1bW1hcnkoYmVzdG1vZCkNCmBgYA0KDQpVc2FuZG8gbGEgZnVuY2nzbiBgcHJlZGljdCgpYCBzZSBwdWVkZSBwcmVkZWNpciBsYSBldGlxdWV0YSBkZSBsYSBjbGFzZSBlbiB1biBzZXQgZGUgb2JzZXJ2YWNpb25lcyBkZSBwcnVlYmEuIFNlIGdlbmVyYXLhIHVuIHRlc3Q6DQpgYGB7cn0NCnh0ZXN0IDwtIG1hdHJpeChybm9ybSgyMCoyKSwgbmNvbCA9IDIpDQp5dGVzdCA8LSBzYW1wbGUoYygtMSwxKSwgMjAsIHJlcCA9IFRSVUUpDQp4dGVzdFt5dGVzdCA9PSAxLF0gPC0geHRlc3RbeXRlc3QgPT0gMSxdICsgMQ0KdGVzdGRhdCA8LSBkYXRhLmZyYW1lKHggPSB4dGVzdCwgeSA9IGFzLmZhY3Rvcih5dGVzdCkpDQp5cHJlZCA8LSBwcmVkaWN0KGJlc3Rtb2QsIHRlc3RkYXQpDQp0YWJsZShwcmVkaWN0ID0geXByZWQsIHRydXRoID0gdGVzdGRhdCR5KQ0KYGBgDQoNClBvciBsbyBxdWUgdXNhbmRvIGVzZSB2YWxvciBwYXJhIGVsIHBhcuFtZXRybyBgY29zdGAgc2UgcHVlZGVuIGNsYXNpZmljYXIgJDE5JCBvYnNlcnZhY2lvbmVzIGRlIG1hbmVyYSBjb3JyZWN0YS4gUXXpIGh1YmllcmEgcGFzYWRvIHNpIHNlIHVzYXJhIGFob3JhICRjb3N0ID0gMC4wMSQNCmBgYHtyfQ0Kc3ZtZml0IDwtIHN2bSh5IH4gLiwgZGF0YSA9IGRhdCwga2VybmVsID0gImxpbmVhciIsIGNvc3QgPSAwLjAxLCBzY2FsZSA9IEZBTFNFKQ0KeXByZWQgPC0gcHJlZGljdChzdm1maXQsIHRlc3RkYXQpDQp0YWJsZShwcmVkaWN0ID0geXByZWQsIHRydXRoID0gdGVzdGRhdCR5KQ0KYGBgDQpFbiBlc3RlIGNhc28gdW5hIG9ic2VydmFjafNuIHNlIHBpZXJkZS4gDQpBaG9yYSBjb25zaWRlcmFuZG8gcXVlIGRvcyBjbGFzZXMgc29uIGxpbmVhbG1lbnRlIHNlcGFyYWJsZXMuIEFob3JhIHNlIGNyZWFyYW4gZG9zIGNsYXNlcyBxdWUgc2Vy4W4gbGluZWFsbWVudGUgc2VwYXJhYmxlczoNCmBgYHtyfQ0KeFt5ID09IDEsXSA8LSB4W3kgPT0gMSxdICsgMC41DQpwbG90KHgsIGNvbCA9ICh5ICsgNSkvMiwgcGNoID0gMTkpDQpgYGANCg0KQWhvcmEgbGFzIG9ic2VydmFjaW9uZXMgc29uIGNhc2kgc2VwYXJhYmxlcyBsaW5lYWxtZW50ZS4gDQpgYGB7cn0NCmRhdCA8LSBkYXRhLmZyYW1lKHggPSB4LCB5ID0gYXMuZmFjdG9yKHkpKQ0Kc3ZtZml0IDwtIHN2bSh5IH4gLiwgZGF0YT1kYXQsIGtlcm5lbCA9ImxpbmVhciIsIGNvc3QgPTFlKzA1KQ0Kc3VtbWFyeShzdm1maXQpDQpgYGANCg0KQWhvcmEgY29uIHVuIG1lbm9yIHZhbG9yIHBhcmEgY29zdDoNCmBgYHtyfQ0Kc3ZtZml0IDwtIHN2bSh5IH4gLiwgZGF0YSA9IGRhdCwga2VybmVsID0gImxpbmVhciIsIGNvc3QgPSAxKQ0Kc3VtbWFyeShzdm1maXQpDQpwbG90KHN2bWZpdCwgZGF0KQ0KYGBgDQoNCiMjIyA5LjYuMiBTdXBwb3J0IFZlY3RvciBNYWNoaW5lDQoNClBhcmEgdXNhciB1biBrZXJuZWwgcXVlIG5vIHNlYSBsaW5lYWwgdGFtYmnpbiBzZSB1c2EgbGEgZnVuY2nzbiBgc3ZtKClgIHNvbG8gcXVlIGFob3JhIHNlIHVzYSB1biB2YWxvciBkaWZlcmVudGUgcGFyYSBlbCBwYXLhbWV0cm8gYGtlcm5lbGAuIFBhcmEgdW4gU1ZNIHBvbGlub21pYWwgdXNhbW9zIGBrZXJuZWwgPSAicG9seW5vbWlhbCJgIHkgcGFyYSB1biBrZXJuZWwgcmFkaWFsIGBrZXJuZWwgPSAicmFkaWFsImAsIGNvbiBlbCBwYXLhbWV0cm8gYGRlZ3JlZWAgc2UgZXNwZWNpZmljYSBlbCBncmFkbyBwYXJhIGVsIGtlcm5lbC4NClNlIGdlbmVyYSBkYXRhIHBhcmEgYXBsaWNhciB1biBsaW1pdGUgbm8gbGluZWFsOg0KYGBge3J9DQpzZXQuc2VlZCgxKQ0KeCA8LSBtYXRyaXgocm5vcm0oMjAwKjIpLCBuY29sID0gMikNCnhbMToxMDAgLF0gPC0geFsxOjEwMCxdICsgMg0KeFsxMDE6MTUwLF0gPC0geFsxMDE6MTUwLF0gLTINCnkgPC0gYyhyZXAoMSwgMTUwKSwgcmVwKDIsIDUwKSkNCmRhdCA8LSBkYXRhLmZyYW1lKHggPSB4LCB5ID0gYXMuZmFjdG9yKHkpKQ0KYGBgDQoNCkdyYWZpY2Ftb3M6DQpgYGB7cn0NCnBsb3QoeCwgY29sID0geSkNCmBgYA0KDQpTZSBzZXBhcmFy4SBsYSBkYXRhIGVuIHRlc3QgeSB0cmFpbjoNCmBgYHtyfQ0KdHJhaW4gPC0gc2FtcGxlKDIwMCwgMTAwKQ0Kc3ZtZml0IDwtIHN2bSh5IH4gLiwgZGF0YSA9IGRhdFt0cmFpbixdLCBrZXJuZWwgPSAicmFkaWFsIiwgZ2FtbWEgPSAxLCBjb3N0ID0gMSkNCnBsb3Qoc3ZtZml0LCBkYXRbdHJhaW4sXSkNCmBgYA0KDQpMYSBncmFmaWNhIG11ZXN0cmEgZWwgbGltaXRlIG5vIGxpbmVhbCBjcmVhZG8uDQpgYGB7cn0NCnN1bW1hcnkoc3ZtZml0KQ0KYGBgDQpTaSBzZSBpbmNyZW1lbnRhIGVsIHZhbG9yIHBhcmEgY29zdCBzZSBwdWVkZW4gcmVkdWNpciBlbCBu+m1lcm8gZGUgZXJyb3JlcyBkZSB0cmFpbmluZy4gDQpgYGB7cn0NCnN2bWZpdCA8LSBzdm0oeSB+IC4sIGRhdGEgPSBkYXRbdHJhaW4sXSwga2VybmVsID0gInJhZGlhbCIsIGdhbW1hID0gMSwgY29zdCA9IDFlNSkNCnBsb3Qoc3ZtZml0LCBkYXRbdHJhaW4sXSkNCmBgYA0KDQpUYW1iaeluIHNlIHB1ZWRlIGhhY2VyIGNyb3NzLXZhbGlkYXRpb24gdXNhbmRvIGxhIGZ1bmNp824gYHR1bmUoKWA6DQpgYGB7cn0NCnNldC5zZWVkKDEpDQp0dW5lLm91dCA8LSB0dW5lKHN2bSwgeSB+IC4sIGRhdGEgPSBkYXRbdHJhaW4sXSwga2VybmVsID0gInJhZGlhbCIsIHJhbmdlcyA9IGxpc3QoY29zdCA9IGMoMC4xLCAxLCAxMCwgMTAwLCAxMDAwKSwgZ2FtbWEgPSBjKDAuNSwxLDIsMyw0KSkpDQpzdW1tYXJ5KHR1bmUub3V0KQ0KYGBgDQogDQpQb3IgbG8gdGFudG8gbGEgbWVqb3Igc2VsZWNjafNuIGRlIHBhcuFtZXRyb3Mgc2UgaGFjZSBjdWFuZG8gJGNvc3QgPSAxJCB5ICRnYW1tYSA9IDIkIEFob3JhIHNlIGNyZWFy4SBsYSBtYXRyaXogZGUgY29uZnVzafNuOg0KYGBge3J9DQp0YWJsZSh0cnVlID0gZGF0Wy10cmFpbiwieSJdLCBwcmVkID0gcHJlZGljdCh0dW5lLm91dCRiZXN0Lm1vZGVsLCBuZXd4ID0gZGF0Wy10cmFpbixdKSkNCmBgYA0KDQojIyMgOS42LjMgUk9DIEN1cnZlcw0KYGBge3J9DQpsaWJyYXJ5KFJPQ1IpDQpgYGANCg0KU2UgY3JlYXLhIHVuYSBmdW5jafNuIHBhcmEgZ3JhZmljYXIgbGEgY3VydmEgUk9DIGRhZG8gdW4gdmVjdG9yIHF1ZSBjb250ZW5nYSB1biBwdW50YWplIG51belyaWNvIHBhcmEgY2FkYSBvYnNlcnZhY2nzbjoNCmBgYHtyfQ0Kcm9jcGxvdCA8LSBmdW5jdGlvbihwcmVkLCB0cnV0aCwgLi4uKXsNCiAgcHJlZG9iIDwtIHByZWRpY3Rpb24ocHJlZCwgdHJ1dGgpDQogIHBlcmYgPC0gcGVyZm9ybWFuY2UocHJlZG9iLCAidHByIiwgImZwciIpDQogIHBsb3QocGVyZiwgLi4uKQ0KfQ0KYGBgDQoNCkxhIGZ1bmNp824gYHByZWRpY3QoKWAgZGV2b2x2ZXLhIGxvcyB2YWxvcmVzIGRlIHNhbGlkYSBkZWwgbW9kZWxvOg0KYGBge3J9DQpzdm1maXQub3B0IDwtIHN2bSh5IH4gLiwgZGF0YSA9IGRhdFt0cmFpbixdLCBrZXJuZWwgPSAicmFkaWFsIiwgZ2FtbWEgPSAyLCBjb3N0ID0gMSwgZGVjaXNpb24udmFsdWVzID0gVCkNCmZpdHRlZCA8LSBhdHRyaWJ1dGVzKHByZWRpY3Qoc3ZtZml0Lm9wdCwgZGF0W3RyYWluLF0sIGRlY2lzaW9uLnZhbHVlcyA9IFRSVUUpKSRkZWNpc2lvbi52YWx1ZXMNCmBgYA0KDQpBaG9yYSBzZSBwdWVkZSBwcm9kdWNpciBsYSBncuFmaWNhOg0KYGBge3J9DQpwYXIobWZyb3cgPSBjKDEsMikpDQpyb2NwbG90KGZpdHRlZCwgZGF0W3RyYWluLCJ5Il0sIG1haW4gPSAiIFRyYWluaW5nIERhdGEiKQ0KYGBgDQoNCkVsIFNWTSBwYXJlY2UgcXVlIHByb2R1Y2UgcHJlZGljY2lvbmVzIGV4YWN0YXMuIFNpIGF1bWVudGFtb3MgZWwgdmFsb3IgZGUgZ2FtbWEgc2UgcHVlZGUgcHJvZHVjaXIgdW4gbW9kZWxvIG3hcyBmbGV4aWJsZSBwYXJhIG1lam9yYXIgbGEgcHJlY2lzaW9uOg0KYGBge3J9DQpzdm1maXQuZmxleCA8LSBzdm0oeSB+IC4sIGRhdGEgPSBkYXRbdHJhaW4sXSwga2VybmVsID0gInJhZGlhbCIsIGdhbW1hID0gNTAsIGNvc3QgPSAxLCBkZWNpc2lvbi52YWx1ZXMgPSBUKQ0KZml0dGVkIDwtIGF0dHJpYnV0ZXMocHJlZGljdChzdm1maXQuZmxleCwgZGF0W3RyYWluLF0sIGRlY2lzaW9uLnZhbHVlcyA9IFQpKSRkZWNpc2lvbi52YWx1ZXMNCnJvY3Bsb3QoZml0dGVkLCBkYXRbdHJhaW4sInkiXSwgY29sID0gInJlZCIpDQpgYGANCg0KRXN0YXMgY3VydmFzIFJPQyBzb24gc29icmUgZWwgdHJhaW5pbmcgc2V0LiBBaG9yYSBub3MgaW50ZXJlc2EgZW4gZWwgbml2ZWwgZGUgZXhhY3RpdHVkIGRlIGxhcyBwcmVkaWNjaW9uZXMgZGVsIHRlc3Qgc2V0LiBDdWFuZG8gc2Ugb2J0aWVuZSBsYSBjdXJ2YSBST0MgY29uICRnYW1tYSA9IDIkIHBhcmVjZSBxdWUgcHJvdmVlIHJlc3VsdGFkb3MgbeFzIGV4YWN0b3MuDQpgYGB7cn0NCmZpdHRlZCA8LSBhdHRyaWJ1dGVzKHByZWRpY3Qoc3ZtZml0Lm9wdCwgZGF0Wy10cmFpbixdLCBkZWNpc2lvbi52YWx1ZXMgPSBUKSkkZGVjaXNpb24udmFsdWVzDQpyb2NwbG90KGZpdHRlZCwgZGF0Wy10cmFpbiwieSJdLCBtYWluID0gIlRlc3QgRGF0YSIpDQpgYGANCg0KYGBge3J9DQpmaXR0ZWQgPC0gYXR0cmlidXRlcyhwcmVkaWN0KHN2bWZpdC5mbGV4LCBkYXRbLXRyYWluLF0sIGRlY2lzaW9uLnZhbHVlcyA9IFQpKSRkZWNpc2lvbi52YWx1ZXMNCnJvY3Bsb3QoZml0dGVkLCBkYXRbLXRyYWluLCJ5Il0sIGNvbCA9ICJyZWQiKQ0KYGBgDQoNCiMjIyA5LjYuNCBTVk0gd2l0aCBNdWx0aXBsZSBDbGFzc2VzDQpTaSBsYSByZXNwdWVzdGEgZXMgdW4gZmFjdG9yIHF1ZSBjb250aWVuZSBt4XMgZGUgZG9zIG5pdmVsZXMsIGVudG9uY2VzIGxhIGZ1bmNp824gYHN2bSgpYCBwdWVkZSByZWFsaXphciB1bmEgY2xhc2lmaWNhY2nzbiBtdWx0aS1jbGFzcyB1c2FuZG8gZWwgZW5mb3F1ZSBvbmUtdmVyc3VzLW9uZS4NClNlIGdlbmVyYSB1bmEgbnVldmEgY2xhc2UgZGUgb2JzZXJ2YWNpb25lczoNCmBgYHtyfQ0Kc2V0LnNlZWQoMSkNCnggPC0gcmJpbmQoeCwgbWF0cml4KHJub3JtKDUwKjIpLCBuY29sID0gMikpDQp5IDwtIGMoeSwgcmVwKDAsNTApKQ0KeFt5ID09IDAsIDJdIDwtIHhbeSA9PSAwLCAyXSArIDINCmRhdCA8LSBkYXRhLmZyYW1lKHggPSB4LCB5ID0gYXMuZmFjdG9yKHkpKQ0KcGFyKG1mcm93ID0gYygxLDEpKQ0KcGxvdCh4LCBjb2wgPSAoeSArIDEpKQ0KYGBgDQoNCkFob3JhIHNlIGFqdXN0YXLhIHVuIFNWTSBhIGxhIGRhdGE6DQpgYGB7cn0NCnN2bWZpdCA8LSBzdm0oeSB+IC4sIGRhdGEgPSBkYXQsIGtlcm5lbCA9ICJyYWRpYWwiLCBjb3N0ID0gMTAsIGdhbW1hID0gMSkNCnBsb3Qoc3ZtZml0LCBkYXQpDQpgYGANCg0KTGEgbGlicmVyaWEgYGUxMDcxYCBwdWVkZSBzZXIgdXNhZGEgcGFyYSBjcmVhciByZWdyZXNpb25lcyBTViBzaSBlbCB2ZWN0b3IgZGUgcmVzcHVlc3RhIHF1ZSBzZSBwYXJhIGEgbGEgZnVuY2nzbiBgc3ZtKClgIGVzIG51bWVyaWNhLg0KDQojIyMgOS42LjUgQXBwbGljYXRpb24gdG8gR2VuZSBFeHByZXNzaW9uIERhdGENCg0KQWhvcmEgc2UgZXhhbWluYXJhIGVsIGRhdGFzZXQgYEtoYW5gIHF1ZSBjb3JyZXNwb25kZW4gYSB0dW1vcmVzIGF6dWxlcyBkZSB1bmEgY+lsdWxhLiBFbCBkYXRhc2V0IGNvbnNpc3RlIGRlIGRhdGEgcGFyYSB0cmFpbiwgeHRyYWluIHkgeXRyYWluLiB5IHRlc3RpbmcgZGF0YSB4dGVzdCB5IHl0ZXN0Lg0KDQpgYGB7cn0NCmxpYnJhcnkoSVNMUikNCm5hbWVzKEtoYW4pDQpkaW0oS2hhbiR4dHJhaW4pDQpkaW0oS2hhbiR4dGVzdCkNCmxlbmd0aChLaGFuJHl0cmFpbikNCmxlbmd0aChLaGFuJHl0ZXN0KQ0KYGBgDQoNCkVsIGRhdGFzZXQgY29uc2lzdGUgZGUgbWVkaWNpb25lcyBwYXJhICQyLDMwOCQgZ2VuZXMuDQplbCB0cmFpbmluZyBjb25zaXN0ZSBkZSAkNjMkIG9ic2VydmFjaW9uZXMgeSBlbCB0ZXN0aW5nIGNvbnNpc3RlIGRlICQyMCQuDQpgYGB7cn0NCnRhYmxlKEtoYW4keXRyYWluKQ0KdGFibGUoS2hhbiR5dGVzdCkNCmBgYA0KDQpTZSB1c2Fy4SBlbCBlbmZvcXVlIGRlIFN1cHBvcnQgdmVjdG9yIHBhcmEgcHJlZGVjaXIgY2FuY2VyIHVzYW5kbyBsYSBtZWRpY2nzbiBkZSBsb3MgZ2VuZXMuIEVuIGVzdGUgZGF0YXNldCBzb24gbXVjaGFzIHZhcmlhYmxlcyBwYXJhIHBvY2FzIG9ic2VydmFjaW9uZXMuIFNlIHVzYXLhIHVuIGtlcm5lbCBsaW5lYWwgcG9ycXVlIGxhIGZsZXhpYmlsaWRhZCBhZGljaW9uYWwgZGUgdXNhciB1biBrZXJuZWwgcG9saW5vbWlhbCBvIHJhZGlhbCBlcyBpbm5lY2VzYXJpYS4NCmBgYHtyfQ0KZGF0IDwtIGRhdGEuZnJhbWUoeCA9IEtoYW4keHRyYWluLCB5ID0gYXMuZmFjdG9yKEtoYW4keXRyYWluKSkNCm91dCA8LSBzdm0oeSB+IC4sIGRhdGEgPSBkYXQsIGtlcm5lbCA9ICJsaW5lYXIiLCBjb3N0ID0gMTApDQpzdW1tYXJ5KG91dCkNCmBgYA0KDQpgYGB7cn0NCnRhYmxlKG91dCRmaXR0ZWQsIGRhdCR5KQ0KYGBgDQoNClBvciBsbyBxdWUgc2UgcHVlZGUgdmVyIHF1ZSBubyBoYXkgZXJyb3JlcyBkZWwgdHJhaW5pbmcuIEVzdG8gc2UgcHVlZGUgZGVkdWNpciB5YSBxdWUgZWwgbvptZXJvIGRlIHZhcmlhYmxlcyBjb24gbGFzIHBvY2FzIG9ic2VydmFjaW9uZXMgcHVlZGVuIGhhY2VyIHF1ZSBsYXMgY2xhc2VzIHNlIHNlcGFyZW4gdG90YWxtZW50ZS4gQWhvcmEgc2UgcHJvYmFy4SBlbiBlbCB0ZXN0IHNldC4NCmBgYHtyfQ0KZGF0LnRlIDwtIGRhdGEuZnJhbWUoeCA9IEtoYW4keHRlc3QgLCB5ID0gYXMuZmFjdG9yKEtoYW4keXRlc3QpKQ0KcHJlZC50ZSA8LSBwcmVkaWN0KG91dCwgbmV3ZGF0YSA9IGRhdC50ZSkNCnRhYmxlKHByZWQudGUsIGRhdC50ZSR5KQ0KYGBgDQpTZSBwdWVkZSB2ZXIgcXVlIHVzYW5kbyAkY29zdCA9IDEwJCBzZSBwcm9kdWNlIHVuIGVycm9yIGRlICQyJCBlbiBlc3RvcyBkYXRvcy4NCg==