Laboratorio 8.3: Decision Trees

Paula Cazali

Fiabilidad

8.3.1 Fitting Classification Trees

Se cargará la librería tree:

library(tree)

Se usarán árboles de clasificación para analizar el dataset Carseats. En este dataset Sales es una variable continua, por lo que primero se transformará a una variable binaria. Se usará la función ifelse() para crear una variable High la cual tendrá un valor de Yes si la variable Sales sobrepasa $8$ y un valor de No si no lo sobrepasa.

library(ISLR)
High <- ifelse(Sales <= 8, "No", "Yes")

Luego se usará la función data.frame() para unir la variable High que creamos con el resto del dataset.

Carseats2 <- data.frame(Carseats,High)
attach(Carseats2)

Ahora se usará la función tree() para ajustar un árbol de clasificación para poder predecir la variable High usando todas las variables menos Sales, la cual usamos para crear la variable High.

tree.carseats <- tree(High ~ .-Sales, Carseats2)

La función summary() lista las variables que fueron usadas como nodos internos en el árbol, el número de nodos terminales y la tasa de error del training.

summary(tree.carseats)


Classification tree:
tree(formula = High ~ . - Sales, data = Carseats2)
Variables actually used in tree construction:
[1] "ShelveLoc"   "Price"       "Income"      "CompPrice"   "Population"  "Advertising" "Age"         "US"         
Number of terminal nodes:  27 
Residual mean deviance:  0.4575 = 170.7 / 373 
Misclassification error rate: 0.09 = 36 / 400

Se puede ver que la tasa de error de training es del $9\%$.

Una de las propiedades más atractivas de los árboles es que puede ser mostrada la estructura del árbol graficamente usando la función plot() y con la función text() se puede desplegar las etiquetas de los nodos.

plot(tree.carseats)
text(tree.carseats, pretty = 0)

Se puede ver que el indicador más importante de Sales parece ser la ubicación en las estanterias, esta rama diferencia entre Good, Bad y Medium con respecto a las ubicaciones. Si solo escribimos el nombre del objeto del árbol, R despliega la salida corresponndiente para cada rama del árbol. Las ramas que llevan a nodos terminales están indicados usando asteriscos.

tree.carseats

node), split, n, deviance, yval, (yprob)
      * denotes terminal node

  1) root 400 541.500 No ( 0.59000 0.41000 )  
    2) ShelveLoc: Bad,Medium 315 390.600 No ( 0.68889 0.31111 )  
      4) Price < 92.5 46  56.530 Yes ( 0.30435 0.69565 )  
        8) Income < 57 10  12.220 No ( 0.70000 0.30000 )  
         16) CompPrice < 110.5 5   0.000 No ( 1.00000 0.00000 ) *
         17) CompPrice > 110.5 5   6.730 Yes ( 0.40000 0.60000 ) *
        9) Income > 57 36  35.470 Yes ( 0.19444 0.80556 )  
         18) Population < 207.5 16  21.170 Yes ( 0.37500 0.62500 ) *
         19) Population > 207.5 20   7.941 Yes ( 0.05000 0.95000 ) *
      5) Price > 92.5 269 299.800 No ( 0.75465 0.24535 )  
       10) Advertising < 13.5 224 213.200 No ( 0.81696 0.18304 )  
         20) CompPrice < 124.5 96  44.890 No ( 0.93750 0.06250 )  
           40) Price < 106.5 38  33.150 No ( 0.84211 0.15789 )  
             80) Population < 177 12  16.300 No ( 0.58333 0.41667 )  
              160) Income < 60.5 6   0.000 No ( 1.00000 0.00000 ) *
              161) Income > 60.5 6   5.407 Yes ( 0.16667 0.83333 ) *
             81) Population > 177 26   8.477 No ( 0.96154 0.03846 ) *
           41) Price > 106.5 58   0.000 No ( 1.00000 0.00000 ) *
         21) CompPrice > 124.5 128 150.200 No ( 0.72656 0.27344 )  
           42) Price < 122.5 51  70.680 Yes ( 0.49020 0.50980 )  
             84) ShelveLoc: Bad 11   6.702 No ( 0.90909 0.09091 ) *
             85) ShelveLoc: Medium 40  52.930 Yes ( 0.37500 0.62500 )  
              170) Price < 109.5 16   7.481 Yes ( 0.06250 0.93750 ) *
              171) Price > 109.5 24  32.600 No ( 0.58333 0.41667 )  
                342) Age < 49.5 13  16.050 Yes ( 0.30769 0.69231 ) *
                343) Age > 49.5 11   6.702 No ( 0.90909 0.09091 ) *
           43) Price > 122.5 77  55.540 No ( 0.88312 0.11688 )  
             86) CompPrice < 147.5 58  17.400 No ( 0.96552 0.03448 ) *
             87) CompPrice > 147.5 19  25.010 No ( 0.63158 0.36842 )  
              174) Price < 147 12  16.300 Yes ( 0.41667 0.58333 )  
                348) CompPrice < 152.5 7   5.742 Yes ( 0.14286 0.85714 ) *
                349) CompPrice > 152.5 5   5.004 No ( 0.80000 0.20000 ) *
              175) Price > 147 7   0.000 No ( 1.00000 0.00000 ) *
       11) Advertising > 13.5 45  61.830 Yes ( 0.44444 0.55556 )  
         22) Age < 54.5 25  25.020 Yes ( 0.20000 0.80000 )  
           44) CompPrice < 130.5 14  18.250 Yes ( 0.35714 0.64286 )  
             88) Income < 100 9  12.370 No ( 0.55556 0.44444 ) *
             89) Income > 100 5   0.000 Yes ( 0.00000 1.00000 ) *
           45) CompPrice > 130.5 11   0.000 Yes ( 0.00000 1.00000 ) *
         23) Age > 54.5 20  22.490 No ( 0.75000 0.25000 )  
           46) CompPrice < 122.5 10   0.000 No ( 1.00000 0.00000 ) *
           47) CompPrice > 122.5 10  13.860 No ( 0.50000 0.50000 )  
             94) Price < 125 5   0.000 Yes ( 0.00000 1.00000 ) *
             95) Price > 125 5   0.000 No ( 1.00000 0.00000 ) *
    3) ShelveLoc: Good 85  90.330 Yes ( 0.22353 0.77647 )  
      6) Price < 135 68  49.260 Yes ( 0.11765 0.88235 )  
       12) US: No 17  22.070 Yes ( 0.35294 0.64706 )  
         24) Price < 109 8   0.000 Yes ( 0.00000 1.00000 ) *
         25) Price > 109 9  11.460 No ( 0.66667 0.33333 ) *
       13) US: Yes 51  16.880 Yes ( 0.03922 0.96078 ) *
      7) Price > 135 17  22.070 No ( 0.64706 0.35294 )  
       14) Income < 46 6   0.000 No ( 1.00000 0.00000 ) *
       15) Income > 46 11  15.160 Yes ( 0.45455 0.54545 ) *

A manera de evaluar bien el desempeño del árbol de clasificación en este dataset, se de estimar el error de testing y compararlo con el error de training. Se dividirán las observaciones en un training set y un test set. Se construirá el árbol usando el training set y se evaluará su desempeño con el test set. La función predict() puede ser usada para este propósito. En el caso del árbol de clasificación, el argumento type = "class" devuleve la clase actual de esa predección. Este enfoque lleva a predicciones correctas alrededor de $71.5\%$ de las localizaciones en el test set.

set.seed(2)
train <- sample(1:nrow(Carseats2), 200)
Carseats.test <- Carseats2[-train,]
High.test <- High[-train]
tree.carseats <- tree(High ~ .-Sales,Carseats2, subset = train)
tree.pred <- predict(tree.carseats, Carseats.test, type = "class")
table(tree.pred, High.test)

         High.test
tree.pred No Yes
      No  86  27
      Yes 30  57

(86+57)/200

[1] 0.715

La función cv.tree() realiza un cross-validation para determinar el nivel óptimo de la complejidad del árbol. Se usa el argumento FUN = prune.misclass para indicar que se quiere una tasa de error de clasificación para guiar la cross-validation comparado con el default para cv.tree().

set.seed(3)
cv.carseats <- cv.tree(tree.carseats, FUN = prune.misclass)
names(cv.carseats)

[1] "size"   "dev"    "k"      "method"

cv.carseats$size

[1] 19 17 14 13  9  7  3  2  1

cv.carseats$dev

[1] 55 55 53 52 50 56 69 65 80

cv.carseats$k

[1]       -Inf  0.0000000  0.6666667  1.0000000  1.7500000
[6]  2.0000000  4.2500000  5.0000000 23.0000000

cv.carseats$method

[1] "misclass"

attr(cv.carseats,"class")

[1] "prune"         "tree.sequence"

La variable dev corresponde al error de cross-validation. El árbol con $9$ nodos terminales resulta en el error más pequeño de cross-validation. Con $50$ errores de cross-validation. Ahora se grafica el error como una función de size y de k:

par(mfrow = c(1,2))
plot(cv.carseats$size, cv.carseats$dec, type = "b")
plot(cv.carseats$k, cv.carseats$dev, type = "b")

Aplicamos la función prune.misclass():

prune.carseats <- prune.misclass(tree.carseats, best = 9)
plot(prune.carseats)
text(prune.carseats, pretty = 0)

Aplicamos la función predict():

tree.pred <- predict(prune.carseats, Carseats.test, type = "class")
table(tree.pred, High.test)

         High.test
tree.pred No Yes
      No  94  24
      Yes 22  60

(94+60)/200

[1] 0.77

Ahora el $77\%$ de las observaciones del test están correctamente clasificadas. Si se incrementa el valor para best.

prune.carseats <- prune.misclass(tree.carseats, best = 15)
plot(prune.carseats)
text(prune.carseats, pretty = 0)

tree.pred <- predict(prune.carseats, Carseats.test, type = "class")
table(tree.pred, High.test)

         High.test
tree.pred No Yes
      No  86  22
      Yes 30  62

(86+62)/200

[1] 0.74

8.3.2 Fitting Regression Trees

Ahora se hará un árbol para el dataset Boston. Primero creamos el training set y creamos el árbol para el training.

library(MASS)

set.seed(1)
train <- sample(1:nrow(Boston), nrow(Boston)/2)
tree.boston <- tree(medv ~ ., Boston, subset = train)
summary(tree.boston)


Regression tree:
tree(formula = medv ~ ., data = Boston, subset = train)
Variables actually used in tree construction:
[1] "lstat" "rm"    "dis"  
Number of terminal nodes:  8 
Residual mean deviance:  12.65 = 3099 / 245 
Distribution of residuals:
     Min.   1st Qu.    Median      Mean   3rd Qu. 
-14.10000  -2.04200  -0.05357   0.00000   1.96000 
     Max. 
 12.60000

Hay que notar que la salida de summary() indica que solamente tres de las variables fueron usadas para construir el árbol. Para este caso la desviación es solamente la suma de los cuadrados de los errores para el árbol. Ahora se grafica el árbol.

plot(tree.boston)
text(tree.boston, pretty = 0)

El árbol indica que para valores más bajos de lstat corresponden a casas más caras. El árbol predice como media un precio de $\$46,400$ para casas grandes en los suburbios. Ahora se usa la función cv.tree() para mejorar el desempeño.

cv.boston <- cv.tree(tree.boston)
plot(cv.boston$size, cv.boston$dev, type = 'b')

En este caso el árbol más complejo se selecciona por cross-validation.

prune.boston <- prune.tree(tree.boston, best = 5)
plot(prune.boston)
text(prune.boston, pretty = 0)

yhat <- predict(tree.boston, newdata = Boston[-train,])
boston.test = Boston[-train, "medv"]
plot(yhat, boston.test)
abline(0,1)

mean((yhat - boston.test)^2)

[1] 25.04559

Por lo que el MSE para el test set asociado con la regresión del árbol es de $25.05$.

8.3.3 Bagging and Random Forests

Ahora se aplicará el método de bagging y random forests al dataset Boston usando el paquete randomForest

library(randomForest)

set.seed(1)
bag.boston <- randomForest(medv ~ ., data = Boston, subset = train, mtry = 13, importance = TRUE)
bag.boston


Call:
 randomForest(formula = medv ~ ., data = Boston, mtry = 13, importance = TRUE,      subset = train) 
               Type of random forest: regression
                     Number of trees: 500
No. of variables tried at each split: 13

          Mean of squared residuals: 11.15723
                    % Var explained: 86.49

El argumento mtry = 13 indica que $13$ predicciones deben ser consideradas para cada split del árbol. Por lo que debe hacerse bagging.

yhat.bag <- predict(bag.boston, newdata = Boston[-train,])
plot(yhat.bag, boston.test)
abline(0,1)

mean((yhat.bag - boston.test)^2)

[1] 13.50808

Ahora se aplicarán los RandomForests:

set.seed(1)
rf.boston <- randomForest(medv ~ ., data = Boston, subset = train, mtry = 6, importance = TRUE)
yhat.rf <- predict(rf.boston, newdata = Boston[-train,])
mean((yhat.rf - boston.test)^2)

[1] 11.66454

Por lo que el MSE del test es de $11.31\%$ por lo que se ve que el random forest hace una mejora comparado con el bagging. La función importance() puede desplegar la importancia de cada variable.

importance(rf.boston)

          %IncMSE IncNodePurity
crim    12.132320     986.50338
zn       1.955579      57.96945
indus    9.069302     882.78261
chas     2.210835      45.22941
nox     11.104823    1044.33776
rm      31.784033    6359.31971
age     10.962684     516.82969
dis     15.015236    1224.11605
rad      4.118011      95.94586
tax      8.587932     502.96719
ptratio 12.503896     830.77523
black    6.702609     341.30361
lstat   30.695224    7505.73936

Se puede graficar la importancia de las variables:

varImpPlot(rf.boston)

8.3.4 Boosting

Se usa el paquete gbm y la función gbm() para una regresión de tipo boosted en los árboles del dataset Boston.

library(gbm)

set.seed(1)
boost.boston <- gbm(medv ~ ., data = Boston[train,], distribution = "gaussian", n.trees = 5000, interaction.depth = 4)

La función summary() produce una influencia relativa:

summary(boost.boston)

            var    rel.inf
lstat     lstat 37.0661275
rm           rm 25.3533123
dis         dis 11.7903016
crim       crim  8.0388750
black     black  4.2531659
nox         nox  3.5058570
age         age  3.4868724
ptratio ptratio  2.2500385
indus     indus  1.7725070
tax         tax  1.1836592
chas       chas  0.7441319
rad         rad  0.4274311
zn           zn  0.1277206

Se puede ver que lstat y rm son por mucho las variables más importantes. En este caso se puede esérar que la media del precio de las casas incrementen con rm y decrementen con lstat.

par(mfrow = c(1,2))
plot(boost.boston, i = "rm")

plot(boost.boston, i = "lstat")

Ahora se usara el modelo boosted para predecir medv en el test set.

yhat.boost <- predict(boost.boston, newdata = Boston[-train,], n.trees = 5000)
mean((yhat.boost - boston.test)^2)

[1] 10.81479

boost.boston <- gbm(medv ~ ., data = Boston[train,], distribution = "gaussian", n.trees = 5000, interaction.depth = 4, shrinkage = 0.2, verbose = F)
yhat.boost <- predict(boost.boston, newdata = Boston[-train,], n.trees = 5000)
mean((yhat.boost - boston.test)^2)

[1] 11.51109

LS0tDQp0aXRsZTogIkxhYm9yYXRvcmlvIDguMzogRGVjaXNpb24gVHJlZXMiDQpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sNCi0tLQ0KIyMgUGF1bGEgQ2F6YWxpDQojIyMgRmlhYmlsaWRhZA0KDQojIyMgOC4zLjEgRml0dGluZyBDbGFzc2lmaWNhdGlvbiBUcmVlcw0KDQpTZSBjYXJnYXLDoSBsYSBsaWJyZXLDrWEgYHRyZWVgOg0KYGBge3J9DQpsaWJyYXJ5KHRyZWUpDQpgYGANCg0KU2UgdXNhcsOhbiDDoXJib2xlcyBkZSBjbGFzaWZpY2FjacOzbiBwYXJhIGFuYWxpemFyIGVsIGRhdGFzZXQgYENhcnNlYXRzYC4gRW4gZXN0ZSBkYXRhc2V0IGBTYWxlc2AgZXMgdW5hIHZhcmlhYmxlIGNvbnRpbnVhLCBwb3IgbG8gcXVlIHByaW1lcm8gc2UgdHJhbnNmb3JtYXLDoSBhIHVuYSB2YXJpYWJsZSBiaW5hcmlhLiBTZSB1c2Fyw6EgbGEgZnVuY2nDs24gYGlmZWxzZSgpYCBwYXJhIGNyZWFyIHVuYSB2YXJpYWJsZSBgSGlnaGAgbGEgY3VhbCB0ZW5kcsOhIHVuIHZhbG9yIGRlIGBZZXNgIHNpIGxhIHZhcmlhYmxlIGBTYWxlc2Agc29icmVwYXNhICQ4JCB5IHVuIHZhbG9yIGRlIGBOb2Agc2kgbm8gbG8gc29icmVwYXNhLg0KYGBge3J9DQpsaWJyYXJ5KElTTFIpDQpIaWdoIDwtIGlmZWxzZShTYWxlcyA8PSA4LCAiTm8iLCAiWWVzIikNCmBgYA0KDQpMdWVnbyBzZSB1c2Fyw6EgbGEgZnVuY2nDs24gYGRhdGEuZnJhbWUoKWAgcGFyYSB1bmlyIGxhIHZhcmlhYmxlIGBIaWdoYCBxdWUgY3JlYW1vcyBjb24gZWwgcmVzdG8gZGVsIGRhdGFzZXQuDQpgYGB7cn0NCkNhcnNlYXRzMiA8LSBkYXRhLmZyYW1lKENhcnNlYXRzLEhpZ2gpDQphdHRhY2goQ2Fyc2VhdHMyKQ0KYGBgDQoNCkFob3JhIHNlIHVzYXLDoSBsYSBmdW5jacOzbiBgdHJlZSgpYCBwYXJhIGFqdXN0YXIgdW4gw6FyYm9sIGRlIGNsYXNpZmljYWNpw7NuIHBhcmEgcG9kZXIgcHJlZGVjaXIgbGEgdmFyaWFibGUgYEhpZ2hgIHVzYW5kbyB0b2RhcyBsYXMgdmFyaWFibGVzIG1lbm9zIGBTYWxlc2AsIGxhIGN1YWwgdXNhbW9zIHBhcmEgY3JlYXIgbGEgdmFyaWFibGUgYEhpZ2hgLg0KDQpgYGB7cn0NCnRyZWUuY2Fyc2VhdHMgPC0gdHJlZShIaWdoIH4gLi1TYWxlcywgQ2Fyc2VhdHMyKQ0KYGBgDQoNCg0KTGEgZnVuY2nDs24gYHN1bW1hcnkoKWAgbGlzdGEgbGFzIHZhcmlhYmxlcyBxdWUgZnVlcm9uIHVzYWRhcyBjb21vIG5vZG9zIGludGVybm9zIGVuIGVsIMOhcmJvbCwgZWwgbsO6bWVybyBkZSBub2RvcyB0ZXJtaW5hbGVzIHkgbGEgdGFzYSBkZSBlcnJvciBkZWwgdHJhaW5pbmcuDQoNCmBgYHtyfQ0Kc3VtbWFyeSh0cmVlLmNhcnNlYXRzKQ0KYGBgDQoNClNlIHB1ZWRlIHZlciBxdWUgbGEgdGFzYSBkZSBlcnJvciBkZSB0cmFpbmluZyBlcyBkZWwgJDlcJSQuIA0KDQpVbmEgZGUgbGFzIHByb3BpZWRhZGVzIG3DoXMgYXRyYWN0aXZhcyBkZSBsb3Mgw6FyYm9sZXMgZXMgcXVlIHB1ZWRlIHNlciBtb3N0cmFkYSBsYSBlc3RydWN0dXJhIGRlbCDDoXJib2wgZ3JhZmljYW1lbnRlIHVzYW5kbyBsYSBmdW5jacOzbiBgcGxvdCgpYCB5IGNvbiBsYSBmdW5jacOzbiBgdGV4dCgpYCBzZSBwdWVkZSBkZXNwbGVnYXIgbGFzIGV0aXF1ZXRhcyBkZSBsb3Mgbm9kb3MuDQoNCmBgYHtyfQ0KcGxvdCh0cmVlLmNhcnNlYXRzKQ0KdGV4dCh0cmVlLmNhcnNlYXRzLCBwcmV0dHkgPSAwKQ0KYGBgDQoNClNlIHB1ZWRlIHZlciBxdWUgZWwgaW5kaWNhZG9yIG3DoXMgaW1wb3J0YW50ZSBkZSBgU2FsZXNgIHBhcmVjZSBzZXIgbGEgdWJpY2FjacOzbiBlbiBsYXMgZXN0YW50ZXJpYXMsIGVzdGEgcmFtYSBkaWZlcmVuY2lhIGVudHJlIGBHb29kYCwgYEJhZGAgeSBgTWVkaXVtYCBjb24gcmVzcGVjdG8gYSBsYXMgdWJpY2FjaW9uZXMuDQpTaSBzb2xvIGVzY3JpYmltb3MgZWwgbm9tYnJlIGRlbCBvYmpldG8gZGVsIMOhcmJvbCwgUiBkZXNwbGllZ2EgbGEgc2FsaWRhIGNvcnJlc3Bvbm5kaWVudGUgcGFyYSBjYWRhIHJhbWEgZGVsIMOhcmJvbC4gTGFzIHJhbWFzIHF1ZSBsbGV2YW4gYSBub2RvcyB0ZXJtaW5hbGVzIGVzdMOhbiBpbmRpY2Fkb3MgdXNhbmRvIGFzdGVyaXNjb3MuDQoNCmBgYHtyfQ0KdHJlZS5jYXJzZWF0cw0KYGBgDQoNCkEgbWFuZXJhIGRlIGV2YWx1YXIgYmllbiBlbCBkZXNlbXBlw7FvIGRlbCDDoXJib2wgZGUgY2xhc2lmaWNhY2nDs24gZW4gZXN0ZSBkYXRhc2V0LCBzZSBkZSBlc3RpbWFyIGVsIGVycm9yIGRlIHRlc3RpbmcgeSBjb21wYXJhcmxvIGNvbiBlbCBlcnJvciBkZSB0cmFpbmluZy4gU2UgZGl2aWRpcsOhbiBsYXMgb2JzZXJ2YWNpb25lcyBlbiB1biB0cmFpbmluZyBzZXQgeSB1biB0ZXN0IHNldC4gU2UgY29uc3RydWlyw6EgZWwgw6FyYm9sIHVzYW5kbyBlbCB0cmFpbmluZyBzZXQgeSBzZSBldmFsdWFyw6Egc3UgZGVzZW1wZcOxbyBjb24gZWwgdGVzdCBzZXQuIExhIGZ1bmNpw7NuIGBwcmVkaWN0KClgIHB1ZWRlIHNlciB1c2FkYSBwYXJhIGVzdGUgcHJvcMOzc2l0by4gRW4gZWwgY2FzbyBkZWwgw6FyYm9sIGRlIGNsYXNpZmljYWNpw7NuLCBlbCBhcmd1bWVudG8gYHR5cGUgPSAiY2xhc3MiYCBkZXZ1bGV2ZSBsYSBjbGFzZSBhY3R1YWwgZGUgZXNhIHByZWRlY2Npw7NuLiBFc3RlIGVuZm9xdWUgbGxldmEgYSBwcmVkaWNjaW9uZXMgY29ycmVjdGFzIGFscmVkZWRvciBkZSAkNzEuNVwlJCBkZSBsYXMgbG9jYWxpemFjaW9uZXMgZW4gZWwgdGVzdCBzZXQuDQoNCmBgYHtyfQ0Kc2V0LnNlZWQoMikNCnRyYWluIDwtIHNhbXBsZSgxOm5yb3coQ2Fyc2VhdHMyKSwgMjAwKQ0KQ2Fyc2VhdHMudGVzdCA8LSBDYXJzZWF0czJbLXRyYWluLF0NCkhpZ2gudGVzdCA8LSBIaWdoWy10cmFpbl0NCnRyZWUuY2Fyc2VhdHMgPC0gdHJlZShIaWdoIH4gLi1TYWxlcyxDYXJzZWF0czIsIHN1YnNldCA9IHRyYWluKQ0KdHJlZS5wcmVkIDwtIHByZWRpY3QodHJlZS5jYXJzZWF0cywgQ2Fyc2VhdHMudGVzdCwgdHlwZSA9ICJjbGFzcyIpDQp0YWJsZSh0cmVlLnByZWQsIEhpZ2gudGVzdCkNCmBgYA0KDQpgYGB7cn0NCig4Nis1NykvMjAwDQpgYGANCg0KTGEgZnVuY2nDs24gYGN2LnRyZWUoKWAgcmVhbGl6YSB1biBjcm9zcy12YWxpZGF0aW9uIHBhcmEgZGV0ZXJtaW5hciBlbCBuaXZlbCDDs3B0aW1vIGRlIGxhIGNvbXBsZWppZGFkIGRlbCDDoXJib2wuIFNlIHVzYSBlbCBhcmd1bWVudG8gYEZVTiA9IHBydW5lLm1pc2NsYXNzYCBwYXJhIGluZGljYXIgcXVlIHNlIHF1aWVyZSB1bmEgdGFzYSBkZSBlcnJvciBkZSBjbGFzaWZpY2FjacOzbiBwYXJhIGd1aWFyIGxhIGNyb3NzLXZhbGlkYXRpb24gY29tcGFyYWRvIGNvbiBlbCBkZWZhdWx0IHBhcmEgYGN2LnRyZWUoKWAuDQoNCmBgYHtyfQ0Kc2V0LnNlZWQoMykNCmN2LmNhcnNlYXRzIDwtIGN2LnRyZWUodHJlZS5jYXJzZWF0cywgRlVOID0gcHJ1bmUubWlzY2xhc3MpDQpuYW1lcyhjdi5jYXJzZWF0cykNCmN2LmNhcnNlYXRzJHNpemUNCmN2LmNhcnNlYXRzJGRldg0KY3YuY2Fyc2VhdHMkaw0KY3YuY2Fyc2VhdHMkbWV0aG9kDQphdHRyKGN2LmNhcnNlYXRzLCJjbGFzcyIpDQpgYGANCg0KTGEgdmFyaWFibGUgYGRldmAgY29ycmVzcG9uZGUgYWwgZXJyb3IgZGUgY3Jvc3MtdmFsaWRhdGlvbi4gRWwgw6FyYm9sIGNvbiAkOSQgbm9kb3MgdGVybWluYWxlcyByZXN1bHRhIGVuIGVsIGVycm9yIG3DoXMgcGVxdWXDsW8gZGUgY3Jvc3MtdmFsaWRhdGlvbi4gQ29uICQ1MCQgZXJyb3JlcyBkZSBjcm9zcy12YWxpZGF0aW9uLiANCkFob3JhIHNlIGdyYWZpY2EgZWwgZXJyb3IgY29tbyB1bmEgZnVuY2nDs24gZGUgYHNpemVgIHkgZGUgYGtgOg0KDQpgYGB7cn0NCnBhcihtZnJvdyA9IGMoMSwyKSkNCnBsb3QoY3YuY2Fyc2VhdHMkc2l6ZSwgY3YuY2Fyc2VhdHMkZGVjLCB0eXBlID0gImIiKQ0KcGxvdChjdi5jYXJzZWF0cyRrLCBjdi5jYXJzZWF0cyRkZXYsIHR5cGUgPSAiYiIpDQpgYGANCg0KQXBsaWNhbW9zIGxhIGZ1bmNpw7NuIGBwcnVuZS5taXNjbGFzcygpYDoNCmBgYHtyfQ0KcHJ1bmUuY2Fyc2VhdHMgPC0gcHJ1bmUubWlzY2xhc3ModHJlZS5jYXJzZWF0cywgYmVzdCA9IDkpDQpwbG90KHBydW5lLmNhcnNlYXRzKQ0KdGV4dChwcnVuZS5jYXJzZWF0cywgcHJldHR5ID0gMCkNCmBgYA0KDQpBcGxpY2Ftb3MgbGEgZnVuY2nDs24gYHByZWRpY3QoKWA6DQpgYGB7cn0NCnRyZWUucHJlZCA8LSBwcmVkaWN0KHBydW5lLmNhcnNlYXRzLCBDYXJzZWF0cy50ZXN0LCB0eXBlID0gImNsYXNzIikNCnRhYmxlKHRyZWUucHJlZCwgSGlnaC50ZXN0KQ0KYGBgDQpgYGB7cn0NCig5NCs2MCkvMjAwDQpgYGANCg0KQWhvcmEgZWwgJDc3XCUkIGRlIGxhcyBvYnNlcnZhY2lvbmVzIGRlbCB0ZXN0IGVzdMOhbiBjb3JyZWN0YW1lbnRlIGNsYXNpZmljYWRhcy4gU2kgc2UgaW5jcmVtZW50YSBlbCB2YWxvciBwYXJhIGBiZXN0YC4NCmBgYHtyfQ0KcHJ1bmUuY2Fyc2VhdHMgPC0gcHJ1bmUubWlzY2xhc3ModHJlZS5jYXJzZWF0cywgYmVzdCA9IDE1KQ0KcGxvdChwcnVuZS5jYXJzZWF0cykNCnRleHQocHJ1bmUuY2Fyc2VhdHMsIHByZXR0eSA9IDApDQpgYGANCg0KYGBge3J9DQp0cmVlLnByZWQgPC0gcHJlZGljdChwcnVuZS5jYXJzZWF0cywgQ2Fyc2VhdHMudGVzdCwgdHlwZSA9ICJjbGFzcyIpDQp0YWJsZSh0cmVlLnByZWQsIEhpZ2gudGVzdCkNCmBgYA0KYGBge3J9DQooODYrNjIpLzIwMA0KYGBgDQoNCiMjIyA4LjMuMiBGaXR0aW5nIFJlZ3Jlc3Npb24gVHJlZXMNCkFob3JhIHNlIGhhcsOhIHVuIMOhcmJvbCBwYXJhIGVsIGRhdGFzZXQgYEJvc3RvbmAuIFByaW1lcm8gY3JlYW1vcyBlbCB0cmFpbmluZyBzZXQgeSBjcmVhbW9zIGVsIMOhcmJvbCBwYXJhIGVsIHRyYWluaW5nLg0KYGBge3J9DQpsaWJyYXJ5KE1BU1MpDQpgYGANCg0KYGBge3J9DQpzZXQuc2VlZCgxKQ0KdHJhaW4gPC0gc2FtcGxlKDE6bnJvdyhCb3N0b24pLCBucm93KEJvc3RvbikvMikNCnRyZWUuYm9zdG9uIDwtIHRyZWUobWVkdiB+IC4sIEJvc3Rvbiwgc3Vic2V0ID0gdHJhaW4pDQpzdW1tYXJ5KHRyZWUuYm9zdG9uKQ0KYGBgDQoNCkhheSBxdWUgbm90YXIgcXVlIGxhIHNhbGlkYSBkZSBgc3VtbWFyeSgpYCBpbmRpY2EgcXVlIHNvbGFtZW50ZSB0cmVzIGRlIGxhcyB2YXJpYWJsZXMgZnVlcm9uIHVzYWRhcyBwYXJhIGNvbnN0cnVpciBlbCDDoXJib2wuIFBhcmEgZXN0ZSBjYXNvIGxhIGRlc3ZpYWNpw7NuIGVzIHNvbGFtZW50ZSBsYSBzdW1hIGRlIGxvcyBjdWFkcmFkb3MgZGUgbG9zIGVycm9yZXMgcGFyYSBlbCDDoXJib2wuIEFob3JhIHNlIGdyYWZpY2EgZWwgw6FyYm9sLg0KYGBge3J9DQpwbG90KHRyZWUuYm9zdG9uKQ0KdGV4dCh0cmVlLmJvc3RvbiwgcHJldHR5ID0gMCkNCmBgYA0KDQpFbCDDoXJib2wgaW5kaWNhIHF1ZSBwYXJhIHZhbG9yZXMgbcOhcyBiYWpvcyBkZSBgbHN0YXRgIGNvcnJlc3BvbmRlbiBhIGNhc2FzIG3DoXMgY2FyYXMuIEVsIMOhcmJvbCBwcmVkaWNlIGNvbW8gbWVkaWEgdW4gcHJlY2lvIGRlICRcJDQ2LDQwMCQgcGFyYSBjYXNhcyBncmFuZGVzIGVuIGxvcyBzdWJ1cmJpb3MuDQpBaG9yYSBzZSB1c2EgbGEgZnVuY2nDs24gYGN2LnRyZWUoKWAgcGFyYSBtZWpvcmFyIGVsIGRlc2VtcGXDsW8uDQpgYGB7cn0NCmN2LmJvc3RvbiA8LSBjdi50cmVlKHRyZWUuYm9zdG9uKQ0KcGxvdChjdi5ib3N0b24kc2l6ZSwgY3YuYm9zdG9uJGRldiwgdHlwZSA9ICdiJykNCmBgYA0KDQpFbiBlc3RlIGNhc28gZWwgw6FyYm9sIG3DoXMgY29tcGxlam8gc2Ugc2VsZWNjaW9uYSBwb3IgY3Jvc3MtdmFsaWRhdGlvbi4NCmBgYHtyfQ0KcHJ1bmUuYm9zdG9uIDwtIHBydW5lLnRyZWUodHJlZS5ib3N0b24sIGJlc3QgPSA1KQ0KcGxvdChwcnVuZS5ib3N0b24pDQp0ZXh0KHBydW5lLmJvc3RvbiwgcHJldHR5ID0gMCkNCmBgYA0KDQpgYGB7cn0NCnloYXQgPC0gcHJlZGljdCh0cmVlLmJvc3RvbiwgbmV3ZGF0YSA9IEJvc3RvblstdHJhaW4sXSkNCmJvc3Rvbi50ZXN0ID0gQm9zdG9uWy10cmFpbiwgIm1lZHYiXQ0KcGxvdCh5aGF0LCBib3N0b24udGVzdCkNCmFibGluZSgwLDEpDQpgYGANCg0KYGBge3J9DQptZWFuKCh5aGF0IC0gYm9zdG9uLnRlc3QpXjIpDQpgYGANCg0KUG9yIGxvIHF1ZSBlbCBNU0UgcGFyYSBlbCB0ZXN0IHNldCBhc29jaWFkbyBjb24gbGEgcmVncmVzacOzbiBkZWwgw6FyYm9sIGVzIGRlICQyNS4wNSQuDQoNCiMjIyA4LjMuMyBCYWdnaW5nIGFuZCBSYW5kb20gRm9yZXN0cyANCkFob3JhIHNlIGFwbGljYXLDoSBlbCBtw6l0b2RvIGRlIGJhZ2dpbmcgeSByYW5kb20gZm9yZXN0cyBhbCBkYXRhc2V0IGBCb3N0b25gIHVzYW5kbyBlbCBwYXF1ZXRlIGByYW5kb21Gb3Jlc3RgDQoNCmBgYHtyfQ0KbGlicmFyeShyYW5kb21Gb3Jlc3QpDQpgYGANCg0KYGBge3J9DQpzZXQuc2VlZCgxKQ0KYmFnLmJvc3RvbiA8LSByYW5kb21Gb3Jlc3QobWVkdiB+IC4sIGRhdGEgPSBCb3N0b24sIHN1YnNldCA9IHRyYWluLCBtdHJ5ID0gMTMsIGltcG9ydGFuY2UgPSBUUlVFKQ0KYmFnLmJvc3Rvbg0KYGBgDQoNCkVsIGFyZ3VtZW50byBgbXRyeSA9IDEzYCBpbmRpY2EgcXVlICQxMyQgcHJlZGljY2lvbmVzIGRlYmVuIHNlciBjb25zaWRlcmFkYXMgcGFyYSBjYWRhIHNwbGl0IGRlbCDDoXJib2wuIFBvciBsbyBxdWUgZGViZSBoYWNlcnNlIGJhZ2dpbmcuDQpgYGB7cn0NCnloYXQuYmFnIDwtIHByZWRpY3QoYmFnLmJvc3RvbiwgbmV3ZGF0YSA9IEJvc3RvblstdHJhaW4sXSkNCnBsb3QoeWhhdC5iYWcsIGJvc3Rvbi50ZXN0KQ0KYWJsaW5lKDAsMSkNCmBgYA0KYGBge3J9DQptZWFuKCh5aGF0LmJhZyAtIGJvc3Rvbi50ZXN0KV4yKQ0KYGBgDQoNCkFob3JhIHNlIGFwbGljYXLDoW4gbG9zIFJhbmRvbUZvcmVzdHM6DQpgYGB7cn0NCnNldC5zZWVkKDEpDQpyZi5ib3N0b24gPC0gcmFuZG9tRm9yZXN0KG1lZHYgfiAuLCBkYXRhID0gQm9zdG9uLCBzdWJzZXQgPSB0cmFpbiwgbXRyeSA9IDYsIGltcG9ydGFuY2UgPSBUUlVFKQ0KeWhhdC5yZiA8LSBwcmVkaWN0KHJmLmJvc3RvbiwgbmV3ZGF0YSA9IEJvc3RvblstdHJhaW4sXSkNCm1lYW4oKHloYXQucmYgLSBib3N0b24udGVzdCleMikNCmBgYA0KUG9yIGxvIHF1ZSBlbCBNU0UgZGVsIHRlc3QgZXMgZGUgJDExLjMxXCUkIHBvciBsbyBxdWUgc2UgdmUgcXVlIGVsIHJhbmRvbSBmb3Jlc3QgaGFjZSB1bmEgbWVqb3JhIGNvbXBhcmFkbyBjb24gZWwgYmFnZ2luZy4NCkxhIGZ1bmNpw7NuIGBpbXBvcnRhbmNlKClgIHB1ZWRlIGRlc3BsZWdhciBsYSBpbXBvcnRhbmNpYSBkZSBjYWRhIHZhcmlhYmxlLg0KYGBge3J9DQppbXBvcnRhbmNlKHJmLmJvc3RvbikNCmBgYA0KDQpTZSBwdWVkZSBncmFmaWNhciBsYSBpbXBvcnRhbmNpYSBkZSBsYXMgdmFyaWFibGVzOg0KYGBge3J9DQp2YXJJbXBQbG90KHJmLmJvc3RvbikNCmBgYA0KDQojIyMgOC4zLjQgQm9vc3RpbmcNCg0KU2UgdXNhIGVsIHBhcXVldGUgYGdibWAgeSBsYSBmdW5jacOzbiBgZ2JtKClgIHBhcmEgdW5hIHJlZ3Jlc2nDs24gZGUgdGlwbyBib29zdGVkIGVuIGxvcyDDoXJib2xlcyBkZWwgZGF0YXNldCBCb3N0b24uIA0KDQpgYGB7cn0NCmxpYnJhcnkoZ2JtKQ0KYGBgDQoNCmBgYHtyfQ0Kc2V0LnNlZWQoMSkNCmJvb3N0LmJvc3RvbiA8LSBnYm0obWVkdiB+IC4sIGRhdGEgPSBCb3N0b25bdHJhaW4sXSwgZGlzdHJpYnV0aW9uID0gImdhdXNzaWFuIiwgbi50cmVlcyA9IDUwMDAsIGludGVyYWN0aW9uLmRlcHRoID0gNCkNCmBgYA0KDQpMYSBmdW5jacOzbiBgc3VtbWFyeSgpYCBwcm9kdWNlIHVuYSBpbmZsdWVuY2lhIHJlbGF0aXZhOg0KYGBge3J9DQpzdW1tYXJ5KGJvb3N0LmJvc3RvbikNCmBgYA0KDQpTZSBwdWVkZSB2ZXIgcXVlIGBsc3RhdGAgeSBgcm1gIHNvbiBwb3IgbXVjaG8gbGFzIHZhcmlhYmxlcyBtw6FzIGltcG9ydGFudGVzLiBFbiBlc3RlIGNhc28gc2UgcHVlZGUgZXPDqXJhciBxdWUgbGEgbWVkaWEgZGVsIHByZWNpbyBkZSBsYXMgY2FzYXMgaW5jcmVtZW50ZW4gY29uIGBybWAgeSBkZWNyZW1lbnRlbiBjb24gYGxzdGF0YC4NCmBgYHtyfQ0KcGFyKG1mcm93ID0gYygxLDIpKQ0KcGxvdChib29zdC5ib3N0b24sIGkgPSAicm0iKQ0KYGBgDQoNCmBgYHtyfQ0KcGxvdChib29zdC5ib3N0b24sIGkgPSAibHN0YXQiKQ0KYGBgDQoNCkFob3JhIHNlIHVzYXJhIGVsIG1vZGVsbyBib29zdGVkIHBhcmEgcHJlZGVjaXIgYG1lZHZgIGVuIGVsIHRlc3Qgc2V0Lg0KYGBge3J9DQp5aGF0LmJvb3N0IDwtIHByZWRpY3QoYm9vc3QuYm9zdG9uLCBuZXdkYXRhID0gQm9zdG9uWy10cmFpbixdLCBuLnRyZWVzID0gNTAwMCkNCm1lYW4oKHloYXQuYm9vc3QgLSBib3N0b24udGVzdCleMikNCmBgYA0KDQpgYGB7cn0NCmJvb3N0LmJvc3RvbiA8LSBnYm0obWVkdiB+IC4sIGRhdGEgPSBCb3N0b25bdHJhaW4sXSwgZGlzdHJpYnV0aW9uID0gImdhdXNzaWFuIiwgbi50cmVlcyA9IDUwMDAsIGludGVyYWN0aW9uLmRlcHRoID0gNCwgc2hyaW5rYWdlID0gMC4yLCB2ZXJib3NlID0gRikNCnloYXQuYm9vc3QgPC0gcHJlZGljdChib29zdC5ib3N0b24sIG5ld2RhdGEgPSBCb3N0b25bLXRyYWluLF0sIG4udHJlZXMgPSA1MDAwKQ0KbWVhbigoeWhhdC5ib29zdCAtIGJvc3Rvbi50ZXN0KV4yKQ0KYGBgDQoNCg0KDQo=