R Notebook

Which variables are significant, or have factors that are significant? (Use 0.1 as your significance threshold, so variables with a period or dot in the stars column should be counted too. You might see a warning message here - you can ignore it and proceed. This message is a warning that we might be overfitting our model to the training set.) Select all that apply.

census = read.csv("data/census.csv")
library(caTools)
set.seed(2000)
spl = sample.split(census$over50k, SplitRatio = 0.6)
train = subset(census, spl==TRUE)
test = subset(census, spl==FALSE)
censusglm = glm( over50k ~ . , family="binomial", data = train)

glm.fit: fitted probabilities numerically 0 or 1 occurred

summary(censusglm)


Call:
glm(formula = over50k ~ ., family = "binomial", data = train)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-5.1065  -0.5037  -0.1804  -0.0008   3.3383  

Coefficients: (1 not defined because of singularities)
                                           Estimate Std. Error z value Pr(>|z|)
(Intercept)                              -8.658e+00  1.379e+00  -6.279 3.41e-10
age                                       2.548e-02  2.139e-03  11.916  < 2e-16
workclass Federal-gov                     1.105e+00  2.014e-01   5.489 4.03e-08
workclass Local-gov                       3.675e-01  1.821e-01   2.018 0.043641
workclass Never-worked                   -1.283e+01  8.453e+02  -0.015 0.987885
workclass Private                         6.012e-01  1.626e-01   3.698 0.000218
workclass Self-emp-inc                    7.575e-01  1.950e-01   3.884 0.000103
workclass Self-emp-not-inc                1.855e-01  1.774e-01   1.046 0.295646
workclass State-gov                       4.012e-01  1.961e-01   2.046 0.040728
workclass Without-pay                    -1.395e+01  6.597e+02  -0.021 0.983134
education 11th                            2.225e-01  2.867e-01   0.776 0.437738
education 12th                            6.380e-01  3.597e-01   1.774 0.076064
education 1st-4th                        -7.075e-01  7.760e-01  -0.912 0.361897
education 5th-6th                        -3.170e-01  4.880e-01  -0.650 0.516008
education 7th-8th                        -3.498e-01  3.126e-01  -1.119 0.263152
education 9th                            -1.258e-01  3.539e-01  -0.355 0.722228
education Assoc-acdm                      1.602e+00  2.427e-01   6.601 4.10e-11
education Assoc-voc                       1.541e+00  2.368e-01   6.506 7.74e-11
education Bachelors                       2.177e+00  2.218e-01   9.817  < 2e-16
education Doctorate                       2.761e+00  2.893e-01   9.544  < 2e-16
education HS-grad                         1.006e+00  2.169e-01   4.638 3.52e-06
education Masters                         2.421e+00  2.353e-01  10.289  < 2e-16
education Preschool                      -2.237e+01  6.864e+02  -0.033 0.973996
education Prof-school                     2.938e+00  2.753e-01  10.672  < 2e-16
education Some-college                    1.365e+00  2.195e-01   6.219 5.00e-10
maritalstatus Married-AF-spouse           2.540e+00  7.145e-01   3.555 0.000378
maritalstatus Married-civ-spouse          2.458e+00  3.573e-01   6.880 6.00e-12
maritalstatus Married-spouse-absent      -9.486e-02  3.204e-01  -0.296 0.767155
maritalstatus Never-married              -4.515e-01  1.139e-01  -3.962 7.42e-05
maritalstatus Separated                   3.609e-02  1.984e-01   0.182 0.855672
maritalstatus Widowed                     1.858e-01  1.962e-01   0.947 0.343449
occupation Adm-clerical                   9.470e-02  1.288e-01   0.735 0.462064
occupation Armed-Forces                  -1.008e+00  1.487e+00  -0.677 0.498170
occupation Craft-repair                   2.174e-01  1.109e-01   1.960 0.049972
occupation Exec-managerial                9.400e-01  1.138e-01   8.257  < 2e-16
occupation Farming-fishing               -1.068e+00  1.908e-01  -5.599 2.15e-08
occupation Handlers-cleaners             -6.237e-01  1.946e-01  -3.204 0.001353
occupation Machine-op-inspct             -1.862e-01  1.376e-01  -1.353 0.176061
occupation Other-service                 -8.183e-01  1.641e-01  -4.987 6.14e-07
occupation Priv-house-serv               -1.297e+01  2.267e+02  -0.057 0.954385
occupation Prof-specialty                 6.331e-01  1.222e-01   5.180 2.22e-07
occupation Protective-serv                6.267e-01  1.710e-01   3.664 0.000248
occupation Sales                          3.276e-01  1.175e-01   2.789 0.005282
occupation Tech-support                   6.173e-01  1.533e-01   4.028 5.63e-05
occupation Transport-moving                      NA         NA      NA       NA
relationship Not-in-family                7.881e-01  3.530e-01   2.233 0.025562
relationship Other-relative              -2.194e-01  3.137e-01  -0.699 0.484263
relationship Own-child                   -7.489e-01  3.507e-01  -2.136 0.032716
relationship Unmarried                    7.041e-01  3.720e-01   1.893 0.058392
relationship Wife                         1.324e+00  1.331e-01   9.942  < 2e-16
race Asian-Pac-Islander                   4.830e-01  3.548e-01   1.361 0.173504
race Black                                3.644e-01  2.882e-01   1.265 0.206001
race Other                                2.204e-01  4.513e-01   0.488 0.625263
race White                                4.108e-01  2.737e-01   1.501 0.133356
sex Male                                  7.729e-01  1.024e-01   7.545 4.52e-14
capitalgain                               3.280e-04  1.372e-05  23.904  < 2e-16
capitalloss                               6.445e-04  4.854e-05  13.277  < 2e-16
hoursperweek                              2.897e-02  2.101e-03  13.791  < 2e-16
nativecountry Canada                      2.593e-01  1.308e+00   0.198 0.842879
nativecountry China                      -9.695e-01  1.327e+00  -0.730 0.465157
nativecountry Columbia                   -1.954e+00  1.526e+00  -1.280 0.200470
nativecountry Cuba                        5.735e-02  1.323e+00   0.043 0.965432
nativecountry Dominican-Republic         -1.435e+01  3.092e+02  -0.046 0.962972
nativecountry Ecuador                    -3.550e-02  1.477e+00  -0.024 0.980829
nativecountry El-Salvador                -6.095e-01  1.395e+00  -0.437 0.662181
nativecountry England                    -6.707e-02  1.327e+00  -0.051 0.959686
nativecountry France                      5.301e-01  1.419e+00   0.374 0.708642
nativecountry Germany                     5.474e-02  1.306e+00   0.042 0.966572
nativecountry Greece                     -2.646e+00  1.714e+00  -1.544 0.122527
nativecountry Guatemala                  -1.293e+01  3.345e+02  -0.039 0.969180
nativecountry Haiti                      -9.221e-01  1.615e+00  -0.571 0.568105
nativecountry Holand-Netherlands         -1.282e+01  2.400e+03  -0.005 0.995736
nativecountry Honduras                   -9.584e-01  3.412e+00  -0.281 0.778775
nativecountry Hong                       -2.362e-01  1.492e+00  -0.158 0.874155
nativecountry Hungary                     1.412e-01  1.555e+00   0.091 0.927653
nativecountry India                      -8.218e-01  1.314e+00  -0.625 0.531661
nativecountry Iran                       -3.299e-02  1.366e+00  -0.024 0.980736
nativecountry Ireland                     1.579e-01  1.473e+00   0.107 0.914628
nativecountry Italy                       6.100e-01  1.333e+00   0.458 0.647194
nativecountry Jamaica                    -2.279e-01  1.387e+00  -0.164 0.869467
nativecountry Japan                       5.072e-01  1.375e+00   0.369 0.712179
nativecountry Laos                       -6.831e-01  1.661e+00  -0.411 0.680866
nativecountry Mexico                     -9.182e-01  1.303e+00  -0.705 0.481103
nativecountry Nicaragua                  -1.987e-01  1.507e+00  -0.132 0.895132
nativecountry Outlying-US(Guam-USVI-etc) -1.373e+01  8.502e+02  -0.016 0.987115
nativecountry Peru                       -9.660e-01  1.678e+00  -0.576 0.564797
nativecountry Philippines                 4.393e-02  1.281e+00   0.034 0.972640
nativecountry Poland                      2.410e-01  1.383e+00   0.174 0.861624
nativecountry Portugal                    7.276e-01  1.477e+00   0.493 0.622327
nativecountry Puerto-Rico                -5.769e-01  1.357e+00  -0.425 0.670837
nativecountry Scotland                   -1.188e+00  1.719e+00  -0.691 0.489616
nativecountry South                      -8.183e-01  1.341e+00  -0.610 0.541809
nativecountry Taiwan                     -2.590e-01  1.350e+00  -0.192 0.847878
nativecountry Thailand                   -1.693e+00  1.737e+00  -0.975 0.329678
nativecountry Trinadad&Tobago            -1.346e+00  1.721e+00  -0.782 0.434105
nativecountry United-States              -8.594e-02  1.269e+00  -0.068 0.946020
nativecountry Vietnam                    -1.008e+00  1.523e+00  -0.662 0.507799
nativecountry Yugoslavia                  1.402e+00  1.648e+00   0.851 0.394874
                                            
(Intercept)                              ***
age                                      ***
workclass Federal-gov                    ***
workclass Local-gov                      *  
workclass Never-worked                      
workclass Private                        ***
workclass Self-emp-inc                   ***
workclass Self-emp-not-inc                  
workclass State-gov                      *  
workclass Without-pay                       
education 11th                              
education 12th                           .  
education 1st-4th                           
education 5th-6th                           
education 7th-8th                           
education 9th                               
education Assoc-acdm                     ***
education Assoc-voc                      ***
education Bachelors                      ***
education Doctorate                      ***
education HS-grad                        ***
education Masters                        ***
education Preschool                         
education Prof-school                    ***
education Some-college                   ***
maritalstatus Married-AF-spouse          ***
maritalstatus Married-civ-spouse         ***
maritalstatus Married-spouse-absent         
maritalstatus Never-married              ***
maritalstatus Separated                     
maritalstatus Widowed                       
occupation Adm-clerical                     
occupation Armed-Forces                     
occupation Craft-repair                  *  
occupation Exec-managerial               ***
occupation Farming-fishing               ***
occupation Handlers-cleaners             ** 
occupation Machine-op-inspct                
occupation Other-service                 ***
occupation Priv-house-serv                  
occupation Prof-specialty                ***
occupation Protective-serv               ***
occupation Sales                         ** 
occupation Tech-support                  ***
occupation Transport-moving                 
relationship Not-in-family               *  
relationship Other-relative                 
relationship Own-child                   *  
relationship Unmarried                   .  
relationship Wife                        ***
race Asian-Pac-Islander                     
race Black                                  
race Other                                  
race White                                  
sex Male                                 ***
capitalgain                              ***
capitalloss                              ***
hoursperweek                             ***
nativecountry Canada                        
nativecountry China                         
nativecountry Columbia                      
nativecountry Cuba                          
nativecountry Dominican-Republic            
nativecountry Ecuador                       
nativecountry El-Salvador                   
nativecountry England                       
nativecountry France                        
nativecountry Germany                       
nativecountry Greece                        
nativecountry Guatemala                     
nativecountry Haiti                         
nativecountry Holand-Netherlands            
nativecountry Honduras                      
nativecountry Hong                          
nativecountry Hungary                       
nativecountry India                         
nativecountry Iran                          
nativecountry Ireland                       
nativecountry Italy                         
nativecountry Jamaica                       
nativecountry Japan                         
nativecountry Laos                          
nativecountry Mexico                        
nativecountry Nicaragua                     
nativecountry Outlying-US(Guam-USVI-etc)    
nativecountry Peru                          
nativecountry Philippines                   
nativecountry Poland                        
nativecountry Portugal                      
nativecountry Puerto-Rico                   
nativecountry Scotland                      
nativecountry South                         
nativecountry Taiwan                        
nativecountry Thailand                      
nativecountry Trinadad&Tobago               
nativecountry United-States                 
nativecountry Vietnam                       
nativecountry Yugoslavia                    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 21175  on 19186  degrees of freedom
Residual deviance: 12104  on 19090  degrees of freedom
AIC: 12298

Number of Fisher Scoring iterations: 15

print("age, workclass, education, maritalstatus, occupation, relationship, sex, capitalgain, capitalloss, houseperweek")

[1] "age, workclass, education, maritalstatus, occupation, relationship, sex, capitalgain, capitalloss, houseperweek"

Problem 1.2 - A Logistic Regression Model

What is the accuracy of the model on the testing set? Use a threshold of 0.5. (You might see a warning message when you make predictions on the test set - you can safely ignore it.)

predictTest = predict(censusglm, newdata = test, type = "response")

prediction from a rank-deficient fit may be misleading

table(test$over50k, predictTest >= 0.5)

        
         FALSE TRUE
   <=50K  9051  662
   >50K   1190 1888

(9051+1888)/(9051+662+1190+1888)

[1] 0.8552107

Problem 1.3 - A Logistic Regression Model

What is the baseline accuracy for the testing set?

table(train$over50k)


 <=50K   >50K 
 14570   4617

table(test$over50k)


 <=50K   >50K 
  9713   3078

9713/(9713+3078)

[1] 0.7593621

Problem 1.4 - A Logistic Regression Model

要算AUC面積，要用ROCR

What is the area-under-the-curve (AUC) for this model on the test set?

library(ROCR)
ROCRpred = prediction(predictTest, test$over50k)
as.numeric(performance(ROCRpred, "auc")@y.values)

[1] 0.9061598

Problem 2.1 - A CART Model

How many splits does the tree have in total?

library(rpart)
library(rpart.plot)
censustree = rpart( over50k ~ . , method="class", data = train)
prp(censustree)

print(4)

[1] 4

Problem 2.2 - A CART Model

Which variable does the tree split on at the first level (the very first split of the tree)?

prp(censustree)

print("relation")

[1] "relation"

Problem 2.3 - A CART Model

Which variables does the tree split on at the second level (immediately after the first split of the tree)? Select all that apply.

prp(censustree)

print("education, capitalgain")

[1] "education, capitalgain"

Problem 2.4 - A CART Model

What is the accuracy of the model on the testing set? Use a threshold of 0.5. (You can either add the argument type=“class”, or generate probabilities and use a threshold of 0.5 like in logistic regression.)

predictTest = predict(censustree, newdata = test, type = "class")
table(test$over50k, predictTest)

        predictTest
          <=50K  >50K
   <=50K   9243   470
   >50K    1482  1596

(9243+1596)/(9243+470+1482+1596)

[1] 0.8473927

Problem 2.5 - A CART Model

print("The probabilities from the CART model take only a handful of values (five, one for each end bucket/leaf of the tree); the changes in the ROC curve correspond to setting the threshold to one of those values.")

[1] "The probabilities from the CART model take only a handful of values (five, one for each end bucket/leaf of the tree); the changes in the ROC curve correspond to setting the threshold to one of those values."

Problem 2.6 - A CART Model

library(ROCR)
predictTest = predict(censustree, newdata = test)
predictTest = predictTest[,2]
ROCRpred = prediction(predictTest, test$over50k)
as.numeric(performance(ROCRpred, "auc")@y.values)

[1] 0.8470256

Problem 3.1 - A Random Forest Model

set.seed(1)
trainSmall = train[sample(nrow(train), 2000), ]
set.seed(1)
library(randomForest)
censusrf = randomForest(over50k ~ . , data = trainSmall)
predictTest = predict(censusrf, newdata=test)
table(test$over50k, predictTest)

        predictTest
          <=50K  >50K
   <=50K   8843   870
   >50K    1029  2049

(8843+2049)/(8843+870+1029+2049)

[1] 0.8515362

Problem 3.2 - A Random Forest Model

This code produces a chart that for each variable measures the number of times that variable was selected for splitting (the value on the x-axis). Which of the following variables is the most important in terms of the number of splits?

vu = varUsed(censusrf, count=TRUE)
vusorted = sort(vu, decreasing = FALSE, index.return = TRUE)
dotchart(vusorted$x, names(censusrf$forest$xlevels[vusorted$ix]))

print("age")

[1] "age"

Problem 3.3 - A Random Forest Model

Which one of the following variables is the most important in terms of mean reduction in impurity?

varImpPlot(censusrf)

print("occupation")

[1] "occupation"

Problem 4.1 - Selecting cp by Cross-Validation

Which value of cp does the train function recommend?

cartGrid = expand.grid( .cp = seq(0.002,0.1,0.002))
library(caret)
set.seed(2)
fitControl = trainControl( method = "cv", number = 10 )
cartGrid = expand.grid( .cp = seq(0.002,0.1,0.002))
train( over50k ~ . , data = train, method = "rpart", trControl = fitControl, tuneGrid = cartGrid )

CART 

19187 samples
   12 predictor
    2 classes: ' <=50K', ' >50K' 

No pre-processing
Resampling: Cross-Validated (10 fold) 
Summary of sample sizes: 17268, 17268, 17269, 17269, 17269, 17268, ... 
Resampling results across tuning parameters:

  cp     Accuracy   Kappa     
  0.002  0.8510972  0.55404931
  0.004  0.8482829  0.55537475
  0.006  0.8452078  0.53914084
  0.008  0.8442176  0.53817486
  0.010  0.8433317  0.53305978
  0.012  0.8433317  0.53305978
  0.014  0.8433317  0.53305978
  0.016  0.8413510  0.52349296
  0.018  0.8400480  0.51528594
  0.020  0.8381193  0.50351272
  0.022  0.8381193  0.50351272
  0.024  0.8381193  0.50351272
  0.026  0.8381193  0.50351272
  0.028  0.8381193  0.50351272
  0.030  0.8381193  0.50351272
  0.032  0.8381193  0.50351272
  0.034  0.8352011  0.48749911
  0.036  0.8326470  0.47340390
  0.038  0.8267570  0.44688035
  0.040  0.8248289  0.43893150
  0.042  0.8248289  0.43893150
  0.044  0.8248289  0.43893150
  0.046  0.8248289  0.43893150
  0.048  0.8248289  0.43893150
  0.050  0.8231084  0.42467058
  0.052  0.8174798  0.37478096
  0.054  0.8138837  0.33679015
  0.056  0.8118514  0.30751485
  0.058  0.8118514  0.30751485
  0.060  0.8118514  0.30751485
  0.062  0.8118514  0.30751485
  0.064  0.8118514  0.30751485
  0.066  0.8099233  0.29697206
  0.068  0.7971025  0.22226318
  0.070  0.7958512  0.21465656
  0.072  0.7958512  0.21465656
  0.074  0.7958512  0.21465656
  0.076  0.7689601  0.05701508
  0.078  0.7593684  0.00000000
  0.080  0.7593684  0.00000000
  0.082  0.7593684  0.00000000
  0.084  0.7593684  0.00000000
  0.086  0.7593684  0.00000000
  0.088  0.7593684  0.00000000
  0.090  0.7593684  0.00000000
  0.092  0.7593684  0.00000000
  0.094  0.7593684  0.00000000
  0.096  0.7593684  0.00000000
  0.098  0.7593684  0.00000000
  0.100  0.7593684  0.00000000

Accuracy was used to select the optimal model using the largest value.
The final value used for the model was cp = 0.002.

print(0.002)

[1] 0.002

Problem 4.2 - Selecting cp by Cross-Validation

Fit a CART model to the training data using this value of cp. What is the prediction accuracy on the test set?

model = rpart(over50k~., data=train, method="class", cp=0.002)
predictTest = predict(model, newdata=test, type="class")
table(test$over50k, predictTest)

        predictTest
          <=50K  >50K
   <=50K   9178   535
   >50K    1240  1838

(9178+1838)/(9178+535+1240+1838)

[1] 0.8612306

Problem 4.3 - Selecting cp by Cross-Validation

Compared to the original accuracy using the default value of cp, this new CART model is an improvement, and so we should clearly favor this new model over the old one – or should we? Plot the CART tree for this model. How many splits are there?

prp(model)

print(18)

[1] 18

This highlights one important tradeoff in building predictive models. By tuning cp, we improved our accuracy by over 1%, but our tree became significantly more complicated. In some applications, such an improvement in accuracy would be worth the loss in interpretability. In others, we may prefer a less accurate model that is simpler to understand and describe over a more accurate – but more complicated – model.

LS0tDQp0aXRsZTogIlIgTm90ZWJvb2siDQphdXRob3I6ICLpu4Pmn4/ono0gTTA2NDExMTA0NiINCm91dHB1dDogaHRtbF9ub3RlYm9vaw0KLS0tDQpXaGljaCB2YXJpYWJsZXMgYXJlIHNpZ25pZmljYW50LCBvciBoYXZlIGZhY3RvcnMgdGhhdCBhcmUgc2lnbmlmaWNhbnQ/IChVc2UgMC4xIGFzIHlvdXIgc2lnbmlmaWNhbmNlIHRocmVzaG9sZCwgc28gdmFyaWFibGVzIHdpdGggYSBwZXJpb2Qgb3IgZG90IGluIHRoZSBzdGFycyBjb2x1bW4gc2hvdWxkIGJlIGNvdW50ZWQgdG9vLiBZb3UgbWlnaHQgc2VlIGEgd2FybmluZyBtZXNzYWdlIGhlcmUgLSB5b3UgY2FuIGlnbm9yZSBpdCBhbmQgcHJvY2VlZC4gVGhpcyBtZXNzYWdlIGlzIGEgd2FybmluZyB0aGF0IHdlIG1pZ2h0IGJlIG92ZXJmaXR0aW5nIG91ciBtb2RlbCB0byB0aGUgdHJhaW5pbmcgc2V0LikgU2VsZWN0IGFsbCB0aGF0IGFwcGx5Lg0KDQpgYGB7cn0NCmNlbnN1cyA9IHJlYWQuY3N2KCJkYXRhL2NlbnN1cy5jc3YiKQ0KbGlicmFyeShjYVRvb2xzKQ0Kc2V0LnNlZWQoMjAwMCkNCnNwbCA9IHNhbXBsZS5zcGxpdChjZW5zdXMkb3ZlcjUwaywgU3BsaXRSYXRpbyA9IDAuNikNCnRyYWluID0gc3Vic2V0KGNlbnN1cywgc3BsPT1UUlVFKQ0KdGVzdCA9IHN1YnNldChjZW5zdXMsIHNwbD09RkFMU0UpDQpjZW5zdXNnbG0gPSBnbG0oIG92ZXI1MGsgfiAuICwgZmFtaWx5PSJiaW5vbWlhbCIsIGRhdGEgPSB0cmFpbikNCnN1bW1hcnkoY2Vuc3VzZ2xtKQ0KcHJpbnQoImFnZSwgd29ya2NsYXNzLCBlZHVjYXRpb24sIG1hcml0YWxzdGF0dXMsIG9jY3VwYXRpb24sIHJlbGF0aW9uc2hpcCwgc2V4LCBjYXBpdGFsZ2FpbiwgY2FwaXRhbGxvc3MsIGhvdXNlcGVyd2VlayIpDQpgYGANCg0KIyMjI1Byb2JsZW0gMS4yIC0gQSBMb2dpc3RpYyBSZWdyZXNzaW9uIE1vZGVsDQoNCldoYXQgaXMgdGhlIGFjY3VyYWN5IG9mIHRoZSBtb2RlbCBvbiB0aGUgdGVzdGluZyBzZXQ/IFVzZSBhIHRocmVzaG9sZCBvZiAwLjUuIChZb3UgbWlnaHQgc2VlIGEgd2FybmluZyBtZXNzYWdlIHdoZW4geW91IG1ha2UgcHJlZGljdGlvbnMgb24gdGhlIHRlc3Qgc2V0IC0geW91IGNhbiBzYWZlbHkgaWdub3JlIGl0LikNCg0KYGBge3J9DQpwcmVkaWN0VGVzdCA9IHByZWRpY3QoY2Vuc3VzZ2xtLCBuZXdkYXRhID0gdGVzdCwgdHlwZSA9ICJyZXNwb25zZSIpDQp0YWJsZSh0ZXN0JG92ZXI1MGssIHByZWRpY3RUZXN0ID49IDAuNSkNCig5MDUxKzE4ODgpLyg5MDUxKzY2MisxMTkwKzE4ODgpDQpgYGANCiMjIyNQcm9ibGVtIDEuMyAtIEEgTG9naXN0aWMgUmVncmVzc2lvbiBNb2RlbA0KDQpXaGF0IGlzIHRoZSBiYXNlbGluZSBhY2N1cmFjeSBmb3IgdGhlIHRlc3Rpbmcgc2V0Pw0KDQpgYGB7cn0NCnRhYmxlKHRyYWluJG92ZXI1MGspDQp0YWJsZSh0ZXN0JG92ZXI1MGspDQo5NzEzLyg5NzEzKzMwNzgpDQpgYGANCiMjIyNQcm9ibGVtIDEuNCAtIEEgTG9naXN0aWMgUmVncmVzc2lvbiBNb2RlbA0KDQojIyPopoHnrpdBVUPpnaLnqY3vvIzopoHnlKhST0NSDQoNCldoYXQgaXMgdGhlIGFyZWEtdW5kZXItdGhlLWN1cnZlIChBVUMpIGZvciB0aGlzIG1vZGVsIG9uIHRoZSB0ZXN0IHNldD8NCg0KYGBge3J9DQpsaWJyYXJ5KFJPQ1IpDQpST0NScHJlZCA9IHByZWRpY3Rpb24ocHJlZGljdFRlc3QsIHRlc3Qkb3ZlcjUwaykNCmFzLm51bWVyaWMocGVyZm9ybWFuY2UoUk9DUnByZWQsICJhdWMiKUB5LnZhbHVlcykNCmBgYA0KIyMjI1Byb2JsZW0gMi4xIC0gQSBDQVJUIE1vZGVsDQoNCkhvdyBtYW55IHNwbGl0cyBkb2VzIHRoZSB0cmVlIGhhdmUgaW4gdG90YWw/DQoNCmBgYHtyfQ0KbGlicmFyeShycGFydCkNCmxpYnJhcnkocnBhcnQucGxvdCkNCmNlbnN1c3RyZWUgPSBycGFydCggb3ZlcjUwayB+IC4gLCBtZXRob2Q9ImNsYXNzIiwgZGF0YSA9IHRyYWluKQ0KcHJwKGNlbnN1c3RyZWUpDQpwcmludCg0KQ0KYGBgDQojIyMjUHJvYmxlbSAyLjIgLSBBIENBUlQgTW9kZWwNCg0KV2hpY2ggdmFyaWFibGUgZG9lcyB0aGUgdHJlZSBzcGxpdCBvbiBhdCB0aGUgZmlyc3QgbGV2ZWwgKHRoZSB2ZXJ5IGZpcnN0IHNwbGl0IG9mIHRoZSB0cmVlKT8NCg0KYGBge3J9DQpwcnAoY2Vuc3VzdHJlZSkNCnByaW50KCJyZWxhdGlvbiIpDQpgYGANCiMjIyNQcm9ibGVtIDIuMyAtIEEgQ0FSVCBNb2RlbA0KDQpXaGljaCB2YXJpYWJsZXMgZG9lcyB0aGUgdHJlZSBzcGxpdCBvbiBhdCB0aGUgc2Vjb25kIGxldmVsIChpbW1lZGlhdGVseSBhZnRlciB0aGUgZmlyc3Qgc3BsaXQgb2YgdGhlIHRyZWUpPyBTZWxlY3QgYWxsIHRoYXQgYXBwbHkuDQoNCmBgYHtyfQ0KcHJwKGNlbnN1c3RyZWUpDQpwcmludCgiZWR1Y2F0aW9uLCBjYXBpdGFsZ2FpbiIpDQpgYGANCiMjIyNQcm9ibGVtIDIuNCAtIEEgQ0FSVCBNb2RlbA0KDQpXaGF0IGlzIHRoZSBhY2N1cmFjeSBvZiB0aGUgbW9kZWwgb24gdGhlIHRlc3Rpbmcgc2V0PyBVc2UgYSB0aHJlc2hvbGQgb2YgMC41LiAoWW91IGNhbiBlaXRoZXIgYWRkIHRoZSBhcmd1bWVudCB0eXBlPSJjbGFzcyIsIG9yIGdlbmVyYXRlIHByb2JhYmlsaXRpZXMgYW5kIHVzZSBhIHRocmVzaG9sZCBvZiAwLjUgbGlrZSBpbiBsb2dpc3RpYyByZWdyZXNzaW9uLikNCg0KYGBge3J9DQpwcmVkaWN0VGVzdCA9IHByZWRpY3QoY2Vuc3VzdHJlZSwgbmV3ZGF0YSA9IHRlc3QsIHR5cGUgPSAiY2xhc3MiKQ0KdGFibGUodGVzdCRvdmVyNTBrLCBwcmVkaWN0VGVzdCkNCig5MjQzKzE1OTYpLyg5MjQzKzQ3MCsxNDgyKzE1OTYpDQpgYGANCiMjIyNQcm9ibGVtIDIuNSAtIEEgQ0FSVCBNb2RlbA0KDQpgYGB7cn0NCnByaW50KCJUaGUgcHJvYmFiaWxpdGllcyBmcm9tIHRoZSBDQVJUIG1vZGVsIHRha2Ugb25seSBhIGhhbmRmdWwgb2YgdmFsdWVzIChmaXZlLCBvbmUgZm9yIGVhY2ggZW5kIGJ1Y2tldC9sZWFmIG9mIHRoZSB0cmVlKTsgdGhlIGNoYW5nZXMgaW4gdGhlIFJPQyBjdXJ2ZSBjb3JyZXNwb25kIHRvIHNldHRpbmcgdGhlIHRocmVzaG9sZCB0byBvbmUgb2YgdGhvc2UgdmFsdWVzLiIpDQpgYGANCiMjIyNQcm9ibGVtIDIuNiAtIEEgQ0FSVCBNb2RlbA0KDQpgYGB7cn0NCmxpYnJhcnkoUk9DUikNCnByZWRpY3RUZXN0ID0gcHJlZGljdChjZW5zdXN0cmVlLCBuZXdkYXRhID0gdGVzdCkNCnByZWRpY3RUZXN0ID0gcHJlZGljdFRlc3RbLDJdDQpST0NScHJlZCA9IHByZWRpY3Rpb24ocHJlZGljdFRlc3QsIHRlc3Qkb3ZlcjUwaykNCmFzLm51bWVyaWMocGVyZm9ybWFuY2UoUk9DUnByZWQsICJhdWMiKUB5LnZhbHVlcykNCmBgYA0KIyMjI1Byb2JsZW0gMy4xIC0gQSBSYW5kb20gRm9yZXN0IE1vZGVsDQoNCmBgYHtyfQ0Kc2V0LnNlZWQoMSkNCnRyYWluU21hbGwgPSB0cmFpbltzYW1wbGUobnJvdyh0cmFpbiksIDIwMDApLCBdDQpzZXQuc2VlZCgxKQ0KbGlicmFyeShyYW5kb21Gb3Jlc3QpDQpjZW5zdXNyZiA9IHJhbmRvbUZvcmVzdChvdmVyNTBrIH4gLiAsIGRhdGEgPSB0cmFpblNtYWxsKQ0KcHJlZGljdFRlc3QgPSBwcmVkaWN0KGNlbnN1c3JmLCBuZXdkYXRhPXRlc3QpDQp0YWJsZSh0ZXN0JG92ZXI1MGssIHByZWRpY3RUZXN0KQ0KKDg4NDMrMjA0OSkvKDg4NDMrODcwKzEwMjkrMjA0OSkNCmBgYA0KIyMjI1Byb2JsZW0gMy4yIC0gQSBSYW5kb20gRm9yZXN0IE1vZGVsDQoNClRoaXMgY29kZSBwcm9kdWNlcyBhIGNoYXJ0IHRoYXQgZm9yIGVhY2ggdmFyaWFibGUgbWVhc3VyZXMgdGhlIG51bWJlciBvZiB0aW1lcyB0aGF0IHZhcmlhYmxlIHdhcyBzZWxlY3RlZCBmb3Igc3BsaXR0aW5nICh0aGUgdmFsdWUgb24gdGhlIHgtYXhpcykuIFdoaWNoIG9mIHRoZSBmb2xsb3dpbmcgdmFyaWFibGVzIGlzIHRoZSBtb3N0IGltcG9ydGFudCBpbiB0ZXJtcyBvZiB0aGUgbnVtYmVyIG9mIHNwbGl0cz8NCmBgYHtyfQ0KdnUgPSB2YXJVc2VkKGNlbnN1c3JmLCBjb3VudD1UUlVFKQ0KdnVzb3J0ZWQgPSBzb3J0KHZ1LCBkZWNyZWFzaW5nID0gRkFMU0UsIGluZGV4LnJldHVybiA9IFRSVUUpDQpkb3RjaGFydCh2dXNvcnRlZCR4LCBuYW1lcyhjZW5zdXNyZiRmb3Jlc3QkeGxldmVsc1t2dXNvcnRlZCRpeF0pKQ0KcHJpbnQoImFnZSIpDQpgYGANCiMjIyNQcm9ibGVtIDMuMyAtIEEgUmFuZG9tIEZvcmVzdCBNb2RlbA0KDQpXaGljaCBvbmUgb2YgdGhlIGZvbGxvd2luZyB2YXJpYWJsZXMgaXMgdGhlIG1vc3QgaW1wb3J0YW50IGluIHRlcm1zIG9mIG1lYW4gcmVkdWN0aW9uIGluIGltcHVyaXR5Pw0KDQpgYGB7cn0NCnZhckltcFBsb3QoY2Vuc3VzcmYpDQpwcmludCgib2NjdXBhdGlvbiIpDQpgYGANCiMjIyNQcm9ibGVtIDQuMSAtIFNlbGVjdGluZyBjcCBieSBDcm9zcy1WYWxpZGF0aW9uDQoNCldoaWNoIHZhbHVlIG9mIGNwIGRvZXMgdGhlIHRyYWluIGZ1bmN0aW9uIHJlY29tbWVuZD8NCg0KYGBge3J9DQpjYXJ0R3JpZCA9IGV4cGFuZC5ncmlkKCAuY3AgPSBzZXEoMC4wMDIsMC4xLDAuMDAyKSkNCmxpYnJhcnkoY2FyZXQpDQpzZXQuc2VlZCgyKQ0KZml0Q29udHJvbCA9IHRyYWluQ29udHJvbCggbWV0aG9kID0gImN2IiwgbnVtYmVyID0gMTAgKQ0KY2FydEdyaWQgPSBleHBhbmQuZ3JpZCggLmNwID0gc2VxKDAuMDAyLDAuMSwwLjAwMikpDQp0cmFpbiggb3ZlcjUwayB+IC4gLCBkYXRhID0gdHJhaW4sIG1ldGhvZCA9ICJycGFydCIsIHRyQ29udHJvbCA9IGZpdENvbnRyb2wsIHR1bmVHcmlkID0gY2FydEdyaWQgKQ0KcHJpbnQoMC4wMDIpDQpgYGANCiMjIyNQcm9ibGVtIDQuMiAtIFNlbGVjdGluZyBjcCBieSBDcm9zcy1WYWxpZGF0aW9uDQoNCkZpdCBhIENBUlQgbW9kZWwgdG8gdGhlIHRyYWluaW5nIGRhdGEgdXNpbmcgdGhpcyB2YWx1ZSBvZiBjcC4gV2hhdCBpcyB0aGUgcHJlZGljdGlvbiBhY2N1cmFjeSBvbiB0aGUgdGVzdCBzZXQ/DQoNCmBgYHtyfQ0KbW9kZWwgPSBycGFydChvdmVyNTBrfi4sIGRhdGE9dHJhaW4sIG1ldGhvZD0iY2xhc3MiLCBjcD0wLjAwMikNCnByZWRpY3RUZXN0ID0gcHJlZGljdChtb2RlbCwgbmV3ZGF0YT10ZXN0LCB0eXBlPSJjbGFzcyIpDQp0YWJsZSh0ZXN0JG92ZXI1MGssIHByZWRpY3RUZXN0KQ0KKDkxNzgrMTgzOCkvKDkxNzgrNTM1KzEyNDArMTgzOCkNCmBgYA0KIyMjI1Byb2JsZW0gNC4zIC0gU2VsZWN0aW5nIGNwIGJ5IENyb3NzLVZhbGlkYXRpb24NCg0KQ29tcGFyZWQgdG8gdGhlIG9yaWdpbmFsIGFjY3VyYWN5IHVzaW5nIHRoZSBkZWZhdWx0IHZhbHVlIG9mIGNwLCB0aGlzIG5ldyBDQVJUIG1vZGVsIGlzIGFuIGltcHJvdmVtZW50LCBhbmQgc28gd2Ugc2hvdWxkIGNsZWFybHkgZmF2b3IgdGhpcyBuZXcgbW9kZWwgb3ZlciB0aGUgb2xkIG9uZSAtLSBvciBzaG91bGQgd2U/IFBsb3QgdGhlIENBUlQgdHJlZSBmb3IgdGhpcyBtb2RlbC4gSG93IG1hbnkgc3BsaXRzIGFyZSB0aGVyZT8NCg0KYGBge3J9DQpwcnAobW9kZWwpDQpwcmludCgxOCkNCmBgYA0KVGhpcyBoaWdobGlnaHRzIG9uZSBpbXBvcnRhbnQgdHJhZGVvZmYgaW4gYnVpbGRpbmcgcHJlZGljdGl2ZSBtb2RlbHMuIEJ5IHR1bmluZyBjcCwgd2UgaW1wcm92ZWQgb3VyIGFjY3VyYWN5IGJ5IG92ZXIgMSUsIGJ1dCBvdXIgdHJlZSBiZWNhbWUgc2lnbmlmaWNhbnRseSBtb3JlIGNvbXBsaWNhdGVkLiBJbiBzb21lIGFwcGxpY2F0aW9ucywgc3VjaCBhbiBpbXByb3ZlbWVudCBpbiBhY2N1cmFjeSB3b3VsZCBiZSB3b3J0aCB0aGUgbG9zcyBpbiBpbnRlcnByZXRhYmlsaXR5LiBJbiBvdGhlcnMsIHdlIG1heSBwcmVmZXIgYSBsZXNzIGFjY3VyYXRlIG1vZGVsIHRoYXQgaXMgc2ltcGxlciB0byB1bmRlcnN0YW5kIGFuZCBkZXNjcmliZSBvdmVyIGEgbW9yZSBhY2N1cmF0ZSAtLSBidXQgbW9yZSBjb21wbGljYXRlZCAtLSBtb2RlbC4NCg0KDQoNCg==