Austin Dolaway, Evan Heimbach, and Megan Marchetti 4/31/2020

Question 1

The website https://archive.ics.uci.edu/ml/datasets/Ionosphere contains data evaluating “good” and “bad” radar returns for evidence of structure in the ionosphere. There are 351 observations of 34 predictors and a binary response, g or b. (a) Load the data into R, delete any columns with zero variance, and convert the first column to type num and the response to type factor. Set the seed to 12345 and partition the data using createDataPartition with p=0.7.

library(caret)
library(ISLR)
library(data.table)
library(caretEnsemble)

iondata <- fread("https://archive.ics.uci.edu/ml/machine-learning-databases/ionosphere/ionosphere.data")

iondata$V1 <- as.numeric(iondata$V1)
iondata$V2 <- NULL
iondata$V35 <- as.factor(iondata$V35)

set.seed(12345)

ionindex <- createDataPartition(iondata$V35, p = 0.7, list = FALSE)
iontrain <- iondata[ionindex, ]
iontest <- iondata[-ionindex, ]

Build CART (method=“rpart”), random forest (method=“rf”), gradient boosting machine (method=“gbm”), and SVM (method=“svmLinear”) models for the response and call them CART1, RF1, GBM1, and SVM1, respectively. Be sure to suppress computational details that your reader doesn’t want to see.

summary(output)


Call:
summary.resamples(object = output)

Models: rpart, rf, gbm, svmLinear 
Number of resamples: 10 

Accuracy 
               Min.   1st Qu.    Median      Mean 3rd Qu. Max. NA's
rpart     0.7083333 0.8350000 0.8575000 0.8576667    0.91 0.96    0
rf        0.7500000 0.8862500 0.9391667 0.9223333    0.99 1.00    0
gbm       0.7916667 0.8891667 0.9183333 0.9185000    0.96 1.00    0
svmLinear 0.7500000 0.8800000 0.8800000 0.8781667    0.88 0.96    0

Kappa 
               Min.   1st Qu.    Median      Mean   3rd Qu.     Max. NA's
rpart     0.3913043 0.6185152 0.6812276 0.6861784 0.8062323 0.911032    0
rf        0.4666667 0.7587274 0.8603720 0.8290128 0.9777580 1.000000    0
gbm       0.5652174 0.7393258 0.8198702 0.8180478 0.9110320 1.000000    0
svmLinear 0.4146341 0.7191011 0.7191011 0.7171872 0.7330961 0.911032    0

dotplot(output)

Compare the accuracies of the four models on the training data.

confusionMatrix(table(iontrain$V35, predict(mods$rpart, iontrain)))

Confusion Matrix and Statistics

   
      b   g
  b  73  16
  g  10 148
                                          
               Accuracy : 0.8947          
                 95% CI : (0.8496, 0.9301)
    No Information Rate : 0.664           
    P-Value [Acc > NIR] : <2e-16          
                                          
                  Kappa : 0.7682          
                                          
 Mcnemar's Test P-Value : 0.3268          
                                          
            Sensitivity : 0.8795          
            Specificity : 0.9024          
         Pos Pred Value : 0.8202          
         Neg Pred Value : 0.9367          
             Prevalence : 0.3360          
         Detection Rate : 0.2955          
   Detection Prevalence : 0.3603          
      Balanced Accuracy : 0.8910          
                                          
       'Positive' Class : b

confusionMatrix(table(iontrain$V35, predict(mods$rf, iontrain)))

Confusion Matrix and Statistics

   
      b   g
  b  89   0
  g   0 158
                                     
               Accuracy : 1          
                 95% CI : (0.9852, 1)
    No Information Rate : 0.6397     
    P-Value [Acc > NIR] : < 2.2e-16  
                                     
                  Kappa : 1          
                                     
 Mcnemar's Test P-Value : NA         
                                     
            Sensitivity : 1.0000     
            Specificity : 1.0000     
         Pos Pred Value : 1.0000     
         Neg Pred Value : 1.0000     
             Prevalence : 0.3603     
         Detection Rate : 0.3603     
   Detection Prevalence : 0.3603     
      Balanced Accuracy : 1.0000     
                                     
       'Positive' Class : b

confusionMatrix(table(iontrain$V35, predict(mods$gbm, iontrain)))

Confusion Matrix and Statistics

   
      b   g
  b  89   0
  g   0 158
                                     
               Accuracy : 1          
                 95% CI : (0.9852, 1)
    No Information Rate : 0.6397     
    P-Value [Acc > NIR] : < 2.2e-16  
                                     
                  Kappa : 1          
                                     
 Mcnemar's Test P-Value : NA         
                                     
            Sensitivity : 1.0000     
            Specificity : 1.0000     
         Pos Pred Value : 1.0000     
         Neg Pred Value : 1.0000     
             Prevalence : 0.3603     
         Detection Rate : 0.3603     
   Detection Prevalence : 0.3603     
      Balanced Accuracy : 1.0000     
                                     
       'Positive' Class : b

confusionMatrix(table(iontrain$V35, predict(mods$svmLinear, iontrain)))

Confusion Matrix and Statistics

   
      b   g
  b  80   9
  g   2 156
                                          
               Accuracy : 0.9555          
                 95% CI : (0.9217, 0.9776)
    No Information Rate : 0.668           
    P-Value [Acc > NIR] : < 2e-16         
                                          
                  Kappa : 0.9017          
                                          
 Mcnemar's Test P-Value : 0.07044         
                                          
            Sensitivity : 0.9756          
            Specificity : 0.9455          
         Pos Pred Value : 0.8989          
         Neg Pred Value : 0.9873          
             Prevalence : 0.3320          
         Detection Rate : 0.3239          
   Detection Prevalence : 0.3603          
      Balanced Accuracy : 0.9605          
                                          
       'Positive' Class : b

Compare the accuracies of the four models on the testing data.

confusionMatrix(table(iontest$V35, predict(mods$rpart, iontest)))

Confusion Matrix and Statistics

   
     b  g
  b 34  3
  g  3 64
                                          
               Accuracy : 0.9423          
                 95% CI : (0.8787, 0.9785)
    No Information Rate : 0.6442          
    P-Value [Acc > NIR] : 6.661e-13       
                                          
                  Kappa : 0.8741          
                                          
 Mcnemar's Test P-Value : 1               
                                          
            Sensitivity : 0.9189          
            Specificity : 0.9552          
         Pos Pred Value : 0.9189          
         Neg Pred Value : 0.9552          
             Prevalence : 0.3558          
         Detection Rate : 0.3269          
   Detection Prevalence : 0.3558          
      Balanced Accuracy : 0.9371          
                                          
       'Positive' Class : b

confusionMatrix(table(iontest$V35, predict(mods$rf, iontest)))

Confusion Matrix and Statistics

   
     b  g
  b 33  4
  g  1 66
                                          
               Accuracy : 0.9519          
                 95% CI : (0.8914, 0.9842)
    No Information Rate : 0.6731          
    P-Value [Acc > NIR] : 3.633e-12       
                                          
                  Kappa : 0.8932          
                                          
 Mcnemar's Test P-Value : 0.3711          
                                          
            Sensitivity : 0.9706          
            Specificity : 0.9429          
         Pos Pred Value : 0.8919          
         Neg Pred Value : 0.9851          
             Prevalence : 0.3269          
         Detection Rate : 0.3173          
   Detection Prevalence : 0.3558          
      Balanced Accuracy : 0.9567          
                                          
       'Positive' Class : b

confusionMatrix(table(iontest$V35, predict(mods$gbm, iontest)))

Confusion Matrix and Statistics

   
     b  g
  b 34  3
  g  1 66
                                          
               Accuracy : 0.9615          
                 95% CI : (0.9044, 0.9894)
    No Information Rate : 0.6635          
    P-Value [Acc > NIR] : 9.701e-14       
                                          
                  Kappa : 0.9151          
                                          
 Mcnemar's Test P-Value : 0.6171          
                                          
            Sensitivity : 0.9714          
            Specificity : 0.9565          
         Pos Pred Value : 0.9189          
         Neg Pred Value : 0.9851          
             Prevalence : 0.3365          
         Detection Rate : 0.3269          
   Detection Prevalence : 0.3558          
      Balanced Accuracy : 0.9640          
                                          
       'Positive' Class : b

confusionMatrix(table(iontest$V35, predict(mods$svmLinear, iontest)))

Confusion Matrix and Statistics

   
     b  g
  b 26 11
  g  1 66
                                          
               Accuracy : 0.8846          
                 95% CI : (0.8071, 0.9389)
    No Information Rate : 0.7404          
    P-Value [Acc > NIR] : 0.000244        
                                          
                  Kappa : 0.7321          
                                          
 Mcnemar's Test P-Value : 0.009375        
                                          
            Sensitivity : 0.9630          
            Specificity : 0.8571          
         Pos Pred Value : 0.7027          
         Neg Pred Value : 0.9851          
             Prevalence : 0.2596          
         Detection Rate : 0.2500          
   Detection Prevalence : 0.3558          
      Balanced Accuracy : 0.9101          
                                          
       'Positive' Class : b

Question 2

The ISLR package contains a dataset called Khan that consists of gene expression measurements indicating one of four types of small round blue cell tumours of childhood (SRBCT). (a) The data are already split into training and testing sets. Make dataframes for each and set the seed to 12345.

library(caret)
library(ISLR)
library(data.table)
library(caretEnsemble)

khandata <- Khan
khantrain <- data.frame(Khan$xtrain)
khantest <- data.frame(Khan$xtest)
khantrain$response <- as.factor(Khan$ytrain)
khantest$response <- as.factor(Khan$ytest)

set.seed(12345)

Build CART (method=“rpart”), random forest (method=“rf”), gradient boosting machine (method=“gbm”), and SVM (method=“svmLinear”) models for the response and call them CART2, RF2, GBM2, and SVM2, respectively. Be sure to suppress computational details that your reader doesn’t want to see.

CART2 <- train(response~., data = khantrain, method = "rpart", trControl = trainControl(method = "cv", number = 10))
RF2 <- train(response~., data = khantrain, method = "rf", trControl = trainControl(method = "cv", number = 10))
GBM2 <- train(response~., data = khantrain, method = "gbm", trControl = trainControl(method = "cv", number = 10))
SVM2 <- train(response~., data = khantrain, method = "svmLinear", trControl = trainControl(method = "cv", number = 10))

Compare the accuracies of the four models on the training data.

CART2p <- predict(CART2, newdata = khantrain)
confusionMatrix(CART2p, khantrain$response)

Confusion Matrix and Statistics

          Reference
Prediction  1  2  3  4
         1  0  0  0  0
         2  0 22  0  0
         3  7  1 12  0
         4  1  0  0 20

Overall Statistics
                                          
               Accuracy : 0.8571          
                 95% CI : (0.7461, 0.9325)
    No Information Rate : 0.3651          
    P-Value [Acc > NIR] : 1.023e-15       
                                          
                  Kappa : 0.7977          
                                          
 Mcnemar's Test P-Value : NA              

Statistics by Class:

                     Class: 1 Class: 2 Class: 3 Class: 4
Sensitivity             0.000   0.9565   1.0000   1.0000
Specificity             1.000   1.0000   0.8431   0.9767
Pos Pred Value            NaN   1.0000   0.6000   0.9524
Neg Pred Value          0.873   0.9756   1.0000   1.0000
Prevalence              0.127   0.3651   0.1905   0.3175
Detection Rate          0.000   0.3492   0.1905   0.3175
Detection Prevalence    0.000   0.3492   0.3175   0.3333
Balanced Accuracy       0.500   0.9783   0.9216   0.9884

RF2p <- predict(RF2, newdata = khantrain)
confusionMatrix(RF2p, khantrain$response)

Confusion Matrix and Statistics

          Reference
Prediction  1  2  3  4
         1  8  0  0  0
         2  0 23  0  0
         3  0  0 12  0
         4  0  0  0 20

Overall Statistics
                                     
               Accuracy : 1          
                 95% CI : (0.9431, 1)
    No Information Rate : 0.3651     
    P-Value [Acc > NIR] : < 2.2e-16  
                                     
                  Kappa : 1          
                                     
 Mcnemar's Test P-Value : NA         

Statistics by Class:

                     Class: 1 Class: 2 Class: 3 Class: 4
Sensitivity             1.000   1.0000   1.0000   1.0000
Specificity             1.000   1.0000   1.0000   1.0000
Pos Pred Value          1.000   1.0000   1.0000   1.0000
Neg Pred Value          1.000   1.0000   1.0000   1.0000
Prevalence              0.127   0.3651   0.1905   0.3175
Detection Rate          0.127   0.3651   0.1905   0.3175
Detection Prevalence    0.127   0.3651   0.1905   0.3175
Balanced Accuracy       1.000   1.0000   1.0000   1.0000

GBM2p <- predict(GBM2, newdata = khantrain)
confusionMatrix(GBM2p, khantrain$response)

Confusion Matrix and Statistics

          Reference
Prediction  1  2  3  4
         1  8  0  0  0
         2  0 23  0  0
         3  0  0 12  0
         4  0  0  0 20

Overall Statistics
                                     
               Accuracy : 1          
                 95% CI : (0.9431, 1)
    No Information Rate : 0.3651     
    P-Value [Acc > NIR] : < 2.2e-16  
                                     
                  Kappa : 1          
                                     
 Mcnemar's Test P-Value : NA         

Statistics by Class:

                     Class: 1 Class: 2 Class: 3 Class: 4
Sensitivity             1.000   1.0000   1.0000   1.0000
Specificity             1.000   1.0000   1.0000   1.0000
Pos Pred Value          1.000   1.0000   1.0000   1.0000
Neg Pred Value          1.000   1.0000   1.0000   1.0000
Prevalence              0.127   0.3651   0.1905   0.3175
Detection Rate          0.127   0.3651   0.1905   0.3175
Detection Prevalence    0.127   0.3651   0.1905   0.3175
Balanced Accuracy       1.000   1.0000   1.0000   1.0000

SVM2p <- predict(SVM2, newdata = khantrain)
confusionMatrix(SVM2p, khantrain$response)

Confusion Matrix and Statistics

          Reference
Prediction  1  2  3  4
         1  8  0  0  0
         2  0 23  0  0
         3  0  0 12  0
         4  0  0  0 20

Overall Statistics
                                     
               Accuracy : 1          
                 95% CI : (0.9431, 1)
    No Information Rate : 0.3651     
    P-Value [Acc > NIR] : < 2.2e-16  
                                     
                  Kappa : 1          
                                     
 Mcnemar's Test P-Value : NA         

Statistics by Class:

                     Class: 1 Class: 2 Class: 3 Class: 4
Sensitivity             1.000   1.0000   1.0000   1.0000
Specificity             1.000   1.0000   1.0000   1.0000
Pos Pred Value          1.000   1.0000   1.0000   1.0000
Neg Pred Value          1.000   1.0000   1.0000   1.0000
Prevalence              0.127   0.3651   0.1905   0.3175
Detection Rate          0.127   0.3651   0.1905   0.3175
Detection Prevalence    0.127   0.3651   0.1905   0.3175
Balanced Accuracy       1.000   1.0000   1.0000   1.0000

There was little variation between the high accuracies of these models on the training dataset, however it could be lower when modeling the testing data.

Compare the accuracies of the four models on the testing data.

CART2p2 <- predict(CART2, newdata = khantest)
confusionMatrix(CART2p2, khantest$response)

Confusion Matrix and Statistics

          Reference
Prediction 1 2 3 4
         1 0 0 0 0
         2 0 4 0 1
         3 3 1 5 1
         4 0 1 1 3

Overall Statistics
                                          
               Accuracy : 0.6             
                 95% CI : (0.3605, 0.8088)
    No Information Rate : 0.3             
    P-Value [Acc > NIR] : 0.005138        
                                          
                  Kappa : 0.4386          
                                          
 Mcnemar's Test P-Value : NA              

Statistics by Class:

                     Class: 1 Class: 2 Class: 3 Class: 4
Sensitivity              0.00   0.6667   0.8333   0.6000
Specificity              1.00   0.9286   0.6429   0.8667
Pos Pred Value            NaN   0.8000   0.5000   0.6000
Neg Pred Value           0.85   0.8667   0.9000   0.8667
Prevalence               0.15   0.3000   0.3000   0.2500
Detection Rate           0.00   0.2000   0.2500   0.1500
Detection Prevalence     0.00   0.2500   0.5000   0.2500
Balanced Accuracy        0.50   0.7976   0.7381   0.7333

RF2p2 <- predict(RF2, newdata = khantest)
confusionMatrix(RF2p2, khantest$response)

Confusion Matrix and Statistics

          Reference
Prediction 1 2 3 4
         1 3 0 0 0
         2 0 6 0 0
         3 0 0 5 0
         4 0 0 1 5

Overall Statistics
                                          
               Accuracy : 0.95            
                 95% CI : (0.7513, 0.9987)
    No Information Rate : 0.3             
    P-Value [Acc > NIR] : 1.662e-09       
                                          
                  Kappa : 0.9322          
                                          
 Mcnemar's Test P-Value : NA              

Statistics by Class:

                     Class: 1 Class: 2 Class: 3 Class: 4
Sensitivity              1.00      1.0   0.8333   1.0000
Specificity              1.00      1.0   1.0000   0.9333
Pos Pred Value           1.00      1.0   1.0000   0.8333
Neg Pred Value           1.00      1.0   0.9333   1.0000
Prevalence               0.15      0.3   0.3000   0.2500
Detection Rate           0.15      0.3   0.2500   0.2500
Detection Prevalence     0.15      0.3   0.2500   0.3000
Balanced Accuracy        1.00      1.0   0.9167   0.9667

GBM2p2 <- predict(GBM2, newdata = khantest)
confusionMatrix(GBM2p2, khantest$response)

Confusion Matrix and Statistics

          Reference
Prediction 1 2 3 4
         1 3 0 0 0
         2 0 5 0 1
         3 0 0 6 0
         4 0 1 0 4

Overall Statistics
                                         
               Accuracy : 0.9            
                 95% CI : (0.683, 0.9877)
    No Information Rate : 0.3            
    P-Value [Acc > NIR] : 3.773e-08      
                                         
                  Kappa : 0.8639         
                                         
 Mcnemar's Test P-Value : NA             

Statistics by Class:

                     Class: 1 Class: 2 Class: 3 Class: 4
Sensitivity              1.00   0.8333      1.0   0.8000
Specificity              1.00   0.9286      1.0   0.9333
Pos Pred Value           1.00   0.8333      1.0   0.8000
Neg Pred Value           1.00   0.9286      1.0   0.9333
Prevalence               0.15   0.3000      0.3   0.2500
Detection Rate           0.15   0.2500      0.3   0.2000
Detection Prevalence     0.15   0.3000      0.3   0.2500
Balanced Accuracy        1.00   0.8810      1.0   0.8667

SVM2p2 <- predict(SVM2, newdata = khantest)
confusionMatrix(SVM2p2, khantest$response)

Confusion Matrix and Statistics

          Reference
Prediction 1 2 3 4
         1 3 0 0 0
         2 0 6 2 0
         3 0 0 4 0
         4 0 0 0 5

Overall Statistics
                                         
               Accuracy : 0.9            
                 95% CI : (0.683, 0.9877)
    No Information Rate : 0.3            
    P-Value [Acc > NIR] : 3.773e-08      
                                         
                  Kappa : 0.8639         
                                         
 Mcnemar's Test P-Value : NA             

Statistics by Class:

                     Class: 1 Class: 2 Class: 3 Class: 4
Sensitivity              1.00   1.0000   0.6667     1.00
Specificity              1.00   0.8571   1.0000     1.00
Pos Pred Value           1.00   0.7500   1.0000     1.00
Neg Pred Value           1.00   1.0000   0.8750     1.00
Prevalence               0.15   0.3000   0.3000     0.25
Detection Rate           0.15   0.3000   0.2000     0.25
Detection Prevalence     0.15   0.4000   0.2000     0.25
Balanced Accuracy        1.00   0.9286   0.8333     1.00

The accuracy of the CART model was much lower than the accuracy of the SVM model.

Question 3

The data https://archive.ics.uci.edu/ml/datasets/Energy+efficiency contains data on building characteristics and energy efficiency. What is new here is that there are two response variables, heating load (Y1) and cooling load (Y2).

Load the data into R and normalize it so it is suitable for analysis by a neural network. Set the seed to 12345 and use createDataPartition (using Y1 as the response) with p=0.7 to partition the data into training and testing sets.

library(readxl)
library(caret)
library(neuralnet)
enb <- read_excel("A:/Chrome Downloads/ENB2012_data.xlsx")
normal <- function(x){return((x-min(x))/(max(x)-min(x)))}

enb <- as.data.frame(lapply(enb, normal))

set.seed(12345)

trainindex <- createDataPartition(y = enb$Y1, p = 0.7, list = FALSE)
enbtrain <- enb[trainindex, ]
enbtest <- enb[-trainindex, ]

Use train with method=“nnet” to build a neural network model for Y1 using X1, X2, …, X8 as predictors. (Don’t use Y2 as a predictor.) Call the model NN3b. Also, note that there is no need to center and scale the predictors.

NN3b <- train(Y1~.-Y2, data = enbtrain, method = "nnet", trControl = trainControl(method = "cv", number = 10), trace = FALSE)

Compute R2 for NN3b on the testing data

NN3bp <- predict(NN3b, enbtest)
cor(NN3bp, enbtest$Y1)^2

[1] 0.9888821

To predict both Y1 and Y2, use the neuralnet function in the neuralnet package. Using the training data, build a model called NN3d with one hidden unit in one hidden layer. Plot NN3d using plot(NN3d, rep=“best”) and use the testing data to compute R2 for Y1 and Y2.

NN3d <- neuralnet(Y1+Y2~X1+X2+X3+X4+X5+X6+X7+X8, data = enbtrain, hidden = 1)
plot(NN3d, rep = "best")


NN3dp <- predict(NN3d, enbtest)
cor(NN3dp, enbtest$Y1)^2

          [,1]
[1,] 0.9243322
[2,] 0.9243322

cor(NN3dp, enbtest$Y2)^2

          [,1]
[1,] 0.8963057
[2,] 0.8963057

Make a new model, NN3e, for Y1 and Y2 with two hidden layers, the first having 2 nodes and the second having 1 node. Plot NN3e using plot(NN3e, rep=“best”) and use the testing data to compute R2 for Y1 and Y2.

NN3e <- neuralnet(Y1+Y2~X1+X2+X3+X4+X5+X6+X7+X8, data = enbtrain, hidden = c(2,1))
plot(NN3e, rep = "best")


NN3ep <- predict(NN3d, enbtest)
cor(NN3ep, enbtest$Y1)^2

          [,1]
[1,] 0.9243322
[2,] 0.9243322

cor(NN3ep, enbtest$Y2)^2

          [,1]
[1,] 0.8963057
[2,] 0.8963057

The relatively high \(R^2\) value of 0.92 represents a small difference between the observed and fitted values making it a decent model for the data.

Question 4

In this problem, we investigate the importance of normalizing the data before constructing a neural network model. Consider the Boston data set in the MASS package with lstat predicting medv. (a) Set the seed to 12345 and construct a neural network model called NN4b with one hidden layer containing one hidden variable. Plot the data and superimpose the model over the data. Comment on the quality of the fit.

library(MASS)
library(caret)
library(neuralnet)
set.seed(12345)

NN4b <- neuralnet(medv ~ lstat, data = Boston, hidden = 1)
predicted <- predict(NN4b, Boston)

plot(Boston$lstat, Boston$medv, type = "p", pch = 20, xlab="lstat", ylab="medv", main="Boston Data")
lines(lowess(Boston$lstat, predicted), lwd=2, col="green")

The model does not represent the Boston data well. The trendline is horizontal while the data has an upward trend.

Construct a new dataframe containing a normalized version of the Boston data.

#normalization function
normalize<-function(x)
  {
    return((x-min(x))/(max(x)-min(x)))
}

#normalizing data
NormBostonData <- as.data.frame(lapply(Boston, normalize))

Using the normalized data, construct a neural network model called NN4d with one hidden layer containing one hidden variable. Plot the data and superimpose the model over the data and make the curve red. Comment on the quality of the fit.

#Neural network with normalized data and one hidden layer
NN4d <- neuralnet(medv ~ lstat, data = NormBostonData, hidden = 1)
predictedd <- predict(NN4d, NormBostonData)

plot(NormBostonData$lstat, NormBostonData$medv, type = "p", pch = 20, xlab="lstat", ylab="medv", main="Normalized Boston Data")
lines(lowess(NormBostonData$lstat, predictedd), lwd=2, col="red")

This model represents the Boston data much better than the first model. The trendline follows the trend of the data.

Use plot(NN4d, rep=“best”) to visualize the model and write down the corresponding equation. Use S to indicate the activation function.

plot(NN4d, rep="best")

The equation of this model is: \(medv = 2.70587-2.53167S(0.99799+6.03666(lstat))\) (e) Using the normalized data, construct a neural network model called NN4f with two hidden layers containing two hidden variables each. Plot the data and superimpose the model over the data and make the curve blue. Comment on the quality of the fit.

#Neural network with normalized data and two hidden layers
NN4f <- neuralnet(medv ~ lstat, data = NormBostonData, hidden = c(2,2))
predictedf <- predict(NN4f, NormBostonData)

plot(NormBostonData$lstat, NormBostonData$medv, type = "p", pch = 20, xlab="lstat", ylab="medv", main="Two Hidden Layers Normalized Boston Data")
lines(lowess(NormBostonData$lstat, predictedf), lwd=2, col="blue")

Similarily to the previous model this model represents the Boston data well. The trendline follows the trend of the data.

Question 5

A crooked employee at a casino occasionally switches out a fair six-sided die for a weighted six-sided die, and observations of die rolls supervised by this employee are recorded in Casino.csv. (a) Since the employee only rarely switches the dice, initialize the transition matrix to be A =[0.99 0.01 0.02 0.98]. Set the seed to 6789 and and initialize π and B with random positive entries, but be sure that the entries in π add to one and the rows of B add to one.

normalizeProbabilities <- function(x){x/sum(x)}

library(HMM)
casino <- read.csv("A:/Chrome Downloads/Casino.csv", header = TRUE, sep = ",")

set.seed(6789)
PIprobabilities <- normalizeProbabilities(runif(2))
Bprobabilities <- apply(matrix (runif(12), 6), 1, normalizeProbabilities)

transitionMatrix <- matrix(c(.99, .01, .02, .98))

Use the Baum-Welch algorithm to build a hidden Markov model for the crooked employee’s behavior. What does the model predict for the weights of the unfair die?

hmm <- initHMM(c("Fair", "Unfair"), 1:6, startProbs = PIprobabilities, transProbs = transitionMatrix, emissionProbs = Bprobabilities)

bw <- baumWelch(hmm, casino$Roll, maxIterations = 50)
bw$hmm$emissionProbs

        symbols
states           1          2          3         4         5         6
  Fair   0.1666314 0.16706238 0.16771742 0.1667201 0.1672893 0.1645794
  Unfair 0.1009619 0.09892086 0.09879078 0.1005153 0.1015320 0.4992791

The model predicts that the weighted part of the die is the one because that is opposite of side six.

Question 6

The data in KaggleSurvey.csv are derived from the responses to the 2018 Kaggle Machine Learning and Data Science Survey. Respondents were asked “How do you perceive the quality of online learning platforms and MOOCs as compared to the quality of the education provided by traditional brick and mortar institutions?” and responses used the following scale.

Much worse
Slightly worse
Neither better nor worse/No opinion/I do not know
Slightly better
Much better

Since there are a lot of missing salaries, let’s remove the salary data, and since there are so many different countries, let’s also remove the country data. From what remains, remove any incomplete cases.

kaggleSurvey <- read.csv("A:/Chrome Downloads/KaggleSurvey.csv")
kaggleSurvey$Salary <- NULL
kaggleSurvey$Country <- NULL
kaggleSurvey <- kaggleSurvey[!(is.na(kaggleSurvey[,4]) | kaggleSurvey[,4]==""), ]
kaggleSurvey <- kaggleSurvey[!(is.na(kaggleSurvey[,3]) | kaggleSurvey[,3]==""), ]

Use the polr function in the MASS package to build an ordinal regression model called ORD using Gender, Age, and Student to predict responses to the survey.

library(MASS)
kaggleSurvey$Response <- as.factor(kaggleSurvey$Response)
ORD <- polr(Response~(Gender + Age + Student), data = kaggleSurvey)

We can use predict to see probabilities. Run

testing <- data.frame(Student=c(0,1,0,1), Gender=c(“Male”,“Male”,“Female”,“Female”), Age=c(25,25,25,25)) predict(ORD,newdata = testing, type=“p”)

to see probabilities for each response for 25-year-old people. Which group is most likely to respond “Much better” to the survey question?

testing <- data.frame(Student=c(0,1,0,1),Gender=c("Male","Male","Female","Female"),Age=c(25,25,25,25))
predict(ORD,newdata = testing, type="p")

           1          2         3         4         5
1 0.03310606 0.10486481 0.3213671 0.2890439 0.2516181
2 0.02887626 0.09315773 0.3025289 0.2963388 0.2790983
3 0.03827625 0.11858475 0.3400057 0.2787800 0.2243532
4 0.03340870 0.10568552 0.3225823 0.2884737 0.2498498

Group 2 is most likely to respond “Much better” at 27.9%.

Carefully explain the affect of Age on the model.

ORD$coefficients

GenderFemale   GenderMale          Age      Student 
 0.281548213  0.432022905 -0.009502285  0.141061847

Looking at the coefficients of ORD, Age has a coefficient of -0.0095 which implies that it has a significant effect on the Response outcomes compared to the other factors.

Question 7

The file SouthAmerica.csv contains data on ten countries in South America. (a) Load the data, rename the rows with the names of the countries, and use scale to center and scale each column. Then use hclust to produce a cluster dendrogram that displays how similar countries are to one another. Use plot to display the clusters and be sure that the country names are used for the labels.

southAmerica <- read.csv("A:/Chrome Downloads/SouthAmerica.csv")
scaledSA <- scale(southAmerica[, c(2:8)], center = TRUE, scale = TRUE) 
rownames(scaledSA) <- c("Argentina", "Bolivia", "Brazil", "Chile","Colombia","Ecuador", "Paraguay", "Peru","Uruguay", "Venezuela")
hClust <- hclust(dist(scaledSA))
plot(hClust, main = "South American Countries", xlab = "Clusters")

According to the dendrogram, which two countries are most like Colombia?

Peru and Ecuador are most like Colombia.

Suppose that we choose a height so that there are only two clusters. List the countries in each cluster.

hClust$height[2]

[1] 1.43153

Choosing a height of 1.43153 will result in two clusters, one being Colombia and Peru, and the other being Argentina and Uruguay.

Question 8

The file EducationLevel.csv contains data on education levels in all of the counties in the United States. (a) Load the data. There is no need to scale the columns since the numerical columns are all percentages. Carefully examine the data and do any necessary pre-processing.

educationLevel <- read.csv("A:/Chrome Downloads/EducationLevel.csv", header = TRUE, sep = ",")
educationLevel[1,] <- NA #Row 1 is the whole US
educationLevel <- educationLevel[!(is.na(educationLevel[,4]) | educationLevel[,4]==""), ] #Removes NA rows

Set the seed to 1234. Use K-means clustering (kmeans) with 2 clusters on the percentage data.

set.seed(1234) 
kMeans <- kmeans(educationLevel[,4:7], centers = 2)

Make a new data frame called codes that has two variables, fips and cluster. fips contains the numerical ID for each county and cluster identifies the cluster to which each county belongs.

fips <- educationLevel$FIPS.Code 
cluster <- kMeans$cluster 
codes <- data.frame(fips, cluster)

Load the usmaps package and run the following code to generate a color-coded map of the US where the color indicates the cluster membership for each county. plot usmap(data=codes, labels=TRUE, value=’cluster’, label color=’white’) + scale fill continuous(low=“red”, high=“green”) + theme(legend.position = “none”)

library(usmap)
plot_usmap(data=codes, labels=TRUE, value="cluster", label_color="white") + scale_fill_continuous(low="red", high="blue") + theme(legend.position = "none")

LS0tDQp0aXRsZTogIkRBVCAzMTUgTWFjaGluZSBMZWFybmluZyBQcm9qZWN0IDUiDQpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sNCi0tLQ0KQXVzdGluIERvbGF3YXksIEV2YW4gSGVpbWJhY2gsIGFuZCBNZWdhbiBNYXJjaGV0dGkNCjQvMzEvMjAyMA0KDQojIFF1ZXN0aW9uIDENClRoZSB3ZWJzaXRlIGh0dHBzOi8vYXJjaGl2ZS5pY3MudWNpLmVkdS9tbC9kYXRhc2V0cy9Jb25vc3BoZXJlIGNvbnRhaW5zIGRhdGENCmV2YWx1YXRpbmcg4oCcZ29vZOKAnSBhbmQg4oCcYmFk4oCdIHJhZGFyIHJldHVybnMgZm9yIGV2aWRlbmNlIG9mIHN0cnVjdHVyZSBpbiB0aGUgaW9ub3NwaGVyZS4gVGhlcmUgYXJlDQozNTEgb2JzZXJ2YXRpb25zIG9mIDM0IHByZWRpY3RvcnMgYW5kIGEgYmluYXJ5IHJlc3BvbnNlLCBnIG9yIGIuDQooYSkNCkxvYWQgdGhlIGRhdGEgaW50byBSLCBkZWxldGUgYW55IGNvbHVtbnMgd2l0aCB6ZXJvIHZhcmlhbmNlLCBhbmQgY29udmVydCB0aGUgZmlyc3QgY29sdW1uIHRvDQp0eXBlIG51bSBhbmQgdGhlIHJlc3BvbnNlIHRvIHR5cGUgZmFjdG9yLiBTZXQgdGhlIHNlZWQgdG8gMTIzNDUgYW5kIHBhcnRpdGlvbiB0aGUgZGF0YSB1c2luZw0KY3JlYXRlRGF0YVBhcnRpdGlvbiB3aXRoIHA9MC43Lg0KDQpgYGB7cn0NCmxpYnJhcnkoY2FyZXQpDQpsaWJyYXJ5KElTTFIpDQpsaWJyYXJ5KGRhdGEudGFibGUpDQpsaWJyYXJ5KGNhcmV0RW5zZW1ibGUpDQoNCmlvbmRhdGEgPC0gZnJlYWQoImh0dHBzOi8vYXJjaGl2ZS5pY3MudWNpLmVkdS9tbC9tYWNoaW5lLWxlYXJuaW5nLWRhdGFiYXNlcy9pb25vc3BoZXJlL2lvbm9zcGhlcmUuZGF0YSIpDQoNCmlvbmRhdGEkVjEgPC0gYXMubnVtZXJpYyhpb25kYXRhJFYxKQ0KaW9uZGF0YSRWMiA8LSBOVUxMDQppb25kYXRhJFYzNSA8LSBhcy5mYWN0b3IoaW9uZGF0YSRWMzUpDQoNCnNldC5zZWVkKDEyMzQ1KQ0KDQppb25pbmRleCA8LSBjcmVhdGVEYXRhUGFydGl0aW9uKGlvbmRhdGEkVjM1LCBwID0gMC43LCBsaXN0ID0gRkFMU0UpDQppb250cmFpbiA8LSBpb25kYXRhW2lvbmluZGV4LCBdDQppb250ZXN0IDwtIGlvbmRhdGFbLWlvbmluZGV4LCBdDQpgYGANCihiKQ0KQnVpbGQgQ0FSVCAobWV0aG9kPSJycGFydCIpLCByYW5kb20gZm9yZXN0IChtZXRob2Q9InJmIiksIGdyYWRpZW50IGJvb3N0aW5nIG1hY2hpbmUNCihtZXRob2Q9ImdibSIpLCBhbmQgU1ZNIChtZXRob2Q9InN2bUxpbmVhciIpIG1vZGVscyBmb3IgdGhlIHJlc3BvbnNlIGFuZCBjYWxsIHRoZW0NCkNBUlQxLCBSRjEsIEdCTTEsIGFuZCBTVk0xLCByZXNwZWN0aXZlbHkuIEJlIHN1cmUgdG8gc3VwcHJlc3MgY29tcHV0YXRpb25hbCBkZXRhaWxzIHRoYXQgeW91cg0KcmVhZGVyIGRvZXNu4oCZdCB3YW50IHRvIHNlZS4NCg0KYGBge3IsIHJlc3VsdHM9ImhpZGUifQ0KbW9kcyA8LSBjYXJldExpc3QoVjM1fi4sIGRhdGEgPSBpb250cmFpbiwgdHJDb250cm9sID0gdHJhaW5Db250cm9sKG1ldGhvZCA9ImN2IiwgbnVtYmVyID0gMTAsIHNhdmVQcmVkaWN0aW9ucyA9IFRSVUUsIGNsYXNzUHJvYnMgPSBUUlVFKSwgbWV0aG9kTGlzdCA9IGMoJ3JwYXJ0JywgJ3JmJywgJ2dibScsICdzdm1MaW5lYXInKSkNCm91dHB1dCA8LSByZXNhbXBsZXMobW9kcykNCmBgYA0KYGBge3J9DQpzdW1tYXJ5KG91dHB1dCkNCmRvdHBsb3Qob3V0cHV0KQ0KYGBgDQooYykNCkNvbXBhcmUgdGhlIGFjY3VyYWNpZXMgb2YgdGhlIGZvdXIgbW9kZWxzIG9uIHRoZSB0cmFpbmluZyBkYXRhLg0KYGBge3J9DQpjb25mdXNpb25NYXRyaXgodGFibGUoaW9udHJhaW4kVjM1LCBwcmVkaWN0KG1vZHMkcnBhcnQsIGlvbnRyYWluKSkpDQpjb25mdXNpb25NYXRyaXgodGFibGUoaW9udHJhaW4kVjM1LCBwcmVkaWN0KG1vZHMkcmYsIGlvbnRyYWluKSkpDQpjb25mdXNpb25NYXRyaXgodGFibGUoaW9udHJhaW4kVjM1LCBwcmVkaWN0KG1vZHMkZ2JtLCBpb250cmFpbikpKQ0KY29uZnVzaW9uTWF0cml4KHRhYmxlKGlvbnRyYWluJFYzNSwgcHJlZGljdChtb2RzJHN2bUxpbmVhciwgaW9udHJhaW4pKSkNCmBgYA0KKGQpDQpDb21wYXJlIHRoZSBhY2N1cmFjaWVzIG9mIHRoZSBmb3VyIG1vZGVscyBvbiB0aGUgdGVzdGluZyBkYXRhLg0KYGBge3J9DQpjb25mdXNpb25NYXRyaXgodGFibGUoaW9udGVzdCRWMzUsIHByZWRpY3QobW9kcyRycGFydCwgaW9udGVzdCkpKQ0KY29uZnVzaW9uTWF0cml4KHRhYmxlKGlvbnRlc3QkVjM1LCBwcmVkaWN0KG1vZHMkcmYsIGlvbnRlc3QpKSkNCmNvbmZ1c2lvbk1hdHJpeCh0YWJsZShpb250ZXN0JFYzNSwgcHJlZGljdChtb2RzJGdibSwgaW9udGVzdCkpKQ0KY29uZnVzaW9uTWF0cml4KHRhYmxlKGlvbnRlc3QkVjM1LCBwcmVkaWN0KG1vZHMkc3ZtTGluZWFyLCBpb250ZXN0KSkpDQpgYGANCiMgUXVlc3Rpb24gMg0KVGhlIElTTFIgcGFja2FnZSBjb250YWlucyBhIGRhdGFzZXQgY2FsbGVkIEtoYW4gdGhhdCBjb25zaXN0cyBvZiBnZW5lIGV4cHJlc3Npb24gbWVhc3VyZW1lbnRzIGluZGljYXRpbmcgb25lIG9mIGZvdXIgdHlwZXMgb2Ygc21hbGwgcm91bmQgYmx1ZSBjZWxsIHR1bW91cnMgb2YgY2hpbGRob29kIChTUkJDVCkuDQooYSkNClRoZSBkYXRhIGFyZSBhbHJlYWR5IHNwbGl0IGludG8gdHJhaW5pbmcgYW5kIHRlc3Rpbmcgc2V0cy4gTWFrZSBkYXRhZnJhbWVzIGZvciBlYWNoIGFuZCBzZXQNCnRoZSBzZWVkIHRvIDEyMzQ1Lg0KYGBge3J9DQpsaWJyYXJ5KGNhcmV0KQ0KbGlicmFyeShJU0xSKQ0KbGlicmFyeShkYXRhLnRhYmxlKQ0KbGlicmFyeShjYXJldEVuc2VtYmxlKQ0KDQpraGFuZGF0YSA8LSBLaGFuDQpraGFudHJhaW4gPC0gZGF0YS5mcmFtZShLaGFuJHh0cmFpbikNCmtoYW50ZXN0IDwtIGRhdGEuZnJhbWUoS2hhbiR4dGVzdCkNCmtoYW50cmFpbiRyZXNwb25zZSA8LSBhcy5mYWN0b3IoS2hhbiR5dHJhaW4pDQpraGFudGVzdCRyZXNwb25zZSA8LSBhcy5mYWN0b3IoS2hhbiR5dGVzdCkNCg0Kc2V0LnNlZWQoMTIzNDUpDQpgYGANCihiKQ0KQnVpbGQgQ0FSVCAobWV0aG9kPSJycGFydCIpLCByYW5kb20gZm9yZXN0IChtZXRob2Q9InJmIiksIGdyYWRpZW50IGJvb3N0aW5nIG1hY2hpbmUNCihtZXRob2Q9ImdibSIpLCBhbmQgU1ZNIChtZXRob2Q9InN2bUxpbmVhciIpIG1vZGVscyBmb3IgdGhlIHJlc3BvbnNlIGFuZCBjYWxsIHRoZW0NCkNBUlQyLCBSRjIsIEdCTTIsIGFuZCBTVk0yLCByZXNwZWN0aXZlbHkuIEJlIHN1cmUgdG8gc3VwcHJlc3MgY29tcHV0YXRpb25hbCBkZXRhaWxzIHRoYXQgeW91cg0KcmVhZGVyIGRvZXNu4oCZdCB3YW50IHRvIHNlZS4NCmBgYHtyfQ0KQ0FSVDIgPC0gdHJhaW4ocmVzcG9uc2V+LiwgZGF0YSA9IGtoYW50cmFpbiwgbWV0aG9kID0gInJwYXJ0IiwgdHJDb250cm9sID0gdHJhaW5Db250cm9sKG1ldGhvZCA9ICJjdiIsIG51bWJlciA9IDEwKSkNClJGMiA8LSB0cmFpbihyZXNwb25zZX4uLCBkYXRhID0ga2hhbnRyYWluLCBtZXRob2QgPSAicmYiLCB0ckNvbnRyb2wgPSB0cmFpbkNvbnRyb2wobWV0aG9kID0gImN2IiwgbnVtYmVyID0gMTApKQ0KR0JNMiA8LSB0cmFpbihyZXNwb25zZX4uLCBkYXRhID0ga2hhbnRyYWluLCBtZXRob2QgPSAiZ2JtIiwgdHJDb250cm9sID0gdHJhaW5Db250cm9sKG1ldGhvZCA9ICJjdiIsIG51bWJlciA9IDEwKSkNClNWTTIgPC0gdHJhaW4ocmVzcG9uc2V+LiwgZGF0YSA9IGtoYW50cmFpbiwgbWV0aG9kID0gInN2bUxpbmVhciIsIHRyQ29udHJvbCA9IHRyYWluQ29udHJvbChtZXRob2QgPSAiY3YiLCBudW1iZXIgPSAxMCkpDQpgYGANCihjKQ0KQ29tcGFyZSB0aGUgYWNjdXJhY2llcyBvZiB0aGUgZm91ciBtb2RlbHMgb24gdGhlIHRyYWluaW5nIGRhdGEuDQpgYGB7cn0NCkNBUlQycCA8LSBwcmVkaWN0KENBUlQyLCBuZXdkYXRhID0ga2hhbnRyYWluKQ0KY29uZnVzaW9uTWF0cml4KENBUlQycCwga2hhbnRyYWluJHJlc3BvbnNlKQ0KDQpSRjJwIDwtIHByZWRpY3QoUkYyLCBuZXdkYXRhID0ga2hhbnRyYWluKQ0KY29uZnVzaW9uTWF0cml4KFJGMnAsIGtoYW50cmFpbiRyZXNwb25zZSkNCg0KR0JNMnAgPC0gcHJlZGljdChHQk0yLCBuZXdkYXRhID0ga2hhbnRyYWluKQ0KY29uZnVzaW9uTWF0cml4KEdCTTJwLCBraGFudHJhaW4kcmVzcG9uc2UpDQoNClNWTTJwIDwtIHByZWRpY3QoU1ZNMiwgbmV3ZGF0YSA9IGtoYW50cmFpbikNCmNvbmZ1c2lvbk1hdHJpeChTVk0ycCwga2hhbnRyYWluJHJlc3BvbnNlKQ0KYGBgDQpUaGVyZSB3YXMgbGl0dGxlIHZhcmlhdGlvbiBiZXR3ZWVuIHRoZSBoaWdoIGFjY3VyYWNpZXMgb2YgdGhlc2UgbW9kZWxzIG9uIHRoZSB0cmFpbmluZyBkYXRhc2V0LCBob3dldmVyIGl0IGNvdWxkIGJlIGxvd2VyIHdoZW4gbW9kZWxpbmcgdGhlIHRlc3RpbmcgZGF0YS4NCg0KKGQpDQpDb21wYXJlIHRoZSBhY2N1cmFjaWVzIG9mIHRoZSBmb3VyIG1vZGVscyBvbiB0aGUgdGVzdGluZyBkYXRhLg0KYGBge3J9DQpDQVJUMnAyIDwtIHByZWRpY3QoQ0FSVDIsIG5ld2RhdGEgPSBraGFudGVzdCkNCmNvbmZ1c2lvbk1hdHJpeChDQVJUMnAyLCBraGFudGVzdCRyZXNwb25zZSkNCg0KUkYycDIgPC0gcHJlZGljdChSRjIsIG5ld2RhdGEgPSBraGFudGVzdCkNCmNvbmZ1c2lvbk1hdHJpeChSRjJwMiwga2hhbnRlc3QkcmVzcG9uc2UpDQoNCkdCTTJwMiA8LSBwcmVkaWN0KEdCTTIsIG5ld2RhdGEgPSBraGFudGVzdCkNCmNvbmZ1c2lvbk1hdHJpeChHQk0ycDIsIGtoYW50ZXN0JHJlc3BvbnNlKQ0KDQpTVk0ycDIgPC0gcHJlZGljdChTVk0yLCBuZXdkYXRhID0ga2hhbnRlc3QpDQpjb25mdXNpb25NYXRyaXgoU1ZNMnAyLCBraGFudGVzdCRyZXNwb25zZSkNCmBgYA0KVGhlIGFjY3VyYWN5IG9mIHRoZSBDQVJUIG1vZGVsIHdhcyBtdWNoIGxvd2VyIHRoYW4gdGhlIGFjY3VyYWN5IG9mIHRoZSBTVk0gbW9kZWwuIA0KDQojIFF1ZXN0aW9uIDMNClRoZSBkYXRhIGh0dHBzOi8vYXJjaGl2ZS5pY3MudWNpLmVkdS9tbC9kYXRhc2V0cy9FbmVyZ3krZWZmaWNpZW5jeSBjb250YWlucw0KZGF0YSBvbiBidWlsZGluZyBjaGFyYWN0ZXJpc3RpY3MgYW5kIGVuZXJneSBlZmZpY2llbmN5LiBXaGF0IGlzIG5ldyBoZXJlIGlzIHRoYXQgdGhlcmUgYXJlIHR3byByZXNwb25zZSB2YXJpYWJsZXMsIGhlYXRpbmcgbG9hZCAoWTEpIGFuZCBjb29saW5nIGxvYWQgKFkyKS4NCg0KKGEpDQpMb2FkIHRoZSBkYXRhIGludG8gUiBhbmQgbm9ybWFsaXplIGl0IHNvIGl0IGlzIHN1aXRhYmxlIGZvciBhbmFseXNpcyBieSBhIG5ldXJhbCBuZXR3b3JrLiBTZXQNCnRoZSBzZWVkIHRvIDEyMzQ1IGFuZCB1c2UgY3JlYXRlRGF0YVBhcnRpdGlvbiAodXNpbmcgWTEgYXMgdGhlIHJlc3BvbnNlKSB3aXRoIHA9MC43IHRvDQpwYXJ0aXRpb24gdGhlIGRhdGEgaW50byB0cmFpbmluZyBhbmQgdGVzdGluZyBzZXRzLg0KYGBge3J9DQpsaWJyYXJ5KHJlYWR4bCkNCmxpYnJhcnkoY2FyZXQpDQpsaWJyYXJ5KG5ldXJhbG5ldCkNCmVuYiA8LSByZWFkX2V4Y2VsKCJBOi9DaHJvbWUgRG93bmxvYWRzL0VOQjIwMTJfZGF0YS54bHN4IikNCm5vcm1hbCA8LSBmdW5jdGlvbih4KXtyZXR1cm4oKHgtbWluKHgpKS8obWF4KHgpLW1pbih4KSkpfQ0KDQplbmIgPC0gYXMuZGF0YS5mcmFtZShsYXBwbHkoZW5iLCBub3JtYWwpKQ0KDQpzZXQuc2VlZCgxMjM0NSkNCg0KdHJhaW5pbmRleCA8LSBjcmVhdGVEYXRhUGFydGl0aW9uKHkgPSBlbmIkWTEsIHAgPSAwLjcsIGxpc3QgPSBGQUxTRSkNCmVuYnRyYWluIDwtIGVuYlt0cmFpbmluZGV4LCBdDQplbmJ0ZXN0IDwtIGVuYlstdHJhaW5pbmRleCwgXQ0KYGBgDQooYikNClVzZSB0cmFpbiB3aXRoIG1ldGhvZD0ibm5ldCIgdG8gYnVpbGQgYSBuZXVyYWwgbmV0d29yayBtb2RlbCBmb3IgWTEgdXNpbmcgWDEsIFgyLCAuLi4sIFg4DQphcyBwcmVkaWN0b3JzLiAoRG9u4oCZdCB1c2UgWTIgYXMgYSBwcmVkaWN0b3IuKSBDYWxsIHRoZSBtb2RlbCBOTjNiLiBBbHNvLCBub3RlIHRoYXQgdGhlcmUgaXMgbm8NCm5lZWQgdG8gY2VudGVyIGFuZCBzY2FsZSB0aGUgcHJlZGljdG9ycy4NCmBgYHtyfQ0KTk4zYiA8LSB0cmFpbihZMX4uLVkyLCBkYXRhID0gZW5idHJhaW4sIG1ldGhvZCA9ICJubmV0IiwgdHJDb250cm9sID0gdHJhaW5Db250cm9sKG1ldGhvZCA9ICJjdiIsIG51bWJlciA9IDEwKSwgdHJhY2UgPSBGQUxTRSkNCg0KYGBgDQooYykNCkNvbXB1dGUgUjINCmZvciBOTjNiIG9uIHRoZSB0ZXN0aW5nIGRhdGENCmBgYHtyfQ0KTk4zYnAgPC0gcHJlZGljdChOTjNiLCBlbmJ0ZXN0KQ0KY29yKE5OM2JwLCBlbmJ0ZXN0JFkxKV4yIA0KYGBgDQooZCkNClRvIHByZWRpY3QgYm90aCBZMSBhbmQgWTIsIHVzZSB0aGUgbmV1cmFsbmV0IGZ1bmN0aW9uIGluIHRoZSBuZXVyYWxuZXQgcGFja2FnZS4gVXNpbmcgdGhlDQp0cmFpbmluZyBkYXRhLCBidWlsZCBhIG1vZGVsIGNhbGxlZCBOTjNkIHdpdGggb25lIGhpZGRlbiB1bml0IGluIG9uZSBoaWRkZW4gbGF5ZXIuIFBsb3QgTk4zZA0KdXNpbmcgcGxvdChOTjNkLCByZXA9ImJlc3QiKSBhbmQgdXNlIHRoZSB0ZXN0aW5nIGRhdGEgdG8gY29tcHV0ZSBSMg0KZm9yIFkxIGFuZCBZMi4NCmBgYHtyfQ0KTk4zZCA8LSBuZXVyYWxuZXQoWTErWTJ+WDErWDIrWDMrWDQrWDUrWDYrWDcrWDgsIGRhdGEgPSBlbmJ0cmFpbiwgaGlkZGVuID0gMSkNCnBsb3QoTk4zZCwgcmVwID0gImJlc3QiKQ0KDQpOTjNkcCA8LSBwcmVkaWN0KE5OM2QsIGVuYnRlc3QpDQpjb3IoTk4zZHAsIGVuYnRlc3QkWTEpXjINCmNvcihOTjNkcCwgZW5idGVzdCRZMileMg0KYGBgDQooZSkNCk1ha2UgYSBuZXcgbW9kZWwsIE5OM2UsIGZvciBZMSBhbmQgWTIgd2l0aCB0d28gaGlkZGVuIGxheWVycywgdGhlIGZpcnN0IGhhdmluZyAyIG5vZGVzIGFuZA0KdGhlIHNlY29uZCBoYXZpbmcgMSBub2RlLiBQbG90IE5OM2UgdXNpbmcgcGxvdChOTjNlLCByZXA9ImJlc3QiKSBhbmQgdXNlIHRoZSB0ZXN0aW5nIGRhdGENCnRvIGNvbXB1dGUgUjINCmZvciBZMSBhbmQgWTIuDQpgYGB7cn0NCk5OM2UgPC0gbmV1cmFsbmV0KFkxK1kyflgxK1gyK1gzK1g0K1g1K1g2K1g3K1g4LCBkYXRhID0gZW5idHJhaW4sIGhpZGRlbiA9IGMoMiwxKSkNCnBsb3QoTk4zZSwgcmVwID0gImJlc3QiKQ0KDQpOTjNlcCA8LSBwcmVkaWN0KE5OM2QsIGVuYnRlc3QpDQpjb3IoTk4zZXAsIGVuYnRlc3QkWTEpXjINCmNvcihOTjNlcCwgZW5idGVzdCRZMileMg0KYGBgDQpUaGUgcmVsYXRpdmVseSBoaWdoICRSXjIkIHZhbHVlIG9mIDAuOTIgcmVwcmVzZW50cyBhIHNtYWxsIGRpZmZlcmVuY2UgYmV0d2VlbiB0aGUgb2JzZXJ2ZWQgYW5kIGZpdHRlZCB2YWx1ZXMgbWFraW5nIGl0IGEgZGVjZW50IG1vZGVsIGZvciB0aGUgZGF0YS4NCg0KIyBRdWVzdGlvbiA0DQpJbiB0aGlzIHByb2JsZW0sIHdlIGludmVzdGlnYXRlIHRoZSBpbXBvcnRhbmNlIG9mIG5vcm1hbGl6aW5nIHRoZSBkYXRhIGJlZm9yZSBjb25zdHJ1Y3RpbmcgYSBuZXVyYWwgbmV0d29yayBtb2RlbC4gQ29uc2lkZXIgdGhlIEJvc3RvbiBkYXRhIHNldCBpbiB0aGUgTUFTUyBwYWNrYWdlIHdpdGggbHN0YXQNCnByZWRpY3RpbmcgbWVkdi4NCihhKQ0KU2V0IHRoZSBzZWVkIHRvIDEyMzQ1IGFuZCBjb25zdHJ1Y3QgYSBuZXVyYWwgbmV0d29yayBtb2RlbCBjYWxsZWQgTk40YiB3aXRoIG9uZSBoaWRkZW4NCmxheWVyIGNvbnRhaW5pbmcgb25lIGhpZGRlbiB2YXJpYWJsZS4gUGxvdCB0aGUgZGF0YSBhbmQgc3VwZXJpbXBvc2UgdGhlIG1vZGVsIG92ZXIgdGhlIGRhdGEuDQpDb21tZW50IG9uIHRoZSBxdWFsaXR5IG9mIHRoZSBmaXQuDQpgYGB7cn0NCmxpYnJhcnkoTUFTUykNCmxpYnJhcnkoY2FyZXQpDQpsaWJyYXJ5KG5ldXJhbG5ldCkNCnNldC5zZWVkKDEyMzQ1KQ0KDQpOTjRiIDwtIG5ldXJhbG5ldChtZWR2IH4gbHN0YXQsIGRhdGEgPSBCb3N0b24sIGhpZGRlbiA9IDEpDQpwcmVkaWN0ZWQgPC0gcHJlZGljdChOTjRiLCBCb3N0b24pDQoNCnBsb3QoQm9zdG9uJGxzdGF0LCBCb3N0b24kbWVkdiwgdHlwZSA9ICJwIiwgcGNoID0gMjAsIHhsYWI9ImxzdGF0IiwgeWxhYj0ibWVkdiIsIG1haW49IkJvc3RvbiBEYXRhIikNCmxpbmVzKGxvd2VzcyhCb3N0b24kbHN0YXQsIHByZWRpY3RlZCksIGx3ZD0yLCBjb2w9ImdyZWVuIikNCmBgYA0KVGhlIG1vZGVsIGRvZXMgbm90IHJlcHJlc2VudCB0aGUgQm9zdG9uIGRhdGEgd2VsbC4gVGhlIHRyZW5kbGluZSBpcyBob3Jpem9udGFsIHdoaWxlIHRoZSBkYXRhIGhhcyBhbiB1cHdhcmQgdHJlbmQuDQoNCihiKQ0KQ29uc3RydWN0IGEgbmV3IGRhdGFmcmFtZSBjb250YWluaW5nIGEgbm9ybWFsaXplZCB2ZXJzaW9uIG9mIHRoZSBCb3N0b24gZGF0YS4NCmBgYHtyfQ0KI25vcm1hbGl6YXRpb24gZnVuY3Rpb24NCm5vcm1hbGl6ZTwtZnVuY3Rpb24oeCkNCiAgew0KICAgIHJldHVybigoeC1taW4oeCkpLyhtYXgoeCktbWluKHgpKSkNCn0NCg0KI25vcm1hbGl6aW5nIGRhdGENCk5vcm1Cb3N0b25EYXRhIDwtIGFzLmRhdGEuZnJhbWUobGFwcGx5KEJvc3Rvbiwgbm9ybWFsaXplKSkNCmBgYA0KKGMpDQpVc2luZyB0aGUgbm9ybWFsaXplZCBkYXRhLCBjb25zdHJ1Y3QgYSBuZXVyYWwgbmV0d29yayBtb2RlbCBjYWxsZWQgTk40ZCB3aXRoIG9uZSBoaWRkZW4NCmxheWVyIGNvbnRhaW5pbmcgb25lIGhpZGRlbiB2YXJpYWJsZS4gUGxvdCB0aGUgZGF0YSBhbmQgc3VwZXJpbXBvc2UgdGhlIG1vZGVsIG92ZXIgdGhlIGRhdGENCmFuZCBtYWtlIHRoZSBjdXJ2ZSByZWQuIENvbW1lbnQgb24gdGhlIHF1YWxpdHkgb2YgdGhlIGZpdC4NCmBgYHtyfQ0KI05ldXJhbCBuZXR3b3JrIHdpdGggbm9ybWFsaXplZCBkYXRhIGFuZCBvbmUgaGlkZGVuIGxheWVyDQpOTjRkIDwtIG5ldXJhbG5ldChtZWR2IH4gbHN0YXQsIGRhdGEgPSBOb3JtQm9zdG9uRGF0YSwgaGlkZGVuID0gMSkNCnByZWRpY3RlZGQgPC0gcHJlZGljdChOTjRkLCBOb3JtQm9zdG9uRGF0YSkNCg0KcGxvdChOb3JtQm9zdG9uRGF0YSRsc3RhdCwgTm9ybUJvc3RvbkRhdGEkbWVkdiwgdHlwZSA9ICJwIiwgcGNoID0gMjAsIHhsYWI9ImxzdGF0IiwgeWxhYj0ibWVkdiIsIG1haW49Ik5vcm1hbGl6ZWQgQm9zdG9uIERhdGEiKQ0KbGluZXMobG93ZXNzKE5vcm1Cb3N0b25EYXRhJGxzdGF0LCBwcmVkaWN0ZWRkKSwgbHdkPTIsIGNvbD0icmVkIikNCmBgYA0KVGhpcyBtb2RlbCByZXByZXNlbnRzIHRoZSBCb3N0b24gZGF0YSBtdWNoIGJldHRlciB0aGFuIHRoZSBmaXJzdCBtb2RlbC4gVGhlIHRyZW5kbGluZSBmb2xsb3dzIHRoZSB0cmVuZCBvZiB0aGUgZGF0YS4NCg0KKGQpDQpVc2UgcGxvdChOTjRkLCByZXA9ImJlc3QiKSB0byB2aXN1YWxpemUgdGhlIG1vZGVsIGFuZCB3cml0ZSBkb3duIHRoZSBjb3JyZXNwb25kaW5nIGVxdWF0aW9uLiBVc2UgUyB0byBpbmRpY2F0ZSB0aGUgYWN0aXZhdGlvbiBmdW5jdGlvbi4NCmBgYHtyfQ0KcGxvdChOTjRkLCByZXA9ImJlc3QiKQ0KYGBgDQpUaGUgZXF1YXRpb24gb2YgdGhpcyBtb2RlbCBpczogDQokbWVkdiA9IDIuNzA1ODctMi41MzE2N1MoMC45OTc5OSs2LjAzNjY2KGxzdGF0KSkkDQooZSkNClVzaW5nIHRoZSBub3JtYWxpemVkIGRhdGEsIGNvbnN0cnVjdCBhIG5ldXJhbCBuZXR3b3JrIG1vZGVsIGNhbGxlZCBOTjRmIHdpdGggdHdvIGhpZGRlbg0KbGF5ZXJzIGNvbnRhaW5pbmcgdHdvIGhpZGRlbiB2YXJpYWJsZXMgZWFjaC4gUGxvdCB0aGUgZGF0YSBhbmQgc3VwZXJpbXBvc2UgdGhlIG1vZGVsIG92ZXINCnRoZSBkYXRhIGFuZCBtYWtlIHRoZSBjdXJ2ZSBibHVlLiBDb21tZW50IG9uIHRoZSBxdWFsaXR5IG9mIHRoZSBmaXQuDQpgYGB7cn0NCiNOZXVyYWwgbmV0d29yayB3aXRoIG5vcm1hbGl6ZWQgZGF0YSBhbmQgdHdvIGhpZGRlbiBsYXllcnMNCk5ONGYgPC0gbmV1cmFsbmV0KG1lZHYgfiBsc3RhdCwgZGF0YSA9IE5vcm1Cb3N0b25EYXRhLCBoaWRkZW4gPSBjKDIsMikpDQpwcmVkaWN0ZWRmIDwtIHByZWRpY3QoTk40ZiwgTm9ybUJvc3RvbkRhdGEpDQoNCnBsb3QoTm9ybUJvc3RvbkRhdGEkbHN0YXQsIE5vcm1Cb3N0b25EYXRhJG1lZHYsIHR5cGUgPSAicCIsIHBjaCA9IDIwLCB4bGFiPSJsc3RhdCIsIHlsYWI9Im1lZHYiLCBtYWluPSJUd28gSGlkZGVuIExheWVycyBOb3JtYWxpemVkIEJvc3RvbiBEYXRhIikNCmxpbmVzKGxvd2VzcyhOb3JtQm9zdG9uRGF0YSRsc3RhdCwgcHJlZGljdGVkZiksIGx3ZD0yLCBjb2w9ImJsdWUiKQ0KYGBgDQpTaW1pbGFyaWx5IHRvIHRoZSBwcmV2aW91cyBtb2RlbCB0aGlzIG1vZGVsIHJlcHJlc2VudHMgdGhlIEJvc3RvbiBkYXRhIHdlbGwuIFRoZSB0cmVuZGxpbmUgZm9sbG93cyB0aGUgdHJlbmQgb2YgdGhlIGRhdGEuDQoNCiMgUXVlc3Rpb24gNQ0KQSBjcm9va2VkIGVtcGxveWVlIGF0IGEgY2FzaW5vIG9jY2FzaW9uYWxseSBzd2l0Y2hlcyBvdXQgYSBmYWlyIHNpeC1zaWRlZCBkaWUgZm9yIGENCndlaWdodGVkIHNpeC1zaWRlZCBkaWUsIGFuZCBvYnNlcnZhdGlvbnMgb2YgZGllIHJvbGxzIHN1cGVydmlzZWQgYnkgdGhpcyBlbXBsb3llZSBhcmUgcmVjb3JkZWQgaW4NCkNhc2luby5jc3YuDQooYSkNClNpbmNlIHRoZSBlbXBsb3llZSBvbmx5IHJhcmVseSBzd2l0Y2hlcyB0aGUgZGljZSwgaW5pdGlhbGl6ZSB0aGUgdHJhbnNpdGlvbiBtYXRyaXggdG8gYmUgQSA9WzAuOTkgMC4wMSAwLjAyIDAuOThdLiBTZXQgdGhlIHNlZWQgdG8gNjc4OSBhbmQgYW5kIGluaXRpYWxpemUgz4AgYW5kIEIgd2l0aCByYW5kb20gcG9zaXRpdmUgZW50cmllcywgYnV0IGJlIHN1cmUgdGhhdA0KdGhlIGVudHJpZXMgaW4gz4AgYWRkIHRvIG9uZSBhbmQgdGhlIHJvd3Mgb2YgQiBhZGQgdG8gb25lLg0KYGBge3J9DQpub3JtYWxpemVQcm9iYWJpbGl0aWVzIDwtIGZ1bmN0aW9uKHgpe3gvc3VtKHgpfQ0KDQpsaWJyYXJ5KEhNTSkNCmNhc2lubyA8LSByZWFkLmNzdigiQTovQ2hyb21lIERvd25sb2Fkcy9DYXNpbm8uY3N2IiwgaGVhZGVyID0gVFJVRSwgc2VwID0gIiwiKQ0KDQpzZXQuc2VlZCg2Nzg5KQ0KUElwcm9iYWJpbGl0aWVzIDwtIG5vcm1hbGl6ZVByb2JhYmlsaXRpZXMocnVuaWYoMikpDQpCcHJvYmFiaWxpdGllcyA8LSBhcHBseShtYXRyaXggKHJ1bmlmKDEyKSwgNiksIDEsIG5vcm1hbGl6ZVByb2JhYmlsaXRpZXMpDQoNCnRyYW5zaXRpb25NYXRyaXggPC0gbWF0cml4KGMoLjk5LCAuMDEsIC4wMiwgLjk4KSkNCmBgYA0KKGIpDQpVc2UgdGhlIEJhdW0tV2VsY2ggYWxnb3JpdGhtIHRvIGJ1aWxkIGEgaGlkZGVuIE1hcmtvdiBtb2RlbCBmb3IgdGhlIGNyb29rZWQgZW1wbG95ZWXigJlzDQpiZWhhdmlvci4gV2hhdCBkb2VzIHRoZSBtb2RlbCBwcmVkaWN0IGZvciB0aGUgd2VpZ2h0cyBvZiB0aGUgdW5mYWlyIGRpZT8NCmBgYHtyfQ0KaG1tIDwtIGluaXRITU0oYygiRmFpciIsICJVbmZhaXIiKSwgMTo2LCBzdGFydFByb2JzID0gUElwcm9iYWJpbGl0aWVzLCB0cmFuc1Byb2JzID0gdHJhbnNpdGlvbk1hdHJpeCwgZW1pc3Npb25Qcm9icyA9IEJwcm9iYWJpbGl0aWVzKQ0KDQpidyA8LSBiYXVtV2VsY2goaG1tLCBjYXNpbm8kUm9sbCwgbWF4SXRlcmF0aW9ucyA9IDUwKQ0KYnckaG1tJGVtaXNzaW9uUHJvYnMNCmBgYA0KVGhlIG1vZGVsIHByZWRpY3RzIHRoYXQgdGhlIHdlaWdodGVkIHBhcnQgb2YgdGhlIGRpZSBpcyB0aGUgb25lIGJlY2F1c2UgdGhhdCBpcyBvcHBvc2l0ZSBvZiBzaWRlIHNpeC4NCg0KIyBRdWVzdGlvbiA2DQpUaGUgZGF0YSBpbiBLYWdnbGVTdXJ2ZXkuY3N2IGFyZSBkZXJpdmVkIGZyb20gdGhlIHJlc3BvbnNlcyB0byB0aGUgMjAxOCBLYWdnbGUgTWFjaGluZSBMZWFybmluZyBhbmQgRGF0YSBTY2llbmNlIFN1cnZleS4gUmVzcG9uZGVudHMgd2VyZSBhc2tlZCDigJxIb3cgZG8geW91IHBlcmNlaXZlIHRoZSBxdWFsaXR5DQpvZiBvbmxpbmUgbGVhcm5pbmcgcGxhdGZvcm1zIGFuZCBNT09DcyBhcyBjb21wYXJlZCB0byB0aGUgcXVhbGl0eSBvZiB0aGUgZWR1Y2F0aW9uIHByb3ZpZGVkIGJ5DQp0cmFkaXRpb25hbCBicmljayBhbmQgbW9ydGFyIGluc3RpdHV0aW9ucz/igJ0gYW5kIHJlc3BvbnNlcyB1c2VkIHRoZSBmb2xsb3dpbmcgc2NhbGUuDQoNCjEuIE11Y2ggd29yc2UNCjIuIFNsaWdodGx5IHdvcnNlDQozLiBOZWl0aGVyIGJldHRlciBub3Igd29yc2UvTm8gb3Bpbmlvbi9JIGRvIG5vdCBrbm93DQo0LiBTbGlnaHRseSBiZXR0ZXINCjUuIE11Y2ggYmV0dGVyDQooYSkNClNpbmNlIHRoZXJlIGFyZSBhIGxvdCBvZiBtaXNzaW5nIHNhbGFyaWVzLCBsZXTigJlzIHJlbW92ZSB0aGUgc2FsYXJ5IGRhdGEsIGFuZCBzaW5jZSB0aGVyZSBhcmUgc28NCm1hbnkgZGlmZmVyZW50IGNvdW50cmllcywgbGV04oCZcyBhbHNvIHJlbW92ZSB0aGUgY291bnRyeSBkYXRhLiBGcm9tIHdoYXQgcmVtYWlucywgcmVtb3ZlIGFueQ0KaW5jb21wbGV0ZSBjYXNlcy4NCmBgYHtyfQ0Ka2FnZ2xlU3VydmV5IDwtIHJlYWQuY3N2KCJBOi9DaHJvbWUgRG93bmxvYWRzL0thZ2dsZVN1cnZleS5jc3YiKQ0Ka2FnZ2xlU3VydmV5JFNhbGFyeSA8LSBOVUxMDQprYWdnbGVTdXJ2ZXkkQ291bnRyeSA8LSBOVUxMDQprYWdnbGVTdXJ2ZXkgPC0ga2FnZ2xlU3VydmV5WyEoaXMubmEoa2FnZ2xlU3VydmV5Wyw0XSkgfCBrYWdnbGVTdXJ2ZXlbLDRdPT0iIiksIF0NCmthZ2dsZVN1cnZleSA8LSBrYWdnbGVTdXJ2ZXlbIShpcy5uYShrYWdnbGVTdXJ2ZXlbLDNdKSB8IGthZ2dsZVN1cnZleVssM109PSIiKSwgXQ0KYGBgDQooYikNClVzZSB0aGUgcG9sciBmdW5jdGlvbiBpbiB0aGUgTUFTUyBwYWNrYWdlIHRvIGJ1aWxkIGFuIG9yZGluYWwgcmVncmVzc2lvbiBtb2RlbCBjYWxsZWQgT1JEDQp1c2luZyBHZW5kZXIsIEFnZSwgYW5kIFN0dWRlbnQgdG8gcHJlZGljdCByZXNwb25zZXMgdG8gdGhlIHN1cnZleS4NCmBgYHtyfQ0KbGlicmFyeShNQVNTKQ0Ka2FnZ2xlU3VydmV5JFJlc3BvbnNlIDwtIGFzLmZhY3RvcihrYWdnbGVTdXJ2ZXkkUmVzcG9uc2UpDQpPUkQgPC0gcG9scihSZXNwb25zZX4oR2VuZGVyICsgQWdlICsgU3R1ZGVudCksIGRhdGEgPSBrYWdnbGVTdXJ2ZXkpDQpgYGANCihjKQ0KV2UgY2FuIHVzZSBwcmVkaWN0IHRvIHNlZSBwcm9iYWJpbGl0aWVzLiBSdW4NCg0KdGVzdGluZyA8LSBkYXRhLmZyYW1lKFN0dWRlbnQ9YygwLDEsMCwxKSwNCkdlbmRlcj1jKCJNYWxlIiwiTWFsZSIsIkZlbWFsZSIsIkZlbWFsZSIpLA0KQWdlPWMoMjUsMjUsMjUsMjUpKQ0KcHJlZGljdChPUkQsbmV3ZGF0YSA9IHRlc3RpbmcsIHR5cGU9InAiKQ0KDQp0byBzZWUgcHJvYmFiaWxpdGllcyBmb3IgZWFjaCByZXNwb25zZSBmb3IgMjUteWVhci1vbGQgcGVvcGxlLiBXaGljaCBncm91cCBpcyBtb3N0IGxpa2VseSB0bw0KcmVzcG9uZCDigJxNdWNoIGJldHRlcuKAnSB0byB0aGUgc3VydmV5IHF1ZXN0aW9uPw0KYGBge3J9DQp0ZXN0aW5nIDwtIGRhdGEuZnJhbWUoU3R1ZGVudD1jKDAsMSwwLDEpLEdlbmRlcj1jKCJNYWxlIiwiTWFsZSIsIkZlbWFsZSIsIkZlbWFsZSIpLEFnZT1jKDI1LDI1LDI1LDI1KSkNCnByZWRpY3QoT1JELG5ld2RhdGEgPSB0ZXN0aW5nLCB0eXBlPSJwIikNCmBgYA0KR3JvdXAgMiBpcyBtb3N0IGxpa2VseSB0byByZXNwb25kICJNdWNoIGJldHRlciIgYXQgMjcuOSUuDQoNCihkKQ0KQ2FyZWZ1bGx5IGV4cGxhaW4gdGhlIGFmZmVjdCBvZiBBZ2Ugb24gdGhlIG1vZGVsLg0KYGBge3J9DQpPUkQkY29lZmZpY2llbnRzDQpgYGANCkxvb2tpbmcgYXQgdGhlIGNvZWZmaWNpZW50cyBvZiBPUkQsIEFnZSBoYXMgYSBjb2VmZmljaWVudCBvZiAtMC4wMDk1IHdoaWNoIGltcGxpZXMgdGhhdCBpdCBoYXMgYSBzaWduaWZpY2FudCBlZmZlY3Qgb24gdGhlIFJlc3BvbnNlIG91dGNvbWVzIGNvbXBhcmVkIHRvIHRoZSBvdGhlciBmYWN0b3JzLg0KDQojIFF1ZXN0aW9uIDcNClRoZSBmaWxlIFNvdXRoQW1lcmljYS5jc3YgY29udGFpbnMgZGF0YSBvbiB0ZW4gY291bnRyaWVzIGluIFNvdXRoIEFtZXJpY2EuDQooYSkNCkxvYWQgdGhlIGRhdGEsIHJlbmFtZSB0aGUgcm93cyB3aXRoIHRoZSBuYW1lcyBvZiB0aGUgY291bnRyaWVzLCBhbmQgdXNlIHNjYWxlIHRvIGNlbnRlcg0KYW5kIHNjYWxlIGVhY2ggY29sdW1uLiBUaGVuIHVzZSBoY2x1c3QgdG8gcHJvZHVjZSBhIGNsdXN0ZXIgZGVuZHJvZ3JhbSB0aGF0IGRpc3BsYXlzIGhvdw0Kc2ltaWxhciBjb3VudHJpZXMgYXJlIHRvIG9uZSBhbm90aGVyLiBVc2UgcGxvdCB0byBkaXNwbGF5IHRoZSBjbHVzdGVycyBhbmQgYmUgc3VyZSB0aGF0IHRoZQ0KY291bnRyeSBuYW1lcyBhcmUgdXNlZCBmb3IgdGhlIGxhYmVscy4NCmBgYHtyfQ0Kc291dGhBbWVyaWNhIDwtIHJlYWQuY3N2KCJBOi9DaHJvbWUgRG93bmxvYWRzL1NvdXRoQW1lcmljYS5jc3YiKQ0Kc2NhbGVkU0EgPC0gc2NhbGUoc291dGhBbWVyaWNhWywgYygyOjgpXSwgY2VudGVyID0gVFJVRSwgc2NhbGUgPSBUUlVFKSANCnJvd25hbWVzKHNjYWxlZFNBKSA8LSBjKCJBcmdlbnRpbmEiLCAiQm9saXZpYSIsICJCcmF6aWwiLCAiQ2hpbGUiLCJDb2xvbWJpYSIsIkVjdWFkb3IiLCAiUGFyYWd1YXkiLCAiUGVydSIsIlVydWd1YXkiLCAiVmVuZXp1ZWxhIikNCmhDbHVzdCA8LSBoY2x1c3QoZGlzdChzY2FsZWRTQSkpDQpwbG90KGhDbHVzdCwgbWFpbiA9ICJTb3V0aCBBbWVyaWNhbiBDb3VudHJpZXMiLCB4bGFiID0gIkNsdXN0ZXJzIikNCmBgYA0KKGIpDQpBY2NvcmRpbmcgdG8gdGhlIGRlbmRyb2dyYW0sIHdoaWNoIHR3byBjb3VudHJpZXMgYXJlIG1vc3QgbGlrZSBDb2xvbWJpYT8NCg0KUGVydSBhbmQgRWN1YWRvciBhcmUgbW9zdCBsaWtlIENvbG9tYmlhLg0KDQooYykNClN1cHBvc2UgdGhhdCB3ZSBjaG9vc2UgYSBoZWlnaHQgc28gdGhhdCB0aGVyZSBhcmUgb25seSB0d28gY2x1c3RlcnMuIExpc3QgdGhlIGNvdW50cmllcyBpbiBlYWNoDQpjbHVzdGVyLg0KYGBge3J9DQpoQ2x1c3QkaGVpZ2h0WzJdDQpgYGANCkNob29zaW5nIGEgaGVpZ2h0IG9mIDEuNDMxNTMgd2lsbCByZXN1bHQgaW4gdHdvIGNsdXN0ZXJzLCBvbmUgYmVpbmcgQ29sb21iaWEgYW5kIFBlcnUsIGFuZCB0aGUgb3RoZXIgYmVpbmcgQXJnZW50aW5hIGFuZCBVcnVndWF5Lg0KDQojIFF1ZXN0aW9uIDgNClRoZSBmaWxlIEVkdWNhdGlvbkxldmVsLmNzdiBjb250YWlucyBkYXRhIG9uIGVkdWNhdGlvbiBsZXZlbHMgaW4gYWxsIG9mIHRoZSBjb3VudGllcyBpbg0KdGhlIFVuaXRlZCBTdGF0ZXMuDQooYSkNCkxvYWQgdGhlIGRhdGEuIFRoZXJlIGlzIG5vIG5lZWQgdG8gc2NhbGUgdGhlIGNvbHVtbnMgc2luY2UgdGhlIG51bWVyaWNhbCBjb2x1bW5zIGFyZSBhbGwNCnBlcmNlbnRhZ2VzLiBDYXJlZnVsbHkgZXhhbWluZSB0aGUgZGF0YSBhbmQgZG8gYW55IG5lY2Vzc2FyeSBwcmUtcHJvY2Vzc2luZy4NCmBgYHtyfQ0KZWR1Y2F0aW9uTGV2ZWwgPC0gcmVhZC5jc3YoIkE6L0Nocm9tZSBEb3dubG9hZHMvRWR1Y2F0aW9uTGV2ZWwuY3N2IiwgaGVhZGVyID0gVFJVRSwgc2VwID0gIiwiKQ0KZWR1Y2F0aW9uTGV2ZWxbMSxdIDwtIE5BICNSb3cgMSBpcyB0aGUgd2hvbGUgVVMNCmVkdWNhdGlvbkxldmVsIDwtIGVkdWNhdGlvbkxldmVsWyEoaXMubmEoZWR1Y2F0aW9uTGV2ZWxbLDRdKSB8IGVkdWNhdGlvbkxldmVsWyw0XT09IiIpLCBdICNSZW1vdmVzIE5BIHJvd3MNCmBgYA0KKGIpDQpTZXQgdGhlIHNlZWQgdG8gMTIzNC4gVXNlIEstbWVhbnMgY2x1c3RlcmluZyAoa21lYW5zKSB3aXRoIDIgY2x1c3RlcnMgb24gdGhlIHBlcmNlbnRhZ2UgZGF0YS4NCmBgYHtyfQ0Kc2V0LnNlZWQoMTIzNCkgDQprTWVhbnMgPC0ga21lYW5zKGVkdWNhdGlvbkxldmVsWyw0OjddLCBjZW50ZXJzID0gMikgDQpgYGANCihjKQ0KTWFrZSBhIG5ldyBkYXRhIGZyYW1lIGNhbGxlZCBjb2RlcyB0aGF0IGhhcyB0d28gdmFyaWFibGVzLCBmaXBzIGFuZCBjbHVzdGVyLiBmaXBzIGNvbnRhaW5zDQp0aGUgbnVtZXJpY2FsIElEIGZvciBlYWNoIGNvdW50eSBhbmQgY2x1c3RlciBpZGVudGlmaWVzIHRoZSBjbHVzdGVyIHRvIHdoaWNoIGVhY2ggY291bnR5DQpiZWxvbmdzLg0KYGBge3J9DQpmaXBzIDwtIGVkdWNhdGlvbkxldmVsJEZJUFMuQ29kZSANCmNsdXN0ZXIgPC0ga01lYW5zJGNsdXN0ZXIgDQpjb2RlcyA8LSBkYXRhLmZyYW1lKGZpcHMsIGNsdXN0ZXIpIA0KYGBgDQooZCkNCkxvYWQgdGhlIHVzbWFwcyBwYWNrYWdlIGFuZCBydW4gdGhlIGZvbGxvd2luZyBjb2RlIHRvIGdlbmVyYXRlIGEgY29sb3ItY29kZWQgbWFwIG9mIHRoZSBVUw0Kd2hlcmUgdGhlIGNvbG9yIGluZGljYXRlcyB0aGUgY2x1c3RlciBtZW1iZXJzaGlwIGZvciBlYWNoIGNvdW50eS4NCnBsb3QgdXNtYXAoZGF0YT1jb2RlcywgbGFiZWxzPVRSVUUsIHZhbHVlPeKAmWNsdXN0ZXLigJksIGxhYmVsIGNvbG9yPeKAmXdoaXRl4oCZKSArDQpzY2FsZSBmaWxsIGNvbnRpbnVvdXMobG93PSJyZWQiLCBoaWdoPSJncmVlbiIpICsNCnRoZW1lKGxlZ2VuZC5wb3NpdGlvbiA9ICJub25lIikNCmBgYHtyfQ0KbGlicmFyeSh1c21hcCkNCnBsb3RfdXNtYXAoZGF0YT1jb2RlcywgbGFiZWxzPVRSVUUsIHZhbHVlPSJjbHVzdGVyIiwgbGFiZWxfY29sb3I9IndoaXRlIikgKyBzY2FsZV9maWxsX2NvbnRpbnVvdXMobG93PSJyZWQiLCBoaWdoPSJibHVlIikgKyB0aGVtZShsZWdlbmQucG9zaXRpb24gPSAibm9uZSIpDQpgYGA=

DAT 315 Machine Learning Project 5