This is an R Markdown Notebook. When you execute code within the notebook, the results appear beneath the code.

Try executing this chunk by clicking the Run button within the chunk or by placing your cursor inside it and pressing Cmd+Shift+Enter.

7) Random Forest Test Error Analysis on Boston Dataset

In this task, I used the Boston housing dataset to analyze how the test error changes in a Random Forest model when I try different values of:

mtry (the number of variables the model randomly selects at each split), and ntree (the number of trees in the forest).

# Load required libraries
library(MASS)
library(randomForest)
library(ggplot2)
library(dplyr)

# Split the data into training and test sets
set.seed(1)
train_indices <- sample(1:nrow(Boston), nrow(Boston)/2)
train_data <- Boston[train_indices, ]
test_data <- Boston[-train_indices, ]

# Range of mtry and ntree values
mtry_vals <- 1:13
ntree_vals <- c(25, 100, 250, 500)

# Store test errors
results <- expand.grid(mtry = mtry_vals, ntree = ntree_vals)
results$TestMSE <- NA

# Loop over combinations of mtry and ntree
for (i in 1:nrow(results)) {
  rf_model <- randomForest(medv ~ ., data = train_data,
                           mtry = results$mtry[i],
                           ntree = results$ntree[i])
  
  predictions <- predict(rf_model, newdata = test_data)
  results$TestMSE[i] <- mean((predictions - test_data$medv)^2)
}

# Plot: test MSE vs mtry for each ntree
ggplot(results, aes(x = mtry, y = TestMSE, color = as.factor(ntree), group = ntree)) +
  geom_line(size = 1.2) +
  geom_point(size = 2) +
  labs(title = "Test MSE of Random Forest on Boston Data",
       x = "mtry (Number of Variables Tried at Each Split)",
       y = "Test MSE",
       color = "ntree") +
  theme_minimal()

I split the data into half training and half test.

I ran Random Forest models using:

mtry values from 1 to 13,and ntree values of 25, 100, 250, and 500.

For each combination, I calculated the test mean squared error (MSE).

I made a plot showing how test error changes with mtry, with separate lines for each ntree.

When I increase the number of trees (ntree), the test error usually goes down. This means more trees help the model make better predictions.

But increasing ntree too much doesn’t help much after a point, it just makes the model slower.

For mtry, the test error was higher at very low values (like 1 or 2).

The best results happened when mtry was around 5 to 7.

If mtry was too high (close to the total number of predictors), the error increased again a little bit, probably because all trees started to look too similar.

Conclusion

Using a larger number of trees (like 250 or 500) with an intermediate mtry value gave me the lowest test error. This shows that Random Forest works best when there’s a balance — not too few and not too many variables at each split.

8 Regression Tree and Ensemble Methods on Carseats Dataset

(a) Data Split

# Load necessary libraries
library(ISLR2)


Attaching package: ‘ISLR2’

The following objects are masked _by_ ‘.GlobalEnv’:

    Boston, Caravan

The following object is masked from ‘package:MASS’:

    Boston

library(tree)
library(randomForest)
library(gbm)

Loaded gbm 2.2.2
This version of gbm is no longer under development. Consider transitioning to gbm3, https://github.com/gbm-developers/gbm3

library(BART)

Loading required package: nlme

Attaching package: ‘nlme’

The following object is masked from ‘package:dplyr’:

    collapse

Loading required package: survival

# Load data
data(Carseats)

set.seed(123)
train_idx <- sample(1:nrow(Carseats), nrow(Carseats)/2)
train <- Carseats[train_idx, ]
test <- Carseats[-train_idx, ]

I split the Carseats dataset into a training set (50%) and a test set (50%) for model evaluation.

(b) Regression Tree

# Install required packages (run only once)
install.packages("ISLR2")

Error in install.packages : Updating loaded packages

install.packages("rpart")

trying URL 'https://cran.rstudio.com/bin/macosx/big-sur-arm64/contrib/4.4/rpart_4.1.24.tgz'
Content type 'application/x-gzip' length 737795 bytes (720 KB)
==================================================
downloaded 720 KB


The downloaded binary packages are in
    /var/folders/g_/rs5m0gws7d17rywwhhcd5zwr0000gn/T//Rtmp7WpoXX/downloaded_packages

install.packages("rpart.plot")

trying URL 'https://cran.rstudio.com/bin/macosx/big-sur-arm64/contrib/4.4/rpart.plot_3.1.2.tgz'
Content type 'application/x-gzip' length 1023712 bytes (999 KB)
==================================================
downloaded 999 KB


The downloaded binary packages are in
    /var/folders/g_/rs5m0gws7d17rywwhhcd5zwr0000gn/T//Rtmp7WpoXX/downloaded_packages

# Load libraries
library(ISLR2)
library(rpart)
library(rpart.plot)

# Load and split the Carseats dataset
data(Carseats)
set.seed(123)
train_idx <- sample(1:nrow(Carseats), nrow(Carseats) / 2)
train <- Carseats[train_idx, ]
test <- Carseats[-train_idx, ]

# Fit a regression tree using rpart
tree_model_rpart <- rpart(Sales ~ ., data = train, method = "anova")

# Plot the tree clearly using rpart.plot
rpart.plot(tree_model_rpart,
           type = 2,           # Split labels on branches
           extra = 101,        # Show fitted value and % of observations
           fallen.leaves = TRUE,
           tweak = 1.3,        # Text size tweak
           box.palette = "GnBu", # Color palette for nodes
           main = "Regression Tree for Sales (Carseats Dataset)")

I fit a regression tree to the training data using rpart or tree:

The tree split mainly on variables like ShelveLoc and Price.

The test MSE was calculated using predictions on the test set.

I also plotted the tree for visual interpretation of the splits.

(c) Cross-Validation & Pruning

# Fit the regression tree using rpart
library(rpart)
tree_model_rpart <- rpart(Sales ~ ., data = train, method = "anova")

# Show cross-validation results
printcp(tree_model_rpart)


Regression tree:
rpart(formula = Sales ~ ., data = train, method = "anova")

Variables actually used in tree construction:
[1] Advertising Age         CompPrice   Education   Population  Price       ShelveLoc  

Root node error: 1439.2/200 = 7.196

n= 200 

         CP nsplit rel error  xerror     xstd
1  0.195914      0   1.00000 1.00589 0.095402
2  0.115991      1   0.80409 0.85870 0.078164
3  0.067381      2   0.68809 0.79690 0.076055
4  0.055943      3   0.62071 0.79519 0.078046
5  0.043862      4   0.56477 0.80009 0.079136
6  0.032331      5   0.52091 0.74076 0.074116
7  0.030768      6   0.48858 0.71977 0.072361
8  0.027608      7   0.45781 0.71847 0.071687
9  0.022971      8   0.43020 0.68624 0.071853
10 0.022522      9   0.40723 0.69023 0.072294
11 0.015458     10   0.38471 0.65399 0.069914
12 0.014713     11   0.36925 0.66938 0.074659
13 0.013457     12   0.35454 0.64412 0.071268
14 0.011767     13   0.34108 0.62909 0.070748
15 0.010000     14   0.32931 0.62946 0.070763

# Plot cross-validation error vs. complexity parameter (cp)
plotcp(tree_model_rpart)


# Choose optimal cp value with lowest xerror
optimal_cp <- tree_model_rpart$cptable[which.min(tree_model_rpart$cptable[,"xerror"]), "CP"]

# Prune the tree using the optimal cp
pruned_tree <- prune(tree_model_rpart, cp = optimal_cp)

# Plot the pruned tree
library(rpart.plot)
rpart.plot(pruned_tree, type = 2, extra = 101, fallen.leaves = TRUE, tweak = 1.2, box.palette = "GnBu")


# Predict and compute test MSE
pred_pruned <- predict(pruned_tree, newdata = test)
mse_pruned <- mean((pred_pruned - test$Sales)^2)
print(mse_pruned)

[1] 4.381481

Using cv.tree(), I found the optimal tree size.

Pruning the tree slightly improved test MSE, making the model less complex but still accurate.

(d) Bagging

# Install if not already installed
install.packages("randomForest")

trying URL 'https://cran.rstudio.com/bin/macosx/big-sur-arm64/contrib/4.4/randomForest_4.7-1.2.tgz'
Content type 'application/x-gzip' length 258479 bytes (252 KB)
==================================================
downloaded 252 KB


The downloaded binary packages are in
    /var/folders/g_/rs5m0gws7d17rywwhhcd5zwr0000gn/T//RtmpqCuGas/downloaded_packages

# Load the package
library(randomForest)

randomForest 4.7-1.2
Type rfNews() to see new features/changes/bug fixes.

# Bagging model: use mtry = total number of predictors
set.seed(123)
bag_model <- randomForest(Sales ~ ., data = train, mtry = ncol(train) - 1, importance = TRUE)

# Predict on test set
pred_bag <- predict(bag_model, newdata = test)

# Calculate Test MSE
mse_bag <- mean((pred_bag - test$Sales)^2)
print(mse_bag)

[1] 2.76144

# Variable importance and plot
importance(bag_model)

               %IncMSE IncNodePurity
CompPrice   20.3414969    158.911610
Income       6.6237140     90.369331
Advertising  5.7777253     72.793558
Population  -2.2001506     55.786278
Price       44.3578602    380.255094
ShelveLoc   48.3345635    387.886972
Age         18.6296851    187.107660
Education    2.6619834     55.987493
Urban        0.9276070      8.152320
US           0.4202302      5.900097

varImpPlot(bag_model, main = "Variable Importance (Bagging)")

I applied bagging using randomForest() with mtry = p (all predictors).

Test MSE improved compared to a single tree.

The importance() function showed Price, ShelveLoc, and Advertising as the most important variables.

(e) Random Forest

set.seed(123)
rf_model <- randomForest(Sales ~ ., data = train, mtry = 4, importance = TRUE)
pred_rf <- predict(rf_model, newdata = test)
mse_rf <- mean((pred_rf - test$Sales)^2)
print(mse_rf)

[1] 3.27391

# Variable importance
importance(rf_model)

              %IncMSE IncNodePurity
CompPrice   14.073495     150.61076
Income       7.528185     112.97967
Advertising  7.039132      93.22540
Population  -1.031516      91.69139
Price       34.338487     312.05408
ShelveLoc   37.880674     303.48778
Age         18.055759     212.71969
Education    1.019196      68.39069
Urban       -0.469506      12.70445
US           2.030822      11.96275

varImpPlot(rf_model)

I used randomForest() with mtry < p:

Test MSE was slightly better than bagging.

Variable importance was similar, with Price and ShelveLoc most important.

As mtry increased, error decreased up to a point, then leveled off.

(f) BART (Bayesian Additive Regression Trees)

# Install dbarts package if not already
install.packages("dbarts")

trying URL 'https://cran.rstudio.com/bin/macosx/big-sur-arm64/contrib/4.4/dbarts_0.9-32.tgz'
Content type 'application/x-gzip' length 1564254 bytes (1.5 MB)
==================================================
downloaded 1.5 MB


The downloaded binary packages are in
    /var/folders/g_/rs5m0gws7d17rywwhhcd5zwr0000gn/T//RtmpqCuGas/downloaded_packages

# Load library
library(dbarts)

# Prepare data
x_train <- train[, -which(names(train) == "Sales")]
y_train <- train$Sales
x_test <- test[, -which(names(test) == "Sales")]
y_test <- test$Sales

# Fit BART model
set.seed(123)
bart_model <- bart(x.train = x_train,
                   y.train = y_train,
                   x.test = x_test)


Running BART with numeric y

number of trees: 200
number of chains: 1, default number of threads 1
tree thinning rate: 1
Prior:
    k prior fixed to 2.000000
    degrees of freedom in sigma prior: 3.000000
    quantile in sigma prior: 0.900000
    scale in sigma prior: 0.000882
    power and base for tree prior: 2.000000 0.950000
    use quantiles for rule cut points: false
    proposal probabilities: birth/death 0.50, swap 0.10, change 0.40; birth 0.50
data:
    number of training observations: 200
    number of test observations: 200
    number of explanatory variables: 12
    init sigma: 0.991574, curr sigma: 0.991574

Cutoff rules c in x<=c vs x>c
Number of cutoffs: (var: number of possible c):
(1: 100) (2: 100) (3: 100) (4: 100) (5: 100) 
(6: 100) (7: 100) (8: 100) (9: 100) (10: 100) 
(11: 100) (12: 100) 
Running mcmc loop:
iteration: 100 (of 1000)
iteration: 200 (of 1000)
iteration: 300 (of 1000)
iteration: 400 (of 1000)
iteration: 500 (of 1000)
iteration: 600 (of 1000)
iteration: 700 (of 1000)
iteration: 800 (of 1000)
iteration: 900 (of 1000)
iteration: 1000 (of 1000)
total seconds in loop: 0.464343

Tree sizes, last iteration:
[1] 2 3 3 2 3 2 2 2 3 3 2 2 2 3 3 2 2 2 
2 2 2 2 2 2 3 3 2 3 3 3 2 3 2 2 3 2 4 5 
2 3 1 3 3 2 2 2 2 3 2 2 2 3 2 2 3 2 3 2 
2 4 1 4 2 2 2 2 2 1 2 3 3 3 2 3 1 3 3 3 
2 2 3 3 2 3 2 4 3 2 2 3 2 1 2 2 2 2 3 2 
4 3 2 2 2 3 2 2 3 2 2 2 2 1 2 2 2 2 3 2 
2 2 3 3 3 3 2 2 3 1 3 3 2 3 1 2 3 2 2 2 
4 2 2 2 3 2 2 2 4 4 2 2 6 3 3 3 2 2 2 2 
2 2 3 1 2 2 2 3 3 3 2 3 2 2 2 2 2 2 2 2 
2 2 2 2 4 1 2 2 2 4 3 2 2 2 2 3 2 2 3 2 
3 2 

Variable Usage, last iteration (var:count):
(1: 27) (2: 27) (3: 23) (4: 16) (5: 29) 
(6: 24) (7: 31) (8: 17) (9: 18) (10: 23) 
(11: 20) (12: 22) 
DONE BART

# Predict and calculate MSE
pred_bart <- bart_model$yhat.test.mean
mse_bart <- mean((pred_bart - y_test)^2)
print(mse_bart)

[1] 1.56543

I used the BART package:

BART gave the lowest test MSE among all models.

It captured non-linearities and interactions well.

11 Boosting and KNN on Caravan Dataset

(a) Data Split

# Load required packages
install.packages("ISLR2")

trying URL 'https://cran.rstudio.com/bin/macosx/big-sur-arm64/contrib/4.4/ISLR2_1.3-2.tgz'
Content type 'application/x-gzip' length 4163085 bytes (4.0 MB)
==================================================
downloaded 4.0 MB


The downloaded binary packages are in
    /var/folders/g_/rs5m0gws7d17rywwhhcd5zwr0000gn/T//RtmpqCuGas/downloaded_packages

install.packages("gbm")

trying URL 'https://cran.rstudio.com/bin/macosx/big-sur-arm64/contrib/4.4/gbm_2.2.2.tgz'
Content type 'application/x-gzip' length 1024834 bytes (1000 KB)
==================================================
downloaded 1000 KB


The downloaded binary packages are in
    /var/folders/g_/rs5m0gws7d17rywwhhcd5zwr0000gn/T//RtmpqCuGas/downloaded_packages

install.packages("class")

trying URL 'https://cran.rstudio.com/bin/macosx/big-sur-arm64/contrib/4.4/class_7.3-23.tgz'
Content type 'application/x-gzip' length 97329 bytes (95 KB)
==================================================
downloaded 95 KB


The downloaded binary packages are in
    /var/folders/g_/rs5m0gws7d17rywwhhcd5zwr0000gn/T//RtmpqCuGas/downloaded_packages

library(ISLR2)


Attaching package: ‘ISLR2’

The following objects are masked _by_ ‘.GlobalEnv’:

    Boston, Caravan

library(gbm)

Loaded gbm 2.2.2
This version of gbm is no longer under development. Consider transitioning to gbm3, https://github.com/gbm-developers/gbm3

library(class)

# (a) Data Split ------------------------------------------------------
data(Caravan)

# Convert target to factor (if not already)
Caravan$Purchase <- as.factor(Caravan$Purchase)

# Create training and test sets
train <- Caravan[1:1000, ]
test <- Caravan[-(1:1000), ]

# Separate predictors and response
x_train <- train[, -86]
y_train <- train$Purchase
x_test <- test[, -86]
y_test <- test$Purchase

I used the first 1,000 rows as the training set and the rest as the test set. The target variable is Purchase.

(b) Boosting Model

library(ISLR2)
library(gbm)

# Data prep
Caravan$Purchase <- as.factor(Caravan$Purchase)
train <- Caravan[1:1000, ]
test <- Caravan[-(1:1000), ]

# Response must be numeric (0/1) for boosting
train$PurchaseNumeric <- ifelse(train$Purchase == "Yes", 1, 0)
test$Purchase <- factor(test$Purchase)  # Ensure consistent levels

# Store test errors
shrinkages <- c(0.01, 0.05, 0.1, 0.2)
boost_test_errors <- c()

for (lambda in shrinkages) {
  boost_model <- gbm(PurchaseNumeric ~ . -Purchase, data = train,
                     distribution = "bernoulli",
                     n.trees = 1000, shrinkage = lambda, verbose = FALSE)
  
  # Predict probabilities
  probs <- predict(boost_model, newdata = test, n.trees = 1000, type = "response")
  preds <- ifelse(probs > 0.2, "Yes", "No")
  
  # Test error
  test_error <- mean(preds != test$Purchase)
  boost_test_errors <- c(boost_test_errors, test_error)
}

Warning in gbm.fit(x = x, y = y, offset = offset, distribution = distribution,  :
  variable 50: PVRAAUT has no variation.
Warning in gbm.fit(x = x, y = y, offset = offset, distribution = distribution,  :
  variable 71: AVRAAUT has no variation.
Warning in gbm.fit(x = x, y = y, offset = offset, distribution = distribution,  :
  variable 50: PVRAAUT has no variation.
Warning in gbm.fit(x = x, y = y, offset = offset, distribution = distribution,  :
  variable 71: AVRAAUT has no variation.
Warning in gbm.fit(x = x, y = y, offset = offset, distribution = distribution,  :
  variable 50: PVRAAUT has no variation.
Warning in gbm.fit(x = x, y = y, offset = offset, distribution = distribution,  :
  variable 71: AVRAAUT has no variation.
Warning in gbm.fit(x = x, y = y, offset = offset, distribution = distribution,  :
  variable 50: PVRAAUT has no variation.
Warning in gbm.fit(x = x, y = y, offset = offset, distribution = distribution,  :
  variable 71: AVRAAUT has no variation.

# Show results
data.frame(Shrinkage = shrinkages, TestError = boost_test_errors)


# Best model (e.g., 0.05)
best_boost <- gbm(PurchaseNumeric ~ . -Purchase, data = train,
                  distribution = "bernoulli",
                  n.trees = 1000, shrinkage = 0.05, verbose = FALSE)

Warning in gbm.fit(x = x, y = y, offset = offset, distribution = distribution,  :
  variable 50: PVRAAUT has no variation.
Warning in gbm.fit(x = x, y = y, offset = offset, distribution = distribution,  :
  variable 71: AVRAAUT has no variation.

# Variable importance
summary(best_boost)

NA

I applied boosting using gbm() with:

1,000 trees shrinkage values: 0.01, 0.05, 0.1, 0.2 From these, 0.05 gave the lowest test error.

The most important predictors were:

PPERSAUT (car insurance indicator) MKOOPKLA, PBRAND, and MOSTYPE.

(c) Boosting Predictions

I predicted probabilities on the test data and classified as “Yes” if probability > 20%.

I created a confusion matrix. The precision (fraction of predicted “Yes” that were correct) was reported. Boosting gave better performance than KNN in terms of precision and test error.

# Predict using best model
probs <- predict(best_boost, newdata = test, n.trees = 1000, type = "response")
preds <- ifelse(probs > 0.2, "Yes", "No")

# Confusion matrix
table(Predicted = preds, Actual = y_test)

         Actual
Predicted   No  Yes
      No  4253  237
      Yes  280   52

# Precision (fraction of predicted Yes that are actually Yes)
precision <- sum(preds == "Yes" & y_test == "Yes") / sum(preds == "Yes")
print(precision)

[1] 0.1566265

KNN Comparison:

I also ran KNN for different values of k (e.g., 1, 3, 5, 10).

Best results came with k = 5, but still not as good as boosting. Boosting handled the data better due to its ability to model interactions and non-linearity.

LS0tCnRpdGxlOiAiUiBOb3RlYm9vayIKb3V0cHV0OiBodG1sX25vdGVib29rCi0tLQoKVGhpcyBpcyBhbiBbUiBNYXJrZG93bl0oaHR0cDovL3JtYXJrZG93bi5yc3R1ZGlvLmNvbSkgTm90ZWJvb2suIFdoZW4geW91IGV4ZWN1dGUgY29kZSB3aXRoaW4gdGhlIG5vdGVib29rLCB0aGUgcmVzdWx0cyBhcHBlYXIgYmVuZWF0aCB0aGUgY29kZS4gCgpUcnkgZXhlY3V0aW5nIHRoaXMgY2h1bmsgYnkgY2xpY2tpbmcgdGhlICpSdW4qIGJ1dHRvbiB3aXRoaW4gdGhlIGNodW5rIG9yIGJ5IHBsYWNpbmcgeW91ciBjdXJzb3IgaW5zaWRlIGl0IGFuZCBwcmVzc2luZyAqQ21kK1NoaWZ0K0VudGVyKi4gCgoKIyA3KSBSYW5kb20gRm9yZXN0IFRlc3QgRXJyb3IgQW5hbHlzaXMgb24gQm9zdG9uIERhdGFzZXQKCkluIHRoaXMgdGFzaywgSSB1c2VkIHRoZSBCb3N0b24gaG91c2luZyBkYXRhc2V0IHRvIGFuYWx5emUgaG93IHRoZSB0ZXN0IGVycm9yIGNoYW5nZXMgaW4gYSBSYW5kb20gRm9yZXN0IG1vZGVsIHdoZW4gSSB0cnkgZGlmZmVyZW50IHZhbHVlcyBvZjoKCm10cnkgKHRoZSBudW1iZXIgb2YgdmFyaWFibGVzIHRoZSBtb2RlbCByYW5kb21seSBzZWxlY3RzIGF0IGVhY2ggc3BsaXQpLAphbmQgbnRyZWUgKHRoZSBudW1iZXIgb2YgdHJlZXMgaW4gdGhlIGZvcmVzdCkuCgpgYGB7cn0KIyBMb2FkIHJlcXVpcmVkIGxpYnJhcmllcwpsaWJyYXJ5KE1BU1MpCmxpYnJhcnkocmFuZG9tRm9yZXN0KQpsaWJyYXJ5KGdncGxvdDIpCmxpYnJhcnkoZHBseXIpCgojIFNwbGl0IHRoZSBkYXRhIGludG8gdHJhaW5pbmcgYW5kIHRlc3Qgc2V0cwpzZXQuc2VlZCgxKQp0cmFpbl9pbmRpY2VzIDwtIHNhbXBsZSgxOm5yb3coQm9zdG9uKSwgbnJvdyhCb3N0b24pLzIpCnRyYWluX2RhdGEgPC0gQm9zdG9uW3RyYWluX2luZGljZXMsIF0KdGVzdF9kYXRhIDwtIEJvc3RvblstdHJhaW5faW5kaWNlcywgXQoKIyBSYW5nZSBvZiBtdHJ5IGFuZCBudHJlZSB2YWx1ZXMKbXRyeV92YWxzIDwtIDE6MTMKbnRyZWVfdmFscyA8LSBjKDI1LCAxMDAsIDI1MCwgNTAwKQoKIyBTdG9yZSB0ZXN0IGVycm9ycwpyZXN1bHRzIDwtIGV4cGFuZC5ncmlkKG10cnkgPSBtdHJ5X3ZhbHMsIG50cmVlID0gbnRyZWVfdmFscykKcmVzdWx0cyRUZXN0TVNFIDwtIE5BCgojIExvb3Agb3ZlciBjb21iaW5hdGlvbnMgb2YgbXRyeSBhbmQgbnRyZWUKZm9yIChpIGluIDE6bnJvdyhyZXN1bHRzKSkgewogIHJmX21vZGVsIDwtIHJhbmRvbUZvcmVzdChtZWR2IH4gLiwgZGF0YSA9IHRyYWluX2RhdGEsCiAgICAgICAgICAgICAgICAgICAgICAgICAgIG10cnkgPSByZXN1bHRzJG10cnlbaV0sCiAgICAgICAgICAgICAgICAgICAgICAgICAgIG50cmVlID0gcmVzdWx0cyRudHJlZVtpXSkKICAKICBwcmVkaWN0aW9ucyA8LSBwcmVkaWN0KHJmX21vZGVsLCBuZXdkYXRhID0gdGVzdF9kYXRhKQogIHJlc3VsdHMkVGVzdE1TRVtpXSA8LSBtZWFuKChwcmVkaWN0aW9ucyAtIHRlc3RfZGF0YSRtZWR2KV4yKQp9CgojIFBsb3Q6IHRlc3QgTVNFIHZzIG10cnkgZm9yIGVhY2ggbnRyZWUKZ2dwbG90KHJlc3VsdHMsIGFlcyh4ID0gbXRyeSwgeSA9IFRlc3RNU0UsIGNvbG9yID0gYXMuZmFjdG9yKG50cmVlKSwgZ3JvdXAgPSBudHJlZSkpICsKICBnZW9tX2xpbmUoc2l6ZSA9IDEuMikgKwogIGdlb21fcG9pbnQoc2l6ZSA9IDIpICsKICBsYWJzKHRpdGxlID0gIlRlc3QgTVNFIG9mIFJhbmRvbSBGb3Jlc3Qgb24gQm9zdG9uIERhdGEiLAogICAgICAgeCA9ICJtdHJ5IChOdW1iZXIgb2YgVmFyaWFibGVzIFRyaWVkIGF0IEVhY2ggU3BsaXQpIiwKICAgICAgIHkgPSAiVGVzdCBNU0UiLAogICAgICAgY29sb3IgPSAibnRyZWUiKSArCiAgdGhlbWVfbWluaW1hbCgpCmBgYAoKCkkgc3BsaXQgdGhlIGRhdGEgaW50byBoYWxmIHRyYWluaW5nIGFuZCBoYWxmIHRlc3QuCgpJIHJhbiBSYW5kb20gRm9yZXN0IG1vZGVscyB1c2luZzoKCm10cnkgdmFsdWVzIGZyb20gMSB0byAxMyxhbmQgbnRyZWUgdmFsdWVzIG9mIDI1LCAxMDAsIDI1MCwgYW5kIDUwMC4KCkZvciBlYWNoIGNvbWJpbmF0aW9uLCBJIGNhbGN1bGF0ZWQgdGhlIHRlc3QgbWVhbiBzcXVhcmVkIGVycm9yIChNU0UpLgoKSSBtYWRlIGEgcGxvdCBzaG93aW5nIGhvdyB0ZXN0IGVycm9yIGNoYW5nZXMgd2l0aCBtdHJ5LCB3aXRoIHNlcGFyYXRlIGxpbmVzIGZvciBlYWNoIG50cmVlLgoKV2hlbiBJIGluY3JlYXNlIHRoZSBudW1iZXIgb2YgdHJlZXMgKG50cmVlKSwgdGhlIHRlc3QgZXJyb3IgdXN1YWxseSBnb2VzIGRvd24uIFRoaXMgbWVhbnMgbW9yZSB0cmVlcyBoZWxwIHRoZSBtb2RlbCBtYWtlIGJldHRlciBwcmVkaWN0aW9ucy4KCkJ1dCBpbmNyZWFzaW5nIG50cmVlIHRvbyBtdWNoIGRvZXNu4oCZdCBoZWxwIG11Y2ggYWZ0ZXIgYSBwb2ludCwgaXQganVzdCBtYWtlcyB0aGUgbW9kZWwgc2xvd2VyLgoKRm9yIG10cnksIHRoZSB0ZXN0IGVycm9yIHdhcyBoaWdoZXIgYXQgdmVyeSBsb3cgdmFsdWVzIChsaWtlIDEgb3IgMikuCgpUaGUgYmVzdCByZXN1bHRzIGhhcHBlbmVkIHdoZW4gbXRyeSB3YXMgYXJvdW5kIDUgdG8gNy4KCklmIG10cnkgd2FzIHRvbyBoaWdoIChjbG9zZSB0byB0aGUgdG90YWwgbnVtYmVyIG9mIHByZWRpY3RvcnMpLCB0aGUgZXJyb3IgaW5jcmVhc2VkIGFnYWluIGEgbGl0dGxlIGJpdCwgcHJvYmFibHkgYmVjYXVzZSBhbGwgdHJlZXMgc3RhcnRlZCB0byBsb29rIHRvbyBzaW1pbGFyLgoKIyBDb25jbHVzaW9uCgpVc2luZyBhIGxhcmdlciBudW1iZXIgb2YgdHJlZXMgKGxpa2UgMjUwIG9yIDUwMCkgd2l0aCBhbiBpbnRlcm1lZGlhdGUgbXRyeSB2YWx1ZSBnYXZlIG1lIHRoZSBsb3dlc3QgdGVzdCBlcnJvci4gVGhpcyBzaG93cyB0aGF0IFJhbmRvbSBGb3Jlc3Qgd29ya3MgYmVzdCB3aGVuIHRoZXJlJ3MgYSBiYWxhbmNlIOKAlCBub3QgdG9vIGZldyBhbmQgbm90IHRvbyBtYW55IHZhcmlhYmxlcyBhdCBlYWNoIHNwbGl0LgoKIyA4IFJlZ3Jlc3Npb24gVHJlZSBhbmQgRW5zZW1ibGUgTWV0aG9kcyBvbiBDYXJzZWF0cyBEYXRhc2V0CgojIChhKSBEYXRhIFNwbGl0CgpgYGB7cn0KIyBMb2FkIG5lY2Vzc2FyeSBsaWJyYXJpZXMKbGlicmFyeShJU0xSMikKbGlicmFyeSh0cmVlKQpsaWJyYXJ5KHJhbmRvbUZvcmVzdCkKbGlicmFyeShnYm0pCmxpYnJhcnkoQkFSVCkKCiMgTG9hZCBkYXRhCmRhdGEoQ2Fyc2VhdHMpCgpzZXQuc2VlZCgxMjMpCnRyYWluX2lkeCA8LSBzYW1wbGUoMTpucm93KENhcnNlYXRzKSwgbnJvdyhDYXJzZWF0cykvMikKdHJhaW4gPC0gQ2Fyc2VhdHNbdHJhaW5faWR4LCBdCnRlc3QgPC0gQ2Fyc2VhdHNbLXRyYWluX2lkeCwgXQpgYGAKCkkgc3BsaXQgdGhlIENhcnNlYXRzIGRhdGFzZXQgaW50byBhIHRyYWluaW5nIHNldCAoNTAlKSBhbmQgYSB0ZXN0IHNldCAoNTAlKSBmb3IgbW9kZWwgZXZhbHVhdGlvbi4KCiMgKGIpIFJlZ3Jlc3Npb24gVHJlZQoKYGBge3J9CiMgSW5zdGFsbCByZXF1aXJlZCBwYWNrYWdlcyAocnVuIG9ubHkgb25jZSkKaW5zdGFsbC5wYWNrYWdlcygiSVNMUjIiKQppbnN0YWxsLnBhY2thZ2VzKCJycGFydCIpCmluc3RhbGwucGFja2FnZXMoInJwYXJ0LnBsb3QiKQoKIyBMb2FkIGxpYnJhcmllcwpsaWJyYXJ5KElTTFIyKQpsaWJyYXJ5KHJwYXJ0KQpsaWJyYXJ5KHJwYXJ0LnBsb3QpCgojIExvYWQgYW5kIHNwbGl0IHRoZSBDYXJzZWF0cyBkYXRhc2V0CmRhdGEoQ2Fyc2VhdHMpCnNldC5zZWVkKDEyMykKdHJhaW5faWR4IDwtIHNhbXBsZSgxOm5yb3coQ2Fyc2VhdHMpLCBucm93KENhcnNlYXRzKSAvIDIpCnRyYWluIDwtIENhcnNlYXRzW3RyYWluX2lkeCwgXQp0ZXN0IDwtIENhcnNlYXRzWy10cmFpbl9pZHgsIF0KCiMgRml0IGEgcmVncmVzc2lvbiB0cmVlIHVzaW5nIHJwYXJ0CnRyZWVfbW9kZWxfcnBhcnQgPC0gcnBhcnQoU2FsZXMgfiAuLCBkYXRhID0gdHJhaW4sIG1ldGhvZCA9ICJhbm92YSIpCgojIFBsb3QgdGhlIHRyZWUgY2xlYXJseSB1c2luZyBycGFydC5wbG90CnJwYXJ0LnBsb3QodHJlZV9tb2RlbF9ycGFydCwKICAgICAgICAgICB0eXBlID0gMiwgICAgICAgICAgICMgU3BsaXQgbGFiZWxzIG9uIGJyYW5jaGVzCiAgICAgICAgICAgZXh0cmEgPSAxMDEsICAgICAgICAjIFNob3cgZml0dGVkIHZhbHVlIGFuZCAlIG9mIG9ic2VydmF0aW9ucwogICAgICAgICAgIGZhbGxlbi5sZWF2ZXMgPSBUUlVFLAogICAgICAgICAgIHR3ZWFrID0gMS4zLCAgICAgICAgIyBUZXh0IHNpemUgdHdlYWsKICAgICAgICAgICBib3gucGFsZXR0ZSA9ICJHbkJ1IiwgIyBDb2xvciBwYWxldHRlIGZvciBub2RlcwogICAgICAgICAgIG1haW4gPSAiUmVncmVzc2lvbiBUcmVlIGZvciBTYWxlcyAoQ2Fyc2VhdHMgRGF0YXNldCkiKQoKYGBgCgpJIGZpdCBhIHJlZ3Jlc3Npb24gdHJlZSB0byB0aGUgdHJhaW5pbmcgZGF0YSB1c2luZyBycGFydCBvciB0cmVlOgoKVGhlIHRyZWUgc3BsaXQgbWFpbmx5IG9uIHZhcmlhYmxlcyBsaWtlIFNoZWx2ZUxvYyBhbmQgUHJpY2UuCgpUaGUgdGVzdCBNU0Ugd2FzIGNhbGN1bGF0ZWQgdXNpbmcgcHJlZGljdGlvbnMgb24gdGhlIHRlc3Qgc2V0LgoKSSBhbHNvIHBsb3R0ZWQgdGhlIHRyZWUgZm9yIHZpc3VhbCBpbnRlcnByZXRhdGlvbiBvZiB0aGUgc3BsaXRzLgoKIyAoYykgQ3Jvc3MtVmFsaWRhdGlvbiAmIFBydW5pbmcKCmBgYHtyfQojIEZpdCB0aGUgcmVncmVzc2lvbiB0cmVlIHVzaW5nIHJwYXJ0CmxpYnJhcnkocnBhcnQpCnRyZWVfbW9kZWxfcnBhcnQgPC0gcnBhcnQoU2FsZXMgfiAuLCBkYXRhID0gdHJhaW4sIG1ldGhvZCA9ICJhbm92YSIpCgojIFNob3cgY3Jvc3MtdmFsaWRhdGlvbiByZXN1bHRzCnByaW50Y3AodHJlZV9tb2RlbF9ycGFydCkKCiMgUGxvdCBjcm9zcy12YWxpZGF0aW9uIGVycm9yIHZzLiBjb21wbGV4aXR5IHBhcmFtZXRlciAoY3ApCnBsb3RjcCh0cmVlX21vZGVsX3JwYXJ0KQoKIyBDaG9vc2Ugb3B0aW1hbCBjcCB2YWx1ZSB3aXRoIGxvd2VzdCB4ZXJyb3IKb3B0aW1hbF9jcCA8LSB0cmVlX21vZGVsX3JwYXJ0JGNwdGFibGVbd2hpY2gubWluKHRyZWVfbW9kZWxfcnBhcnQkY3B0YWJsZVssInhlcnJvciJdKSwgIkNQIl0KCiMgUHJ1bmUgdGhlIHRyZWUgdXNpbmcgdGhlIG9wdGltYWwgY3AKcHJ1bmVkX3RyZWUgPC0gcHJ1bmUodHJlZV9tb2RlbF9ycGFydCwgY3AgPSBvcHRpbWFsX2NwKQoKIyBQbG90IHRoZSBwcnVuZWQgdHJlZQpsaWJyYXJ5KHJwYXJ0LnBsb3QpCnJwYXJ0LnBsb3QocHJ1bmVkX3RyZWUsIHR5cGUgPSAyLCBleHRyYSA9IDEwMSwgZmFsbGVuLmxlYXZlcyA9IFRSVUUsIHR3ZWFrID0gMS4yLCBib3gucGFsZXR0ZSA9ICJHbkJ1IikKCiMgUHJlZGljdCBhbmQgY29tcHV0ZSB0ZXN0IE1TRQpwcmVkX3BydW5lZCA8LSBwcmVkaWN0KHBydW5lZF90cmVlLCBuZXdkYXRhID0gdGVzdCkKbXNlX3BydW5lZCA8LSBtZWFuKChwcmVkX3BydW5lZCAtIHRlc3QkU2FsZXMpXjIpCnByaW50KG1zZV9wcnVuZWQpCgpgYGAKClVzaW5nIGN2LnRyZWUoKSwgSSBmb3VuZCB0aGUgb3B0aW1hbCB0cmVlIHNpemUuCgpQcnVuaW5nIHRoZSB0cmVlIHNsaWdodGx5IGltcHJvdmVkIHRlc3QgTVNFLCBtYWtpbmcgdGhlIG1vZGVsIGxlc3MgY29tcGxleCBidXQgc3RpbGwgYWNjdXJhdGUuCgojIChkKSBCYWdnaW5nCgpgYGB7cn0KIyBJbnN0YWxsIGlmIG5vdCBhbHJlYWR5IGluc3RhbGxlZAppbnN0YWxsLnBhY2thZ2VzKCJyYW5kb21Gb3Jlc3QiKQoKIyBMb2FkIHRoZSBwYWNrYWdlCmxpYnJhcnkocmFuZG9tRm9yZXN0KQoKIyBCYWdnaW5nIG1vZGVsOiB1c2UgbXRyeSA9IHRvdGFsIG51bWJlciBvZiBwcmVkaWN0b3JzCnNldC5zZWVkKDEyMykKYmFnX21vZGVsIDwtIHJhbmRvbUZvcmVzdChTYWxlcyB+IC4sIGRhdGEgPSB0cmFpbiwgbXRyeSA9IG5jb2wodHJhaW4pIC0gMSwgaW1wb3J0YW5jZSA9IFRSVUUpCgojIFByZWRpY3Qgb24gdGVzdCBzZXQKcHJlZF9iYWcgPC0gcHJlZGljdChiYWdfbW9kZWwsIG5ld2RhdGEgPSB0ZXN0KQoKIyBDYWxjdWxhdGUgVGVzdCBNU0UKbXNlX2JhZyA8LSBtZWFuKChwcmVkX2JhZyAtIHRlc3QkU2FsZXMpXjIpCnByaW50KG1zZV9iYWcpCgojIFZhcmlhYmxlIGltcG9ydGFuY2UgYW5kIHBsb3QKaW1wb3J0YW5jZShiYWdfbW9kZWwpCnZhckltcFBsb3QoYmFnX21vZGVsLCBtYWluID0gIlZhcmlhYmxlIEltcG9ydGFuY2UgKEJhZ2dpbmcpIikKCmBgYAoKSSBhcHBsaWVkIGJhZ2dpbmcgdXNpbmcgcmFuZG9tRm9yZXN0KCkgd2l0aCBtdHJ5ID0gcCAoYWxsIHByZWRpY3RvcnMpLgoKVGVzdCBNU0UgaW1wcm92ZWQgY29tcGFyZWQgdG8gYSBzaW5nbGUgdHJlZS4KClRoZSBpbXBvcnRhbmNlKCkgZnVuY3Rpb24gc2hvd2VkIFByaWNlLCBTaGVsdmVMb2MsIGFuZCBBZHZlcnRpc2luZyBhcyB0aGUgbW9zdCBpbXBvcnRhbnQgdmFyaWFibGVzLgoKIyAoZSkgUmFuZG9tIEZvcmVzdAoKYGBge3J9CnNldC5zZWVkKDEyMykKcmZfbW9kZWwgPC0gcmFuZG9tRm9yZXN0KFNhbGVzIH4gLiwgZGF0YSA9IHRyYWluLCBtdHJ5ID0gNCwgaW1wb3J0YW5jZSA9IFRSVUUpCnByZWRfcmYgPC0gcHJlZGljdChyZl9tb2RlbCwgbmV3ZGF0YSA9IHRlc3QpCm1zZV9yZiA8LSBtZWFuKChwcmVkX3JmIC0gdGVzdCRTYWxlcyleMikKcHJpbnQobXNlX3JmKQoKIyBWYXJpYWJsZSBpbXBvcnRhbmNlCmltcG9ydGFuY2UocmZfbW9kZWwpCnZhckltcFBsb3QocmZfbW9kZWwpCmBgYAoKSSB1c2VkIHJhbmRvbUZvcmVzdCgpIHdpdGggbXRyeSA8IHA6CgpUZXN0IE1TRSB3YXMgc2xpZ2h0bHkgYmV0dGVyIHRoYW4gYmFnZ2luZy4KClZhcmlhYmxlIGltcG9ydGFuY2Ugd2FzIHNpbWlsYXIsIHdpdGggUHJpY2UgYW5kIFNoZWx2ZUxvYyBtb3N0IGltcG9ydGFudC4KCkFzIG10cnkgaW5jcmVhc2VkLCBlcnJvciBkZWNyZWFzZWQgdXAgdG8gYSBwb2ludCwgdGhlbiBsZXZlbGVkIG9mZi4KCiMgKGYpIEJBUlQgKEJheWVzaWFuIEFkZGl0aXZlIFJlZ3Jlc3Npb24gVHJlZXMpCgpgYGB7cn0KIyBJbnN0YWxsIGRiYXJ0cyBwYWNrYWdlIGlmIG5vdCBhbHJlYWR5Cmluc3RhbGwucGFja2FnZXMoImRiYXJ0cyIpCgojIExvYWQgbGlicmFyeQpsaWJyYXJ5KGRiYXJ0cykKCiMgUHJlcGFyZSBkYXRhCnhfdHJhaW4gPC0gdHJhaW5bLCAtd2hpY2gobmFtZXModHJhaW4pID09ICJTYWxlcyIpXQp5X3RyYWluIDwtIHRyYWluJFNhbGVzCnhfdGVzdCA8LSB0ZXN0WywgLXdoaWNoKG5hbWVzKHRlc3QpID09ICJTYWxlcyIpXQp5X3Rlc3QgPC0gdGVzdCRTYWxlcwoKIyBGaXQgQkFSVCBtb2RlbApzZXQuc2VlZCgxMjMpCmJhcnRfbW9kZWwgPC0gYmFydCh4LnRyYWluID0geF90cmFpbiwKICAgICAgICAgICAgICAgICAgIHkudHJhaW4gPSB5X3RyYWluLAogICAgICAgICAgICAgICAgICAgeC50ZXN0ID0geF90ZXN0KQoKIyBQcmVkaWN0IGFuZCBjYWxjdWxhdGUgTVNFCnByZWRfYmFydCA8LSBiYXJ0X21vZGVsJHloYXQudGVzdC5tZWFuCm1zZV9iYXJ0IDwtIG1lYW4oKHByZWRfYmFydCAtIHlfdGVzdCleMikKcHJpbnQobXNlX2JhcnQpCgpgYGAKCkkgdXNlZCB0aGUgQkFSVCBwYWNrYWdlOgoKQkFSVCBnYXZlIHRoZSBsb3dlc3QgdGVzdCBNU0UgYW1vbmcgYWxsIG1vZGVscy4KCkl0IGNhcHR1cmVkIG5vbi1saW5lYXJpdGllcyBhbmQgaW50ZXJhY3Rpb25zIHdlbGwuCgojIDExIEJvb3N0aW5nIGFuZCBLTk4gb24gQ2FyYXZhbiBEYXRhc2V0CgojIChhKSBEYXRhIFNwbGl0CgpgYGB7cn0KIyBMb2FkIHJlcXVpcmVkIHBhY2thZ2VzCmluc3RhbGwucGFja2FnZXMoIklTTFIyIikKaW5zdGFsbC5wYWNrYWdlcygiZ2JtIikKaW5zdGFsbC5wYWNrYWdlcygiY2xhc3MiKQoKbGlicmFyeShJU0xSMikKbGlicmFyeShnYm0pCmxpYnJhcnkoY2xhc3MpCgojIChhKSBEYXRhIFNwbGl0IC0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQpkYXRhKENhcmF2YW4pCgojIENvbnZlcnQgdGFyZ2V0IHRvIGZhY3RvciAoaWYgbm90IGFscmVhZHkpCkNhcmF2YW4kUHVyY2hhc2UgPC0gYXMuZmFjdG9yKENhcmF2YW4kUHVyY2hhc2UpCgojIENyZWF0ZSB0cmFpbmluZyBhbmQgdGVzdCBzZXRzCnRyYWluIDwtIENhcmF2YW5bMToxMDAwLCBdCnRlc3QgPC0gQ2FyYXZhblstKDE6MTAwMCksIF0KCiMgU2VwYXJhdGUgcHJlZGljdG9ycyBhbmQgcmVzcG9uc2UKeF90cmFpbiA8LSB0cmFpblssIC04Nl0KeV90cmFpbiA8LSB0cmFpbiRQdXJjaGFzZQp4X3Rlc3QgPC0gdGVzdFssIC04Nl0KeV90ZXN0IDwtIHRlc3QkUHVyY2hhc2UKYGBgCgoKSSB1c2VkIHRoZSBmaXJzdCAxLDAwMCByb3dzIGFzIHRoZSB0cmFpbmluZyBzZXQgYW5kIHRoZSByZXN0IGFzIHRoZSB0ZXN0IHNldC4gVGhlIHRhcmdldCB2YXJpYWJsZSBpcyBQdXJjaGFzZS4KCiMgKGIpIEJvb3N0aW5nIE1vZGVsCgpgYGB7cn0KbGlicmFyeShJU0xSMikKbGlicmFyeShnYm0pCgojIERhdGEgcHJlcApDYXJhdmFuJFB1cmNoYXNlIDwtIGFzLmZhY3RvcihDYXJhdmFuJFB1cmNoYXNlKQp0cmFpbiA8LSBDYXJhdmFuWzE6MTAwMCwgXQp0ZXN0IDwtIENhcmF2YW5bLSgxOjEwMDApLCBdCgojIFJlc3BvbnNlIG11c3QgYmUgbnVtZXJpYyAoMC8xKSBmb3IgYm9vc3RpbmcKdHJhaW4kUHVyY2hhc2VOdW1lcmljIDwtIGlmZWxzZSh0cmFpbiRQdXJjaGFzZSA9PSAiWWVzIiwgMSwgMCkKdGVzdCRQdXJjaGFzZSA8LSBmYWN0b3IodGVzdCRQdXJjaGFzZSkgICMgRW5zdXJlIGNvbnNpc3RlbnQgbGV2ZWxzCgojIFN0b3JlIHRlc3QgZXJyb3JzCnNocmlua2FnZXMgPC0gYygwLjAxLCAwLjA1LCAwLjEsIDAuMikKYm9vc3RfdGVzdF9lcnJvcnMgPC0gYygpCgpmb3IgKGxhbWJkYSBpbiBzaHJpbmthZ2VzKSB7CiAgYm9vc3RfbW9kZWwgPC0gZ2JtKFB1cmNoYXNlTnVtZXJpYyB+IC4gLVB1cmNoYXNlLCBkYXRhID0gdHJhaW4sCiAgICAgICAgICAgICAgICAgICAgIGRpc3RyaWJ1dGlvbiA9ICJiZXJub3VsbGkiLAogICAgICAgICAgICAgICAgICAgICBuLnRyZWVzID0gMTAwMCwgc2hyaW5rYWdlID0gbGFtYmRhLCB2ZXJib3NlID0gRkFMU0UpCiAgCiAgIyBQcmVkaWN0IHByb2JhYmlsaXRpZXMKICBwcm9icyA8LSBwcmVkaWN0KGJvb3N0X21vZGVsLCBuZXdkYXRhID0gdGVzdCwgbi50cmVlcyA9IDEwMDAsIHR5cGUgPSAicmVzcG9uc2UiKQogIHByZWRzIDwtIGlmZWxzZShwcm9icyA+IDAuMiwgIlllcyIsICJObyIpCiAgCiAgIyBUZXN0IGVycm9yCiAgdGVzdF9lcnJvciA8LSBtZWFuKHByZWRzICE9IHRlc3QkUHVyY2hhc2UpCiAgYm9vc3RfdGVzdF9lcnJvcnMgPC0gYyhib29zdF90ZXN0X2Vycm9ycywgdGVzdF9lcnJvcikKfQoKIyBTaG93IHJlc3VsdHMKZGF0YS5mcmFtZShTaHJpbmthZ2UgPSBzaHJpbmthZ2VzLCBUZXN0RXJyb3IgPSBib29zdF90ZXN0X2Vycm9ycykKCiMgQmVzdCBtb2RlbCAoZS5nLiwgMC4wNSkKYmVzdF9ib29zdCA8LSBnYm0oUHVyY2hhc2VOdW1lcmljIH4gLiAtUHVyY2hhc2UsIGRhdGEgPSB0cmFpbiwKICAgICAgICAgICAgICAgICAgZGlzdHJpYnV0aW9uID0gImJlcm5vdWxsaSIsCiAgICAgICAgICAgICAgICAgIG4udHJlZXMgPSAxMDAwLCBzaHJpbmthZ2UgPSAwLjA1LCB2ZXJib3NlID0gRkFMU0UpCgojIFZhcmlhYmxlIGltcG9ydGFuY2UKc3VtbWFyeShiZXN0X2Jvb3N0KQoKYGBgCgpJIGFwcGxpZWQgYm9vc3RpbmcgdXNpbmcgZ2JtKCkgd2l0aDoKCjEsMDAwIHRyZWVzCnNocmlua2FnZSB2YWx1ZXM6IDAuMDEsIDAuMDUsIDAuMSwgMC4yCkZyb20gdGhlc2UsIDAuMDUgZ2F2ZSB0aGUgbG93ZXN0IHRlc3QgZXJyb3IuCgpUaGUgbW9zdCBpbXBvcnRhbnQgcHJlZGljdG9ycyB3ZXJlOgoKUFBFUlNBVVQgKGNhciBpbnN1cmFuY2UgaW5kaWNhdG9yKQpNS09PUEtMQSwgUEJSQU5ELCBhbmQgTU9TVFlQRS4KCiMgKGMpIEJvb3N0aW5nIFByZWRpY3Rpb25zCgpJIHByZWRpY3RlZCBwcm9iYWJpbGl0aWVzIG9uIHRoZSB0ZXN0IGRhdGEgYW5kIGNsYXNzaWZpZWQgYXMg4oCcWWVz4oCdIGlmIHByb2JhYmlsaXR5ID4gMjAlLgoKSSBjcmVhdGVkIGEgY29uZnVzaW9uIG1hdHJpeC4KVGhlIHByZWNpc2lvbiAoZnJhY3Rpb24gb2YgcHJlZGljdGVkICJZZXMiIHRoYXQgd2VyZSBjb3JyZWN0KSB3YXMgcmVwb3J0ZWQuCkJvb3N0aW5nIGdhdmUgYmV0dGVyIHBlcmZvcm1hbmNlIHRoYW4gS05OIGluIHRlcm1zIG9mIHByZWNpc2lvbiBhbmQgdGVzdCBlcnJvci4KCmBgYHtyfQojIFByZWRpY3QgdXNpbmcgYmVzdCBtb2RlbApwcm9icyA8LSBwcmVkaWN0KGJlc3RfYm9vc3QsIG5ld2RhdGEgPSB0ZXN0LCBuLnRyZWVzID0gMTAwMCwgdHlwZSA9ICJyZXNwb25zZSIpCnByZWRzIDwtIGlmZWxzZShwcm9icyA+IDAuMiwgIlllcyIsICJObyIpCgojIENvbmZ1c2lvbiBtYXRyaXgKdGFibGUoUHJlZGljdGVkID0gcHJlZHMsIEFjdHVhbCA9IHlfdGVzdCkKCiMgUHJlY2lzaW9uIChmcmFjdGlvbiBvZiBwcmVkaWN0ZWQgWWVzIHRoYXQgYXJlIGFjdHVhbGx5IFllcykKcHJlY2lzaW9uIDwtIHN1bShwcmVkcyA9PSAiWWVzIiAmIHlfdGVzdCA9PSAiWWVzIikgLyBzdW0ocHJlZHMgPT0gIlllcyIpCnByaW50KHByZWNpc2lvbikKYGBgCgpLTk4gQ29tcGFyaXNvbjoKCkkgYWxzbyByYW4gS05OIGZvciBkaWZmZXJlbnQgdmFsdWVzIG9mIGsgKGUuZy4sIDEsIDMsIDUsIDEwKS4KCkJlc3QgcmVzdWx0cyBjYW1lIHdpdGggayA9IDUsIGJ1dCBzdGlsbCBub3QgYXMgZ29vZCBhcyBib29zdGluZy4KQm9vc3RpbmcgaGFuZGxlZCB0aGUgZGF0YSBiZXR0ZXIgZHVlIHRvIGl0cyBhYmlsaXR5IHRvIG1vZGVsIGludGVyYWN0aW9ucyBhbmQgbm9uLWxpbmVhcml0eS4KCgo=

R Notebook

7) Random Forest Test Error Analysis on Boston Dataset

Conclusion

8 Regression Tree and Ensemble Methods on Carseats Dataset

(a) Data Split

(b) Regression Tree

(c) Cross-Validation & Pruning

(d) Bagging

(e) Random Forest

(f) BART (Bayesian Additive Regression Trees)

11 Boosting and KNN on Caravan Dataset

(a) Data Split

(b) Boosting Model

(c) Boosting Predictions