PRELIMINARIES

Cleaning the RStudio environment

rm(list = ls()) # clean global environment
cat("\014")  # clean the console

Default directory

# CHANGE TO THE CORRESPONDING WORKING DIRECTORY
knitr::opts_knit$set(root.dir = '/home/harpo/Dropbox/ongoing-work/git-repos/inta-vine-quality/')
#knitr::opts_knit$set(root.dir = '/home/rodralez/hostdir/jobs/demand-planning/')

EXPLORATION

Loading Dataset

#vines_dataset<-readr::read_csv("datasets/vine_train_newnames.csv", col_types =cols())
#vines_dataset
vines_dataset<-readr::read_csv("rawdata/2022/vine_raw.csv",col_types = cols(
  Temporada = col_character(),
  ID = col_double(),
  ubi_Finca = col_character(),
  ubi_x = col_double(),
  ubi_y = col_double(),
  `ubi_Altura s.n.m.` = col_double(),
  ubi_Zona = col_character(),
  ubi_Distrito = col_character(),
  `uva_L hollejo` = col_double(),
  uva_a_hollejo = col_double(),
  uva_b_hollejo = col_double(),
  uva_h_hollejo = col_double(),
  uva_C_hollejo = col_double(),
  `uva_FT(mg/ghollejo)` = col_double(),
  `uva_FT(mg/gbaya)` = col_double(),
  `uva_FT(mg/baya)` = col_double(),
  `uva_TAN(mg/ghollejo)` = col_double(),
  `uva_TAN(mg/gbaya)` = col_double(),
  `uva_TAN(mg/baya)` = col_double(),
  `uva_ANT(mg/ghollejo)` = col_double(),
  `uva_ANT(mg/gbaya)` = col_double(),
  `uva_ANT(mg/baya)` = col_double(),
  uva_Acti_antirr_hollejo = col_double(),
  `Uva_Semillas/baya` = col_double(),
  `uva_Peso semillas/baya` = col_double(),
  uva_Brix = col_double(),
  uva_pH_mosto = col_double(),
  `uva_Acidez Mosto` = col_double(),
  `uva_ NPA_Enz(mg/L)` = col_double(),
  `uva_ Potasio_Enz(mg/L)` = col_double(),
  `uva_ NPA_Foss(mg/L)` = col_double(),
  `uva_ Potasio_Foss(mg/L)` = col_double(),
  planta_Peso_racimo = col_double(),
  planta_Peso_de_baya = col_double(),
  `planta_Bayas/racimo` = col_double(),
  planta_Ravaz = col_double(),
  `planta_Long Cordon` = col_double(),
  `planta_Nro de Racimos/m` = col_double(),
  `planta_ Peso de poda/m` = col_double(),
  `planta_Dist. hileras` = col_double(),
  `planta_Dist. plantas` = col_double(),
  `planta_Plantas/ha` = col_double(),
  `planta_Rnto/ha` = col_double(),
  planta_ndvi = col_double(),
  suelo_Aspecto = col_double(),
  `suelo_Vol. Sedimentacion (%)` = col_double(),
  suelo_Textura = col_character(),
  `suelo_Indice fondo Valle` = col_double(),
  suelo_Pendiente = col_double(),
  `eco_Estacion datos clima` = col_character(),
  `eco_GDA historico` = col_double(),
  `eco_Temp. Mínima °C` = col_double(),
  `eco_Temp. Media °C` = col_double(),
  `eco_Temp. Máxima °C` = col_double(),
  `eco_Amplitud Térmica °C` = col_double(),
  `eco_Precipitaciones (mm) Temp 2020` = col_double(),
  `eco_Grados Días Acum. Temp` = col_double(),
  `eco_Evapotranspiración mm Temp` = col_double(),
  `eco_Días con Temp.>35°C Temp` = col_double(),
  `eco_Radiacíon W/m2 Temp` = col_double(),
  `eco_Velocidad Media Viento km/h Temp` = col_double(),
  `eco_I. de Fresco Nocturno Temp` = col_double(),
  `eco_Temp. Media Marzo °C Temp` = col_double(),
  `eco_Ampl. Térmica Marzo °C Temp` = col_double(),
  `eco_Horas de Frío Temp` = col_double(),
  Calidad = col_character()
)
)
#spec(vines_dataset)
#vines_dataset <- vines_dataset %>% filter(Temporada == 2020)
vines_dataset %>% group_by(Temporada) %>% count()

Training dataset dimension 56 x 211

Removing unnecesary data

#removed_numeric_var<-c("ubi_x","ubi_y","ID")
removed_numeric_var<-c("ID","ubi_x","ubi_y")




vines_dataset <- vines_dataset %>% select(-all_of(removed_numeric_var))

Removing columns with too many missing values

missing_vals<-vines_dataset  %>% group_by(Temporada) %>% select_if(function(x) any(is.na(x)))  %>%
  summarise_each(funs(sum(is.na(.)))) %>% reshape2::melt() %>% filter(Temporada == "2020" & value == 87) %>% select(variable)

Using Temporada as id variables

missing_vals<-rbind(missing_vals, "eco_Horas de Frío Temp") %>% unlist() %>% unname

vines_dataset<-vines_dataset %>% select(-all_of(missing_vals))

Train and Test split:

set.seed(7)
test_dataset  <- vines_dataset %>% sample_frac(0.2)
train_dataset <-dplyr::setdiff(vines_dataset, test_dataset)
vines_dataset<-train_dataset
vines_dataset %>% group_by(Temporada) %>% count()

Basic Distribution Information

Categorical Variables

vines_dataset_factors<-vines_dataset %>% select_if(~class(.) == 'character')
names(vines_dataset_factors) %>% as.data.frame()

 skimr::skim(vines_dataset_factors %>% select(-Calidad))# %>% knitr::kable() %>% kable_styling(font_size = 9)

── Data Summary ────────────────────────
                           Values                      
Name                       vines_dataset_factors %>%...
Number of rows             211                         
Number of columns          6                           
_______________________                                
Column type frequency:                                 
  character                6                           
________________________                               
Group variables            None

Numerical Variables

vines_dataset_numeric<-vines_dataset %>% select_if(~class(.) == 'numeric')
names(vines_dataset_numeric) %>% as.data.frame()

skimr::skim(vines_dataset_numeric) %>% arrange(desc(n_missing)) #%>% knitr::kable() %>% kable_styling(font_size = 9)

── Data Summary ────────────────────────
                           Values               
Name                       vines_dataset_numeric
Number of rows             211                  
Number of columns          49                   
_______________________                         
Column type frequency:                          
  numeric                  49                   
________________________                        
Group variables            None

Class Distribution

vines_dataset %>% group_by(Calidad) %>% summarise(total=n()) %>%
  ggplot()+
  geom_col(aes(x=Calidad,y=total,fill=Calidad))+
  ggdark::dark_theme_bw()

ANALISYS NUMERICAL VARIABLES

Dealing Missing Data

res<-VIM::aggr(vines_dataset_numeric, 
          combined = FALSE , 
          numbers = TRUE, 
          sortCombs = TRUE, 
          sortVars = TRUE, 
          labels=names(vines_dataset_numeric),
          cex.axis=.4, 
          varheight = FALSE,
          cex.numbers=0.8,
          cex.lab=0.8,
          prop = TRUE)


 Variables sorted by number of missings:

Missing values imputation

vines_dataset_numeric_imputed <- kNN(vines_dataset_numeric)
vines_dataset_numeric<-vines_dataset_numeric_imputed %>% select(-ends_with("_imp"))
#vines_dataset_numeric %>% select(-NAME)

Correlation Matrix

Checking Correlation with Class

vines_dataset_numeric_wcalnum <- vines_dataset_numeric %>% 
  tibble::add_column(Calidad = as.factor(vines_dataset$Calidad)) %>% 
   tibble::add_column(ubi_Zona = as.factor(vines_dataset$ubi_Zona)) %>% 
  mutate(Calidad = as.numeric(Calidad),
         ubi_Zona = as.numeric(ubi_Zona))

library(d3heatmap)
vines_dataset_numeric_cor_matrix<-cor(vines_dataset_numeric_wcalnum ,method="spearman")

vines_dataset_numeric_cor_matrix %>% as.data.frame() %>% tibble::rownames_to_column("class") %>% 
  filter(class=="Calidad") %>% 
  reshape2::melt() %>% select(variable, value) %>%
  arrange(desc(abs(value))) %>%
  ggplot()+
  geom_col(aes(x=variable,y=value,fill=variable))+
  ggdark::dark_theme_bw()

Using class as id variables

  
#heatmap(postop_data_cor_matrix)
d3heatmap(vines_dataset_numeric_cor_matrix ,colors = "Blues",cexRow = 0.8, cexCol = 0.8)

NA

Matrix considering all variables


library(d3heatmap)
vines_dataset_numeric_cor_matrix<-cor(vines_dataset_numeric ,method="spearman")
#heatmap(postop_data_cor_matrix)
d3heatmap(vines_dataset_numeric_cor_matrix ,colors = "Blues",cexRow = 0.8, cexCol = 0.8)

PCA Elipses for clases

library(FactoMineR)
#vines_dataset_numeric %>% select(-highlyCorrelated_var) %>% tibble::add_column(Calidad=vines_dataset$Calidad)
res_pca = PCA(vines_dataset_numeric  %>% 
                tibble::add_column(Calidad=vines_dataset$Calidad)
              , scale.unit=TRUE, 
              ncp=6, 
              graph=F,
              quali.sup=50, #colid for Calidad
              )

plot(res_pca,choix="ind",habillage=50)
par(mfcol=c(1,2))

plot(res_pca,choix="var",habillage="none",invisible = "ind") # para las variables

plotellipses(res_pca, invisible="ind",xlim=c(-10,10),ylim=c(-6,6))

List of highly correlated variables

highlyCorrelated <- caret::findCorrelation(vines_dataset_numeric_cor_matrix, cutoff=0.9, verbose = F)
highlyCorrelated_var<-vines_dataset_numeric_cor_matrix[,highlyCorrelated] %>% as.data.frame() %>% names()
highlyCorrelated_var

[1] "uva_C_hollejo"              "uva_FT(mg/ghollejo)"        "eco_Grados Días Acum. Temp" "uva_ANT(mg/baya)"           "uva_ANT(mg/ghollejo)"      
[6] "uva_TAN(mg/gbaya)"          "uva_TAN(mg/ghollejo)"

Correlation Matrix with highly correlated removed

#highlyCorrelated_var %>% length()
#vines_dataset_numeric_cor_matrix[-highlyCorrelated,-highlyCorrelated]  %>% nrow()
d3heatmap(vines_dataset_numeric_cor_matrix[-highlyCorrelated,-highlyCorrelated] ,colors = "Blues",cexRow = 0.8, cexCol = 0.8)

NA

Convert class to numeric

#vines_dataset %>% mutate()
#vines_dataset$Calidad %>% as.numeric(as.factor(vines_dataset$Calidad))

FEATURE SELECTION

Bootstrap resampling

100 new datasets used for evaluating feature selection algorithms

vines_dataset_numeric_reduced<-vines_dataset_numeric  %>% 
  select(-all_of(highlyCorrelated_var))  %>% 
  #select(names(var_importance[1:11])) %>%
  tibble::add_column(Calidad=as.factor(vines_dataset$Calidad))

resamples<-rsample::bootstraps(vines_dataset_numeric_reduced,strata= Calidad,times = 100  )
num_of_feat<-5

BORUTA for feature selection

vines_dataset_bootstrap<-rsample::analysis(resamples$splits[[sample(1:100,1)]])
val_dataset  <- vines_dataset_bootstrap   %>% group_by(Calidad) %>% sample_n(2) %>% ungroup()
train_dataset <-dplyr::setdiff(vines_dataset_numeric_reduced,val_dataset)

var_importance_boruta<-Boruta(Calidad ~ . ,data=train_dataset)

var_importance_boruta<-attStats(var_importance_boruta) %>% filter(decision=='Confirmed') %>% select(meanImp) %>% arrange(desc(meanImp)) %>% top_n(num_of_feat)

Selecting by meanImp

var_importance_boruta<-var_importance_boruta %>% add_rownames('variable')
var_importance_boruta_final<-apply(var_importance_boruta$variable %>% t() ,2, function(x) stringr::str_replace_all(x, pattern="`",replacement = "")) %>% as.data.frame()
names(var_importance_boruta_final)<-"variable"
var_importance_boruta_final

CART Features selection ad-hoc using importance metric

var_importance<-c()
for (i in  1:100){
vines_dataset_bootstrap<-rsample::analysis(resamples$splits[[i]])
val_dataset  <- vines_dataset_bootstrap   %>% group_by(Calidad) %>% sample_n(2) %>% ungroup()
train_dataset <-dplyr::setdiff(vines_dataset_numeric_reduced,val_dataset)

tree<-rpart::rpart(Calidad~.,
                   data=train_dataset,
                   control = rpart.control(minsplit = 10),)
var_importance<- c(var_importance,tree$variable.importance[1:num_of_feat])
#rpart.plot(tree,type=1,
#           extra=101, box.palette="GnBu",
#           branch.lty=3, shadow.col="gray", nn=TRUE
#        )
}

var_importance_cart_final<-data.frame(variable=names(var_importance),value=var_importance) %>% group_by(variable) %>% summarise(n=n()) %>% arrange(desc(n)) %>% top_n(20)

Selecting by n

var_importance_cart_final %>% as.data.frame()

RANDOM FORESTS feature importance

vines_dataset_bootstrap<-rsample::analysis(resamples$splits[[sample(1:100,1)]])
val_dataset  <- vines_dataset_bootstrap   %>% group_by(Calidad) %>% sample_n(2) %>% ungroup()
train_dataset <-dplyr::setdiff(vines_dataset_numeric_reduced,val_dataset)

rf_names<-apply(names(train_dataset) %>% t() ,2, function(x) stringr::str_replace_all(x, pattern=" ",replacement = "_"))
rf_names<-apply(rf_names %>% t() ,2, function(x) stringr::str_replace_all(x, pattern="[/()%°>]+",replacement = "_"))

train_dataset_rf<-train_dataset
names(train_dataset_rf)<-rf_names

rf<-randomForest::randomForest(Calidad ~ .,data=train_dataset_rf,importance=TRUE)
var_importance_rf_final<-randomForest::importance(rf) %>% as.data.frame() %>% arrange(desc(MeanDecreaseGini)) %>% add_rownames('variable')  %>% top_n(num_of_feat) %>% select(variable)

Selecting by MeanDecreaseGini

var_importance_rf_final<- data.frame(variable=names(train_dataset[,which(names(train_dataset_rf) %in% var_importance_rf_final$variable)]) )
var_importance_rf_final

GLMNET Feature Selection

library(glmnet)
vines_dataset_bootstrap<-rsample::analysis(resamples$splits[[sample(1:100,1)]])
val_dataset  <- vines_dataset_bootstrap   %>% group_by(Calidad) %>% sample_n(2) %>% ungroup()
train_dataset <-dplyr::setdiff(vines_dataset_numeric_reduced,val_dataset)
glmfit<-cv.glmnet(x = train_dataset %>% select(-Calidad) %>% as.matrix(),
       y = train_dataset$Calidad %>% as.factor(),
       family = "multinomial")
#coef(glmfit,s = 'lambda.min')

'%ni%'<-Negate('%in%')
c<-coef(glmfit,s='lambda.min',exact=TRUE)


var_importance_glmnet<-purrr::map(c, function(x) {
  inds <- which(x != 0)
  variables <- row.names(x)[inds]
  variables <- variables[variables %ni% '(Intercept)']
}) 

#do.call(rbind,var_importance_glmnet) %>% as.data.frame()


var_importance_glmnet_final<-var_importance_glmnet %>% unlist() %>% unique() %>% as.data.frame()
names(var_importance_glmnet_final)<-"variable"

var_importance_glmnet_final

Selected variables per class

var_importance_glmnet

$A0
 [1] "uva_L hollejo"                        "uva_a_hollejo"                        "uva_ANT(mg/gbaya)"                   
 [4] "uva_Acti_antirr_hollejo"              "uva_Acidez Mosto"                     "planta_Long Cordon"                  
 [7] "planta_Nro de Racimos/m"              "planta_ Peso de poda/m"               "planta_Dist. hileras"                
[10] "planta_Rnto/ha"                       "suelo_Aspecto"                        "suelo_Vol. Sedimentacion (%)"        
[13] "eco_GDA historico"                    "eco_Temp. Mínima °C"                  "eco_Evapotranspiración mm Temp"      
[16] "eco_Velocidad Media Viento km/h Temp" "eco_Ampl. Térmica Marzo °C Temp"     

$A1
 [1] "ubi_Altura s.n.m."                  "uva_a_hollejo"                      "uva_b_hollejo"                      "uva_FT(mg/gbaya)"                  
 [5] "uva_FT(mg/baya)"                    "uva_Brix"                           "uva_Acidez Mosto"                   "planta_Long Cordon"                
 [9] "planta_Dist. hileras"               "planta_Plantas/ha"                  "planta_ndvi"                        "suelo_Vol. Sedimentacion (%)"      
[13] "suelo_Indice fondo Valle"           "eco_Precipitaciones (mm) Temp 2020" "eco_Evapotranspiración mm Temp"     "eco_I. de Fresco Nocturno Temp"    
[17] "eco_Ampl. Térmica Marzo °C Temp"   

$A2
 [1] "ubi_Altura s.n.m."                  "uva_L hollejo"                      "uva_h_hollejo"                      "uva_FT(mg/gbaya)"                  
 [5] "uva_FT(mg/baya)"                    "uva_ANT(mg/gbaya)"                  "uva_Acti_antirr_hollejo"            "uva_Brix"                          
 [9] "uva_pH_mosto"                       "uva_Acidez Mosto"                   "planta_Peso_racimo"                 "planta_Long Cordon"                
[13] "planta_ Peso de poda/m"             "planta_Plantas/ha"                  "suelo_Aspecto"                      "eco_Temp. Máxima °C"               
[17] "eco_Precipitaciones (mm) Temp 2020" "eco_I. de Fresco Nocturno Temp"    

$A3
 [1] "uva_L hollejo"                        "uva_a_hollejo"                        "uva_TAN(mg/baya)"                    
 [4] "uva_ANT(mg/gbaya)"                    "uva_pH_mosto"                         "uva_Acidez Mosto"                    
 [7] "planta_Bayas/racimo"                  "planta_Ravaz"                         "planta_Nro de Racimos/m"             
[10] "planta_Dist. hileras"                 "planta_Dist. plantas"                 "planta_Rnto/ha"                      
[13] "planta_ndvi"                          "suelo_Aspecto"                        "suelo_Vol. Sedimentacion (%)"        
[16] "suelo_Indice fondo Valle"             "eco_GDA historico"                    "eco_Temp. Mínima °C"                 
[19] "eco_Temp. Media °C"                   "eco_Temp. Máxima °C"                  "eco_Velocidad Media Viento km/h Temp"
[22] "eco_I. de Fresco Nocturno Temp"      

$A5
 [1] "ubi_Altura s.n.m."                    "uva_a_hollejo"                        "uva_TAN(mg/baya)"                    
 [4] "uva_ANT(mg/gbaya)"                    "uva_Acti_antirr_hollejo"              "uva_Acidez Mosto"                    
 [7] "planta_Peso_racimo"                   "planta_ Peso de poda/m"               "planta_Dist. hileras"                
[10] "planta_Dist. plantas"                 "planta_ndvi"                          "suelo_Vol. Sedimentacion (%)"        
[13] "suelo_Indice fondo Valle"             "eco_Temp. Mínima °C"                  "eco_Temp. Máxima °C"                 
[16] "eco_Radiacíon W/m2 Temp"              "eco_Velocidad Media Viento km/h Temp"

$B
[1] "ubi_Altura s.n.m."            "planta_Nro de Racimos/m"      "planta_Plantas/ha"            "planta_Rnto/ha"               "suelo_Vol. Sedimentacion (%)"
[6] "suelo_Indice fondo Valle"     "eco_Radiacíon W/m2 Temp"     

$C
 [1] "uva_pH_mosto"                 "planta_Long Cordon"           "planta_Nro de Racimos/m"      "planta_ Peso de poda/m"      
 [5] "planta_Dist. hileras"         "planta_Rnto/ha"               "suelo_Aspecto"                "suelo_Vol. Sedimentacion (%)"
 [9] "suelo_Pendiente"              "eco_GDA historico"            "eco_Días con Temp.>35°C Temp"

FINAL VARIABLE SELECTION

selected_variables<-var_importance_boruta_final


#selected_variables<-data.frame(variable=c("planta_Peso_racimo",        
#"uva_Acidez Mosto",            
#"uva_TAN(mg/baya)",
#"planta_Bayas/racimo",
#"eco_Amplitud Térmica °C"))

Selected variables range


vines_dataset_numeric_reduced %>% select(selected_variables$variable) %>% reshape2::melt() %>%
  ggplot()+
  facet_wrap(~variable,scales = 'free',ncol = 10)+
  geom_boxplot(aes(x=variable,y=value,fill=variable),color='gray')+
  ggdark::dark_theme_bw()+
    theme(axis.text.x = element_text(angle = 45, hjust = 1))+
  theme(legend.position="none",
        axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank())+
  theme( strip.text = element_text(size = 6))

No id variables; using all as measure variables

NA

PCA Ellipses for classes with selected variables


calidad_index<-vines_dataset_numeric_reduced  %>% 
               select(selected_variables$variable,Calidad)
calidad_index<- which(colnames(calidad_index)=="Calidad")
library(FactoMineR)
res_pca = PCA(vines_dataset_numeric_reduced  %>% 
               select(selected_variables$variable,Calidad)
              , scale.unit=TRUE, 
              ncp=6, 
              graph=F,
              quali.sup=calidad_index, #colid for Calidad
              )

plot(res_pca,choix="ind",habillage=calidad_index)

#par(mfcol=c(1,2))
plot(res_pca,choix="var",habillage="none",invisible = "ind") # para las variables

plotellipses(res_pca, invisible="ind",xlim=c(-6,6),ylim=c(-6,6))

NA
NA

CART

vines_dataset_bootstrap<-rsample::analysis(resamples$splits[[sample(1:100,1)]])
val_dataset  <- vines_dataset_bootstrap   %>% group_by(Calidad) %>% sample_n(2) %>% ungroup()
train_dataset <-dplyr::setdiff(vines_dataset_numeric_reduced,val_dataset)

tree<-rpart::rpart(Calidad~.,
                   data=train_dataset %>% 
                     select(selected_variables$variable,Calidad),
                   control = rpart.control(minsplit = 5),)
rpart.plot(tree,type=1,
           extra=101, box.palette="GnBu",
           branch.lty=3, shadow.col="gray", nn=TRUE
        )

predictions<-predict(tree,val_dataset,type = 'class')
caret::confusionMatrix(val_dataset$Calidad %>% as.factor(),predictions)

Confusion Matrix and Statistics

          Reference
Prediction A0 A1 A2 A3 A5 B C
        A0  2  0  0  0  0 0 0
        A1  0  2  0  0  0 0 0
        A2  0  0  2  0  0 0 0
        A3  1  0  0  1  0 0 0
        A5  0  0  0  0  2 0 0
        B   0  0  0  0  0 2 0
        C   0  0  0  0  0 0 2

Overall Statistics
                                          
               Accuracy : 0.9286          
                 95% CI : (0.6613, 0.9982)
    No Information Rate : 0.2143          
    P-Value [Acc > NIR] : 2.253e-08       
                                          
                  Kappa : 0.9167          
                                          
 Mcnemar's Test P-Value : NA              

Statistics by Class:

                     Class: A0 Class: A1 Class: A2 Class: A3 Class: A5 Class: B Class: C
Sensitivity             0.6667    1.0000    1.0000   1.00000    1.0000   1.0000   1.0000
Specificity             1.0000    1.0000    1.0000   0.92308    1.0000   1.0000   1.0000
Pos Pred Value          1.0000    1.0000    1.0000   0.50000    1.0000   1.0000   1.0000
Neg Pred Value          0.9167    1.0000    1.0000   1.00000    1.0000   1.0000   1.0000
Prevalence              0.2143    0.1429    0.1429   0.07143    0.1429   0.1429   0.1429
Detection Rate          0.1429    0.1429    0.1429   0.07143    0.1429   0.1429   0.1429
Detection Prevalence    0.1429    0.1429    0.1429   0.14286    0.1429   0.1429   0.1429
Balanced Accuracy       0.8333    1.0000    1.0000   0.96154    1.0000   1.0000   1.0000

#printcp(tree)

tree$variable.importance %>% as.data.frame()

MODEL EVALUATION

CART

Cross Validation 3x10

library(caret)
library(doMC)
registerDoMC(cores = 4)
ctrl_fast <- trainControl(
  method = "repeatedcv",
  repeats = 3,
  number = 10,
  returnResamp = 'final',
  savePredictions = 'final',
  verboseIter = F,
  classProbs = TRUE,
  allowParallel = T
)

#rf_grid <-  expand.grid(.mtry = c(5))
cartFit <- caret::train(
  x = vines_dataset_numeric_reduced %>% 
                     select(selected_variables$variable) %>% na.omit(),
  y = vines_dataset_numeric_reduced %>% 
                     select(Calidad) %>% unlist() %>% as.factor(),
  method = "rpart",
  tuneLength=10,
  #tuneGrid = rf_grid,
  #verbose = 2,
  trControl = ctrl_fast,
  #ntree = 200
)

cartFit$results %>%
  ggplot(aes(x = cp, y = Accuracy)) +
  geom_point(color = 'red') +
  geom_errorbar(
    aes(ymin = Accuracy - AccuracySD, ymax = Accuracy + AccuracySD),
    width = .02,
    color = 'yellow'
  ) +
  ggdark::dark_theme_bw() +
  labs(title="CART: Mean and Standard deviation after hyper-parameter (cp) tuning")+
  theme(axis.text.x = element_text(angle = 45, hjust = 1))


cartFit

CART 

211 samples
  5 predictor
  7 classes: 'A0', 'A1', 'A2', 'A3', 'A5', 'B', 'C' 

No pre-processing
Resampling: Cross-Validated (10 fold, repeated 3 times) 
Summary of sample sizes: 191, 191, 189, 191, 190, 191, ... 
Resampling results across tuning parameters:

  cp          Accuracy   Kappa     
  0.00000000  0.7713507  0.72035640
  0.02150538  0.7473188  0.69145307
  0.04301075  0.7282070  0.66772317
  0.06451613  0.6674427  0.59189092
  0.08602151  0.5755858  0.47388470
  0.10752688  0.5475735  0.43632317
  0.12903226  0.4458962  0.28586830
  0.15053763  0.3708944  0.16949186
  0.17204301  0.3521282  0.14149779
  0.19354839  0.3063336  0.07099667

Accuracy was used to select the optimal model using the largest value.
The final value used for the model was cp = 0.

Learning Curves


cart_data <-
  learning_curve_dat(dat = vines_dataset_numeric_reduced %>% 
                     select(selected_variables$variable,Calidad),
                     outcome = "Calidad",
                     #test_prop = 0.6,
                     proportion = seq(0.3,1,0.1),
                     ## `train` arguments1
                     method = "rpart",
                     metric = "Accuracy",
                     trControl = ctrl_fast,
                     verbose = F)

ggplot(cart_data, aes(x = Training_Size, y = Accuracy, color = Data)) +
  geom_smooth(method = loess, span = .8) +
  ggdark::dark_theme_bw()+
  labs(title="CART: Learning curves on training and resampled datasets")

NA
NA

Random Forests

Cross Validation 3x10

#rf_grid <-  expand.grid(.mtry = c(5))
rfFit <- caret::train(
  x = vines_dataset_numeric_reduced %>% 
                     select(selected_variables$variable) %>% na.omit(),
  y = vines_dataset_numeric_reduced %>% 
                     select(Calidad) %>% unlist() %>% as.factor(),
  method = "rf",
  tuneLength=10,
  #tuneGrid = rf_grid,
  #verbose = 2,
  trControl = ctrl_fast,
  #ntree = 200
)

note: only 4 unique complexity parameters in default grid. Truncating the grid to 4 .

rfFit$results %>%
  ggplot(aes(x = mtry, y = Accuracy)) +
  geom_point(color = 'red') +
  geom_errorbar(
    aes(ymin = Accuracy - AccuracySD, ymax = Accuracy + AccuracySD),
    width = .02,
    color = 'yellow'
  ) +
  ggdark::dark_theme_bw() +
  labs(title="Random Forest: Mean and Standard deviation after hyper-parameter (mtry) tuning")+
  theme(axis.text.x = element_text(angle = 45, hjust = 1))


rfFit

Random Forest 

211 samples
  5 predictor
  7 classes: 'A0', 'A1', 'A2', 'A3', 'A5', 'B', 'C' 

No pre-processing
Resampling: Cross-Validated (10 fold, repeated 3 times) 
Summary of sample sizes: 190, 190, 190, 189, 189, 191, ... 
Resampling results across tuning parameters:

  mtry  Accuracy   Kappa    
  2     0.9452368  0.9333587
  3     0.9375754  0.9240269
  4     0.9346109  0.9203579
  5     0.9316600  0.9166846

Accuracy was used to select the optimal model using the largest value.
The final value used for the model was mtry = 2.

Learning Curves

set.seed(21052025)
rf_data <-
  learning_curve_dat(dat = vines_dataset_numeric_reduced %>% 
                     select(selected_variables$variable,Calidad),
                     outcome = "Calidad",
                     #test_prop = 0.6,
                     proportion = seq(0.3,1,0.1),
                     ## `train` arguments1
                     method = "ranger",
                     metric = "Accuracy",
                     trControl = ctrl_fast,
                     verbose = F)

ggplot(rf_data, aes(x = Training_Size, y = Accuracy, color = Data)) +
  geom_smooth(method = loess, span = .8) +
  ggdark::dark_theme_bw()+
  labs(title="Random Forests: Learning curves on training and resampled datasets")

Predictions

test_dataset_numeric<-test_dataset %>% select_if(~class(.) == 'numeric')
test_dataset_numeric_imputed <- kNN(test_dataset_numeric)
test_dataset_numeric<-test_dataset_numeric_imputed %>% select(-ends_with("_imp"))
preds<-predict(rfFit,test_dataset_numeric %>% 
                     select(selected_variables$variable))

caret::confusionMatrix(data = as.factor(preds), 
                       reference = as.factor(test_dataset$Calidad)
                       )

Confusion Matrix and Statistics

          Reference
Prediction A0 A1 A2 A3 A5  B  C
        A0  8  0  1  0  0  0  0
        A1  0  9  0  0  0  0  0
        A2  0  0  9  0  0  0  0
        A3  0  0  0 11  0  0  0
        A5  0  0  0  1  2  0  0
        B   0  0  0  0  0  7  0
        C   0  0  0  0  0  0  5

Overall Statistics
                                          
               Accuracy : 0.9623          
                 95% CI : (0.8702, 0.9954)
    No Information Rate : 0.2264          
    P-Value [Acc > NIR] : < 2.2e-16       
                                          
                  Kappa : 0.955           
                                          
 Mcnemar's Test P-Value : NA              

Statistics by Class:

                     Class: A0 Class: A1 Class: A2 Class: A3 Class: A5 Class: B Class: C
Sensitivity             1.0000    1.0000    0.9000    0.9167   1.00000   1.0000  1.00000
Specificity             0.9778    1.0000    1.0000    1.0000   0.98039   1.0000  1.00000
Pos Pred Value          0.8889    1.0000    1.0000    1.0000   0.66667   1.0000  1.00000
Neg Pred Value          1.0000    1.0000    0.9773    0.9762   1.00000   1.0000  1.00000
Prevalence              0.1509    0.1698    0.1887    0.2264   0.03774   0.1321  0.09434
Detection Rate          0.1509    0.1698    0.1698    0.2075   0.03774   0.1321  0.09434
Detection Prevalence    0.1698    0.1698    0.1698    0.2075   0.05660   0.1321  0.09434
Balanced Accuracy       0.9889    1.0000    0.9500    0.9583   0.99020   1.0000  1.00000

GLMNET

Cross Validation 3x10

Learning Curves

LS0tCnRpdGxlOiAiUC4gRXhwbG9yYXRvcnkgQW5hbHlzaXM6IFZpbmVzIDIwMjEgNUYiCm91dHB1dDogCiAgaHRtbF9ub3RlYm9vazogCiAgICBmaWdfd2lkdGg6IDEwCiAgICBmaWdfaGVpZ2h0OiA1CiAgICBjb2RlX2ZvbGRpbmc6IGhpZGUKICAgIHRvYzogdHJ1ZQogICAgdG9jX2Zsb2F0OiB0cnVlCiAgICB0b2NfY29sbGFwc2VkOiB0cnVlCgotLS0KCiMgUFJFTElNSU5BUklFUwoKQ2xlYW5pbmcgdGhlIFJTdHVkaW8gZW52aXJvbm1lbnQKCmBgYHtyIG1lc3NhZ2U9RkFMU0UsIHdhcm5pbmc9RkFMU0V9CnJtKGxpc3QgPSBscygpKSAjIGNsZWFuIGdsb2JhbCBlbnZpcm9ubWVudApjYXQoIlwwMTQiKSAgIyBjbGVhbiB0aGUgY29uc29sZQpgYGAKCkRlZmF1bHQgZGlyZWN0b3J5CgpgYGB7ciBzZXR1cCwgd2FybmluZz1GQUxTRX0KIyBDSEFOR0UgVE8gVEhFIENPUlJFU1BPTkRJTkcgV09SS0lORyBESVJFQ1RPUlkKa25pdHI6Om9wdHNfa25pdCRzZXQocm9vdC5kaXIgPSAnL2hvbWUvaGFycG8vRHJvcGJveC9vbmdvaW5nLXdvcmsvZ2l0LXJlcG9zL2ludGEtdmluZS1xdWFsaXR5LycpCiNrbml0cjo6b3B0c19rbml0JHNldChyb290LmRpciA9ICcvaG9tZS9yb2RyYWxlei9ob3N0ZGlyL2pvYnMvZGVtYW5kLXBsYW5uaW5nLycpCmBgYAoKYGBge3IgaW5jbHVkZT1GQUxTRX0KbGlicmFyeShkcGx5cikKbGlicmFyeShyZWFkcikKbGlicmFyeShnZ3Bsb3QyKQpsaWJyYXJ5KHNraW1yKQpsaWJyYXJ5KFZJTSkKbGlicmFyeShycGFydCkKbGlicmFyeShycGFydC5wbG90KQpsaWJyYXJ5KEJvcnV0YSkgI2ZvciBmZWF0dXJlIHNlbGVjdGlvbgpsaWJyYXJ5KGthYmxlRXh0cmEpICMgZm9yIHByZXR0eSBwcmludGluZyB0YWJsZXMKCmBgYAoKCiMgRVhQTE9SQVRJT04KIyMgTG9hZGluZyAgRGF0YXNldAoKYGBge3Igd2FybmluZz1GQUxTRX0KI3ZpbmVzX2RhdGFzZXQ8LXJlYWRyOjpyZWFkX2NzdigiZGF0YXNldHMvdmluZV90cmFpbl9uZXduYW1lcy5jc3YiLCBjb2xfdHlwZXMgPWNvbHMoKSkKI3ZpbmVzX2RhdGFzZXQKdmluZXNfZGF0YXNldDwtcmVhZHI6OnJlYWRfY3N2KCJyYXdkYXRhLzIwMjIvdmluZV9yYXcuY3N2Iixjb2xfdHlwZXMgPSBjb2xzKAogIFRlbXBvcmFkYSA9IGNvbF9jaGFyYWN0ZXIoKSwKICBJRCA9IGNvbF9kb3VibGUoKSwKICB1YmlfRmluY2EgPSBjb2xfY2hhcmFjdGVyKCksCiAgdWJpX3ggPSBjb2xfZG91YmxlKCksCiAgdWJpX3kgPSBjb2xfZG91YmxlKCksCiAgYHViaV9BbHR1cmEgcy5uLm0uYCA9IGNvbF9kb3VibGUoKSwKICB1YmlfWm9uYSA9IGNvbF9jaGFyYWN0ZXIoKSwKICB1YmlfRGlzdHJpdG8gPSBjb2xfY2hhcmFjdGVyKCksCiAgYHV2YV9MIGhvbGxlam9gID0gY29sX2RvdWJsZSgpLAogIHV2YV9hX2hvbGxlam8gPSBjb2xfZG91YmxlKCksCiAgdXZhX2JfaG9sbGVqbyA9IGNvbF9kb3VibGUoKSwKICB1dmFfaF9ob2xsZWpvID0gY29sX2RvdWJsZSgpLAogIHV2YV9DX2hvbGxlam8gPSBjb2xfZG91YmxlKCksCiAgYHV2YV9GVChtZy9naG9sbGVqbylgID0gY29sX2RvdWJsZSgpLAogIGB1dmFfRlQobWcvZ2JheWEpYCA9IGNvbF9kb3VibGUoKSwKICBgdXZhX0ZUKG1nL2JheWEpYCA9IGNvbF9kb3VibGUoKSwKICBgdXZhX1RBTihtZy9naG9sbGVqbylgID0gY29sX2RvdWJsZSgpLAogIGB1dmFfVEFOKG1nL2diYXlhKWAgPSBjb2xfZG91YmxlKCksCiAgYHV2YV9UQU4obWcvYmF5YSlgID0gY29sX2RvdWJsZSgpLAogIGB1dmFfQU5UKG1nL2dob2xsZWpvKWAgPSBjb2xfZG91YmxlKCksCiAgYHV2YV9BTlQobWcvZ2JheWEpYCA9IGNvbF9kb3VibGUoKSwKICBgdXZhX0FOVChtZy9iYXlhKWAgPSBjb2xfZG91YmxlKCksCiAgdXZhX0FjdGlfYW50aXJyX2hvbGxlam8gPSBjb2xfZG91YmxlKCksCiAgYFV2YV9TZW1pbGxhcy9iYXlhYCA9IGNvbF9kb3VibGUoKSwKICBgdXZhX1Blc28gc2VtaWxsYXMvYmF5YWAgPSBjb2xfZG91YmxlKCksCiAgdXZhX0JyaXggPSBjb2xfZG91YmxlKCksCiAgdXZhX3BIX21vc3RvID0gY29sX2RvdWJsZSgpLAogIGB1dmFfQWNpZGV6IE1vc3RvYCA9IGNvbF9kb3VibGUoKSwKICBgdXZhXyBOUEFfRW56KG1nL0wpYCA9IGNvbF9kb3VibGUoKSwKICBgdXZhXyBQb3Rhc2lvX0VueihtZy9MKWAgPSBjb2xfZG91YmxlKCksCiAgYHV2YV8gTlBBX0Zvc3MobWcvTClgID0gY29sX2RvdWJsZSgpLAogIGB1dmFfIFBvdGFzaW9fRm9zcyhtZy9MKWAgPSBjb2xfZG91YmxlKCksCiAgcGxhbnRhX1Blc29fcmFjaW1vID0gY29sX2RvdWJsZSgpLAogIHBsYW50YV9QZXNvX2RlX2JheWEgPSBjb2xfZG91YmxlKCksCiAgYHBsYW50YV9CYXlhcy9yYWNpbW9gID0gY29sX2RvdWJsZSgpLAogIHBsYW50YV9SYXZheiA9IGNvbF9kb3VibGUoKSwKICBgcGxhbnRhX0xvbmcgQ29yZG9uYCA9IGNvbF9kb3VibGUoKSwKICBgcGxhbnRhX05ybyBkZSBSYWNpbW9zL21gID0gY29sX2RvdWJsZSgpLAogIGBwbGFudGFfIFBlc28gZGUgcG9kYS9tYCA9IGNvbF9kb3VibGUoKSwKICBgcGxhbnRhX0Rpc3QuIGhpbGVyYXNgID0gY29sX2RvdWJsZSgpLAogIGBwbGFudGFfRGlzdC4gcGxhbnRhc2AgPSBjb2xfZG91YmxlKCksCiAgYHBsYW50YV9QbGFudGFzL2hhYCA9IGNvbF9kb3VibGUoKSwKICBgcGxhbnRhX1JudG8vaGFgID0gY29sX2RvdWJsZSgpLAogIHBsYW50YV9uZHZpID0gY29sX2RvdWJsZSgpLAogIHN1ZWxvX0FzcGVjdG8gPSBjb2xfZG91YmxlKCksCiAgYHN1ZWxvX1ZvbC4gU2VkaW1lbnRhY2lvbiAoJSlgID0gY29sX2RvdWJsZSgpLAogIHN1ZWxvX1RleHR1cmEgPSBjb2xfY2hhcmFjdGVyKCksCiAgYHN1ZWxvX0luZGljZSBmb25kbyBWYWxsZWAgPSBjb2xfZG91YmxlKCksCiAgc3VlbG9fUGVuZGllbnRlID0gY29sX2RvdWJsZSgpLAogIGBlY29fRXN0YWNpb24gZGF0b3MgY2xpbWFgID0gY29sX2NoYXJhY3RlcigpLAogIGBlY29fR0RBIGhpc3Rvcmljb2AgPSBjb2xfZG91YmxlKCksCiAgYGVjb19UZW1wLiBNw61uaW1hIMKwQ2AgPSBjb2xfZG91YmxlKCksCiAgYGVjb19UZW1wLiBNZWRpYSDCsENgID0gY29sX2RvdWJsZSgpLAogIGBlY29fVGVtcC4gTcOheGltYSDCsENgID0gY29sX2RvdWJsZSgpLAogIGBlY29fQW1wbGl0dWQgVMOpcm1pY2EgwrBDYCA9IGNvbF9kb3VibGUoKSwKICBgZWNvX1ByZWNpcGl0YWNpb25lcyAobW0pIFRlbXAgMjAyMGAgPSBjb2xfZG91YmxlKCksCiAgYGVjb19HcmFkb3MgRMOtYXMgQWN1bS4gVGVtcGAgPSBjb2xfZG91YmxlKCksCiAgYGVjb19FdmFwb3RyYW5zcGlyYWNpw7NuIG1tIFRlbXBgID0gY29sX2RvdWJsZSgpLAogIGBlY29fRMOtYXMgY29uIFRlbXAuPjM1wrBDIFRlbXBgID0gY29sX2RvdWJsZSgpLAogIGBlY29fUmFkaWFjw61vbiBXL20yIFRlbXBgID0gY29sX2RvdWJsZSgpLAogIGBlY29fVmVsb2NpZGFkIE1lZGlhIFZpZW50byBrbS9oIFRlbXBgID0gY29sX2RvdWJsZSgpLAogIGBlY29fSS4gZGUgRnJlc2NvIE5vY3R1cm5vIFRlbXBgID0gY29sX2RvdWJsZSgpLAogIGBlY29fVGVtcC4gTWVkaWEgTWFyem8gwrBDIFRlbXBgID0gY29sX2RvdWJsZSgpLAogIGBlY29fQW1wbC4gVMOpcm1pY2EgTWFyem8gwrBDIFRlbXBgID0gY29sX2RvdWJsZSgpLAogIGBlY29fSG9yYXMgZGUgRnLDrW8gVGVtcGAgPSBjb2xfZG91YmxlKCksCiAgQ2FsaWRhZCA9IGNvbF9jaGFyYWN0ZXIoKQopCikKI3NwZWModmluZXNfZGF0YXNldCkKI3ZpbmVzX2RhdGFzZXQgPC0gdmluZXNfZGF0YXNldCAlPiUgZmlsdGVyKFRlbXBvcmFkYSA9PSAyMDIwKQp2aW5lc19kYXRhc2V0ICU+JSBncm91cF9ieShUZW1wb3JhZGEpICU+JSBjb3VudCgpCmBgYAoKVHJhaW5pbmcgZGF0YXNldCBkaW1lbnNpb24gYHIgdmluZXNfZGF0YXNldCAlPiUgbmNvbCgpYCB4IGByIHZpbmVzX2RhdGFzZXQgJT4lIG5yb3coKWAKCgojIyBSZW1vdmluZyB1bm5lY2VzYXJ5IGRhdGEKYGBge3Igd2FybmluZz1GQUxTRX0KI3JlbW92ZWRfbnVtZXJpY192YXI8LWMoInViaV94IiwidWJpX3kiLCJJRCIpCnJlbW92ZWRfbnVtZXJpY192YXI8LWMoIklEIiwidWJpX3giLCJ1YmlfeSIpCgoKCgp2aW5lc19kYXRhc2V0IDwtIHZpbmVzX2RhdGFzZXQgJT4lIHNlbGVjdCgtYWxsX29mKHJlbW92ZWRfbnVtZXJpY192YXIpKQpgYGAKCiMjIFJlbW92aW5nIGNvbHVtbnMgd2l0aCB0b28gbWFueSBtaXNzaW5nIHZhbHVlcwoKYGBge3Igd2FybmluZz1GQUxTRX0KbWlzc2luZ192YWxzPC12aW5lc19kYXRhc2V0ICAlPiUgZ3JvdXBfYnkoVGVtcG9yYWRhKSAlPiUgc2VsZWN0X2lmKGZ1bmN0aW9uKHgpIGFueShpcy5uYSh4KSkpICAlPiUKICBzdW1tYXJpc2VfZWFjaChmdW5zKHN1bShpcy5uYSguKSkpKSAlPiUgcmVzaGFwZTI6Om1lbHQoKSAlPiUgZmlsdGVyKFRlbXBvcmFkYSA9PSAiMjAyMCIgJiB2YWx1ZSA9PSA4NykgJT4lIHNlbGVjdCh2YXJpYWJsZSkKCgptaXNzaW5nX3ZhbHM8LXJiaW5kKG1pc3NpbmdfdmFscywgImVjb19Ib3JhcyBkZSBGcsOtbyBUZW1wIikgJT4lIHVubGlzdCgpICU+JSB1bm5hbWUKCnZpbmVzX2RhdGFzZXQ8LXZpbmVzX2RhdGFzZXQgJT4lIHNlbGVjdCgtYWxsX29mKG1pc3NpbmdfdmFscykpCmBgYAoKIyMgVHJhaW4gYW5kIFRlc3Qgc3BsaXQ6CgpgYGB7ciB3YXJuaW5nPUZBTFNFfQpzZXQuc2VlZCg3KQp0ZXN0X2RhdGFzZXQgIDwtIHZpbmVzX2RhdGFzZXQgJT4lIHNhbXBsZV9mcmFjKDAuMikKdHJhaW5fZGF0YXNldCA8LWRwbHlyOjpzZXRkaWZmKHZpbmVzX2RhdGFzZXQsIHRlc3RfZGF0YXNldCkKdmluZXNfZGF0YXNldDwtdHJhaW5fZGF0YXNldAp2aW5lc19kYXRhc2V0ICU+JSBncm91cF9ieShUZW1wb3JhZGEpICU+JSBjb3VudCgpCmBgYAoKCgojIyBCYXNpYyBEaXN0cmlidXRpb24gSW5mb3JtYXRpb24KIyMjIENhdGVnb3JpY2FsIFZhcmlhYmxlcwpgYGB7ciB3YXJuaW5nPUZBTFNFfQp2aW5lc19kYXRhc2V0X2ZhY3RvcnM8LXZpbmVzX2RhdGFzZXQgJT4lIHNlbGVjdF9pZih+Y2xhc3MoLikgPT0gJ2NoYXJhY3RlcicpCm5hbWVzKHZpbmVzX2RhdGFzZXRfZmFjdG9ycykgJT4lIGFzLmRhdGEuZnJhbWUoKQpgYGAKYGBge3Igd2FybmluZz1GQUxTRX0KIHNraW1yOjpza2ltKHZpbmVzX2RhdGFzZXRfZmFjdG9ycyAlPiUgc2VsZWN0KC1DYWxpZGFkKSkjICU+JSBrbml0cjo6a2FibGUoKSAlPiUga2FibGVfc3R5bGluZyhmb250X3NpemUgPSA5KQpgYGAKCiMjIyBOdW1lcmljYWwgVmFyaWFibGVzCgpgYGB7ciB3YXJuaW5nPUZBTFNFfQp2aW5lc19kYXRhc2V0X251bWVyaWM8LXZpbmVzX2RhdGFzZXQgJT4lIHNlbGVjdF9pZih+Y2xhc3MoLikgPT0gJ251bWVyaWMnKQpuYW1lcyh2aW5lc19kYXRhc2V0X251bWVyaWMpICU+JSBhcy5kYXRhLmZyYW1lKCkKYGBgCgpgYGB7ciB3YXJuaW5nPUZBTFNFfQpza2ltcjo6c2tpbSh2aW5lc19kYXRhc2V0X251bWVyaWMpICU+JSBhcnJhbmdlKGRlc2Mobl9taXNzaW5nKSkgIyU+JSBrbml0cjo6a2FibGUoKSAlPiUga2FibGVfc3R5bGluZyhmb250X3NpemUgPSA5KQpgYGAKCgojIyMgQ2xhc3MgRGlzdHJpYnV0aW9uCgpgYGB7ciB3YXJuaW5nPUZBTFNFfQp2aW5lc19kYXRhc2V0ICU+JSBncm91cF9ieShDYWxpZGFkKSAlPiUgc3VtbWFyaXNlKHRvdGFsPW4oKSkgJT4lCiAgZ2dwbG90KCkrCiAgZ2VvbV9jb2woYWVzKHg9Q2FsaWRhZCx5PXRvdGFsLGZpbGw9Q2FsaWRhZCkpKwogIGdnZGFyazo6ZGFya190aGVtZV9idygpCmBgYAoKCiMgQU5BTElTWVMgTlVNRVJJQ0FMIFZBUklBQkxFUwoKCgoKIyMgRGVhbGluZyBNaXNzaW5nIERhdGEKCmBgYHtyIGZpZy5oZWlnaHQ9NSwgZmlnLndpZHRoPTEyLCB3YXJuaW5nPUZBTFNFfQpyZXM8LVZJTTo6YWdncih2aW5lc19kYXRhc2V0X251bWVyaWMsIAogICAgICAgICAgY29tYmluZWQgPSBGQUxTRSAsIAogICAgICAgICAgbnVtYmVycyA9IFRSVUUsIAogICAgICAgICAgc29ydENvbWJzID0gVFJVRSwgCiAgICAgICAgICBzb3J0VmFycyA9IFRSVUUsIAogICAgICAgICAgbGFiZWxzPW5hbWVzKHZpbmVzX2RhdGFzZXRfbnVtZXJpYyksCiAgICAgICAgICBjZXguYXhpcz0uNCwgCiAgICAgICAgICB2YXJoZWlnaHQgPSBGQUxTRSwKICAgICAgICAgIGNleC5udW1iZXJzPTAuOCwKICAgICAgICAgIGNleC5sYWI9MC44LAogICAgICAgICAgcHJvcCA9IFRSVUUpCmBgYAoKCgoKCiMjIyBNaXNzaW5nIHZhbHVlcyBpbXB1dGF0aW9uCmBgYHtyIHdhcm5pbmc9RkFMU0V9CnZpbmVzX2RhdGFzZXRfbnVtZXJpY19pbXB1dGVkIDwtIGtOTih2aW5lc19kYXRhc2V0X251bWVyaWMpCnZpbmVzX2RhdGFzZXRfbnVtZXJpYzwtdmluZXNfZGF0YXNldF9udW1lcmljX2ltcHV0ZWQgJT4lIHNlbGVjdCgtZW5kc193aXRoKCJfaW1wIikpCiN2aW5lc19kYXRhc2V0X251bWVyaWMgJT4lIHNlbGVjdCgtTkFNRSkKYGBgCgojIyBDb3JyZWxhdGlvbiBNYXRyaXgKCiMjIENoZWNraW5nICBDb3JyZWxhdGlvbiB3aXRoIENsYXNzCmBgYHtyIGV2YWw9RkFMU0UsIGZpZy5oZWlnaHQ9MTAsIGZpZy53aWR0aD0xOCwgaW5jbHVkZT1GQUxTRSx3YXJuaW5nPUZBTFNFfQp2aW5lc19kYXRhc2V0X251bWVyaWMgJT4lIAogIHRpYmJsZTo6YWRkX2NvbHVtbihDYWxpZGFkID0gYXMuZmFjdG9yKHZpbmVzX2RhdGFzZXQkQ2FsaWRhZCkpICAlPiUgcmVzaGFwZTI6Om1lbHQoKSAlPiUgZmlsdGVyKHZhcmlhYmxlICVpbiUgYygiZWNvX0dEQSBoaXN0b3JpY28iLCJ1YmlfQWx0dXJhIHMubi5tLiIpKSAlPiUKICBnZ3Bsb3QoKSsKICBmYWNldF93cmFwKH5DYWxpZGFkLG5jb2w9OCkrCiAgI2ZhY2V0X3dyYXAofnZhcmlhYmxlLHNjYWxlcyA9ICdmcmVlJyxuY29sID0gMTApKwogIGdlb21fYm94cGxvdChhZXMoeD12YXJpYWJsZSx5PXZhbHVlLGZpbGw9dmFyaWFibGUpLGNvbG9yPSdncmF5JykrCiAgZ2dkYXJrOjpkYXJrX3RoZW1lX2J3KCkrCiAgICB0aGVtZShheGlzLnRleHQueCA9IGVsZW1lbnRfdGV4dChhbmdsZSA9IDQ1LCBoanVzdCA9IDEpKSsKICAgIHRoZW1lKGxlZ2VuZC5wb3NpdGlvbj0ibm9uZSIpKwogICB0aGVtZSggc3RyaXAudGV4dCA9IGVsZW1lbnRfdGV4dChzaXplID0gNikpCgoKIyAgdGhlbWUobGVnZW5kLnBvc2l0aW9uPSJub25lIiwKIyAgICAgICAgYXhpcy50aXRsZS54PWVsZW1lbnRfYmxhbmsoKSwKIyAgICAgICAgYXhpcy50ZXh0Lng9ZWxlbWVudF9ibGFuaygpLAojICAgICAgICBheGlzLnRpY2tzLng9ZWxlbWVudF9ibGFuaygpKSsKIApgYGAKCmBgYHtyIGZpZy5oZWlnaHQ9MTgsIGZpZy53aWR0aD0xOCx3YXJuaW5nPUZBTFNFfQp2aW5lc19kYXRhc2V0X251bWVyaWNfd2NhbG51bSA8LSB2aW5lc19kYXRhc2V0X251bWVyaWMgJT4lIAogIHRpYmJsZTo6YWRkX2NvbHVtbihDYWxpZGFkID0gYXMuZmFjdG9yKHZpbmVzX2RhdGFzZXQkQ2FsaWRhZCkpICU+JSAKICAgdGliYmxlOjphZGRfY29sdW1uKHViaV9ab25hID0gYXMuZmFjdG9yKHZpbmVzX2RhdGFzZXQkdWJpX1pvbmEpKSAlPiUgCiAgbXV0YXRlKENhbGlkYWQgPSBhcy5udW1lcmljKENhbGlkYWQpLAogICAgICAgICB1YmlfWm9uYSA9IGFzLm51bWVyaWModWJpX1pvbmEpKQoKbGlicmFyeShkM2hlYXRtYXApCnZpbmVzX2RhdGFzZXRfbnVtZXJpY19jb3JfbWF0cml4PC1jb3IodmluZXNfZGF0YXNldF9udW1lcmljX3djYWxudW0gLG1ldGhvZD0ic3BlYXJtYW4iKQoKdmluZXNfZGF0YXNldF9udW1lcmljX2Nvcl9tYXRyaXggJT4lIGFzLmRhdGEuZnJhbWUoKSAlPiUgdGliYmxlOjpyb3duYW1lc190b19jb2x1bW4oImNsYXNzIikgJT4lIAogIGZpbHRlcihjbGFzcz09IkNhbGlkYWQiKSAlPiUgCiAgcmVzaGFwZTI6Om1lbHQoKSAlPiUgc2VsZWN0KHZhcmlhYmxlLCB2YWx1ZSkgJT4lCiAgYXJyYW5nZShkZXNjKGFicyh2YWx1ZSkpKSAlPiUKICBnZ3Bsb3QoKSsKICBnZW9tX2NvbChhZXMoeD12YXJpYWJsZSx5PXZhbHVlLGZpbGw9dmFyaWFibGUpKSsKICBnZ2Rhcms6OmRhcmtfdGhlbWVfYncoKQogIAojaGVhdG1hcChwb3N0b3BfZGF0YV9jb3JfbWF0cml4KQpkM2hlYXRtYXAodmluZXNfZGF0YXNldF9udW1lcmljX2Nvcl9tYXRyaXggLGNvbG9ycyA9ICJCbHVlcyIsY2V4Um93ID0gMC44LCBjZXhDb2wgPSAwLjgpCgpgYGAKCgojIyMgTWF0cml4IGNvbnNpZGVyaW5nIGFsbCB2YXJpYWJsZXMKYGBge3IgZmlnLmhlaWdodD04LCBmaWcud2lkdGg9OCx3YXJuaW5nPUZBTFNFfQoKbGlicmFyeShkM2hlYXRtYXApCnZpbmVzX2RhdGFzZXRfbnVtZXJpY19jb3JfbWF0cml4PC1jb3IodmluZXNfZGF0YXNldF9udW1lcmljICxtZXRob2Q9InNwZWFybWFuIikKI2hlYXRtYXAocG9zdG9wX2RhdGFfY29yX21hdHJpeCkKZDNoZWF0bWFwKHZpbmVzX2RhdGFzZXRfbnVtZXJpY19jb3JfbWF0cml4ICxjb2xvcnMgPSAiQmx1ZXMiLGNleFJvdyA9IDAuOCwgY2V4Q29sID0gMC44KQpgYGAKCgoKIyMgUENBIEVsaXBzZXMgZm9yIGNsYXNlcyAKYGBge3IgZmlnLmhlaWdodD0xMiwgZmlnLndpZHRoPTEyLHdhcm5pbmc9RkFMU0V9CmxpYnJhcnkoRmFjdG9NaW5lUikKI3ZpbmVzX2RhdGFzZXRfbnVtZXJpYyAlPiUgc2VsZWN0KC1oaWdobHlDb3JyZWxhdGVkX3ZhcikgJT4lIHRpYmJsZTo6YWRkX2NvbHVtbihDYWxpZGFkPXZpbmVzX2RhdGFzZXQkQ2FsaWRhZCkKcmVzX3BjYSA9IFBDQSh2aW5lc19kYXRhc2V0X251bWVyaWMgICU+JSAKICAgICAgICAgICAgICAgIHRpYmJsZTo6YWRkX2NvbHVtbihDYWxpZGFkPXZpbmVzX2RhdGFzZXQkQ2FsaWRhZCkKICAgICAgICAgICAgICAsIHNjYWxlLnVuaXQ9VFJVRSwgCiAgICAgICAgICAgICAgbmNwPTYsIAogICAgICAgICAgICAgIGdyYXBoPUYsCiAgICAgICAgICAgICAgcXVhbGkuc3VwPTUwLCAjY29saWQgZm9yIENhbGlkYWQKICAgICAgICAgICAgICApCgpwbG90KHJlc19wY2EsY2hvaXg9ImluZCIsaGFiaWxsYWdlPTUwKQpwYXIobWZjb2w9YygxLDIpKQpwbG90KHJlc19wY2EsY2hvaXg9InZhciIsaGFiaWxsYWdlPSJub25lIixpbnZpc2libGUgPSAiaW5kIikgIyBwYXJhIGxhcyB2YXJpYWJsZXMKcGxvdGVsbGlwc2VzKHJlc19wY2EsIGludmlzaWJsZT0iaW5kIix4bGltPWMoLTEwLDEwKSx5bGltPWMoLTYsNikpCmBgYAoKCiMjIExpc3Qgb2YgaGlnaGx5IGNvcnJlbGF0ZWQgdmFyaWFibGVzCmBgYHtyfQpoaWdobHlDb3JyZWxhdGVkIDwtIGNhcmV0OjpmaW5kQ29ycmVsYXRpb24odmluZXNfZGF0YXNldF9udW1lcmljX2Nvcl9tYXRyaXgsIGN1dG9mZj0wLjksIHZlcmJvc2UgPSBGKQpoaWdobHlDb3JyZWxhdGVkX3ZhcjwtdmluZXNfZGF0YXNldF9udW1lcmljX2Nvcl9tYXRyaXhbLGhpZ2hseUNvcnJlbGF0ZWRdICU+JSBhcy5kYXRhLmZyYW1lKCkgJT4lIG5hbWVzKCkKaGlnaGx5Q29ycmVsYXRlZF92YXIKYGBgCgojIyBDb3JyZWxhdGlvbiBNYXRyaXggd2l0aCAgaGlnaGx5IGNvcnJlbGF0ZWQgcmVtb3ZlZAoKYGBge3IgZmlnLmhlaWdodD04LCBmaWcud2lkdGg9OCx3YXJuaW5nPUZBTFNFfQojaGlnaGx5Q29ycmVsYXRlZF92YXIgJT4lIGxlbmd0aCgpCiN2aW5lc19kYXRhc2V0X251bWVyaWNfY29yX21hdHJpeFstaGlnaGx5Q29ycmVsYXRlZCwtaGlnaGx5Q29ycmVsYXRlZF0gICU+JSBucm93KCkKZDNoZWF0bWFwKHZpbmVzX2RhdGFzZXRfbnVtZXJpY19jb3JfbWF0cml4Wy1oaWdobHlDb3JyZWxhdGVkLC1oaWdobHlDb3JyZWxhdGVkXSAsY29sb3JzID0gIkJsdWVzIixjZXhSb3cgPSAwLjgsIGNleENvbCA9IDAuOCkKCmBgYAoKCgoKIyMgQ29udmVydCBjbGFzcyB0byBudW1lcmljCmBgYHtyICx3YXJuaW5nPUZBTFNFfQojdmluZXNfZGF0YXNldCAlPiUgbXV0YXRlKCkKI3ZpbmVzX2RhdGFzZXQkQ2FsaWRhZCAlPiUgYXMubnVtZXJpYyhhcy5mYWN0b3IodmluZXNfZGF0YXNldCRDYWxpZGFkKSkKYGBgCgojIEZFQVRVUkUgU0VMRUNUSU9OCiMjIEJvb3RzdHJhcCByZXNhbXBsaW5nCjEwMCBuZXcgZGF0YXNldHMgdXNlZCBmb3IgZXZhbHVhdGluZyBmZWF0dXJlIHNlbGVjdGlvbiBhbGdvcml0aG1zCmBgYHtyICx3YXJuaW5nPUZBTFNFfQp2aW5lc19kYXRhc2V0X251bWVyaWNfcmVkdWNlZDwtdmluZXNfZGF0YXNldF9udW1lcmljICAlPiUgCiAgc2VsZWN0KC1hbGxfb2YoaGlnaGx5Q29ycmVsYXRlZF92YXIpKSAgJT4lIAogICNzZWxlY3QobmFtZXModmFyX2ltcG9ydGFuY2VbMToxMV0pKSAlPiUKICB0aWJibGU6OmFkZF9jb2x1bW4oQ2FsaWRhZD1hcy5mYWN0b3IodmluZXNfZGF0YXNldCRDYWxpZGFkKSkKCnJlc2FtcGxlczwtcnNhbXBsZTo6Ym9vdHN0cmFwcyh2aW5lc19kYXRhc2V0X251bWVyaWNfcmVkdWNlZCxzdHJhdGE9IENhbGlkYWQsdGltZXMgPSAxMDAgICkKbnVtX29mX2ZlYXQ8LTUKYGBgCgojIyBCT1JVVEEgZm9yIGZlYXR1cmUgc2VsZWN0aW9uCmBgYHtyICx3YXJuaW5nPUZBTFNFfQp2aW5lc19kYXRhc2V0X2Jvb3RzdHJhcDwtcnNhbXBsZTo6YW5hbHlzaXMocmVzYW1wbGVzJHNwbGl0c1tbc2FtcGxlKDE6MTAwLDEpXV0pCnZhbF9kYXRhc2V0ICA8LSB2aW5lc19kYXRhc2V0X2Jvb3RzdHJhcCAgICU+JSBncm91cF9ieShDYWxpZGFkKSAlPiUgc2FtcGxlX24oMikgJT4lIHVuZ3JvdXAoKQp0cmFpbl9kYXRhc2V0IDwtZHBseXI6OnNldGRpZmYodmluZXNfZGF0YXNldF9udW1lcmljX3JlZHVjZWQsdmFsX2RhdGFzZXQpCgp2YXJfaW1wb3J0YW5jZV9ib3J1dGE8LUJvcnV0YShDYWxpZGFkIH4gLiAsZGF0YT10cmFpbl9kYXRhc2V0KQoKdmFyX2ltcG9ydGFuY2VfYm9ydXRhPC1hdHRTdGF0cyh2YXJfaW1wb3J0YW5jZV9ib3J1dGEpICU+JSBmaWx0ZXIoZGVjaXNpb249PSdDb25maXJtZWQnKSAlPiUgc2VsZWN0KG1lYW5JbXApICU+JSBhcnJhbmdlKGRlc2MobWVhbkltcCkpICU+JSB0b3BfbihudW1fb2ZfZmVhdCkKdmFyX2ltcG9ydGFuY2VfYm9ydXRhPC12YXJfaW1wb3J0YW5jZV9ib3J1dGEgJT4lIGFkZF9yb3duYW1lcygndmFyaWFibGUnKQp2YXJfaW1wb3J0YW5jZV9ib3J1dGFfZmluYWw8LWFwcGx5KHZhcl9pbXBvcnRhbmNlX2JvcnV0YSR2YXJpYWJsZSAlPiUgdCgpICwyLCBmdW5jdGlvbih4KSBzdHJpbmdyOjpzdHJfcmVwbGFjZV9hbGwoeCwgcGF0dGVybj0iYCIscmVwbGFjZW1lbnQgPSAiIikpICU+JSBhcy5kYXRhLmZyYW1lKCkKbmFtZXModmFyX2ltcG9ydGFuY2VfYm9ydXRhX2ZpbmFsKTwtInZhcmlhYmxlIgp2YXJfaW1wb3J0YW5jZV9ib3J1dGFfZmluYWwKYGBgCgojIyBDQVJUIEZlYXR1cmVzIHNlbGVjdGlvbiBhZC1ob2MgdXNpbmcgaW1wb3J0YW5jZSBtZXRyaWMKYGBge3IgLHdhcm5pbmc9RkFMU0V9CnZhcl9pbXBvcnRhbmNlPC1jKCkKZm9yIChpIGluICAxOjEwMCl7CnZpbmVzX2RhdGFzZXRfYm9vdHN0cmFwPC1yc2FtcGxlOjphbmFseXNpcyhyZXNhbXBsZXMkc3BsaXRzW1tpXV0pCnZhbF9kYXRhc2V0ICA8LSB2aW5lc19kYXRhc2V0X2Jvb3RzdHJhcCAgICU+JSBncm91cF9ieShDYWxpZGFkKSAlPiUgc2FtcGxlX24oMikgJT4lIHVuZ3JvdXAoKQp0cmFpbl9kYXRhc2V0IDwtZHBseXI6OnNldGRpZmYodmluZXNfZGF0YXNldF9udW1lcmljX3JlZHVjZWQsdmFsX2RhdGFzZXQpCgp0cmVlPC1ycGFydDo6cnBhcnQoQ2FsaWRhZH4uLAogICAgICAgICAgICAgICAgICAgZGF0YT10cmFpbl9kYXRhc2V0LAogICAgICAgICAgICAgICAgICAgY29udHJvbCA9IHJwYXJ0LmNvbnRyb2wobWluc3BsaXQgPSAxMCksKQp2YXJfaW1wb3J0YW5jZTwtIGModmFyX2ltcG9ydGFuY2UsdHJlZSR2YXJpYWJsZS5pbXBvcnRhbmNlWzE6bnVtX29mX2ZlYXRdKQojcnBhcnQucGxvdCh0cmVlLHR5cGU9MSwKIyAgICAgICAgICAgZXh0cmE9MTAxLCBib3gucGFsZXR0ZT0iR25CdSIsCiMgICAgICAgICAgIGJyYW5jaC5sdHk9Mywgc2hhZG93LmNvbD0iZ3JheSIsIG5uPVRSVUUKIyAgICAgICAgKQp9CgpgYGAKCgpgYGB7ciAsd2FybmluZz1GQUxTRX0KdmFyX2ltcG9ydGFuY2VfY2FydF9maW5hbDwtZGF0YS5mcmFtZSh2YXJpYWJsZT1uYW1lcyh2YXJfaW1wb3J0YW5jZSksdmFsdWU9dmFyX2ltcG9ydGFuY2UpICU+JSBncm91cF9ieSh2YXJpYWJsZSkgJT4lIHN1bW1hcmlzZShuPW4oKSkgJT4lIGFycmFuZ2UoZGVzYyhuKSkgJT4lIHRvcF9uKDIwKQp2YXJfaW1wb3J0YW5jZV9jYXJ0X2ZpbmFsICU+JSBhcy5kYXRhLmZyYW1lKCkKYGBgCiMjIFJBTkRPTSBGT1JFU1RTIGZlYXR1cmUgaW1wb3J0YW5jZQpgYGB7ciAsd2FybmluZz1GQUxTRX0KdmluZXNfZGF0YXNldF9ib290c3RyYXA8LXJzYW1wbGU6OmFuYWx5c2lzKHJlc2FtcGxlcyRzcGxpdHNbW3NhbXBsZSgxOjEwMCwxKV1dKQp2YWxfZGF0YXNldCAgPC0gdmluZXNfZGF0YXNldF9ib290c3RyYXAgICAlPiUgZ3JvdXBfYnkoQ2FsaWRhZCkgJT4lIHNhbXBsZV9uKDIpICU+JSB1bmdyb3VwKCkKdHJhaW5fZGF0YXNldCA8LWRwbHlyOjpzZXRkaWZmKHZpbmVzX2RhdGFzZXRfbnVtZXJpY19yZWR1Y2VkLHZhbF9kYXRhc2V0KQoKcmZfbmFtZXM8LWFwcGx5KG5hbWVzKHRyYWluX2RhdGFzZXQpICU+JSB0KCkgLDIsIGZ1bmN0aW9uKHgpIHN0cmluZ3I6OnN0cl9yZXBsYWNlX2FsbCh4LCBwYXR0ZXJuPSIgIixyZXBsYWNlbWVudCA9ICJfIikpCnJmX25hbWVzPC1hcHBseShyZl9uYW1lcyAlPiUgdCgpICwyLCBmdW5jdGlvbih4KSBzdHJpbmdyOjpzdHJfcmVwbGFjZV9hbGwoeCwgcGF0dGVybj0iWy8oKSXCsD5dKyIscmVwbGFjZW1lbnQgPSAiXyIpKQoKdHJhaW5fZGF0YXNldF9yZjwtdHJhaW5fZGF0YXNldApuYW1lcyh0cmFpbl9kYXRhc2V0X3JmKTwtcmZfbmFtZXMKCnJmPC1yYW5kb21Gb3Jlc3Q6OnJhbmRvbUZvcmVzdChDYWxpZGFkIH4gLixkYXRhPXRyYWluX2RhdGFzZXRfcmYsaW1wb3J0YW5jZT1UUlVFKQp2YXJfaW1wb3J0YW5jZV9yZl9maW5hbDwtcmFuZG9tRm9yZXN0OjppbXBvcnRhbmNlKHJmKSAlPiUgYXMuZGF0YS5mcmFtZSgpICU+JSBhcnJhbmdlKGRlc2MoTWVhbkRlY3JlYXNlR2luaSkpICU+JSBhZGRfcm93bmFtZXMoJ3ZhcmlhYmxlJykgICU+JSB0b3BfbihudW1fb2ZfZmVhdCkgJT4lIHNlbGVjdCh2YXJpYWJsZSkKdmFyX2ltcG9ydGFuY2VfcmZfZmluYWw8LSBkYXRhLmZyYW1lKHZhcmlhYmxlPW5hbWVzKHRyYWluX2RhdGFzZXRbLHdoaWNoKG5hbWVzKHRyYWluX2RhdGFzZXRfcmYpICVpbiUgdmFyX2ltcG9ydGFuY2VfcmZfZmluYWwkdmFyaWFibGUpXSkgKQp2YXJfaW1wb3J0YW5jZV9yZl9maW5hbApgYGAKIyMgR0xNTkVUIEZlYXR1cmUgU2VsZWN0aW9uCmBgYHtyICx3YXJuaW5nPUZBTFNFfQpsaWJyYXJ5KGdsbW5ldCkKdmluZXNfZGF0YXNldF9ib290c3RyYXA8LXJzYW1wbGU6OmFuYWx5c2lzKHJlc2FtcGxlcyRzcGxpdHNbW3NhbXBsZSgxOjEwMCwxKV1dKQp2YWxfZGF0YXNldCAgPC0gdmluZXNfZGF0YXNldF9ib290c3RyYXAgICAlPiUgZ3JvdXBfYnkoQ2FsaWRhZCkgJT4lIHNhbXBsZV9uKDIpICU+JSB1bmdyb3VwKCkKdHJhaW5fZGF0YXNldCA8LWRwbHlyOjpzZXRkaWZmKHZpbmVzX2RhdGFzZXRfbnVtZXJpY19yZWR1Y2VkLHZhbF9kYXRhc2V0KQpnbG1maXQ8LWN2LmdsbW5ldCh4ID0gdHJhaW5fZGF0YXNldCAlPiUgc2VsZWN0KC1DYWxpZGFkKSAlPiUgYXMubWF0cml4KCksCiAgICAgICB5ID0gdHJhaW5fZGF0YXNldCRDYWxpZGFkICU+JSBhcy5mYWN0b3IoKSwKICAgICAgIGZhbWlseSA9ICJtdWx0aW5vbWlhbCIpCiNjb2VmKGdsbWZpdCxzID0gJ2xhbWJkYS5taW4nKQoKJyVuaSUnPC1OZWdhdGUoJyVpbiUnKQpjPC1jb2VmKGdsbWZpdCxzPSdsYW1iZGEubWluJyxleGFjdD1UUlVFKQoKCnZhcl9pbXBvcnRhbmNlX2dsbW5ldDwtcHVycnI6Om1hcChjLCBmdW5jdGlvbih4KSB7CiAgaW5kcyA8LSB3aGljaCh4ICE9IDApCiAgdmFyaWFibGVzIDwtIHJvdy5uYW1lcyh4KVtpbmRzXQogIHZhcmlhYmxlcyA8LSB2YXJpYWJsZXNbdmFyaWFibGVzICVuaSUgJyhJbnRlcmNlcHQpJ10KfSkgCgojZG8uY2FsbChyYmluZCx2YXJfaW1wb3J0YW5jZV9nbG1uZXQpICU+JSBhcy5kYXRhLmZyYW1lKCkKCgp2YXJfaW1wb3J0YW5jZV9nbG1uZXRfZmluYWw8LXZhcl9pbXBvcnRhbmNlX2dsbW5ldCAlPiUgdW5saXN0KCkgJT4lIHVuaXF1ZSgpICU+JSBhcy5kYXRhLmZyYW1lKCkKbmFtZXModmFyX2ltcG9ydGFuY2VfZ2xtbmV0X2ZpbmFsKTwtInZhcmlhYmxlIgoKdmFyX2ltcG9ydGFuY2VfZ2xtbmV0X2ZpbmFsCmBgYAoKIyMjIFNlbGVjdGVkIHZhcmlhYmxlcyBwZXIgY2xhc3MKYGBge3IgLHdhcm5pbmc9RkFMU0V9CnZhcl9pbXBvcnRhbmNlX2dsbW5ldApgYGAKCiMgRklOQUwgVkFSSUFCTEUgU0VMRUNUSU9OCmBgYHtyICx3YXJuaW5nPUZBTFNFfQpzZWxlY3RlZF92YXJpYWJsZXM8LXZhcl9pbXBvcnRhbmNlX2JvcnV0YV9maW5hbAoKCiNzZWxlY3RlZF92YXJpYWJsZXM8LWRhdGEuZnJhbWUodmFyaWFibGU9YygicGxhbnRhX1Blc29fcmFjaW1vIiwJCQojInV2YV9BY2lkZXogTW9zdG8iLAkJCQojInV2YV9UQU4obWcvYmF5YSkiLAojInBsYW50YV9CYXlhcy9yYWNpbW8iLAojImVjb19BbXBsaXR1ZCBUw6lybWljYSDCsEMiKSkKCgoKYGBgCiMjIyBTZWxlY3RlZCB2YXJpYWJsZXMgcmFuZ2UKYGBge3IgZmlnLmhlaWdodD02LCBmaWcud2lkdGg9MTJ9Cgp2aW5lc19kYXRhc2V0X251bWVyaWNfcmVkdWNlZCAlPiUgc2VsZWN0KHNlbGVjdGVkX3ZhcmlhYmxlcyR2YXJpYWJsZSkgJT4lIHJlc2hhcGUyOjptZWx0KCkgJT4lCiAgZ2dwbG90KCkrCiAgZmFjZXRfd3JhcCh+dmFyaWFibGUsc2NhbGVzID0gJ2ZyZWUnLG5jb2wgPSAxMCkrCiAgZ2VvbV9ib3hwbG90KGFlcyh4PXZhcmlhYmxlLHk9dmFsdWUsZmlsbD12YXJpYWJsZSksY29sb3I9J2dyYXknKSsKICBnZ2Rhcms6OmRhcmtfdGhlbWVfYncoKSsKICAgIHRoZW1lKGF4aXMudGV4dC54ID0gZWxlbWVudF90ZXh0KGFuZ2xlID0gNDUsIGhqdXN0ID0gMSkpKwogIHRoZW1lKGxlZ2VuZC5wb3NpdGlvbj0ibm9uZSIsCiAgICAgICAgYXhpcy50aXRsZS54PWVsZW1lbnRfYmxhbmsoKSwKICAgICAgICBheGlzLnRleHQueD1lbGVtZW50X2JsYW5rKCksCiAgICAgICAgYXhpcy50aWNrcy54PWVsZW1lbnRfYmxhbmsoKSkrCiAgdGhlbWUoIHN0cmlwLnRleHQgPSBlbGVtZW50X3RleHQoc2l6ZSA9IDYpKQogIApgYGAKCgoKIyMgUENBIEVsbGlwc2VzIGZvciBjbGFzc2VzIHdpdGggc2VsZWN0ZWQgIHZhcmlhYmxlcwpgYGB7ciBmaWcuaGVpZ2h0PTEyLCBmaWcud2lkdGg9MTJ9CgpjYWxpZGFkX2luZGV4PC12aW5lc19kYXRhc2V0X251bWVyaWNfcmVkdWNlZCAgJT4lIAogICAgICAgICAgICAgICBzZWxlY3Qoc2VsZWN0ZWRfdmFyaWFibGVzJHZhcmlhYmxlLENhbGlkYWQpCmNhbGlkYWRfaW5kZXg8LSB3aGljaChjb2xuYW1lcyhjYWxpZGFkX2luZGV4KT09IkNhbGlkYWQiKQpsaWJyYXJ5KEZhY3RvTWluZVIpCnJlc19wY2EgPSBQQ0EodmluZXNfZGF0YXNldF9udW1lcmljX3JlZHVjZWQgICU+JSAKICAgICAgICAgICAgICAgc2VsZWN0KHNlbGVjdGVkX3ZhcmlhYmxlcyR2YXJpYWJsZSxDYWxpZGFkKQogICAgICAgICAgICAgICwgc2NhbGUudW5pdD1UUlVFLCAKICAgICAgICAgICAgICBuY3A9NiwgCiAgICAgICAgICAgICAgZ3JhcGg9RiwKICAgICAgICAgICAgICBxdWFsaS5zdXA9Y2FsaWRhZF9pbmRleCwgI2NvbGlkIGZvciBDYWxpZGFkCiAgICAgICAgICAgICAgKQoKcGxvdChyZXNfcGNhLGNob2l4PSJpbmQiLGhhYmlsbGFnZT1jYWxpZGFkX2luZGV4KQojcGFyKG1mY29sPWMoMSwyKSkKcGxvdChyZXNfcGNhLGNob2l4PSJ2YXIiLGhhYmlsbGFnZT0ibm9uZSIsaW52aXNpYmxlID0gImluZCIpICMgcGFyYSBsYXMgdmFyaWFibGVzCnBsb3RlbGxpcHNlcyhyZXNfcGNhLCBpbnZpc2libGU9ImluZCIseGxpbT1jKC02LDYpLHlsaW09YygtNiw2KSkKCgpgYGAKCiMjIENBUlQKYGBge3IgZmlnLmhlaWdodD0xMiwgZmlnLndpZHRoPTEyICx3YXJuaW5nPUZBTFNFfQp2aW5lc19kYXRhc2V0X2Jvb3RzdHJhcDwtcnNhbXBsZTo6YW5hbHlzaXMocmVzYW1wbGVzJHNwbGl0c1tbc2FtcGxlKDE6MTAwLDEpXV0pCnZhbF9kYXRhc2V0ICA8LSB2aW5lc19kYXRhc2V0X2Jvb3RzdHJhcCAgICU+JSBncm91cF9ieShDYWxpZGFkKSAlPiUgc2FtcGxlX24oMikgJT4lIHVuZ3JvdXAoKQp0cmFpbl9kYXRhc2V0IDwtZHBseXI6OnNldGRpZmYodmluZXNfZGF0YXNldF9udW1lcmljX3JlZHVjZWQsdmFsX2RhdGFzZXQpCgp0cmVlPC1ycGFydDo6cnBhcnQoQ2FsaWRhZH4uLAogICAgICAgICAgICAgICAgICAgZGF0YT10cmFpbl9kYXRhc2V0ICU+JSAKICAgICAgICAgICAgICAgICAgICAgc2VsZWN0KHNlbGVjdGVkX3ZhcmlhYmxlcyR2YXJpYWJsZSxDYWxpZGFkKSwKICAgICAgICAgICAgICAgICAgIGNvbnRyb2wgPSBycGFydC5jb250cm9sKG1pbnNwbGl0ID0gNSksKQpycGFydC5wbG90KHRyZWUsdHlwZT0xLAogICAgICAgICAgIGV4dHJhPTEwMSwgYm94LnBhbGV0dGU9IkduQnUiLAogICAgICAgICAgIGJyYW5jaC5sdHk9Mywgc2hhZG93LmNvbD0iZ3JheSIsIG5uPVRSVUUKICAgICAgICApCnByZWRpY3Rpb25zPC1wcmVkaWN0KHRyZWUsdmFsX2RhdGFzZXQsdHlwZSA9ICdjbGFzcycpCmNhcmV0Ojpjb25mdXNpb25NYXRyaXgodmFsX2RhdGFzZXQkQ2FsaWRhZCAlPiUgYXMuZmFjdG9yKCkscHJlZGljdGlvbnMpCiNwcmludGNwKHRyZWUpCgpgYGAKCmBgYHtyICx3YXJuaW5nPUZBTFNFfQp0cmVlJHZhcmlhYmxlLmltcG9ydGFuY2UgJT4lIGFzLmRhdGEuZnJhbWUoKQpgYGAKCiMgTU9ERUwgRVZBTFVBVElPTgojIyBDQVJUICAKIyMjIENyb3NzIFZhbGlkYXRpb24gM3gxMApgYGB7ciAsd2FybmluZz1GQUxTRX0KbGlicmFyeShjYXJldCkKbGlicmFyeShkb01DKQpyZWdpc3RlckRvTUMoY29yZXMgPSA0KQpjdHJsX2Zhc3QgPC0gdHJhaW5Db250cm9sKAogIG1ldGhvZCA9ICJyZXBlYXRlZGN2IiwKICByZXBlYXRzID0gMywKICBudW1iZXIgPSAxMCwKICByZXR1cm5SZXNhbXAgPSAnZmluYWwnLAogIHNhdmVQcmVkaWN0aW9ucyA9ICdmaW5hbCcsCiAgdmVyYm9zZUl0ZXIgPSBGLAogIGNsYXNzUHJvYnMgPSBUUlVFLAogIGFsbG93UGFyYWxsZWwgPSBUCikKCiNyZl9ncmlkIDwtICBleHBhbmQuZ3JpZCgubXRyeSA9IGMoNSkpCmNhcnRGaXQgPC0gY2FyZXQ6OnRyYWluKAogIHggPSB2aW5lc19kYXRhc2V0X251bWVyaWNfcmVkdWNlZCAlPiUgCiAgICAgICAgICAgICAgICAgICAgIHNlbGVjdChzZWxlY3RlZF92YXJpYWJsZXMkdmFyaWFibGUpICU+JSBuYS5vbWl0KCksCiAgeSA9IHZpbmVzX2RhdGFzZXRfbnVtZXJpY19yZWR1Y2VkICU+JSAKICAgICAgICAgICAgICAgICAgICAgc2VsZWN0KENhbGlkYWQpICU+JSB1bmxpc3QoKSAlPiUgYXMuZmFjdG9yKCksCiAgbWV0aG9kID0gInJwYXJ0IiwKICB0dW5lTGVuZ3RoPTEwLAogICN0dW5lR3JpZCA9IHJmX2dyaWQsCiAgI3ZlcmJvc2UgPSAyLAogIHRyQ29udHJvbCA9IGN0cmxfZmFzdCwKICAjbnRyZWUgPSAyMDAKKQoKY2FydEZpdCRyZXN1bHRzICU+JQogIGdncGxvdChhZXMoeCA9IGNwLCB5ID0gQWNjdXJhY3kpKSArCiAgZ2VvbV9wb2ludChjb2xvciA9ICdyZWQnKSArCiAgZ2VvbV9lcnJvcmJhcigKICAgIGFlcyh5bWluID0gQWNjdXJhY3kgLSBBY2N1cmFjeVNELCB5bWF4ID0gQWNjdXJhY3kgKyBBY2N1cmFjeVNEKSwKICAgIHdpZHRoID0gLjAyLAogICAgY29sb3IgPSAneWVsbG93JwogICkgKwogIGdnZGFyazo6ZGFya190aGVtZV9idygpICsKICBsYWJzKHRpdGxlPSJDQVJUOiBNZWFuIGFuZCBTdGFuZGFyZCBkZXZpYXRpb24gYWZ0ZXIgaHlwZXItcGFyYW1ldGVyIChjcCkgdHVuaW5nIikrCiAgdGhlbWUoYXhpcy50ZXh0LnggPSBlbGVtZW50X3RleHQoYW5nbGUgPSA0NSwgaGp1c3QgPSAxKSkKCmNhcnRGaXQKYGBgCiMjIyBMZWFybmluZyBDdXJ2ZXMKYGBge3IgLHdhcm5pbmc9RkFMU0V9CgpjYXJ0X2RhdGEgPC0KICBsZWFybmluZ19jdXJ2ZV9kYXQoZGF0ID0gdmluZXNfZGF0YXNldF9udW1lcmljX3JlZHVjZWQgJT4lIAogICAgICAgICAgICAgICAgICAgICBzZWxlY3Qoc2VsZWN0ZWRfdmFyaWFibGVzJHZhcmlhYmxlLENhbGlkYWQpLAogICAgICAgICAgICAgICAgICAgICBvdXRjb21lID0gIkNhbGlkYWQiLAogICAgICAgICAgICAgICAgICAgICAjdGVzdF9wcm9wID0gMC42LAogICAgICAgICAgICAgICAgICAgICBwcm9wb3J0aW9uID0gc2VxKDAuMywxLDAuMSksCiAgICAgICAgICAgICAgICAgICAgICMjIGB0cmFpbmAgYXJndW1lbnRzMQogICAgICAgICAgICAgICAgICAgICBtZXRob2QgPSAicnBhcnQiLAogICAgICAgICAgICAgICAgICAgICBtZXRyaWMgPSAiQWNjdXJhY3kiLAogICAgICAgICAgICAgICAgICAgICB0ckNvbnRyb2wgPSBjdHJsX2Zhc3QsCiAgICAgICAgICAgICAgICAgICAgIHZlcmJvc2UgPSBGKQoKZ2dwbG90KGNhcnRfZGF0YSwgYWVzKHggPSBUcmFpbmluZ19TaXplLCB5ID0gQWNjdXJhY3ksIGNvbG9yID0gRGF0YSkpICsKICBnZW9tX3Ntb290aChtZXRob2QgPSBsb2Vzcywgc3BhbiA9IC44KSArCiAgZ2dkYXJrOjpkYXJrX3RoZW1lX2J3KCkrCiAgbGFicyh0aXRsZT0iQ0FSVDogTGVhcm5pbmcgY3VydmVzIG9uIHRyYWluaW5nIGFuZCByZXNhbXBsZWQgZGF0YXNldHMiKQoKCmBgYAoKIyMgUmFuZG9tIEZvcmVzdHMgCiMjIyBDcm9zcyBWYWxpZGF0aW9uIDN4MTAKYGBge3IgLHdhcm5pbmc9RkFMU0V9CiNyZl9ncmlkIDwtICBleHBhbmQuZ3JpZCgubXRyeSA9IGMoNSkpCnJmRml0IDwtIGNhcmV0Ojp0cmFpbigKICB4ID0gdmluZXNfZGF0YXNldF9udW1lcmljX3JlZHVjZWQgJT4lIAogICAgICAgICAgICAgICAgICAgICBzZWxlY3Qoc2VsZWN0ZWRfdmFyaWFibGVzJHZhcmlhYmxlKSAlPiUgbmEub21pdCgpLAogIHkgPSB2aW5lc19kYXRhc2V0X251bWVyaWNfcmVkdWNlZCAlPiUgCiAgICAgICAgICAgICAgICAgICAgIHNlbGVjdChDYWxpZGFkKSAlPiUgdW5saXN0KCkgJT4lIGFzLmZhY3RvcigpLAogIG1ldGhvZCA9ICJyZiIsCiAgdHVuZUxlbmd0aD0xMCwKICAjdHVuZUdyaWQgPSByZl9ncmlkLAogICN2ZXJib3NlID0gMiwKICB0ckNvbnRyb2wgPSBjdHJsX2Zhc3QsCiAgI250cmVlID0gMjAwCikKCnJmRml0JHJlc3VsdHMgJT4lCiAgZ2dwbG90KGFlcyh4ID0gbXRyeSwgeSA9IEFjY3VyYWN5KSkgKwogIGdlb21fcG9pbnQoY29sb3IgPSAncmVkJykgKwogIGdlb21fZXJyb3JiYXIoCiAgICBhZXMoeW1pbiA9IEFjY3VyYWN5IC0gQWNjdXJhY3lTRCwgeW1heCA9IEFjY3VyYWN5ICsgQWNjdXJhY3lTRCksCiAgICB3aWR0aCA9IC4wMiwKICAgIGNvbG9yID0gJ3llbGxvdycKICApICsKICBnZ2Rhcms6OmRhcmtfdGhlbWVfYncoKSArCiAgbGFicyh0aXRsZT0iUmFuZG9tIEZvcmVzdDogTWVhbiBhbmQgU3RhbmRhcmQgZGV2aWF0aW9uIGFmdGVyIGh5cGVyLXBhcmFtZXRlciAobXRyeSkgdHVuaW5nIikrCiAgdGhlbWUoYXhpcy50ZXh0LnggPSBlbGVtZW50X3RleHQoYW5nbGUgPSA0NSwgaGp1c3QgPSAxKSkKCnJmRml0CmBgYAojIyMgTGVhcm5pbmcgQ3VydmVzIApgYGB7ciAsd2FybmluZz1GQUxTRX0Kc2V0LnNlZWQoMjEwNTIwMjUpCnJmX2RhdGEgPC0KICBsZWFybmluZ19jdXJ2ZV9kYXQoZGF0ID0gdmluZXNfZGF0YXNldF9udW1lcmljX3JlZHVjZWQgJT4lIAogICAgICAgICAgICAgICAgICAgICBzZWxlY3Qoc2VsZWN0ZWRfdmFyaWFibGVzJHZhcmlhYmxlLENhbGlkYWQpLAogICAgICAgICAgICAgICAgICAgICBvdXRjb21lID0gIkNhbGlkYWQiLAogICAgICAgICAgICAgICAgICAgICAjdGVzdF9wcm9wID0gMC42LAogICAgICAgICAgICAgICAgICAgICBwcm9wb3J0aW9uID0gc2VxKDAuMywxLDAuMSksCiAgICAgICAgICAgICAgICAgICAgICMjIGB0cmFpbmAgYXJndW1lbnRzMQogICAgICAgICAgICAgICAgICAgICBtZXRob2QgPSAicmFuZ2VyIiwKICAgICAgICAgICAgICAgICAgICAgbWV0cmljID0gIkFjY3VyYWN5IiwKICAgICAgICAgICAgICAgICAgICAgdHJDb250cm9sID0gY3RybF9mYXN0LAogICAgICAgICAgICAgICAgICAgICB2ZXJib3NlID0gRikKCmdncGxvdChyZl9kYXRhLCBhZXMoeCA9IFRyYWluaW5nX1NpemUsIHkgPSBBY2N1cmFjeSwgY29sb3IgPSBEYXRhKSkgKwogIGdlb21fc21vb3RoKG1ldGhvZCA9IGxvZXNzLCBzcGFuID0gLjgpICsKICBnZ2Rhcms6OmRhcmtfdGhlbWVfYncoKSsKICBsYWJzKHRpdGxlPSJSYW5kb20gRm9yZXN0czogTGVhcm5pbmcgY3VydmVzIG9uIHRyYWluaW5nIGFuZCByZXNhbXBsZWQgZGF0YXNldHMiKQpgYGAKCiMjIyBQcmVkaWN0aW9ucwoKYGBge3IgLHdhcm5pbmc9RkFMU0V9CnRlc3RfZGF0YXNldF9udW1lcmljPC10ZXN0X2RhdGFzZXQgJT4lIHNlbGVjdF9pZih+Y2xhc3MoLikgPT0gJ251bWVyaWMnKQp0ZXN0X2RhdGFzZXRfbnVtZXJpY19pbXB1dGVkIDwtIGtOTih0ZXN0X2RhdGFzZXRfbnVtZXJpYykKdGVzdF9kYXRhc2V0X251bWVyaWM8LXRlc3RfZGF0YXNldF9udW1lcmljX2ltcHV0ZWQgJT4lIHNlbGVjdCgtZW5kc193aXRoKCJfaW1wIikpCnByZWRzPC1wcmVkaWN0KHJmRml0LHRlc3RfZGF0YXNldF9udW1lcmljICU+JSAKICAgICAgICAgICAgICAgICAgICAgc2VsZWN0KHNlbGVjdGVkX3ZhcmlhYmxlcyR2YXJpYWJsZSkpCgpjYXJldDo6Y29uZnVzaW9uTWF0cml4KGRhdGEgPSBhcy5mYWN0b3IocHJlZHMpLCAKICAgICAgICAgICAgICAgICAgICAgICByZWZlcmVuY2UgPSBhcy5mYWN0b3IodGVzdF9kYXRhc2V0JENhbGlkYWQpCiAgICAgICAgICAgICAgICAgICAgICAgKQpgYGAKCgojIyBHTE1ORVQKIyMjIENyb3NzIFZhbGlkYXRpb24gM3gxMApgYGB7ciBldmFsPUZBTFNFLCBmaWcuaGVpZ2h0PTQsIGZpZy53aWR0aD0xMiwgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRSwgaW5jbHVkZT1GQUxTRX0KI3JmX2dyaWQgPC0gIGV4cGFuZC5ncmlkKC5tdHJ5ID0gYyg1KSkKZ2xtRml0IDwtIGNhcmV0Ojp0cmFpbigKICB4ID0gdmluZXNfZGF0YXNldF9udW1lcmljX3JlZHVjZWQgJT4lIAogICAgICAgICAgICAgICAgICAgICBzZWxlY3Qoc2VsZWN0ZWRfdmFyaWFibGVzJHZhcmlhYmxlKSAlPiUgbmEub21pdCgpLAogIHkgPSB2aW5lc19kYXRhc2V0X251bWVyaWNfcmVkdWNlZCAlPiUgCiAgICAgICAgICAgICAgICAgICAgIHNlbGVjdChDYWxpZGFkKSAlPiUgdW5saXN0KCkgJT4lIGFzLmZhY3RvcigpLAogIG1ldGhvZCA9ICJnbG1uZXQiLAogIHR1bmVMZW5ndGg9MTAsCiAgI3R1bmVHcmlkID0gcmZfZ3JpZCwKICAjdmVyYm9zZSA9IDIsCiAgdHJDb250cm9sID0gY3RybF9mYXN0LAogICNudHJlZSA9IDIwMAopCgpnbG1fcmVzdWx0czwtZ2xtRml0JHJlc3VsdHMgJT4lIG11dGF0ZV9hdCgyLCByb3VuZCwgNCkgJT4lIGFycmFuZ2UoZGVzYyhBY2N1cmFjeSkpICU+JXRpZHlyOjp1bml0ZShwYXJhbWV0ZXJzLGFscGhhOmxhbWJkYSkgCmdsbV9yZXN1bHRzJHBhcmFtZXRlcnM8LWZhY3RvcihnbG1fcmVzdWx0cyRwYXJhbWV0ZXJzLGxldmVscz11bmlxdWUoZ2xtX3Jlc3VsdHMkcGFyYW1ldGVycykpCmdsbV9yZXN1bHRzICU+JSBnZ3Bsb3QoYWVzKHggPSBwYXJhbWV0ZXJzLCB5ID0gQWNjdXJhY3kpKSArCiAgZ2VvbV9wb2ludChjb2xvciA9ICdyZWQnKSArCiAgZ2VvbV9lcnJvcmJhcigKICAgIGFlcyh5bWluID0gQWNjdXJhY3kgLSBBY2N1cmFjeVNELCB5bWF4ID0gQWNjdXJhY3kgKyBBY2N1cmFjeVNEKSwKICAgIHdpZHRoID0gMC4wMiwKICAgIGNvbG9yID0gJ3llbGxvdycKICApICsKICBnZ2Rhcms6OmRhcmtfdGhlbWVfYncoKSArCiAgbGFicyh0aXRsZT0iRWxhc3RpYyBOZXQ6IE1lYW4gYW5kIFN0YW5kYXJkIGRldmlhdGlvbiBhZnRlciBoeXBlci1wYXJhbWV0ZXIgKG10cnkpIHR1bmluZyIpKwogIHRoZW1lKGF4aXMudGV4dC54ID0gZWxlbWVudF90ZXh0KGFuZ2xlID0gNDUsIGhqdXN0ID0gMSkpKwogIHRoZW1lKGF4aXMudGV4dD1lbGVtZW50X3RleHQoc2l6ZT02KSkKCmdsbUZpdApgYGAKCgojIyMgTGVhcm5pbmcgQ3VydmVzCmBgYHtyIGV2YWw9RkFMU0UsIG1lc3NhZ2U9VFJVRSwgd2FybmluZz1GQUxTRSwgaW5jbHVkZT1GQUxTRX0Kc2V0LnNlZWQoMjEwNTIwMjYpCiNzZXQuc2VlZCgyMTA1MjAyNSkKZ2xtbmV0X2RhdGEgPC0KICBsZWFybmluZ19jdXJ2ZV9kYXQoZGF0ID0gdmluZXNfZGF0YXNldF9udW1lcmljX3JlZHVjZWQgJT4lIAogICAgICAgICAgICAgICAgICAgICBzZWxlY3Qoc2VsZWN0ZWRfdmFyaWFibGVzJHZhcmlhYmxlLENhbGlkYWQpLAogICAgICAgICAgICAgICAgICAgICBvdXRjb21lID0gIkNhbGlkYWQiLAogICAgICAgICAgICAgICAgICAgICAjdGVzdF9wcm9wID0gMC42LAogICAgICAgICAgICAgICAgICAgICBwcm9wb3J0aW9uID0gc2VxKDAuMywxLDAuMSksCiAgICAgICAgICAgICAgICAgICAgICMjIGB0cmFpbmAgYXJndW1lbnRzMQogICAgICAgICAgICAgICAgICAgICBtZXRob2QgPSAiZ2xtbmV0IiwKICAgICAgICAgICAgICAgICAgICAgbWV0cmljID0gIkFjY3VyYWN5IiwKICAgICAgICAgICAgICAgICAgICAgdHJDb250cm9sID0gY3RybF9mYXN0LAogICAgICAgICAgICAgICAgICAgICB2ZXJib3NlID0gRikKCmdncGxvdChnbG1uZXRfZGF0YSwgYWVzKHggPSBUcmFpbmluZ19TaXplLCB5ID0gQWNjdXJhY3ksIGNvbG9yID0gRGF0YSkpICsKICBnZW9tX3Ntb290aChtZXRob2QgPSBsb2Vzcywgc3BhbiA9IC44KSArCiAgZ2dkYXJrOjpkYXJrX3RoZW1lX2J3KCkrCiAgbGFicyh0aXRsZT0iRWxhc3RpYyBOZXQ6IExlYXJuaW5nIGN1cnZlcyBvbiB0cmFpbmluZyBhbmQgcmVzYW1wbGVkIGRhdGFzZXRzIikKYGBgCg==

P. Exploratory Analysis: Vines 2021 5F

PRELIMINARIES

EXPLORATION

Loading Dataset

Removing unnecesary data

Removing columns with too many missing values

Train and Test split:

Basic Distribution Information

Categorical Variables

Numerical Variables

Class Distribution

ANALISYS NUMERICAL VARIABLES

Dealing Missing Data

Missing values imputation

Correlation Matrix

Checking Correlation with Class

Matrix considering all variables

PCA Elipses for clases

List of highly correlated variables

Correlation Matrix with highly correlated removed

Convert class to numeric

FEATURE SELECTION

Bootstrap resampling

BORUTA for feature selection

CART Features selection ad-hoc using importance metric

RANDOM FORESTS feature importance

GLMNET Feature Selection

Selected variables per class

FINAL VARIABLE SELECTION

Selected variables range

PCA Ellipses for classes with selected variables

CART

MODEL EVALUATION

CART

Cross Validation 3x10

Learning Curves

Random Forests

Cross Validation 3x10

Learning Curves

Predictions

GLMNET

Cross Validation 3x10

Learning Curves