Análisis Predictivos de Rotación de Personal

Prólogo

Cómo esta clase tiene más contenido teórico, recomendamos también ver la presentación que está en el archivo Clase_3_Análisis_Predictivos.html.

Además, como siempre, recuerden que tienen el canal #auxilio en Slack para hacer todas las consultas que necesitan.

El ejemplo de hoy, lo vamos a usar reciclando un caso de estudio que desarrollamos en Data 4HR en Python, y lo vamos a replicar en R. El caso original lo pueden ver en este link y este es el repositorio original (aprovechen para ver las diferencias en las sintaxis entre R y Python si pueden).

Introducción

Existen varios tipos de análisis predictivos. En particular, hoy vamos a utilizar un modelo llamado de clasificación porque lo que queremos predecir es si una persona va a pertenecer a una clase (renuncia) o a otra clase (no renuncia).

Este tipo de algoritmo, nos va a brindar como resultado, una probabilidad, es decir un valor que nos va a indicar con qué grado de certeza (o menor margen de incertidumbre) podemos afirmar que algo va a pasar o no.

¿Qué es un análisis predictivo?

El objetivo de los análisis predictivos es detectar patrones, en nuestro caso, patrones en los comportamientos, en las características, y en los datos de los empleados para poder detectar quién tiene más probabilidad de renunciar por ejemplo.

Hoy, sin ningún análisis hecho, lo que sabemos de cada empleado es que tiene tanta probabilidad de renunciar, como de no renunciar. O sea que la cosa esta “fifty-fifty”, o como para ir nerdeando la cosa, con una probabilidad de 0.5.

Lo que buscamos con un análisis predictivo es mejorar esa probabilidad para reducir la incertidumbre sobre lo que puede o no ocurrir en el futuro.

Hacer un análisis no implica acertar el 100% de los casos, sino que es un intento de tener una idea de quiénes tienen más probabilidad de irse. ¿Esto quiere decir que alguien que tiene alta probabilidad de renunciar y no lo hace (o viceversa) el modelo está mal?

No. Al menos no necesariamente. ¿Qué es la probabilidad?

Probabilidad

La probabilidad es toda una rama de la estadística en sí misma. Se enfoca en intentar descubrir la certeza (o incertidumbre) de que ocurran las cosas. El resultado de una probabilidad siempre va a dar entre 0 y 1.

Un resultado igual o cercano a 0 implica un evento improbable.
Un resultado igual o cercano a 1 implica una alta probabilidad.

¿Qué pasa si ocurre algo improbable, o no ocurre algo con alta probabilidad? Es parte del margen de error inherente a la estadística, y por eso se asume que va a haber errores. El punto es, si repetimos el experimento 100 veces, ¿cuánto acierta el modelo, y con qué precisión?

Regresión Logística

Hay varias formas de hacer análisis predictivos, y siempre vamos a tener que tomar decisiones entre modelos computacionalmente eficientes y simples, o computacionalmente más costosos y precisos; o entre modelos más transparentes en el sentido que podemos explicar la relación entre las variables y la predicción, o entre modelos que son una caja negra en la que sabemos el resultado pero no podemos explicar el por qué.

En este sentido, la regresión logística es un algoritmo computacionalmente eficiente, simple, y transparente para explicar la relación entre la probabilidad y la influencia de las variables.

¿Cómo se hace un análisis predictivo?

Para hacer análisis predictivos vamos a trabajar con datos del pasado. Tradicionalmente se usa una el 70% de los datos para entrenar el modelo, y el 30% de los datos, se los usa para testear el modelo. A estos datasets los vamos a llamar training o de entrenamiento y dataset de testing o de validación respectivamente.

La selección de los datos se hace al azar. Así que hay que asegurarse que la proporción de renuncias sea similar en ambos datasets.

Paquetes

Vamos a utilizar los siguientes paquetes:

install.packages("caret")  # Es EL paquete para correr modelos
install.packages("car")    # Companion to Applied Regression
install.packages("pROC")   # Para realizar Curvas ROC
install.packages("funModeling")  # Análisis Exploratorios y mucho más

Ahora activemos todos los paquetes que vamos a necesitar.

library(caret)
library(car)
library(pROC)
library(funModeling)
library(tidyverse)

La fuente de datos que vamos a utilizar lo podemos cargar directamente desde el repositorio de GitHub del caso de estudio:

# Leer los datos de GitHub
datos <- read_csv("https://raw.githubusercontent.com/mlambolla/Analytics_HR_Attrition/master/HR_comma_sep.csv")

# Ver el dataset con glimpse()
glimpse(datos)

## Rows: 14,999
## Columns: 10
## $ satisfaction_level    <dbl> 0.38, 0.80, 0.11, 0.72, 0.37, 0.41, 0.10, 0.92, …
## $ last_evaluation       <dbl> 0.53, 0.86, 0.88, 0.87, 0.52, 0.50, 0.77, 0.85, …
## $ number_project        <dbl> 2, 5, 7, 5, 2, 2, 6, 5, 5, 2, 2, 6, 4, 2, 2, 2, …
## $ average_montly_hours  <dbl> 157, 262, 272, 223, 159, 153, 247, 259, 224, 142…
## $ time_spend_company    <dbl> 3, 6, 4, 5, 3, 3, 4, 5, 5, 3, 3, 4, 5, 3, 3, 3, …
## $ Work_accident         <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ left                  <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, …
## $ promotion_last_5years <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ sales                 <chr> "sales", "sales", "sales", "sales", "sales", "sa…
## $ salary                <chr> "low", "medium", "medium", "low", "low", "low", …

Un paso que necesitamos hacer es convertir una variable character a numeric. Además eliminamos la variable sales (que en realidad es la variable de sectores, pero tiene muchos valores posibles).

# Elminamos la variable 'sales' y cambiemos los valores de 'salary' a numéricos.
datos<- datos %>% 
  select(-sales) %>%
  mutate(salary = as.numeric(case_when(
    salary == 'low' ~ 0,
    salary == 'medium' ~ 1,
    salary == 'high' ~ 2
  )))

Pasos de un análisis predictivo

En los ciclos de vida de los proyectos de data mining en general, está establecida como metodología, la metodología CRISP-DM (Cross Industry Standard Process for Data Mining). En donde:

Entre la etapa de Modelado y la Puesta en producción (deployment) hay una etapa de evaluación. Mientras diseñamos el modelo, trabajamos con datos históricos, en la etapa de Evaluación vamos probando la precisión del modelo con datos nuevos, y si todo va bien, se poné en producción.

Los pasos básicos de un análisis predictivo son:

Definir la variable target
Separar el dataset en training y testing
Explorar los datos
Controlar los sesgos de los datos
Entrenar el modelo
Controlar los resultados
Ajustar y repetir

Por un tema de tiempos, nos vamos a saltear el paso 3. Si necesitan ayuda para realizar el análisis exploratorio de datos por su cuenta, pueden revisar la sesión de R4HR Club de R para RRHH o el capítulo 7 de R para Ciencia de Datos.

Desarrollo del análisis predictivo

1. Definir la variable `target`

Usualmente, en los modelos predictivos, tenemos una variable objetivo a la que llamaremos target.

Por lo general usamos o una variable numérica o lógica (TRUE o FALSE) codificada con 1 o 0. Es una práctica común usar el número 1 para lo que nos interesa saber, en nuestro caso, si la persona de nuestra base de datos, se fue de la compañía.

Veamos el data frame con la función View().

# Ver la tabla de datos con View() 
View(datos)

En nuestro caso, la variable target es la columna left. Veamos en los datos, cuantos empleados se fueron, y cuántos aún permanecen en la compañía.

# Contar cantidad de empleados que se van y que se quedan
datos %>% # Ctrl + Shift + M
  count(left)

## # A tibble: 2 × 2
##    left     n
##   <dbl> <int>
## 1     0 11428
## 2     1  3571

# Qué porcentaje de empleados se fueron?
datos %>% # Ctrl + Shift + M
  count(left) %>% 
  mutate(prop = n/sum(n))

## # A tibble: 2 × 3
##    left     n  prop
##   <dbl> <int> <dbl>
## 1     0 11428 0.762
## 2     1  3571 0.238

2. Dividir en training y testing

El paso siguiente es separar el data frame en dos partes, una que llamaremos training, y otra que llamaremos testing.

El data frame de training o entrenamiento sirve para entrenar el modelo, es decir que con esta porción de los datos vamos a crear la fórmula que luego utilizaremos para estimar las probabilidades de nuestro modelo predictivo.

El data frame de testing o validación nos sirve para verificar que la fórmula que creamos en el paso anterior sea efectiva con datos nuevos. Es una forma de simular que son nuevos datos y que nos permite evaluar qué tan efectiva es la predicción.

El método para dividir el dataset en dos es similar al que haríamos con un listado final de invitados a una boda. De todas las personas posibles sólo “invitamos” a un grupo.

De la misma manera vamos a crear un índice, el cual nos va a indicar las filas del data frame original que formarán el data frame de training y el de testing.

La selección de los datos se hace aleatoriamente, o sea que si no hacemos nada, cada vez que hagamos la selección R elegirá filas diferentes. Con lo cual, el primer paso es definir una semilla.

# Definir una semilla con set.seed()
set.seed(42)

Luego vamos a crear nuestro índice de filas para el dataset de entrenamiento (nuestra lista de invitados) con la función createDataPartition() del paquete caret cuyos parámetros son:

y: que indica nuestra variable target con el formato data_frame$variable_target.
p: que indica la proporción de datos que queremos para el índice.
list = FALSE: Con eso le indicamos a la función que no queremos que almacene el resultado como una lista.

# Usar la función createDataPartition() y guardar los resultados en un objeto llamado indice
indice <- createDataPartition(y = datos$left,
                              p = 0.7,
                              list = FALSE)

# Ver el contenido de las primeras 20 filas 
head(indice, 20)

##       Resample1
##  [1,]         1
##  [2,]         2
##  [3,]         3
##  [4,]         4
##  [5,]         6
##  [6,]         7
##  [7,]         8
##  [8,]         9
##  [9,]        13
## [10,]        14
## [11,]        15
## [12,]        16
## [13,]        18
## [14,]        19
## [15,]        22
## [16,]        24
## [17,]        25
## [18,]        26
## [19,]        27
## [20,]        29

Ahora, con ese índice vamos a crear los dos data frames que necesitamos. Vamos a usar la lógica nombre_dataframe[filas, columnas], indicando en este caso que para el data frame de entrenamiento vamos a seleccionar las filas que estén en el indice.

Para crear el data frame de validación, vamos a poner todas las filas que no estén en el índice.

El primer data frame lo almacenaremos en un objeto llamado df_train y el data frame de validación lo guardaremos en un objeto llamado df_test.

#Armo el dataframe de training data_frame[fila, columna]
df_train <- datos[indice, ]

# Con el signo - (menos), creamos el dataset de testing, con todas las filas 'que no estén en indice'
df_test <- datos[-indice, ]

Revisemos ambos data frames con la función glimpse().

# Revisar el data frame df_train
glimpse(df_train)

## Rows: 10,500
## Columns: 9
## $ satisfaction_level    <dbl> 0.38, 0.80, 0.11, 0.72, 0.41, 0.10, 0.92, 0.89, …
## $ last_evaluation       <dbl> 0.53, 0.86, 0.88, 0.87, 0.50, 0.77, 0.85, 1.00, …
## $ number_project        <dbl> 2, 5, 7, 5, 2, 6, 5, 5, 4, 2, 2, 2, 4, 2, 2, 2, …
## $ average_montly_hours  <dbl> 157, 262, 272, 223, 153, 247, 259, 224, 234, 148…
## $ time_spend_company    <dbl> 3, 6, 4, 5, 3, 4, 5, 5, 5, 3, 3, 3, 6, 3, 3, 3, …
## $ Work_accident         <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, …
## $ left                  <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, …
## $ promotion_last_5years <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, …
## $ salary                <dbl> 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …

# Revisar el data frame df_test()
glimpse(df_test)

## Rows: 4,499
## Columns: 9
## $ satisfaction_level    <dbl> 0.37, 0.42, 0.45, 0.11, 0.45, 0.76, 0.11, 0.09, …
## $ last_evaluation       <dbl> 0.52, 0.53, 0.54, 0.81, 0.47, 0.89, 0.83, 0.95, …
## $ number_project        <dbl> 2, 2, 2, 6, 2, 5, 6, 6, 2, 2, 6, 2, 6, 5, 2, 6, …
## $ average_montly_hours  <dbl> 159, 142, 135, 305, 160, 262, 282, 304, 135, 132…
## $ time_spend_company    <dbl> 3, 3, 3, 4, 3, 5, 4, 4, 3, 3, 4, 3, 4, 5, 3, 4, …
## $ Work_accident         <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ left                  <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, …
## $ promotion_last_5years <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ salary                <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …

3. Explorar los datos

Recuerden que por un tema de tiempos omitiremos este paso. Pueden ver los pasos desarrollados en el caso de estudio en el repositorio de GitHub.

4. Controlar los sesgos

En este paso lo que vamos a hacer es verificar que la proporción de casos en ambos dataframes sea pareja. Esto nos permitirá asumir que cuando hagamos la validación de los datos tengamos una cantidad de casos relevante para analizar.

Dado que la variable left se compone de 0 y de 1 podemos calcular fácilmente que el porcentaje en ambos data frames sea similar calculando el promedio de la columna left en ambos data frames.

# Calcular el promedio de la columna left en df_train
mean(df_train$left)

## [1] 0.2395238

# Calcular el promedio de la columna left en df_test
mean(df_test$left)

## [1] 0.2347188

Como las proporciones son similares podemos avanzar.

5. Entrenar el modelo

El primer paso es generar un modelo predictivo con los datos de training.left es la variable objetivo, y los símbolos ~ . indican contra qué variables vamos a entrenar el modelo. Esto implica que el resto del dataset son las variables explicatorias.

# Calculamos un modelo de entrenamiento, sacando department de los cálculos.
modelo <- glm(left ~. , 
              family = "binomial",
              data = df_train) 

# Veamos un resumen del resultado
summary(modelo)

## 
## Call:
## glm(formula = left ~ ., family = "binomial", data = df_train)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.1472  -0.6627  -0.4160  -0.1336   3.0646  
## 
## Coefficients:
##                         Estimate Std. Error z value Pr(>|z|)    
## (Intercept)            0.5069962  0.1418949   3.573 0.000353 ***
## satisfaction_level    -4.1310403  0.1165079 -35.457  < 2e-16 ***
## last_evaluation        0.6773515  0.1767800   3.832 0.000127 ***
## number_project        -0.3027174  0.0251443 -12.039  < 2e-16 ***
## average_montly_hours   0.0044670  0.0006097   7.327 2.35e-13 ***
## time_spend_company     0.2547823  0.0180718  14.098  < 2e-16 ***
## Work_accident         -1.4787005  0.1051336 -14.065  < 2e-16 ***
## promotion_last_5years -1.2253470  0.2775988  -4.414 1.01e-05 ***
## salary                -0.6866613  0.0445736 -15.405  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 11561.1  on 10499  degrees of freedom
## Residual deviance:  9134.7  on 10491  degrees of freedom
## AIC: 9152.7
## 
## Number of Fisher Scoring iterations: 5

Un control que podemos hacer en este punto es analizar los resultados para analizar que no haya multicolinealidad.

La multicolinealidad es un efecto no deseado entre los datos, porque corremos el riesgo de encontrar relaciones sospechosamente fuertes entre dos o más variables cuando en realidad son la misma cosa expresada de diferente manera, como por ejemplo la antigüedad de una persona expresada en años y su bono de antigüeadd, o cuando una variable surge del cálculo de otra, como el Índice de Masa Muscular y el peso.

Entonces, lo que buscamos es que la relación entre las variables sea lo más sana posible. Una forma de detectar si hay multcolinealidad o no es calculando el VIF (Variance Inflation Factor) con la función vif() del paquete car.

# Usar la función vif() en df_train
vif(modelo)

##    satisfaction_level       last_evaluation        number_project 
##              1.153786              1.429789              1.769583 
##  average_montly_hours    time_spend_company         Work_accident 
##              1.519144              1.098879              1.009792 
## promotion_last_5years                salary 
##              1.010921              1.025109

¿Cómo interpretamos los resultados? De la siguiente manera:

VIF	Interpretación
1	No hay multicolinealidad
Entre 1 y 5	Multicolinealidad moderada
5 o más	Alta Multicolinealidad

Calculando las probabilidades

Ahora lo que tenemos es cuáles son las variables significativas para el modelo vamos a convertir los resultados en probabilidades. Así que ahora vamos a realizar tres pasos:

Estimar las probabilidades
Asignar las probabilidades a una columna que llamaremos score.
Crear una nueva columna (prediccion) donde si score es mayor que 0.5 escriba un 1, y de lo contrario, 0.

Realicemos el primer paso.

# Cacular las probabilidades de df_train
pred_train <- predict(modelo,              # Fórmulas del modelo
                      newdata = df_train,  # Fuente de datos 
                      type = "response")   

# Calcular las probabilidades de df_test
pred_test <- predict(modelo, newdata = df_test, type = "response")

Lo que obtenemos en el paso anterior es es un gran listado de probabilidades (asegurarse que los resultados estén entre 0 y 1). Veamos los primeros 20 resultados de pred_test.

# Ver los primeros 20 resultados
pred_test[1:20]

##         1         2         3         4         5         6         7         8 
## 0.5498075 0.4810531 0.4441712 0.7625090 0.4600874 0.2499117 0.7459811 0.7924024 
##         9        10        11        12        13        14        15        16 
## 0.4871114 0.5061066 0.7448388 0.4513688 0.7450726 0.1781397 0.4595508 0.7638225 
##        17        18        19        20 
## 0.4676785 0.4560720 0.5168010 0.6452583

# Controlar que todos los resultados estén entre 0 y 1.
summary(pred_test)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 0.00223 0.07697 0.17133 0.24082 0.34962 0.88983

Ahora tenemos que asignar esos resultados que son un vector a una columna que llamaremos score. Una forma de hacerlo es la siguiente:

# Crear la columna score en df_train
df_train$score <- pred_train

# Repetir con df_test
df_test$score <- pred_test

# Ver el contenido de df_test con glimpse()
glimpse(df_test)

## Rows: 4,499
## Columns: 10
## $ satisfaction_level    <dbl> 0.37, 0.42, 0.45, 0.11, 0.45, 0.76, 0.11, 0.09, …
## $ last_evaluation       <dbl> 0.52, 0.53, 0.54, 0.81, 0.47, 0.89, 0.83, 0.95, …
## $ number_project        <dbl> 2, 2, 2, 6, 2, 5, 6, 6, 2, 2, 6, 2, 6, 5, 2, 6, …
## $ average_montly_hours  <dbl> 159, 142, 135, 305, 160, 262, 282, 304, 135, 132…
## $ time_spend_company    <dbl> 3, 3, 3, 4, 3, 5, 4, 4, 3, 3, 4, 3, 4, 5, 3, 4, …
## $ Work_accident         <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ left                  <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, …
## $ promotion_last_5years <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ salary                <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, …
## $ score                 <dbl> 0.5498075, 0.4810531, 0.4441712, 0.7625090, 0.46…

Por último para simplificar los resultados vamos a crear una columna que se llamará prediccion en la cual pondremos un 1 si el valor de la celda de la columna score es mayor a 0.5, y un 0 cuando el valor de score sea menor a 0.5.

# Crear una columna llamada prediccion en df_train
df_train <- df_train %>% 
  mutate(prediccion = if_else(score > 0.5, 1, 0))

# Repetir para df_test

df_test <- df_test %>% 
  mutate(prediccion = if_else(score > 0.5, 1, 0))

# Usemos la función View() con df_test
View(df_test)

Ahora podemos controlar nuestras predicciones contra la variable target original y revisar qué tan bien nos fue.

6. Controlar los resultados

Para controlar los resultados vamos a hacer tres cosas. Calcular la Matriz de Confusión, la Curva ROC y por último el gain y el lift.

Matriz de confusión

La matriz de confusión es una tabla de doble entrada en donde lo que hacemos es contrastar los aciertos del modelo, contra los fallos.

Matriz de Confusión

En principio nos vamos a enfocar únicamente en la diagonal. Los aciertos positivos y los aciertos negativos, lo que nos va a dar el Accuracy del modelo. Todo lo que vemos en los márgenes de la matriz son distintas métricas que podemos calcular con esta tabla.

El Accuracy lo que nos indica es el total de aciertos (verdadores y negativos, TP y TN respectivamente) sobre el total de casos. Ese porcentaje de aciertos es una de las cosas que nos interesa analizar.

Para crear una matriz de confusión tenemos que crear una tabla de doble entrada, en donde pongamos por un lado los valores de la columna left y por otro lado los valores de la columna prediccion y veamos las coincidencias.

# Crear una matriz con los datos de df_train
matrix_conf_train <- table(df_train$left, df_train$prediccion)

# Repetir con df_test
matrix_conf_test <- table(df_test$left, df_test$prediccion)

# Ver la tabla 
matrix_conf_test

##    
##        0    1
##   0 3190  253
##   1  666  390

El paquete caret tiene una función que nos brinda toda la información que necesitamos, y es la función confusionMatrix().

# Ver las métricas de matrix_conf_train
confusionMatrix(matrix_conf_train)

## Confusion Matrix and Statistics
## 
##    
##        0    1
##   0 7402  583
##   1 1609  906
##                                          
##                Accuracy : 0.7912         
##                  95% CI : (0.7833, 0.799)
##     No Information Rate : 0.8582         
##     P-Value [Acc > NIR] : 1              
##                                          
##                   Kappa : 0.3339         
##                                          
##  Mcnemar's Test P-Value : <2e-16         
##                                          
##             Sensitivity : 0.8214         
##             Specificity : 0.6085         
##          Pos Pred Value : 0.9270         
##          Neg Pred Value : 0.3602         
##              Prevalence : 0.8582         
##          Detection Rate : 0.7050         
##    Detection Prevalence : 0.7605         
##       Balanced Accuracy : 0.7150         
##                                          
##        'Positive' Class : 0              
##

Luego repetimos este paso con matrix_conf_test.

# Ver las métricas para matrix_conf_test
confusionMatrix(matrix_conf_test)

## Confusion Matrix and Statistics
## 
##    
##        0    1
##   0 3190  253
##   1  666  390
##                                           
##                Accuracy : 0.7957          
##                  95% CI : (0.7837, 0.8074)
##     No Information Rate : 0.8571          
##     P-Value [Acc > NIR] : 1               
##                                           
##                   Kappa : 0.3422          
##                                           
##  Mcnemar's Test P-Value : <2e-16          
##                                           
##             Sensitivity : 0.8273          
##             Specificity : 0.6065          
##          Pos Pred Value : 0.9265          
##          Neg Pred Value : 0.3693          
##              Prevalence : 0.8571          
##          Detection Rate : 0.7090          
##    Detection Prevalence : 0.7653          
##       Balanced Accuracy : 0.7169          
##                                           
##        'Positive' Class : 0               
##

La razón por la que hacemos este paso para ambos data frames es para tener un control de la calidad del modelo. Lo esperable es que el accuracy del modelo de entrenamiento sea un poco más alto que en el data frame de validación porque el modelo se construyó sobre esos datos.

Si hubieran diferencias significativas, como una amplia diferencia entre ambas accuracies, o que los resultados sean mucho mejores en testing que en training eso puede reflejar que el modelo tenga problemas como el overfitting o que necesitemos otro algoritmo para obtener mejores resultados.

Ahora probaremos otro control sobre los resultados que es la Curva ROC.

Curva ROC

La Curva ROC, es una forma visual de calcular el AUC (Area Under the Curve, el área bajo la curva). Internamente lo que hace este gráfico es ordenar las probabilidades de mayor a menor, y a medida que tenemos un positivo verdadero (el empleado se fue y nosotros predecimos que se iba) la curva se mueve hacia arriba. Con cada falso positivo, la curva se va moviendo a la derecha.

Para esto vamos a usar la librería pROC.

Video: cómo se construye la curva ROC: https://youtu.be/OjWew7W4KnY.

Para simplificar vamos a realizar este proceso únicamente con los datos de testing:

# Calcular la curva ROC
pROC_obj <- roc(df_test$left, df_test$score,
                smoothed = FALSE,
                # argumentos del intervalo de confianza
                ci=TRUE, ci.alpha=0.9, stratified=FALSE,
                # argumentos del gráfico
                plot=TRUE, auc.polygon=TRUE, max.auc.polygon=TRUE, grid=TRUE,
                print.auc=TRUE, show.thres=TRUE)

El valor que muestra dentro del gráfico, representa el porcentaje de la superficie del gráfico está cubierto por la Curva ROC del modelo. Mientras mayor sea ese porcentaje, mejor.

Gain y lift

Cuando graficamos la curva ROC, R internamente ordena las predicciones de mayor probabilidad a menor. Para calcular el lift y el gain hace lo mismo, y divide al dataset en deciles (o sea que lo divide en 10 partes iguales).

El gain, (o ganancia en español), lo que mide es qué proporción de aciertos acumuladas para cada decil de las predicciones.

El lift, (o lift en español), lo que mide es cuántas veces mejora las predicciones el modelo, respecto de no tener ningún modelo.

Usaremos una función del paquete funModeling desarrollado por Pablo Casas. La función gain_lift() nos hace los gráficos de gain y de lift y nos genera una tabla con los resultados.

# Carlcular el gain y el lift de df_test
gain_lift(data = df_test, score = "score", target = "left")

##    Population   Gain Lift Score.Point
## 1          10  23.58 2.36 0.550951519
## 2          20  52.37 2.62 0.425579762
## 3          30  66.86 2.23 0.307962335
## 4          40  78.22 1.96 0.229118634
## 5          50  86.36 1.73 0.171325182
## 6          60  92.99 1.55 0.128518793
## 7          70  97.54 1.39 0.090582093
## 8          80  98.86 1.24 0.061068259
## 9          90  99.34 1.10 0.033568197
## 10        100 100.00 1.00 0.002230154

¿Qué hay de fondo en estas métricas?

Tanto con la curva ROC, con el gain, y con el lift, lo que buscan medir, es qué tanto mejoran las probabilidades los modelos respecto de no hacer ningún cálculo.

Desde el punto de vista de la teoría de la probabilidad, en su forma más simple, un empleado tiene 50% chances de irse, y 50% de chances de quedarse en la empresa. Esta falta de modelo, es de alguna manera un modelo aleatorio porque dejamos al azar la ocurrencia de renuncias.

Por ejemplo el lift nos dice en cada decil, cuántas veces mejor es la predicción respecto del modelo aleatorio.

Análisis complementarios

En particular este modelo nos arrojó buenos resultados. Pero puede ocurrir que tengamos un modelo que no tenga tan buena performance pero que nos puede ser útil de todas maneras.

Todos los empleados son iguales pero algunos son más iguales que otros

Algo interesante que surge del análisis exploratorio, son los tres grupos notorios que tenemos entre los empleados que se van.

Tenemos un grupo llamativo, que representan a los empleados de alto desempeño y de alto nivel de satisfacción.

ggplot(datos, aes(x = last_evaluation, y = satisfaction_level, color = factor(left)))+
  geom_point(alpha = 0.7)+
  scale_color_manual(values = c("#BFC9CA","#2874A6")) # Asigno manualmente los colores a los puntos

Vamos a dividir a los empleados del archivo en 3 grupos, para determinar qué tan bueno es el modelo con los top de lo top, o sea con las personas de alto desempeño y alto nivel de satisfacción.

Para ello, haremos un análisis de clusters, con un algoritmo que se llama k-means, que es uno de los más sencillos para encontrar grupos.

library(ggthemes)

# Seleccionamos las variables para elegir los clusters
variables_cluster <- df_test %>%
  select(last_evaluation, satisfaction_level)

# Preparo los datos para hacer el cálculo
vc <- scale(variables_cluster)

# Defino una semilla para repetir resultados
set.seed(87) 

# Corro el algoritmo de clustering
fit_vc <- kmeans(vc, 3)

# Agrego los clusters ajustados (calculados) al dataset
df_test$cluster <- fit_vc$cluster

# Visualizo los resultados
ggplot(df_test, aes(x = last_evaluation,
                    y = satisfaction_level, 
                    color = factor(cluster))) +
  geom_point(alpha = 0.7)

Ahora, vamos a filtrar los resultados del cluster 1 que son las personas de alto nivel de desempeño y de alto nivel de satisfacción.

# Filtramos los datos del cluster 1
modelo_c1 <- df_test %>% 
  filter(cluster == 1)

conf_matrix_c1 <- table(modelo_c1$left, modelo_c1$prediccion)

# Veamos todas las métricas de la matriz con esta función del paquete caret
confusionMatrix(conf_matrix_c1)

## Confusion Matrix and Statistics
## 
##    
##        0    1
##   0 1587   16
##   1  284    1
##                                              
##                Accuracy : 0.8411             
##                  95% CI : (0.8238, 0.8573)   
##     No Information Rate : 0.991              
##     P-Value [Acc > NIR] : 1                  
##                                              
##                   Kappa : -0.0106            
##                                              
##  Mcnemar's Test P-Value : <0.0000000000000002
##                                              
##             Sensitivity : 0.848210           
##             Specificity : 0.058824           
##          Pos Pred Value : 0.990019           
##          Neg Pred Value : 0.003509           
##              Prevalence : 0.990996           
##          Detection Rate : 0.840572           
##    Detection Prevalence : 0.849047           
##       Balanced Accuracy : 0.453517           
##                                              
##        'Positive' Class : 0                  
##

En este caso vemos que el modelo es aún mejor con este grupo de interés.

Otros modelos, referencias y ayuda

Si quieren conocer otros modelos predictivos pueden consultar las carpetas de Junio y de Julio 2020 que entre las sesiones 6 a la 10 realizamos distintas sesiones sobre modelos predictivos.

Si quieren revisar las fuentes de consulta para armar esta clase les recomiendo que vean:

Libros

Max Kuhn, The caret package

Pablo Casas, Libro Vivo de Ciencia de Datos

Keith McNulty, The Handbook of Regression Modeling in People Analytics

Explicaciones de lift y gain

https://www.listendata.com/2015/06/r-function-gain-and-lift-table.html https://www.listendata.com/2014/08/excel-template-gain-and-lift-charts.html

https://supervised-ml-course.netlify.app/chapter1

Regresión logística

https://rpubs.com/Joaquin_AR/229736 https://www.cienciadedatos.net/documentos/27_regresion_logistica_simple_y_multiple

Curvas ROC

https://rviews.rstudio.com/2019/03/01/some-r-packages-for-roc-curves/

Ayuda

Y si necesitan ayuda con la práctica pueden acudir al canal #auxilio en Slack

LS0tDQp0aXRsZTogIkFuw6FsaXNpcyBQcmVkaWN0aXZvIGRlIFR1cm5vdmVyIg0KYXV0aG9yOiAiU2VyZ2lvIEdhcmPDrWEgTW9yYSB8IERhdGEgNEhSIg0KZGF0ZTogIjExLzEwLzIwMjIiDQpvdXRwdXQ6IA0KICBodG1sX2RvY3VtZW50Og0KICAgIHRoZW1lOiBsdW1lbg0KICAgIGhpZ2hsaWdodDogcHlnbWVudHMNCiAgICB0b2M6IHRydWUNCiAgICB0b2NfZmxvYXQ6IHRydWUNCiAgICBjb2RlX2ZvbGRpbmc6IHNob3cNCiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlDQotLS0NCg0KYGBge3Igc2V0dXAsIGluY2x1ZGU9RkFMU0V9DQprbml0cjo6b3B0c19jaHVuayRzZXQoZWNobyA9IFRSVUUsIHdhcm5pbmcgPSBGQUxTRSwgbWVzc2FnZSA9IEZBTFNFKQ0KYGBgDQoNCiMgQW7DoWxpc2lzIFByZWRpY3Rpdm9zIGRlIFJvdGFjacOzbiBkZSBQZXJzb25hbA0KDQojIyBQcsOzbG9nbw0KDQpDw7NtbyBlc3RhIGNsYXNlIHRpZW5lIG3DoXMgY29udGVuaWRvIHRlw7NyaWNvLCByZWNvbWVuZGFtb3MgdGFtYmnDqW4gdmVyIGxhIHByZXNlbnRhY2nDs24gcXVlIGVzdMOhIGVuIGVsIGFyY2hpdm8gKkNsYXNlXzNcX0Fuw6FsaXNpc19QcmVkaWN0aXZvcy5odG1sKi4NCg0KQWRlbcOhcywgY29tbyBzaWVtcHJlLCByZWN1ZXJkZW4gcXVlIHRpZW5lbiBlbCBjYW5hbCAqKiNhdXhpbGlvKiogZW4gU2xhY2sgcGFyYSBoYWNlciB0b2RhcyBsYXMgY29uc3VsdGFzIHF1ZSBuZWNlc2l0YW4uDQoNCkVsIGVqZW1wbG8gZGUgaG95LCBsbyB2YW1vcyBhIHVzYXIgcmVjaWNsYW5kbyB1biBjYXNvIGRlIGVzdHVkaW8gcXVlIGRlc2Fycm9sbGFtb3MgZW4gRGF0YSA0SFIgZW4gUHl0aG9uLCB5IGxvIHZhbW9zIGEgcmVwbGljYXIgZW4gUi4gRWwgY2FzbyBvcmlnaW5hbCBsbyBwdWVkZW4gdmVyIGVuIFtlc3RlIGxpbmtdKGh0dHBzOi8vZHJpdmUuZ29vZ2xlLmNvbS9maWxlL2QvMVhjZ1QwX292aWhwWXRucWJFRGh3dTR6andJNGx0eDF3L3ZpZXc/dXNwPXNoYXJpbmcpIHkgZXN0ZSBlcyBlbCBbcmVwb3NpdG9yaW8gb3JpZ2luYWxdKGh0dHBzOi8vZ2l0aHViLmNvbS9tbGFtYm9sbGEvQW5hbHl0aWNzX0hSX0F0dHJpdGlvbikgKGFwcm92ZWNoZW4gcGFyYSB2ZXIgbGFzIGRpZmVyZW5jaWFzIGVuIGxhcyBzaW50YXhpcyBlbnRyZSBSIHkgUHl0aG9uIHNpIHB1ZWRlbikuDQoNCiMjIEludHJvZHVjY2nDs24NCg0KRXhpc3RlbiB2YXJpb3MgdGlwb3MgZGUgYW7DoWxpc2lzIHByZWRpY3Rpdm9zLiBFbiBwYXJ0aWN1bGFyLCBob3kgdmFtb3MgYSB1dGlsaXphciB1biBtb2RlbG8gbGxhbWFkbyBkZSAqY2xhc2lmaWNhY2nDs24qIHBvcnF1ZSBsbyBxdWUgcXVlcmVtb3MgcHJlZGVjaXIgZXMgc2kgdW5hIHBlcnNvbmEgdmEgYSBwZXJ0ZW5lY2VyIGEgdW5hIGNsYXNlIChyZW51bmNpYSkgbyBhIG90cmEgY2xhc2UgKG5vIHJlbnVuY2lhKS4NCg0KRXN0ZSB0aXBvIGRlIGFsZ29yaXRtbywgbm9zIHZhIGEgYnJpbmRhciBjb21vIHJlc3VsdGFkbywgdW5hICoqcHJvYmFiaWxpZGFkKiosIGVzIGRlY2lyIHVuIHZhbG9yIHF1ZSBub3MgdmEgYSBpbmRpY2FyIGNvbiBxdcOpIGdyYWRvIGRlIGNlcnRlemEgKG8gbWVub3IgbWFyZ2VuIGRlIGluY2VydGlkdW1icmUpIHBvZGVtb3MgYWZpcm1hciBxdWUgYWxnbyB2YSBhIHBhc2FyIG8gbm8uDQoNCiMgwr9RdcOpIGVzIHVuIGFuw6FsaXNpcyBwcmVkaWN0aXZvPw0KDQpFbCBvYmpldGl2byBkZSBsb3MgYW7DoWxpc2lzIHByZWRpY3Rpdm9zIGVzIGRldGVjdGFyIHBhdHJvbmVzLCBlbiBudWVzdHJvIGNhc28sIHBhdHJvbmVzIGVuIGxvcyBjb21wb3J0YW1pZW50b3MsIGVuIGxhcyBjYXJhY3RlcsOtc3RpY2FzLCB5IGVuIGxvcyBkYXRvcyBkZSBsb3MgZW1wbGVhZG9zIHBhcmEgcG9kZXIgZGV0ZWN0YXIgcXVpw6luIHRpZW5lIG3DoXMgcHJvYmFiaWxpZGFkIGRlIHJlbnVuY2lhciBwb3IgZWplbXBsby4NCg0KSG95LCBzaW4gbmluZ8O6biBhbsOhbGlzaXMgaGVjaG8sIGxvIHF1ZSBzYWJlbW9zIGRlIGNhZGEgZW1wbGVhZG8gZXMgcXVlIHRpZW5lIHRhbnRhIHByb2JhYmlsaWRhZCAqZGUgcmVudW5jaWFyKiwgY29tbyBkZSAqbm8gcmVudW5jaWFyKi4gTyBzZWEgcXVlIGxhIGNvc2EgZXN0YSAqImZpZnR5LWZpZnR5IiosIG8gY29tbyBwYXJhIGlyIG5lcmRlYW5kbyBsYSBjb3NhLCBjb24gdW5hIHByb2JhYmlsaWRhZCBkZSAwLjUuDQoNCkxvIHF1ZSBidXNjYW1vcyBjb24gdW4gYW7DoWxpc2lzIHByZWRpY3Rpdm8gZXMgbWVqb3JhciBlc2EgcHJvYmFiaWxpZGFkIHBhcmEgcmVkdWNpciBsYSBpbmNlcnRpZHVtYnJlIHNvYnJlIGxvIHF1ZSBwdWVkZSBvIG5vIG9jdXJyaXIgZW4gZWwgZnV0dXJvLg0KDQpIYWNlciB1biBhbsOhbGlzaXMgbm8gaW1wbGljYSBhY2VydGFyIGVsIDEwMCUgZGUgbG9zIGNhc29zLCBzaW5vIHF1ZSBlcyB1biBpbnRlbnRvIGRlIHRlbmVyIHVuYSBpZGVhIGRlIHF1acOpbmVzIHRpZW5lbiBtw6FzICoqcHJvYmFiaWxpZGFkKiogZGUgaXJzZS4gwr9Fc3RvIHF1aWVyZSBkZWNpciBxdWUgYWxndWllbiBxdWUgdGllbmUgYWx0YSBwcm9iYWJpbGlkYWQgZGUgcmVudW5jaWFyIHkgbm8gbG8gaGFjZSAobyB2aWNldmVyc2EpIGVsIG1vZGVsbyBlc3TDoSBtYWw/DQoNCk5vLiBBbCBtZW5vcyBubyBuZWNlc2FyaWFtZW50ZS4gwr9RdcOpIGVzIGxhIHByb2JhYmlsaWRhZD8NCg0KIyMgUHJvYmFiaWxpZGFkDQoNCkxhIHByb2JhYmlsaWRhZCBlcyB0b2RhIHVuYSByYW1hIGRlIGxhIGVzdGFkw61zdGljYSBlbiBzw60gbWlzbWEuIFNlIGVuZm9jYSBlbiBpbnRlbnRhciBkZXNjdWJyaXIgbGEgY2VydGV6YSAobyBpbmNlcnRpZHVtYnJlKSBkZSBxdWUgb2N1cnJhbiBsYXMgY29zYXMuIEVsIHJlc3VsdGFkbyBkZSB1bmEgcHJvYmFiaWxpZGFkIHNpZW1wcmUgdmEgYSBkYXIgZW50cmUgMCB5IDEuDQoNCi0gICBVbiByZXN1bHRhZG8gaWd1YWwgbyBjZXJjYW5vIGEgKiowKiogaW1wbGljYSB1biBldmVudG8gaW1wcm9iYWJsZS4NCi0gICBVbiByZXN1bHRhZG8gaWd1YWwgbyBjZXJjYW5vIGEgKioxKiogaW1wbGljYSB1bmEgYWx0YSBwcm9iYWJpbGlkYWQuDQoNCsK/UXXDqSBwYXNhIHNpIG9jdXJyZSBhbGdvIGltcHJvYmFibGUsIG8gbm8gb2N1cnJlIGFsZ28gY29uIGFsdGEgcHJvYmFiaWxpZGFkPyBFcyBwYXJ0ZSBkZWwgbWFyZ2VuIGRlIGVycm9yIGluaGVyZW50ZSBhIGxhIGVzdGFkw61zdGljYSwgeSBwb3IgZXNvIHNlIGFzdW1lIHF1ZSB2YSBhIGhhYmVyIGVycm9yZXMuIEVsIHB1bnRvIGVzLCBzaSByZXBldGltb3MgZWwgZXhwZXJpbWVudG8gMTAwIHZlY2VzLCDCv2N1w6FudG8gYWNpZXJ0YSBlbCBtb2RlbG8sIHkgY29uIHF1w6kgcHJlY2lzacOzbj8NCg0KIyMgUmVncmVzacOzbiBMb2fDrXN0aWNhDQoNCkhheSB2YXJpYXMgZm9ybWFzIGRlIGhhY2VyIGFuw6FsaXNpcyBwcmVkaWN0aXZvcywgeSBzaWVtcHJlIHZhbW9zIGEgdGVuZXIgcXVlIHRvbWFyIGRlY2lzaW9uZXMgZW50cmUgbW9kZWxvcyBjb21wdXRhY2lvbmFsbWVudGUgZWZpY2llbnRlcyB5IHNpbXBsZXMsIG8gY29tcHV0YWNpb25hbG1lbnRlIG3DoXMgY29zdG9zb3MgeSBwcmVjaXNvczsgbyBlbnRyZSBtb2RlbG9zIG3DoXMgKnRyYW5zcGFyZW50ZXMqIGVuIGVsIHNlbnRpZG8gcXVlIHBvZGVtb3MgZXhwbGljYXIgbGEgcmVsYWNpw7NuIGVudHJlIGxhcyB2YXJpYWJsZXMgeSBsYSBwcmVkaWNjacOzbiwgbyBlbnRyZSBtb2RlbG9zIHF1ZSBzb24gdW5hICpjYWphIG5lZ3JhKiBlbiBsYSBxdWUgc2FiZW1vcyBlbCByZXN1bHRhZG8gcGVybyBubyBwb2RlbW9zIGV4cGxpY2FyIGVsIHBvciBxdcOpLg0KDQpFbiBlc3RlIHNlbnRpZG8sIGxhIHJlZ3Jlc2nDs24gbG9nw61zdGljYSBlcyB1biBhbGdvcml0bW8gY29tcHV0YWNpb25hbG1lbnRlIGVmaWNpZW50ZSwgc2ltcGxlLCB5IHRyYW5zcGFyZW50ZSBwYXJhIGV4cGxpY2FyIGxhIHJlbGFjacOzbiBlbnRyZSBsYSBwcm9iYWJpbGlkYWQgeSBsYSBpbmZsdWVuY2lhIGRlIGxhcyB2YXJpYWJsZXMuDQoNCiMgwr9Dw7NtbyBzZSBoYWNlIHVuIGFuw6FsaXNpcyBwcmVkaWN0aXZvPw0KDQpQYXJhIGhhY2VyIGFuw6FsaXNpcyBwcmVkaWN0aXZvcyB2YW1vcyBhIHRyYWJhamFyIGNvbiBkYXRvcyBkZWwgcGFzYWRvLiBUcmFkaWNpb25hbG1lbnRlIHNlIHVzYSB1bmEgZWwgNzAlIGRlIGxvcyBkYXRvcyBwYXJhICplbnRyZW5hciBlbCBtb2RlbG8qLCB5IGVsIDMwJSBkZSBsb3MgZGF0b3MsIHNlIGxvcyB1c2EgcGFyYSAqdGVzdGVhciBlbCBtb2RlbG8qLiBBIGVzdG9zIGRhdGFzZXRzIGxvcyB2YW1vcyBhIGxsYW1hciAqKnRyYWluaW5nKiogbyBkZSAqKmVudHJlbmFtaWVudG8qKiB5IGRhdGFzZXQgZGUgKip0ZXN0aW5nKiogbyBkZSAqKnZhbGlkYWNpw7NuKiogcmVzcGVjdGl2YW1lbnRlLg0KDQohW10oaHR0cHM6Ly93d3cub3JlaWxseS5jb20vbGlicmFyeS92aWV3L3N0YXRpc3RpY3MtZm9yLW1hY2hpbmUvOTc4MTc4ODI5NTc1OC9hc3NldHMvYmJiMmE1NDgtNmRiYS00ZDlmLWE0ZjctOGYyMGQxMzQyMmUwLnBuZykNCg0KTGEgc2VsZWNjacOzbiBkZSBsb3MgZGF0b3Mgc2UgaGFjZSBhbCBhemFyLiBBc8OtIHF1ZSBoYXkgcXVlIGFzZWd1cmFyc2UgcXVlIGxhIHByb3BvcmNpw7NuIGRlIHJlbnVuY2lhcyBzZWEgc2ltaWxhciBlbiBhbWJvcyBkYXRhc2V0cy4NCg0KIyMgUGFxdWV0ZXMNCg0KVmFtb3MgYSB1dGlsaXphciBsb3Mgc2lndWllbnRlcyBwYXF1ZXRlczoNCg0KYGBge3IgcGFxdWV0ZXMsIGV2YWw9RkFMU0V9DQppbnN0YWxsLnBhY2thZ2VzKCJjYXJldCIpICAjIEVzIEVMIHBhcXVldGUgcGFyYSBjb3JyZXIgbW9kZWxvcw0KaW5zdGFsbC5wYWNrYWdlcygiY2FyIikgICAgIyBDb21wYW5pb24gdG8gQXBwbGllZCBSZWdyZXNzaW9uDQppbnN0YWxsLnBhY2thZ2VzKCJwUk9DIikgICAjIFBhcmEgcmVhbGl6YXIgQ3VydmFzIFJPQw0KaW5zdGFsbC5wYWNrYWdlcygiZnVuTW9kZWxpbmciKSAgIyBBbsOhbGlzaXMgRXhwbG9yYXRvcmlvcyB5IG11Y2hvIG3DoXMNCmBgYA0KDQpBaG9yYSBhY3RpdmVtb3MgdG9kb3MgbG9zIHBhcXVldGVzIHF1ZSB2YW1vcyBhIG5lY2VzaXRhci4NCg0KYGBge3IgcGFxdWV0ZXMyfQ0KbGlicmFyeShjYXJldCkNCmxpYnJhcnkoY2FyKQ0KbGlicmFyeShwUk9DKQ0KbGlicmFyeShmdW5Nb2RlbGluZykNCmxpYnJhcnkodGlkeXZlcnNlKQ0KYGBgDQoNCkxhIGZ1ZW50ZSBkZSBkYXRvcyBxdWUgdmFtb3MgYSB1dGlsaXphciBsbyBwb2RlbW9zIGNhcmdhciBkaXJlY3RhbWVudGUgZGVzZGUgZWwgcmVwb3NpdG9yaW8gZGUgR2l0SHViIGRlbCBjYXNvIGRlIGVzdHVkaW86DQoNCmBgYHtyIGRhdG9zfQ0KIyBMZWVyIGxvcyBkYXRvcyBkZSBHaXRIdWINCmRhdG9zIDwtIHJlYWRfY3N2KCJodHRwczovL3Jhdy5naXRodWJ1c2VyY29udGVudC5jb20vbWxhbWJvbGxhL0FuYWx5dGljc19IUl9BdHRyaXRpb24vbWFzdGVyL0hSX2NvbW1hX3NlcC5jc3YiKQ0KDQojIFZlciBlbCBkYXRhc2V0IGNvbiBnbGltcHNlKCkNCmdsaW1wc2UoZGF0b3MpDQpgYGANCg0KVW4gcGFzbyBxdWUgbmVjZXNpdGFtb3MgaGFjZXIgZXMgY29udmVydGlyIHVuYSB2YXJpYWJsZSBgY2hhcmFjdGVyYCBhIGBudW1lcmljYC4gQWRlbcOhcyBlbGltaW5hbW9zIGxhIHZhcmlhYmxlIGBzYWxlc2AgKHF1ZSBlbiByZWFsaWRhZCBlcyBsYSB2YXJpYWJsZSBkZSBzZWN0b3JlcywgcGVybyB0aWVuZSBtdWNob3MgdmFsb3JlcyBwb3NpYmxlcykuDQoNCmBgYHtyIGRhdG9zMn0NCiMgRWxtaW5hbW9zIGxhIHZhcmlhYmxlICdzYWxlcycgeSBjYW1iaWVtb3MgbG9zIHZhbG9yZXMgZGUgJ3NhbGFyeScgYSBudW3DqXJpY29zLg0KZGF0b3M8LSBkYXRvcyAlPiUgDQogIHNlbGVjdCgtc2FsZXMpICU+JQ0KICBtdXRhdGUoc2FsYXJ5ID0gYXMubnVtZXJpYyhjYXNlX3doZW4oDQogICAgc2FsYXJ5ID09ICdsb3cnIH4gMCwNCiAgICBzYWxhcnkgPT0gJ21lZGl1bScgfiAxLA0KICAgIHNhbGFyeSA9PSAnaGlnaCcgfiAyDQogICkpKQ0KYGBgDQoNCiMjIFBhc29zIGRlIHVuIGFuw6FsaXNpcyBwcmVkaWN0aXZvDQoNCkVuIGxvcyBjaWNsb3MgZGUgdmlkYSBkZSBsb3MgcHJveWVjdG9zIGRlIGRhdGEgbWluaW5nIGVuIGdlbmVyYWwsIGVzdMOhIGVzdGFibGVjaWRhIGNvbW8gbWV0b2RvbG9nw61hLCBsYSBtZXRvZG9sb2fDrWEgKipDUklTUC1ETSoqICgqQ3Jvc3MgSW5kdXN0cnkgU3RhbmRhcmQgUHJvY2VzcyBmb3IgRGF0YSBNaW5pbmcqKS4gRW4gZG9uZGU6DQoNCkVudHJlIGxhIGV0YXBhIGRlICpNb2RlbGFkbyogeSBsYSAqUHVlc3RhIGVuIHByb2R1Y2Npw7NuKiAoZGVwbG95bWVudCkgaGF5IHVuYSBldGFwYSBkZSBldmFsdWFjacOzbi4gTWllbnRyYXMgZGlzZcOxYW1vcyBlbCBtb2RlbG8sIHRyYWJhamFtb3MgY29uIGRhdG9zIGhpc3TDs3JpY29zLCBlbiBsYSBldGFwYSBkZSAqRXZhbHVhY2nDs24qIHZhbW9zIHByb2JhbmRvIGxhIHByZWNpc2nDs24gZGVsIG1vZGVsbyBjb24gZGF0b3MgbnVldm9zLCB5IHNpIHRvZG8gdmEgYmllbiwgc2UgcG9uw6kgZW4gcHJvZHVjY2nDs24uDQoNCiFbXShodHRwczovL3VwbG9hZC53aWtpbWVkaWEub3JnL3dpa2lwZWRpYS9jb21tb25zL3RodW1iL2IvYjkvQ1JJU1AtRE1fUHJvY2Vzc19EaWFncmFtLnBuZy84MDBweC1DUklTUC1ETV9Qcm9jZXNzX0RpYWdyYW0ucG5nKXt3aWR0aD0iNDI0In0NCg0KTG9zIHBhc29zIGLDoXNpY29zIGRlIHVuIGFuw6FsaXNpcyBwcmVkaWN0aXZvIHNvbjoNCg0KMS4gIERlZmluaXIgbGEgdmFyaWFibGUgKnRhcmdldCoNCjIuICBTZXBhcmFyIGVsIGRhdGFzZXQgZW4gKip0cmFpbmluZyoqIHkgKip0ZXN0aW5nKioNCjMuICBFeHBsb3JhciBsb3MgZGF0b3MNCjQuICBDb250cm9sYXIgbG9zIHNlc2dvcyBkZSBsb3MgZGF0b3MNCjUuICBFbnRyZW5hciBlbCBtb2RlbG8NCjYuICBDb250cm9sYXIgbG9zIHJlc3VsdGFkb3MNCjcuICBBanVzdGFyIHkgcmVwZXRpcg0KDQohW10oaHR0cHM6Ly9wYnMudHdpbWcuY29tL21lZGlhL0M5RXR4WEVYVUFBekRiWi5qcGcpe3dpZHRoPSIzMjYifQ0KDQpQb3IgdW4gdGVtYSBkZSB0aWVtcG9zLCBub3MgdmFtb3MgYSBzYWx0ZWFyIGVsIHBhc28gMy4gU2kgbmVjZXNpdGFuIGF5dWRhIHBhcmEgcmVhbGl6YXIgZWwgYW7DoWxpc2lzIGV4cGxvcmF0b3JpbyBkZSBkYXRvcyBwb3Igc3UgY3VlbnRhLCBwdWVkZW4gcmV2aXNhciBsYSBzZXNpw7NuIGRlIFtSNEhSIENsdWIgZGUgUiBwYXJhIFJSSEhdKGh0dHBzOi8vZHJpdmUuZ29vZ2xlLmNvbS9maWxlL2QvMTZGb1NqaVhiZVFMV3pQX3ZYa28zdVQtb3h5Ym9QUG84L3ZpZXc/dXNwPXNoYXJpbmcpIG8gZWwgY2Fww610dWxvIDcgZGUgW1IgcGFyYSBDaWVuY2lhIGRlIERhdG9zXShodHRwczovL2VzLnI0ZHMuaGFkbGV5Lm56L2FuJUMzJUExbGlzaXMtZXhwbG9yYXRvcmlvLWRlLWRhdG9zLWVkYS5odG1sKS4NCg0KIyBEZXNhcnJvbGxvIGRlbCBhbsOhbGlzaXMgcHJlZGljdGl2bw0KDQojIyAxLiBEZWZpbmlyIGxhIHZhcmlhYmxlIGB0YXJnZXRgDQoNClVzdWFsbWVudGUsIGVuIGxvcyBtb2RlbG9zIHByZWRpY3Rpdm9zLCB0ZW5lbW9zIHVuYSAqdmFyaWFibGUgb2JqZXRpdm8qIGEgbGEgcXVlIGxsYW1hcmVtb3MgKip0YXJnZXQqKi4NCg0KUG9yIGxvIGdlbmVyYWwgdXNhbW9zIG8gdW5hIHZhcmlhYmxlIG51bcOpcmljYSBvIGzDs2dpY2EgKGBUUlVFYCBvIGBGQUxTRWApIGNvZGlmaWNhZGEgY29uIGAxYCBvIGAwYC4gRXMgdW5hIHByw6FjdGljYSBjb23Dum4gdXNhciBlbCBuw7ptZXJvIDEgcGFyYSBsbyBxdWUgbm9zIGludGVyZXNhIHNhYmVyLCBlbiBudWVzdHJvIGNhc28sIHNpIGxhIHBlcnNvbmEgZGUgbnVlc3RyYSBiYXNlIGRlIGRhdG9zLCBzZSBmdWUgZGUgbGEgY29tcGHDscOtYS4NCg0KVmVhbW9zIGVsIGRhdGEgZnJhbWUgY29uIGxhIGZ1bmNpw7NuIGBWaWV3KClgLg0KDQpgYGB7ciB2ZXItZGF0b3N9DQojIFZlciBsYSB0YWJsYSBkZSBkYXRvcyBjb24gVmlldygpIA0KVmlldyhkYXRvcykNCmBgYA0KDQpFbiBudWVzdHJvIGNhc28sIGxhIHZhcmlhYmxlICp0YXJnZXQqIGVzIGxhIGNvbHVtbmEgYGxlZnRgLiBWZWFtb3MgZW4gbG9zIGRhdG9zLCBjdWFudG9zIGVtcGxlYWRvcyBzZSBmdWVyb24sIHkgY3XDoW50b3MgYcO6biBwZXJtYW5lY2VuIGVuIGxhIGNvbXBhw7HDrWEuDQoNCmBgYHtyIHRhcmdldH0NCiMgQ29udGFyIGNhbnRpZGFkIGRlIGVtcGxlYWRvcyBxdWUgc2UgdmFuIHkgcXVlIHNlIHF1ZWRhbg0KZGF0b3MgJT4lICMgQ3RybCArIFNoaWZ0ICsgTQ0KICBjb3VudChsZWZ0KQ0KDQojIFF1w6kgcG9yY2VudGFqZSBkZSBlbXBsZWFkb3Mgc2UgZnVlcm9uPw0KZGF0b3MgJT4lICMgQ3RybCArIFNoaWZ0ICsgTQ0KICBjb3VudChsZWZ0KSAlPiUgDQogIG11dGF0ZShwcm9wID0gbi9zdW0obikpDQoNCmBgYA0KDQojIyAyLiBEaXZpZGlyIGVuIHRyYWluaW5nIHkgdGVzdGluZw0KDQpFbCBwYXNvIHNpZ3VpZW50ZSBlcyBzZXBhcmFyIGVsIGRhdGEgZnJhbWUgZW4gZG9zIHBhcnRlcywgdW5hIHF1ZSBsbGFtYXJlbW9zICoqdHJhaW5pbmcqKiwgeSBvdHJhIHF1ZSBsbGFtYXJlbW9zICoqdGVzdGluZyoqLg0KDQpFbCBkYXRhIGZyYW1lIGRlICoqdHJhaW5pbmcqKiBvICoqZW50cmVuYW1pZW50byoqIHNpcnZlIHBhcmEgKmVudHJlbmFyIGVsIG1vZGVsbyosIGVzIGRlY2lyIHF1ZSBjb24gZXN0YSBwb3JjacOzbiBkZSBsb3MgZGF0b3MgdmFtb3MgYSBjcmVhciBsYSBmw7NybXVsYSBxdWUgbHVlZ28gdXRpbGl6YXJlbW9zIHBhcmEgZXN0aW1hciBsYXMgcHJvYmFiaWxpZGFkZXMgZGUgbnVlc3RybyBtb2RlbG8gcHJlZGljdGl2by4NCg0KRWwgZGF0YSBmcmFtZSBkZSAqKnRlc3RpbmcqKiBvICoqdmFsaWRhY2nDs24qKiBub3Mgc2lydmUgcGFyYSB2ZXJpZmljYXIgcXVlIGxhIGbDs3JtdWxhIHF1ZSBjcmVhbW9zIGVuIGVsIHBhc28gYW50ZXJpb3Igc2VhIGVmZWN0aXZhIGNvbiBkYXRvcyBudWV2b3MuIEVzIHVuYSBmb3JtYSBkZSBzaW11bGFyIHF1ZSBzb24gbnVldm9zIGRhdG9zIHkgcXVlIG5vcyBwZXJtaXRlIGV2YWx1YXIgcXXDqSB0YW4gZWZlY3RpdmEgZXMgbGEgcHJlZGljY2nDs24uDQoNCkVsIG3DqXRvZG8gcGFyYSBkaXZpZGlyIGVsIGRhdGFzZXQgZW4gZG9zIGVzIHNpbWlsYXIgYWwgcXVlIGhhcsOtYW1vcyBjb24gdW4gbGlzdGFkbyBmaW5hbCBkZSBpbnZpdGFkb3MgYSB1bmEgYm9kYS4gRGUgdG9kYXMgbGFzIHBlcnNvbmFzIHBvc2libGVzIHPDs2xvICoiaW52aXRhbW9zIiogYSB1biBncnVwby4NCg0KRGUgbGEgbWlzbWEgbWFuZXJhIHZhbW9zIGEgY3JlYXIgdW4gw61uZGljZSwgZWwgY3VhbCBub3MgdmEgYSBpbmRpY2FyIGxhcyBmaWxhcyBkZWwgZGF0YSBmcmFtZSBvcmlnaW5hbCBxdWUgZm9ybWFyw6FuIGVsIGRhdGEgZnJhbWUgZGUgKip0cmFpbmluZyoqIHkgZWwgZGUgKip0ZXN0aW5nKiouDQoNCkxhIHNlbGVjY2nDs24gZGUgbG9zIGRhdG9zIHNlIGhhY2UgYWxlYXRvcmlhbWVudGUsIG8gc2VhIHF1ZSBzaSBubyBoYWNlbW9zIG5hZGEsIGNhZGEgdmV6IHF1ZSBoYWdhbW9zIGxhIHNlbGVjY2nDs24gUiBlbGVnaXLDoSBmaWxhcyBkaWZlcmVudGVzLiBDb24gbG8gY3VhbCwgZWwgcHJpbWVyIHBhc28gZXMgZGVmaW5pciB1bmEgc2VtaWxsYS4NCg0KYGBge3Igc2VtaWxsYX0NCiMgRGVmaW5pciB1bmEgc2VtaWxsYSBjb24gc2V0LnNlZWQoKQ0Kc2V0LnNlZWQoNDIpDQpgYGANCg0KTHVlZ28gdmFtb3MgYSBjcmVhciBudWVzdHJvIMOtbmRpY2UgZGUgZmlsYXMgcGFyYSBlbCBkYXRhc2V0IGRlIGVudHJlbmFtaWVudG8gKG51ZXN0cmEgbGlzdGEgZGUgaW52aXRhZG9zKSBjb24gbGEgZnVuY2nDs24gYGNyZWF0ZURhdGFQYXJ0aXRpb24oKWAgZGVsIHBhcXVldGUgYGNhcmV0YCBjdXlvcyBwYXLDoW1ldHJvcyBzb246DQoNCi0gICBgeWA6IHF1ZSBpbmRpY2EgbnVlc3RyYSB2YXJpYWJsZSAqdGFyZ2V0KiBjb24gZWwgZm9ybWF0byBgZGF0YV9mcmFtZSR2YXJpYWJsZV90YXJnZXRgLg0KLSAgIGBwYDogcXVlIGluZGljYSBsYSBwcm9wb3JjacOzbiBkZSBkYXRvcyBxdWUgcXVlcmVtb3MgcGFyYSBlbCDDrW5kaWNlLg0KLSAgIGBsaXN0ID0gRkFMU0VgOiBDb24gZXNvIGxlIGluZGljYW1vcyBhIGxhIGZ1bmNpw7NuIHF1ZSBubyBxdWVyZW1vcyBxdWUgYWxtYWNlbmUgZWwgcmVzdWx0YWRvIGNvbW8gdW5hIGxpc3RhLg0KDQpgYGB7ciBkaXZpc2lvbn0NCiMgVXNhciBsYSBmdW5jacOzbiBjcmVhdGVEYXRhUGFydGl0aW9uKCkgeSBndWFyZGFyIGxvcyByZXN1bHRhZG9zIGVuIHVuIG9iamV0byBsbGFtYWRvIGluZGljZQ0KaW5kaWNlIDwtIGNyZWF0ZURhdGFQYXJ0aXRpb24oeSA9IGRhdG9zJGxlZnQsDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICBwID0gMC43LA0KICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgbGlzdCA9IEZBTFNFKQ0KDQojIFZlciBlbCBjb250ZW5pZG8gZGUgbGFzIHByaW1lcmFzIDIwIGZpbGFzIA0KaGVhZChpbmRpY2UsIDIwKQ0KYGBgDQoNCkFob3JhLCBjb24gZXNlIMOtbmRpY2UgdmFtb3MgYSBjcmVhciBsb3MgZG9zIGRhdGEgZnJhbWVzIHF1ZSBuZWNlc2l0YW1vcy4gVmFtb3MgYSB1c2FyIGxhIGzDs2dpY2EgYG5vbWJyZV9kYXRhZnJhbWVbZmlsYXMsIGNvbHVtbmFzXWAsIGluZGljYW5kbyBlbiBlc3RlIGNhc28gcXVlIHBhcmEgZWwgZGF0YSBmcmFtZSBkZSBlbnRyZW5hbWllbnRvIHZhbW9zIGEgc2VsZWNjaW9uYXIgbGFzIGZpbGFzIHF1ZSBlc3TDqW4gZW4gZWwgYGluZGljZWAuDQoNClBhcmEgY3JlYXIgZWwgZGF0YSBmcmFtZSBkZSB2YWxpZGFjacOzbiwgdmFtb3MgYSBwb25lciB0b2RhcyBsYXMgZmlsYXMgcXVlICoqbm8gZXN0w6luKiogZW4gZWwgw61uZGljZS4NCg0KRWwgcHJpbWVyIGRhdGEgZnJhbWUgbG8gYWxtYWNlbmFyZW1vcyBlbiB1biBvYmpldG8gbGxhbWFkbyBgZGZfdHJhaW5gIHkgZWwgZGF0YSBmcmFtZSBkZSAqdmFsaWRhY2nDs24qIGxvIGd1YXJkYXJlbW9zIGVuIHVuIG9iamV0byBsbGFtYWRvIGBkZl90ZXN0YC4NCg0KYGBge3IgZGl2aXNpb24yfQ0KI0FybW8gZWwgZGF0YWZyYW1lIGRlIHRyYWluaW5nIGRhdGFfZnJhbWVbZmlsYSwgY29sdW1uYV0NCmRmX3RyYWluIDwtIGRhdG9zW2luZGljZSwgXQ0KDQojIENvbiBlbCBzaWdubyAtIChtZW5vcyksIGNyZWFtb3MgZWwgZGF0YXNldCBkZSB0ZXN0aW5nLCBjb24gdG9kYXMgbGFzIGZpbGFzICdxdWUgbm8gZXN0w6luIGVuIGluZGljZScNCmRmX3Rlc3QgPC0gZGF0b3NbLWluZGljZSwgXQ0KYGBgDQoNClJldmlzZW1vcyBhbWJvcyBkYXRhIGZyYW1lcyBjb24gbGEgZnVuY2nDs24gYGdsaW1wc2UoKWAuDQoNCmBgYHtyIGRpdmlzaW9uM30NCiMgUmV2aXNhciBlbCBkYXRhIGZyYW1lIGRmX3RyYWluDQpnbGltcHNlKGRmX3RyYWluKQ0KDQojIFJldmlzYXIgZWwgZGF0YSBmcmFtZSBkZl90ZXN0KCkNCmdsaW1wc2UoZGZfdGVzdCkNCmBgYA0KDQojIyAzLiBFeHBsb3JhciBsb3MgZGF0b3MNCg0KIVtdKEFyY2hpdm9zL25vX2VkYS5qcGcpe3dpZHRoPSIzNjIifQ0KDQpSZWN1ZXJkZW4gcXVlIHBvciB1biB0ZW1hIGRlIHRpZW1wb3Mgb21pdGlyZW1vcyBlc3RlIHBhc28uIFB1ZWRlbiB2ZXIgbG9zIHBhc29zIGRlc2Fycm9sbGFkb3MgZW4gZWwgW2Nhc28gZGUgZXN0dWRpbyBlbiBlbCByZXBvc2l0b3JpbyBkZSBHaXRIdWJdKGh0dHBzOi8vZ2l0aHViLmNvbS9tbGFtYm9sbGEvQW5hbHl0aWNzX0hSX0F0dHJpdGlvbi9ibG9iL21hc3Rlci9EZW1vJTIwLSUyMEF0dHJpdGlvbi5pcHluYikuDQoNCiMjIDQuIENvbnRyb2xhciBsb3Mgc2VzZ29zDQoNCkVuIGVzdGUgcGFzbyBsbyBxdWUgdmFtb3MgYSBoYWNlciBlcyB2ZXJpZmljYXIgcXVlIGxhIHByb3BvcmNpw7NuIGRlIGNhc29zIGVuIGFtYm9zIGRhdGFmcmFtZXMgc2VhIHBhcmVqYS4gRXN0byBub3MgcGVybWl0aXLDoSBhc3VtaXIgcXVlIGN1YW5kbyBoYWdhbW9zIGxhIHZhbGlkYWNpw7NuIGRlIGxvcyBkYXRvcyB0ZW5nYW1vcyB1bmEgY2FudGlkYWQgZGUgY2Fzb3MgcmVsZXZhbnRlIHBhcmEgYW5hbGl6YXIuDQoNCkRhZG8gcXVlIGxhIHZhcmlhYmxlIGBsZWZ0YCBzZSBjb21wb25lIGRlIGAwYCB5IGRlIGAxYCBwb2RlbW9zIGNhbGN1bGFyIGbDoWNpbG1lbnRlIHF1ZSBlbCBwb3JjZW50YWplIGVuIGFtYm9zIGRhdGEgZnJhbWVzIHNlYSBzaW1pbGFyIGNhbGN1bGFuZG8gZWwgcHJvbWVkaW8gZGUgbGEgY29sdW1uYSBgbGVmdGAgZW4gYW1ib3MgZGF0YSBmcmFtZXMuDQoNCmBgYHtyIHNlc2dvc30NCiMgQ2FsY3VsYXIgZWwgcHJvbWVkaW8gZGUgbGEgY29sdW1uYSBsZWZ0IGVuIGRmX3RyYWluDQptZWFuKGRmX3RyYWluJGxlZnQpDQoNCiMgQ2FsY3VsYXIgZWwgcHJvbWVkaW8gZGUgbGEgY29sdW1uYSBsZWZ0IGVuIGRmX3Rlc3QNCm1lYW4oZGZfdGVzdCRsZWZ0KQ0KYGBgDQoNCkNvbW8gbGFzIHByb3BvcmNpb25lcyBzb24gc2ltaWxhcmVzIHBvZGVtb3MgYXZhbnphci4NCg0KIyMgNS4gRW50cmVuYXIgZWwgbW9kZWxvDQoNCkVsIHByaW1lciBwYXNvIGVzIGdlbmVyYXIgdW4gbW9kZWxvIHByZWRpY3Rpdm8gY29uIGxvcyBkYXRvcyBkZSAqdHJhaW5pbmcqLmBsZWZ0YCBlcyBsYSB2YXJpYWJsZSBvYmpldGl2bywgeSBsb3Mgc8OtbWJvbG9zIGB+IC5gIGluZGljYW4gY29udHJhIHF1w6kgdmFyaWFibGVzIHZhbW9zIGEgZW50cmVuYXIgZWwgbW9kZWxvLiBFc3RvIGltcGxpY2EgcXVlIGVsIHJlc3RvIGRlbCBkYXRhc2V0IHNvbiBsYXMgdmFyaWFibGVzIGV4cGxpY2F0b3JpYXMuDQoNCmBgYHtyIG1vZGVsb30NCiMgQ2FsY3VsYW1vcyB1biBtb2RlbG8gZGUgZW50cmVuYW1pZW50bywgc2FjYW5kbyBkZXBhcnRtZW50IGRlIGxvcyBjw6FsY3Vsb3MuDQptb2RlbG8gPC0gZ2xtKGxlZnQgfi4gLCANCiAgICAgICAgICAgICAgZmFtaWx5ID0gImJpbm9taWFsIiwNCiAgICAgICAgICAgICAgZGF0YSA9IGRmX3RyYWluKSANCg0KIyBWZWFtb3MgdW4gcmVzdW1lbiBkZWwgcmVzdWx0YWRvDQpzdW1tYXJ5KG1vZGVsbykNCg0KYGBgDQoNClVuIGNvbnRyb2wgcXVlIHBvZGVtb3MgaGFjZXIgZW4gZXN0ZSBwdW50byBlcyBhbmFsaXphciBsb3MgcmVzdWx0YWRvcyBwYXJhIGFuYWxpemFyIHF1ZSBubyBoYXlhICoqbXVsdGljb2xpbmVhbGlkYWQqKi4NCg0KTGEgbXVsdGljb2xpbmVhbGlkYWQgZXMgdW4gZWZlY3RvIG5vIGRlc2VhZG8gZW50cmUgbG9zIGRhdG9zLCBwb3JxdWUgY29ycmVtb3MgZWwgcmllc2dvIGRlIGVuY29udHJhciByZWxhY2lvbmVzICpzb3NwZWNob3NhbWVudGUqIGZ1ZXJ0ZXMgZW50cmUgZG9zIG8gbcOhcyB2YXJpYWJsZXMgY3VhbmRvIGVuIHJlYWxpZGFkIHNvbiBsYSBtaXNtYSBjb3NhIGV4cHJlc2FkYSBkZSBkaWZlcmVudGUgbWFuZXJhLCBjb21vIHBvciBlamVtcGxvIGxhIGFudGlnw7xlZGFkIGRlIHVuYSBwZXJzb25hIGV4cHJlc2FkYSBlbiBhw7FvcyB5IHN1IGJvbm8gZGUgYW50aWfDvGVhZGQsIG8gY3VhbmRvIHVuYSB2YXJpYWJsZSBzdXJnZSBkZWwgY8OhbGN1bG8gZGUgb3RyYSwgY29tbyBlbCDDjW5kaWNlIGRlIE1hc2EgTXVzY3VsYXIgeSBlbCBwZXNvLg0KDQpFbnRvbmNlcywgbG8gcXVlIGJ1c2NhbW9zIGVzIHF1ZSBsYSByZWxhY2nDs24gZW50cmUgbGFzIHZhcmlhYmxlcyBzZWEgbG8gKm3DoXMgc2FuYSBwb3NpYmxlKi4gVW5hIGZvcm1hIGRlIGRldGVjdGFyIHNpIGhheSBtdWx0Y29saW5lYWxpZGFkIG8gbm8gZXMgY2FsY3VsYW5kbyBlbCAqKlZJRioqIChWYXJpYW5jZSBJbmZsYXRpb24gRmFjdG9yKSBjb24gbGEgZnVuY2nDs24gYHZpZigpYCBkZWwgcGFxdWV0ZSBgY2FyYC4NCg0KYGBge3IgdmlmfQ0KIyBVc2FyIGxhIGZ1bmNpw7NuIHZpZigpIGVuIGRmX3RyYWluDQp2aWYobW9kZWxvKQ0KYGBgDQoNCsK/Q8OzbW8gaW50ZXJwcmV0YW1vcyBsb3MgcmVzdWx0YWRvcz8gRGUgbGEgc2lndWllbnRlIG1hbmVyYToNCg0KfCAgICAgVklGICAgICB8ICAgICAgIEludGVycHJldGFjacOzbiAgICAgICB8DQp8Oi0tLS0tLS0tLS0tOnw6LS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS06fA0KfCAgICAgIDEgICAgICB8ICBObyBoYXkgbXVsdGljb2xpbmVhbGlkYWQgIHwNCnwgRW50cmUgMSB5IDUgfCBNdWx0aWNvbGluZWFsaWRhZCBtb2RlcmFkYSB8DQp8ICAgNSBvIG3DoXMgICB8ICAgQWx0YSBNdWx0aWNvbGluZWFsaWRhZCAgIHwNCg0KIyMjIENhbGN1bGFuZG8gbGFzIHByb2JhYmlsaWRhZGVzDQoNCkFob3JhIGxvIHF1ZSB0ZW5lbW9zIGVzIGN1w6FsZXMgc29uIGxhcyB2YXJpYWJsZXMgc2lnbmlmaWNhdGl2YXMgcGFyYSBlbCBtb2RlbG8gdmFtb3MgYSBjb252ZXJ0aXIgbG9zIHJlc3VsdGFkb3MgZW4gcHJvYmFiaWxpZGFkZXMuIEFzw60gcXVlIGFob3JhIHZhbW9zIGEgcmVhbGl6YXIgdHJlcyBwYXNvczoNCg0KMS4gIEVzdGltYXIgbGFzIHByb2JhYmlsaWRhZGVzDQoyLiAgQXNpZ25hciBsYXMgcHJvYmFiaWxpZGFkZXMgYSB1bmEgY29sdW1uYSBxdWUgbGxhbWFyZW1vcyBgc2NvcmVgLg0KMy4gIENyZWFyIHVuYSBudWV2YSBjb2x1bW5hIChgcHJlZGljY2lvbmApIGRvbmRlIHNpIGBzY29yZWAgZXMgbWF5b3IgcXVlIGAwLjVgIGVzY3JpYmEgdW4gYDFgLCB5IGRlIGxvIGNvbnRyYXJpbywgYDBgLg0KDQpSZWFsaWNlbW9zIGVsIHByaW1lciBwYXNvLg0KDQpgYGB7cn0NCiMgQ2FjdWxhciBsYXMgcHJvYmFiaWxpZGFkZXMgZGUgZGZfdHJhaW4NCnByZWRfdHJhaW4gPC0gcHJlZGljdChtb2RlbG8sICAgICAgICAgICAgICAjIEbDs3JtdWxhcyBkZWwgbW9kZWxvDQogICAgICAgICAgICAgICAgICAgICAgbmV3ZGF0YSA9IGRmX3RyYWluLCAgIyBGdWVudGUgZGUgZGF0b3MgDQogICAgICAgICAgICAgICAgICAgICAgdHlwZSA9ICJyZXNwb25zZSIpICAgDQoNCiMgQ2FsY3VsYXIgbGFzIHByb2JhYmlsaWRhZGVzIGRlIGRmX3Rlc3QNCnByZWRfdGVzdCA8LSBwcmVkaWN0KG1vZGVsbywgbmV3ZGF0YSA9IGRmX3Rlc3QsIHR5cGUgPSAicmVzcG9uc2UiKQ0KYGBgDQoNCkxvIHF1ZSBvYnRlbmVtb3MgZW4gZWwgcGFzbyBhbnRlcmlvciBlcyBlcyB1biBncmFuIGxpc3RhZG8gZGUgcHJvYmFiaWxpZGFkZXMgKGFzZWd1cmFyc2UgcXVlIGxvcyByZXN1bHRhZG9zIGVzdMOpbiBlbnRyZSAwIHkgMSkuIFZlYW1vcyBsb3MgcHJpbWVyb3MgMjAgcmVzdWx0YWRvcyBkZSBgcHJlZF90ZXN0YC4NCg0KYGBge3J9DQojIFZlciBsb3MgcHJpbWVyb3MgMjAgcmVzdWx0YWRvcw0KcHJlZF90ZXN0WzE6MjBdDQoNCiMgQ29udHJvbGFyIHF1ZSB0b2RvcyBsb3MgcmVzdWx0YWRvcyBlc3TDqW4gZW50cmUgMCB5IDEuDQpzdW1tYXJ5KHByZWRfdGVzdCkNCmBgYA0KDQpBaG9yYSB0ZW5lbW9zIHF1ZSBhc2lnbmFyIGVzb3MgcmVzdWx0YWRvcyBxdWUgc29uIHVuIHZlY3RvciBhIHVuYSBjb2x1bW5hIHF1ZSBsbGFtYXJlbW9zIGBzY29yZWAuIFVuYSBmb3JtYSBkZSBoYWNlcmxvIGVzIGxhIHNpZ3VpZW50ZToNCg0KYGBge3Igc2NvcmV9DQojIENyZWFyIGxhIGNvbHVtbmEgc2NvcmUgZW4gZGZfdHJhaW4NCmRmX3RyYWluJHNjb3JlIDwtIHByZWRfdHJhaW4NCg0KIyBSZXBldGlyIGNvbiBkZl90ZXN0DQpkZl90ZXN0JHNjb3JlIDwtIHByZWRfdGVzdA0KDQojIFZlciBlbCBjb250ZW5pZG8gZGUgZGZfdGVzdCBjb24gZ2xpbXBzZSgpDQpnbGltcHNlKGRmX3Rlc3QpDQpgYGANCg0KUG9yIMO6bHRpbW8gcGFyYSBzaW1wbGlmaWNhciBsb3MgcmVzdWx0YWRvcyB2YW1vcyBhIGNyZWFyIHVuYSBjb2x1bW5hIHF1ZSBzZSBsbGFtYXLDoSBgcHJlZGljY2lvbmAgZW4gbGEgY3VhbCBwb25kcmVtb3MgdW4gMSBzaSBlbCB2YWxvciBkZSBsYSBjZWxkYSBkZSBsYSBjb2x1bW5hIGBzY29yZWAgZXMgbWF5b3IgYSAwLjUsIHkgdW4gMCBjdWFuZG8gZWwgdmFsb3IgZGUgYHNjb3JlYCBzZWEgbWVub3IgYSAwLjUuDQoNCmBgYHtyIHByZWRpY2Npb259DQojIENyZWFyIHVuYSBjb2x1bW5hIGxsYW1hZGEgcHJlZGljY2lvbiBlbiBkZl90cmFpbg0KZGZfdHJhaW4gPC0gZGZfdHJhaW4gJT4lIA0KICBtdXRhdGUocHJlZGljY2lvbiA9IGlmX2Vsc2Uoc2NvcmUgPiAwLjUsIDEsIDApKQ0KDQojIFJlcGV0aXIgcGFyYSBkZl90ZXN0DQoNCmRmX3Rlc3QgPC0gZGZfdGVzdCAlPiUgDQogIG11dGF0ZShwcmVkaWNjaW9uID0gaWZfZWxzZShzY29yZSA+IDAuNSwgMSwgMCkpDQoNCiMgVXNlbW9zIGxhIGZ1bmNpw7NuIFZpZXcoKSBjb24gZGZfdGVzdA0KVmlldyhkZl90ZXN0KQ0KYGBgDQoNCkFob3JhIHBvZGVtb3MgY29udHJvbGFyIG51ZXN0cmFzIHByZWRpY2Npb25lcyBjb250cmEgbGEgdmFyaWFibGUgdGFyZ2V0IG9yaWdpbmFsIHkgcmV2aXNhciBxdcOpIHRhbiBiaWVuIG5vcyBmdWUuDQoNCiMjIDYuIENvbnRyb2xhciBsb3MgcmVzdWx0YWRvcw0KDQpQYXJhIGNvbnRyb2xhciBsb3MgcmVzdWx0YWRvcyB2YW1vcyBhIGhhY2VyIHRyZXMgY29zYXMuIENhbGN1bGFyIGxhICoqTWF0cml6IGRlIENvbmZ1c2nDs24qKiwgbGEgKipDdXJ2YSBST0MqKiB5IHBvciDDumx0aW1vIGVsICoqZ2FpbioqIHkgZWwgKipsaWZ0KiouDQoNCiMjIyBNYXRyaXogZGUgY29uZnVzacOzbg0KDQpMYSBtYXRyaXogZGUgY29uZnVzacOzbiBlcyB1bmEgdGFibGEgZGUgZG9ibGUgZW50cmFkYSBlbiBkb25kZSBsbyBxdWUgaGFjZW1vcyBlcyBjb250cmFzdGFyIGxvcyBhY2llcnRvcyBkZWwgbW9kZWxvLCBjb250cmEgbG9zIGZhbGxvcy4NCg0KIVtNYXRyaXogZGUgQ29uZnVzacOzbl0oaHR0cHM6Ly8yLmJwLmJsb2dzcG90LmNvbS8tRXZTWERvdFRPd2MvWE1mZU9HWi1DVkkvQUFBQUFBQUFFaUUvb2VQRmZ2aGZPUU0xMWRnUm45RmtQeGxlZ0NYYmdPRjRRQ0xjQkdBcy9zMTYwMC9jb25mdXNpb25NYXRyeGlVcGRhdGVkLmpwZykNCg0KRW4gcHJpbmNpcGlvIG5vcyB2YW1vcyBhIGVuZm9jYXIgw7puaWNhbWVudGUgZW4gbGEgZGlhZ29uYWwuIExvcyBhY2llcnRvcyAqcG9zaXRpdm9zKiB5IGxvcyBhY2llcnRvcyAqbmVnYXRpdm9zLCogbG8gcXVlIG5vcyB2YSBhIGRhciBlbCAqKkFjY3VyYWN5KiogZGVsIG1vZGVsby4gVG9kbyBsbyBxdWUgdmVtb3MgZW4gbG9zIG3DoXJnZW5lcyBkZSBsYSBtYXRyaXogc29uIGRpc3RpbnRhcyBtw6l0cmljYXMgcXVlIHBvZGVtb3MgY2FsY3VsYXIgY29uIGVzdGEgdGFibGEuDQoNCkVsICoqQWNjdXJhY3kqKiBsbyBxdWUgbm9zIGluZGljYSBlcyBlbCAqdG90YWwgZGUgYWNpZXJ0b3MgKHZlcmRhZG9yZXMgeSBuZWdhdGl2b3MsIFRQIHkgVE4gcmVzcGVjdGl2YW1lbnRlKSBzb2JyZSBlbCB0b3RhbCBkZSBjYXNvcyouIEVzZSBwb3JjZW50YWplIGRlIGFjaWVydG9zIGVzIHVuYSBkZSBsYXMgY29zYXMgcXVlIG5vcyBpbnRlcmVzYSBhbmFsaXphci4NCg0KUGFyYSBjcmVhciB1bmEgbWF0cml6IGRlIGNvbmZ1c2nDs24gdGVuZW1vcyBxdWUgY3JlYXIgdW5hIHRhYmxhIGRlIGRvYmxlIGVudHJhZGEsIGVuIGRvbmRlIHBvbmdhbW9zIHBvciB1biBsYWRvIGxvcyB2YWxvcmVzIGRlIGxhIGNvbHVtbmEgYGxlZnRgIHkgcG9yIG90cm8gbGFkbyBsb3MgdmFsb3JlcyBkZSBsYSBjb2x1bW5hIGBwcmVkaWNjaW9uYCB5IHZlYW1vcyBsYXMgY29pbmNpZGVuY2lhcy4NCg0KYGBge3IgdGFibGF9DQojIENyZWFyIHVuYSBtYXRyaXogY29uIGxvcyBkYXRvcyBkZSBkZl90cmFpbg0KbWF0cml4X2NvbmZfdHJhaW4gPC0gdGFibGUoZGZfdHJhaW4kbGVmdCwgZGZfdHJhaW4kcHJlZGljY2lvbikNCg0KIyBSZXBldGlyIGNvbiBkZl90ZXN0DQptYXRyaXhfY29uZl90ZXN0IDwtIHRhYmxlKGRmX3Rlc3QkbGVmdCwgZGZfdGVzdCRwcmVkaWNjaW9uKQ0KDQojIFZlciBsYSB0YWJsYSANCm1hdHJpeF9jb25mX3Rlc3QNCmBgYA0KDQpFbCBwYXF1ZXRlIGBjYXJldGAgdGllbmUgdW5hIGZ1bmNpw7NuIHF1ZSBub3MgYnJpbmRhIHRvZGEgbGEgaW5mb3JtYWNpw7NuIHF1ZSBuZWNlc2l0YW1vcywgeSBlcyBsYSBmdW5jacOzbiBgY29uZnVzaW9uTWF0cml4KClgLg0KDQpgYGB7ciBtYXRyaXp9DQojIFZlciBsYXMgbcOpdHJpY2FzIGRlIG1hdHJpeF9jb25mX3RyYWluDQpjb25mdXNpb25NYXRyaXgobWF0cml4X2NvbmZfdHJhaW4pDQpgYGANCg0KTHVlZ28gcmVwZXRpbW9zIGVzdGUgcGFzbyBjb24gYG1hdHJpeF9jb25mX3Rlc3RgLg0KDQpgYGB7ciBtYXRyaXoxfQ0KIyBWZXIgbGFzIG3DqXRyaWNhcyBwYXJhIG1hdHJpeF9jb25mX3Rlc3QNCmNvbmZ1c2lvbk1hdHJpeChtYXRyaXhfY29uZl90ZXN0KQ0KYGBgDQoNCkxhIHJhesOzbiBwb3IgbGEgcXVlIGhhY2Vtb3MgZXN0ZSBwYXNvIHBhcmEgYW1ib3MgZGF0YSBmcmFtZXMgZXMgcGFyYSB0ZW5lciB1biBjb250cm9sIGRlIGxhIGNhbGlkYWQgZGVsIG1vZGVsby4gTG8gZXNwZXJhYmxlIGVzIHF1ZSBlbCAqYWNjdXJhY3kqIGRlbCBtb2RlbG8gZGUgZW50cmVuYW1pZW50byBzZWEgdW4gcG9jbyBtw6FzIGFsdG8gcXVlIGVuIGVsIGRhdGEgZnJhbWUgZGUgdmFsaWRhY2nDs24gcG9ycXVlIGVsIG1vZGVsbyBzZSBjb25zdHJ1ecOzIHNvYnJlIGVzb3MgZGF0b3MuDQoNClNpIGh1YmllcmFuIGRpZmVyZW5jaWFzIHNpZ25pZmljYXRpdmFzLCBjb21vIHVuYSBhbXBsaWEgZGlmZXJlbmNpYSBlbnRyZSBhbWJhcyAqYWNjdXJhY2llcyosIG8gcXVlIGxvcyByZXN1bHRhZG9zIHNlYW4gbXVjaG8gbWVqb3JlcyBlbiB0ZXN0aW5nIHF1ZSBlbiB0cmFpbmluZyBlc28gcHVlZGUgcmVmbGVqYXIgcXVlIGVsIG1vZGVsbyB0ZW5nYSBwcm9ibGVtYXMgY29tbyBlbCAqb3ZlcmZpdHRpbmcqIG8gcXVlIG5lY2VzaXRlbW9zIG90cm8gYWxnb3JpdG1vIHBhcmEgb2J0ZW5lciBtZWpvcmVzIHJlc3VsdGFkb3MuDQoNCkFob3JhIHByb2JhcmVtb3Mgb3RybyBjb250cm9sIHNvYnJlIGxvcyByZXN1bHRhZG9zIHF1ZSBlcyBsYSAqKkN1cnZhIFJPQy4qKg0KDQojIyMgQ3VydmEgUk9DDQoNCkxhICoqQ3VydmEgUk9DKiosIGVzIHVuYSBmb3JtYSB2aXN1YWwgZGUgY2FsY3VsYXIgZWwgKipBVUMqKiAoKkFyZWEgVW5kZXIgdGhlIEN1cnZlKiwgZWwgw6FyZWEgYmFqbyBsYSBjdXJ2YSkuIEludGVybmFtZW50ZSBsbyBxdWUgaGFjZSBlc3RlIGdyw6FmaWNvIGVzIG9yZGVuYXIgbGFzIHByb2JhYmlsaWRhZGVzIGRlIG1heW9yIGEgbWVub3IsIHkgYSBtZWRpZGEgcXVlIHRlbmVtb3MgdW4gKnBvc2l0aXZvIHZlcmRhZGVybyogKGVsIGVtcGxlYWRvIHNlIGZ1ZSB5IG5vc290cm9zIHByZWRlY2ltb3MgcXVlIHNlIGliYSkgbGEgY3VydmEgc2UgbXVldmUgaGFjaWEgYXJyaWJhLiBDb24gY2FkYSBmYWxzbyBwb3NpdGl2bywgbGEgY3VydmEgc2UgdmEgbW92aWVuZG8gYSBsYSBkZXJlY2hhLg0KDQpQYXJhIGVzdG8gdmFtb3MgYSB1c2FyIGxhIGxpYnJlcsOtYSBgcFJPQ2AuDQoNCj4gVmlkZW86IGPDs21vIHNlIGNvbnN0cnV5ZSBsYSBjdXJ2YSBST0M6IDxodHRwczovL3lvdXR1LmJlL09qV2V3N1c0S25ZPi4NCg0KUGFyYSBzaW1wbGlmaWNhciB2YW1vcyBhIHJlYWxpemFyIGVzdGUgcHJvY2VzbyDDum5pY2FtZW50ZSBjb24gbG9zIGRhdG9zIGRlIHRlc3Rpbmc6DQoNCmBgYHtyIGN1cnZhLXJvY30NCiMgQ2FsY3VsYXIgbGEgY3VydmEgUk9DDQpwUk9DX29iaiA8LSByb2MoZGZfdGVzdCRsZWZ0LCBkZl90ZXN0JHNjb3JlLA0KICAgICAgICAgICAgICAgIHNtb290aGVkID0gRkFMU0UsDQogICAgICAgICAgICAgICAgIyBhcmd1bWVudG9zIGRlbCBpbnRlcnZhbG8gZGUgY29uZmlhbnphDQogICAgICAgICAgICAgICAgY2k9VFJVRSwgY2kuYWxwaGE9MC45LCBzdHJhdGlmaWVkPUZBTFNFLA0KICAgICAgICAgICAgICAgICMgYXJndW1lbnRvcyBkZWwgZ3LDoWZpY28NCiAgICAgICAgICAgICAgICBwbG90PVRSVUUsIGF1Yy5wb2x5Z29uPVRSVUUsIG1heC5hdWMucG9seWdvbj1UUlVFLCBncmlkPVRSVUUsDQogICAgICAgICAgICAgICAgcHJpbnQuYXVjPVRSVUUsIHNob3cudGhyZXM9VFJVRSkNCg0KYGBgDQoNCkVsIHZhbG9yIHF1ZSBtdWVzdHJhIGRlbnRybyBkZWwgZ3LDoWZpY28sIHJlcHJlc2VudGEgZWwgcG9yY2VudGFqZSBkZSBsYSBzdXBlcmZpY2llIGRlbCBncsOhZmljbyBlc3TDoSBjdWJpZXJ0byBwb3IgbGEgQ3VydmEgUk9DIGRlbCBtb2RlbG8uIE1pZW50cmFzIG1heW9yIHNlYSBlc2UgcG9yY2VudGFqZSwgbWVqb3IuDQoNCiMjIyBHYWluIHkgbGlmdA0KDQpDdWFuZG8gZ3JhZmljYW1vcyBsYSBjdXJ2YSBST0MsIFIgaW50ZXJuYW1lbnRlIG9yZGVuYSBsYXMgcHJlZGljY2lvbmVzIGRlIG1heW9yIHByb2JhYmlsaWRhZCBhIG1lbm9yLiBQYXJhIGNhbGN1bGFyIGVsICoqbGlmdCoqIHkgZWwgKipnYWluKiogaGFjZSBsbyBtaXNtbywgeSBkaXZpZGUgYWwgZGF0YXNldCBlbiAqKmRlY2lsZXMqKiAobyBzZWEgcXVlIGxvIGRpdmlkZSBlbiAxMCBwYXJ0ZXMgaWd1YWxlcykuDQoNCkVsICoqZ2FpbioqLCAobyAqZ2FuYW5jaWEqIGVuIGVzcGHDsW9sKSwgbG8gcXVlIG1pZGUgZXMgcXXDqSBwcm9wb3JjacOzbiBkZSBhY2llcnRvcyBhY3VtdWxhZGFzIHBhcmEgY2FkYSBkZWNpbCBkZSBsYXMgcHJlZGljY2lvbmVzLg0KDQpFbCAqKmxpZnQqKiwgKG8gKmxpZnQqIGVuIGVzcGHDsW9sKSwgbG8gcXVlIG1pZGUgZXMgY3XDoW50YXMgdmVjZXMgbWVqb3JhIGxhcyBwcmVkaWNjaW9uZXMgZWwgbW9kZWxvLCByZXNwZWN0byBkZSBubyB0ZW5lciBuaW5nw7puIG1vZGVsby4NCg0KVXNhcmVtb3MgdW5hIGZ1bmNpw7NuIGRlbCBwYXF1ZXRlIGBmdW5Nb2RlbGluZ2AgZGVzYXJyb2xsYWRvIHBvciBQYWJsbyBDYXNhcy4gTGEgZnVuY2nDs24gYGdhaW5fbGlmdCgpYCBub3MgaGFjZSBsb3MgZ3LDoWZpY29zIGRlICpnYWluKiB5IGRlICpsaWZ0KiB5IG5vcyBnZW5lcmEgdW5hIHRhYmxhIGNvbiBsb3MgcmVzdWx0YWRvcy4NCg0KYGBge3IgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRX0NCiMgQ2FybGN1bGFyIGVsIGdhaW4geSBlbCBsaWZ0IGRlIGRmX3Rlc3QNCmdhaW5fbGlmdChkYXRhID0gZGZfdGVzdCwgc2NvcmUgPSAic2NvcmUiLCB0YXJnZXQgPSAibGVmdCIpDQpgYGANCg0KKirCv1F1w6kgaGF5IGRlIGZvbmRvIGVuIGVzdGFzIG3DqXRyaWNhcz8qKg0KDQpUYW50byBjb24gbGEgY3VydmEgUk9DLCBjb24gZWwgZ2FpbiwgeSBjb24gZWwgbGlmdCwgbG8gcXVlIGJ1c2NhbiBtZWRpciwgZXMgKnF1w6kgdGFudG8gbWVqb3JhbiBsYXMgcHJvYmFiaWxpZGFkZXMgbG9zIG1vZGVsb3MqIHJlc3BlY3RvIGRlIG5vIGhhY2VyIG5pbmfDum4gY8OhbGN1bG8uDQoNCkRlc2RlIGVsIHB1bnRvIGRlIHZpc3RhIGRlIGxhIHRlb3LDrWEgZGUgbGEgcHJvYmFiaWxpZGFkLCBlbiBzdSBmb3JtYSBtw6FzIHNpbXBsZSwgdW4gZW1wbGVhZG8gdGllbmUgNTAlIGNoYW5jZXMgZGUgaXJzZSwgeSA1MCUgZGUgY2hhbmNlcyBkZSBxdWVkYXJzZSBlbiBsYSBlbXByZXNhLiBFc3RhIGZhbHRhIGRlIG1vZGVsbywgZXMgZGUgYWxndW5hIG1hbmVyYSB1biBtb2RlbG8gKmFsZWF0b3JpbyogcG9ycXVlIGRlamFtb3MgYWwgYXphciBsYSBvY3VycmVuY2lhIGRlIHJlbnVuY2lhcy4NCg0KUG9yIGVqZW1wbG8gZWwgKmxpZnQqIG5vcyBkaWNlIGVuIGNhZGEgZGVjaWwsIGN1w6FudGFzIHZlY2VzIG1lam9yIGVzIGxhIHByZWRpY2Npw7NuIHJlc3BlY3RvIGRlbCBtb2RlbG8gYWxlYXRvcmlvLg0KDQojIEFuw6FsaXNpcyBjb21wbGVtZW50YXJpb3MNCg0KIVtdKGh0dHBzOi8vY29tcGxlbWVudGFyeXRyYWluaW5nLm5ldC93cC1jb250ZW50L3VwbG9hZHMvMjAxNC8wNy9xdW90ZS1lc3NlbnRpYWxseS1hbGwtbW9kZWxzLWFyZS13cm9uZy1idXQtc29tZS1hcmUtdXNlZnVsLWdlb3JnZS1lLXAtYm94LTIxMjcxMS5qcGcpDQoNCkVuIHBhcnRpY3VsYXIgZXN0ZSBtb2RlbG8gbm9zIGFycm9qw7MgYnVlbm9zIHJlc3VsdGFkb3MuIFBlcm8gcHVlZGUgb2N1cnJpciBxdWUgdGVuZ2Ftb3MgdW4gbW9kZWxvIHF1ZSBubyB0ZW5nYSB0YW4gYnVlbmEgcGVyZm9ybWFuY2UgcGVybyBxdWUgbm9zIHB1ZWRlIHNlciDDunRpbCBkZSB0b2RhcyBtYW5lcmFzLg0KDQojIyBUb2RvcyBsb3MgZW1wbGVhZG9zIHNvbiBpZ3VhbGVzIHBlcm8gYWxndW5vcyBzb24gbcOhcyBpZ3VhbGVzIHF1ZSBvdHJvcw0KDQpBbGdvIGludGVyZXNhbnRlIHF1ZSBzdXJnZSBkZWwgYW7DoWxpc2lzIGV4cGxvcmF0b3Jpbywgc29uIGxvcyB0cmVzIGdydXBvcyBub3RvcmlvcyBxdWUgdGVuZW1vcyBlbnRyZSBsb3MgZW1wbGVhZG9zIHF1ZSBzZSB2YW4uDQoNClRlbmVtb3MgdW4gZ3J1cG8gbGxhbWF0aXZvLCBxdWUgcmVwcmVzZW50YW4gYSBsb3MgZW1wbGVhZG9zIGRlICphbHRvIGRlc2VtcGXDsW8qIHkgZGUgKmFsdG8gbml2ZWwgZGUgc2F0aXNmYWNjacOzbiouDQoNCmBgYHtyIGV2YWwtc2F0aXMsIGZpZy5zaG93PSdoaWRlJywgd2FybmluZz1GQUxTRSwgbWVzc2FnZT1GQUxTRX0NCmdncGxvdChkYXRvcywgYWVzKHggPSBsYXN0X2V2YWx1YXRpb24sIHkgPSBzYXRpc2ZhY3Rpb25fbGV2ZWwsIGNvbG9yID0gZmFjdG9yKGxlZnQpKSkrDQogIGdlb21fcG9pbnQoYWxwaGEgPSAwLjcpKw0KICBzY2FsZV9jb2xvcl9tYW51YWwodmFsdWVzID0gYygiI0JGQzlDQSIsIiMyODc0QTYiKSkgIyBBc2lnbm8gbWFudWFsbWVudGUgbG9zIGNvbG9yZXMgYSBsb3MgcHVudG9zDQpgYGANCg0KVmFtb3MgYSBkaXZpZGlyIGEgbG9zIGVtcGxlYWRvcyBkZWwgYXJjaGl2byBlbiAzIGdydXBvcywgcGFyYSBkZXRlcm1pbmFyIHF1w6kgdGFuIGJ1ZW5vIGVzIGVsIG1vZGVsbyBjb24gbG9zICp0b3AgZGUgbG8gdG9wKiwgbyBzZWEgY29uIGxhcyBwZXJzb25hcyBkZSBhbHRvIGRlc2VtcGXDsW8geSBhbHRvIG5pdmVsIGRlIHNhdGlzZmFjY2nDs24uDQoNClBhcmEgZWxsbywgaGFyZW1vcyB1biBhbsOhbGlzaXMgZGUgY2x1c3RlcnMsIGNvbiB1biBhbGdvcml0bW8gcXVlIHNlIGxsYW1hIGBrLW1lYW5zYCwgcXVlIGVzIHVubyBkZSBsb3MgbcOhcyBzZW5jaWxsb3MgcGFyYSBlbmNvbnRyYXIgZ3J1cG9zLg0KDQpgYGB7ciBjbHVzdGVyfQ0KbGlicmFyeShnZ3RoZW1lcykNCg0KIyBTZWxlY2Npb25hbW9zIGxhcyB2YXJpYWJsZXMgcGFyYSBlbGVnaXIgbG9zIGNsdXN0ZXJzDQp2YXJpYWJsZXNfY2x1c3RlciA8LSBkZl90ZXN0ICU+JQ0KICBzZWxlY3QobGFzdF9ldmFsdWF0aW9uLCBzYXRpc2ZhY3Rpb25fbGV2ZWwpDQoNCiMgUHJlcGFybyBsb3MgZGF0b3MgcGFyYSBoYWNlciBlbCBjw6FsY3Vsbw0KdmMgPC0gc2NhbGUodmFyaWFibGVzX2NsdXN0ZXIpDQoNCiMgRGVmaW5vIHVuYSBzZW1pbGxhIHBhcmEgcmVwZXRpciByZXN1bHRhZG9zDQpzZXQuc2VlZCg4NykgDQoNCiMgQ29ycm8gZWwgYWxnb3JpdG1vIGRlIGNsdXN0ZXJpbmcNCmZpdF92YyA8LSBrbWVhbnModmMsIDMpDQoNCiMgQWdyZWdvIGxvcyBjbHVzdGVycyBhanVzdGFkb3MgKGNhbGN1bGFkb3MpIGFsIGRhdGFzZXQNCmRmX3Rlc3QkY2x1c3RlciA8LSBmaXRfdmMkY2x1c3Rlcg0KDQojIFZpc3VhbGl6byBsb3MgcmVzdWx0YWRvcw0KZ2dwbG90KGRmX3Rlc3QsIGFlcyh4ID0gbGFzdF9ldmFsdWF0aW9uLA0KICAgICAgICAgICAgICAgICAgICB5ID0gc2F0aXNmYWN0aW9uX2xldmVsLCANCiAgICAgICAgICAgICAgICAgICAgY29sb3IgPSBmYWN0b3IoY2x1c3RlcikpKSArDQogIGdlb21fcG9pbnQoYWxwaGEgPSAwLjcpIA0KYGBgDQoNCkFob3JhLCB2YW1vcyBhIGZpbHRyYXIgbG9zIHJlc3VsdGFkb3MgZGVsICoqY2x1c3RlciAxKiogcXVlIHNvbiBsYXMgcGVyc29uYXMgZGUgYWx0byBuaXZlbCBkZSBkZXNlbXBlw7FvIHkgZGUgYWx0byBuaXZlbCBkZSBzYXRpc2ZhY2Npw7NuLg0KDQpgYGB7cn0NCiMgRmlsdHJhbW9zIGxvcyBkYXRvcyBkZWwgY2x1c3RlciAxDQptb2RlbG9fYzEgPC0gZGZfdGVzdCAlPiUgDQogIGZpbHRlcihjbHVzdGVyID09IDEpDQoNCmNvbmZfbWF0cml4X2MxIDwtIHRhYmxlKG1vZGVsb19jMSRsZWZ0LCBtb2RlbG9fYzEkcHJlZGljY2lvbikNCg0KIyBWZWFtb3MgdG9kYXMgbGFzIG3DqXRyaWNhcyBkZSBsYSBtYXRyaXogY29uIGVzdGEgZnVuY2nDs24gZGVsIHBhcXVldGUgY2FyZXQNCmNvbmZ1c2lvbk1hdHJpeChjb25mX21hdHJpeF9jMSkNCmBgYA0KDQpFbiBlc3RlIGNhc28gdmVtb3MgcXVlIGVsIG1vZGVsbyBlcyBhw7puIG1lam9yIGNvbiBlc3RlIGdydXBvIGRlIGludGVyw6lzLg0KDQojIE90cm9zIG1vZGVsb3MsIHJlZmVyZW5jaWFzIHkgYXl1ZGENCg0KU2kgcXVpZXJlbiBjb25vY2VyIG90cm9zIG1vZGVsb3MgcHJlZGljdGl2b3MgcHVlZGVuIGNvbnN1bHRhciBsYXMgY2FycGV0YXMgZGUgW0p1bmlvXShodHRwczovL2RyaXZlLmdvb2dsZS5jb20vZHJpdmUvZm9sZGVycy8xazJuS09Bd3UydlVMT19Nd0htVFlrZ3pxV20tZDVJNkk/dXNwPXNoYXJpbmcpIHkgZGUgW0p1bGlvIDIwMjBdKGh0dHBzOi8vZHJpdmUuZ29vZ2xlLmNvbS9kcml2ZS9mb2xkZXJzLzFvRmNCcEhlM2ppaldnOWp4UndDWE1aNFJNXzNtUWctcj91c3A9c2hhcmluZykgcXVlIGVudHJlIGxhcyBzZXNpb25lcyA2IGEgbGEgMTAgcmVhbGl6YW1vcyBkaXN0aW50YXMgc2VzaW9uZXMgc29icmUgbW9kZWxvcyBwcmVkaWN0aXZvcy4NCg0KU2kgcXVpZXJlbiByZXZpc2FyIGxhcyBmdWVudGVzIGRlIGNvbnN1bHRhIHBhcmEgYXJtYXIgZXN0YSBjbGFzZSBsZXMgcmVjb21pZW5kbyBxdWUgdmVhbjoNCg0KIyMgTGlicm9zDQoNCk1heCBLdWhuLCBbVGhlIGNhcmV0IHBhY2thZ2VdKGh0dHBzOi8vdG9wZXBvLmdpdGh1Yi5pby9jYXJldC9pbmRleC5odG1sKQ0KDQpQYWJsbyBDYXNhcywgW0xpYnJvIFZpdm8gZGUgQ2llbmNpYSBkZSBEYXRvc10oaHR0cHM6Ly9saWJyb3Zpdm9kZWNpZW5jaWFkZWRhdG9zLmFpLykNCg0KS2VpdGggTWNOdWx0eSwgW1RoZSBIYW5kYm9vayBvZiBSZWdyZXNzaW9uIE1vZGVsaW5nIGluIFBlb3BsZSBBbmFseXRpY3NdKGh0dHBzOi8vcGVvcGxlYW5hbHl0aWNzLXJlZ3Jlc3Npb24tYm9vay5vcmcvaW5kZXguaHRtbCkNCg0KIyMgRXhwbGljYWNpb25lcyBkZSBsaWZ0IHkgZ2Fpbg0KDQo8aHR0cHM6Ly93d3cubGlzdGVuZGF0YS5jb20vMjAxNS8wNi9yLWZ1bmN0aW9uLWdhaW4tYW5kLWxpZnQtdGFibGUuaHRtbD4gPGh0dHBzOi8vd3d3Lmxpc3RlbmRhdGEuY29tLzIwMTQvMDgvZXhjZWwtdGVtcGxhdGUtZ2Fpbi1hbmQtbGlmdC1jaGFydHMuaHRtbD4NCg0KPGh0dHBzOi8vc3VwZXJ2aXNlZC1tbC1jb3Vyc2UubmV0bGlmeS5hcHAvY2hhcHRlcjE+DQoNCiMjIFJlZ3Jlc2nDs24gbG9nw61zdGljYQ0KDQo8aHR0cHM6Ly9ycHVicy5jb20vSm9hcXVpbl9BUi8yMjk3MzY+IDxodHRwczovL3d3dy5jaWVuY2lhZGVkYXRvcy5uZXQvZG9jdW1lbnRvcy8yN19yZWdyZXNpb25fbG9naXN0aWNhX3NpbXBsZV95X211bHRpcGxlPg0KDQojIyBDdXJ2YXMgUk9DDQoNCjxodHRwczovL3J2aWV3cy5yc3R1ZGlvLmNvbS8yMDE5LzAzLzAxL3NvbWUtci1wYWNrYWdlcy1mb3Itcm9jLWN1cnZlcy8+DQoNCiMjIEF5dWRhDQoNClkgc2kgbmVjZXNpdGFuIGF5dWRhIGNvbiBsYSBwcsOhY3RpY2EgcHVlZGVuIGFjdWRpciBhbCBjYW5hbCAjYXV4aWxpbyBlbiBbU2xhY2tdKGh0dHBzOi8vam9pbi5zbGFjay5jb20vdC9yNGhyL3NoYXJlZF9pbnZpdGUvenQtb2NyaXl4NWUtbnFYdXdXZUR5T0ttMklDVUpqaHU2ZykNCg0KIVtdKEFyY2hpdm9zL2F1eGlsaW8uanBnKQ0K

Análisis Predictivo de Turnover

Sergio García Mora | Data 4HR

11/10/2022

Análisis Predictivos de Rotación de Personal

Prólogo

Introducción

¿Qué es un análisis predictivo?

Probabilidad

Regresión Logística

¿Cómo se hace un análisis predictivo?

Paquetes

Pasos de un análisis predictivo

Desarrollo del análisis predictivo

1. Definir la variable `target`

2. Dividir en training y testing

3. Explorar los datos

4. Controlar los sesgos

5. Entrenar el modelo

Calculando las probabilidades

6. Controlar los resultados

Matriz de confusión

Curva ROC

Gain y lift

Análisis complementarios

Todos los empleados son iguales pero algunos son más iguales que otros

Otros modelos, referencias y ayuda

Libros

Explicaciones de lift y gain

Regresión logística

Curvas ROC

Ayuda

Análisis Predictivo de Turnover

Sergio García Mora | Data 4HR

11/10/2022

Análisis Predictivos de Rotación de Personal

Prólogo

Introducción

¿Qué es un análisis predictivo?

Probabilidad

Regresión Logística

¿Cómo se hace un análisis predictivo?

Paquetes

Pasos de un análisis predictivo

Desarrollo del análisis predictivo

1. Definir la variable target

2. Dividir en training y testing

3. Explorar los datos

4. Controlar los sesgos

5. Entrenar el modelo

Calculando las probabilidades

6. Controlar los resultados

Matriz de confusión

Curva ROC

Gain y lift

Análisis complementarios

Todos los empleados son iguales pero algunos son más iguales que otros

Otros modelos, referencias y ayuda

Libros

Explicaciones de lift y gain

Regresión logística

Curvas ROC

Ayuda

1. Definir la variable `target`