Preguntas Guía

i) ¿Qué es Supervised Machine Learning y cuáles son algunas de sus aplicaciones en Inteligencia de Negocios?

Supervised learning, also known as supervised machine learning, is a subcategory of machine learning and artificial intelligence. It is defined by its use of labeled datasets to train algorithms that to classify data or predict outcomes accurately. As input data is fed into the model, it adjusts its weights until the model has been fitted appropriately, which occurs as part of the cross validation process. Supervised learning helps organizations solve for a variety of real-world problems at scale, such as classifying spam in a separate folder from your inbox.

ii) ¿Cuáles son los principales algoritmos de Supervised Machine Learning?

En los procesos de machine learning supervisado se utilizan varios algoritmos y técnicas de cálculo. A continuación, se incluyen breves explicaciones de algunos de los métodos de aprendizaje más utilizados, generalmente calculados mediante el uso de programas como R o Python:

1. Redes Neuronales:

Las redes neuronales son modelos utilizados en el ámbito del aprendizaje profundo para procesar datos imitando la interconexión de neuronas en el cerebro humano. Estas redes consisten en capas de nodos, donde cada nodo recibe entradas, aplica ponderaciones, un sesgo y produce una salida. A través del aprendizaje supervisado, estas redes ajustan sus conexiones basadas en una función de pérdida, buscando minimizar errores y mejorar la precisión del modelo.

2. Naive Bayes:

Naive Bayes es un método de clasificación que se basa en el principio de independencia condicional de clases, según el Teorema de Bayes. Este enfoque asume que las características predictoras son independientes entre sí, lo que lo hace eficaz en la clasificación de textos, sistemas de recomendación y detección de correo no deseado. Se divide en tres tipos: Multinomial, Bernoulli y Gaussiano.

3. Regresión Lineal:

La regresión lineal busca entender la relación entre una variable dependiente y una o más variables independientes para realizar predicciones. Se ajusta a través del método de mínimos cuadrados, intentando trazar una línea recta que mejor se ajuste a los datos. Si hay una variable independiente, se llama regresión lineal simple; si hay múltiples variables independientes, es una regresión lineal múltiple.

4. Regresión Logística:

La regresión logística se emplea cuando la variable dependiente es categórica, es decir, tiene resultados binarios como “verdadero” o “falso”. A diferencia de la regresión lineal, que se utiliza con variables continuas, la regresión logística se aplica principalmente en problemas de clasificación binaria, como la detección de correo no deseado.

5. Máquinas de Vectores de Soporte (SVM):

Las SVM son modelos de aprendizaje supervisado utilizados para clasificación y regresión. Buscan un hiperplano que maximice la distancia entre dos clases de puntos de datos, actuando como límite de decisión. Esto permite separar eficientemente las clases de puntos de datos en el espacio.

6. K Vecino Más Cercano (KNN):

El algoritmo KNN clasifica los puntos de datos según la proximidad a otros puntos de datos conocidos. Se basa en la suposición de que puntos similares están cerca unos de otros. Utiliza la distancia euclidiana para calcular la similitud y asignar una categoría basada en la mayoría de las categorías de los vecinos más cercanos.

7. Bosque Aleatorio:

El bosque aleatorio es un algoritmo flexible de aprendizaje supervisado que combina múltiples árboles de decisión para mejorar la precisión de las predicciones. Cada árbol de decisión opera de manera independiente y su resultado se combina para reducir la varianza y mejorar la capacidad predictiva del modelo.

iii) ¿Qué es la R2 Ajustada? ¿Qué es la métrica RMSE? ¿Cuál es la diferencia entre la R2 Ajustada y la métrica RMSE?

** El R cuadrado ajustado (o coeficiente de determinación ajustado) se utiliza en la regresión múltiple para ver el grado de intensidad o efectividad que tienen las variables independientes en explicar la variable dependiente.

** El error cuadrático medio (RMSE) es una regla de puntuación cuadrática que también mide la magnitud media del error. Es la raíz cuadrada del promedio de diferencias cuadradas entre la predicción y la observación real.

** En resumen, la R2 ajustada evalúa la capacidad explicativa del modelo considerando el número de predictores, mientras que el RMSE evalúa la precisión de las predicciones del modelo sin considerar la complejidad del mismo. Ambas métricas son importantes en la evaluación de modelos de regresión, ya que proporcionan información sobre diferentes aspectos de su desempeño.

Referencias Bibliograficas

** What is Supervised Learning? | IBM. (s. f.). https://www.ibm.com/topics/supervised-learning

** MAE y RMSE: ¿qué métrica es mejor? (2020, 27 noviembre). ICHI.PRO. https://ichi.pro/es/mae-y-rmse-que-metrica-es-mejor-252933908062525

** Sanjuán, F. J. M. (2022, 24 noviembre). R cuadrado ajustado (Coeficiente de determinación ajustado). Economipedia. https://economipedia.com/definiciones/r-cuadrado-ajustado-coeficiente-de-determinacion-ajustado.html

Librerías

library(psych)
library(ggplot2)
library(dplyr)
library(GGally)
library(ggcorrplot)
library(dplyr)
library(car)
library(lmtest)
library(regclass)       
library(mctest)         
library(lmtest)        
library(spdep)          
library(sf)            
library(spData)         
library(spatialreg)     
library(caret)         
library(e1071)          
library(SparseM)       
library(Metrics)       
library(randomForest)  
library(jtools)         
library(xgboost)        
library(DiagrammeR)     
library(effects)        
library(rpart.plot)    
library(neuralnet)      
library(MASS)           
library(sp)

Análisis Exploratorio de los Datos (EDA)

df=read.csv("C:\\Users\\lesda\\OneDrive\\Documentos\\Concentracion IA\\Estadistica\\health_insurance ACT 1.csv")
summary(df)

##       age            sex                 bmi           children    
##  Min.   :18.00   Length:1338        Min.   :16.00   Min.   :0.000  
##  1st Qu.:27.00   Class :character   1st Qu.:26.30   1st Qu.:0.000  
##  Median :39.00   Mode  :character   Median :30.40   Median :1.000  
##  Mean   :39.21                      Mean   :30.67   Mean   :1.095  
##  3rd Qu.:51.00                      3rd Qu.:34.70   3rd Qu.:2.000  
##  Max.   :64.00                      Max.   :53.10   Max.   :5.000  
##     smoker             region             expenses    
##  Length:1338        Length:1338        Min.   : 1122  
##  Class :character   Class :character   1st Qu.: 4740  
##  Mode  :character   Mode  :character   Median : 9382  
##                                        Mean   :13270  
##                                        3rd Qu.:16640  
##                                        Max.   :63770

str(df)

## 'data.frame':    1338 obs. of  7 variables:
##  $ age     : int  19 18 28 33 32 31 46 37 37 60 ...
##  $ sex     : chr  "female" "male" "male" "male" ...
##  $ bmi     : num  27.9 33.8 33 22.7 28.9 25.7 33.4 27.7 29.8 25.8 ...
##  $ children: int  0 1 3 0 0 0 1 3 2 0 ...
##  $ smoker  : chr  "yes" "no" "no" "no" ...
##  $ region  : chr  "southwest" "southeast" "southeast" "northwest" ...
##  $ expenses: num  16885 1726 4449 21984 3867 ...

Medidas de tendencia central

describe(df)

##          vars    n     mean       sd  median  trimmed     mad     min      max
## age         1 1338    39.21    14.05   39.00    39.01   17.79   18.00    64.00
## sex*        2 1338     1.51     0.50    2.00     1.51    0.00    1.00     2.00
## bmi         3 1338    30.67     6.10   30.40    30.50    6.23   16.00    53.10
## children    4 1338     1.09     1.21    1.00     0.94    1.48    0.00     5.00
## smoker*     5 1338     1.20     0.40    1.00     1.13    0.00    1.00     2.00
## region*     6 1338     2.52     1.10    3.00     2.52    1.48    1.00     4.00
## expenses    7 1338 13270.42 12110.01 9382.03 11076.02 7440.81 1121.87 63770.43
##             range  skew kurtosis     se
## age         46.00  0.06    -1.25   0.38
## sex*         1.00 -0.02    -2.00   0.01
## bmi         37.10  0.28    -0.06   0.17
## children     5.00  0.94     0.19   0.03
## smoker*      1.00  1.46     0.14   0.01
## region*      3.00 -0.04    -1.33   0.03
## expenses 62648.56  1.51     1.59 331.07

moda <- function(x) {
  tabla_frecuencias <- table(x)
  modas <- names(tabla_frecuencias[tabla_frecuencias == max(tabla_frecuencias)])
  if (is.numeric(x)) {
    modas <- as.numeric(modas)
  }
  return(modas)
}
# Usar sapply para aplicar la función moda a cada columna
modas_por_columna <- sapply(df, moda)

# Mostrar las modas de cada columna
modas_por_columna

## $age
## [1] 18
## 
## $sex
## [1] "male"
## 
## $bmi
## [1] 27.6 33.3
## 
## $children
## [1] 0
## 
## $smoker
## [1] "no"
## 
## $region
## [1] "southeast"
## 
## $expenses
## [1] 1639.56

Medidas de dispersión

# Función para calcular estadísticas
calcular_estadisticas <- function(columna) {
  rango <- max(columna, na.rm = TRUE) - min(columna, na.rm = TRUE)
  varianza <- var(columna, na.rm = TRUE)
  desviacion_std <- sd(columna, na.rm = TRUE)
  rango_iqr <- IQR(columna, na.rm = TRUE)
  
  c(Rango = rango, Varianza = varianza, `Desviación Estándar` = desviacion_std, `Rango Intercuartílico` = rango_iqr)
}

# Aplicar la función a cada columna numérica de df
estadisticas_df <- sapply(df, function(x) if(is.numeric(x)) calcular_estadisticas(x) else NA)

# Mostrar las estadísticas
estadisticas_df

## $age
##                 Rango              Varianza   Desviación Estándar 
##              46.00000             197.40139              14.04996 
## Rango Intercuartílico 
##              24.00000 
## 
## $sex
## [1] NA
## 
## $bmi
##                 Rango              Varianza   Desviación Estándar 
##             37.100000             37.190265              6.098382 
## Rango Intercuartílico 
##              8.400000 
## 
## $children
##                 Rango              Varianza   Desviación Estándar 
##              5.000000              1.453213              1.205493 
## Rango Intercuartílico 
##              2.000000 
## 
## $smoker
## [1] NA
## 
## $region
## [1] NA
## 
## $expenses
##                 Rango              Varianza   Desviación Estándar 
##              62648.56          146652372.23              12110.01 
## Rango Intercuartílico 
##              11899.63

Identificación de patrones, tendencias

#Distribución de la edad

ggplot(df, aes(x=age)) + geom_histogram(binwidth=5, fill="pink", color="black") + labs(title="Distribución de Edad", x="Edad", y="Frecuencia")

#Distribución por sexo

ggplot(df, aes(x=sex)) + geom_bar(fill="magenta", color="black") + labs(title="Distribución por Sexo", x="Sexo", y="Conteo")

#Comparación entre BMI y edad por sexo
ggplot(df, aes(x=age, y=bmi)) + geom_point(aes(color=sex)) + labs(title="BMI vs Edad por Sexo", x="Edad", y="BMI") + theme_minimal()

#BMI por sexo

ggplot(df, aes(x=sex, y=bmi, fill=sex)) + geom_boxplot() + labs(title="Distribución de BMI por Sexo", x="Sexo", y="BMI")

#Comparación de fumadores y no fumadores
ggplot(df, aes(x=smoker)) + geom_bar(aes(fill=smoker)) + labs(title="Distribución de Fumadores", x="Fumador", y="Conteo")

#Cantidad de hijos
ggplot(df, aes(x=factor(children))) + geom_bar(fill="magenta", color="black") + labs(title="Distribución del Número de Hijos", x="Número de Hijos", y="Conteo")

#Distribución de gastos por región

 ggplot(df, aes(x=region, y=expenses, fill=region)) + geom_violin() + labs(title="Distribución de Gastos por Región", x="Región", y="Gastos")

#Relación entre BMI y número de hijos
ggplot(df, aes(x=factor(children), y=bmi)) + geom_jitter(aes(color=sex), width=0.2) + labs(title="BMI por Número de Hijos y Sexo", x="Número de Hijos", y="BMI")

Distribuciones de cada variable

  hist(df$age, 
     main = "Histograma de Edad", 
     xlab = "Edad", 
     ylab = "Frecuencia", 
     col = "orange", 
     border = "black")

hist(df$bmi, 
     main = "Histograma de Índice de masa corporal", 
     xlab = "Edad", 
     ylab = "Frecuencia", 
     col = "yellow", 
     border = "black")

hist(df$children, 
     main = "Histograma de número de hijos", 
     xlab = "Edad", 
     ylab = "Frecuencia", 
     col = "lightblue", 
     border = "black")

hist(df$expenses, 
     main = "Histograma de prima", 
     xlab = "Prima", 
     ylab = "Frecuencia", 
     col = "purple", 
     border = "black")

Relaciones entre variables independientes y la dependiente

# Relaciones entre variables independientes y la dependiente

ggplot(df, aes(x=age, y=expenses, color=sex)) +
  geom_point(alpha=0.5) +
  labs(title="Gastos vs. Edad, Diferenciados por Sexo", x="Edad", y="Gastos Médicos") +
  theme_minimal()

ggplot(df, aes(x=sex, y=expenses, color=sex)) +
  geom_point(position = position_jitterdodge(), alpha=0.5) +
  labs(title="Gastos Médicos Diferenciados por Sexo", x="Sexo", y="Gastos Médicos") +
  theme_minimal()

ggplot(df, aes(x=bmi, y=expenses, color=smoker)) +
  geom_point(alpha=0.5) +
  labs(title="Gastos vs. BMI, Diferenciados por Fumadores", x="BMI", y="Gastos Médicos") +
  theme_minimal()

ggplot(df, aes(x=factor(children), y=expenses)) +
  geom_point(position = position_jitter(width = 0.2), aes(color=factor(children)), alpha=0.5) +
  labs(title="Gastos vs. Número de Hijos", x="Número de Hijos", y="Gastos Médicos") +
  theme_minimal()

ggplot(df, aes(x=region, y=expenses, color=region)) +
  geom_point(position = position_jitter(width = 0.2), alpha=0.5) +
  labs(title="Gastos Médicos Diferenciados por Región", x="Región", y="Gastos Médicos") +
  theme_minimal()

ggplot(df, aes(x=region, y=expenses, fill=region)) + 
  geom_boxplot() +
  scale_fill_brewer(palette="Pastel1") +
  labs(title="Gastos por Región", x="Región", y="Gastos Médicos") +
  theme_minimal()

ggplot(df, aes(x=sex, y=expenses, fill=sex)) + 
  geom_boxplot() +
  scale_fill_brewer(palette="Set1") +
  labs(title="Gastos por Sexo", x="Sexo", y="Gastos Médicos") +
  theme_minimal()

ggplot(df, aes(x=smoker, y=expenses, fill=smoker)) + 
  geom_boxplot() +
  scale_fill_brewer(palette="Set2") +
  labs(title="Gastos por Fumador", x="Fumador", y="Gastos Médicos") +
  theme_minimal()

ggplot(df, aes(x=as.factor(children), y=expenses)) +
  geom_boxplot(aes(fill=as.factor(children))) +
  scale_fill_brewer(palette="Pastel1") + 
  labs(title="Gastos Médicos por Número de Hijos",
       x="Número de Hijos",
       y="Gastos Médicos") +
  theme_minimal()

Correlación entre variables

# Correlación entre variables
# Correlation
model.matrix(~0+., data=df) %>% 
  cor(use="pairwise.complete.obs") %>% 
  ggcorrplot(show.diag = F, type="lower", lab=TRUE, lab_size=2, 
             colors = c("pink", "white", "purple"))

age : int 19 18 28 33 32 31 46 37 37 60 … $ sex : chr “female” “male” “male” “male” … $ bmi : num 27.9 33.8 33 22.7 28.9 25.7 33.4 27.7 29.8 25.8 … $ children: int 0 1 3 0 0 0 1 3 2 0 … $ smoker : chr “yes” “no” “no” “no” … $ region : chr “southwest” “southeast” “southeast” “northwest” … $ expenses: num 16885 1726 4449 21984 3867 …

Modelo de regresión lineal

ols_model <- lm(expenses ~ age + bmi + smoker + region, data = df)
summary(ols_model)

## 
## Call:
## lm(formula = expenses ~ age + bmi + smoker + region, data = df)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -11902.8  -3038.0   -997.5   1528.2  29408.0 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     -11604.13     976.19 -11.887   <2e-16 ***
## age                258.62      11.93  21.679   <2e-16 ***
## bmi                340.09      28.67  11.862   <2e-16 ***
## smokeryes        23851.43     413.50  57.682   <2e-16 ***
## regionnorthwest   -303.33     477.84  -0.635   0.5257    
## regionsoutheast  -1039.16     480.48  -2.163   0.0307 *  
## regionsouthwest   -915.16     479.54  -1.908   0.0566 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6085 on 1331 degrees of freedom
## Multiple R-squared:  0.7487, Adjusted R-squared:  0.7475 
## F-statistic: 660.8 on 6 and 1331 DF,  p-value: < 2.2e-16

# Para 'age'
df <- df[!(df$age < (quantile(df$age, 0.25) - 1.5*IQR(df$age)) | df$age > (quantile(df$age, 0.75) + 1.5*IQR(df$age))),]

# Para 'bmi'
df <- df[!(df$bmi < (quantile(df$bmi, 0.25) - 1.5*IQR(df$bmi)) | df$bmi > (quantile(df$bmi, 0.75) + 1.5*IQR(df$bmi))),]

df <- df[!(df$expenses < (quantile(df$expenses, 0.25) - 1.5 * IQR(df$expenses)) | df$expenses > (quantile(df$expenses, 0.75) + 1.5 * IQR(df$expenses))), ]


log_ols_model <- lm(log(expenses) ~ log(age) + log(bmi) + as.factor(smoker) + children  , data = df)
summary(log_ols_model)

## 
## Call:
## lm(formula = log(expenses) ~ log(age) + log(bmi) + as.factor(smoker) + 
##     children, data = df)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.73765 -0.18524 -0.08124  0.02947  2.24392 
## 
## Coefficients:
##                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)           3.40936    0.24249  14.060  < 2e-16 ***
## log(age)              1.34353    0.03264  41.163  < 2e-16 ***
## log(bmi)              0.13081    0.06617   1.977   0.0483 *  
## as.factor(smoker)yes  1.30216    0.04115  31.646  < 2e-16 ***
## children              0.08576    0.01043   8.220  5.3e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4361 on 1186 degrees of freedom
## Multiple R-squared:  0.6993, Adjusted R-squared:  0.6983 
## F-statistic: 689.7 on 4 and 1186 DF,  p-value: < 2.2e-16

Evaluación del modelo

AIC(ols_model)

## [1] 27123.48

AIC(log_ols_model)

## [1] 1410.047

RMSE_ols_model     <- sqrt(mean(ols_model$residuals^2))
RMSE_log_ols_model <- sqrt(mean(log_ols_model$residuals^2))

RMSE_ols_model

## [1] 6068.772

RMSE_log_ols_model

## [1] 0.4351707

Pruebas de diagnóstico

Multicolinealidad

vif(log_ols_model)

##          log(age)          log(bmi) as.factor(smoker)          children 
##          1.023662          1.084219          1.072588          1.007884

Heterocedasticidad

bptest(log_ols_model)

## 
##  studentized Breusch-Pagan test
## 
## data:  log_ols_model
## BP = 79.894, df = 4, p-value < 2.2e-16

Autocorrelación serial

Autocorrelación espacial

Normalidad de los residuales

shapiro.test(resid(log_ols_model))

## 
##  Shapiro-Wilk normality test
## 
## data:  resid(log_ols_model)
## W = 0.7389, p-value < 2.2e-16

#Gráfico de residuos
hist(log_ols_model$residuals,
col = "purple", 
border = "black")

Transformaciones a las variables

#Quitar outliers

df2=df
df2 <- df2[!(df$expenses < (quantile(df$expenses, 0.25) - 1.5 * IQR(df$expenses)) | df$expenses > (quantile(df$expenses, 0.75) + 1.5 * IQR(df$expenses))), ]
# Para 'age'
df2 <- df2[!(df$age < (quantile(df$age, 0.25) - 1.5*IQR(df$age)) | df$age > (quantile(df$age, 0.75) + 1.5*IQR(df$age))),]

# Para 'bmi'
df2 <- df2[!(df$bmi < (quantile(df$bmi, 0.25) - 1.5*IQR(df$bmi)) | df$bmi > (quantile(df$bmi, 0.75) + 1.5*IQR(df$bmi))),]

log_ols_model2 <- lm(log(expenses) ~ log(age) + log(bmi) + as.factor(smoker) + children  , data = df2)
summary(log_ols_model)

## 
## Call:
## lm(formula = log(expenses) ~ log(age) + log(bmi) + as.factor(smoker) + 
##     children, data = df)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.73765 -0.18524 -0.08124  0.02947  2.24392 
## 
## Coefficients:
##                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)           3.40936    0.24249  14.060  < 2e-16 ***
## log(age)              1.34353    0.03264  41.163  < 2e-16 ***
## log(bmi)              0.13081    0.06617   1.977   0.0483 *  
## as.factor(smoker)yes  1.30216    0.04115  31.646  < 2e-16 ***
## children              0.08576    0.01043   8.220  5.3e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4361 on 1186 degrees of freedom
## Multiple R-squared:  0.6993, Adjusted R-squared:  0.6983 
## F-statistic: 689.7 on 4 and 1186 DF,  p-value: < 2.2e-16

Heterocedasticidad

bptest(log_ols_model2)

## 
##  studentized Breusch-Pagan test
## 
## data:  log_ols_model2
## BP = 75.24, df = 4, p-value = 1.773e-15

Normalidad de los residuales

shapiro.test(resid(log_ols_model2))

## 
##  Shapiro-Wilk normality test
## 
## data:  resid(log_ols_model2)
## W = 0.69358, p-value < 2.2e-16

Weight OLS

weights <- 1 / log(df2$expenses)

# Ajustar el modelo WLS
log_ols_wls_model <- lm(log(expenses) ~ log(age) + log(bmi) + as.factor(smoker) + children, data = df2, weights = weights)

# Ver el resumen del modelo
summary(log_ols_wls_model)

## 
## Call:
## lm(formula = log(expenses) ~ log(age) + log(bmi) + as.factor(smoker) + 
##     children, data = df2, weights = weights)
## 
## Weighted Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.22687 -0.04532 -0.01595  0.01621  0.74026 
## 
## Coefficients:
##                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          3.351724   0.212186  15.796   <2e-16 ***
## log(age)             1.422077   0.029058  48.940   <2e-16 ***
## log(bmi)             0.049728   0.058220   0.854    0.393    
## as.factor(smoker)yes 1.279863   0.041505  30.837   <2e-16 ***
## children             0.091877   0.009305   9.874   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.1274 on 1126 degrees of freedom
##   (53 observations deleted due to missingness)
## Multiple R-squared:  0.7592, Adjusted R-squared:  0.7583 
## F-statistic: 887.4 on 4 and 1126 DF,  p-value: < 2.2e-16

Heterocedasticidad

bptest(log_ols_wls_model)

## 
##  studentized Breusch-Pagan test
## 
## data:  log_ols_wls_model
## BP = 11.771, df = 4, p-value = 0.01914

Normalidad de los residuales

shapiro.test(resid(log_ols_wls_model))

## 
##  Shapiro-Wilk normality test
## 
## data:  resid(log_ols_wls_model)
## W = 0.67331, p-value < 2.2e-16

hist(log_ols_wls_model$residuals,
     col = "pink", 
     border = "black")

Las transformaciones de las variables con la eliminación de los Outliers y el modelo Weight OLS lograron reducir significativamente la Heterocedasticidad, sin embargo se mantiene el problema de la anormalidad de los residuales.

#RMSE

RMSE_log_ols_wls_model <- sqrt(mean(log_ols_wls_model$residuals^2))
RMSE_log_ols_wls_model

## [1] 0.390953

Modelos de machine learning

Cross Validation

df2 <- na.omit(df2)  # Limpia el dataframe de NA
df2_alt <- df2 %>% dplyr::select(expenses, age,bmi,smoker,children)

df2$expenses= log(df2$expenses )
df2$age= log(df2$age )
df2$bmi= log(df2$bmi )

set.seed(123)
partition <- createDataPartition(y = df2$expenses, p = 0.7, list = FALSE)
train = df2[partition, ]
test = df2[-partition, ]
train2 = df2[partition, ]
test2 = df2[-partition, ]

XGBoost Regresión

# **NOTE**: The estimation regression method XGBoost are sensitive to specifying commands such as log() and I()^2 in the regression equation so we will do the data transformation and directly include it the dataset. 





# define explanatory variables (X's) and dependent variable (Y) in training set
train_x = data.matrix(train[, -7])
train_y = train[,7]

# define explanatory variables (X's) and dependent variable (Y) in testing set
test_x = data.matrix(train[, -7])
test_y = train[, 7]

# define final training and testing sets
xgb_train = xgb.DMatrix(data = train_x, label = train_y)
xgb_test  = xgb.DMatrix(data = test_x, label = test_y)

# Lets fit XGBoost regression model and display RMSE for both training and testing data at each round
watchlist = list(train=xgb_train, test=xgb_test)
model_xgb = xgb.train(data=xgb_train, max.depth=3, watchlist=watchlist, nrounds=70) # the more the number of rounds selected, the longer the time to display the results.

## [1]  train-rmse:5.893701 test-rmse:5.893701 
## [2]  train-rmse:4.146337 test-rmse:4.146337 
## [3]  train-rmse:2.926488 test-rmse:2.926488 
## [4]  train-rmse:2.071960 test-rmse:2.071960 
## [5]  train-rmse:1.479140 test-rmse:1.479140 
## [6]  train-rmse:1.072780 test-rmse:1.072780 
## [7]  train-rmse:0.797338 test-rmse:0.797338 
## [8]  train-rmse:0.616903 test-rmse:0.616903 
## [9]  train-rmse:0.502248 test-rmse:0.502248 
## [10] train-rmse:0.433278 test-rmse:0.433278 
## [11] train-rmse:0.393131 test-rmse:0.393131 
## [12] train-rmse:0.370336 test-rmse:0.370336 
## [13] train-rmse:0.355950 test-rmse:0.355950 
## [14] train-rmse:0.348553 test-rmse:0.348553 
## [15] train-rmse:0.343831 test-rmse:0.343831 
## [16] train-rmse:0.338843 test-rmse:0.338843 
## [17] train-rmse:0.334898 test-rmse:0.334898 
## [18] train-rmse:0.331781 test-rmse:0.331781 
## [19] train-rmse:0.329272 test-rmse:0.329272 
## [20] train-rmse:0.328168 test-rmse:0.328168 
## [21] train-rmse:0.325709 test-rmse:0.325709 
## [22] train-rmse:0.322696 test-rmse:0.322696 
## [23] train-rmse:0.320312 test-rmse:0.320312 
## [24] train-rmse:0.318257 test-rmse:0.318257 
## [25] train-rmse:0.316940 test-rmse:0.316940 
## [26] train-rmse:0.315047 test-rmse:0.315047 
## [27] train-rmse:0.313476 test-rmse:0.313476 
## [28] train-rmse:0.309481 test-rmse:0.309481 
## [29] train-rmse:0.308494 test-rmse:0.308494 
## [30] train-rmse:0.308048 test-rmse:0.308048 
## [31] train-rmse:0.306446 test-rmse:0.306446 
## [32] train-rmse:0.302774 test-rmse:0.302774 
## [33] train-rmse:0.301287 test-rmse:0.301287 
## [34] train-rmse:0.300636 test-rmse:0.300636 
## [35] train-rmse:0.299763 test-rmse:0.299763 
## [36] train-rmse:0.296936 test-rmse:0.296936 
## [37] train-rmse:0.295638 test-rmse:0.295638 
## [38] train-rmse:0.295129 test-rmse:0.295129 
## [39] train-rmse:0.294046 test-rmse:0.294046 
## [40] train-rmse:0.293564 test-rmse:0.293564 
## [41] train-rmse:0.293201 test-rmse:0.293201 
## [42] train-rmse:0.290426 test-rmse:0.290426 
## [43] train-rmse:0.289572 test-rmse:0.289572 
## [44] train-rmse:0.288200 test-rmse:0.288200 
## [45] train-rmse:0.284922 test-rmse:0.284922 
## [46] train-rmse:0.284153 test-rmse:0.284153 
## [47] train-rmse:0.282600 test-rmse:0.282600 
## [48] train-rmse:0.280748 test-rmse:0.280748 
## [49] train-rmse:0.280357 test-rmse:0.280357 
## [50] train-rmse:0.279848 test-rmse:0.279848 
## [51] train-rmse:0.278802 test-rmse:0.278802 
## [52] train-rmse:0.277189 test-rmse:0.277189 
## [53] train-rmse:0.276742 test-rmse:0.276742 
## [54] train-rmse:0.275960 test-rmse:0.275960 
## [55] train-rmse:0.273845 test-rmse:0.273845 
## [56] train-rmse:0.272900 test-rmse:0.272900 
## [57] train-rmse:0.272006 test-rmse:0.272006 
## [58] train-rmse:0.270044 test-rmse:0.270044 
## [59] train-rmse:0.269023 test-rmse:0.269023 
## [60] train-rmse:0.268472 test-rmse:0.268472 
## [61] train-rmse:0.267644 test-rmse:0.267644 
## [62] train-rmse:0.263392 test-rmse:0.263392 
## [63] train-rmse:0.261552 test-rmse:0.261552 
## [64] train-rmse:0.261288 test-rmse:0.261288 
## [65] train-rmse:0.260638 test-rmse:0.260638 
## [66] train-rmse:0.258681 test-rmse:0.258681 
## [67] train-rmse:0.257493 test-rmse:0.257493 
## [68] train-rmse:0.257118 test-rmse:0.257118 
## [69] train-rmse:0.255843 test-rmse:0.255843 
## [70] train-rmse:0.253668 test-rmse:0.253668

# Looks like the lowest RMSE for both training and test dataset is achieved at 59 round. 
# Lets estimate our final regression model
reg_xgb = xgboost(data = xgb_train, max.depth = 3, nrounds = 59, verbose = 0) # setting verbose = 0 avoids to display the training and testing error for each round. 
prediction_xgb_test<-predict(reg_xgb, xgb_test)
RMSE_SVM <- rmse(prediction_xgb_test, test$expenses)

## Warning in actual - predicted: longitud de objeto mayor no es múltiplo de la
## longitud de uno menor

# Lets do some diagnostic check of regression residuals 
xgb_reg_residuals<-test$expenses - prediction_xgb_test

## Warning in test$expenses - prediction_xgb_test: longitud de objeto mayor no es
## múltiplo de la longitud de uno menor

plot(xgb_reg_residuals, xlab= "Dependent Variable", ylab = "Residuals", main = 'XGBoost Regression Residuals')
abline(0,0)

# Plot first 3 trees of model
xgb.plot.tree(model=reg_xgb, trees=0:2)

importance_matrix <- xgb.importance(model = reg_xgb)
xgb.plot.importance(importance_matrix, xlab = "Explanatory Variables X's Importance")

RMSE

# Cálculo del RMSE
RMSE_XGB <- rmse(test$expenses, prediction_xgb_test)

# Imprimir el RMSE
print(RMSE_XGB)

## [1] 1.005894

Árboles de decisión

decision_tree_model <- rpart(expenses ~ age +  bmi + children + smoker, data = train)

# summary(decision_tree_regression)
plot(decision_tree_model, compress = TRUE)
text(decision_tree_model, use.n = TRUE)

rpart.plot(decision_tree_model)

RMSE

### RMSE of DECISION TREE REGRESSION
decision_tree_prediction <- predict(decision_tree_model,test)
RMSE_tree <- rmse(decision_tree_prediction, test$expenses)
RMSE_tree

## [1] 0.376174

colnames(train)

## [1] "age"      "sex"      "bmi"      "children" "smoker"   "region"   "expenses"

Random Forest

rf_model <- randomForest(expenses ~  age + bmi + children + smoker, data= train, proximity=TRUE)
# random_forest<-randomForest(MEDV~.,data=train_alt,importance=TRUE, proximity=TRUE) 
print(rf_model) ### the train data set model accuracy is around 85%.

## 
## Call:
##  randomForest(formula = expenses ~ age + bmi + children + smoker,      data = train, proximity = TRUE) 
##                Type of random forest: regression
##                      Number of trees: 500
## No. of variables tried at each split: 1
## 
##           Mean of squared residuals: 0.1975525
##                     % Var explained: 65.4

# Prediction & Confusion Matrix – test data
rf_prediction <- predict(rf_model,test)

# confusionMatrix(rf_prediction_train_data, train$MEDV) # a confusion matrix is essentially a table that categorizes predictions against actual values.
RMSE_rf <- rmse(rf_prediction, test$expenses)


# Evalute Variables' Importance
# How to interpret varImpPlot()? The higher the value of mean decrease accuracy, the higher the importance of the variable in the model. 
# In other words, mean decrease accuracy represents how much removing each variable reduces the accuracy of the model.
varImpPlot(rf_model, n.var = 5, main = "Top 10 - Variable") # It displays a variable importance plot from the random forest model.

importance(rf_model)                                        # It is worth mentioning that IncNodePurity by how much the model error increases by dropping each of the specified explanatory variables.

##          IncNodePurity
## age          148.47066
## bmi           19.23523
## children      19.81647
## smoker        69.04689

                                                            # Briefly, varImpPlot() indicates each variable's importance in explaining the performance of the dependent variable (Y).

RMSE

RMSE_rf

## [1] 0.4324175

Redes Neuronales

df2 <- na.omit(df2)  # Limpia el dataframe de NA
df2_alt <- df2 %>% dplyr::select(expenses, age,bmi,smoker,children)

df2$expenses= log(df2$expenses )
df2$age= log(df2$age )
df2$bmi= log(df2$bmi )

set.seed(123)
partition <- createDataPartition(y = df2$expenses, p = 0.7, list = FALSE)
train = df2[partition, ]
test = df2[-partition, ]
train2 = df2[partition, ]
test2 = df2[-partition, ]

# Lets estimate a Neural Network Regression

train2 <- train2 %>%
  mutate(smoker = if_else(smoker == "yes", 1, 0))
test2 <- test2 %>%
  mutate(smoker = if_else(smoker == "yes", 1, 0))

nn_model <- neuralnet(expenses ~ age +  bmi + children + smoker, data = train2, hidden = c(5, 3), linear.output = TRUE) 

# Plot the neural network 
plot(nn_model)


nn_predictions <- neuralnet::compute(nn_model, test2)
nn_predictions_values <- nn_predictions$net.result


actual_values <- test2$expenses


# Calcular el RMSE
rmse_NN <- Metrics::rmse(actual_values, nn_predictions_values)

RMSE

# Imprimir el RMSE
print(rmse_NN)

## [1] 0.03888752

Evaluación y selección del modelo

RMSE de todos los modelos

# Crear el data.frame
rmse_df <- data.frame(
  Modelo = c("RMSE de log_ols_model", "RMSE de log_ols_wls_model", "RMSE de XGB", "RMSE de Tree", "RMSE de RF", "RMSE de NN"),
  RMSE = c(RMSE_log_ols_model, RMSE_log_ols_wls_model, RMSE_XGB, RMSE_tree, RMSE_rf, rmse_NN)
)

# Imprimir el data.frame creado
print(rmse_df)

##                      Modelo       RMSE
## 1     RMSE de log_ols_model 0.43517072
## 2 RMSE de log_ols_wls_model 0.39095301
## 3               RMSE de XGB 1.00589420
## 4              RMSE de Tree 0.37617398
## 5                RMSE de RF 0.43241751
## 6                RMSE de NN 0.03888752

# Crear el gráfico de barras
ggplot(rmse_df, aes(x = Modelo, y = RMSE, fill = Modelo)) +
  geom_bar(stat = "identity", show.legend = FALSE) + 
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  labs(title = "Comparación de RMSE por Modelo",
       x = "Modelo",
       y = "RMSE") +
  geom_text(aes(label = round(RMSE, 2)), vjust = -0.5, size = 3.5)

Conclusiones

Dado que los resultados obtenidos al evaluar la métrica RMSE indican que el modelo de redes neuronales tiene el menor valor, se decide seleccionarlo como el modelo que presenta el mejor desempeño en términos de precisión según esta métrica.

EDA

Tras nuestro análisis exhaustivo de los datos, identificamos que varias variables no seguían distribuciones normales, por lo que recurrimos a transformaciones logarítmicas para normalizarlas. También detectamos la presencia de outliers que afectaban negativamente la interpretación de nuestros modelos. Este análisis detallado nos brindó una comprensión más profunda de cada variable y su relación con la variable dependiente, lo que facilitó la creación de un modelo más preciso y con una mejor capacidad predictiva. Además, observamos una baja correlación entre las variables, lo que descartó preocupaciones sobre multicolinealidad y respaldó la suposición de independencia entre las variables explicativas.

Sin embargo, debido a las irregularidades en las distribuciones de las variables independientes y la naturaleza transversal de los datos, anticipamos posibles problemas de heteroscedasticidad. Estas preocupaciones se confirmaron durante la estimación de los modelos de regresión lineal. Para abordar estos desafíos, aplicamos transformaciones a las variables y utilizamos un modelo de regresión lineal ponderado, lo que mejoró la fiabilidad de los resultados y mitigó los problemas asociados con la heteroscedasticidad.

Modelo seleccionado

i. ¿Cuáles son las variables que contribuyen a explicar los cambios de la principal variable de estudio?

Según los coeficientes obtenidos del modelo de redes neuronales, podemos inferir que las variables que ejercen una mayor influencia en la predicción de la variable dependiente son age, smoke y bmi.

ii. ¿Cómo es el impacto de dichas variables explicativas sobre la variable dependiente?

Todas las variables mencionadas anteriormente tienen una influencia significativa en la variable dependiente y su efecto en la variable a predecir es positivo. Esto significa que a medida que estas variables aumentan, también aumenta la variable dependiente (expenses).

iii. ¿Los resultados estimados del modelo seleccionado son similares a los otros modelos estimados? ¿Cuáles son las diferencias?

Los resultados de todos los modelos son similares cuando se comparan con sus principales métricas de evaluación de resultados, en los modelos de regresión lineal, los AIC son similares y se mejoró esta mética con el modelo de regresión ponderado por los motivos de transformaciones y de la ponderación de las variables. Por otro lado, todos los modelos muestran un RMSE similar, estando todas en un rango similar de valores. Por último, las variables significativas en los modelos coinciden al colocar a age como la variable con más peso, seguido de smoke y bmi.

LS0tDQp0aXRsZTogIkhlYWx0aCBJbnN1cmVuY2UiDQphdXRob3I6ICJMZXNseSBEYXJpYW4gUm9tZXJvIFZhenF1ZXoiDQpkYXRlOiAiMjAyNC0wMy0wMSINCm91dHB1dDogDQogaHRtbF9kb2N1bWVudDoNCiAgICB0b2M6IHRydWUNCiAgICB0b2NfZmxvYXQ6IHRydWUNCiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlIA0KICAgIHRoZW1lOiBjb3Ntbw0KLS0tDQoNCiMgUHJlZ3VudGFzIEd1w61hDQoNCg0KDQojIyMjICoqaSkgwr9RdcOpIGVzIFN1cGVydmlzZWQgTWFjaGluZSBMZWFybmluZyB5IGN1w6FsZXMgc29uIGFsZ3VuYXMgZGUgc3VzIGFwbGljYWNpb25lcyBlbiBJbnRlbGlnZW5jaWEgZGUgTmVnb2Npb3M/KioNCg0KU3VwZXJ2aXNlZCBsZWFybmluZywgYWxzbyBrbm93biBhcyBzdXBlcnZpc2VkIG1hY2hpbmUgbGVhcm5pbmcsIGlzIGEgc3ViY2F0ZWdvcnkgb2YgbWFjaGluZSBsZWFybmluZyBhbmQgYXJ0aWZpY2lhbCBpbnRlbGxpZ2VuY2UuIEl0IGlzIGRlZmluZWQgYnkgaXRzIHVzZSBvZiBsYWJlbGVkIGRhdGFzZXRzIHRvIHRyYWluIGFsZ29yaXRobXMgdGhhdCB0byBjbGFzc2lmeSBkYXRhIG9yIHByZWRpY3Qgb3V0Y29tZXMgYWNjdXJhdGVseS4gQXMgaW5wdXQgZGF0YSBpcyBmZWQgaW50byB0aGUgbW9kZWwsIGl0IGFkanVzdHMgaXRzIHdlaWdodHMgdW50aWwgdGhlIG1vZGVsIGhhcyBiZWVuIGZpdHRlZCBhcHByb3ByaWF0ZWx5LCB3aGljaCBvY2N1cnMgYXMgcGFydCBvZiB0aGUgY3Jvc3MgdmFsaWRhdGlvbiBwcm9jZXNzLiBTdXBlcnZpc2VkIGxlYXJuaW5nIGhlbHBzIG9yZ2FuaXphdGlvbnMgc29sdmUgZm9yIGEgdmFyaWV0eSBvZiByZWFsLXdvcmxkIHByb2JsZW1zIGF0IHNjYWxlLCBzdWNoIGFzIGNsYXNzaWZ5aW5nIHNwYW0gaW4gYSBzZXBhcmF0ZSBmb2xkZXIgZnJvbSB5b3VyIGluYm94Lg0KDQohW10oQzpcXFVzZXJzXFxsZXNkYVxcRG93bmxvYWRzXFxMZWFybmluZy5wbmcpDQoNCg0KDQojIyMjICoqaWkpIMK/Q3XDoWxlcyBzb24gbG9zIHByaW5jaXBhbGVzIGFsZ29yaXRtb3MgZGUgU3VwZXJ2aXNlZCBNYWNoaW5lIExlYXJuaW5nPyAqKiANCg0KRW4gbG9zIHByb2Nlc29zIGRlIG1hY2hpbmUgbGVhcm5pbmcgc3VwZXJ2aXNhZG8gc2UgdXRpbGl6YW4gdmFyaW9zIGFsZ29yaXRtb3MgeSB0w6ljbmljYXMgZGUgY8OhbGN1bG8uIEEgY29udGludWFjacOzbiwgc2UgaW5jbHV5ZW4gYnJldmVzIGV4cGxpY2FjaW9uZXMgZGUgYWxndW5vcyBkZSBsb3MgbcOpdG9kb3MgZGUgYXByZW5kaXphamUgbcOhcyB1dGlsaXphZG9zLCBnZW5lcmFsbWVudGUgY2FsY3VsYWRvcyBtZWRpYW50ZSBlbCB1c28gZGUgcHJvZ3JhbWFzIGNvbW8gUiBvIFB5dGhvbjoNCg0KDQoqKjEuIFJlZGVzIE5ldXJvbmFsZXM6KioNCg0KTGFzIHJlZGVzIG5ldXJvbmFsZXMgc29uIG1vZGVsb3MgdXRpbGl6YWRvcyBlbiBlbCDDoW1iaXRvIGRlbCBhcHJlbmRpemFqZSBwcm9mdW5kbyBwYXJhIHByb2Nlc2FyIGRhdG9zIGltaXRhbmRvIGxhIGludGVyY29uZXhpw7NuIGRlIG5ldXJvbmFzIGVuIGVsIGNlcmVicm8gaHVtYW5vLiBFc3RhcyByZWRlcyBjb25zaXN0ZW4gZW4gY2FwYXMgZGUgbm9kb3MsIGRvbmRlIGNhZGEgbm9kbyByZWNpYmUgZW50cmFkYXMsIGFwbGljYSBwb25kZXJhY2lvbmVzLCB1biBzZXNnbyB5IHByb2R1Y2UgdW5hIHNhbGlkYS4gQSB0cmF2w6lzIGRlbCBhcHJlbmRpemFqZSBzdXBlcnZpc2FkbywgZXN0YXMgcmVkZXMgYWp1c3RhbiBzdXMgY29uZXhpb25lcyBiYXNhZGFzIGVuIHVuYSBmdW5jacOzbiBkZSBww6lyZGlkYSwgYnVzY2FuZG8gbWluaW1pemFyIGVycm9yZXMgeSBtZWpvcmFyIGxhIHByZWNpc2nDs24gZGVsIG1vZGVsby4NCg0KDQoqKjIuIE5haXZlIEJheWVzOioqDQoNCk5haXZlIEJheWVzIGVzIHVuIG3DqXRvZG8gZGUgY2xhc2lmaWNhY2nDs24gcXVlIHNlIGJhc2EgZW4gZWwgcHJpbmNpcGlvIGRlIGluZGVwZW5kZW5jaWEgY29uZGljaW9uYWwgZGUgY2xhc2VzLCBzZWfDum4gZWwgVGVvcmVtYSBkZSBCYXllcy4gRXN0ZSBlbmZvcXVlIGFzdW1lIHF1ZSBsYXMgY2FyYWN0ZXLDrXN0aWNhcyBwcmVkaWN0b3JhcyBzb24gaW5kZXBlbmRpZW50ZXMgZW50cmUgc8OtLCBsbyBxdWUgbG8gaGFjZSBlZmljYXogZW4gbGEgY2xhc2lmaWNhY2nDs24gZGUgdGV4dG9zLCBzaXN0ZW1hcyBkZSByZWNvbWVuZGFjacOzbiB5IGRldGVjY2nDs24gZGUgY29ycmVvIG5vIGRlc2VhZG8uIFNlIGRpdmlkZSBlbiB0cmVzIHRpcG9zOiBNdWx0aW5vbWlhbCwgQmVybm91bGxpIHkgR2F1c3NpYW5vLg0KDQoNCioqMy4gUmVncmVzacOzbiBMaW5lYWw6KioNCg0KTGEgcmVncmVzacOzbiBsaW5lYWwgYnVzY2EgZW50ZW5kZXIgbGEgcmVsYWNpw7NuIGVudHJlIHVuYSB2YXJpYWJsZSBkZXBlbmRpZW50ZSB5IHVuYSBvIG3DoXMgdmFyaWFibGVzIGluZGVwZW5kaWVudGVzIHBhcmEgcmVhbGl6YXIgcHJlZGljY2lvbmVzLiBTZSBhanVzdGEgYSB0cmF2w6lzIGRlbCBtw6l0b2RvIGRlIG3DrW5pbW9zIGN1YWRyYWRvcywgaW50ZW50YW5kbyB0cmF6YXIgdW5hIGzDrW5lYSByZWN0YSBxdWUgbWVqb3Igc2UgYWp1c3RlIGEgbG9zIGRhdG9zLiBTaSBoYXkgdW5hIHZhcmlhYmxlIGluZGVwZW5kaWVudGUsIHNlIGxsYW1hIHJlZ3Jlc2nDs24gbGluZWFsIHNpbXBsZTsgc2kgaGF5IG3Dumx0aXBsZXMgdmFyaWFibGVzIGluZGVwZW5kaWVudGVzLCBlcyB1bmEgcmVncmVzacOzbiBsaW5lYWwgbcO6bHRpcGxlLg0KDQoNCioqNC4gUmVncmVzacOzbiBMb2fDrXN0aWNhOioqDQoNCkxhIHJlZ3Jlc2nDs24gbG9nw61zdGljYSBzZSBlbXBsZWEgY3VhbmRvIGxhIHZhcmlhYmxlIGRlcGVuZGllbnRlIGVzIGNhdGVnw7NyaWNhLCBlcyBkZWNpciwgdGllbmUgcmVzdWx0YWRvcyBiaW5hcmlvcyBjb21vICJ2ZXJkYWRlcm8iIG8gImZhbHNvIi4gQSBkaWZlcmVuY2lhIGRlIGxhIHJlZ3Jlc2nDs24gbGluZWFsLCBxdWUgc2UgdXRpbGl6YSBjb24gdmFyaWFibGVzIGNvbnRpbnVhcywgbGEgcmVncmVzacOzbiBsb2fDrXN0aWNhIHNlIGFwbGljYSBwcmluY2lwYWxtZW50ZSBlbiBwcm9ibGVtYXMgZGUgY2xhc2lmaWNhY2nDs24gYmluYXJpYSwgY29tbyBsYSBkZXRlY2Npw7NuIGRlIGNvcnJlbyBubyBkZXNlYWRvLg0KDQoNCioqNS4gTcOhcXVpbmFzIGRlIFZlY3RvcmVzIGRlIFNvcG9ydGUgKFNWTSk6KioNCg0KTGFzIFNWTSBzb24gbW9kZWxvcyBkZSBhcHJlbmRpemFqZSBzdXBlcnZpc2FkbyB1dGlsaXphZG9zIHBhcmEgY2xhc2lmaWNhY2nDs24geSByZWdyZXNpw7NuLiBCdXNjYW4gdW4gaGlwZXJwbGFubyBxdWUgbWF4aW1pY2UgbGEgZGlzdGFuY2lhIGVudHJlIGRvcyBjbGFzZXMgZGUgcHVudG9zIGRlIGRhdG9zLCBhY3R1YW5kbyBjb21vIGzDrW1pdGUgZGUgZGVjaXNpw7NuLiBFc3RvIHBlcm1pdGUgc2VwYXJhciBlZmljaWVudGVtZW50ZSBsYXMgY2xhc2VzIGRlIHB1bnRvcyBkZSBkYXRvcyBlbiBlbCBlc3BhY2lvLg0KDQoNCioqNi4gSyBWZWNpbm8gTcOhcyBDZXJjYW5vIChLTk4pOioqDQoNCkVsIGFsZ29yaXRtbyBLTk4gY2xhc2lmaWNhIGxvcyBwdW50b3MgZGUgZGF0b3Mgc2Vnw7puIGxhIHByb3hpbWlkYWQgYSBvdHJvcyBwdW50b3MgZGUgZGF0b3MgY29ub2NpZG9zLiBTZSBiYXNhIGVuIGxhIHN1cG9zaWNpw7NuIGRlIHF1ZSBwdW50b3Mgc2ltaWxhcmVzIGVzdMOhbiBjZXJjYSB1bm9zIGRlIG90cm9zLiBVdGlsaXphIGxhIGRpc3RhbmNpYSBldWNsaWRpYW5hIHBhcmEgY2FsY3VsYXIgbGEgc2ltaWxpdHVkIHkgYXNpZ25hciB1bmEgY2F0ZWdvcsOtYSBiYXNhZGEgZW4gbGEgbWF5b3LDrWEgZGUgbGFzIGNhdGVnb3LDrWFzIGRlIGxvcyB2ZWNpbm9zIG3DoXMgY2VyY2Fub3MuDQoNCg0KKio3LiBCb3NxdWUgQWxlYXRvcmlvOioqDQoNCkVsIGJvc3F1ZSBhbGVhdG9yaW8gZXMgdW4gYWxnb3JpdG1vIGZsZXhpYmxlIGRlIGFwcmVuZGl6YWplIHN1cGVydmlzYWRvIHF1ZSBjb21iaW5hIG3Dumx0aXBsZXMgw6FyYm9sZXMgZGUgZGVjaXNpw7NuIHBhcmEgbWVqb3JhciBsYSBwcmVjaXNpw7NuIGRlIGxhcyBwcmVkaWNjaW9uZXMuIENhZGEgw6FyYm9sIGRlIGRlY2lzacOzbiBvcGVyYSBkZSBtYW5lcmEgaW5kZXBlbmRpZW50ZSB5IHN1IHJlc3VsdGFkbyBzZSBjb21iaW5hIHBhcmEgcmVkdWNpciBsYSB2YXJpYW56YSB5IG1lam9yYXIgbGEgY2FwYWNpZGFkIHByZWRpY3RpdmEgZGVsIG1vZGVsby4NCg0KDQoNCiMjIyMgKippaWkpIMK/UXXDqSBlcyBsYSBSMiBBanVzdGFkYT8gwr9RdcOpIGVzIGxhIG3DqXRyaWNhIFJNU0U/IMK/Q3XDoWwgZXMgbGEgZGlmZXJlbmNpYSBlbnRyZSBsYSBSMiBBanVzdGFkYSB5IGxhIG3DqXRyaWNhIFJNU0U/KioNCg0KICAqKiBFbCBSIGN1YWRyYWRvIGFqdXN0YWRvIChvIGNvZWZpY2llbnRlIGRlIGRldGVybWluYWNpw7NuIGFqdXN0YWRvKSBzZSB1dGlsaXphIGVuIGxhIHJlZ3Jlc2nDs24gbcO6bHRpcGxlIHBhcmEgdmVyIGVsIGdyYWRvIGRlIGludGVuc2lkYWQgbyBlZmVjdGl2aWRhZCBxdWUgdGllbmVuIGxhcyB2YXJpYWJsZXMgaW5kZXBlbmRpZW50ZXMgZW4gZXhwbGljYXIgbGEgdmFyaWFibGUgZGVwZW5kaWVudGUuDQogIA0KICAqKiBFbCBlcnJvciBjdWFkcsOhdGljbyBtZWRpbyAoUk1TRSkgZXMgdW5hIHJlZ2xhIGRlIHB1bnR1YWNpw7NuIGN1YWRyw6F0aWNhIHF1ZSB0YW1iacOpbiBtaWRlIGxhIG1hZ25pdHVkIG1lZGlhIGRlbCBlcnJvci4gRXMgbGEgcmHDrXogY3VhZHJhZGEgZGVsIHByb21lZGlvIGRlIGRpZmVyZW5jaWFzIGN1YWRyYWRhcyBlbnRyZSBsYSBwcmVkaWNjacOzbiB5IGxhIG9ic2VydmFjacOzbiByZWFsLg0KICANCiAgICAqKiBFbiByZXN1bWVuLCBsYSBSMiBhanVzdGFkYSBldmFsw7phIGxhIGNhcGFjaWRhZCBleHBsaWNhdGl2YSBkZWwgbW9kZWxvIGNvbnNpZGVyYW5kbyBlbCBuw7ptZXJvIGRlIHByZWRpY3RvcmVzLCBtaWVudHJhcyBxdWUgZWwgUk1TRSBldmFsw7phIGxhIHByZWNpc2nDs24gZGUgbGFzIHByZWRpY2Npb25lcyBkZWwgbW9kZWxvIHNpbiBjb25zaWRlcmFyIGxhIGNvbXBsZWppZGFkIGRlbCBtaXNtby4gQW1iYXMgbcOpdHJpY2FzIHNvbiBpbXBvcnRhbnRlcyBlbiBsYSBldmFsdWFjacOzbiBkZSBtb2RlbG9zIGRlIHJlZ3Jlc2nDs24sIHlhIHF1ZSBwcm9wb3JjaW9uYW4gaW5mb3JtYWNpw7NuIHNvYnJlIGRpZmVyZW50ZXMgYXNwZWN0b3MgZGUgc3UgZGVzZW1wZcOxby4NCiAgDQoNCg0KIyMjIyBSZWZlcmVuY2lhcyBCaWJsaW9ncmFmaWNhcw0KDQogICoqIFdoYXQgaXMgU3VwZXJ2aXNlZCBMZWFybmluZz/CoCB8IElCTS4gKHMuwqBmLikuIGh0dHBzOi8vd3d3LmlibS5jb20vdG9waWNzL3N1cGVydmlzZWQtbGVhcm5pbmcNCiAgDQogICoqIE1BRSB5IFJNU0U6IMK/cXXDqSBtw6l0cmljYSBlcyBtZWpvcj8gKDIwMjAsIDI3IG5vdmllbWJyZSkuIElDSEkuUFJPLiBodHRwczovL2ljaGkucHJvL2VzL21hZS15LXJtc2UtcXVlLW1ldHJpY2EtZXMtbWVqb3ItMjUyOTMzOTA4MDYyNTI1DQogIA0KICAqKiBTYW5qdcOhbiwgRi4gSi4gTS4gKDIwMjIsIDI0IG5vdmllbWJyZSkuIFIgY3VhZHJhZG8gYWp1c3RhZG8gKENvZWZpY2llbnRlIGRlIGRldGVybWluYWNpw7NuIGFqdXN0YWRvKS4gRWNvbm9taXBlZGlhLiBodHRwczovL2Vjb25vbWlwZWRpYS5jb20vZGVmaW5pY2lvbmVzL3ItY3VhZHJhZG8tYWp1c3RhZG8tY29lZmljaWVudGUtZGUtZGV0ZXJtaW5hY2lvbi1hanVzdGFkby5odG1sDQogIA0KDQoNCiMgTGlicmVyw61hcw0KDQpgYGB7ciBtZXNzYWdlPUZBTFNFLCB3YXJuaW5nPUZBTFNFfQ0KbGlicmFyeShwc3ljaCkNCmxpYnJhcnkoZ2dwbG90MikNCmxpYnJhcnkoZHBseXIpDQpsaWJyYXJ5KEdHYWxseSkNCmxpYnJhcnkoZ2djb3JycGxvdCkNCmxpYnJhcnkoZHBseXIpDQpsaWJyYXJ5KGNhcikNCmxpYnJhcnkobG10ZXN0KQ0KbGlicmFyeShyZWdjbGFzcykgICAgICAgDQpsaWJyYXJ5KG1jdGVzdCkgICAgICAgICANCmxpYnJhcnkobG10ZXN0KSAgICAgICAgDQpsaWJyYXJ5KHNwZGVwKSAgICAgICAgICANCmxpYnJhcnkoc2YpICAgICAgICAgICAgDQpsaWJyYXJ5KHNwRGF0YSkgICAgICAgICANCmxpYnJhcnkoc3BhdGlhbHJlZykgICAgIA0KbGlicmFyeShjYXJldCkgICAgICAgICANCmxpYnJhcnkoZTEwNzEpICAgICAgICAgIA0KbGlicmFyeShTcGFyc2VNKSAgICAgICANCmxpYnJhcnkoTWV0cmljcykgICAgICAgDQpsaWJyYXJ5KHJhbmRvbUZvcmVzdCkgIA0KbGlicmFyeShqdG9vbHMpICAgICAgICAgDQpsaWJyYXJ5KHhnYm9vc3QpICAgICAgICANCmxpYnJhcnkoRGlhZ3JhbW1lUikgICAgIA0KbGlicmFyeShlZmZlY3RzKSAgICAgICAgDQpsaWJyYXJ5KHJwYXJ0LnBsb3QpICAgIA0KbGlicmFyeShuZXVyYWxuZXQpICAgICAgDQpsaWJyYXJ5KE1BU1MpICAgICAgICAgICANCmxpYnJhcnkoc3ApDQpgYGANCg0KDQojIEFuw6FsaXNpcyBFeHBsb3JhdG9yaW8gZGUgbG9zIERhdG9zIChFREEpDQoNCmBgYHtyfQ0KZGY9cmVhZC5jc3YoIkM6XFxVc2Vyc1xcbGVzZGFcXE9uZURyaXZlXFxEb2N1bWVudG9zXFxDb25jZW50cmFjaW9uIElBXFxFc3RhZGlzdGljYVxcaGVhbHRoX2luc3VyYW5jZSBBQ1QgMS5jc3YiKQ0Kc3VtbWFyeShkZikNCmBgYA0KDQpgYGB7cn0NCnN0cihkZikNCmBgYA0KDQoNCiMjIyBNZWRpZGFzIGRlIHRlbmRlbmNpYSBjZW50cmFsDQoNCmBgYHtyfQ0KZGVzY3JpYmUoZGYpDQpgYGANCg0KDQpgYGB7cn0NCm1vZGEgPC0gZnVuY3Rpb24oeCkgew0KICB0YWJsYV9mcmVjdWVuY2lhcyA8LSB0YWJsZSh4KQ0KICBtb2RhcyA8LSBuYW1lcyh0YWJsYV9mcmVjdWVuY2lhc1t0YWJsYV9mcmVjdWVuY2lhcyA9PSBtYXgodGFibGFfZnJlY3VlbmNpYXMpXSkNCiAgaWYgKGlzLm51bWVyaWMoeCkpIHsNCiAgICBtb2RhcyA8LSBhcy5udW1lcmljKG1vZGFzKQ0KICB9DQogIHJldHVybihtb2RhcykNCn0NCiMgVXNhciBzYXBwbHkgcGFyYSBhcGxpY2FyIGxhIGZ1bmNpw7NuIG1vZGEgYSBjYWRhIGNvbHVtbmENCm1vZGFzX3Bvcl9jb2x1bW5hIDwtIHNhcHBseShkZiwgbW9kYSkNCg0KIyBNb3N0cmFyIGxhcyBtb2RhcyBkZSBjYWRhIGNvbHVtbmENCm1vZGFzX3Bvcl9jb2x1bW5hDQpgYGANCiMjIyBNZWRpZGFzIGRlIGRpc3BlcnNpw7NuDQoNCmBgYHtyfQ0KIyBGdW5jacOzbiBwYXJhIGNhbGN1bGFyIGVzdGFkw61zdGljYXMNCmNhbGN1bGFyX2VzdGFkaXN0aWNhcyA8LSBmdW5jdGlvbihjb2x1bW5hKSB7DQogIHJhbmdvIDwtIG1heChjb2x1bW5hLCBuYS5ybSA9IFRSVUUpIC0gbWluKGNvbHVtbmEsIG5hLnJtID0gVFJVRSkNCiAgdmFyaWFuemEgPC0gdmFyKGNvbHVtbmEsIG5hLnJtID0gVFJVRSkNCiAgZGVzdmlhY2lvbl9zdGQgPC0gc2QoY29sdW1uYSwgbmEucm0gPSBUUlVFKQ0KICByYW5nb19pcXIgPC0gSVFSKGNvbHVtbmEsIG5hLnJtID0gVFJVRSkNCiAgDQogIGMoUmFuZ28gPSByYW5nbywgVmFyaWFuemEgPSB2YXJpYW56YSwgYERlc3ZpYWNpw7NuIEVzdMOhbmRhcmAgPSBkZXN2aWFjaW9uX3N0ZCwgYFJhbmdvIEludGVyY3VhcnTDrWxpY29gID0gcmFuZ29faXFyKQ0KfQ0KDQojIEFwbGljYXIgbGEgZnVuY2nDs24gYSBjYWRhIGNvbHVtbmEgbnVtw6lyaWNhIGRlIGRmDQplc3RhZGlzdGljYXNfZGYgPC0gc2FwcGx5KGRmLCBmdW5jdGlvbih4KSBpZihpcy5udW1lcmljKHgpKSBjYWxjdWxhcl9lc3RhZGlzdGljYXMoeCkgZWxzZSBOQSkNCg0KIyBNb3N0cmFyIGxhcyBlc3RhZMOtc3RpY2FzDQplc3RhZGlzdGljYXNfZGYNCmBgYA0KDQojIyMgSWRlbnRpZmljYWNpw7NuIGRlIHBhdHJvbmVzLCB0ZW5kZW5jaWFzIA0KDQpgYGB7cn0NCg0KI0Rpc3RyaWJ1Y2nDs24gZGUgbGEgZWRhZA0KDQpnZ3Bsb3QoZGYsIGFlcyh4PWFnZSkpICsgZ2VvbV9oaXN0b2dyYW0oYmlud2lkdGg9NSwgZmlsbD0icGluayIsIGNvbG9yPSJibGFjayIpICsgbGFicyh0aXRsZT0iRGlzdHJpYnVjacOzbiBkZSBFZGFkIiwgeD0iRWRhZCIsIHk9IkZyZWN1ZW5jaWEiKQ0KDQpgYGANCg0KYGBge3J9DQojRGlzdHJpYnVjacOzbiBwb3Igc2V4bw0KDQpnZ3Bsb3QoZGYsIGFlcyh4PXNleCkpICsgZ2VvbV9iYXIoZmlsbD0ibWFnZW50YSIsIGNvbG9yPSJibGFjayIpICsgbGFicyh0aXRsZT0iRGlzdHJpYnVjacOzbiBwb3IgU2V4byIsIHg9IlNleG8iLCB5PSJDb250ZW8iKQ0KDQpgYGANCg0KYGBge3J9DQoNCiNDb21wYXJhY2nDs24gZW50cmUgQk1JIHkgZWRhZCBwb3Igc2V4bw0KZ2dwbG90KGRmLCBhZXMoeD1hZ2UsIHk9Ym1pKSkgKyBnZW9tX3BvaW50KGFlcyhjb2xvcj1zZXgpKSArIGxhYnModGl0bGU9IkJNSSB2cyBFZGFkIHBvciBTZXhvIiwgeD0iRWRhZCIsIHk9IkJNSSIpICsgdGhlbWVfbWluaW1hbCgpDQoNCg0KYGBgDQoNCmBgYHtyfQ0KI0JNSSBwb3Igc2V4bw0KDQpnZ3Bsb3QoZGYsIGFlcyh4PXNleCwgeT1ibWksIGZpbGw9c2V4KSkgKyBnZW9tX2JveHBsb3QoKSArIGxhYnModGl0bGU9IkRpc3RyaWJ1Y2nDs24gZGUgQk1JIHBvciBTZXhvIiwgeD0iU2V4byIsIHk9IkJNSSIpDQoNCmBgYA0KDQpgYGB7cn0NCiNDb21wYXJhY2nDs24gZGUgZnVtYWRvcmVzIHkgbm8gZnVtYWRvcmVzDQpnZ3Bsb3QoZGYsIGFlcyh4PXNtb2tlcikpICsgZ2VvbV9iYXIoYWVzKGZpbGw9c21va2VyKSkgKyBsYWJzKHRpdGxlPSJEaXN0cmlidWNpw7NuIGRlIEZ1bWFkb3JlcyIsIHg9IkZ1bWFkb3IiLCB5PSJDb250ZW8iKQ0KDQpgYGANCg0KYGBge3J9DQojQ2FudGlkYWQgZGUgaGlqb3MNCmdncGxvdChkZiwgYWVzKHg9ZmFjdG9yKGNoaWxkcmVuKSkpICsgZ2VvbV9iYXIoZmlsbD0ibWFnZW50YSIsIGNvbG9yPSJibGFjayIpICsgbGFicyh0aXRsZT0iRGlzdHJpYnVjacOzbiBkZWwgTsO6bWVybyBkZSBIaWpvcyIsIHg9Ik7Dum1lcm8gZGUgSGlqb3MiLCB5PSJDb250ZW8iKQ0KDQoNCmBgYA0KYGBge3J9DQojRGlzdHJpYnVjacOzbiBkZSBnYXN0b3MgcG9yIHJlZ2nDs24NCg0KIGdncGxvdChkZiwgYWVzKHg9cmVnaW9uLCB5PWV4cGVuc2VzLCBmaWxsPXJlZ2lvbikpICsgZ2VvbV92aW9saW4oKSArIGxhYnModGl0bGU9IkRpc3RyaWJ1Y2nDs24gZGUgR2FzdG9zIHBvciBSZWdpw7NuIiwgeD0iUmVnacOzbiIsIHk9Ikdhc3RvcyIpDQoNCmBgYA0KDQpgYGB7cn0NCiNSZWxhY2nDs24gZW50cmUgQk1JIHkgbsO6bWVybyBkZSBoaWpvcw0KZ2dwbG90KGRmLCBhZXMoeD1mYWN0b3IoY2hpbGRyZW4pLCB5PWJtaSkpICsgZ2VvbV9qaXR0ZXIoYWVzKGNvbG9yPXNleCksIHdpZHRoPTAuMikgKyBsYWJzKHRpdGxlPSJCTUkgcG9yIE7Dum1lcm8gZGUgSGlqb3MgeSBTZXhvIiwgeD0iTsO6bWVybyBkZSBIaWpvcyIsIHk9IkJNSSIpDQoNCmBgYA0KDQojIyMgRGlzdHJpYnVjaW9uZXMgZGUgY2FkYSB2YXJpYWJsZQ0KDQoNCmBgYHtyfQ0KICBoaXN0KGRmJGFnZSwgDQogICAgIG1haW4gPSAiSGlzdG9ncmFtYSBkZSBFZGFkIiwgDQogICAgIHhsYWIgPSAiRWRhZCIsIA0KICAgICB5bGFiID0gIkZyZWN1ZW5jaWEiLCANCiAgICAgY29sID0gIm9yYW5nZSIsIA0KICAgICBib3JkZXIgPSAiYmxhY2siKQ0KDQpoaXN0KGRmJGJtaSwgDQogICAgIG1haW4gPSAiSGlzdG9ncmFtYSBkZSDDjW5kaWNlIGRlIG1hc2EgY29ycG9yYWwiLCANCiAgICAgeGxhYiA9ICJFZGFkIiwgDQogICAgIHlsYWIgPSAiRnJlY3VlbmNpYSIsIA0KICAgICBjb2wgPSAieWVsbG93IiwgDQogICAgIGJvcmRlciA9ICJibGFjayIpDQoNCmhpc3QoZGYkY2hpbGRyZW4sIA0KICAgICBtYWluID0gIkhpc3RvZ3JhbWEgZGUgbsO6bWVybyBkZSBoaWpvcyIsIA0KICAgICB4bGFiID0gIkVkYWQiLCANCiAgICAgeWxhYiA9ICJGcmVjdWVuY2lhIiwgDQogICAgIGNvbCA9ICJsaWdodGJsdWUiLCANCiAgICAgYm9yZGVyID0gImJsYWNrIikNCg0KaGlzdChkZiRleHBlbnNlcywgDQogICAgIG1haW4gPSAiSGlzdG9ncmFtYSBkZSBwcmltYSIsIA0KICAgICB4bGFiID0gIlByaW1hIiwgDQogICAgIHlsYWIgPSAiRnJlY3VlbmNpYSIsIA0KICAgICBjb2wgPSAicHVycGxlIiwgDQogICAgIGJvcmRlciA9ICJibGFjayIpDQpgYGANCg0KDQojIyMgUmVsYWNpb25lcyBlbnRyZSB2YXJpYWJsZXMgaW5kZXBlbmRpZW50ZXMgeSBsYSBkZXBlbmRpZW50ZQ0KDQoNCmBgYHtyfQ0KIyBSZWxhY2lvbmVzIGVudHJlIHZhcmlhYmxlcyBpbmRlcGVuZGllbnRlcyB5IGxhIGRlcGVuZGllbnRlDQoNCmdncGxvdChkZiwgYWVzKHg9YWdlLCB5PWV4cGVuc2VzLCBjb2xvcj1zZXgpKSArDQogIGdlb21fcG9pbnQoYWxwaGE9MC41KSArDQogIGxhYnModGl0bGU9Ikdhc3RvcyB2cy4gRWRhZCwgRGlmZXJlbmNpYWRvcyBwb3IgU2V4byIsIHg9IkVkYWQiLCB5PSJHYXN0b3MgTcOpZGljb3MiKSArDQogIHRoZW1lX21pbmltYWwoKQ0KDQpnZ3Bsb3QoZGYsIGFlcyh4PXNleCwgeT1leHBlbnNlcywgY29sb3I9c2V4KSkgKw0KICBnZW9tX3BvaW50KHBvc2l0aW9uID0gcG9zaXRpb25faml0dGVyZG9kZ2UoKSwgYWxwaGE9MC41KSArDQogIGxhYnModGl0bGU9Ikdhc3RvcyBNw6lkaWNvcyBEaWZlcmVuY2lhZG9zIHBvciBTZXhvIiwgeD0iU2V4byIsIHk9Ikdhc3RvcyBNw6lkaWNvcyIpICsNCiAgdGhlbWVfbWluaW1hbCgpDQoNCmdncGxvdChkZiwgYWVzKHg9Ym1pLCB5PWV4cGVuc2VzLCBjb2xvcj1zbW9rZXIpKSArDQogIGdlb21fcG9pbnQoYWxwaGE9MC41KSArDQogIGxhYnModGl0bGU9Ikdhc3RvcyB2cy4gQk1JLCBEaWZlcmVuY2lhZG9zIHBvciBGdW1hZG9yZXMiLCB4PSJCTUkiLCB5PSJHYXN0b3MgTcOpZGljb3MiKSArDQogIHRoZW1lX21pbmltYWwoKQ0KDQpnZ3Bsb3QoZGYsIGFlcyh4PWZhY3RvcihjaGlsZHJlbiksIHk9ZXhwZW5zZXMpKSArDQogIGdlb21fcG9pbnQocG9zaXRpb24gPSBwb3NpdGlvbl9qaXR0ZXIod2lkdGggPSAwLjIpLCBhZXMoY29sb3I9ZmFjdG9yKGNoaWxkcmVuKSksIGFscGhhPTAuNSkgKw0KICBsYWJzKHRpdGxlPSJHYXN0b3MgdnMuIE7Dum1lcm8gZGUgSGlqb3MiLCB4PSJOw7ptZXJvIGRlIEhpam9zIiwgeT0iR2FzdG9zIE3DqWRpY29zIikgKw0KICB0aGVtZV9taW5pbWFsKCkNCg0KZ2dwbG90KGRmLCBhZXMoeD1yZWdpb24sIHk9ZXhwZW5zZXMsIGNvbG9yPXJlZ2lvbikpICsNCiAgZ2VvbV9wb2ludChwb3NpdGlvbiA9IHBvc2l0aW9uX2ppdHRlcih3aWR0aCA9IDAuMiksIGFscGhhPTAuNSkgKw0KICBsYWJzKHRpdGxlPSJHYXN0b3MgTcOpZGljb3MgRGlmZXJlbmNpYWRvcyBwb3IgUmVnacOzbiIsIHg9IlJlZ2nDs24iLCB5PSJHYXN0b3MgTcOpZGljb3MiKSArDQogIHRoZW1lX21pbmltYWwoKQ0KDQoNCg0KYGBgDQoNCmBgYHtyfQ0KDQpnZ3Bsb3QoZGYsIGFlcyh4PXJlZ2lvbiwgeT1leHBlbnNlcywgZmlsbD1yZWdpb24pKSArIA0KICBnZW9tX2JveHBsb3QoKSArDQogIHNjYWxlX2ZpbGxfYnJld2VyKHBhbGV0dGU9IlBhc3RlbDEiKSArDQogIGxhYnModGl0bGU9Ikdhc3RvcyBwb3IgUmVnacOzbiIsIHg9IlJlZ2nDs24iLCB5PSJHYXN0b3MgTcOpZGljb3MiKSArDQogIHRoZW1lX21pbmltYWwoKQ0KDQpnZ3Bsb3QoZGYsIGFlcyh4PXNleCwgeT1leHBlbnNlcywgZmlsbD1zZXgpKSArIA0KICBnZW9tX2JveHBsb3QoKSArDQogIHNjYWxlX2ZpbGxfYnJld2VyKHBhbGV0dGU9IlNldDEiKSArDQogIGxhYnModGl0bGU9Ikdhc3RvcyBwb3IgU2V4byIsIHg9IlNleG8iLCB5PSJHYXN0b3MgTcOpZGljb3MiKSArDQogIHRoZW1lX21pbmltYWwoKQ0KDQpnZ3Bsb3QoZGYsIGFlcyh4PXNtb2tlciwgeT1leHBlbnNlcywgZmlsbD1zbW9rZXIpKSArIA0KICBnZW9tX2JveHBsb3QoKSArDQogIHNjYWxlX2ZpbGxfYnJld2VyKHBhbGV0dGU9IlNldDIiKSArDQogIGxhYnModGl0bGU9Ikdhc3RvcyBwb3IgRnVtYWRvciIsIHg9IkZ1bWFkb3IiLCB5PSJHYXN0b3MgTcOpZGljb3MiKSArDQogIHRoZW1lX21pbmltYWwoKQ0KDQpnZ3Bsb3QoZGYsIGFlcyh4PWFzLmZhY3RvcihjaGlsZHJlbiksIHk9ZXhwZW5zZXMpKSArDQogIGdlb21fYm94cGxvdChhZXMoZmlsbD1hcy5mYWN0b3IoY2hpbGRyZW4pKSkgKw0KICBzY2FsZV9maWxsX2JyZXdlcihwYWxldHRlPSJQYXN0ZWwxIikgKyANCiAgbGFicyh0aXRsZT0iR2FzdG9zIE3DqWRpY29zIHBvciBOw7ptZXJvIGRlIEhpam9zIiwNCiAgICAgICB4PSJOw7ptZXJvIGRlIEhpam9zIiwNCiAgICAgICB5PSJHYXN0b3MgTcOpZGljb3MiKSArDQogIHRoZW1lX21pbmltYWwoKQ0KDQoNCg0KYGBgDQoNCiMjIyBDb3JyZWxhY2nDs24gZW50cmUgdmFyaWFibGVzDQoNCmBgYHtyfQ0KIyBDb3JyZWxhY2nDs24gZW50cmUgdmFyaWFibGVzDQojIENvcnJlbGF0aW9uDQptb2RlbC5tYXRyaXgofjArLiwgZGF0YT1kZikgJT4lIA0KICBjb3IodXNlPSJwYWlyd2lzZS5jb21wbGV0ZS5vYnMiKSAlPiUgDQogIGdnY29ycnBsb3Qoc2hvdy5kaWFnID0gRiwgdHlwZT0ibG93ZXIiLCBsYWI9VFJVRSwgbGFiX3NpemU9MiwgDQogICAgICAgICAgICAgY29sb3JzID0gYygicGluayIsICJ3aGl0ZSIsICJwdXJwbGUiKSkgDQpgYGANCmFnZSAgICAgOiBpbnQgIDE5IDE4IDI4IDMzIDMyIDMxIDQ2IDM3IDM3IDYwIC4uLg0KICQgc2V4ICAgICA6IGNociAgImZlbWFsZSIgIm1hbGUiICJtYWxlIiAibWFsZSIgLi4uDQogJCBibWkgICAgIDogbnVtICAyNy45IDMzLjggMzMgMjIuNyAyOC45IDI1LjcgMzMuNCAyNy43IDI5LjggMjUuOCAuLi4NCiAkIGNoaWxkcmVuOiBpbnQgIDAgMSAzIDAgMCAwIDEgMyAyIDAgLi4uDQogJCBzbW9rZXIgIDogY2hyICAieWVzIiAibm8iICJubyIgIm5vIiAuLi4NCiAkIHJlZ2lvbiAgOiBjaHIgICJzb3V0aHdlc3QiICJzb3V0aGVhc3QiICJzb3V0aGVhc3QiICJub3J0aHdlc3QiIC4uLg0KICQgZXhwZW5zZXM6IG51bSAgMTY4ODUgMTcyNiA0NDQ5IDIxOTg0IDM4NjcgLi4uDQoNCiMgTW9kZWxvIGRlIHJlZ3Jlc2nDs24gbGluZWFsDQoNCmBgYHtyfQ0Kb2xzX21vZGVsIDwtIGxtKGV4cGVuc2VzIH4gYWdlICsgYm1pICsgc21va2VyICsgcmVnaW9uLCBkYXRhID0gZGYpDQpzdW1tYXJ5KG9sc19tb2RlbCkNCg0KIyBQYXJhICdhZ2UnDQpkZiA8LSBkZlshKGRmJGFnZSA8IChxdWFudGlsZShkZiRhZ2UsIDAuMjUpIC0gMS41KklRUihkZiRhZ2UpKSB8IGRmJGFnZSA+IChxdWFudGlsZShkZiRhZ2UsIDAuNzUpICsgMS41KklRUihkZiRhZ2UpKSksXQ0KDQojIFBhcmEgJ2JtaScNCmRmIDwtIGRmWyEoZGYkYm1pIDwgKHF1YW50aWxlKGRmJGJtaSwgMC4yNSkgLSAxLjUqSVFSKGRmJGJtaSkpIHwgZGYkYm1pID4gKHF1YW50aWxlKGRmJGJtaSwgMC43NSkgKyAxLjUqSVFSKGRmJGJtaSkpKSxdDQoNCmRmIDwtIGRmWyEoZGYkZXhwZW5zZXMgPCAocXVhbnRpbGUoZGYkZXhwZW5zZXMsIDAuMjUpIC0gMS41ICogSVFSKGRmJGV4cGVuc2VzKSkgfCBkZiRleHBlbnNlcyA+IChxdWFudGlsZShkZiRleHBlbnNlcywgMC43NSkgKyAxLjUgKiBJUVIoZGYkZXhwZW5zZXMpKSksIF0NCg0KDQpsb2dfb2xzX21vZGVsIDwtIGxtKGxvZyhleHBlbnNlcykgfiBsb2coYWdlKSArIGxvZyhibWkpICsgYXMuZmFjdG9yKHNtb2tlcikgKyBjaGlsZHJlbiAgLCBkYXRhID0gZGYpDQpzdW1tYXJ5KGxvZ19vbHNfbW9kZWwpDQoNCg0KYGBgDQojIyMgRXZhbHVhY2nDs24gZGVsIG1vZGVsbw0KDQpgYGB7cn0NCkFJQyhvbHNfbW9kZWwpICANCkFJQyhsb2dfb2xzX21vZGVsKSANCg0KYGBgDQoNCmBgYHtyfQ0KUk1TRV9vbHNfbW9kZWwgICAgIDwtIHNxcnQobWVhbihvbHNfbW9kZWwkcmVzaWR1YWxzXjIpKQ0KUk1TRV9sb2dfb2xzX21vZGVsIDwtIHNxcnQobWVhbihsb2dfb2xzX21vZGVsJHJlc2lkdWFsc14yKSkNCg0KUk1TRV9vbHNfbW9kZWwNClJNU0VfbG9nX29sc19tb2RlbA0KYGBgDQoNCiMjIyBQcnVlYmFzIGRlIGRpYWduw7NzdGljbw0KDQojIyMjIE11bHRpY29saW5lYWxpZGFkDQoNCmBgYHtyfQ0KdmlmKGxvZ19vbHNfbW9kZWwpIA0KYGBgDQoNCiMjIyMgSGV0ZXJvY2VkYXN0aWNpZGFkDQoNCmBgYHtyfQ0KYnB0ZXN0KGxvZ19vbHNfbW9kZWwpDQpgYGANCg0KIyMjIyBBdXRvY29ycmVsYWNpw7NuIHNlcmlhbA0KDQpOQQ0KDQojIyMjIEF1dG9jb3JyZWxhY2nDs24gZXNwYWNpYWwNCiANCk5BDQoNCiMjIyMgTm9ybWFsaWRhZCBkZSBsb3MgcmVzaWR1YWxlcw0KDQpgYGB7cn0NCnNoYXBpcm8udGVzdChyZXNpZChsb2dfb2xzX21vZGVsKSkNCmBgYA0KYGBge3J9DQojR3LDoWZpY28gZGUgcmVzaWR1b3MNCmhpc3QobG9nX29sc19tb2RlbCRyZXNpZHVhbHMsDQpjb2wgPSAicHVycGxlIiwgDQpib3JkZXIgPSAiYmxhY2siKQ0KYGBgDQoNCiMjIyBUcmFuc2Zvcm1hY2lvbmVzIGEgbGFzIHZhcmlhYmxlcw0KDQpgYGB7cn0NCiNRdWl0YXIgb3V0bGllcnMNCg0KZGYyPWRmDQpkZjIgPC0gZGYyWyEoZGYkZXhwZW5zZXMgPCAocXVhbnRpbGUoZGYkZXhwZW5zZXMsIDAuMjUpIC0gMS41ICogSVFSKGRmJGV4cGVuc2VzKSkgfCBkZiRleHBlbnNlcyA+IChxdWFudGlsZShkZiRleHBlbnNlcywgMC43NSkgKyAxLjUgKiBJUVIoZGYkZXhwZW5zZXMpKSksIF0NCiMgUGFyYSAnYWdlJw0KZGYyIDwtIGRmMlshKGRmJGFnZSA8IChxdWFudGlsZShkZiRhZ2UsIDAuMjUpIC0gMS41KklRUihkZiRhZ2UpKSB8IGRmJGFnZSA+IChxdWFudGlsZShkZiRhZ2UsIDAuNzUpICsgMS41KklRUihkZiRhZ2UpKSksXQ0KDQojIFBhcmEgJ2JtaScNCmRmMiA8LSBkZjJbIShkZiRibWkgPCAocXVhbnRpbGUoZGYkYm1pLCAwLjI1KSAtIDEuNSpJUVIoZGYkYm1pKSkgfCBkZiRibWkgPiAocXVhbnRpbGUoZGYkYm1pLCAwLjc1KSArIDEuNSpJUVIoZGYkYm1pKSkpLF0NCg0KbG9nX29sc19tb2RlbDIgPC0gbG0obG9nKGV4cGVuc2VzKSB+IGxvZyhhZ2UpICsgbG9nKGJtaSkgKyBhcy5mYWN0b3Ioc21va2VyKSArIGNoaWxkcmVuICAsIGRhdGEgPSBkZjIpDQpzdW1tYXJ5KGxvZ19vbHNfbW9kZWwpDQoNCmBgYA0KDQojIyMjIEhldGVyb2NlZGFzdGljaWRhZA0KYGBge3J9DQpicHRlc3QobG9nX29sc19tb2RlbDIpDQpgYGANCiMjIyMgTm9ybWFsaWRhZCBkZSBsb3MgcmVzaWR1YWxlcw0KDQpgYGB7cn0NCnNoYXBpcm8udGVzdChyZXNpZChsb2dfb2xzX21vZGVsMikpDQpgYGANCg0KIyMjIFdlaWdodCBPTFMNCg0KYGBge3J9DQp3ZWlnaHRzIDwtIDEgLyBsb2coZGYyJGV4cGVuc2VzKQ0KDQojIEFqdXN0YXIgZWwgbW9kZWxvIFdMUw0KbG9nX29sc193bHNfbW9kZWwgPC0gbG0obG9nKGV4cGVuc2VzKSB+IGxvZyhhZ2UpICsgbG9nKGJtaSkgKyBhcy5mYWN0b3Ioc21va2VyKSArIGNoaWxkcmVuLCBkYXRhID0gZGYyLCB3ZWlnaHRzID0gd2VpZ2h0cykNCg0KIyBWZXIgZWwgcmVzdW1lbiBkZWwgbW9kZWxvDQpzdW1tYXJ5KGxvZ19vbHNfd2xzX21vZGVsKQ0KYGBgDQojIyMjIEhldGVyb2NlZGFzdGljaWRhZA0KDQpgYGB7cn0NCmJwdGVzdChsb2dfb2xzX3dsc19tb2RlbCkNCmBgYA0KIyMjIyBOb3JtYWxpZGFkIGRlIGxvcyByZXNpZHVhbGVzDQpgYGB7cn0NCnNoYXBpcm8udGVzdChyZXNpZChsb2dfb2xzX3dsc19tb2RlbCkpDQpgYGANCmBgYHtyfQ0KaGlzdChsb2dfb2xzX3dsc19tb2RlbCRyZXNpZHVhbHMsDQogICAgIGNvbCA9ICJwaW5rIiwgDQogICAgIGJvcmRlciA9ICJibGFjayIpDQpgYGANCg0KTGFzIHRyYW5zZm9ybWFjaW9uZXMgZGUgbGFzIHZhcmlhYmxlcyBjb24gbGEgZWxpbWluYWNpw7NuIGRlIGxvcyBPdXRsaWVycyB5IGVsIG1vZGVsbyBXZWlnaHQgT0xTIGxvZ3Jhcm9uIHJlZHVjaXIgc2lnbmlmaWNhdGl2YW1lbnRlIGxhICpIZXRlcm9jZWRhc3RpY2lkYWQqLCBzaW4gZW1iYXJnbyBzZSBtYW50aWVuZSBlbCBwcm9ibGVtYSBkZSBsYSAqYW5vcm1hbGlkYWQgZGUgbG9zIHJlc2lkdWFsZXMqLg0KDQpgYGB7cn0NCiNSTVNFDQoNClJNU0VfbG9nX29sc193bHNfbW9kZWwgPC0gc3FydChtZWFuKGxvZ19vbHNfd2xzX21vZGVsJHJlc2lkdWFsc14yKSkNClJNU0VfbG9nX29sc193bHNfbW9kZWwNCg0KYGBgDQoNCg0KIyBNb2RlbG9zIGRlIG1hY2hpbmUgbGVhcm5pbmcNCg0KIyMgQ3Jvc3MgVmFsaWRhdGlvbg0KDQpgYGB7cn0NCg0KZGYyIDwtIG5hLm9taXQoZGYyKSAgIyBMaW1waWEgZWwgZGF0YWZyYW1lIGRlIE5BDQpkZjJfYWx0IDwtIGRmMiAlPiUgZHBseXI6OnNlbGVjdChleHBlbnNlcywgYWdlLGJtaSxzbW9rZXIsY2hpbGRyZW4pDQoNCmRmMiRleHBlbnNlcz0gbG9nKGRmMiRleHBlbnNlcyApDQpkZjIkYWdlPSBsb2coZGYyJGFnZSApDQpkZjIkYm1pPSBsb2coZGYyJGJtaSApDQoNCnNldC5zZWVkKDEyMykNCnBhcnRpdGlvbiA8LSBjcmVhdGVEYXRhUGFydGl0aW9uKHkgPSBkZjIkZXhwZW5zZXMsIHAgPSAwLjcsIGxpc3QgPSBGQUxTRSkNCnRyYWluID0gZGYyW3BhcnRpdGlvbiwgXQ0KdGVzdCA9IGRmMlstcGFydGl0aW9uLCBdDQp0cmFpbjIgPSBkZjJbcGFydGl0aW9uLCBdDQp0ZXN0MiA9IGRmMlstcGFydGl0aW9uLCBdDQoNCg0KYGBgDQoNCg0KDQoNCiMjIFhHQm9vc3QgUmVncmVzacOzbg0KDQpgYGB7cn0NCiMgKipOT1RFKio6IFRoZSBlc3RpbWF0aW9uIHJlZ3Jlc3Npb24gbWV0aG9kIFhHQm9vc3QgYXJlIHNlbnNpdGl2ZSB0byBzcGVjaWZ5aW5nIGNvbW1hbmRzIHN1Y2ggYXMgbG9nKCkgYW5kIEkoKV4yIGluIHRoZSByZWdyZXNzaW9uIGVxdWF0aW9uIHNvIHdlIHdpbGwgZG8gdGhlIGRhdGEgdHJhbnNmb3JtYXRpb24gYW5kIGRpcmVjdGx5IGluY2x1ZGUgaXQgdGhlIGRhdGFzZXQuIA0KDQoNCg0KDQoNCiMgZGVmaW5lIGV4cGxhbmF0b3J5IHZhcmlhYmxlcyAoWCdzKSBhbmQgZGVwZW5kZW50IHZhcmlhYmxlIChZKSBpbiB0cmFpbmluZyBzZXQNCnRyYWluX3ggPSBkYXRhLm1hdHJpeCh0cmFpblssIC03XSkNCnRyYWluX3kgPSB0cmFpblssN10NCg0KIyBkZWZpbmUgZXhwbGFuYXRvcnkgdmFyaWFibGVzIChYJ3MpIGFuZCBkZXBlbmRlbnQgdmFyaWFibGUgKFkpIGluIHRlc3Rpbmcgc2V0DQp0ZXN0X3ggPSBkYXRhLm1hdHJpeCh0cmFpblssIC03XSkNCnRlc3RfeSA9IHRyYWluWywgN10NCg0KIyBkZWZpbmUgZmluYWwgdHJhaW5pbmcgYW5kIHRlc3Rpbmcgc2V0cw0KeGdiX3RyYWluID0geGdiLkRNYXRyaXgoZGF0YSA9IHRyYWluX3gsIGxhYmVsID0gdHJhaW5feSkNCnhnYl90ZXN0ICA9IHhnYi5ETWF0cml4KGRhdGEgPSB0ZXN0X3gsIGxhYmVsID0gdGVzdF95KQ0KDQojIExldHMgZml0IFhHQm9vc3QgcmVncmVzc2lvbiBtb2RlbCBhbmQgZGlzcGxheSBSTVNFIGZvciBib3RoIHRyYWluaW5nIGFuZCB0ZXN0aW5nIGRhdGEgYXQgZWFjaCByb3VuZA0Kd2F0Y2hsaXN0ID0gbGlzdCh0cmFpbj14Z2JfdHJhaW4sIHRlc3Q9eGdiX3Rlc3QpDQptb2RlbF94Z2IgPSB4Z2IudHJhaW4oZGF0YT14Z2JfdHJhaW4sIG1heC5kZXB0aD0zLCB3YXRjaGxpc3Q9d2F0Y2hsaXN0LCBucm91bmRzPTcwKSAjIHRoZSBtb3JlIHRoZSBudW1iZXIgb2Ygcm91bmRzIHNlbGVjdGVkLCB0aGUgbG9uZ2VyIHRoZSB0aW1lIHRvIGRpc3BsYXkgdGhlIHJlc3VsdHMuIA0KDQojIExvb2tzIGxpa2UgdGhlIGxvd2VzdCBSTVNFIGZvciBib3RoIHRyYWluaW5nIGFuZCB0ZXN0IGRhdGFzZXQgaXMgYWNoaWV2ZWQgYXQgNTkgcm91bmQuIA0KIyBMZXRzIGVzdGltYXRlIG91ciBmaW5hbCByZWdyZXNzaW9uIG1vZGVsDQpyZWdfeGdiID0geGdib29zdChkYXRhID0geGdiX3RyYWluLCBtYXguZGVwdGggPSAzLCBucm91bmRzID0gNTksIHZlcmJvc2UgPSAwKSAjIHNldHRpbmcgdmVyYm9zZSA9IDAgYXZvaWRzIHRvIGRpc3BsYXkgdGhlIHRyYWluaW5nIGFuZCB0ZXN0aW5nIGVycm9yIGZvciBlYWNoIHJvdW5kLiANCnByZWRpY3Rpb25feGdiX3Rlc3Q8LXByZWRpY3QocmVnX3hnYiwgeGdiX3Rlc3QpDQpSTVNFX1NWTSA8LSBybXNlKHByZWRpY3Rpb25feGdiX3Rlc3QsIHRlc3QkZXhwZW5zZXMpDQoNCiMgTGV0cyBkbyBzb21lIGRpYWdub3N0aWMgY2hlY2sgb2YgcmVncmVzc2lvbiByZXNpZHVhbHMgDQp4Z2JfcmVnX3Jlc2lkdWFsczwtdGVzdCRleHBlbnNlcyAtIHByZWRpY3Rpb25feGdiX3Rlc3QNCnBsb3QoeGdiX3JlZ19yZXNpZHVhbHMsIHhsYWI9ICJEZXBlbmRlbnQgVmFyaWFibGUiLCB5bGFiID0gIlJlc2lkdWFscyIsIG1haW4gPSAnWEdCb29zdCBSZWdyZXNzaW9uIFJlc2lkdWFscycpDQphYmxpbmUoMCwwKQ0KDQojIFBsb3QgZmlyc3QgMyB0cmVlcyBvZiBtb2RlbA0KeGdiLnBsb3QudHJlZShtb2RlbD1yZWdfeGdiLCB0cmVlcz0wOjIpDQppbXBvcnRhbmNlX21hdHJpeCA8LSB4Z2IuaW1wb3J0YW5jZShtb2RlbCA9IHJlZ194Z2IpDQp4Z2IucGxvdC5pbXBvcnRhbmNlKGltcG9ydGFuY2VfbWF0cml4LCB4bGFiID0gIkV4cGxhbmF0b3J5IFZhcmlhYmxlcyBYJ3MgSW1wb3J0YW5jZSIpDQpgYGANCg0KIyMjIyBSTVNFDQoNCmBgYHtyIHdhcm5pbmc9RkFMU0V9DQojIEPDoWxjdWxvIGRlbCBSTVNFDQpSTVNFX1hHQiA8LSBybXNlKHRlc3QkZXhwZW5zZXMsIHByZWRpY3Rpb25feGdiX3Rlc3QpDQoNCiMgSW1wcmltaXIgZWwgUk1TRQ0KcHJpbnQoUk1TRV9YR0IpDQpgYGANCg0KIyMgw4FyYm9sZXMgZGUgZGVjaXNpw7NuDQoNCmBgYHtyfQ0KZGVjaXNpb25fdHJlZV9tb2RlbCA8LSBycGFydChleHBlbnNlcyB+IGFnZSArICBibWkgKyBjaGlsZHJlbiArIHNtb2tlciwgZGF0YSA9IHRyYWluKQ0KDQojIHN1bW1hcnkoZGVjaXNpb25fdHJlZV9yZWdyZXNzaW9uKQ0KcGxvdChkZWNpc2lvbl90cmVlX21vZGVsLCBjb21wcmVzcyA9IFRSVUUpDQp0ZXh0KGRlY2lzaW9uX3RyZWVfbW9kZWwsIHVzZS5uID0gVFJVRSkNCnJwYXJ0LnBsb3QoZGVjaXNpb25fdHJlZV9tb2RlbCkNCg0KYGBgDQoNCiMjIyMgUk1TRQ0KYGBge3J9DQojIyMgUk1TRSBvZiBERUNJU0lPTiBUUkVFIFJFR1JFU1NJT04NCmRlY2lzaW9uX3RyZWVfcHJlZGljdGlvbiA8LSBwcmVkaWN0KGRlY2lzaW9uX3RyZWVfbW9kZWwsdGVzdCkNClJNU0VfdHJlZSA8LSBybXNlKGRlY2lzaW9uX3RyZWVfcHJlZGljdGlvbiwgdGVzdCRleHBlbnNlcykNClJNU0VfdHJlZQ0KYGBgDQpgYGB7cn0NCmNvbG5hbWVzKHRyYWluKQ0KDQpgYGANCg0KIyMgUmFuZG9tIEZvcmVzdCANCg0KYGBge3J9DQpyZl9tb2RlbCA8LSByYW5kb21Gb3Jlc3QoZXhwZW5zZXMgfiAgYWdlICsgYm1pICsgY2hpbGRyZW4gKyBzbW9rZXIsIGRhdGE9IHRyYWluLCBwcm94aW1pdHk9VFJVRSkNCiMgcmFuZG9tX2ZvcmVzdDwtcmFuZG9tRm9yZXN0KE1FRFZ+LixkYXRhPXRyYWluX2FsdCxpbXBvcnRhbmNlPVRSVUUsIHByb3hpbWl0eT1UUlVFKSANCnByaW50KHJmX21vZGVsKSAjIyMgdGhlIHRyYWluIGRhdGEgc2V0IG1vZGVsIGFjY3VyYWN5IGlzIGFyb3VuZCA4NSUuDQoNCg0KIyBQcmVkaWN0aW9uICYgQ29uZnVzaW9uIE1hdHJpeCDigJMgdGVzdCBkYXRhDQpyZl9wcmVkaWN0aW9uIDwtIHByZWRpY3QocmZfbW9kZWwsdGVzdCkNCg0KIyBjb25mdXNpb25NYXRyaXgocmZfcHJlZGljdGlvbl90cmFpbl9kYXRhLCB0cmFpbiRNRURWKSAjIGEgY29uZnVzaW9uIG1hdHJpeCBpcyBlc3NlbnRpYWxseSBhIHRhYmxlIHRoYXQgY2F0ZWdvcml6ZXMgcHJlZGljdGlvbnMgYWdhaW5zdCBhY3R1YWwgdmFsdWVzLg0KUk1TRV9yZiA8LSBybXNlKHJmX3ByZWRpY3Rpb24sIHRlc3QkZXhwZW5zZXMpDQoNCg0KIyBFdmFsdXRlIFZhcmlhYmxlcycgSW1wb3J0YW5jZQ0KIyBIb3cgdG8gaW50ZXJwcmV0IHZhckltcFBsb3QoKT8gVGhlIGhpZ2hlciB0aGUgdmFsdWUgb2YgbWVhbiBkZWNyZWFzZSBhY2N1cmFjeSwgdGhlIGhpZ2hlciB0aGUgaW1wb3J0YW5jZSBvZiB0aGUgdmFyaWFibGUgaW4gdGhlIG1vZGVsLiANCiMgSW4gb3RoZXIgd29yZHMsIG1lYW4gZGVjcmVhc2UgYWNjdXJhY3kgcmVwcmVzZW50cyBob3cgbXVjaCByZW1vdmluZyBlYWNoIHZhcmlhYmxlIHJlZHVjZXMgdGhlIGFjY3VyYWN5IG9mIHRoZSBtb2RlbC4NCnZhckltcFBsb3QocmZfbW9kZWwsIG4udmFyID0gNSwgbWFpbiA9ICJUb3AgMTAgLSBWYXJpYWJsZSIpICMgSXQgZGlzcGxheXMgYSB2YXJpYWJsZSBpbXBvcnRhbmNlIHBsb3QgZnJvbSB0aGUgcmFuZG9tIGZvcmVzdCBtb2RlbC4gDQppbXBvcnRhbmNlKHJmX21vZGVsKSAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAjIEl0IGlzIHdvcnRoIG1lbnRpb25pbmcgdGhhdCBJbmNOb2RlUHVyaXR5IGJ5IGhvdyBtdWNoIHRoZSBtb2RlbCBlcnJvciBpbmNyZWFzZXMgYnkgZHJvcHBpbmcgZWFjaCBvZiB0aGUgc3BlY2lmaWVkIGV4cGxhbmF0b3J5IHZhcmlhYmxlcy4gDQogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAjIEJyaWVmbHksIHZhckltcFBsb3QoKSBpbmRpY2F0ZXMgZWFjaCB2YXJpYWJsZSdzIGltcG9ydGFuY2UgaW4gZXhwbGFpbmluZyB0aGUgcGVyZm9ybWFuY2Ugb2YgdGhlIGRlcGVuZGVudCB2YXJpYWJsZSAoWSkuDQoNCg0KYGBgDQoNCiMjIyMgUk1TRQ0KDQpgYGB7cn0NClJNU0VfcmYNCmBgYA0KDQojIyBSZWRlcyBOZXVyb25hbGVzDQoNCg0KYGBge3J9DQoNCmRmMiA8LSBuYS5vbWl0KGRmMikgICMgTGltcGlhIGVsIGRhdGFmcmFtZSBkZSBOQQ0KZGYyX2FsdCA8LSBkZjIgJT4lIGRwbHlyOjpzZWxlY3QoZXhwZW5zZXMsIGFnZSxibWksc21va2VyLGNoaWxkcmVuKQ0KDQpkZjIkZXhwZW5zZXM9IGxvZyhkZjIkZXhwZW5zZXMgKQ0KZGYyJGFnZT0gbG9nKGRmMiRhZ2UgKQ0KZGYyJGJtaT0gbG9nKGRmMiRibWkgKQ0KDQpzZXQuc2VlZCgxMjMpDQpwYXJ0aXRpb24gPC0gY3JlYXRlRGF0YVBhcnRpdGlvbih5ID0gZGYyJGV4cGVuc2VzLCBwID0gMC43LCBsaXN0ID0gRkFMU0UpDQp0cmFpbiA9IGRmMltwYXJ0aXRpb24sIF0NCnRlc3QgPSBkZjJbLXBhcnRpdGlvbiwgXQ0KdHJhaW4yID0gZGYyW3BhcnRpdGlvbiwgXQ0KdGVzdDIgPSBkZjJbLXBhcnRpdGlvbiwgXQ0KDQojIExldHMgZXN0aW1hdGUgYSBOZXVyYWwgTmV0d29yayBSZWdyZXNzaW9uDQoNCnRyYWluMiA8LSB0cmFpbjIgJT4lDQogIG11dGF0ZShzbW9rZXIgPSBpZl9lbHNlKHNtb2tlciA9PSAieWVzIiwgMSwgMCkpDQp0ZXN0MiA8LSB0ZXN0MiAlPiUNCiAgbXV0YXRlKHNtb2tlciA9IGlmX2Vsc2Uoc21va2VyID09ICJ5ZXMiLCAxLCAwKSkNCg0Kbm5fbW9kZWwgPC0gbmV1cmFsbmV0KGV4cGVuc2VzIH4gYWdlICsgIGJtaSArIGNoaWxkcmVuICsgc21va2VyLCBkYXRhID0gdHJhaW4yLCBoaWRkZW4gPSBjKDUsIDMpLCBsaW5lYXIub3V0cHV0ID0gVFJVRSkgDQoNCiMgUGxvdCB0aGUgbmV1cmFsIG5ldHdvcmsgDQpwbG90KG5uX21vZGVsKQ0KDQoNCm5uX3ByZWRpY3Rpb25zIDwtIG5ldXJhbG5ldDo6Y29tcHV0ZShubl9tb2RlbCwgdGVzdDIpDQpubl9wcmVkaWN0aW9uc192YWx1ZXMgPC0gbm5fcHJlZGljdGlvbnMkbmV0LnJlc3VsdA0KDQoNCmFjdHVhbF92YWx1ZXMgPC0gdGVzdDIkZXhwZW5zZXMNCg0KDQojIENhbGN1bGFyIGVsIFJNU0UNCnJtc2VfTk4gPC0gTWV0cmljczo6cm1zZShhY3R1YWxfdmFsdWVzLCBubl9wcmVkaWN0aW9uc192YWx1ZXMpDQoNCg0KYGBgDQoNCiMjIyMgUk1TRQ0KDQpgYGB7cn0NCiMgSW1wcmltaXIgZWwgUk1TRQ0KcHJpbnQocm1zZV9OTikNCmBgYA0KDQojIEV2YWx1YWNpw7NuIHkgc2VsZWNjacOzbiBkZWwgbW9kZWxvDQoNCg0KIyMgUk1TRSBkZSB0b2RvcyBsb3MgbW9kZWxvcw0KDQpgYGB7cn0NCiMgQ3JlYXIgZWwgZGF0YS5mcmFtZQ0Kcm1zZV9kZiA8LSBkYXRhLmZyYW1lKA0KICBNb2RlbG8gPSBjKCJSTVNFIGRlIGxvZ19vbHNfbW9kZWwiLCAiUk1TRSBkZSBsb2dfb2xzX3dsc19tb2RlbCIsICJSTVNFIGRlIFhHQiIsICJSTVNFIGRlIFRyZWUiLCAiUk1TRSBkZSBSRiIsICJSTVNFIGRlIE5OIiksDQogIFJNU0UgPSBjKFJNU0VfbG9nX29sc19tb2RlbCwgUk1TRV9sb2dfb2xzX3dsc19tb2RlbCwgUk1TRV9YR0IsIFJNU0VfdHJlZSwgUk1TRV9yZiwgcm1zZV9OTikNCikNCg0KIyBJbXByaW1pciBlbCBkYXRhLmZyYW1lIGNyZWFkbw0KcHJpbnQocm1zZV9kZikNCg0KYGBgDQoNCmBgYHtyfQ0KDQojIENyZWFyIGVsIGdyw6FmaWNvIGRlIGJhcnJhcw0KZ2dwbG90KHJtc2VfZGYsIGFlcyh4ID0gTW9kZWxvLCB5ID0gUk1TRSwgZmlsbCA9IE1vZGVsbykpICsNCiAgZ2VvbV9iYXIoc3RhdCA9ICJpZGVudGl0eSIsIHNob3cubGVnZW5kID0gRkFMU0UpICsgDQogIHRoZW1lX21pbmltYWwoKSArDQogIHRoZW1lKGF4aXMudGV4dC54ID0gZWxlbWVudF90ZXh0KGFuZ2xlID0gNDUsIGhqdXN0ID0gMSkpICsNCiAgbGFicyh0aXRsZSA9ICJDb21wYXJhY2nDs24gZGUgUk1TRSBwb3IgTW9kZWxvIiwNCiAgICAgICB4ID0gIk1vZGVsbyIsDQogICAgICAgeSA9ICJSTVNFIikgKw0KICBnZW9tX3RleHQoYWVzKGxhYmVsID0gcm91bmQoUk1TRSwgMikpLCB2anVzdCA9IC0wLjUsIHNpemUgPSAzLjUpDQoNCmBgYA0KDQojIENvbmNsdXNpb25lcw0KDQpEYWRvIHF1ZSBsb3MgcmVzdWx0YWRvcyBvYnRlbmlkb3MgYWwgZXZhbHVhciBsYSBtw6l0cmljYSBSTVNFIGluZGljYW4gcXVlIGVsIG1vZGVsbyBkZSByZWRlcyBuZXVyb25hbGVzIHRpZW5lIGVsIG1lbm9yIHZhbG9yLCBzZSBkZWNpZGUgc2VsZWNjaW9uYXJsbyBjb21vIGVsIG1vZGVsbyBxdWUgcHJlc2VudGEgZWwgbWVqb3IgZGVzZW1wZcOxbyBlbiB0w6lybWlub3MgZGUgcHJlY2lzacOzbiBzZWfDum4gZXN0YSBtw6l0cmljYS4NCg0KIyMgRURBIA0KDQpUcmFzIG51ZXN0cm8gYW7DoWxpc2lzIGV4aGF1c3Rpdm8gZGUgbG9zIGRhdG9zLCBpZGVudGlmaWNhbW9zIHF1ZSB2YXJpYXMgdmFyaWFibGVzIG5vIHNlZ3XDrWFuIGRpc3RyaWJ1Y2lvbmVzIG5vcm1hbGVzLCBwb3IgbG8gcXVlIHJlY3Vycmltb3MgYSB0cmFuc2Zvcm1hY2lvbmVzIGxvZ2Fyw610bWljYXMgcGFyYSBub3JtYWxpemFybGFzLiBUYW1iacOpbiBkZXRlY3RhbW9zIGxhIHByZXNlbmNpYSBkZSBvdXRsaWVycyBxdWUgYWZlY3RhYmFuIG5lZ2F0aXZhbWVudGUgbGEgaW50ZXJwcmV0YWNpw7NuIGRlIG51ZXN0cm9zIG1vZGVsb3MuIEVzdGUgYW7DoWxpc2lzIGRldGFsbGFkbyBub3MgYnJpbmTDsyB1bmEgY29tcHJlbnNpw7NuIG3DoXMgcHJvZnVuZGEgZGUgY2FkYSB2YXJpYWJsZSB5IHN1IHJlbGFjacOzbiBjb24gbGEgdmFyaWFibGUgZGVwZW5kaWVudGUsIGxvIHF1ZSBmYWNpbGl0w7MgbGEgY3JlYWNpw7NuIGRlIHVuIG1vZGVsbyBtw6FzIHByZWNpc28geSBjb24gdW5hIG1lam9yIGNhcGFjaWRhZCBwcmVkaWN0aXZhLiBBZGVtw6FzLCBvYnNlcnZhbW9zIHVuYSBiYWphIGNvcnJlbGFjacOzbiBlbnRyZSBsYXMgdmFyaWFibGVzLCBsbyBxdWUgZGVzY2FydMOzIHByZW9jdXBhY2lvbmVzIHNvYnJlIG11bHRpY29saW5lYWxpZGFkIHkgcmVzcGFsZMOzIGxhIHN1cG9zaWNpw7NuIGRlIGluZGVwZW5kZW5jaWEgZW50cmUgbGFzIHZhcmlhYmxlcyBleHBsaWNhdGl2YXMuDQoNClNpbiBlbWJhcmdvLCBkZWJpZG8gYSBsYXMgaXJyZWd1bGFyaWRhZGVzIGVuIGxhcyBkaXN0cmlidWNpb25lcyBkZSBsYXMgdmFyaWFibGVzIGluZGVwZW5kaWVudGVzIHkgbGEgbmF0dXJhbGV6YSB0cmFuc3ZlcnNhbCBkZSBsb3MgZGF0b3MsIGFudGljaXBhbW9zIHBvc2libGVzIHByb2JsZW1hcyBkZSBoZXRlcm9zY2VkYXN0aWNpZGFkLiBFc3RhcyBwcmVvY3VwYWNpb25lcyBzZSBjb25maXJtYXJvbiBkdXJhbnRlIGxhIGVzdGltYWNpw7NuIGRlIGxvcyBtb2RlbG9zIGRlIHJlZ3Jlc2nDs24gbGluZWFsLiBQYXJhIGFib3JkYXIgZXN0b3MgZGVzYWbDrW9zLCBhcGxpY2Ftb3MgdHJhbnNmb3JtYWNpb25lcyBhIGxhcyB2YXJpYWJsZXMgeSB1dGlsaXphbW9zIHVuIG1vZGVsbyBkZSByZWdyZXNpw7NuIGxpbmVhbCBwb25kZXJhZG8sIGxvIHF1ZSBtZWpvcsOzIGxhIGZpYWJpbGlkYWQgZGUgbG9zIHJlc3VsdGFkb3MgeSBtaXRpZ8OzIGxvcyBwcm9ibGVtYXMgYXNvY2lhZG9zIGNvbiBsYSBoZXRlcm9zY2VkYXN0aWNpZGFkLg0KDQojIyBNb2RlbG8gc2VsZWNjaW9uYWRvDQoNCiMjIyMgaS4gwr9DdcOhbGVzIHNvbiBsYXMgdmFyaWFibGVzIHF1ZSBjb250cmlidXllbiBhIGV4cGxpY2FyIGxvcyBjYW1iaW9zIGRlIGxhIHByaW5jaXBhbCB2YXJpYWJsZSBkZSBlc3R1ZGlvPw0KDQpTZWfDum4gbG9zIGNvZWZpY2llbnRlcyBvYnRlbmlkb3MgZGVsIG1vZGVsbyBkZSByZWRlcyBuZXVyb25hbGVzLCBwb2RlbW9zIGluZmVyaXIgcXVlIGxhcyB2YXJpYWJsZXMgcXVlIGVqZXJjZW4gdW5hIG1heW9yIGluZmx1ZW5jaWEgZW4gbGEgcHJlZGljY2nDs24gZGUgbGEgdmFyaWFibGUgZGVwZW5kaWVudGUgc29uIGFnZSwgc21va2UgeSBibWkuIA0KDQojIyMjIGlpLiDCv0PDs21vIGVzIGVsIGltcGFjdG8gZGUgZGljaGFzIHZhcmlhYmxlcyBleHBsaWNhdGl2YXMgc29icmUgbGEgdmFyaWFibGUgZGVwZW5kaWVudGU/DQoNClRvZGFzIGxhcyB2YXJpYWJsZXMgbWVuY2lvbmFkYXMgYW50ZXJpb3JtZW50ZSB0aWVuZW4gdW5hIGluZmx1ZW5jaWEgc2lnbmlmaWNhdGl2YSBlbiBsYSB2YXJpYWJsZSBkZXBlbmRpZW50ZSB5IHN1IGVmZWN0byBlbiBsYSB2YXJpYWJsZSBhIHByZWRlY2lyIGVzIHBvc2l0aXZvLiBFc3RvIHNpZ25pZmljYSBxdWUgYSBtZWRpZGEgcXVlIGVzdGFzIHZhcmlhYmxlcyBhdW1lbnRhbiwgdGFtYmnDqW4gYXVtZW50YSBsYSB2YXJpYWJsZSBkZXBlbmRpZW50ZSAoZXhwZW5zZXMpLg0KDQojIyMjIGlpaS4gwr9Mb3MgcmVzdWx0YWRvcyBlc3RpbWFkb3MgZGVsIG1vZGVsbyBzZWxlY2Npb25hZG8gc29uIHNpbWlsYXJlcyBhIGxvcyBvdHJvcyBtb2RlbG9zIGVzdGltYWRvcz8gwr9DdcOhbGVzIHNvbiBsYXMgZGlmZXJlbmNpYXM/DQoNCkxvcyByZXN1bHRhZG9zIGRlIHRvZG9zIGxvcyBtb2RlbG9zIHNvbiBzaW1pbGFyZXMgY3VhbmRvIHNlIGNvbXBhcmFuIGNvbiBzdXMgcHJpbmNpcGFsZXMgbcOpdHJpY2FzIGRlIGV2YWx1YWNpw7NuIGRlIHJlc3VsdGFkb3MsIGVuIGxvcyBtb2RlbG9zIGRlIHJlZ3Jlc2nDs24gbGluZWFsLCBsb3MgQUlDIHNvbiBzaW1pbGFyZXMgeSBzZSBtZWpvcsOzIGVzdGEgbcOpdGljYSBjb24gZWwgbW9kZWxvIGRlIHJlZ3Jlc2nDs24gcG9uZGVyYWRvIHBvciBsb3MgbW90aXZvcyBkZSB0cmFuc2Zvcm1hY2lvbmVzIHkgZGUgbGEgcG9uZGVyYWNpw7NuIGRlIGxhcyB2YXJpYWJsZXMuIFBvciBvdHJvIGxhZG8sIHRvZG9zIGxvcyBtb2RlbG9zIG11ZXN0cmFuIHVuIFJNU0Ugc2ltaWxhciwgZXN0YW5kbyB0b2RhcyBlbiB1biByYW5nbyBzaW1pbGFyIGRlIHZhbG9yZXMuIFBvciDDumx0aW1vLCBsYXMgdmFyaWFibGVzIHNpZ25pZmljYXRpdmFzIGVuIGxvcyBtb2RlbG9zIGNvaW5jaWRlbiBhbCBjb2xvY2FyIGEgKmFnZSogY29tbyBsYSB2YXJpYWJsZSBjb24gbcOhcyBwZXNvLCBzZWd1aWRvIGRlIHNtb2tlIHkgYm1pLg==

Health Insurence

Lesly Darian Romero Vazquez

2024-03-01

Preguntas Guía

i) ¿Qué es Supervised Machine Learning y cuáles son algunas de sus aplicaciones en Inteligencia de Negocios?

ii) ¿Cuáles son los principales algoritmos de Supervised Machine Learning?

iii) ¿Qué es la R2 Ajustada? ¿Qué es la métrica RMSE? ¿Cuál es la diferencia entre la R2 Ajustada y la métrica RMSE?

Referencias Bibliograficas

Librerías

Análisis Exploratorio de los Datos (EDA)

Medidas de tendencia central

Medidas de dispersión

Identificación de patrones, tendencias

Distribuciones de cada variable

Relaciones entre variables independientes y la dependiente

Correlación entre variables

Modelo de regresión lineal

Evaluación del modelo

Pruebas de diagnóstico

Multicolinealidad

Heterocedasticidad

Autocorrelación serial

Autocorrelación espacial

Normalidad de los residuales

Transformaciones a las variables

Heterocedasticidad

Normalidad de los residuales

Weight OLS

Heterocedasticidad

Normalidad de los residuales

Modelos de machine learning

Cross Validation

XGBoost Regresión

RMSE

Árboles de decisión

RMSE

Random Forest

RMSE

Redes Neuronales

RMSE

Evaluación y selección del modelo

RMSE de todos los modelos

Conclusiones

EDA

Modelo seleccionado

i. ¿Cuáles son las variables que contribuyen a explicar los cambios de la principal variable de estudio?

ii. ¿Cómo es el impacto de dichas variables explicativas sobre la variable dependiente?

iii. ¿Los resultados estimados del modelo seleccionado son similares a los otros modelos estimados? ¿Cuáles son las diferencias?