Os dados são referentes a informações de clientes de um banco com a variável alvo sendo binária e refletindo a permanência ou não do cliente no banco, ou seja, se o mesmo encerrou ou não a sua conta bancária.
Dentre as variáveis nós temos:
| Variável | Descrição |
|---|---|
| Id_Cliente | IDs unicos para a identificação dos clientes |
| Sobrenome | Ultimo nome do cliente |
| Pont_Credito | Pontuação de crédito do cliente |
| País | O país de onde o cliente pertence |
| Gênero | Gênero do cliente |
| Idade | A idade do cliente |
| Posse | Número de anos que o cliente esteve no banco |
| Saldo | Saldo bancário do cliente |
| Num_Produto | Número de produtos bancários utilizado pelo cliente |
| Tem_cart_cred | Se o cliente possui um cartão de crédito com o banco ou não |
| Cli_ativo | Se o cliente é um membro ativo no banco ou não |
| Salario_est | Salário estimado do cliente em dólares |
| Encerrou | Se o cliente encerrou ou não a sua conta |
Matriz de correlação para as variáveis quantitativas utilizando o método de spearman
Teste Qui-Quadrado de Independência
| Gênero | ||
|---|---|---|
| Feminino | Masculino | |
| País | ||
| Alemanha | 1193 | 1316 |
| Espanha | 1089 | 1388 |
| França | 2261 | 2753 |
| #Total cases | 4543 | 5457 |
##
## Pearson's Chi-squared test
##
## data: table(X$País, X$Gênero)
## X-squared = 6.9182, df = 2, p-value = 0.03146
Quantidade
País x Encerrou
Onde:
Densidade
Quantidade
Produtos consumidos x Encerrou
## `summarise()` has grouped output by 'Num_Produto'. You can override using the
## `.groups` argument.
## `summarise()` has grouped output by 'Num_Produto'. You can override using the
## `.groups` argument.
## `mutate_all()` ignored the following grouping variables:
Clientes Ativos x país
Clientes Ativos x Encerrou
Quantidade
Tem cartão de crédito x Encerrou a conta
Quantidade
Anos como cliente x Encerrou a conta
Densidade
Para Idade
| Categoria | Sim | Não | RR |
|---|---|---|---|
| ate32 | 2.13% | 25.77% | 0.0827 |
| 32_37 | 2.49% | 20.48% | 0.1216 |
| 38_44 | 5.31% | 20.42% | 0.2600 |
| 44mais | 10.44% | 12.96% | 0.8056 |
Para pontuação de Crédito
| Categoria | Sim | Não | RR |
|---|---|---|---|
| ate584 | 5.56% | 19.78% | 0.2811 |
| 584_652 | 5.26% | 19.75% | 0.2663 |
| 652_718 | 4.55% | 20.47% | 0.2223 |
| 718mais | 5% | 19.63% | 0.2547 |
Para posse
| Categoria | Sim | Não | RR |
|---|---|---|---|
| ate3 | 7.41% | 27.64% | 0.2681 |
| 3_7 | 7.85% | 32.11% | 0.2445 |
| 7mais | 5.11% | 19.88% | 0.2570 |
Para Saldo
| Categoria | Sim | Não | RR |
|---|---|---|---|
| ate 0 | 5% | 31.17% | 0.1604 |
| 0_118000 | 7.18% | 23.21% | 0.3093 |
| 118000 mais | 8.19% | 25.25% | 0.3244 |
Para Salário estimado
| Categoria | Sim | Não | RR |
|---|---|---|---|
| ate 67100 | 6.71% | 26.63% | 0.2520 |
| 67100_133000 | 6.6% | 26.83% | 0.2460 |
| 133000 mais | 7.06% | 26.17% | 0.2698 |
Para Número de produtos
| Categoria | Sim | Não | RR |
|---|---|---|---|
| ate 1 | 14.09% | 36.75% | 0.3834 |
| 1 mais | 6.28% | 42.88% | 0.1465 |
Visualização parcial do dados transformados em dummys
| alvo | Tem_cart_cred | Cli_ativo | FX_idade_ate32 | FX_idade_32_37 | FX_idade_38_44 | FX_idade_44mais | FX_Pont_cred_ate584 | FX_Pont_cred_584_652 | FX_Pont_cred_652_718 | FX_Pont_cred_718mais | FX_posse_ate3 | FX_posse_3_7 | FX_posse_7mais | FX_saldo_ate.0 | FX_saldo_0_118000 | FX_saldo_118000.mais | FX_sal_est_ate.67100 | FX_sal_est_67100_133000 | FX_sal_est_133000.mais | FX_num_prod_ate.1 | FX_num_prod_1.mais | País_Alemanha | País_Espanha | País_França | Gênero_Feminino | Gênero_Masculino |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 1 | 1 | 0 |
| 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 1 | 0 | 1 | 0 |
| 1 | 1 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 0 |
| 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 0 |
| 0 | 1 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 1 | 0 | 0 | 1 | 0 | 1 | 0 |
| 1 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 1 | 0 | 0 | 1 |
Verificando a Proporção da varipavel alvo
##
## 0 1
## 0.7963 0.2037
Banco de dados Balanceado
##
## 0 1
## 0.5 0.5
| alvo | Tem_cart_cred | Cli_ativo | FX_idade_32_37 | FX_idade_38_44 | FX_idade_44mais | FX_Pont_cred_ate584 | FX_Pont_cred_584_652 | FX_Pont_cred_652_718 | FX_posse_ate3 | FX_posse_3_7 | FX_saldo_0_118000 | FX_saldo_118000.mais | FX_sal_est_ate.67100 | FX_sal_est_67100_133000 | FX_num_prod_ate.1 | País_Alemanha | País_França | Gênero_Masculino |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | 1 | 0 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 1 | 0 |
| 1 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 1 | 0 |
| 1 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
| 1 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 0 |
| 1 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 1 | 0 | 1 | 1 | 0 | 1 |
| 1 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 |
A separação será realizada por:
split = sample.split(Base_balanceada$alvo, SplitRatio = 0.75)
training_set = subset(Base_balanceada, split == TRUE)
test_set = subset(Base_balanceada, split == FALSE)
Base treino
| alvo | Tem_cart_cred | Cli_ativo | FX_idade_32_37 | FX_idade_38_44 | FX_idade_44mais | FX_Pont_cred_ate584 | FX_Pont_cred_584_652 | FX_Pont_cred_652_718 | FX_posse_ate3 | FX_posse_3_7 | FX_saldo_0_118000 | FX_saldo_118000.mais | FX_sal_est_ate.67100 | FX_sal_est_67100_133000 | FX_num_prod_ate.1 | País_Alemanha | País_França | Gênero_Masculino | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 3 | 1 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
| 5 | 1 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 1 | 0 | 1 | 1 | 0 | 1 |
| 6 | 1 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 |
| 8 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 0 | 1 | 0 | 1 | 0 |
| 9 | 1 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 1 | 0 |
| 10 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 1 | 0 |
Base teste
| alvo | Tem_cart_cred | Cli_ativo | FX_idade_32_37 | FX_idade_38_44 | FX_idade_44mais | FX_Pont_cred_ate584 | FX_Pont_cred_584_652 | FX_Pont_cred_652_718 | FX_posse_ate3 | FX_posse_3_7 | FX_saldo_0_118000 | FX_saldo_118000.mais | FX_sal_est_ate.67100 | FX_sal_est_67100_133000 | FX_num_prod_ate.1 | País_Alemanha | País_França | Gênero_Masculino | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | 1 | 1 | 0 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 1 | 0 |
| 2 | 1 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 1 | 0 |
| 4 | 1 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 0 |
| 7 | 1 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| 12 | 1 | 1 | 1 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 1 | 1 | 0 | 0 |
| 18 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 1 | 1 | 0 | 0 | 1 |
Ajuste Inicial
##
## Call:
## glm(formula = alvo ~ ., family = binomial(link = "logit"), data = training_set)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.41372 -0.88835 -0.01187 0.87491 2.37834
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.365289 0.204582 -6.674 2.50e-11 ***
## Tem_cart_cred -0.022894 0.092912 -0.246 0.8054
## Cli_ativo -0.839647 0.085824 -9.783 < 2e-16 ***
## FX_idade_32_37 0.354440 0.135301 2.620 0.0088 **
## FX_idade_38_44 1.175857 0.124450 9.448 < 2e-16 ***
## FX_idade_44mais 2.256627 0.124248 18.162 < 2e-16 ***
## FX_Pont_cred_ate584 -0.022881 0.119198 -0.192 0.8478
## FX_Pont_cred_584_652 0.059718 0.120014 0.498 0.6188
## FX_Pont_cred_652_718 -0.115081 0.122112 -0.942 0.3460
## FX_posse_ate3 0.206347 0.111326 1.854 0.0638 .
## FX_posse_3_7 0.034243 0.107256 0.319 0.7495
## FX_saldo_0_118000 0.115646 0.118211 0.978 0.3279
## FX_saldo_118000.mais 0.078147 0.115616 0.676 0.4991
## FX_sal_est_ate.67100 0.086286 0.104201 0.828 0.4076
## FX_sal_est_67100_133000 -0.078504 0.102866 -0.763 0.4454
## FX_num_prod_ate.1 0.882278 0.089428 9.866 < 2e-16 ***
## País_Alemanha 0.821953 0.126635 6.491 8.54e-11 ***
## País_França -0.008784 0.106828 -0.082 0.9345
## Gênero_Masculino -0.486430 0.084925 -5.728 1.02e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 4236.5 on 3055 degrees of freedom
## Residual deviance: 3330.1 on 3037 degrees of freedom
## AIC: 3368.1
##
## Number of Fisher Scoring iterations: 4
Aplicando o método do Stepwise
## Start: AIC=3368.06
## alvo ~ Tem_cart_cred + Cli_ativo + FX_idade_32_37 + FX_idade_38_44 +
## FX_idade_44mais + FX_Pont_cred_ate584 + FX_Pont_cred_584_652 +
## FX_Pont_cred_652_718 + FX_posse_ate3 + FX_posse_3_7 + FX_saldo_0_118000 +
## FX_saldo_118000.mais + FX_sal_est_ate.67100 + FX_sal_est_67100_133000 +
## FX_num_prod_ate.1 + País_Alemanha + País_França + Gênero_Masculino
##
## Df Deviance AIC
## - País_França 1 3330.1 3366.1
## - FX_Pont_cred_ate584 1 3330.1 3366.1
## - Tem_cart_cred 1 3330.1 3366.1
## - FX_posse_3_7 1 3330.2 3366.2
## - FX_Pont_cred_584_652 1 3330.3 3366.3
## - FX_saldo_118000.mais 1 3330.5 3366.5
## - FX_sal_est_67100_133000 1 3330.6 3366.6
## - FX_sal_est_ate.67100 1 3330.7 3366.7
## - FX_Pont_cred_652_718 1 3331.0 3367.0
## - FX_saldo_0_118000 1 3331.0 3367.0
## <none> 3330.1 3368.1
## - FX_posse_ate3 1 3333.5 3369.5
## - FX_idade_32_37 1 3337.0 3373.0
## - Gênero_Masculino 1 3363.1 3399.1
## - País_Alemanha 1 3372.7 3408.7
## - FX_idade_38_44 1 3424.2 3460.2
## - Cli_ativo 1 3428.4 3464.4
## - FX_num_prod_ate.1 1 3429.7 3465.7
## - FX_idade_44mais 1 3711.9 3747.9
##
## Step: AIC=3366.07
## alvo ~ Tem_cart_cred + Cli_ativo + FX_idade_32_37 + FX_idade_38_44 +
## FX_idade_44mais + FX_Pont_cred_ate584 + FX_Pont_cred_584_652 +
## FX_Pont_cred_652_718 + FX_posse_ate3 + FX_posse_3_7 + FX_saldo_0_118000 +
## FX_saldo_118000.mais + FX_sal_est_ate.67100 + FX_sal_est_67100_133000 +
## FX_num_prod_ate.1 + País_Alemanha + Gênero_Masculino
##
## Df Deviance AIC
## - FX_Pont_cred_ate584 1 3330.1 3364.1
## - Tem_cart_cred 1 3330.1 3364.1
## - FX_posse_3_7 1 3330.2 3364.2
## - FX_Pont_cred_584_652 1 3330.3 3364.3
## - FX_saldo_118000.mais 1 3330.5 3364.5
## - FX_sal_est_67100_133000 1 3330.7 3364.7
## - FX_sal_est_ate.67100 1 3330.8 3364.8
## - FX_Pont_cred_652_718 1 3331.0 3365.0
## - FX_saldo_0_118000 1 3331.0 3365.0
## <none> 3330.1 3366.1
## - FX_posse_ate3 1 3333.5 3367.5
## - FX_idade_32_37 1 3337.0 3371.0
## - Gênero_Masculino 1 3363.1 3397.1
## - País_Alemanha 1 3394.3 3428.3
## - FX_idade_38_44 1 3424.2 3458.2
## - Cli_ativo 1 3428.6 3462.6
## - FX_num_prod_ate.1 1 3429.7 3463.7
## - FX_idade_44mais 1 3711.9 3745.9
##
## Step: AIC=3364.11
## alvo ~ Tem_cart_cred + Cli_ativo + FX_idade_32_37 + FX_idade_38_44 +
## FX_idade_44mais + FX_Pont_cred_584_652 + FX_Pont_cred_652_718 +
## FX_posse_ate3 + FX_posse_3_7 + FX_saldo_0_118000 + FX_saldo_118000.mais +
## FX_sal_est_ate.67100 + FX_sal_est_67100_133000 + FX_num_prod_ate.1 +
## País_Alemanha + Gênero_Masculino
##
## Df Deviance AIC
## - Tem_cart_cred 1 3330.2 3362.2
## - FX_posse_3_7 1 3330.2 3362.2
## - FX_saldo_118000.mais 1 3330.6 3362.6
## - FX_Pont_cred_584_652 1 3330.6 3362.6
## - FX_sal_est_67100_133000 1 3330.7 3362.7
## - FX_sal_est_ate.67100 1 3330.8 3362.8
## - FX_saldo_0_118000 1 3331.1 3363.1
## - FX_Pont_cred_652_718 1 3331.1 3363.1
## <none> 3330.1 3364.1
## - FX_posse_ate3 1 3333.5 3365.5
## - FX_idade_32_37 1 3337.0 3369.0
## - Gênero_Masculino 1 3363.2 3395.2
## - País_Alemanha 1 3394.5 3426.5
## - FX_idade_38_44 1 3424.3 3456.3
## - Cli_ativo 1 3428.6 3460.6
## - FX_num_prod_ate.1 1 3429.7 3461.7
## - FX_idade_44mais 1 3712.0 3744.0
##
## Step: AIC=3362.17
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais +
## FX_Pont_cred_584_652 + FX_Pont_cred_652_718 + FX_posse_ate3 +
## FX_posse_3_7 + FX_saldo_0_118000 + FX_saldo_118000.mais +
## FX_sal_est_ate.67100 + FX_sal_est_67100_133000 + FX_num_prod_ate.1 +
## País_Alemanha + Gênero_Masculino
##
## Df Deviance AIC
## - FX_posse_3_7 1 3330.3 3360.3
## - FX_saldo_118000.mais 1 3330.6 3360.6
## - FX_Pont_cred_584_652 1 3330.6 3360.6
## - FX_sal_est_67100_133000 1 3330.8 3360.8
## - FX_sal_est_ate.67100 1 3330.9 3360.9
## - FX_Pont_cred_652_718 1 3331.1 3361.1
## - FX_saldo_0_118000 1 3331.1 3361.1
## <none> 3330.2 3362.2
## - FX_posse_ate3 1 3333.6 3363.6
## - FX_idade_32_37 1 3337.1 3367.1
## - Gênero_Masculino 1 3363.3 3393.3
## - País_Alemanha 1 3394.5 3424.5
## - FX_idade_38_44 1 3424.3 3454.3
## - Cli_ativo 1 3428.6 3458.6
## - FX_num_prod_ate.1 1 3429.9 3459.9
## - FX_idade_44mais 1 3712.2 3742.2
##
## Step: AIC=3360.27
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais +
## FX_Pont_cred_584_652 + FX_Pont_cred_652_718 + FX_posse_ate3 +
## FX_saldo_0_118000 + FX_saldo_118000.mais + FX_sal_est_ate.67100 +
## FX_sal_est_67100_133000 + FX_num_prod_ate.1 + País_Alemanha +
## Gênero_Masculino
##
## Df Deviance AIC
## - FX_saldo_118000.mais 1 3330.7 3358.7
## - FX_Pont_cred_584_652 1 3330.7 3358.7
## - FX_sal_est_67100_133000 1 3330.9 3358.9
## - FX_sal_est_ate.67100 1 3331.0 3359.0
## - FX_Pont_cred_652_718 1 3331.2 3359.2
## - FX_saldo_0_118000 1 3331.3 3359.3
## <none> 3330.3 3360.3
## - FX_posse_ate3 1 3334.6 3362.6
## - FX_idade_32_37 1 3337.2 3365.2
## - Gênero_Masculino 1 3363.4 3391.4
## - País_Alemanha 1 3394.5 3422.5
## - FX_idade_38_44 1 3424.4 3452.4
## - Cli_ativo 1 3428.6 3456.6
## - FX_num_prod_ate.1 1 3430.2 3458.2
## - FX_idade_44mais 1 3712.3 3740.3
##
## Step: AIC=3358.74
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais +
## FX_Pont_cred_584_652 + FX_Pont_cred_652_718 + FX_posse_ate3 +
## FX_saldo_0_118000 + FX_sal_est_ate.67100 + FX_sal_est_67100_133000 +
## FX_num_prod_ate.1 + País_Alemanha + Gênero_Masculino
##
## Df Deviance AIC
## - FX_Pont_cred_584_652 1 3331.2 3357.2
## - FX_saldo_0_118000 1 3331.3 3357.3
## - FX_sal_est_67100_133000 1 3331.4 3357.4
## - FX_sal_est_ate.67100 1 3331.4 3357.4
## - FX_Pont_cred_652_718 1 3331.7 3357.7
## <none> 3330.7 3358.7
## - FX_posse_ate3 1 3335.1 3361.1
## - FX_idade_32_37 1 3337.5 3363.5
## - Gênero_Masculino 1 3363.8 3389.8
## - País_Alemanha 1 3413.2 3439.2
## - FX_idade_38_44 1 3424.8 3450.8
## - Cli_ativo 1 3428.9 3454.9
## - FX_num_prod_ate.1 1 3441.8 3467.8
## - FX_idade_44mais 1 3712.7 3738.7
##
## Step: AIC=3357.21
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais +
## FX_Pont_cred_652_718 + FX_posse_ate3 + FX_saldo_0_118000 +
## FX_sal_est_ate.67100 + FX_sal_est_67100_133000 + FX_num_prod_ate.1 +
## País_Alemanha + Gênero_Masculino
##
## Df Deviance AIC
## - FX_saldo_0_118000 1 3331.7 3355.7
## - FX_sal_est_67100_133000 1 3331.9 3355.9
## - FX_sal_est_ate.67100 1 3331.9 3355.9
## - FX_Pont_cred_652_718 1 3332.8 3356.8
## <none> 3331.2 3357.2
## - FX_posse_ate3 1 3335.5 3359.5
## - FX_idade_32_37 1 3338.0 3362.0
## - Gênero_Masculino 1 3364.5 3388.5
## - País_Alemanha 1 3413.4 3437.4
## - FX_idade_38_44 1 3425.1 3449.1
## - Cli_ativo 1 3429.2 3453.2
## - FX_num_prod_ate.1 1 3441.8 3465.8
## - FX_idade_44mais 1 3713.2 3737.2
##
## Step: AIC=3355.72
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais +
## FX_Pont_cred_652_718 + FX_posse_ate3 + FX_sal_est_ate.67100 +
## FX_sal_est_67100_133000 + FX_num_prod_ate.1 + País_Alemanha +
## Gênero_Masculino
##
## Df Deviance AIC
## - FX_sal_est_67100_133000 1 3332.3 3354.3
## - FX_sal_est_ate.67100 1 3332.3 3354.3
## - FX_Pont_cred_652_718 1 3333.3 3355.3
## <none> 3331.7 3355.7
## - FX_posse_ate3 1 3336.1 3358.1
## - FX_idade_32_37 1 3338.6 3360.6
## - Gênero_Masculino 1 3365.2 3387.2
## - País_Alemanha 1 3420.6 3442.6
## - FX_idade_38_44 1 3425.6 3447.6
## - Cli_ativo 1 3429.5 3451.5
## - FX_num_prod_ate.1 1 3444.3 3466.3
## - FX_idade_44mais 1 3713.8 3735.8
##
## Step: AIC=3354.33
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais +
## FX_Pont_cred_652_718 + FX_posse_ate3 + FX_sal_est_ate.67100 +
## FX_num_prod_ate.1 + País_Alemanha + Gênero_Masculino
##
## Df Deviance AIC
## - FX_Pont_cred_652_718 1 3333.9 3353.9
## - FX_sal_est_ate.67100 1 3334.2 3354.2
## <none> 3332.3 3354.3
## - FX_posse_ate3 1 3336.7 3356.7
## - FX_idade_32_37 1 3339.2 3359.2
## - Gênero_Masculino 1 3365.9 3385.9
## - País_Alemanha 1 3421.5 3441.5
## - FX_idade_38_44 1 3426.3 3446.3
## - Cli_ativo 1 3430.4 3450.4
## - FX_num_prod_ate.1 1 3444.6 3464.6
## - FX_idade_44mais 1 3714.5 3734.5
##
## Step: AIC=3353.94
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais +
## FX_posse_ate3 + FX_sal_est_ate.67100 + FX_num_prod_ate.1 +
## País_Alemanha + Gênero_Masculino
##
## Df Deviance AIC
## - FX_sal_est_ate.67100 1 3335.8 3353.8
## <none> 3333.9 3353.9
## - FX_posse_ate3 1 3338.2 3356.2
## - FX_idade_32_37 1 3340.9 3358.9
## - Gênero_Masculino 1 3367.4 3385.4
## - País_Alemanha 1 3423.6 3441.6
## - FX_idade_38_44 1 3427.6 3445.6
## - Cli_ativo 1 3432.1 3450.1
## - FX_num_prod_ate.1 1 3446.5 3464.5
## - FX_idade_44mais 1 3717.4 3735.4
##
## Step: AIC=3353.81
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais +
## FX_posse_ate3 + FX_num_prod_ate.1 + País_Alemanha + Gênero_Masculino
##
## Df Deviance AIC
## <none> 3335.8 3353.8
## - FX_posse_ate3 1 3340.2 3356.2
## - FX_idade_32_37 1 3342.8 3358.8
## - Gênero_Masculino 1 3369.0 3385.0
## - País_Alemanha 1 3425.8 3441.8
## - FX_idade_38_44 1 3429.5 3445.5
## - Cli_ativo 1 3434.4 3450.4
## - FX_num_prod_ate.1 1 3448.5 3464.5
## - FX_idade_44mais 1 3719.5 3735.5
Modelo do Stepwise
##
## Call:
## glm(formula = a$formula, family = binomial(link = "logit"), data = training_set)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.42169 -0.88740 -0.01782 0.88722 2.33830
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.34204 0.12957 -10.358 < 2e-16 ***
## Cli_ativo -0.83825 0.08557 -9.796 < 2e-16 ***
## FX_idade_32_37 0.35637 0.13506 2.639 0.00832 **
## FX_idade_38_44 1.17121 0.12427 9.425 < 2e-16 ***
## FX_idade_44mais 2.25944 0.12414 18.200 < 2e-16 ***
## FX_posse_ate3 0.18767 0.08922 2.103 0.03544 *
## FX_num_prod_ate.1 0.90006 0.08593 10.474 < 2e-16 ***
## País_Alemanha 0.87241 0.09337 9.343 < 2e-16 ***
## Gênero_Masculino -0.48636 0.08472 -5.741 9.43e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 4236.5 on 3055 degrees of freedom
## Residual deviance: 3335.8 on 3047 degrees of freedom
## AIC: 3353.8
##
## Number of Fisher Scoring iterations: 4
Matriz de Confusão
## Confusion Matrix and Statistics
##
##
## pred_log_test 0 1
## 0 371 147
## 1 138 362
##
## Accuracy : 0.72
## 95% CI : (0.6914, 0.7474)
## No Information Rate : 0.5
## P-Value [Acc > NIR] : <2e-16
##
## Kappa : 0.4401
##
## Mcnemar's Test P-Value : 0.6356
##
## Sensitivity : 0.7289
## Specificity : 0.7112
## Pos Pred Value : 0.7162
## Neg Pred Value : 0.7240
## Prevalence : 0.5000
## Detection Rate : 0.3644
## Detection Prevalence : 0.5088
## Balanced Accuracy : 0.7200
##
## 'Positive' Class : 0
##
Gráfico das probabilidades
Curva ROC
| 4 | Area under curve: 0.8023 |