Descrição

     Os dados são referentes a informações de clientes de um banco com a variável alvo sendo binária e refletindo a permanência ou não do cliente no banco, ou seja, se o mesmo encerrou ou não a sua conta bancária.

     Dentre as variáveis nós temos:

Descrição das variáveis.
Variável Descrição
Id_Cliente IDs unicos para a identificação dos clientes
Sobrenome Ultimo nome do cliente
Pont_Credito Pontuação de crédito do cliente
País O país de onde o cliente pertence
Gênero Gênero do cliente
Idade A idade do cliente
Posse Número de anos que o cliente esteve no banco
Saldo Saldo bancário do cliente
Num_Produto Número de produtos bancários utilizado pelo cliente
Tem_cart_cred Se o cliente possui um cartão de crédito com o banco ou não
Cli_ativo Se o cliente é um membro ativo no banco ou não
Salario_est Salário estimado do cliente em dólares
Encerrou Se o cliente encerrou ou não a sua conta

Análise descritiva

Estatísticas descritivas

Tabela

Avaliando correlação e dependência

Matriz de correlação para as variáveis quantitativas utilizando o método de spearman

Teste Qui-Quadrado de Independência

  • \(H_0\): São independentes/Não associadas
  • \(H_1\): Não são independentes/São associadas
 Gênero 
 Feminino   Masculino 
 País 
   Alemanha  1193 1316
   Espanha  1089 1388
   França  2261 2753
   #Total cases  4543 5457
## 
##  Pearson's Chi-squared test
## 
## data:  table(X$País, X$Gênero)
## X-squared = 6.9182, df = 2, p-value = 0.03146

Gráficos

País

Quantidade

País x Encerrou

     Onde:

  • prop_SIM.1: Proporção dentro dos países;
  • prop_SIM.2: Proporção entre os países;

Pontuação de crédito

Saldo bancário

Densidade

Número de produtos consumidos

Quantidade

Produtos consumidos x Encerrou

## `summarise()` has grouped output by 'Num_Produto'. You can override using the
## `.groups` argument.
## `summarise()` has grouped output by 'Num_Produto'. You can override using the
## `.groups` argument.
## `mutate_all()` ignored the following grouping variables:

Clientes Ativos

Clientes Ativos x país

Clientes Ativos x Encerrou

Tem cartão de crédito

Quantidade

Tem cartão de crédito x Encerrou a conta

Posse

Quantidade

Anos como cliente x Encerrou a conta

Salário estimado

Densidade

Ajustes para aplicação

Ajustes

Para Idade

Categoria Sim Não RR
ate32 2.13% 25.77% 0.0827
32_37 2.49% 20.48% 0.1216
38_44 5.31% 20.42% 0.2600
44mais 10.44% 12.96% 0.8056

Para pontuação de Crédito

Categoria Sim Não RR
ate584 5.56% 19.78% 0.2811
584_652 5.26% 19.75% 0.2663
652_718 4.55% 20.47% 0.2223
718mais 5% 19.63% 0.2547

Para posse

Categoria Sim Não RR
ate3 7.41% 27.64% 0.2681
3_7 7.85% 32.11% 0.2445
7mais 5.11% 19.88% 0.2570

Para Saldo

Categoria Sim Não RR
ate 0 5% 31.17% 0.1604
0_118000 7.18% 23.21% 0.3093
118000 mais 8.19% 25.25% 0.3244

Para Salário estimado

Categoria Sim Não RR
ate 67100 6.71% 26.63% 0.2520
67100_133000 6.6% 26.83% 0.2460
133000 mais 7.06% 26.17% 0.2698

Para Número de produtos

Categoria Sim Não RR
ate 1 14.09% 36.75% 0.3834
1 mais 6.28% 42.88% 0.1465

Visualização parcial do dados transformados em dummys

alvo Tem_cart_cred Cli_ativo FX_idade_ate32 FX_idade_32_37 FX_idade_38_44 FX_idade_44mais FX_Pont_cred_ate584 FX_Pont_cred_584_652 FX_Pont_cred_652_718 FX_Pont_cred_718mais FX_posse_ate3 FX_posse_3_7 FX_posse_7mais FX_saldo_ate.0 FX_saldo_0_118000 FX_saldo_118000.mais FX_sal_est_ate.67100 FX_sal_est_67100_133000 FX_sal_est_133000.mais FX_num_prod_ate.1 FX_num_prod_1.mais País_Alemanha País_Espanha País_França Gênero_Feminino Gênero_Masculino
1 1 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 0 1 0 1 0 0 0 1 1 0
0 0 1 0 0 1 0 0 1 0 0 1 0 0 0 1 0 0 1 0 1 0 0 1 0 1 0
1 1 0 0 0 1 0 1 0 0 0 0 0 1 0 0 1 0 1 0 0 1 0 0 1 1 0
0 0 0 0 0 1 0 0 0 1 0 1 0 0 1 0 0 0 1 0 0 1 0 0 1 1 0
0 1 1 0 0 1 0 0 0 0 1 1 0 0 0 0 1 0 1 0 1 0 0 1 0 1 0
1 1 0 0 0 1 0 0 1 0 0 0 0 1 0 1 0 0 0 1 0 1 0 1 0 0 1

Verificando a Proporção da varipavel alvo

## 
##      0      1 
## 0.7963 0.2037

Banco de dados Balanceado

## 
##   0   1 
## 0.5 0.5
alvo Tem_cart_cred Cli_ativo FX_idade_32_37 FX_idade_38_44 FX_idade_44mais FX_Pont_cred_ate584 FX_Pont_cred_584_652 FX_Pont_cred_652_718 FX_posse_ate3 FX_posse_3_7 FX_saldo_0_118000 FX_saldo_118000.mais FX_sal_est_ate.67100 FX_sal_est_67100_133000 FX_num_prod_ate.1 País_Alemanha País_França Gênero_Masculino
1 1 1 0 1 0 0 1 0 1 0 0 0 0 1 1 0 1 0
1 1 0 0 1 0 1 0 0 0 0 0 1 0 1 0 0 1 0
1 1 0 0 1 0 0 1 0 0 0 1 0 0 0 0 0 0 1
1 1 0 0 0 0 1 0 0 0 1 1 0 0 1 0 1 0 0
1 1 0 0 0 1 0 0 1 1 0 0 1 1 0 1 1 0 1
1 1 0 0 1 0 1 0 0 0 1 0 0 0 1 1 0 0 0

Separação treino x teste

     A separação será realizada por:

split = sample.split(Base_balanceada$alvo, SplitRatio = 0.75)

training_set = subset(Base_balanceada, split == TRUE)
test_set = subset(Base_balanceada, split == FALSE)

Base treino

alvo Tem_cart_cred Cli_ativo FX_idade_32_37 FX_idade_38_44 FX_idade_44mais FX_Pont_cred_ate584 FX_Pont_cred_584_652 FX_Pont_cred_652_718 FX_posse_ate3 FX_posse_3_7 FX_saldo_0_118000 FX_saldo_118000.mais FX_sal_est_ate.67100 FX_sal_est_67100_133000 FX_num_prod_ate.1 País_Alemanha País_França Gênero_Masculino
3 1 1 0 0 1 0 0 1 0 0 0 1 0 0 0 0 0 0 1
5 1 1 0 0 0 1 0 0 1 1 0 0 1 1 0 1 1 0 1
6 1 1 0 0 1 0 1 0 0 0 1 0 0 0 1 1 0 0 0
8 1 1 0 0 0 1 1 0 0 1 0 0 1 1 0 1 0 1 0
9 1 0 0 0 0 1 1 0 0 0 0 0 1 0 0 1 0 1 0
10 1 0 0 0 0 1 0 0 0 1 0 0 1 0 0 1 0 1 0

Base teste

alvo Tem_cart_cred Cli_ativo FX_idade_32_37 FX_idade_38_44 FX_idade_44mais FX_Pont_cred_ate584 FX_Pont_cred_584_652 FX_Pont_cred_652_718 FX_posse_ate3 FX_posse_3_7 FX_saldo_0_118000 FX_saldo_118000.mais FX_sal_est_ate.67100 FX_sal_est_67100_133000 FX_num_prod_ate.1 País_Alemanha País_França Gênero_Masculino
1 1 1 1 0 1 0 0 1 0 1 0 0 0 0 1 1 0 1 0
2 1 1 0 0 1 0 1 0 0 0 0 0 1 0 1 0 0 1 0
4 1 1 0 0 0 0 1 0 0 0 1 1 0 0 1 0 1 0 0
7 1 1 0 0 1 0 0 1 0 1 0 0 0 0 0 0 0 0 0
12 1 1 1 0 1 0 0 1 0 0 0 0 1 0 1 1 1 0 0
18 1 1 0 0 0 0 0 0 0 1 0 0 1 0 1 1 0 0 1

Modelo de Regressão Logística

Modelo

Ajuste Inicial

## 
## Call:
## glm(formula = alvo ~ ., family = binomial(link = "logit"), data = training_set)
## 
## Deviance Residuals: 
##      Min        1Q    Median        3Q       Max  
## -2.41372  -0.88835  -0.01187   0.87491   2.37834  
## 
## Coefficients:
##                          Estimate Std. Error z value Pr(>|z|)    
## (Intercept)             -1.365289   0.204582  -6.674 2.50e-11 ***
## Tem_cart_cred           -0.022894   0.092912  -0.246   0.8054    
## Cli_ativo               -0.839647   0.085824  -9.783  < 2e-16 ***
## FX_idade_32_37           0.354440   0.135301   2.620   0.0088 ** 
## FX_idade_38_44           1.175857   0.124450   9.448  < 2e-16 ***
## FX_idade_44mais          2.256627   0.124248  18.162  < 2e-16 ***
## FX_Pont_cred_ate584     -0.022881   0.119198  -0.192   0.8478    
## FX_Pont_cred_584_652     0.059718   0.120014   0.498   0.6188    
## FX_Pont_cred_652_718    -0.115081   0.122112  -0.942   0.3460    
## FX_posse_ate3            0.206347   0.111326   1.854   0.0638 .  
## FX_posse_3_7             0.034243   0.107256   0.319   0.7495    
## FX_saldo_0_118000        0.115646   0.118211   0.978   0.3279    
## FX_saldo_118000.mais     0.078147   0.115616   0.676   0.4991    
## FX_sal_est_ate.67100     0.086286   0.104201   0.828   0.4076    
## FX_sal_est_67100_133000 -0.078504   0.102866  -0.763   0.4454    
## FX_num_prod_ate.1        0.882278   0.089428   9.866  < 2e-16 ***
## País_Alemanha            0.821953   0.126635   6.491 8.54e-11 ***
## País_França             -0.008784   0.106828  -0.082   0.9345    
## Gênero_Masculino        -0.486430   0.084925  -5.728 1.02e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 4236.5  on 3055  degrees of freedom
## Residual deviance: 3330.1  on 3037  degrees of freedom
## AIC: 3368.1
## 
## Number of Fisher Scoring iterations: 4

Aplicando o método do Stepwise

## Start:  AIC=3368.06
## alvo ~ Tem_cart_cred + Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + 
##     FX_idade_44mais + FX_Pont_cred_ate584 + FX_Pont_cred_584_652 + 
##     FX_Pont_cred_652_718 + FX_posse_ate3 + FX_posse_3_7 + FX_saldo_0_118000 + 
##     FX_saldo_118000.mais + FX_sal_est_ate.67100 + FX_sal_est_67100_133000 + 
##     FX_num_prod_ate.1 + País_Alemanha + País_França + Gênero_Masculino
## 
##                           Df Deviance    AIC
## - País_França              1   3330.1 3366.1
## - FX_Pont_cred_ate584      1   3330.1 3366.1
## - Tem_cart_cred            1   3330.1 3366.1
## - FX_posse_3_7             1   3330.2 3366.2
## - FX_Pont_cred_584_652     1   3330.3 3366.3
## - FX_saldo_118000.mais     1   3330.5 3366.5
## - FX_sal_est_67100_133000  1   3330.6 3366.6
## - FX_sal_est_ate.67100     1   3330.7 3366.7
## - FX_Pont_cred_652_718     1   3331.0 3367.0
## - FX_saldo_0_118000        1   3331.0 3367.0
## <none>                         3330.1 3368.1
## - FX_posse_ate3            1   3333.5 3369.5
## - FX_idade_32_37           1   3337.0 3373.0
## - Gênero_Masculino         1   3363.1 3399.1
## - País_Alemanha            1   3372.7 3408.7
## - FX_idade_38_44           1   3424.2 3460.2
## - Cli_ativo                1   3428.4 3464.4
## - FX_num_prod_ate.1        1   3429.7 3465.7
## - FX_idade_44mais          1   3711.9 3747.9
## 
## Step:  AIC=3366.07
## alvo ~ Tem_cart_cred + Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + 
##     FX_idade_44mais + FX_Pont_cred_ate584 + FX_Pont_cred_584_652 + 
##     FX_Pont_cred_652_718 + FX_posse_ate3 + FX_posse_3_7 + FX_saldo_0_118000 + 
##     FX_saldo_118000.mais + FX_sal_est_ate.67100 + FX_sal_est_67100_133000 + 
##     FX_num_prod_ate.1 + País_Alemanha + Gênero_Masculino
## 
##                           Df Deviance    AIC
## - FX_Pont_cred_ate584      1   3330.1 3364.1
## - Tem_cart_cred            1   3330.1 3364.1
## - FX_posse_3_7             1   3330.2 3364.2
## - FX_Pont_cred_584_652     1   3330.3 3364.3
## - FX_saldo_118000.mais     1   3330.5 3364.5
## - FX_sal_est_67100_133000  1   3330.7 3364.7
## - FX_sal_est_ate.67100     1   3330.8 3364.8
## - FX_Pont_cred_652_718     1   3331.0 3365.0
## - FX_saldo_0_118000        1   3331.0 3365.0
## <none>                         3330.1 3366.1
## - FX_posse_ate3            1   3333.5 3367.5
## - FX_idade_32_37           1   3337.0 3371.0
## - Gênero_Masculino         1   3363.1 3397.1
## - País_Alemanha            1   3394.3 3428.3
## - FX_idade_38_44           1   3424.2 3458.2
## - Cli_ativo                1   3428.6 3462.6
## - FX_num_prod_ate.1        1   3429.7 3463.7
## - FX_idade_44mais          1   3711.9 3745.9
## 
## Step:  AIC=3364.11
## alvo ~ Tem_cart_cred + Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + 
##     FX_idade_44mais + FX_Pont_cred_584_652 + FX_Pont_cred_652_718 + 
##     FX_posse_ate3 + FX_posse_3_7 + FX_saldo_0_118000 + FX_saldo_118000.mais + 
##     FX_sal_est_ate.67100 + FX_sal_est_67100_133000 + FX_num_prod_ate.1 + 
##     País_Alemanha + Gênero_Masculino
## 
##                           Df Deviance    AIC
## - Tem_cart_cred            1   3330.2 3362.2
## - FX_posse_3_7             1   3330.2 3362.2
## - FX_saldo_118000.mais     1   3330.6 3362.6
## - FX_Pont_cred_584_652     1   3330.6 3362.6
## - FX_sal_est_67100_133000  1   3330.7 3362.7
## - FX_sal_est_ate.67100     1   3330.8 3362.8
## - FX_saldo_0_118000        1   3331.1 3363.1
## - FX_Pont_cred_652_718     1   3331.1 3363.1
## <none>                         3330.1 3364.1
## - FX_posse_ate3            1   3333.5 3365.5
## - FX_idade_32_37           1   3337.0 3369.0
## - Gênero_Masculino         1   3363.2 3395.2
## - País_Alemanha            1   3394.5 3426.5
## - FX_idade_38_44           1   3424.3 3456.3
## - Cli_ativo                1   3428.6 3460.6
## - FX_num_prod_ate.1        1   3429.7 3461.7
## - FX_idade_44mais          1   3712.0 3744.0
## 
## Step:  AIC=3362.17
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais + 
##     FX_Pont_cred_584_652 + FX_Pont_cred_652_718 + FX_posse_ate3 + 
##     FX_posse_3_7 + FX_saldo_0_118000 + FX_saldo_118000.mais + 
##     FX_sal_est_ate.67100 + FX_sal_est_67100_133000 + FX_num_prod_ate.1 + 
##     País_Alemanha + Gênero_Masculino
## 
##                           Df Deviance    AIC
## - FX_posse_3_7             1   3330.3 3360.3
## - FX_saldo_118000.mais     1   3330.6 3360.6
## - FX_Pont_cred_584_652     1   3330.6 3360.6
## - FX_sal_est_67100_133000  1   3330.8 3360.8
## - FX_sal_est_ate.67100     1   3330.9 3360.9
## - FX_Pont_cred_652_718     1   3331.1 3361.1
## - FX_saldo_0_118000        1   3331.1 3361.1
## <none>                         3330.2 3362.2
## - FX_posse_ate3            1   3333.6 3363.6
## - FX_idade_32_37           1   3337.1 3367.1
## - Gênero_Masculino         1   3363.3 3393.3
## - País_Alemanha            1   3394.5 3424.5
## - FX_idade_38_44           1   3424.3 3454.3
## - Cli_ativo                1   3428.6 3458.6
## - FX_num_prod_ate.1        1   3429.9 3459.9
## - FX_idade_44mais          1   3712.2 3742.2
## 
## Step:  AIC=3360.27
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais + 
##     FX_Pont_cred_584_652 + FX_Pont_cred_652_718 + FX_posse_ate3 + 
##     FX_saldo_0_118000 + FX_saldo_118000.mais + FX_sal_est_ate.67100 + 
##     FX_sal_est_67100_133000 + FX_num_prod_ate.1 + País_Alemanha + 
##     Gênero_Masculino
## 
##                           Df Deviance    AIC
## - FX_saldo_118000.mais     1   3330.7 3358.7
## - FX_Pont_cred_584_652     1   3330.7 3358.7
## - FX_sal_est_67100_133000  1   3330.9 3358.9
## - FX_sal_est_ate.67100     1   3331.0 3359.0
## - FX_Pont_cred_652_718     1   3331.2 3359.2
## - FX_saldo_0_118000        1   3331.3 3359.3
## <none>                         3330.3 3360.3
## - FX_posse_ate3            1   3334.6 3362.6
## - FX_idade_32_37           1   3337.2 3365.2
## - Gênero_Masculino         1   3363.4 3391.4
## - País_Alemanha            1   3394.5 3422.5
## - FX_idade_38_44           1   3424.4 3452.4
## - Cli_ativo                1   3428.6 3456.6
## - FX_num_prod_ate.1        1   3430.2 3458.2
## - FX_idade_44mais          1   3712.3 3740.3
## 
## Step:  AIC=3358.74
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais + 
##     FX_Pont_cred_584_652 + FX_Pont_cred_652_718 + FX_posse_ate3 + 
##     FX_saldo_0_118000 + FX_sal_est_ate.67100 + FX_sal_est_67100_133000 + 
##     FX_num_prod_ate.1 + País_Alemanha + Gênero_Masculino
## 
##                           Df Deviance    AIC
## - FX_Pont_cred_584_652     1   3331.2 3357.2
## - FX_saldo_0_118000        1   3331.3 3357.3
## - FX_sal_est_67100_133000  1   3331.4 3357.4
## - FX_sal_est_ate.67100     1   3331.4 3357.4
## - FX_Pont_cred_652_718     1   3331.7 3357.7
## <none>                         3330.7 3358.7
## - FX_posse_ate3            1   3335.1 3361.1
## - FX_idade_32_37           1   3337.5 3363.5
## - Gênero_Masculino         1   3363.8 3389.8
## - País_Alemanha            1   3413.2 3439.2
## - FX_idade_38_44           1   3424.8 3450.8
## - Cli_ativo                1   3428.9 3454.9
## - FX_num_prod_ate.1        1   3441.8 3467.8
## - FX_idade_44mais          1   3712.7 3738.7
## 
## Step:  AIC=3357.21
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais + 
##     FX_Pont_cred_652_718 + FX_posse_ate3 + FX_saldo_0_118000 + 
##     FX_sal_est_ate.67100 + FX_sal_est_67100_133000 + FX_num_prod_ate.1 + 
##     País_Alemanha + Gênero_Masculino
## 
##                           Df Deviance    AIC
## - FX_saldo_0_118000        1   3331.7 3355.7
## - FX_sal_est_67100_133000  1   3331.9 3355.9
## - FX_sal_est_ate.67100     1   3331.9 3355.9
## - FX_Pont_cred_652_718     1   3332.8 3356.8
## <none>                         3331.2 3357.2
## - FX_posse_ate3            1   3335.5 3359.5
## - FX_idade_32_37           1   3338.0 3362.0
## - Gênero_Masculino         1   3364.5 3388.5
## - País_Alemanha            1   3413.4 3437.4
## - FX_idade_38_44           1   3425.1 3449.1
## - Cli_ativo                1   3429.2 3453.2
## - FX_num_prod_ate.1        1   3441.8 3465.8
## - FX_idade_44mais          1   3713.2 3737.2
## 
## Step:  AIC=3355.72
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais + 
##     FX_Pont_cred_652_718 + FX_posse_ate3 + FX_sal_est_ate.67100 + 
##     FX_sal_est_67100_133000 + FX_num_prod_ate.1 + País_Alemanha + 
##     Gênero_Masculino
## 
##                           Df Deviance    AIC
## - FX_sal_est_67100_133000  1   3332.3 3354.3
## - FX_sal_est_ate.67100     1   3332.3 3354.3
## - FX_Pont_cred_652_718     1   3333.3 3355.3
## <none>                         3331.7 3355.7
## - FX_posse_ate3            1   3336.1 3358.1
## - FX_idade_32_37           1   3338.6 3360.6
## - Gênero_Masculino         1   3365.2 3387.2
## - País_Alemanha            1   3420.6 3442.6
## - FX_idade_38_44           1   3425.6 3447.6
## - Cli_ativo                1   3429.5 3451.5
## - FX_num_prod_ate.1        1   3444.3 3466.3
## - FX_idade_44mais          1   3713.8 3735.8
## 
## Step:  AIC=3354.33
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais + 
##     FX_Pont_cred_652_718 + FX_posse_ate3 + FX_sal_est_ate.67100 + 
##     FX_num_prod_ate.1 + País_Alemanha + Gênero_Masculino
## 
##                        Df Deviance    AIC
## - FX_Pont_cred_652_718  1   3333.9 3353.9
## - FX_sal_est_ate.67100  1   3334.2 3354.2
## <none>                      3332.3 3354.3
## - FX_posse_ate3         1   3336.7 3356.7
## - FX_idade_32_37        1   3339.2 3359.2
## - Gênero_Masculino      1   3365.9 3385.9
## - País_Alemanha         1   3421.5 3441.5
## - FX_idade_38_44        1   3426.3 3446.3
## - Cli_ativo             1   3430.4 3450.4
## - FX_num_prod_ate.1     1   3444.6 3464.6
## - FX_idade_44mais       1   3714.5 3734.5
## 
## Step:  AIC=3353.94
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais + 
##     FX_posse_ate3 + FX_sal_est_ate.67100 + FX_num_prod_ate.1 + 
##     País_Alemanha + Gênero_Masculino
## 
##                        Df Deviance    AIC
## - FX_sal_est_ate.67100  1   3335.8 3353.8
## <none>                      3333.9 3353.9
## - FX_posse_ate3         1   3338.2 3356.2
## - FX_idade_32_37        1   3340.9 3358.9
## - Gênero_Masculino      1   3367.4 3385.4
## - País_Alemanha         1   3423.6 3441.6
## - FX_idade_38_44        1   3427.6 3445.6
## - Cli_ativo             1   3432.1 3450.1
## - FX_num_prod_ate.1     1   3446.5 3464.5
## - FX_idade_44mais       1   3717.4 3735.4
## 
## Step:  AIC=3353.81
## alvo ~ Cli_ativo + FX_idade_32_37 + FX_idade_38_44 + FX_idade_44mais + 
##     FX_posse_ate3 + FX_num_prod_ate.1 + País_Alemanha + Gênero_Masculino
## 
##                     Df Deviance    AIC
## <none>                   3335.8 3353.8
## - FX_posse_ate3      1   3340.2 3356.2
## - FX_idade_32_37     1   3342.8 3358.8
## - Gênero_Masculino   1   3369.0 3385.0
## - País_Alemanha      1   3425.8 3441.8
## - FX_idade_38_44     1   3429.5 3445.5
## - Cli_ativo          1   3434.4 3450.4
## - FX_num_prod_ate.1  1   3448.5 3464.5
## - FX_idade_44mais    1   3719.5 3735.5

Modelo do Stepwise

## 
## Call:
## glm(formula = a$formula, family = binomial(link = "logit"), data = training_set)
## 
## Deviance Residuals: 
##      Min        1Q    Median        3Q       Max  
## -2.42169  -0.88740  -0.01782   0.88722   2.33830  
## 
## Coefficients:
##                   Estimate Std. Error z value Pr(>|z|)    
## (Intercept)       -1.34204    0.12957 -10.358  < 2e-16 ***
## Cli_ativo         -0.83825    0.08557  -9.796  < 2e-16 ***
## FX_idade_32_37     0.35637    0.13506   2.639  0.00832 ** 
## FX_idade_38_44     1.17121    0.12427   9.425  < 2e-16 ***
## FX_idade_44mais    2.25944    0.12414  18.200  < 2e-16 ***
## FX_posse_ate3      0.18767    0.08922   2.103  0.03544 *  
## FX_num_prod_ate.1  0.90006    0.08593  10.474  < 2e-16 ***
## País_Alemanha      0.87241    0.09337   9.343  < 2e-16 ***
## Gênero_Masculino  -0.48636    0.08472  -5.741 9.43e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 4236.5  on 3055  degrees of freedom
## Residual deviance: 3335.8  on 3047  degrees of freedom
## AIC: 3353.8
## 
## Number of Fisher Scoring iterations: 4

Métricas de avaliação

Matriz de Confusão

## Confusion Matrix and Statistics
## 
##              
## pred_log_test   0   1
##             0 371 147
##             1 138 362
##                                           
##                Accuracy : 0.72            
##                  95% CI : (0.6914, 0.7474)
##     No Information Rate : 0.5             
##     P-Value [Acc > NIR] : <2e-16          
##                                           
##                   Kappa : 0.4401          
##                                           
##  Mcnemar's Test P-Value : 0.6356          
##                                           
##             Sensitivity : 0.7289          
##             Specificity : 0.7112          
##          Pos Pred Value : 0.7162          
##          Neg Pred Value : 0.7240          
##              Prevalence : 0.5000          
##          Detection Rate : 0.3644          
##    Detection Prevalence : 0.5088          
##       Balanced Accuracy : 0.7200          
##                                           
##        'Positive' Class : 0               
## 

Gráfico das probabilidades

Curva ROC

4 Area under curve: 0.8023