Analisis de supervivencia Aplicado a Bancos

Herrera Paniagua Lizbeth Guadalupe

2018-10-09

Conociendo al Cliente

Primero que nada,¿ Qué hace un banco?

Los bancos hacen muchas cosas, pero su función principal es captar fondos -depósitos- de gente con dinero, aglomerarlos y prestarlos a quienes los necesitan. Un banco es un intermediario entre los depositantes (quienes le prestan dinero) y los prestatarios (a quienes les presta dinero).Al ser un intermediario, necesita satisfacer la oferta y demanda de los diferentes productos servicios que ofrecen a través de nuevos proyectos y políticas para mantener un balance y así seguir cumpliendo con su objetivo principal. Es por ello que se ven en la necesidad de conocer mejor las características y la forma en que sus clientes interactuan con la institución. Es fundamental analizar la estancia de sus clientes dentro de la cartera, ya que de esta forma se pueden planear estrategias operativas y de mercado que logren mantener y aumentar su cartera.

Ahora bien, para este trabajo se eligió al Banco INGRESE EL NOMBRE DE SU BANCO FAVORITO AQUÍ, del cual se obtuvo una pequeña base de datos la cual consta de 10,000 registros, cada uno inttegrado de un total de 14 variables. Presentadas a continuación:

## [1] "C:/Users/bec-rene3/Documents/Lizbeth/Trabajos/R"
x
RowNumber
CustomerId
Surname
CreditScore
Geography
Gender
Age
Tenure
Balance
NumOfProducts
HasCrCard
IsActiveMember
EstimatedSalary
Exited

Ahora bien, dentro de cada una de las variables encontramos información que será de utilidad para nuestro análisis. ## Análisis Exploratorio El Primer paso para realizar de forma correcta nuestro análisis de supervivencia es concocer cada una de las variables, para ello realizaremos un análisis exploratorio.

Pues bien, ¡comencemos!

##    RowNumber       CustomerId           Surname      CreditScore   
##  Min.   :    1   Min.   :15565701   Smith   :  32   Min.   :350.0  
##  1st Qu.: 2501   1st Qu.:15628528   Martin  :  29   1st Qu.:584.0  
##  Median : 5000   Median :15690738   Scott   :  29   Median :652.0  
##  Mean   : 5000   Mean   :15690941   Walker  :  28   Mean   :650.5  
##  3rd Qu.: 7500   3rd Qu.:15753234   Brown   :  26   3rd Qu.:718.0  
##  Max.   :10000   Max.   :15815690   Genovese:  25   Max.   :850.0  
##                                     (Other) :9831                  
##    Geography       Gender          Age            Tenure      
##  France :5014   Female:4543   Min.   :18.00   Min.   : 0.000  
##  Germany:2509   Male  :5457   1st Qu.:32.00   1st Qu.: 3.000  
##  Spain  :2477                 Median :37.00   Median : 5.000  
##                               Mean   :38.92   Mean   : 5.013  
##                               3rd Qu.:44.00   3rd Qu.: 7.000  
##                               Max.   :92.00   Max.   :10.000  
##                                                               
##     Balance       NumOfProducts    HasCrCard      IsActiveMember  
##  Min.   :     0   Min.   :1.00   Min.   :0.0000   Min.   :0.0000  
##  1st Qu.:     0   1st Qu.:1.00   1st Qu.:0.0000   1st Qu.:0.0000  
##  Median : 97199   Median :1.00   Median :1.0000   Median :1.0000  
##  Mean   : 76486   Mean   :1.53   Mean   :0.7055   Mean   :0.5151  
##  3rd Qu.:127644   3rd Qu.:2.00   3rd Qu.:1.0000   3rd Qu.:1.0000  
##  Max.   :250898   Max.   :4.00   Max.   :1.0000   Max.   :1.0000  
##                                                                   
##  EstimatedSalary         Exited      
##  Min.   :    11.58   Min.   :0.0000  
##  1st Qu.: 51002.11   1st Qu.:0.0000  
##  Median :100193.91   Median :0.0000  
##  Mean   :100090.24   Mean   :0.2037  
##  3rd Qu.:149388.25   3rd Qu.:0.0000  
##  Max.   :199992.48   Max.   :1.0000  
## 

Como podemos Observar, de las 14 variables en total, podemos darnos el pequeño lujo de desacrtar 3, RowNumber CustomerId y Surname, debido a que dichas variables son sólo de identificación de algún usuario de forma particular, lo que para este caso es intrascendente.

Después de descartar cosas, procedemos a realizar el análisis individual de cada una de las variables restantes.

Análisis Individual

Iniciemos con las variables Cuantitativas

La primera será Credit Score, que, como su nombre lo indica, muestra el total de puntos acumulados por parte del cliente.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   350.0   584.0   652.0   650.5   718.0   850.0

Como podemos observar temos puntuaciones que van desde 350 hasta un máximo de 850 puntos. Sin embargo la mayoría de los clientes ronda entre 600 y 700 puntos, a decir verdad se cuenta con una puntuación alta en promedio. (Si supiera porque les dan los puntos diría algo más jejeje XD )

Ahora revisemos la edad de nuestros clientes

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   18.00   32.00   37.00   38.92   44.00   92.00

Notemos que la edad mínima dentro de la cartera es 18 años, eso hace notar que aún no se cuentan con productos para menores de edad, además de que la edad máxima es 92 años, aunque la mayoría de los individuos de nuestra cartera tienen edades entre los 32 a 44 años, lo que indica una población económicamente activa y con mayores ingresos económicos. Esto puede ser bueno, debido a que al ofrecer productos de crédito se esperaría que este tipo de clientes permaneciera má tiempo dentro de la cartera pues tienen mayor estabilidad y solvencia económica.


#NOTA: ##Así de bote pronto, voy a poner todo el análisis descriptivo sin cometarios, por ahora, pero conforme vaya avanzando el proyecto iré actualizando y mejorando el análisis.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##       0       0   97199   76486  127644  250898

##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
##     11.58  51002.11 100193.91 100090.24 149388.25 199992.48

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   3.000   5.000   5.013   7.000  10.000

## vari2
##    0    1    2    3    4    5    6    7    8    9   10 
##  413 1035 1048 1009  989 1012  967 1028 1025  984  490

## vari2
##    1    2    3    4 
## 5084 4590  266   60

## vari2
##    0    1 
## 2945 7055

## vari2
##    0    1 
## 4849 5151

## vari2
## Female   Male 
##   4543   5457

## vari2
##  France Germany   Spain 
##    5014    2509    2477
##      segmn
## vari3 Female Male
##    0     204  209
##    1     478  557
##    2     480  568
##    3     469  540
##    4     442  547
##    5     448  564
##    6     458  509
##    7     464  564
##    8     433  592
##    9     422  562
##    10    245  245

##      segmn
## vari3 France Germany Spain
##    0     205     105   103
##    1     529     264   242
##    2     525     275   248
##    3     491     261   257
##    4     512     232   245
##    5     485     259   268
##    6     503     227   237
##    7     552     225   251
##    8     465     264   296
##    9     504     269   211
##    10    243     128   119

##      segmn
## vari3   0   1
##    0  194 219
##    1  466 569
##    2  488 560
##    3  485 524
##    4  489 500
##    5  506 506
##    6  468 499
##    7  493 535
##    8  506 519
##    9  513 471
##    10 241 249

##      segmn
## vari3   1   2   3   4
##    0  236 171   6   0
##    1  568 431  32   4
##    2  473 543  21  11
##    3  529 430  42   8
##    4  504 462  20   3
##    5  501 468  36   7
##    6  490 456  17   4
##    7  517 482  24   5
##    8  525 468  28   4
##    9  500 451  23  10
##    10 241 228  17   4

##      segmn
## vari3   0   1
##    0  145 268
##    1  334 701
##    2  310 738
##    3  279 730
##    4  280 709
##    5  312 700
##    6  273 694
##    7  302 726
##    8  283 742
##    9  292 692
##    10 135 355

Continuará…


Y recuerden amiguitos: “La pereza no es más que el hábito de descansar antes de que te canses.” Jules Renard Y pues yo me voy a descansar jajaja

Nos vemos en un futuro no muy lejano.