Marketing de un banco

Situación

Nuestro cliente está en el área de marketing de un banco con el siguiente caso:

La publicidad de los productos del banco en cuestión tiene mucha efectividad cuando va dirigida a sus “no-clientes”. Sin embargo, cuando se hace un lanzamiento de productos enfocados a clientes la publicidad no suele ser tan efectiva.

Por tal motivo, el área de marketing le ha dado seguimiento a la última campaña con la que promovieron un nuevo producto y ha buscado la ayuda de nuestra consultoría con el fin de optimizar y mejorar sus campañas futuras.

Variables

Se observa en el esqueleto de la base de datos que posee 15 variables y 45211 observaciones

La descripción y estructura de las variables es la siguiente:

Imagen Ilustrativa

Imagen Ilustrativa

Planteamiento del problema

El banco en cuestión tiene muy buena efectividad con la publicidad de sus productos cuando ésta va dirigida hacia no-clientes. Sin embargo, cuando se hace un lanzamiento de productos enfocados a clientes, la publicidad no suele ser tan efectiva. Por tal motivo, los principales objetivos son:

  • Identificar cuales variables influyen en la efectividad.
  • Estimar la supervivencia usando Kaplan Meier para cada subgrupo considerado en las hipótesis y así determinar bajo qué condiciones se tendrá una mejor respuesta de los clientes durante y después de la campaña, de tal manera que se pretende identificar las variables que afectan la efectividad.

Para con ello poder identificar y responder lo siguente

¿Qué grupos compran más?

¿Qué condiciones debe cumplir la población para que adquieran el producto?

¿Por que medio debemos de promover las campañas?

¿Podríamos enfocarnos en un grupos en especial para vender?

¿Qué es lo que tenemos?

Vistaso rápido

Por lo que consideraremos las curvas de supervivencia de los subgrupos de aquellos que se encuentran en los rangos 18-25, 55-95.
HIPOTESIS: Las campañas no están dirigidas a público de 18-25 años de edad, los cuales cubren la mayor parte de la población.

Esta gráfica nos indica que la mayor parte de nuestra población tiene empleos en blue-collar, managment, technician.

A su vez, tenemos que la mayoría de nuestra población se ecuentra casada dejando en segundo plano a la población soltera. En la variable “Marital” tenemos 3 subgrupos: single, married, divorced. Se pueden generar curvas de supervivencia para cada uno de ellos y así determinar que tipo de campañas ofrecer.
HIPÓTESIS: Las campañas no están dirigidas, en su mayoría, a personas casadas, las cuales representan la mayor parte de los clientes.

Respecto a la edudación, sobresalen los clientes con educación secundaria y superior.

Notamos que en un amplio porcentaje la gente está catalogada como puntuales y solo aproximadamente el 1.7% esta catalogada como clientes morosos. Ésto significa que la gran parte de la cartera de clientes que posee el banco cumple con sus obligaciones con la institución.

Respecto a los préstamos hipotecarios la población se encuentra dividida practicamente en un 50%. Se observa una variación muy pequeña entre los clientes que tienen crédito hipotecario y los que no. Se realizarán curvas de supervivencia en subgrupos para aquellos que tienen crédito hipotecario y los que no.
Hipótesis: Debido a que se observa una variación muy pequeña entre los clientes que tienen crédito hipotecario y los que no, estas categorias no influyen en el rendimiento de los clientes en la campaña\

Aquí notamos una tendencia distinta contra los clientes que tienen un crédito hipotecario. En este caso los clientes que no poseen préstamos destacan considerablemente sobre la población que tiene préstamos en la cadena.

También notamos que, en la mayoría de nuestros clientes, la campaña se dio a conocer a través de su celular.

Por otro lado, tenemos que los clientes han sido expuestos desde 1 hasta 63 campañas de marketing; siendo la media por cliente de solo 2.

A su vez, notamos que las campañas tienen una duración máxima de 871 horas y la media de éstas es de 40 horas.

¿Qué se relaciona con que? (Análisis de Correlación)

El análisis de correlación nos revela que los días que han pasado desde la última campaña que se le mostró al cliente están correlacionados con la duración de las campañas, es decir, entre mayor sea la duración de la campaña más tiempo pasa desde la última campaña que se le mostró al cliente.

Otra corelación notoria es que la edad está correlacionada con el balance del cliente, esto quiere decir que entre mayor edad tenga el cliente, mayor será en balance en su cuenta.

Por otro lado notamos que, entre mayor número de campañas a las que ha sido expuesto el cliente, menor será la duración de la exposición de la campaña. Este comportamiento se presenta también con las variables campaing y campaing:duration; es decir, entre mayor sea la duración de la campaña menos serán las campañas expuestas al cliente.

Analizando todas las variables que se encuentran en la base

En estre gráfico más completo observamos que una relación totalmente inversa en las variables tipo factor dicotómicas, de estas destacaremos la de prestamo hipotecario pues es una de las variables que presenta cambios en la correlación con diferentes variables dentro de la base.

Las variables que resaltan y atraen nuestra atención son las variables de edad que habíamos destacado desde el gráfico parcial, aunado al estado civil para ver el comportamiento de los clientes por 3 subgrupos: single, married, divorced. Se generarán curvas de supervivencia para cada uno de ellos y así determinar a que tipo de clientes ofrecer las campañas.

También vemos cambios en las diferentes tipos de educacion de los clientes por lo cual será otra variable que analizaremos su comportamiento.

Analizando otro gráfico:

Del gráfico anterior podemos observar que el valor máximo de días de una campaña a otra es de 275, sin embargo, éste es un dato atípico por lo que no se considerará para el estudio.

¿Cómo resolver el problema?

Se pretende resolver el problema mediante curvas de supervivencia determinando que grupos de clientes son los que presentan el fallo antes que otros, determinando de esta manera a que tipo de cliente se deberían enfocar las campañas para que tengan éxito.

Aunado a ello se determinará cuanto tiempo habrá de por medio entre un grupo y otro para toda la cartera de clientes tenga éxito.

ANÁLISIS DE SUPERVIVENCIA

En el primer vistazo de la base de datos se nota que la mayoría de los clientes se encuentra en el rango de edad de 25-55 años así que se conglomerarán en un grupo llamado “mayoría” y el resto de edades será la “minoría”.

Se puede decir que el grupo minoría compra en menor tiempo el producto, por lo que se ve en la gráfica. Y las supervivencias son diferentes a un nivel de confianza del 99.9999%. Por lo que debería aumentarse la propaganda a clientes entre las edades de 18 a 25 años y de 55 en adelante.

En la gráfica se nota la frecuencia con la cual se compra el producto por hora, la minoría compra aproximadamente una unidad más por hora que el grupo mayoritario.
Además esta diferencia se espera al menos antes de las 500 horas que es cuando se tocan las bandas de confianza.

MARITAL

Aunque no sea muy evidente a simple vista, debido a que p<0.0001<0.01, sabemos que tenemos un 99% de probabilidad de que las curvas sean distintas. Por lo tanto podemos deducir que las campañas tienen mayor impacto y efectividad en las personas que están solteras.

Sin embargo la frecuencia con la que se hacen las compras no se diferencía mucho entre los tres conjuntos antes de las 400 horas y los intervalos de confianza se siguen tocando hasta el final de la gráfica, lo que nos lleva a conlcluir que no habrá una diferencia sirnificativa en el estado civil.

CRÉDITO HIPOTECARIO

Notemos que, gráficamente, la curva de supervivencia correspondiente a los clientes que no tienen crédito hipotecario está por debajo de aquellos que si lo tienen. Además, p<0.0001<.01, esto quiere decir que con una probabilidad de 99%, éstas curvas son distintas. Por lo tanto, se tiene una mayor eficacia en la campaña con los clientes que no tienen crédito hipotecario.

La frecuencia de compra de los clientes sin crédito hipotecario será mayor en una unidad por hora que los que tienen crédito hipotecario. Y al no tocarse los intervalos de confianza podemos presumir que siempre se mantiene por arriba la frecuencia del primer grupo.

Además de que compran hasta en 268 horas antes los que no tienen crédito hipotecario.

PRÉSTAMO BANCARIO

De nuevo, observando que la curva de supervivencia de las personas que no tienen préstamos bancarios está por debajo de la de las personas que sí tienen préstamos y, recordando, que p<0.0001<0.01, podemos asegurar que las campañas tienen mayor eficacia en las personas que no tienen préstamos bancarios.

Sin embargo para que haya una diferencia significativa entre las frecuencias de compra de ambas poblaciones se tendría que esperar a las ventas a partir de las 400 horas.

Notemos dos cosas en esta gráfica:

  • La curva de supervivencia de las personas con mayor grado de estudios está por debajo de las demás.
  • Las curvas de las personas con un grado de estudios desconocido y las de estudios superiores se comportan de una manera muy similar hasta cierto punto en el tiempo.

Como sabemos que p<0.0001<0.01 aseguramos con ésto que existe un 99% de probabilidad de que las curvas sean distintas entre sí. Podemos decir que, casi seguramente, la campaña tiene mayor efectividad en las personas entre mayor sea su grado de estudios.

Sin embargo la frecuencia de ventas por grado de estudios no tiene diferencias significativas entre los estratos.

CONTACT

Observando la tabla de correlaciones podríamos suponer que es más difícil vender los productos promocionados a las personas contactadas por teléfono. Sin embargo, la supervivencia de este grupo es casi igual a la del grupo al que se le ofreció el producto por medio de su celular. Sólo el grupo que tuvo un contacto desconocido presentó menor cantidad de ventas dentro de su propio grupo (Sólo un 4% dentro estrato “unknown” compró el producto contra el 13% y 15% dentro de los otros).

Queda la proporción total de ventas de esta manera:

Por último la frecuencia de compra de los que tienen método de contacto desconocido es menos de media venta por hora.

JOB. Las observaciones de esta variable se dividieron en dos grupos: profesionistas y no profesionistas. La curva de supervivencia de los profesionistas se encuentra por debajo de la curva de supervivencia de los no profesionistas,esto quiere decir que existe una mejor efectividad en los clientes profesionistas. Además, la curva de riesgo acumulada de los profesionistas se encuentra por arriba de la curva correspondiente al otro subgrupo.

Pero aunque se encuentre por encima la diferencia de número de ventas por hora no es muy significativa.

OUTCOME

Notemos que la curva de supervivencia del grupo “success” está por debajo de las curvas de supervivencia de “other” y “failure”. Esto quiere decir que una vez que se tiene éxito en alguna campaña, en la siguiente es más probable y rápido tenerlo para ese cliente.

Y efectivamente, las ventas del estrato “success” son de un máximo de 5 por hora, a diferencia de 2 por hora del resto.

Conclusiones

Con el análisis de supervivencia, podemos resolver el problema del cliente pues gracias a este se identificaron las variables influyen de manera positiva en la efectividad, estas fueron las siguientes:

  • El rango de edad. La mercadotecnia estaba principalmente dirigida a personas entre 25 y 55 años de edad, sin embargo el resto de edades compran con mayor frecuencia y facilidad así que la recomendación es ampliar la publicidad a los clientes menores a 25 años y mayores a 55.
  • El medio de contacto a los clientes es ligeramente significativo entre teléfono local y teléfono celular obteniendo que las ventas por celular son mas efectivas. Pero la mayor diferencia es entre las ventas realizadas por un método de contacto diferente a los anteriores, así que se recomienda evitar todo contacto diferente al celular o teléfono.
  • Si se tuvo éxito en campañas anteriores es el que tiene una frecuencia más significativa, siempre que se tenga éxito con un cliente es más probable que una nueva campaña tenga éxito en él.
  • Si el cliente tiene o no créito hipotecario. Aquellos que no tengan crédito hipotecario compran más facilmente los productos promocionados.

Por otro lado las variables que no presentan una influencia para la promoción de la campaña son:

  • nivel de escolaridad,
  • el estado civil de los clientes,
  • y si tienen préstamo bancario.