30 de septiembre de 2019

Marketing de un banco

Situación

Nuestro cliente está en el área de marketing de un banco con el siguiente caso:

La publicidad de los productos del banco en cuestión tiene mucha efectividad cuando va dirigida a sus “no-clientes”. Sin embargo, cuandose hace un lanzamiento de productos enfocados a clientes la publicidad no suele ser tan efectiva.

Objetivo

Optimizar y mejorar sus campañas futuras.

Imagen Ilustrativa

Variables y Estructura

Se observa en el esqueleto de la base de datos que posee 15 variables y 45211 observaciones

La descripción y estructura de las variables es la siguiente:

Tabla de variables

¿Qué se necesita para lograr el objetivo?

  1. Identificar cuales variables influyen en la efectividad.
  2. Estimar la supervivencia usando Kaplan Meier para cada subgrupo considerado en las hipótesis y así determinar bajo qué condiciones se tendrá una mejor respuesta de los clientes durante y después de la campaña.

Se requiere responder lo siguente:

  • ¿Qué grupos compran más?
  • ¿Qué condiciones debe cumplir la población para que adquieran el producto?
  • ¿Por que medio se deben promover las campañas?
  • ¿Se podrá enfocar en un grupos en especial para vender?
  • ¿Qué es lo que tenemos?

    Vistazo rápido

    Análisis gráfica anterior

    Se considerará las curvas de supervivencia de los subgrupos de aquellos clientes que se encuentran en los rangos 18-25 y 55-95.

    HIPÓTESIS: Las campañas no están dirigidas a público de 18-25 años de edad, los cuales cubren la mayor parte de la población.

    Ocupación de los clientes

    Análisis del gráfico

    Esta gráfica nos indica que la mayor parte de nuestra población tiene empleos en blue-collar, managment, technician.

    Estado civil de los clientes

    Análisis del gráfico

    Se obtiene que la mayoría de nuestra población se ecuentra casada dejando en segundo plano a la población soltera.

    En la variable “Marital” tenemos 3 subgrupos: single, married, divorced. Se pueden generar curvas de supervivencia para cada uno de ellos y así determinar que tipo de campañas ofrecer.

    HIPÓTESIS: Las campañas no están dirigidas, en su mayoría, a personas casadas, las cuales representan la mayor parte de los clientes.

    Nivel de escolaridad de los clientes

    Análisis del gráfico

    Respecto a la edudación, sobresalen los clientes con educación secundaria y superior.

    Incumplimiento de los clientes

    Análisis del gráfico

    Notamos que en un amplio porcentaje la gente está catalogada como puntuales y solo aproximadamente el 1.7% esta catalogada como clientes morosos. Ésto significa que la gran parte de la cartera de clientes que posee el banco cumple con sus obligaciones con la institución.

    Clientes con crédito hipotecario

    Análisis del gráfico

    Respecto a los préstamos hipotecarios la población se encuentra dividida practicamente en un 50%. Se observa una variación muy pequeña entre los clientes que tienen crédito hipotecario y los que no. Se realizarán curvas de supervivencia en subgrupos para aquellos que tienen crédito hipotecario y los que no.

    Hipótesis: Debido a que se observa una variación muy pequeña entre los clientes que tienen crédito hipotecario y los que no, estas categorías no influyen en el rendimiento de los clientes en la campaña.

    Clientes con préstamos bancarios

    Análisis del gráfico

    Se presenta una tendencia distinta contra los clientes que tienen un crédito hipotecario. En este caso los clientes que no poseen préstamos destacan considerablemente sobre la población que tiene préstamos en la cadena.

    Medio de promoción de la campaña

    Análisis del gráfico

    En la mayoría de nuestros clientes, la campaña se dio a conocer a través de su celular.

    No. de campañas a las que se ha expuesto el cliente

    Análisis del gráfico

    Por otro lado, tenemos que los clientes han sido expuestos desde 1 hasta 63 campañas de mkt; siendo la media por cliente de solo 2.

    Duración de la campaña en seguimiento (en horas)

    Análisis del gráfico

    A su vez, notamos que las campañas tienen una duración máxima de 871 horas y la media de éstas es de 40 horas.

    ¿Qué se relaciona con que? (Análisis de Correlación)

    ¿Qué nos dice?

  • El análisis nos revela que los días que pasaron desde la última campaña que fue mostrada al cliente están correlacionados con la duración de las campañas, i.e., entre mayor sea la duración de una campaña más tiempo pasará hasta la próximacampaña que se le muestre al cliente.
  • La edad está correlacionada con el balance del cliente: entre mayor edad tenga el cliente, mayor será en balance en su cuenta.
  • Entre mayor número de campañas a las que ha sido expuesto el cliente, menor será la duración de la exposición de la campaña.
  • Entre mayor sea la duración de la campaña menos serán las campañas expuestas al cliente.
  • Analizando las variables de la base

    Análisis del gráfico

    En estre gráfico más completo observamos que una relación totalmente inversa en las variables tipo factor dicotómicas, de estas destacaremos la de prestamo hipotecario pues es una de las variables que presenta cambios en la correlación con diferentes variables dentro de la base.

    Las variables que resaltan y atraen nuestra atención son las variables de edad que habíamos destacado desde el gráfico parcial, aunado al estado civil para ver el comportamiento de los clientes por 3 subgrupos: single, married, divorced. Se generarán curvas de supervivencia para cada uno de ellos y así determinar a que tipo de clientes ofrecer las campañas.

    También vemos cambios en las diferentes tipos de educacion de los clientes por lo cual será otra variable que analizaremos su comportamiento.

    Analizando otro gráfico:

    Análisis del gráfico

    Del gráfico anterior podemos observar que el valor máximo de días de una campaña a otra es de 275, sin embargo, éste es un dato atípico por lo que no se considerará para el estudio.

    ¿Cómo resolver el problema?

    Se pretende resolver el problema mediante curvas de supervivencia determinando que grupos de clientes son los que presentan el fallo antes que otros, determinando de esta manera a que tipo de cliente se deberían enfocar las campañas para que tengan éxito.

    Aunado a ello se determinará cuanto tiempo habrá de por medio entre un grupo y otro para toda la cartera de clientes tenga éxito.

    ANÁLISIS DE SUPERVIVENCIA

    Gráfico ilustrativo

    ¿Como comenzar?

    En el primer vistazo de la base de datos se nota que la mayoría de los clientes se encuentra en el rango de edad de 25-55 años así que se conglomerarán en un grupo llamado “mayoría” y el resto de edades será la “minoría”.

    Supervivencia por edad

    Análisis del gráfico

    Se puede decir que el grupo minoría compra en menor tiempo el producto, por lo que se ve en la gráfica. Y las supervivencias son diferentes a un nivel de confianza del 99.9999%. Por lo que debería aumentarse la propaganda a clientes entre las edades de 18 a 25 años y de 55 en adelante.

    Función de riesgo acumulado según grupo de edad

    Análisis de la Función de riesgo acumulado según grupo de edad

    En la gráfica se nota la frecuencia con la cual se compra el producto por hora, la minoría compra aproximadamente una unidad más por hora que el grupo mayoritario.
    Además esta diferencia se espera al menos antes de las 500 horas que es cuando se tocan las bandas de confianza.

    Supervivencia por estado civil

    Análisis del gráfico

    Aunque no sea muy evidente a simple vista, debido a que p<0.0001<0.01, sabemos que tenemos un 99% de probabilidad de que las curvas sean distintas. Por lo tanto podemos deducir que las campañas tienen mayor impacto y efectividad en las personas que están solteras.

    Función de riesgo acumulado según estado civil

    Análisis de la función de riesgo acumulado según estado civil

    Sin embargo la frecuencia con la que se hacen las compras no se diferencía mucho entre los tres conjuntos antes de las 400 horas y los intervalos de confianza se siguen tocando hasta el final de la gráfica, lo que nos lleva a conlcluir que no habrá una diferencia sirnificativa en el estado civil.

    Supervivencia por crédito hipotecario

    Análisis del gráfico

    Notemos que, gráficamente, la curva de supervivencia correspondiente a los clientes que no tienen crédito hipotecario está por debajo de aquellos que si lo tienen. Además, p<0.0001<.01, esto quiere decir que con una probabilidad de 99%, éstas curvas son distintas. Por lo tanto, se tiene una mayor eficacia en la campaña con los clientes que no tienen crédito hipotecario.

    Distancia máxima entre los estratos

    Se observa que compran hasta en 268 horas antes los que no tienen crédito hipotecario.

    Supervivencia por préstamos bancarios

    Análisis del gráfico

    De nuevo, observando que la curva de supervivencia de las personas que no tienen préstamos bancarios está por debajo de la de las personas que sí tienen préstamos y, recordando, que p<0.0001<0.01, podemos asegurar que las campañas tienen mayor eficacia en las personas que no tienen préstamos bancarios.

    Distancia máxima entre estratos

    Análisis del gráfico

    Para que haya una diferencia significativa entre las frecuencias de compra de ambas poblaciones se tendría que esperar a las ventas a partir de las 400 horas.

    Supervivencia por nivel de escolaridad

    Análisis del gráfico

    Notemos dos cosas en esta gráfica:
  • La curva de supervivencia de las personas con mayor grado de estudios está por debajo de las demás.
  • Las curvas de las personas con un grado de estudios desconocido y las de estudios superiores se comportan de una manera muy similar hasta cierto punto en el tiempo.
  • Como sabemos que p<0.0001<0.01 aseguramos con ésto que existe un 99% de probabilidad de que las curvas sean distintas entre sí. Podemos decir que, casi seguramente, la campaña tiene mayor efectividad en las personas entre mayor sea su grado de estudios.

    Función de riesgo acumulado

    Análisis del gráfico

    La frecuencia de ventas por grado de estudios no tiene diferencias significativas entre los estratos.

    Supervivencia por medio de contacto

    Análisis del gráfico

    Observando la tabla de correlaciones podríamos suponer que es más difícil vender los productos promocionados a las personas contactadas por teléfono. Sin embargo, la supervivencia de este grupo es casi igual a la del grupo al que se le ofreció el producto por medio de su celular. Sólo el grupo que tuvo un contacto desconocido presentó menor cantidad de ventas dentro de su propio grupo (Sólo un 4% dentro estrato “unknown” compró el producto contra el 13% y 15% dentro de los otros). Quedando la proporción total de ventas de esta manera:

    Porción de ventas

    Función de riesgo acumulado

    Análisis del gráfico

    Por último la frecuencia de compra de los que tienen método de contacto desconocido es menos de media venta por hora.

    Supervivencia por ocupación

    Las observaciones de esta variable se dividieron en dos grupos: profesionistas y no profesionistas. La curva de supervivencia de los profesionistas se encuentra por debajo de la curva de supervivencia de los no profesionistas,esto quiere decir que existe una mejor efectividad en los clientes profesionistas. Además, la curva de riesgo acumulada de los profesionistas se encuentra por arriba de la curva correspondiente al otro subgrupo.

    Modelo Kaplan Meier

    Análisis del gráfico

    Pero aunque se encuentre por encima la diferencia de número de ventas por hora no es muy significativa.

    Supervivencia según el éxito en campañas pasadas

    Análisis del gráfico

    Notemos que la curva de supervivencia del grupo “success” está por debajo de las curvas de supervivencia de “other” y “failure”. Esto quiere decir que una vez que se tiene éxito en alguna campaña, en la siguiente es más probable y rápido tenerlo para ese cliente.

    Función de riesgo según el éxito en campañas pasadas

    Análisis del gráfico

    Las ventas del estrato “success” son de un máximo de 5 por hora, a diferencia de 2 por hora del resto.

    Conclusiones

    Con el análisis de supervivencia, podemos resolver el problema del cliente pues gracias a este se identificaron las variables influyen de manera positiva en la efectividad, estas fueron las siguientes:

    • El rango de edad. La mercadotecnia estaba principalmente dirigida a personas entre 25 y 55 años de edad, sin embargo el resto de edades compran con mayor frecuencia y facilidad así que la recomendación es ampliar la publicidad a los clientes menores a 25 años y mayores a 55.

    .

    • El medio de contacto a los clientes es ligeramente significativo entre teléfono local y teléfono celular obteniendo que las ventas por celular son mas efectivas. Pero la mayor diferencia es entre las ventas realizadas por un método de contacto diferente a los anteriores, así que se recomienda evitar todo contacto diferente al celular o teléfono.
    • Si se tuvo éxito en campañas anteriores es el que tiene una frecuencia más significativa, siempre que se tenga éxito con un cliente es más probable que una nueva campaña tenga éxito en él.
    • Si el cliente tiene o no créito hipotecario. Aquellos que no tengan crédito hipotecario compran más facilmente los productos promocionados.

    _

    Por otro lado las variables que no presentan una influencia para la promoción de la campaña son:

    • nivel de escolaridad,
    • el estado civil de los clientes,
    • y si tienen préstamo bancario.