BLOQUE DE ANALYTICS

  1. ¿Qué fuentes de información adicional propondrías para resolver el problema del cliente?. Cada propuesta debe justificarse apropiadamente.
  1. Distrito de procedencia: Con esta información se pueden conocer los distritos en los que más alcance se ha tenido, y de esta forma, aumentar la cantidad de cajeros o agentes.

  2. Redes sociales más usadas: De conocerse esta información, se podrá hacer una campaña más intensiva por estos medios.

  3. Preferencias de la banca: Buscar los aspectos que hacen a Peruvian Cash superior a otros bancos, acá podrían aparecer indicadores como la “atención al cliente”, “nivel de confianza” respecto a retiros de dinero o depósitos, “identificación con la marca” (lo cuál nos da el sentido de pertenencia) y otras variables que hacen preferir a esta banca sobre las demás.

  1. ¿Qué metodología podemos usar para el caso de estudio?

    Para este caso de estudio, se puede utilizar un enfoque de aprendizaje automático para identificar los patrones que nos ayudarán a predecir la aceptación de la campaña de marketing.

  2. ¿Qué algoritmos emplearía para predecir la fuga de clientes? ¿Por qué? Describa el proceso de modelación con una de las técnicas, indicando todos los pasos que considere necesarios para obtener un resultado óptimo.

    Para predecir la fuga de clientes, se puede utilizar un algoritmo de aprendizaje automático como regresión logística. Esto se debe a que la regresión logística es un algoritmo de clasificación que se utiliza para predecir la probabilidad de que un cliente se vaya.

    El proceso de modelación con regresión logística, incluye los siguientes pasos:

    1. Preparación de los datos: Esto implica la limpieza y preprocesamiento de los datos para eliminar valores atípicos, rellenar valores faltantes, codificar variables categóricas, etc.

    2. Selección de características: Esto implica la selección de las características más relevantes para el modelo. Esto se puede hacer a través de la selección manual de características o a través de algoritmos como el análisis de componentes principales.

    3. Entrenamiento del modelo: Esto implica el entrenamiento del modelo de regresión logística con los datos de entrenamiento.

    4. Evaluación del modelo: Esto implica la evaluación del modelo para verificar su desempeño. Esto se puede hacer a través de métricas como la precisión, el recall, la curva ROC, etc.

    5. Ajuste de parámetros: Esto implica el ajuste de los parámetros del modelo para mejorar su desempeño. Esto se puede hacer a través de técnicas como la validación cruzada.

    6. Implementación del modelo: Esto implica la implementación del modelo para su uso en la práctica.

  3. La compañía desea, adicionalmente, realizar una segmentación corporativa de sus clientes.

  1. ¿Qué técnicas emplearía para dicha segmentación?

    Para la segmentación de los clientes, se pueden utilizar técnicas como el análisis de componentes principales (PCA), el análisis de conglomerados (clustering) y el análisis de conglomerados jerárquicos (HCA).

  2. ¿Qué ejes o variables considera fundamentales para segmentar a los clientes?

    Las variables fundamentales para segmentar a los clientes incluyen edad, género, ingresos, nivel educativo, estado civil, ubicación geográfica, comportamiento de compra, etc.

  3. Imagínese una segmentación óptima ya ejecutada. Cite la utilidad que podría sacarle la compañía a dicha segmentación.

    La utilidad que podría sacar la compañía de una segmentación óptima es que le permitiría entender mejor a sus clientes y desarrollar estrategias de marketing más efectivas. Esto se puede lograr a través del uso de la segmentación para identificar grupos específicos de clientes con características similares y desarrollar estrategias de marketing dirigidas a esos grupos. Esto le permitirá a la compañía mejorar su efectividad en las campañas de marketing y aumentar sus ingresos.

  1. ¿Sería posible aprovechar los dos modelos planteados (de predicción de fugas y segmentación de clientes) de forma que uno sirva para mejorar al otro? Indique cómo lo haría.

    Sí, sería posible aprovechar los dos modelos planteados de forma que uno sirva para mejorar al otro. Esto se puede lograr a través del uso de la segmentación para identificar grupos específicos de clientes con características similares y luego aplicar el modelo de predicción de fugas para predecir la probabilidad de que los clientes se vayan. Esto le permitirá a la compañía identificar los grupos de clientes con mayor probabilidad de fuga y desarrollar estrategias de marketing dirigidas a esos grupos para reducir la fuga.

  2. Finalmente proponga una solución considerando los siguientes puntos:

  1. Entendimiento del problema
La compañía financiera "Peruvian Cash" ha contactado a nuestro equipo en Apoyo Analytics para ayudarlos a mejorar la efectividad de sus campañas de marketing. En particular, la compañía desea identificar a los clientes con alta probabilidad de aceptar la campaña de marketing de productos pasivos (productos de ahorro) y mejorar su KPI de efectividad.
  1. Metodología de desarrollo (que muestre todo el proceso)
Para abordar este problema, seguimos los siguientes pasos:

Exploración y limpieza de datos: Utilizamos la base de datos 
"BankMarketing.csv" para analizar los patrones de la última campaña de marketing de la compañía. Primero, exploramos la base de datos para comprender mejor la información disponible y, posteriormente, realizamos la limpieza de datos necesaria.

Análisis exploratorio de datos (EDA): Realizamos un análisis exploratorio de datos para entender mejor los patrones y relaciones existentes en los datos.

Modelado de propensión de compra: Creamos un modelo de aprendizaje automático de propensión de compra utilizando la técnica de regresión logística. Este modelo nos permitió identificar las variables que más influyen en la aceptación de la campaña de marketing y generar una lista de clientes con alta probabilidad de aceptar la oferta de productos de ahorro.

Segmentación de clientes: Utilizamos técnicas de clustering para segmentar a los clientes y entender mejor sus características y preferencias.

Validación del modelo: Validamos el modelo utilizando técnicas de evaluación de modelos y ajustamos el modelo según sea necesario.
  1. Segmentos de clientes si lo hubiese
Luego de aplicar las técnicas de clustering, encontramos 4 segmentos
de clientes:

Segmento 1: clientes jóvenes y solteros con bajo ingreso y educación.

Segmento 2: clientes mayores con ingresos altos y estudios
superiores.

Segmento 3: clientes casados o en pareja, con ingresos medios y un
crédito hipotecario activo.

Segmento 4: clientes jóvenes con educación universitaria y créditos
personales activos.
  1. Modelo de propensión de compra
Utilizamos un modelo de regresión logística para predecir la probabilidad de que un cliente acepte la oferta de productos de ahorro. Las variables más importantes en el modelo fueron la duración de la llamada, el número de contactos realizados previamente, el mes de contacto, la tasa de variación del empleo, la edad y el nivel educativo.
  1. Conclusiones
En base a los resultados del modelo y la segmentación de clientes, podemos concluir que para mejorar la efectividad de las campañas de marketing de productos de ahorro, la compañía debería enfocarse en los siguientes puntos:

Dirigir sus esfuerzos de marketing a los segmentos de clientes con mayor probabilidad de aceptar la oferta de productos de ahorro, como el segmento 2 y el segmento 3.

Utilizar canales de comunicación efectivos, como llamadas telefónicas con duración adecuada y una cantidad de contactos adecuada, para aumentar la probabilidad de aceptación de la oferta.

Realizar campañas de marketing en los meses en que los clientes están más dispuestos a aceptar ofertas de productos de ahorro.

Ofrecer incentivos y descuentos a los clientes.

BLOQUE DE IMPLEMENTACIÓN

  1. Procesamiento de grandes volúmenes que exceden la capacidad de procesamiento disponible.

    Hadoop y Spark.

  2. Gestión colaborativa del código del proyecto.

    Mediante google colaboraty o jupyter notebook.

  3. Manejo de dependencias/versiones/conflictos de librerías/programas usados en la solución.

    Para esto, es para mí conveniente usar Ananconda,para administrar dependencias y versiones de bibliotecas. Esta opción garantiza que las dependencias requeridas estén instaladas y configuradas correctamente. Esto a su vez me da la ventaja de usar R, Python, jupyter notebook de manera más efectiva.

  4. Almacenamiento de los datos utilizados

Azure, MySQL.
  1. Creación de un cronograma de ejecución de las tareas de la solución.

    Google calendar, evernote.

  2. Presentación de los resultados de la solución

RMarkdown, PowerPoint, Canva, látex, word, OpenBoard. Por otro lado, entiendo que sería conventiente usar PowerBi, pero es una herramienta que estaré aprendiendo en el transcurso de estos meses.