Análisis multivariado aplicado Segmentación de clientes Clustering jerárquico

Objetivo de la tarea: aplicar agrupamiento jerárquico para segmentar clientes de tarjeta de crédito a partir de variables de comportamiento y perfil crediticio. La idea no es solo correr código, sino traducir los clusters a decisiones de negocio. El algoritmo no hace magia; ustedes sí tienen que ponerle criterio gerencial.

Una entidad financiera desea mejorar sus estrategias de marketing y servicios personalizados mediante la segmentación efectiva de sus clientes de tarjeta de crédito (TC). Para lograrlo, el banco ha recopilado datos de cinco variables clave de sus clientes, disponibles en el archivo CC_CustomerData.csv.

  • Avg_Credit_Limit: Promedio del límite de las tarjetas de crédito del cliente (dólares).

  • Total_Credit_Cards: Número de tarjetas de créditos que posee el cliente.

  • Total_visits_bank: Cantidad de visitas físicas a sucursales del banco por parte de los clientes en el último mes.

  • Total_visits_online: Número de visitas a la página web del banco en el último mes.

  • Total_calls_made: Cantidad de llamadas realizadas por los clientes al centro de atención telefónica del banco en el último mes.

El objetivo principal de este estudio es segmentar a los clientes en grupos homogéneos basados en su comportamiento y perfil crediticio. Estos segmentos podrían ayudar al banco a adaptar sus ofertas, campañas publicitarias y servicios de manera más efectiva, mejorando así la satisfacción del cliente y la rentabilidad de la empresa.

A continuación, se muestran los datos correspondientes a los 5 primeros registros:

Primeros 5 registros de la base de clientes de tarjeta de crédito
Avg_Credit_Limit Total_Credit_Cards Total_visits_bank Total_visits_online Total_calls_made
1e+05 2 1 1 0
5e+04 3 0 10 9
5e+04 7 1 3 4
3e+04 5 1 1 4
1e+05 6 0 12 3

Importante: antes de aplicar clustering, recuerden revisar la escala de las variables. Un límite de crédito en dólares no juega en la misma cancha que el número de llamadas o visitas. Si no estandarizan, el modelo puede terminar agrupando por tamaño de número y no por patrón de comportamiento. Clásico error elegante, pero error al fin.

Preguntas

a) Representación del agrupamiento jerárquico

Tomando en cuenta las variables disponibles en la base de datos, represente el agrupamiento jerárquico de los clientes.

b) Número óptimo de grupos

Determine el número de grupos óptimo para los resultados del método jerárquico.

c) Interpretación y etiquetado de clusters

Interprete y etiquete los clusters finales obtenidos. Además, mencione la cantidad de clientes que pertenece al cluster más grande.