Análisis multivariado aplicado Segmentación de clientes Clustering jerárquico
Objetivo de la tarea: aplicar agrupamiento jerárquico para segmentar clientes de tarjeta de crédito a partir de variables de comportamiento y perfil crediticio. La idea no es solo correr código, sino traducir los clusters a decisiones de negocio. El algoritmo no hace magia; ustedes sí tienen que ponerle criterio gerencial.
Una entidad financiera desea mejorar sus estrategias de marketing y
servicios personalizados mediante la segmentación efectiva de sus
clientes de tarjeta de crédito (TC). Para lograrlo, el banco ha
recopilado datos de cinco variables clave de sus clientes, disponibles
en el archivo CC_CustomerData.csv.
Avg_Credit_Limit: Promedio del límite de las tarjetas de crédito del cliente (dólares).
Total_Credit_Cards: Número de tarjetas de créditos que posee el cliente.
Total_visits_bank: Cantidad de visitas físicas a sucursales del banco por parte de los clientes en el último mes.
Total_visits_online: Número de visitas a la página web del banco en el último mes.
Total_calls_made: Cantidad de llamadas realizadas por los clientes al centro de atención telefónica del banco en el último mes.
El objetivo principal de este estudio es segmentar a los clientes en grupos homogéneos basados en su comportamiento y perfil crediticio. Estos segmentos podrían ayudar al banco a adaptar sus ofertas, campañas publicitarias y servicios de manera más efectiva, mejorando así la satisfacción del cliente y la rentabilidad de la empresa.
A continuación, se muestran los datos correspondientes a los 5 primeros registros:
| Avg_Credit_Limit | Total_Credit_Cards | Total_visits_bank | Total_visits_online | Total_calls_made |
|---|---|---|---|---|
| 1e+05 | 2 | 1 | 1 | 0 |
| 5e+04 | 3 | 0 | 10 | 9 |
| 5e+04 | 7 | 1 | 3 | 4 |
| 3e+04 | 5 | 1 | 1 | 4 |
| 1e+05 | 6 | 0 | 12 | 3 |
Importante: antes de aplicar clustering, recuerden revisar la escala de las variables. Un límite de crédito en dólares no juega en la misma cancha que el número de llamadas o visitas. Si no estandarizan, el modelo puede terminar agrupando por tamaño de número y no por patrón de comportamiento. Clásico error elegante, pero error al fin.
Tomando en cuenta las variables disponibles en la base de datos, represente el agrupamiento jerárquico de los clientes.
Determine el número de grupos óptimo para los resultados del método jerárquico.
Interprete y etiquete los clusters finales obtenidos. Además, mencione la cantidad de clientes que pertenece al cluster más grande.