Introducción

En la actualidad se observa una tendencia en las empresas de adoptar un enfoque orientado hacia sus clientes, los comportamientos y necesidades de estos. Esto implica que la organización y todas las personas pertenecientes a ella deben responder a las necesidades de los diferentes clientes, logrando que la empresa responda en tiempo y en forma oportuna las exigencias del medio.

Aquellas empresas con un enfoque orientado hacia los clientes son más rentables, puesto que al conocer y satisfacer mejor las necesidades de los mismos desarrollan relaciones de largo plazo generando mayor lealtad y la posibilidad de futuras negociaciones.

Por ello, surge la necesidad de realizar un proceso de segmentación de clientes que permita a las empresas dividir a sus consumidores en categorías específicas, basadas en características que se extraen de su comportamiento como clientes y la información que pueden obtener de sus interacciones con la empresa; en este estudio en particular se está trabajando con información de clientes corporativos, es decir, una empresa cuyos clientes también son empresas.

El objetivo es crear grupos de empresas(clientes) para ayudar a la empresa principal, cuyo sector de desarrollo será la banca, con el fin de mejorar el trato a sus clientes además de los servicios y beneficios que les ofrece según sus condiciones, es decir, ayudar a la toma de decisiones para que todo el entorno corporativo funcione de una manera efectiva. Por otro lado, se considera de suma importancia efectuar una segmentación de clientes buscando detectar aquel segmento que genera mayor rentabilidad para el Banco. De este modo, se desarrolla una herramienta que colabore con la nueva percepción de la entidad y que permita migrar con mayor facilidad a un enfoque de gestión orientado hacia los clientes.

Objetivo

El objetivo es crear grupos que tengan sentido es decir interpretables para ser clasificados y caracterizados mediante la identificación de patrones de uso de productos y canales y su relación con los estados financieros y que permitan a la empresa tomar acción sobre esos grupos, como el ofrecimiento de sus servicios y entender más a fondo cómo se comportan en el entorno.

Resumen

El presente trabajo se concentra en una segmentación de clientes, en este caso empresas, de las cuales se tiene información como el uso de canales de entrada y salida que posee el banco y sus características o estados financieros que permiten entender su estructura, es decir si de servicios, de productos, si es grande, pequeña, si se mueve a nivel nacional y/o internacional, como es el comportamiento de sus inventarios, de sus cuentas por cobrar y pagar y de los diferentes ciclos de negocios y financieros, etc. Esto permite no solo entender como se caracteriza el cliente sino además sus necesidades logrando así ofrecerle servicios que sean beneficiosos, tanto para él como para el banco.

Durante el desarrollo de este trabajo se buscaron diferentes caminos para realizar la segmentación de los clientes. En este documento se presentan las que generaron mejores resultados e hicieron que los grupos tuvieran mayor sentido, además de ello se verificó que todos los procesos fueran estadísticamente válidos.

Retos

  • Entender el entorno donde se desarrolla el trabajo, cual es su objetivo y saber que debido a que es un problema de aprendizaje no supervisado se debe intentar llegar a los resultados que intuitivamente sean más adecuados y coherentes.

  • Contextualizar la base de datos para lograr una interpretación correcta de cada variable, sus unidades y rangos.

  • Presentar las variables mediante tablas y gráficas permitiendo entender su comportamiento y estructura

  • Realizar un correcto análisis descriptivo buscando tener las condiciones óptimas como la aplicación de transformaciones y escalamiento de variables para ser utilizadas de manera correcta en los distintos métodos para el proceso de segmentación.

  • Idear diferentes caminos a seguir para realizar los agrupamientos mediante k-means.

  • De los caminos seguidos en el punto anterior, escoger el mejor con el fin de realizar comparaciones que sean de provecho.

  • Caracterizar los diferentes grupos.

  • Plantear posibles estrategias o dar recomendaciones al banco buscando mejorar el trabajo que desarrollan con sus diferentes grupos de clientes.

  • Dar conclusiones sobre el estudio.

Contextualización

El estudio se quiere contextualizar en un entorno o sector bancario, este tiene como clientes a empresas que utilizan sus diferentes servicios por medio de canales de entrada y de salida que tienen fines específicos para cada cliente, es decir, cada cliente puede utilizar diversos canales, con montos y número de transacciones diferente.

Por lo tanto, el objetivo de la entidad bancaria es comprender cómo pueden agruparse sus diferentes clientes según sus características financieras y según el uso que hacen de los canales con el fin de ofrecerles condiciones que se adapten más a sus hábitos. Además, se busca incentivar su participación, permitiendo beneficios por medio de los canales que son de su interés.

Es por esto que la entidad bancaria busca obtener un proceso de segmentación muy bien elaborado, que le permita tomar decisiones frente a sus clientes y contribuya al crecimiento de la organización. Así mismo, es importante entender a los clientes actuales, buscando entender a los nuevos clientes que puedan llegar ya que se les ofrecería los servicios que mejor se adapten a sus características.


Contextualización de variables

Variables de canales (¿Cómo te usa el cliente?)

en_vm_canalX: valor del ticket promedio de entrada por el canal X

sal_vm_canalX: valor del ticket promedio de salida por el canal X

en_tx_canalX: cantidad de transacciones de entrada mensuales en promedio por el canal X

sal_tx_canalX: cantidad de transacciones de salida mensuales en promedio por el canal X


Variables financieras (¿Qué necesita el cliente?)

impo_cv: Variable categorizada que hace referencia al porcentaje de insumos que cada empresa obtiene mediante importación.

expo_vt: Variable categorizada que hace referencia al porcentaje de producción que cada empresa tiene destinado para exportación.

cxp: Número de cuentas por pagar que tiene cada cliente (Deudas). Está categorizada en 6 niveles.

cxc: Número de cuentas por cobrar que tiene cada cliente (Adquisiciones). También puede hacer referencia a lo que el cliente ha vendido y todavía no ha sido pagado.

totalinventory: Valor de los inventarios de la empresa al 31 de Diciembre. Está categorizada en 6 niveles, si presta servicios son casi 0. También hace referencia a lo que está para la venta pero no se ha vendido.

pagos_pj: Porcentaje de los pagos que van hacia empresas. Se obtiene de dividir los pagos hechos a personas jurídicas sobre los pagos totales

pagos_pn: Porcentaje de los pagos que van hacia personas. Se obtiene de dividir los pagos hechos a personas naturales sobre los pagos totales

tiene_ventas_fisicas: la empresa tiene puntos de venta físicos (1:Si, 0:No)

tiene_ventas_electronicas: la empresa tiene ventas electrónicas (1:Si, 0:No)

recaudos_pj: Porcentaje de los recaudos que provienen de empresas. Se obtiene al dividir recaudos provenientes de personas jurídicas sobre los recaudos totales.

recaudos_pn: Porcentaje de los recaudos que provienen de personas. Se obtiene al dividir recaudos provenientes de personas naturales sobre los recaudos totales.

recaudo: todos los ingresos registrados en un tiempo estimado.

rotacion_inventarios: Índice del número de veces que se han renovado las existencias en días, es decir, a cantidad de días que le toma a la empresa realizar rotación de inventarios. Está categorizada con seis niveles, donde entre menor sea el nivel de esta variable, más rápido se venden el producto o servicio que la empresa ofrece.

rotacion_cxp: Hace referencia a la rotación de cuentas por pagar medida en días, esta es un índice que refleja la velocidad con que la empresa ha pagado las deudas contraídas con proveedores ,es decir, capacidad de saldar sus deudas. Está categorizada con 4 niveles.

rotacion_cxc: Hace referencia a la rotación de cuentas por cobrar medida en días, esta es un índice de la velocidad con la que una empresa cobra sus cuentas, es decir, capacidad de transformarlas en dinero efectivo. Está categorizada con 4 niveles.

ciclo_negocio: Es el ciclo de negocio medido en días, es decir, el índice del número de días que le toma a una empresa llevar a cabo todas sus operaciones de negocio. Está categorizada con 6 niveles.

ciclo_financiero: Es el ciclo financiero medido en días, es decir, el índice del número de días que le toma a una empresa llevar a cabo todas sus operaciones financieras. Entre más pequeño, más rápido recupera la empresa su inversión. Está categorizada con 6 niveles.

Análisis Descriptivo

  • Lectura de la base de datos
df <- read.csv("base_trabajo_segmentacion.csv", sep = ";", dec = '.', header = T)


  • Base de datos original
en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
0 0 0 0 0 0 0 0 0 0 0 0.000000 0.000000 0.000000 0.00000 0.000000 0.00 0.00 0.0 0 0 0 0 0 0 0 0.000000 0.00000 0 0.00000 1 1 6 6 6 0.000 0.000 0 0 0 0 6 2 2 5 6
0 0 0 0 0 0 0 0 0 0 0 0.000000 0.000000 0.000000 0.00000 0.000000 0.00 0.00 0.0 0 0 0 0 0 0 0 0.000000 0.00000 0 0.00000 1 1 2 6 2 1.000 0.000 0 0 0 0 1 3 1 3 4
250927493 54160892 5122152 41852510 413614315 1663236 2106847525 0 0 0 0 24.416667 11.916667 3.333333 237.83333 2.545454 5.40 8.25 0.0 0 0 0 413614315 2265361194 0 0 2.545454 613.08333 0 0.00000 1 1 3 1 2 0.456 0.544 1 0 0 0 2 1 2 2 1
39402360 96468998 8226710 0 0 7072802 0 9000000 0 0 0 14.416667 13.833333 4.600000 0.00000 0.000000 2.80 0.00 1.0 0 0 0 0 60558440 0 0 0.000000 10.33333 0 0.00000 2 2 1 1 1 0.615 0.385 1 0 0 0 5 2 3 5 5
337432319 234217927 105344054 15755287 0 23671840 0 3600962 3727299 0 0 153.583333 42.250000 102.416667 49.33333 0.000000 18.00 0.00 2.2 4 0 0 0 0 0 622080714 0.000000 0.00000 0 53.41667 1 1 2 2 2 1.000 0.000 1 0 0 0 2 2 1 3 3
33629514 42883291 1348792 0 0 3828360 0 0 687244 0 0 7.416667 8.833333 1.000000 0.00000 0.000000 1.25 0.00 0.0 1 0 0 0 1960611436 0 0 0.000000 90.00000 0 0.00000 1 1 1 3 1 0.590 0.410 0 0 0 0 1 4 1 5 5
Filas Columnas
2233 46
  • El conjunto de datos cuenta con 2233 registros, es decir, 2233 empresas que son clientes de la compañía en la que se va a realizar el estudio.

  • Hay 46 variables de las cuales, la primeras 30 reflejan el uso que cada uno de los clientes le da a los canales ofrecidos por la organización, estos se dividen en canales de entrada y de salida donde algunos miden montos de dinero y otros el número de transacciones realizadas en cada canal. Las 16 variables restantes tienen que ver con características financieras que permiten conocer algunas peculiaridades del perfil o estructura de la empresa(cliente).


¿Por qué realizar la transformación de logaritmo natural?

Para las variables asociadas a los canales se realiza la transformación logaritmo natural para trabajar con escalas que permitan una mejor visualización y comprensión del comportamiento de estas, esta transformación es de mucha utilidad cuando se cuenta con valores extremos, que en este caso particular se presentan y han hecho menos viable la compresión de las diferentes variables, además de que esta transformación solo cambia la escala y permite que muchas interpretaciones se puedan seguir realizando como cuáles canales son los que manejan mayores o menores montos de dinero o mayor o menor número de transacciones, por lo tanto esta transformación da habilidad para acotar el rango de la variable en una cantidad más pequeña que la original. Este efecto reduce la sensibilidad de las estimaciones a las observaciones extremas, lo cual en este estudio ha sido de mucha utilidad y ha permitido realizar unas mejores agrupaciones.

¿Por qué escalar las variables para realizar las agrupaciones?

Dado que se está trabajando con el algoritmo k-means el cual está basado en distancias, la escala de las diferencias variables influyen mucho en los resultados que se obtienen, lo que lleva a dar más peso a variables cuyos rangos son más grandes, por lo tanto se acudió a un procedimiento que se llama escalamiento o estandarización de variables, el cual permite trabajar sobre un mismo rango de valores en las diferentes variables ya que permite quitar las unidades de medidas de cada uno de las variables, permitiendo que estas se puedan comparar entre sí sin problema.

Separación de las variables financieras y canales (no escaladas)

finan_no_scaled <- df[, 31:46]
Canal_no_scaled <- df[ , 1:30]

Separando en conjunto de datos en variables de canales y variables financieras donde ya están escaladas:

# Escalamiento de los datos completos
df_scaled <- scale(df, center = T, scale = T)

Canal_scaled <- df_scaled[,1:30]
finan_scaled <- df_scaled[,31:46]

Variables de los canales en logaritmo sin escalar y escalados

Canal_log <- log(Canal_no_scaled + 1) 

Canal_log_scaled <- scale(log(Canal_no_scaled + 1), center = T, scale = T)


Análisis descriptivo de las variables de canales de entrada y salida que reflejan los montos de dinero en millones de pesos:

en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros
Min. : 0.00 Min. : 0.0 Min. : 0.00 Min. : 0.0 Min. : 0.0 Min. : 0.000 Min. : 0 Min. : 0.000 Min. : 0.000 Min. : 0.0000 Min. : 0.0 Min. : 0.0 Min. : 0.0 Min. : 0.00 Min. : 0.0000
1st Qu.: 51.38 1st Qu.: 224.6 1st Qu.: 0.00 1st Qu.: 0.0 1st Qu.: 0.0 1st Qu.: 0.598 1st Qu.: 0 1st Qu.: 0.000 1st Qu.: 0.000 1st Qu.: 0.0000 1st Qu.: 0.0 1st Qu.: 0.0 1st Qu.: 11.4 1st Qu.: 0.00 1st Qu.: 0.0000
Median : 348.67 Median : 961.2 Median : 1.26 Median : 0.0 Median : 4.2 Median : 9.021 Median : 0 Median : 1.909 Median : 1.509 Median : 0.0000 Median : 0.0 Median : 0.2 Median : 660.8 Median : 0.00 Median : 0.0000
Mean : 1853.34 Mean : 5073.0 Mean : 198.00 Mean : 436.7 Mean : 2120.2 Mean : 123.494 Mean : 1066 Mean : 28.877 Mean : 12.474 Mean : 0.9863 Mean : 257.1 Mean : 2115.9 Mean : 5191.3 Mean : 12.56 Mean : 0.9051
3rd Qu.: 1229.57 3rd Qu.: 3114.0 3rd Qu.: 8.26 3rd Qu.: 3.7 3rd Qu.: 300.0 3rd Qu.: 47.120 3rd Qu.: 0 3rd Qu.: 7.916 3rd Qu.: 7.012 3rd Qu.: 0.0000 3rd Qu.: 0.0 3rd Qu.: 300.6 3rd Qu.: 2473.2 3rd Qu.: 0.00 3rd Qu.: 0.0000
Max. :251092.00 Max. :695285.0 Max. :52076.54 Max. :405096.0 Max. :806965.0 Max. :14523.637 Max. :770542 Max. :10038.466 Max. :5408.477 Max. :180.4752 Max. :160039.0 Max. :806965.0 Max. :856183.0 Max. :23931.43 Max. :622.0807


Análisis descriptivo de las variables de canales de entrada y salida que muestran el número de transacciones:

en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros
Min. : 0.00 Min. : 0.000 Min. : 0.0 Min. : 0 Min. : 0.000 Min. : 0.000 Min. : 0.000 Min. : 0.000 Min. : 0.000 Min. : 0.0000 Min. : 0 Min. : 0.000 Min. : 0.0 Min. : 0.000 Min. : 0.0000
1st Qu.: 4.67 1st Qu.: 7.583 1st Qu.: 0.0 1st Qu.: 0 1st Qu.: 0.000 1st Qu.: 1.083 1st Qu.: 0.000 1st Qu.: 0.000 1st Qu.: 0.000 1st Qu.: 0.0000 1st Qu.: 0 1st Qu.: 0.000 1st Qu.: 1.0 1st Qu.: 0.000 1st Qu.: 0.0000
Median : 48.08 Median : 38.250 Median : 1.9 Median : 0 Median : 1.000 Median : 3.889 Median : 0.000 Median : 1.333 Median : 1.500 Median : 0.0000 Median : 0 Median : 1.000 Median : 122.7 Median : 0.000 Median : 0.0000
Mean : 622.49 Mean : 122.008 Mean : 863.6 Mean : 2624 Mean : 5.697 Mean : 18.892 Mean : 7.822 Mean : 20.843 Mean : 10.553 Mean : 0.1591 Mean : 670 Mean : 5.702 Mean : 763.9 Mean : 2.472 Mean : 0.9025
3rd Qu.: 235.92 3rd Qu.: 122.833 3rd Qu.: 8.8 3rd Qu.: 6 3rd Qu.: 4.364 3rd Qu.: 16.000 3rd Qu.: 0.000 3rd Qu.: 3.833 3rd Qu.: 4.222 3rd Qu.: 0.0000 3rd Qu.: 0 3rd Qu.: 4.167 3rd Qu.: 561.3 3rd Qu.: 0.000 3rd Qu.: 0.0000
Max. :289252.33 Max. :4638.833 Max. :438619.6 Max. :3510700 Max. :519.167 Max. :669.667 Max. :2446.500 Max. :5492.667 Max. :1763.778 Max. :11.8333 Max. :466385 Max. :516.500 Max. :73057.6 Max. :4586.000 Max. :579.2121


  • Dado que se cuenta con unas cifras numéricas muy grandes, se decide realizar el análisis gráfico de estas variables mediante el logaritmo, ya que este permite una mejor visualización y comprensión de cuales canales tienen mayor uso, cuales manejan mayor dinero y cuales realizan mayor número de transacciones haciendo posible una mejor comprensión del funcionamiento de los distintos canales.


Gráfico de la media en logaritmo natural de cada variable asociadas a los canales

plot(1:30, colMeans(Canal_log), type = 'b', xaxt = "n", xlab = '', 
     lwd = 2, ylab = 'Media', col="cyan4", main="Gráfico de la medias de los canales en logaritmo natural", pch=19)
axis(1, 1:30, names(df)[1:30], las = 2, cex.axis = 0.7)
grid()

Boxplots del logaritmo natural de las variables de los canales

Mediante los gráficos se puede analizar que:

Análisis de los canales de entrada:

  • Los canales de entrada que manejan un monto promedio más alto de dinero son: canal1, canal2, canal6, canal8 y canal9.

  • Los canales de entrada que manejan un monto promedio más bajo de dinero son: canal4, canal7, canal10 y canalOtros.

  • Los canales de entrada que manejan en promedio un mayor número de transacciones son: canal1 y canal2

  • Los canales de entrada que manejan en promedio un número intermedio de transacciones son: canal3, canal4, canal5, canal6, canal8 y canal9.

  • Los canales de entrada que manejan en promedio un menor número de transacciones son: canal7, canal10 y CanalOtros.

En general, en los canales de entrada, el canal1 y el canal2 son los que manejan un mayor monto promedio de dinero y un mayor número de transacciones; por otro lado, el canal7 y el canal10 son los que manejan menor monto promedio de dinero y un menor número de transacciones. También se puede visualizar particularmente que a pesar de que el canal5 maneja un mayor monto promedio de dinero que el canal4, en el canal5 se presenta un menor número de transacciones que en el canal4.

Análisis de los canales de salida:

  • El canal de salida que maneja un monto promedio mayor de dinero es el canal2.

  • El canal de salida que maneja un monto promedio intermedio de dinero es el canal5.

  • Los canales de salida que manejan un monto promedio menor de dinero son el canal8 y canalOtros.

  • El canal de salida que maneja en promedio un mayor número de transacciones es el canal2.

  • Los canales de salida que manejan en promedio un menor número de transacciones son el canal5, canal8 y CanalOtros, aunque entre estos el canal5 es el que realiza un mayor número de transacciones.

En general en los canales de salida, el canal2 es el que maneja un mayor monto promedio de dinero, además un mayor número de transacciones; por otro lado el canal8 y canalOtros son los que manejan los menores montos promedio de dinero y menor números de transacciones.

Matriz de correlación asociada a las variables de los canales:

library(corrplot)
corrplot(cor(Canal_no_scaled), 
         method="color",  
         type="upper", order='original', 
         addCoef.col = "black", # Add coefficient of correlation
         tl.col="black", tl.srt=45, #Text label color and rotation
         sig.level = 0.01, insig = "blank", 
         number.cex = 0.5,
         # hide correlation coefficient on the principal diagonal
         diag=FALSE
         )

  • El canal de entrada 3 parece estar positivamente correlacionado con el canal de entrada 9 y con el número de transacciones por el canal 3 y 9.

  • El canal de entrada 4 parece estar positivamente correlacionado con los canales de entrada 5 y 7, con el número de transacciones por el canal 4 y con el canal de salida 5.

  • Existe una fuerte correlación lineal positiva entre el canal de entrada 5 y el número de transacciones en el canal 4 y el canal 2 de salida. Además de una correlación de 1 con el canal 5 de salida.

  • Parece que el canal de entrada 6 no se encuentra linealmente correlacionado con los demás canales.

  • Existe una fuerte correlación lineal positiva entre el número de transacciones del canal 4 y el canal 2 de salida.

  • El canal de entrada 8 parece estar positivamente correlacionado con el canal 8 de salida.

  • El canal de entrada otros parece estar positivamente correlacionado con el número de transacciones del canal 1.

  • Existe una fuerte correlación lineal positiva entre el número de transacciones del canal 5 y el número de transacciones por el canal 2 de salida.

  • El canal 2 de salida parece estar positivamente correlacionado con el canal 2 de salida.


Análisis descriptivo de las variables financieras:

  • Gráficos de frecuencias relativas para las variables categoricas

  • Gráficos de histograma para las variables continuas

  • impo_cv: Más del 60% de los clientes tiene un nivel de importación entre 1 y 2.

  • expo_vt: Más del 50% de los clientes tiene un nivel del exportación de 2.

  • cxp: Más del 50% de los clientes tiene un número bajo de cuentas por pagar (1 y 2). También destaca que más del 15% de los clientes están en el nivel más alto de cuentas por pagar (6).

  • cxc: Más del 25% de los clientes se encuentran en el nivel más alto del número de cuentas por cobrar (6), sin embargo más del 55% de los clientes se encuentra en el nivel 1, 2 y 3 de cuentas por cobrar.

  • totalinventory: Casi un 25% de los clientes está en el nivel más alto del valor de inventario al 31 de diciembre, el grueso de los clientes se encuentra en el nivel 1, 2 y 3.

  • pagos_pj:

    • El 75% de los clientes tiene un porcentaje de pago a personas jurídicas que ronda entre el 31.6 y el 77.4 porciento.

    • También se puede observar que en promedio el porcentaje de pago a personas jurídicas está en el 53.9%.

    • Aproximadamente un 25% de los clientes de la empresa, tiene un porcentaje de pago a personas jurídicas que ronda entre el 78 y el 100 porciento.

  • pagos_pn:

    • El 75% de los clientes tiene un porcentaje de pago a personas naturales que ronda entre el 20 y el 66.5 porciento.

    • También se puede observar que en promedio el porcentaje de pago a personas naturales está en el 44%.

    • Aproximadamente un 25% de los clientes de la empresa, tiene un porcentaje de pago a personas naturales que ronda entre el 0 y el 19 porciento.

  • tiene_ventas_fisicas: El 52.4% de los clientes no tiene ventas físicas, mientras que el 47.5% sí.

  • tiene_ventas_electronicas: Aproximadamente el 95% de los clientes no tiene ventas electrónicas.

  • recaudos_pj: El 93.2% de los clientes de la empresa no tienen ingresos provenientes de personas jurídicas. Aproximadamente el 0.8% de los clientes tienen todos sus ingresos de personas jurídicas.

  • recaudos_pn: El 92.1% de los clientes de la empresa no tiene ingresos provenientes de personas naturales. Aproximadamente el 2% de los clientes tienen todos sus ingresos de personas naturales.

  • rotacion_inventarios: Un poco más del 20% de los clientes se encuentra en el nivel de rotación más lento de inventario en días (nivel 6). Aproximadamente el 48% de los clientes se encuentra en el nivel de rotación más rápido (nivel 1 y 2).

  • rotacion_cxc: Aproximadamente el 55% de los clientes tiene una velocidad alta (nivel 1 y 2) para cobrar sus cuentas.

  • rotacion_cxp: Aproximadamente el 65% de los clientes tiene una velocidad alta (nivel 1 y 2) para pagar sus cuentas.

  • ciclo_negocio: El 45% de los clientes tiene un ciclo de negocio lento, es decir en los niveles más altos (5 y 6). Aproximadamente el 23% de los clientes tiene un ciclo de negocio nivel 4, es decir medio-lento.

  • ciclo_financiero: El 45% de los clientes tiene un ciclo de financiero lento, es decir en los niveles más altos (5 y 6).

A continuación se pueden observar las características financieras de un cliente promedio.

Matriz de correlaciones entre las variables financieras

  • Se observa una relación inversamente proporcional entre las variables pagos_pj y pagos_pn, con una correlación de 0.88.

  • Se observa una buena relación lineal entre las variables rotacion_inventarios y ciclo_negocio, con un coeficiente de correlación de 0.77.

  • Se observa una relación positiva buena entre ciclo_negocio y ciclo_financiero, con un coeficiente de correlación del 0.77.

  • Se observa una relación moderada entre rotacion_inventarios y ciclo_financiero, con una correlación de 0.65.

  • Se observa una relación moderada entre ciclo_negocio y rotacion_cxc, con una correlación de 0.59.

  • Se observa una relación positiva grande entre impo_cv y expo_vt, con una correlación de 0.87.

  • Se observa una relación positiva moderada entre totalinventory y cxp, con una correlación de 0.58.

  • Se observa una relación positiva moderada entre totalinventory y cxc, con una correlación de 0.52.

  • Se observa una relación positiva moderada entre cxp y cxc, con una correlación de 0.68.

Segmentación

Procedimientos para llegar a la segmentación

Ya que se tuvo una exploración de las diferentes variables de canales y financieras, se pudo comprender que el comportamiento de los clientes en este tipo de variables es muy particular, ya que las variables asociadas a los canales ayudan a entender mejor como usa el cliente la compañía y las variables financieras muestran que necesita el cliente de la compañía a partir de sus características. Por este motivo se considera que los procedimientos de segmentación de clientes se deben hacer de manera independiente entre las variables de los canales y las variables financieras, dado que se espera que salgan grupos muy diferentes realizando la segmentación mediante estos dos tipos de variables debido a que cada una estudia perspectivas muy diferentes del cliente. Se concilió entonces, realizar el proceso de segmentación por un tipo de variable y luego realizar subgrupos por el otro tipo de variable a partir de los grupos creados inicialmente.

Las variables de los canales son variables cuantitativas que en general tienen valores extremos, al ser utilizados en la segmentación pueden crear un gran impacto en los grupos resultantes, dado que el algoritmo que se usa “K-means” es muy sensible a observaciones extremas, por lo tanto para solucionar este problema se decide realizar una transformación logaritmo natural sobre las variables asociadas a los canales.

(¿Por qué realizar la transformación de logaritmo natural?)

Además de ello el algoritmo de segmentación K-means es muy sensible a las unidades de las diferentes variables dado que está basado en distancias, por lo tanto, así se aplique una transformación logaritmo natural, se deben escalar las variables para que todas puedan ser comparadas entre sí y los resultados sean estadísticamente válidos.

¿Por qué escalar las variables para realizar las agrupaciones?

Introducción Kmeans

Dado que en nuestra base de datos no existe una variable respuesta específica que se desee predecir, una forma relativamente rápida de detectar patrones y determinar características similares entre los clientes es la clasificación no supervisada o análisis de agrupamiento (clustering).

En este caso se utiliza el algoritmo de agrupación K-means, el cual consiste en que para un conjunto de datos de variables numéricas se repiten una serie de pasos hasta asignar cada observación a uno de k grupos donde la distancia a la media del grupo sea la más corta.

Procedimiento de segmentación 1

En este caso, se decide realizar una segmentación mediante las variables asociadas a los canales y en cada uno de los grupos que se obtengan a partir de esta se va a realizar una segmentación adicional (subgrupos) teniendo en cuenta las variables financieras, de tal manera que cada grupo final se caracterice por tener un comportamiento particular tanto en las variables de los canales como en las variables financieras.

A continuación se presenta el procedimiento desarrollado realizando una segmentación con todas las variables asociadas a los canales, primero se les aplica logaritmo natural y luego se escalan, posteriormente en cada uno de los grupos resultantes se realiza una subagrupación solo teniendo en cuenta las variables financieras:

  • Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar
library(ggdendro)
library(ggplot2)
require(factoextra)

dendrogram <- hclust(dist(Canal_log_scaled, method = 'euclidean'), method = 'ward.D')


plot(dendrogram, xlab="", sub="", cex=0.9)
rect.hclust(dendrogram, k=2, border="cyan4")

  • Del gráfico se concluye adecuado considerar dos grupos.

Agrupamiento k means con las variables de los canales (usando transformación logaritmo natural):

require(cluster)

set.seed(93285)
Agru_canal<- kmeans(Canal_log_scaled, 2 , nstart = 5, iter.max = 100)

clusplot(Canal_log_scaled, Agru_canal$cluster, color = TRUE, 
          shade = FALSE, labels = 4, lines = 1, 
          col.clus = c("darkgreen", "darkblue"),
          col.p = ifelse(Agru_canal$cluster == 2, "darkblue","darkgreen"), 
          main = "Grupos seleccionados de canales mediante K-means", 
          xlab = "Componente principal 1 canales",
          ylab = "Componente principal 2 canales",
          sub = "")
grid()

En el gráfico anterior se puede observar una representación en dos dimensiones de los grupos encontrados por K-means.

  • Se agrega la variable que indica el grupo al conjunto de datos
grupos <- as.factor(Agru_canal$cluster) # Se extraen los grupos

# Se agrega a los canales la variable grupo
canal_group <- data.frame(grupos, Canal_no_scaled)
grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros
2 0 0 0 0 0 0 0 0 0 0 0 0.000000 0.000000 0.000000 0.00000 0.000000 0.00 0.00 0.0 0 0 0 0 0 0 0 0.000000 0.00000 0 0.00000
2 0 0 0 0 0 0 0 0 0 0 0 0.000000 0.000000 0.000000 0.00000 0.000000 0.00 0.00 0.0 0 0 0 0 0 0 0 0.000000 0.00000 0 0.00000
1 250927493 54160892 5122152 41852510 413614315 1663236 2106847525 0 0 0 0 24.416667 11.916667 3.333333 237.83333 2.545454 5.40 8.25 0.0 0 0 0 413614315 2265361194 0 0 2.545454 613.08333 0 0.00000
2 39402360 96468998 8226710 0 0 7072802 0 9000000 0 0 0 14.416667 13.833333 4.600000 0.00000 0.000000 2.80 0.00 1.0 0 0 0 0 60558440 0 0 0.000000 10.33333 0 0.00000
1 337432319 234217927 105344054 15755287 0 23671840 0 3600962 3727299 0 0 153.583333 42.250000 102.416667 49.33333 0.000000 18.00 0.00 2.2 4 0 0 0 0 0 622080714 0.000000 0.00000 0 53.41667
2 33629514 42883291 1348792 0 0 3828360 0 0 687244 0 0 7.416667 8.833333 1.000000 0.00000 0.000000 1.25 0.00 0.0 1 0 0 0 1960611436 0 0 0.000000 90.00000 0 0.00000


  • Valor medio de cada variable en canal discriminada por grupo
grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros
1 3052845467 7729555004 341362868 739955168 3565396603 209593817 1818052483 49189977 21137779 1674443.75 446423983 1070.02973 199.51983 1467.68709 4438.3730 9.2530307 31.586029 12.753469 35.8568139 17.9665620 0.2710424 1160.916608 3571259229 8316097293 21876763.03 1507134.75 9.2788245 1205.3505 4.286158 1.4486338
2 239299231 1498440969 5102830 28758148 175670136 7638942 54804920 1544850 816903 60337.35 2402784 20.28635 17.70836 50.76329 181.7786 0.9116181 1.810945 1.186824 0.6407367 0.5766897 0.0084034 9.418356 157664225 986508168 17207.66 94969.53 0.8896961 169.8572 0.030042 0.1675477


  • Número de clientes en cada uno de los grupos
Grupo Número de clientes
1 1281
2 952


El grupo 1 cuenta con 1281 clientes y el grupo 2 con 952 clientes, en general el grupo 1 tiene a los clientes que tienden a manejar montos más altos de dinero y mayor número de transacciones por todos los canales en comparación con los del grupo 2.

  • Los gráficos son de las variables de los canales en escala logaritmo natural

  • En términos generales, se puede observar que el grupo 1 presenta en promedio un monto y un número mayor de transacciones.

  • Se puede notar una mayor dispersión del grupo 2 en los canales de entrada 3, 6, 8, y 9 y en el grupo1 en el canal otros.

  • En general en los canales de entrada asociados al número de transacciones el grupo 1 presenta una mayor dispersión, en parte debido a una mayor cantidad de valores extremos.

  • En los canales de salida, tanto para montos como para transacciones, el grupo 1 parece estar más disperso en el canal 5, mientras que el grupo 2 lo está en el canal 2, en el resto de canales el comportamiento es similar aunque el grupo 1 presenta más valores extremos.


Se ingresa la variable que indica los grupos a los conjuntos de datos escalados y sin escalar, adicional a eso se crear sub bases de datos para cada uno de los grupos para ser utilizados en los siguientes pasos de segmentación

df_scaled_group <- data.frame(grupos, Canal_log_scaled, finan_scaled) #conjunto de datos escalados

#Separacion de los grupos formados, variables escaladas
grupo1_scaled <- df_scaled_group[df_scaled_group$grupos==1,]
grupo2_scaled <- df_scaled_group[df_scaled_group$grupos==2,]

#conjunto de datos original mas la variable grupos
df_group <- data.frame(grupos,df)

#Separacion de los grupos formados, variables sin escalar
grupo1_no_scaled <- df_group[df_group$grupos==1,]
grupo2_no_scaled <- df_group[df_group$grupos==2,]

#Logaritmo natural en las variables de los canales
df_group_log <- df_group
df_group_log[, 2:31] <- log(df_group[, 2:31] + 1)

#Media de los grupos, canales escala-log natural
media_df_grupcanal <-  aggregate(.~grupos,data=df_group_log, FUN=mean)


Análisis del valor medio de los grupos en cada variable


Gráfico de los grupos en las variables de los canales

De la gráfica anterior, se puede ver que en general hay un comportamiento similar entre ambos grupos, sin embargo, el grupo 1 presenta un monto y un número mayor de transacciones promedio. Siendo la diferencia más amplia en los canales de entrada 3, 5, 6, 8, 9 y en los canales de salida 5 y 2.


media de los grupos mediante las variables financieras


El grupo 1 maneja montos de dinero y número de transacciones promedio más grandes en los canales, a su vez, se pueden observar valores promedios más grandes en las cuentas por pagar, cuentas por cobrar y en el total de inventario y aunque el número de importaciones y exportaciones promedio es mayor que la del grupo 2, la diferencia es muy pequeña, además el grupo 1 tiende a tener una mayor proporción de tiendas físicas. En las demás variables el comportamiento promedio es bastante similar.

Se crean subgrupos mediante las variables financieras para cada grupo creado con canales

  • Agrupamiento por variables financieras para el grupo 1 de canales:

  • Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar

dendrogram <- hclust(dist(grupo1_scaled[,32:47], method = 'euclidean'), method = 'ward.D')

plot(dendrogram, xlab="", sub="", cex=0.9)
rect.hclust(dendrogram, k=3, border="cyan4")

Del dendograma anterior se concluye considerar 3 subgrupos.

Subagrupamientos mediante las variables de estados financieros usando k-means :

set.seed(9325)
kc1 <- kmeans(grupo1_scaled[,32:47], 3 , nstart = 5, iter.max = 100)

clusplot(grupo1_scaled[,32:47], kc1$cluster, color = TRUE, 
          shade = FALSE, labels = 4, lines = 1,
          col.clus = c("#46EB65", "#206B2E", "#B2F768"),
          col.p = sapply(kc1$cluster, get_color_grupo1), 
          main = "Subgrupos del grupo 1 de canales mediante K-means", 
          xlab = "Componente principal 1 canales",
          ylab = "Componente principal 2 canales",
          sub = "")
grid()

Grupo Número de clientes
1 620
2 180
3 481

Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables financieras

canal1_finan <- data.frame(sub_grupos=kc1$cluster, grupo1_no_scaled)
canal1_finan$sub_grupos <- as.factor(canal1_finan$sub_grupos)
sub_grupos grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
3 3 1 250927493 54160892 5122152 41852510 413614315 1663236 2106847525 0 0 0 0 24.41667 11.91667 3.333333 237.83333 2.545454 5.400000 8.25 0.00000 0.000000 0 0 413614315 2265361194 0 0 2.545454 613.083333 0 0.00000 1 1 3 1 2 0.456 0.544 1 0 0 0 2 1 2 2 1
5 3 1 337432319 234217927 105344054 15755287 0 23671840 0 3600962 3727299 0 0 153.58333 42.25000 102.416667 49.33333 0.000000 18.000000 0.00 2.20000 4.000000 0 0 0 0 0 622080714 0.000000 0.000000 0 53.41667 1 1 2 2 2 1.000 0.000 1 0 0 0 2 2 1 3 3
11 3 1 1595455311 819040616 19735057 43250553 370619782 25252000 0 579077 1571573 11538300 0 221.58333 84.41667 31.083333 60.33333 17.000000 8.333333 0.00 1.00000 1.545454 1 0 666678118 138832642 0 0 24.916667 9.083333 0 0.00000 1 1 1 2 2 0.741 0.259 1 0 0 0 2 2 1 3 4
12 3 1 4219657307 1766126975 2012687388 0 0 75341542 1077317025 5962060 34572613 0 0 1065.75000 154.08333 1748.916667 0.00000 0.000000 19.583333 23.25 1.62500 22.111111 0 0 0 3383677202 0 0 0.000000 1664.166667 0 0.00000 2 2 6 4 4 0.062 0.938 1 0 0 0 1 1 1 2 2
13 1 1 562511318 2580633323 7018899 71462637 884650876 59098871 0 30779975 6163143 0 0 98.33333 248.91667 6.500000 31.58333 6.916667 21.083333 0.00 33.50000 2.666667 0 0 879750000 1085327718 543500 0 6.000000 466.500000 2 0.00000 4 2 3 3 3 0.519 0.481 1 0 0 0 5 3 4 5 5
15 3 1 2245281836 3328117603 81091841 0 23609691 134484842 0 24676625 6843971 0 0 725.41667 236.58333 80.666667 0.00000 1.900000 67.416667 0.00 11.91667 6.888889 0 0 23472526 3771666763 0 15000000 1.800000 391.416667 0 1.00000 2 2 2 4 2 0.386 0.614 0 0 0 0 2 3 1 4 5
canal1_finan_log <- canal1_finan
canal1_finan_log[, 3:32] <- log(canal1_finan_log[, 3:32] + 1)

media_canal1_finan <-  aggregate(.~sub_grupos,data=canal1_finan_log, FUN=mean)


Análisis del valor medio de los grupos en cada variable


De la grafica presentada previamente se espera que los tres grupos tengan un comportamiento y valores promedios muy similares, dado que está siendo graficada en las variables asociados a los canales y estos sub grupos fueron hallados a partir del grupo 1 de las variables de los canales, por lo tanto se espera que estos tres grupos tengan sus diferencias en las variables financieras pero sean muy similares en los canales.

  • Los tres grupos toman valores promedios diferentes en las distintas variables financieras, lo que indica la diferencia esperada ellas.

  • El sub-grupo 1 del grupo 1 tiende a tener el mayor número promedio de importaciones, exportaciones, inventarios y además de ello es al que le toma más tiempo realizar las rotaciones de inventarios, rotaciones de cuenta por cobrar y pagar y realizar los ciclos de negocio y financieros. En los pagos y recaudos a personas jurídicas y naturales tiende a tener porcentajes bajos.

  • El sub-grupo 2 del grupo 1 en comparación a los otros grupos, tiende a tener un número promedio o intermedio de importaciones, exportaciones, inventarios, al igual que las rotaciones de inventarios, rotaciones de cuentas por cobrar y pagar y tiempos promedios en la realización de los ciclos de negocio y financiero, pero cabe aclarar que es el que tiene mayor número promedio de cuentas por cobrar y cuentas por pagar, pagos a personas jurídicas y naturales, recaudos a personas jurídicas y naturales, además que es el que cuenta con mayor número de tiendas físicas y electrónicas.

  • El sub-grupo 3 del grupo 1 es el que en general tiende a tener menores niveles promedios en todas las variables financieras, es decir es el que realiza menos importaciones, exportaciones, tiene menor número de cuentas por cobrar y por pagar, menores inventarios, le toma menos tiempo realizar las rotaciones de inventarios, rotaciones de cuenta por cobrar y pagar y realizar los ciclos de negocio y financieros. En los pagos y recaudos a personas jurídicas y naturales tiende a tener porcentajes bajos.


  • Agrupamiento por variables financieras para el grupo 2 de canales:

  • Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar

dendrogram <- hclust(dist(grupo2_scaled[, 32:47], method = 'euclidean'), method = 'ward.D')

plot(dendrogram, xlab="", sub="", cex=0.9)

Del dendograma anterior se concluye considerar 3 subgrupos.

Subagrupamientos mediante las variables de estados financieros usando k-means :

set.seed(9326)
kc2 <- kmeans(grupo2_scaled[, 32:47], 3, nstart = 5, iter.max = 100)

clusplot(grupo2_scaled[,32:47], kc2$cluster, color = TRUE, 
          shade = FALSE, labels = 4, lines = 1,
          col.clus = c("#0688AC", "#0669AC", "#000080"),
          col.p = sapply(kc2$cluster, get_color_grupo2), 
          main = "Subgrupos del grupo 2 de canales mediante K-means", 
          xlab = "Componente principal 1 canales",
          ylab = "Componente principal 2 canales",
          sub = "")
grid()

Grupo Número de clientes
1 314
2 274
3 364

Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables financieras

canal2_finan <- data.frame(sub_grupos=kc2$cluster, grupo2_no_scaled)
canal2_finan$sub_grupos <- as.factor(canal2_finan$sub_grupos)
sub_grupos grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 2 2 0 0 0 0 0 0 0 0e+00 0 0 0 0.000000 0.000000 0.0 0 0 0.00 0 0 0 0 0 0 0 0 0 0 0.000000 0 0 1 1 6 6 6 0.000 0.000 0 0 0 0 6 2 2 5 6
2 3 2 0 0 0 0 0 0 0 0e+00 0 0 0 0.000000 0.000000 0.0 0 0 0.00 0 0 0 0 0 0 0 0 0 0 0.000000 0 0 1 1 2 6 2 1.000 0.000 0 0 0 0 1 3 1 3 4
4 1 2 39402360 96468998 8226710 0 0 7072802 0 9e+06 0 0 0 14.416667 13.833333 4.6 0 0 2.80 0 1 0 0 0 0 60558440 0 0 0 10.333333 0 0 2 2 1 1 1 0.615 0.385 1 0 0 0 5 2 3 5 5
6 1 2 33629514 42883291 1348792 0 0 3828360 0 0e+00 687244 0 0 7.416667 8.833333 1.0 0 0 1.25 0 0 1 0 0 0 1960611436 0 0 0 90.000000 0 0 1 1 1 3 1 0.590 0.410 0 0 0 0 1 4 1 5 5
7 1 2 373650131 1383138437 0 0 0 0 0 0e+00 0 0 0 1.333333 1.000000 0.0 0 0 0.00 0 0 0 0 0 0 604532004 0 0 0 3.833333 0 0 1 1 1 4 1 1.000 0.000 0 0 0 0 2 4 1 6 6
8 1 2 0 0 0 0 0 0 0 0e+00 0 0 0 0.000000 0.000000 0.0 0 0 0.00 0 0 0 0 0 0 0 0 0 0 0.000000 0 0 2 2 2 1 6 0.000 0.000 0 0 0 0 6 1 1 6 6
canal2_finan_log <- canal2_finan
canal2_finan_log[, 3:32] <- log(canal2_finan_log[, 3:32] + 1)

media_canal2_finan <-  aggregate(.~sub_grupos,data=canal2_finan_log, FUN=mean)


Análisis del valor medio de los grupos en cada variable


De la gráfica presentada previamente se espera que los tres grupos tengan un comportamiento y valores promedios muy similares, dado que esta siendo graficada en las variables asociados a los canales y estos sub grupos fueron hallados a partir del grupo 2 de las variables de los canales, por lo tanto se espera que estos tres grupos tengan sus diferencias en las variables financieras pero muy similares en los canales.

  • Los tres grupos toman valores diferentes en las distintas variables financieras, lo que indica la diferencia esperada en estas variables.

  • El sub-grupo 1 del grupo 2 tiende a tener un número promedio intermedio de importaciones, pocas exportaciones, tiene la menor cantidad de cuentas por pagar, y una cantidad promedio de inventario, además es el grupo que le toma mayor tiempo realizar las rotaciones de inventarios, realizar los ciclos de negocio y financieros, pero para realizar las rotaciones de cuentas por cobrar y pagar si toma valores más intermedios.

  • El sub-grupo 2 del grupo 2 es el que realiza mayor número promedio de importaciones y exportaciones, el que más cuenta por pagar y cobrar tiene, además de mayor inventario, además el que le toma mayor tiempo de hacer las rotaciones de cuentas por cobrar y pagar, pero tiene un número intermedio de rotaciones de inventario, ciclo de negocio y financiero.

  • El sub-grupo 3 del grupo 2 es el que tiene menor número promedio de importaciones y exportaciones, el que menos cuentas por cobrar tiene, además de la menor cantidad de inventario, por otro lado también es el que le tarda menos tiempo realizar las rotaciones de inventario, de cuentas por cobrar y pagar, de realizar su ciclo de negocio y financiero.

En general, los tres grupos tienen un comportamiento muy similar en los pagos y recaudos a personas naturales y jurídicas y en las ventas físicas y electrónicas.


Grupos finales

Dado que en los procedimientos anteriores se obtuvieron grupos y subgrupos, ahora llega el momento de crear los 6 grupos resultates, que consiste en la combinación de un grupo y subgrupo respectivamente:

  • Grupo 1: grupo 1 subgrupo 1

  • Grupo 2: grupo 2 subgrupo 1

  • Grupo 3: grupo 1 subgrupo 2

  • Grupo 4: grupo 2 subgrupo 2

  • Grupo 5: grupo 1 subgrupo 3

  • Grupo 6: grupo 2 subgrupo 3

Grupo1 <- canal1_finan[canal1_finan$sub_grupos==1,] # grupo 1 subgrupo 1
Grupo2 <- canal2_finan[canal2_finan$sub_grupos==1,] # grupo 2 subgrupo 1

Grupo3 <- canal1_finan[canal1_finan$sub_grupos==2,] # grupo 1 subgrupo 2
Grupo4 <- canal2_finan[canal2_finan$sub_grupos==2,] # grupo 2 subgrupo 2

Grupo5 <- canal1_finan[canal1_finan$sub_grupos==3,] # grupo 1 subgrupo 3
Grupo6 <- canal2_finan[canal2_finan$sub_grupos==3,] # grupo 2 subgrupo 3
Grupos sub_grupos grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
13 1 1 1 562511318 2580633323 7018899 71462637 884650876 59098871 0 30779975 6163143 0 0.0 98.33333 248.91667 6.500000 31.58333 6.916667 21.083333 0 33.500000 2.666667 0 0.000000 879750000 1085327718 543500 0 6.000000 466.50000 2 0 4 2 3 3 3 0.519 0.481 1 0 0 0 5 3 4 5 5
17 1 1 1 725985979 198904738 2095050 7776259 0 66321404 0 1001086 2078249 0 0.0 334.75000 103.50000 3.000000 75.75000 0.000000 35.000000 0 1.333333 2.571429 0 0.000000 0 0 655796 0 0.000000 0.00000 1 0 2 2 4 3 3 1.000 0.000 1 0 0 0 5 3 4 5 3
18 1 1 1 139004747 511972974 6543537 0 131595000 23781330 0 2147531 3050469 0 729333.3 44.75000 43.33333 8.083333 0.00000 10.000000 7.583333 0 1.666667 2.200000 0 1.666667 131595000 380759976 0 0 10.000000 95.16667 0 0 2 2 4 4 2 0.465 0.535 1 0 0 0 2 4 4 5 3
23 1 1 1 547670088 780003007 103800 0 164250000 8628001 0 1444293 5310911 0 0.0 153.33333 32.83333 1.000000 0.00000 3.250000 7.333333 0 1.400000 3.000000 0 0.000000 164250000 338676699 0 0 3.250000 161.83333 0 0 4 3 2 2 2 0.545 0.455 0 0 0 0 3 2 1 4 5
29 1 1 1 4214600209 14652219803 0 0 0 35419087 0 1244861 22856725 0 0.0 180.50000 208.25000 0.000000 0.00000 0.000000 6.750000 0 1.285714 6.125000 0 0.000000 0 4969060033 0 0 0.000000 743.25000 0 0 3 3 6 6 6 0.556 0.444 0 0 0 0 2 2 2 3 3
32 1 1 1 483638884 5747664945 1922929 0 489273201 2280598 0 5633280 0 0 0.0 14.75000 37.00000 3.333333 0.00000 5.818182 2.083333 0 3.750000 0.000000 0 0.000000 489273201 4255561086 0 0 5.818182 2020.66667 0 0 1 1 4 6 5 0.242 0.758 0 0 0 0 2 4 1 5 5
  • Media de los grupos en escala logaritmo natural
media_canal_finan <- aggregate(.~Grupos,data=Datos_finales_2_log, FUN=mean)
Grupos sub_grupos grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 1 1 20.62671 21.36412 13.969176 7.031524 14.179269 17.380415 1.9188680 15.347292 14.784769 2.2450482 2.9910592 5.158614 4.609525 2.1463349 1.8958918 1.4183542 2.8214675 0.3289200 1.8287538 1.7223956 0.1263417 0.3398891 12.925479 19.38101 3.3362808 0.9223333 1.3266969 5.171773 0.2053072 0.1331201 2.691936 2.058064 3.509677 4.248387 4.551613 0.5344919 0.4655177 0.6274194 0.0548387 0.0000000 0.0000000 4.324193 2.820968 2.522581 5.114516 4.840323
2 1 2 14.92309 15.96927 5.439582 1.385795 5.502098 9.530262 0.3574920 5.230636 4.814679 0.1835013 0.4606027 1.766027 1.843709 0.4573135 0.4113954 0.3903970 0.7534147 0.0539455 0.3472239 0.3128787 0.0088299 0.0573331 5.292840 10.68194 0.1677837 0.1502157 0.3742760 2.151425 0.0095405 0.0245366 1.789809 1.487261 1.598726 2.296178 3.101911 0.6807261 0.2778949 0.2292994 0.0031847 0.0033217 0.0094172 4.910828 2.630573 2.098726 5.506369 5.519108
3 2 1 21.26435 21.98867 15.641965 10.194780 16.922857 17.044089 2.4782814 15.828441 15.445928 4.9482314 15.9361051 6.264393 4.935818 3.8750220 3.1303593 1.8047643 2.9863085 0.4414890 2.5563453 2.4552314 0.3266266 3.4759957 16.346957 20.02152 4.6139827 1.0880111 1.7329102 5.796234 0.3454697 0.1470273 2.161111 1.805556 3.811111 4.566667 4.144444 0.4180667 0.5708278 0.8000000 0.2222222 0.2993000 0.7007056 2.994444 2.511111 2.188889 4.144444 3.922222
4 2 2 12.91468 15.65103 3.882146 1.602786 3.660869 7.630762 0.3354473 4.047007 3.781144 0.0970900 0.4079981 1.714209 2.126816 0.3890634 0.3696535 0.2667819 0.6684314 0.0379376 0.2492797 0.2656895 0.0050595 0.1019710 3.685069 10.52793 0.0000000 0.0000000 0.2640769 2.389335 0.0000000 0.0000000 2.291971 1.905110 4.313869 5.208029 3.832117 0.5322518 0.3947555 0.3248175 0.0072993 0.0029416 0.0080073 2.671533 3.244525 2.784671 4.664234 3.912409
5 3 1 20.23728 20.82283 14.928898 7.951284 14.023858 16.737418 4.2352904 14.123707 13.993880 2.2844697 2.2296256 4.765049 4.247755 2.6590943 2.3829307 1.3490087 2.3685181 0.6990190 1.5190768 1.5318180 0.1210826 0.2882516 13.622001 19.57101 2.1915166 0.7273944 1.3416784 5.365092 0.1565833 0.1234573 1.536382 1.474012 2.613306 3.045738 2.659044 0.4533805 0.5466279 0.5883576 0.0644491 0.0000000 0.0000000 1.808732 1.792100 1.744283 2.898129 2.869023
6 3 2 14.50667 16.53760 6.419857 1.762271 4.776193 8.077886 0.8606253 4.300313 4.447364 0.0839637 0.6333574 1.837737 2.078010 0.6610193 0.5812790 0.3395345 0.6857621 0.1485779 0.2753460 0.3125649 0.0038085 0.1399942 4.578650 11.33980 0.2270761 0.3819650 0.3243986 2.677433 0.0194339 0.0584544 1.530220 1.447802 2.010989 2.118132 1.736264 0.6039780 0.3685577 0.2335165 0.0109890 0.0036841 0.0155467 1.489011 1.664835 1.818681 2.469780 2.346154


Análisis del valor medio de los grupos en cada variable


Variables de los canales

  • En general los grupos 1, 3 y 5 son los que manejan en promedio mayores montos de dinero y mayor número de transacciones, por lo tanto los grupos 2, 4 y 6 son los que manejan en promedio menores montos de dinero y menor número de transacciones.

  • El grupo 3 a pesar de tener un comportamiento de manejar mayores montos en promedio de dinero al igual que el grupo 1 y 5, este se destaca particularmente en el canal de entrada de otros, dado que toma valores muy altos, más que cualquiera de los otros grupos.

Variables financieras

  • Los grupos 1, 3 y 4 son los que realizan mayor número promedio de importaciones y exportaciones, tiene mayor número promedio de cuentas por pagar y cobrar y mayor inventario, por otro lado los grupos 2, 5 y 6 son los que realizan menor número promedio de importaciones y exportaciones, tienen menor número promedio de cuentas por pagar y cobrar y menor inventario, pero respecto al inventario el grupo 2 es el que tiene más en comparación con los grupos 5 y 6 a pesar de que es el que tiene menor número promedio de cuentas por pagar.

  • En general todos los grupos presentan mayor número promedio de ventas físicas que electrónicas, además el grupo 3 es el que presenta mayor promedio de pagos a personas naturales, mayor número promedio de ventas físicas y electrónicas y mayor número promedio de recaudos a personas jurídicas y naturales. El grupo 2 y 6 es el que realiza mayor proporción de pagos a personas jurídicas, pero son los que realizan menor proporción de pagos a personas naturales, tiene la menor cantidad de ventas físicas y electrónicas, además de los menores recaudos a personas jurídicas y naturales. Los grupos 1, 4 y 5 toman valores intermedios.

  • Los grupos 1 y 2, los grupos 3 y 4 y los grupo 5 y 6 tienen comportamientos muy similares en las rotaciones de inventario, de cuentas por cobrar y pagar y en los ciclos de negocio y financieros, en donde los grupos 5 y 6 son a los que les toma menos tiempo promedio realizar estas rotaciones y ciclos, al los grupos 1 y 2 les toma mayor tiempo promedio realizar las rotaciones de inventario y hacer los ciclos de negocio y financiero, por otro lado el grupo 4 es al que más tiempo promedio le toma realizar las rotaciones de cuentas por cobrar y pagar.

En general así los grupos se parezcan entre sí, estos se diferencian en algo, ya sea en las variables financieras o en los canales.

Conclusión general de los grupos formados

  • Grupo 1: es de los que tiende a manejar mayores montos de dinero y mayor número de transacciones a través de los canales, además de ser el grupo que mayores importaciones y exportaciones realiza, tiene buena cantidad de cuentas por cobrar y pagar,además de una gran cantidad de inventarios, maneja muchas ventas físicas, se demora más rotando el inventario y realizando su ciclo de negocio y financiero, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas grandes, de productos, por ello manejan mucho inventario y se demoran mucho para rotarlo, además de que venden y compran productos al exterior.

  • Grupo 2: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, realiza pocas importaciones y exportaciones, tiene pocas cuentas por pagar y aunque tiene más cuentas por cobrar, no se consideran altas, tiene un inventario de nivel intermedio, es el grupo que tiene mayor porcentaje de pagos a personas jurídicas que a personas naturales, además de menores ventas físicas y electrónicas, es decir las menores ventas en general, por otro lado es el grupo que más se demora rotando el inventario y realizando su ciclo de negocio y financiero, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que quizás no están tan desarrolladas y están en un proceso de crecimiento, donde sus ventas no son las mejores y no tiene tanto contacto a nivel internacional.

  • Grupo 3: es el que tiene mayores montos de dinero y mayor número de transacciones a través de los canales, no tiene un nivel alto de importaciones y exportaciones, tiene relativamente un nivel alto en la cuentas por pagar, cuentas por cobrar e inventario, además es el que presenta mayor promedio de pagos a personas naturales, mayor número de ventas físicas y electrónicas y mayor número de recaudos a personas jurídicas y naturales y en general tiene un nivel promedio en las rotaciones y ciclos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas grandes que se mueven más a nivel nacional, tienen muchas ventas ya sean físicas o electrónicas y sus rotaciones de inventario y de cuentas al igual que sus ciclos no tienden a ser tan rápidos ni tan lentos (ejemplo: almacenes de cadena)

  • Grupo 4: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, tiene un nivel medio de importaciones y exportaciones y un nivel muy alto de cuentas por cobrar y pagar, también dispone de un nivel alto de inventario, su nivel de ventas es intermedio al igual que la rotación de inventario y ciclo de negocio y financiero y en comparación con los otros grupos es el que tiene las rotaciones de cuentas por cobrar y pagar más lenta, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que ofrecen un servicio o producto donde la forma de pago no es inmediata, como por ejemplo empresas que realizan pedidos o encargos, empresas distribuidores, etc.

  • Grupo 5: es de los que tiende a manejar mayores montos de dinero y mayor número de transacciones a través de los canales, tiene un nivel bajo de importaciones y exportaciones y un nivel intermedio de cuentas por cobrar, cuentas por pagar e inventario, también tiene un alto porcentaje de pagos a personas juridicas y naturales, además un buen porcentaje de ventas físicas y en general tiene rotaciones de inventario, rotaciones de cuentas y ciclos relativamente rápidos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que se encargan de distribuir productos nacionales, los cuales tienen un proceso de venta rápido, dado que el inventario no es grande ni pequeño pero tienden a realizar rotaciones en poco tiempo y por el hecho de manejar buen monto de dinero da la idea de ser una empresa grande o muy bien acreditada.

  • Grupo 6: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, tiene niveles bajos de importaciones, exportaciones, de cuentas por cobrar y pagar e inventario, tiene porcentajes altos de pagos a personas jurídicas y naturales y sus rotaciones de inventario, de cuentas y ciclos son rápidos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que en general se espera que no sean grandes y tiendan a ofrecer servicios a nivel nacional.

Comentario adicional:

Los valores extremos encontrados inicialmente en los canales son los siguientes:

“825, 1416, 1462, 1668, 1773”

Los cuales pertenecen al grupo:

“5, 3, 3, 1, 3” respectivamente lo cual significa que todos quedan en los grupos que más dinero mueven y más tranzan por los canales, por lo tanto la segmentación es confiable.


Conclusión:

En la segmentación (primero canales luego financieras) anterior se obtuvieron muy buenos resultados dado que se puede interpretar de manera acertada cada uno de los grupos formados, ahora se intenta realizar el proceso de segmentación con un procedimiento contrario (primero financieras luego canales) con el fin de observar si se obtienen grupos similares a los obtenidos hasta ahora, para mirar si hay consistencia con los análisis realizados y mirar si hay influencia alta de hacer los procedimientos en un orden específico.



Procedimiento de segmentación 2

A continuación se presenta el procedimiento desarrollado realizando una segmentación con todas las variables financieras, para ser ingresadas al algoritmo de segmentación siendo escaladas, posteriormente en cada uno de los grupos resultantes se realiza una subagrupación pero solo teniendo en cuenta las variables asociadas a los canales, a ellas se les aplica logaritmo natural y luego son escaladas:

  • Se utiliza agrupamiento jerarquico con la idea de conocer la cantidad de grupos que se deben considerar
library(ggdendro)
library(ggplot2)
require(factoextra)

dendrogram <- hclust(dist(finan_scaled, method = 'euclidean'), method = 'ward.D')


plot(dendrogram, xlab="", sub="", cex=0.9)
rect.hclust(dendrogram, k=3, border="cyan4")

  • Del gráfico se concluye adecuado considerar tres grupos.


  • Agrupamiento k means con las variables financieras:
set.seed(93284)
Agru_finan <- kmeans(finan_scaled, 3 , nstart = 5, iter.max = 100)

clusplot(finan_scaled, Agru_finan$cluster, color = TRUE, 
          shade = FALSE, labels = 4, lines = 1,
          col.clus = c("purple", "red", "blue"),
          col.p = sapply(Agru_finan$cluster, get_color),
          main = "Grupos seleccionados de financieras mediante K-means", 
          xlab = "Componente principal 1 canales",
          ylab = "Componente principal 2 canales",
          sub = "")

En el gráfico anterior se puede observar una representación en dos dimensiones de los grupos encontrados por K-means.

  • Se agrega la variable que indica el grupo al conjunto de datos
grupos <- as.factor(Agru_finan$cluster)

fina_group <- data.frame(grupos, finan_no_scaled)
grupos impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
2 1 1 6 6 6 0.000 0.000 0 0 0 0 6 2 2 5 6
3 1 1 2 6 2 1.000 0.000 0 0 0 0 1 3 1 3 4
3 1 1 3 1 2 0.456 0.544 1 0 0 0 2 1 2 2 1
1 2 2 1 1 1 0.615 0.385 1 0 0 0 5 2 3 5 5
3 1 1 2 2 2 1.000 0.000 1 0 0 0 2 2 1 3 3
3 1 1 1 3 1 0.590 0.410 0 0 0 0 1 4 1 5 5


  • Valor medio de cada variable financiera discriminada por grupo
grupos impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 2.278121 1.779975 1.991347 2.945612 3.500618 0.6264611 0.3537738 0.4252163 0.0395550 0.0087985 0.0394091 4.695921 2.758962 2.229913 5.360939 5.353523
2 2.386950 1.978756 5.036419 5.490137 4.820941 0.4388968 0.5337951 0.6084977 0.0773900 0.0636267 0.1199863 2.878604 2.789074 2.623672 4.358118 3.769347
3 1.474510 1.414379 2.098039 2.403922 1.952941 0.5334719 0.4521582 0.4143791 0.0379085 0.0104784 0.0339660 1.581699 1.717647 1.762091 2.624837 2.524183


  • Número de clientes en cada uno de los grupos
Grupo Número de clientes
1 809
2 659
3 765

El grupo 1 cuenta con 809 clientes y el grupo 2 con 659 clientes y el grupo 3 con 765 clientes.


  • Gráficos de barras para las variables categoricas y boxplots para las variables continuas

Grupo 1

  • impo_cv: El mayor número de observaciones tienen niveles de importación bajos, es decir el número de observaciones va disminuyendo a medida que aumenta el nivel de importaciones por lo que se podría decir que la mayoría tiende a importar menos, pero comparada con los demás grupos es el grupo en el que más observaciones se pueden encontrar en niveles de importación altos, ya que el cambio entre niveles es más leve.

  • expo_vt: la mayor cantidad se concentra en el nivel 2 de exportaciones, continuando con el nivel 1, formando más de un 80% de observaciones en los dos primeros niveles es decir niveles de exportaciones bajos pero comparado con el grupo 3 hay mayor cantidad de exportaciones.

  • cxp: Se acumulan en los primeros niveles, es decir tienden a tener un número menor de cuentas por pagar.

  • cxc: Tiende a estar alrededor de todos los niveles, pero la mayoría se encuentra en los primeros niveles indicando que el número de cuentas por cobrar no es tan alto.

  • total inventory: Están alrededor de todos los niveles, pero la mayoría tienden a estar en los niveles 2 y 3 indicando que su inventario no es ni muy alto ni muy bajo.

  • pagos_pj: En promedio tiene más pagos a personas jurídicas que los grupos 2 y 3.

  • pagos_pn: En promedio el grupo 1 tiene menos pagos a personas naturales.

  • tiene_ventas_fisicas: Es más frecuente encontrar que no tiene ventas físicas aunque no es mucha la diferencia con las que sí tienen tiendas físicas.

  • tiene_ventas_electronicas: Es más frecuente encontrar que no tienen ventas electrónicas.

  • recaudos_pj: La variable presenta muchos ceros, por lo tanto no se logra observar diferencias en los diferentes grupos.

  • recaudos_pn: La variable presenta muchos ceros, por lo tanto no se logra observar diferencias en los diferentes grupos.

  • rotacion_inventarios: La mayoría se acumula en el último nivel indicando que tiene una rotación lenta de inventarios.

  • rotacion_cxc: Están alrededor de todos los niveles, aunque tiende a crecer la frecuencia a medida que aumentan los niveles, quedando mayor cantidad en los niveles más altos, lo que quiere decir que la rotación de las cuentas por cobrar es más bien lenta.

  • rotacion_cxp: Están alrededor de todos los niveles, aunque su mayor frecuencia se observa en el nivel uno, indicando que rotan un poco rápido sus cuentas por pagar.

  • ciclo_negocio: se acumulan en los últimos niveles indicando que se demoran más completando un ciclo de negocio.

  • Ciclo_financiero: se acumulan en los últimos niveles indicando que se demoran más completando un ciclo financiero.

Grupo 2

  • impo_cv: alrededor del 50% tiene un nivel de importación de 2 y el resto se encuentra alrededor de este, en general tiene un nivel de importación que no es alto.

  • expo_vt: más del 70% se concentra en el nivel 2 de exportaciones lo que quiere decir que no tienen niveles de exportaciones ni altos ni bajos.

  • cpx: Se acumulan en los últimos niveles, es decir tienden a tener un número de cuentas por pagar alto.

  • cxc: Tienden a acumularse en los últimos niveles indicando que el número de cuentas por cobrar es muy alto.

  • total inventory: La mayoria se acumula en el último nivel (6) indicando que a final de año tienen un inventario muy alto.

  • pagos_pj: El grupo 2 presenta menor cantidad de pagos a personas jurídicas.

  • pagos_pn: El grupo 2 presenta mayor cantidad de pagos a personas naturales.

  • tiene_ventas_fisicas: Es más frecuente encontrar que tienen ventas físicas aunque no es mucha la diferencia con las que no tienen tiendas físicas.

  • tiene_ventas_electronicas: Es más frecuente encontrar que no tienen ventas electrónicas.

  • recaudos_pj: La variable presenta muchos ceros, por lo tanto no se logra observar diferencias en los diferentes grupos.

  • recaudos_pn: La variable presenta muchos ceros, por lo tanto no se logra observar diferencias en los diferentes grupos.

  • rotacion_inventarios: Tiende a estar alrededor de todos los niveles indicando que las rotaciones son muy variantes, aunque se podría decir que la mayoría está en los primeros niveles indicando que hay una rotación más o menos rápida.

  • rotacion_cxc: Están alrededor de todos los niveles, aunque tiende a crecer la frecuencia a medida que aumentan los niveles, quedando mayor cantidad en los niveles más altos, lo que quiere decir que la rotación de las cuentas por cobrar es más bien lenta.

  • rotacion_cxp: Están alrededor de todos los niveles, aunque su mayor frecuencia se observa en el nivel cuatro, indicando que rotan un poco más lento sus cuentas por pagar.

  • ciclo_negocio: la mayoria se acumula en el nivel 4 indicando que el ciclo de negocio es lento pero no tanto

  • ciclo_financiero: la mayoria se acumula en el nivel 5 indicando que el ciclo financiero es lento pero no tanto como para llegar al nivel 6

Grupo 3

  • impo_cv: El mayor porcentaje tiene un nivel de importación muy bajo, y a medida que aumentan los niveles de importación se presentan menor número de observaciones (disminuye el numero de observaciones bruscamente).

  • expo_cv: Lo niveles de exportaciones son muy bajos ya que más del 95% se acumula en los dos primeros niveles y en especial en el primer nivel son aproximadamente 60% lo que implica que en este grupo no se tiende mucho a exportar.

  • cxp: Se acumulan en los primeros niveles, es decir tienden a tener un número de cuentas por pagar bajo(Similar al primer grupo).

  • cxc: Tiende a estar alrededor de todos los niveles, pero la mayoría se encuentra en los primeros niveles indicando que el número de cuentas por cobrar no es tan alto.

  • total inventory: Tienden a acumularse en los dos primeros niveles indicando que el inventario a final del año es bajo.

  • pagos_pj: El grupo 3 presenta una proporción intermedia de pagos a personas jurídicas.

  • pagos_pn: El grupo 3 presenta una proporción intermedia de pagos a personas naturales.

  • tiene_ventas_fisicas: Es más frecuente encontrar que no tienen ventas físicas aunque no es mucha la diferencia con las que sí tienen tiendas físicas.

  • tiene_ventas_electronicas: Es más frecuente encontrar que no tienen ventas electrónicas.

  • recaudos_pj: La variable presenta muchos ceros, por lo tanto no se logra observar diferencias en los diferentes grupos.

  • recaudos_pn: La variable presenta muchos ceros, por lo tanto no se logra observar diferencias en los diferentes grupos.

  • rotacion_inventarios: La mayoria tiende a acumularse en los primeros niveles indicando que hay una rotación de inventarios rápida.

  • rotacion_cxc: Tienden a acumularse en los primero niveles indicando que la rotación de cuentas por cobrar es muy rápida.

  • rotacion_cxp: Tienden a acumularse en los primero niveles indicando que la rotación de cuentas por pagar es muy rápida.

  • ciclo_negocio: la mayoria se acumula entre los niveles 2 y 3 indicando que el ciclo de negocio es rápido pero no mucho

  • ciclo_financiero: la mayoria se acumula entre los niveles 2 y 3 indicando que el ciclo financiero es rápido pero no mucho

Conclusión general:

El Grupo 3 es el que realiza menos importaciones y el grupo 1 y 2 los que más realizan importaciones.

El grupo 3 es el que realiza menos exportaciones y el grupo 2 el que más realiza.

El grupo 1 y 3 tienen un número de cuentas por pagar pequeño en cambio el grupo 2 tiene muchas cuentas por pagar.

El grupo 1 y 3 tiene un número de cuentas por cobrar bajo, en cambio el grupo 2 tiene un número de cuentas por cobrar muy alto.

El grupo 2 es el que más tiene inventario a final de año y el grupo 3 el que menos inventario tiene.

El grupo 1 y 3 tiene menos ventas físicas y por el contrario el grupo 2 cuenta con más ventas físicas.

En los tres grupos no es frecuente encontrar ventas electrónicas.

El grupo 1 tiende a rotar el inventario muy lento en cambio el grupo 3 tiende a rotar muy rápido.

Las cuentas por cobrar de los grupos 1 y 2 rotan muy lento en cambio en el grupo 3 rotan muy rápido.

El grupo 1 y 3 tiende a rotar rápidamente las cuentas por pagar aunque es más rápido el 3 que el 1 y el grupo 2 tiende a rotar las cuentas por pagar más lento.

El grupo 1 tiene un ciclo de negocio muy lento, luego le sigue el grupo 2 con uno levemente lento y por último el grupo 3 tiene un ciclo de negocio levemente rápido.

El grupo 1 tiene un ciclo financiero muy lento, luego le sigue el grupo 2 con uno levemente lento y por último el grupo 3 tiene un ciclo financiero levemente rápido.

Conclusión final:

  • El grupo 2 parece ser de productos y el grupo 3 parece ser de servicios y el grupo 1 tiene características similares a los otros dos grupos

  • Grupos de las variables escaladas

Se ingresa la variable que indica los grupos a los conjuntos de datos escalados y sin escalar, adicional a eso se crear sub bases de datos para cada uno de los grupos para ser utilizados en los siguientes pasos de segmentación

df_scaled_group <- data.frame(grupos, Canal_log_scaled, finan_scaled) #Conjunto de datos de los grupos y las variables escaladas

#Separacion de los grupos con las variables escaladas
grupo1_scaled <- df_scaled_group[df_scaled_group$grupos==1,]
grupo2_scaled <- df_scaled_group[df_scaled_group$grupos==2,]
grupo3_scaled <- df_scaled_group[df_scaled_group$grupos==3,]

#Conjunto de datos con grupos y variables no escaladas
df_group <- data.frame(grupos, Canal_log, finan_no_scaled)

#Separacion de los grupos con variables no escaladas
grupo1_no_scaled <- df_group[df_group$grupos==1,]
grupo2_no_scaled <- df_group[df_group$grupos==2,]
grupo3_no_scaled <- df_group[df_group$grupos==3,]

#Media de los grupos de las variables no escaladas y canales en escala log natural
media_df_grupfin <- aggregate(.~grupos,data=df_group, FUN=mean)
grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 17.64340 18.52646 9.777666 4.175163 9.554957 13.49980 0.6747598 10.345271 10.18603 1.314108 2.021565 3.409504 3.141016 1.267002 1.044307 0.8594768 1.737475 0.1113207 1.0343611 1.0089556 0.0767454 0.2355005 8.930449 14.80173 1.573095 0.5755578 0.8181244 3.486120 0.0929623 0.0803012 2.278121 1.779975 1.991347 2.945612 3.500618 0.6264611 0.3537738 0.4252163 0.0395550 0.0087985 0.0394091 4.695921 2.758962 2.229913 5.360939 5.353523
2 18.82753 20.37895 11.843369 6.709735 12.644235 14.61977 2.7609071 12.459907 11.77298 2.424380 5.063670 4.675295 4.301098 2.315227 2.040148 1.2942204 2.379026 0.4947268 1.6723377 1.5786483 0.1406999 1.0290435 11.815006 17.67717 3.017707 0.6515043 1.2202590 5.048073 0.2031544 0.0962737 2.386950 1.978756 5.036419 5.490137 4.820941 0.4388968 0.5337951 0.6084977 0.0773900 0.0636267 0.1199863 2.878604 2.789074 2.623672 4.358118 3.769347
3 17.22134 18.46311 10.524046 4.883034 9.136597 12.23844 2.3857225 9.011967 8.94859 1.092086 1.712370 3.231076 3.048477 1.630493 1.487391 0.8159162 1.466728 0.3724958 0.8671028 0.8821876 0.0602645 0.2657522 8.935816 15.39395 1.081265 0.5343800 0.8127722 3.906261 0.0859817 0.0901387 1.474510 1.414379 2.098039 2.403922 1.952941 0.5334719 0.4521582 0.4143791 0.0379085 0.0104784 0.0339660 1.581699 1.717647 1.762091 2.624837 2.524183


Análisis del valor medio de los grupos en cada variable


Gráfico de los grupos en las variables financieras

  • Generalmente se observan comportamientos o valores promedios distintos entre los tres grupos conformados con las variables financieras, lo cual era de esperarse dado que la segmentación fue realizada solo con estas variables.

  • El grupo 2 es el que tiende a tener mayores niveles medios de importaciones, exportaciones, cuentas por cobrar y pagar e inventario en comparación con los demás grupos.

  • El grupo 1 y 3 tienen un nivel medio de cuentas por pagar muy similar, pero el grupo 1 tiene mayores importaciones, exportaciones, cuenta por cobrar e inventario que el grupo 3.

  • El grupo 1 y el grupo 3 tienen mayores proporciones de pagos a personas juridicas que naturales, en cambio el grupo 2 mayores proporciones pagos a personas naturales que juridicas.

  • Todos los grupos disponen de más ventas fisicas que electronicas.

  • Todos los grupos tienden a tener más recaudos a personas naturales que a juridicas.

  • La rotación de inventario promedio es más rápida para el grupo 3, luego para el grupo 2 y por último la más lenta para el grupo 1.

  • La rotación promedio de cuentas por cobrar y pagar para el grupo 1 y 2 es muy similar, en cambio para el grupo 3 estas rotaciones son muy rápidas.

  • El ciclo de negocio y financiero promedio es más rápido para el grupo 3, luego para el grupo 2 y por último el más lento para el grupo 1.

Gráfico de los grupos en las variables de los canales

  • En general los tres grupos tienen comportamientos muy similares en las variables asociadas a los canales, pero el grupo 2 es el que tiende a tener montos y número de transacciones promedio un poco mayores a los otros grupos en los diferentes canales.


Se crean subgrupos mediante las variables de los canales para cada grupo creado con las variables financieras

  • Agrupamiento por variables de canales para el grupo 1 de financieras:

  • Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar

dendrogram <- hclust(dist(grupo1_scaled[,2:31], method = 'euclidean'), method = 'ward.D')

plot(dendrogram, xlab="", sub="", cex=0.9)

  • Del gráfico se concluye adecuado considerar dos grupos.

Subagrupamientos mediante las variables asociadas a los canales usando k-means :

set.seed(932840)
kc1 <- kmeans(grupo1_scaled[,2:31], 2 , nstart = 5, iter.max = 100)

clusplot(grupo1_scaled[,2:31], kc1$cluster, color = TRUE, 
         shade = FALSE, labels = 4, lines = 1,
         col.clus = c("#F54830", "#C23927"),
         col.p = sapply(kc1$cluster, get_color_grupo1),
         main = "Subgrupos del grupo 1 de financieras mediante K-means", 
         xlab = "Componente principal 1 canales",
         ylab = "Componente principal 2 canales",
         sub = "" )
grid()

Grupo Número de clientes
1 526
2 283

Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables de los canales:

finan1_canal <- data.frame(sub_grupos=kc1$cluster, grupo1_no_scaled)
finan1_canal$sub_grupos <- as.factor(finan1_canal$sub_grupos)
sub_grupos grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
4 2 1 17.48934 18.38473 15.92290 0.00000 0.00000 15.77177 0 16.01274 0.00000 0 0 2.7354492 2.6968769 1.7227666 0.000000 0.000000 1.335001 0 0.6931472 0.000000 0 0 0.00000 17.91912 0.00000 0.00000 0.000000 2.427748 0.000000 0.0000000 2 2 1 1 1 0.615 0.385 1 0 0 0 5 2 3 5 5
7 2 1 19.73883 21.04762 0.00000 0.00000 0.00000 0.00000 0 0.00000 0.00000 0 0 0.8472979 0.6931472 0.0000000 0.000000 0.000000 0.000000 0 0.0000000 0.000000 0 0 0.00000 20.21997 0.00000 0.00000 0.000000 1.575536 0.000000 0.0000000 1 1 1 4 1 1.000 0.000 0 0 0 0 2 4 1 6 6
8 2 1 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0 0.00000 0.00000 0 0 0.0000000 0.0000000 0.0000000 0.000000 0.000000 0.000000 0 0.0000000 0.000000 0 0 0.00000 0.00000 0.00000 0.00000 0.000000 0.000000 0.000000 0.0000000 2 2 2 1 6 0.000 0.000 0 0 0 0 6 1 1 6 6
9 2 1 19.60858 19.02453 13.85348 17.87817 0.00000 0.00000 0 0.00000 15.59464 0 0 5.2631219 4.3459676 0.6931472 6.420402 0.000000 0.000000 0 0.0000000 1.871802 0 0 0.00000 0.00000 0.00000 0.00000 0.000000 0.000000 0.000000 0.0000000 2 2 3 1 4 1.000 0.000 1 0 0 0 6 1 4 6 5
13 1 1 20.14792 21.67130 15.76412 18.08469 20.60070 17.89472 0 17.24237 15.63410 0 0 4.5984812 5.5211275 2.0149030 3.483801 2.068970 3.094823 0 3.5409593 1.299283 0 0 20.59515 20.80515 13.20579 0.00000 1.945910 6.147399 1.098612 0.0000000 4 2 3 3 3 0.519 0.481 1 0 0 0 5 3 4 5 5
15 1 1 21.53210 21.92567 18.21109 0.00000 16.97717 18.71696 0 17.02137 15.73888 0 0 6.5881238 5.4705184 4.4026459 0.000000 1.064711 4.225617 0 2.5585185 2.065455 0 0 16.97134 22.05078 0.00000 16.52356 1.029619 5.972324 0.000000 0.6931472 2 2 2 4 2 0.386 0.614 0 0 0 0 2 3 1 4 5


  • Media de los grupos
media_finan1_canal <- aggregate(.~sub_grupos,data=finan1_canal, FUN=mean)
sub_grupos grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 1 19.94031 20.48836 13.094312 5.8857911 11.985258 16.705749 0.8272024 14.444786 14.216166 1.9883975 2.9903560 4.535871 3.991818 1.7902761 1.4590362 1.1312590 2.3897684 0.1369564 1.4965272 1.4598729 0.1167184 0.3384375 11.116358 17.804977 2.419455 0.8561827 1.0788502 4.425699 0.1429781 0.1195126 2.494297 1.895437 2.081749 3.100760 3.684411 0.5933783 0.4028251 0.5361217 0.0589354 0.0132833 0.0570589 4.709125 2.754753 2.216730 5.28327 5.330799
2 1 13.37422 14.87997 3.613156 0.9956914 5.037862 7.541045 0.3914212 2.725678 2.695383 0.0608364 0.2209152 1.315973 1.559667 0.2944157 0.2734687 0.3543268 0.5250866 0.0636727 0.1753527 0.1708549 0.0024493 0.0441759 4.867592 9.219717 0.000000 0.0539722 0.3335243 1.739765 0.0000000 0.0074207 1.876325 1.565371 1.823322 2.657244 3.159011 0.6879505 0.2626042 0.2190813 0.0035336 0.0004629 0.0066042 4.671378 2.766784 2.254417 5.50530 5.395760


Análisis del valor medio de los grupos en cada variable


  • De la gráfica anterior, se puede ver en general un comportamiento similar entre ambos grupos, sin embargo, el grupo 1 presenta un monto y un número de transacciones promedio mayor al del grupo 2. Siendo la diferencia más amplia en los canales de entrada 3, 6, 8, 9 y en los canales de salida 5 y 2.

  • Ambos grupos tienen comportamientos y valores muy similares, dado que ambos provienen del grupo 1 formado por las variables financieras, por lo tanto estos dos grupos se diferencian en las variables de los canales, incluso, las pocas diferencias que se perciben en estas variables financieras, puede deberse a que el grupo 1 es el que tiende a tener mayores montos de dinero y hacer mayor número de transacciones a través de todos los canales, por lo que se percibe la relación que entre más dinero, mayores niveles de importaciones, exportaciones, cuentas por cobrar, pagar e inventario se van a realizar.


  • Agrupamiento por variables de canales para el grupo 2 de financieras:

  • Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar

dendrogram <- hclust(dist(grupo2_scaled[,2:31], method = 'euclidean'), method = 'ward.D')

plot(dendrogram, xlab="", sub="", cex=0.9)

  • En un inicio, del gráfico anterior se concluyó considerar 3 grupos. Sin embargo, después de realizar los agrupamientos mediante K-means se observó que dos de los grupos presentaban un comportamiento medio muy similar que hacia difícil su diferenciación. Por este motivo se decidió considerar únicamente 2 agrupaciones.

Subagrupamientos mediante las variables asociadas a los canales usando k-means :

set.seed(93284)
kc2 <- kmeans(grupo2_scaled[,2:31], 2, nstart = 5, iter.max = 100)

clusplot(grupo2_scaled[,2:31], kc2$cluster, color = TRUE, 
         shade = FALSE, labels = 4, lines = 1,
         col.clus = c("#FF5CFF", "#800080"),
         col.p = sapply(kc2$cluster, get_color_grupo2),
         main = "Subgrupos del grupo 2 de financieras mediante K-means", 
         xlab = "Componente principal 1 canales",
         ylab = "Componente principal 2 canales",
         sub = "" )
grid()

Grupo Número de clientes
1 308
2 351

Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables de los canales:

finan2_canal <- data.frame(sub_grupos=kc2$cluster, grupo2_no_scaled)
finan2_canal$sub_grupos <- as.factor(finan2_canal$sub_grupos)
sub_grupos grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 2 2 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0 0.00000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.0000000 0.0000000 0 0.0000000 0.00000 0.00000 0 0 0.0000000 0.000000 0 0 1 1 6 6 6 0.000 0.000 0 0 0.000 0.000 6 2 2 5 6
10 2 2 19.00290 20.88248 12.83468 0.00000 0.00000 0.00000 0.00000 13.36429 0.00000 0 0.00000 2.633087 2.596498 1.098612 0.000000 0.000000 0.000000 0.000000 0.6931472 0.0000000 0 0.0000000 0.00000 20.69132 0 0 0.0000000 7.187531 0 0 2 2 3 6 3 0.000 1.000 0 0 0.000 0.000 1 3 1 4 4
12 1 2 22.16302 21.29205 21.42274 0.00000 0.00000 18.13754 20.79774 15.60093 17.35857 0 0.00000 6.972372 5.043963 7.467323 0.000000 0.000000 3.024482 3.188417 0.9650809 3.1403135 0 0.0000000 0.00000 21.94223 0 0 0.0000000 7.417681 0 0 2 2 6 4 4 0.062 0.938 1 0 0.000 0.000 1 1 1 2 2
18 2 2 18.75002 20.05378 15.69399 0.00000 18.69524 16.98441 0.00000 14.57983 14.93081 0 13.49989 3.823192 3.791737 2.206441 0.000000 2.397895 2.149822 0.000000 0.9808293 1.1631508 0 0.9808293 18.69524 19.75768 0 0 2.3978953 4.566083 0 0 2 2 4 4 2 0.465 0.535 1 0 0.000 0.000 2 4 4 5 3
24 1 2 22.47140 24.90816 17.46198 10.71319 0.00000 16.97676 0.00000 19.05138 12.30139 0 22.89075 4.789573 5.748331 3.821369 1.163151 0.000000 2.197225 0.000000 8.2885764 0.6931472 0 11.2487516 0.00000 0.00000 0 0 0.0000000 0.000000 0 0 2 2 6 6 3 0.767 0.233 1 0 0.050 0.950 1 2 2 2 2
26 1 2 19.47715 21.11866 16.39086 15.39240 16.63236 15.17027 0.00000 14.96967 15.35682 0 13.08625 7.054881 6.627711 4.734003 1.763589 1.386294 2.862201 0.000000 2.2064412 3.3040336 0 1.6094379 17.48928 21.11045 0 0 0.7884574 6.175521 0 0 2 2 2 3 2 0.280 0.720 1 0 0.152 0.848 2 4 4 5 2


  • Media de los grupos
media_finan2_canal <-  aggregate(.~sub_grupos,data=finan2_canal, FUN=mean)
sub_grupos grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 2 21.88501 22.53515 16.788726 11.686877 17.40060 18.13406 4.9962628 16.763842 16.333063 4.8509176 9.618123 6.626625 5.548397 3.9858344 3.7308871 1.9878102 3.604548 0.9084702 2.7838140 2.6496067 0.2807886 2.0151903 16.303515 21.09586 5.8218516 1.224807 1.8735611 6.394741 0.3939361 0.1667528 2.383117 1.980519 5.022727 5.496753 5.100649 0.3972565 0.6027500 0.8376623 0.1590909 0.1175682 0.2265909 2.983766 2.532468 2.425325 4.211039 3.824675
2 2 16.14461 18.48690 7.503854 2.342328 8.47056 11.53602 0.7993984 8.683235 7.771545 0.2951114 1.067171 2.963018 3.206602 0.8492807 0.5565361 0.6856002 1.303639 0.1316699 0.6970251 0.6388899 0.0177730 0.1637068 7.876371 14.67730 0.5570908 0.148435 0.6469911 3.866382 0.0357448 0.0344288 2.390313 1.977208 5.048433 5.484331 4.575499 0.4754359 0.4732877 0.4074074 0.0056980 0.0162934 0.0264416 2.786325 3.014245 2.797721 4.487179 3.720798


Análisis del valor medio de los grupos en cada variable


  • De la gráfica anterior, se puede ver en general un comportamiento similar entre ambos grupos, sin embargo, el grupo 1 presenta un monto y un número de transacciones promedio mayor al del grupo 2. Siendo la diferencia más amplia en los canales de entrada 3, 4 5, 8, 9 y otros, además en el canal de salida 5.

  • Ambos grupos tienen comportamientos y valores muy similares, dado que ambos provienen del grupo 2 formado por las variables financieras, por lo tanto estos dos grupos se diferencian en las variables de los canales, incluso, las pocas diferencias que se perciben en estas variables financieras, puede deberse a que el grupo 1 es el que tiende a tener mayores montos de dinero y hacer mayor número de transacciones a través de todos los canales, por lo que se percibe la relación que entre más dinero, mayor nivel de inventario se tiene, más tiendas fisicas y más rápidas las rotaciones de cuentas por cobrar y pagar.


  • Agrupamiento por variables de canales para el grupo 3 de financieras:

  • Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar

dendrogram <- hclust(dist(grupo3_scaled[,2:31], method = 'euclidean'), method = 'ward.D')

plot(dendrogram, xlab="", sub="", cex=0.9)

  • Del gráfico se concluye adecuado considerar dos grupos.

Subagrupamientos mediante las variables asociadas a los canales usando k-means :

set.seed(932840)
kc3 <- kmeans(grupo3_scaled[,2:31], 2 , nstart = 5, iter.max = 100)

clusplot(grupo3_scaled[,2:31], kc3$cluster, color = TRUE, 
         shade = FALSE, labels = 4, lines = 1,
         col.clus = c("#7070FF", "#00007A"),
         col.p = sapply(kc3$cluster, get_color_grupo3),
         main = "Subgrupos del grupo 3 de financieras mediante K-means", 
         xlab = "Componente principal 1 canales",
         ylab = "Componente principal 2 canales",
         sub = "" )
grid()

Grupo Número de clientes
1 480
2 285

Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables de los canales:

finan3_canal <- data.frame(sub_grupos=kc3$cluster, grupo3_no_scaled)
finan3_canal$sub_grupos <- as.factor(finan3_canal$sub_grupos)
sub_grupos grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
2 2 3 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0 0.000000 0.000000 0.0000000 0.000000 0.000000 0.0000000 0.000000 0.0000000 0.0000000 0.0000000 0 0.00000 0.00000 0 0.00000 0.000000 0.000000 0 0.000000 1 1 2 6 2 1.000 0.000 0 0 0 0 1 3 1 3 4
3 1 3 19.34067 17.80747 15.44909 17.54966 19.84044 14.32428 21.46846 0.00000 0.00000 0.00000 0 3.235405 2.558518 1.4663371 5.475766 1.265666 1.8562980 2.224624 0.0000000 0.0000000 0.0000000 0 19.84044 21.54100 0 0.00000 1.265666 6.420131 0 0.000000 1 1 3 1 2 0.456 0.544 1 0 0 0 2 1 2 2 1
5 1 3 19.63688 19.27176 18.47274 16.57269 0.00000 16.97980 0.00000 15.09671 15.13119 0.00000 0 5.040733 3.766997 4.6387661 3.918668 0.000000 2.9444390 0.000000 1.1631508 1.6094379 0.0000000 0 0.00000 0.00000 0 20.24858 0.000000 0.000000 0 3.996671 1 1 2 2 2 1.000 0.000 1 0 0 0 2 2 1 3 3
6 2 3 17.33091 17.57399 14.11472 0.00000 0.00000 15.15795 0.00000 0.00000 13.44045 0.00000 0 2.130214 2.285778 0.6931472 0.000000 0.000000 0.8109302 0.000000 0.0000000 0.6931472 0.0000000 0 0.00000 21.39652 0 0.00000 0.000000 4.510859 0 0.000000 1 1 1 3 1 0.590 0.410 0 0 0 0 1 4 1 5 5
11 1 3 21.19043 20.52364 16.79791 17.58252 19.73069 17.04442 0.00000 13.26919 14.26759 16.26118 0 5.405302 4.447541 3.4683367 4.116324 2.890372 2.2335922 0.000000 0.6931472 0.9343092 0.6931472 0 20.31782 18.74878 0 0.00000 3.254886 2.310884 0 0.000000 1 1 1 2 2 0.741 0.259 1 0 0 0 2 2 1 3 4
14 2 3 17.89304 20.38422 13.99694 0.00000 20.33920 10.64545 0.00000 0.00000 0.00000 0.00000 0 1.131402 2.197225 0.6931472 0.000000 2.036882 1.0986123 0.000000 0.0000000 0.0000000 0.0000000 0 20.33920 0.00000 0 0.00000 2.036882 0.000000 0 0.000000 2 2 2 3 2 0.623 0.377 0 0 0 0 2 3 1 4 4


  • Media de los grupos
media_finan3_canal <- aggregate(.~sub_grupos,data=finan3_canal, FUN=mean)
sub_grupos grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 3 19.80348 20.28556 13.997240 6.874063 12.17379 16.118987 3.4884278 13.037747 13.078793 1.740512 2.3850870 4.386671 3.864514 2.353932 2.0696589 1.1355145 2.0862199 0.5359909 1.3005837 1.3334082 0.0960465 0.3451224 11.815367 18.31579 1.6670524 0.7582309 1.1274070 4.814386 0.1326497 0.1320170 1.481250 1.420833 2.122917 2.512500 2.127083 0.4952771 0.5026500 0.5458333 0.0541667 0.0137104 0.0446229 1.627083 1.687500 1.693750 2.664583 2.604167
2 3 12.87247 15.39372 4.674458 1.529722 4.02132 5.702768 0.5285345 2.231706 1.992457 0.000000 0.5793734 1.284813 1.674099 0.412071 0.5067289 0.2776455 0.4233729 0.0971356 0.1370298 0.1222373 0.0000000 0.1320761 4.086044 10.47296 0.0946753 0.1573681 0.2828609 2.376789 0.0073829 0.0196068 1.463158 1.403509 2.056140 2.221053 1.659649 0.5978000 0.3671193 0.1929825 0.0105263 0.0050351 0.0160175 1.505263 1.768421 1.877193 2.557895 2.389474


Análisis del valor medio de los grupos en cada variable


  • De la gráfica anterior, se puede ver en general un comportamiento similar entre ambos grupos, sin embargo, el grupo 1 presenta un monto y un número de transacciones promedio mayor al del grupo 2. Siendo la diferencia más amplia en los canales de entrada 3, 5 6, 8, 9 y en los canales de salida 5 y 2.

  • Ambos grupos tienen comportamientos y valores muy similares, dado que ambos provienen del grupo 3 formado por las variables financieras, por lo tanto estos dos grupos se diferencian en las variables de los canales, incluso, las pocas diferencias que se perciben en estas variables financieras, puede deberse a que el grupo 1 es el que tiende a tener mayores montos de dinero y hacer mayor número de transacciones a través de todos los canales, por lo que se percibe la relación que entre más dinero, mayores nivel en las cuentas por cobrar e inventarios se tiene, además de más tiendas fisicas.


Grupos finales

Dado que en los procedimientos anteriores se obtuvieron grupos y subgrupos, ahora llega el momento de crear los 6 grupos resultates, que consiste en la combinación de un grupo y subgrupo respectivamente:

Grupo 1: grupo 1 subgrupo 1 Grupo 2: grupo 1 subgrupo 2 Grupo 3: grupo 2 subgrupo 1 Grupo 4: grupo 2 subgrupo 2 Grupo 5: grupo 3 subgrupo 1 Grupo 6: grupo 3 subgrupo 2

Grupo1 <- finan1_canal[finan1_canal$sub_grupos==1,] #grupo 1 subgrupo 1
Grupo2 <- finan1_canal[finan1_canal$sub_grupos==2,] #grupo 1 subgrupo 2

Grupo3 <- finan2_canal[finan2_canal$sub_grupos==1,] #grupo 2 subgrupo 1
Grupo4 <- finan2_canal[finan2_canal$sub_grupos==2,] #grupo 2 subgrupo 2

Grupo5 <- finan3_canal[finan3_canal$sub_grupos==1,] #grupo 3 subgrupo 1
Grupo6 <- finan3_canal[finan3_canal$sub_grupos==2,] #grupo 3 subgrupo 2
Grupos sub_grupos grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
13 1 1 1 20.14792 21.67130 15.76412 18.08469 20.60070 17.89472 0 17.24237 15.63410 0.00000 0 4.598481 5.521128 2.0149030 3.483801 2.068970 3.094823 0 3.5409593 1.2992830 0.0000000 0 20.59515 20.80515 13.205787 0.00000 1.945910 6.147399 1.0986123 0.0000000 4 2 3 3 3 0.519 0.481 1 0 0 0 5 3 4 5 5
15 1 1 1 21.53210 21.92567 18.21109 0.00000 16.97717 18.71696 0 17.02137 15.73888 0.00000 0 6.588124 5.470518 4.4026459 0.000000 1.064711 4.225617 0 2.5585185 2.0654553 0.0000000 0 16.97134 22.05078 0.000000 16.52356 1.029619 5.972324 0.0000000 0.6931472 2 2 2 4 2 0.386 0.614 0 0 0 0 2 3 1 4 5
16 1 1 1 16.60844 19.52531 13.25472 0.00000 16.75046 0.00000 0 0.00000 11.79132 0.00000 0 1.658228 2.777783 0.6931472 0.000000 1.858899 0.000000 0 0.0000000 0.6931472 0.0000000 0 16.75046 19.14282 13.560620 16.35711 1.858899 4.496099 0.6931472 3.1570004 2 2 1 2 2 0.709 0.291 0 0 0 0 3 3 1 4 5
17 1 1 1 20.40304 19.10834 14.55509 15.86659 0.00000 18.01002 0 13.81660 14.54704 0.00000 0 5.816367 4.649187 1.3862944 4.340553 0.000000 3.583519 0 0.8472979 1.2729657 0.0000000 0 0.00000 0.00000 13.393607 0.00000 0.000000 0.000000 0.6931472 0.0000000 2 2 4 3 3 1.000 0.000 1 0 0 0 5 3 4 5 3
23 1 1 1 20.12118 20.47481 11.55023 0.00000 18.91690 15.97052 0 14.18313 15.48527 0.00000 0 5.039115 3.521447 0.6931472 0.000000 1.446919 2.120264 0 0.8754687 1.3862944 0.0000000 0 18.91690 19.64056 0.000000 0.00000 1.446919 5.092727 0.0000000 0.0000000 4 3 2 2 2 0.545 0.455 0 0 0 0 3 2 1 4 5
34 1 1 1 22.06128 22.06201 15.51189 16.92158 16.87478 19.80622 0 17.71955 18.20847 15.09422 0 7.320030 6.696417 1.9459101 2.268683 2.505526 5.526117 0 3.5624655 4.4710037 0.8472979 0 16.87478 20.64280 9.937454 0.00000 2.505526 5.066806 0.6931472 0.0000000 4 2 3 6 6 0.672 0.328 1 0 0 0 6 4 2 6 6


  • Media de los grupos
media_finan_canal <- aggregate(.~Grupos,data=Datos_finales_3, FUN=mean)
Grupos sub_grupos grupos en_vm_canal1 en_vm_canal2 en_vm_canal3 en_vm_canal4 en_vm_canal5 en_vm_canal6 en_vm_canal7 en_vm_canal8 en_vm_canal9 en_vm_canal10 en_vm_otros en_tx_canal1 en_tx_canal2 en_tx_canal3 en_tx_canal4 en_tx_canal5 en_tx_canal6 en_tx_canal7 en_tx_canal8 en_tx_canal9 en_tx_canal10 en_tx_otros sal_vm_canal5 sal_vm_canal2 sal_vm_canal8 sal_vm_otros sal_tx_canal5 sal_tx_canal2 sal_tx_canal8 sal_tx_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 1 1 19.94031 20.48836 13.094312 5.8857911 11.985258 16.705749 0.8272024 14.444786 14.216166 1.9883975 2.9903560 4.535871 3.991818 1.7902761 1.4590362 1.1312590 2.3897684 0.1369564 1.4965272 1.4598729 0.1167184 0.3384375 11.116358 17.804977 2.4194552 0.8561827 1.0788502 4.425699 0.1429781 0.1195126 2.494297 1.895437 2.081749 3.100760 3.684411 0.5933783 0.4028251 0.5361217 0.0589354 0.0132833 0.0570589 4.709125 2.754753 2.216730 5.283270 5.330799
2 2 1 13.37422 14.87997 3.613156 0.9956914 5.037862 7.541045 0.3914212 2.725678 2.695383 0.0608364 0.2209152 1.315973 1.559667 0.2944157 0.2734687 0.3543268 0.5250866 0.0636727 0.1753527 0.1708549 0.0024493 0.0441759 4.867592 9.219717 0.0000000 0.0539722 0.3335243 1.739765 0.0000000 0.0074207 1.876325 1.565371 1.823322 2.657244 3.159011 0.6879505 0.2626042 0.2190813 0.0035336 0.0004629 0.0066042 4.671378 2.766784 2.254417 5.505300 5.395760
3 1 2 21.88501 22.53515 16.788726 11.6868769 17.400598 18.134055 4.9962628 16.763842 16.333063 4.8509176 9.6181235 6.626625 5.548397 3.9858344 3.7308871 1.9878102 3.6045476 0.9084702 2.7838140 2.6496067 0.2807886 2.0151903 16.303515 21.095857 5.8218516 1.2248073 1.8735611 6.394741 0.3939361 0.1667528 2.383117 1.980519 5.022727 5.496753 5.100649 0.3972565 0.6027500 0.8376623 0.1590909 0.1175682 0.2265909 2.983766 2.532468 2.425325 4.211039 3.824675
4 2 2 16.14461 18.48690 7.503854 2.3423279 8.470560 11.536015 0.7993984 8.683235 7.771545 0.2951114 1.0671705 2.963018 3.206602 0.8492807 0.5565361 0.6856002 1.3036391 0.1316699 0.6970251 0.6388899 0.0177730 0.1637068 7.876371 14.677304 0.5570908 0.1484350 0.6469911 3.866382 0.0357448 0.0344288 2.390313 1.977208 5.048433 5.484331 4.575499 0.4754359 0.4732877 0.4074074 0.0056980 0.0162934 0.0264416 2.786325 3.014245 2.797721 4.487179 3.720798
5 1 3 19.80348 20.28556 13.997240 6.8740634 12.173792 16.118987 3.4884278 13.037747 13.078793 1.7405120 2.3850870 4.386671 3.864514 2.3539317 2.0696589 1.1355145 2.0862199 0.5359909 1.3005837 1.3334082 0.0960465 0.3451224 11.815367 18.315793 1.6670524 0.7582309 1.1274070 4.814386 0.1326497 0.1320170 1.481250 1.420833 2.122917 2.512500 2.127083 0.4952771 0.5026500 0.5458333 0.0541667 0.0137104 0.0446229 1.627083 1.687500 1.693750 2.664583 2.604167
6 2 3 12.87247 15.39372 4.674458 1.5297216 4.021320 5.702768 0.5285345 2.231706 1.992457 0.0000000 0.5793734 1.284813 1.674099 0.4120710 0.5067289 0.2776455 0.4233729 0.0971356 0.1370298 0.1222373 0.0000000 0.1320761 4.086044 10.472958 0.0946753 0.1573681 0.2828609 2.376789 0.0073829 0.0196068 1.463158 1.403509 2.056140 2.221053 1.659649 0.5978000 0.3671193 0.1929825 0.0105263 0.0050351 0.0160175 1.505263 1.768421 1.877193 2.557895 2.389474


Análisis del valor medio de los grupos en cada variable


Variables de los canales

  • En general el grupo 1, 3 y 5 son los que manejan en promedio mayores montos de dinero y mayor número de transacciones, por lo tanto el grupo 2, 4 y 6 son los que manejan en promedio menores montos de dinero y menor número de transacciones.

  • El grupo 3 a pesar de tener un comportamiento de manejar mayores montos en promedio de dinero al igual que el grupo 1 y 5, es el que toma mayores valores entre estos, además este se destaca particularmente en el canal de entrada de otros, dado que toma valores muy altos, más que cualquiera de los otros grupos.

Variables de los canales

  • El grupo 1, 3 y 4 es el que tiene mayor nivel promedio de importaciones y exportaciones, mientras que el grupo 5 y 6 son los que menos realizan importaciones y exportaciones; el grupo 3 y 4 tienen mayor nivel promedio de cuentas por pagar y cobrar y mayor inventario, el grupo 1 y 2 tienen un nivel promedio de cuentas por pagar y cobrar e inventario intermedio mientras que el grupo 5 y 6 tienen un nivel promedio de cuentas por pagar y cobrar e inventario bajos.

  • En general todos los grupos presentan mayor número promedio de ventas fisicas que electronicas, además el grupo 3 es el que presenta mayor promedio de pagos a personas naturales, mayor número promedio de ventas fisicas y electronicas y mayor número promedio de recaudos a personas juridicas y naturales. El grupo 1, 2 y 6 es el que realiza mayor proporción de pagos a personas juridicas, pero son los que realizan menor proporción de pagos a personas naturales. El grupo 2, 4, 6 tiene la menor cantidad de ventas fisicas y electronicas, además de los menores recaudos a personas juridicas y naturales.

  • El grupo 1 y 2, el grupo 3 y 4, el grupo 5 y 6 tiene comportamientos muy similares en las rotaciones de inventario, rotaciones de cuentas por cobrar y pagar y en los ciclos de negocio y financieros, en donde el grupo 5 y 6 es al que le toma menos tiempo promedio realizar estas rotaciones y ciclos, al grupo 1 y 2 le toma mayor tiempo promedio realizar las rotaciones de inventario y hacer los ciclos de negocio y financiero, por otro lado el grupo 4 es al que más tiempo promedio le toma realizar las rotaciones de cuenta por cobrar y pagar.

En general asi los grupos se parezcan entre si, estos se difieren en algo, ya sea en las variables financieras o en los canales.

Conclusión general de los grupos formados

  • Grupo 1: es de los que tiende a manejar mayores montos de dinero y mayor número de transacciones a través de los canales, además de que es uno de los grupos que mayores importaciones y exportaciones realiza, aunque igual el nivel de estas no es tan alto tiene buena cantidad de cuentas por cobrar, además de una gran cantidad de inventarios, que aunque no es la más alta, tiene un nivel promedio. Maneja un valor intermedio ventas fisicas en comparación con los demás grupos, se demora más rotando el inventario y realizando su ciclo de negocio y financiero, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas grandes, de productos, por ello manejan mucho inventario y se demoran mucho para rotarlo, además de que venden y compran productos al exterior.

  • Grupo 2: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, realizan pocas importaciones y exportaciones, tienen pocas cuentas por pagar y aunque tiene mas cuentas por cobrar, tampoco estas son altas, tiene un inventario de un nivel intermedio, es el grupo que tiene mayor porcentaje de pagos a personas juridicas que a personas naturales, además es uno de los grupos con menores ventas fisicas y electronicas, es decir las menores ventas en general, además de ser el grupo que más se demora rotando el inventario y realizando el su ciclo de negocio y financiero, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que quizas no estan tan desarrolladas y estan en un proceso de crecimiento, en donde sus ventas no son las mejores y no tiene tanto contacto a nivel internacional.

  • Grupo 3: es el que tiene mayores montos de dinero y mayor número de transacciones a través de los canales en comparación con el resto de los grupos, es uno de los grupos que mayores importaciones y exportaciones realiza, aunque igual el nivel de estas no es tan alto, tiene un nivel alto en la cuentas por pagar, cuentas por cobrar e inventario, además el grupo 3 es el que presenta mayor promedio de pagos a personas naturales, mayor número de ventas fisicas y electronicas y mayor número de recaudos a personas juridicas y naturales y en general tiene un nivel promedio en las rotaciones y ciclos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas grandes muy desarrolladas, que se manejan a nivel nacional e internacional, que parecen ser de productos dado que manejan el mayor nivel de inventario, además de tiener muchas ventas ya sean fisicas o electronicas y sus rotaciones de inventario y de cuentas al igual que sus ciclos no tienden a ser tan rapidos ni tan lentos.

  • Grupo 4: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, es uno de los grupos que mayores importaciones y exportaciones realiza, aunque igual el nivel de estas no es tan alto, maneja un nivel muy alto de cuenta por cobrar y pagar, también dispone de un nivel alto de inventario, su nivel de ventas es intermedio al igual que la rotación de inventario y ciclo de negocio y financiero y en comparación con los otros grupos es el que tiene las rotaciones de cuentas por cobrar y pagar más lenta, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que ofrecen un servicio o producto en donde su forma de pago no es inmediata, como por ejemplo empresas que realizan pedidos o encargos, empresas distribuidores, etc.

  • Grupo 5: es de los que tiende a manejar mayores montos de dinero y mayor número de transacciones a través de los canales, tiene un nivel bajo de importaciones y exportaciones y un nivel intermedio de cuentas por cobrar, cuentas por pagar e inventario, también tiene un alto porcentaje de pagos a personas juridicas y naturales, además un buen porcentaje de ventas fisicas y en general tiene rotaciones de inventario, rotaciones de cuentas y ciclos relativamente rápidos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que se encargan de distribuir productos nacionales, los cuales tienen un proceso de venta rápido, dado que el inventario no es grande ni pequeño pero tienden a realizar rotaciones en poco tiempo y por el hecho de manejar buen monto de dinero nos da idea de que puede ser una empresa grande o muy bien acreditada.

  • Grupo 6: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, tiene niveles bajos de importaciones, exportaciones, de cuentas por cobrar y pagar e inventario, tiene porcentajes altos de pagos a personas juridicas y naturales y sus rotaciones de inventario, de cuentas y ciclos son rápidos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que en general se espera que no sean grandes y tiendan a ofrecer servicios a nivel nacional.


Comentario adicional:

Los valores extremos encontrados inicialmente en los canales son los siguientes:

“825, 1416, 1462, 1668, 1773”

Los cuales pertenecen al grupo:

“5, 3, 3, 1, 3” respectivamente lo cual significa que todos quedan en los grupos que más dinero mueven y más tranzan por los canales, por lo tanto la segmentación es confiable.


Conclusión:

Mediante los grupos obtenidos con este segundo procedimiento de segmentación se puede notar una consistencia o una alta relación con los grupos formados en el anterior procedimiento, dado que cada uno de los grupos sigue teniendo relativamente las mismas caracteristicas a tanto en los canales como en las variables financieras, lo que implica que realizar el procedimiento en un respectivo orden no cambia mucho los grupos formados, dado que estos estan muy bien definidos.

Cabe resaltar que los dos subgrupos de los canales hallados a partir de los grupos ya conformados con las variables financieras, tienen la caracteristica de que uno tiende a manejar mayores montos de dinero y número de transacciones que el otro y este fenomeno se percibe en cada una de las subagrupaciones realizadas, lo cual da idea del porque hay consistencia con el procedimiento 1 y procedimiento 2 de segmentación, en el cual el procedimiento 1 realiza primero la segmentación por las variables de los canales y claramente se resaltan dos grupos los cuales se diferencian por los montos de dinero que manejan y número de transacciones, por lo tanto a pesar de que se realice primero la agrupación por las variables financieras y los tres grupos tengan sus diferencias, en todos se conserva el comportamiento descrito en la primera segmentación para las variables de los canales.

A pesar de que existe una alta relación entre los dos procedimientos de segmentación realizados, mediante los análisis se concluye que estan mejor definidos los grupos realizados mediante el procedimiento 2 (primero financieras y luego canales), debido a que el orden lógico por el cual se caracterizaría un nuevo usuario (que no tiene información de uso de los canales de la empresa) sería mediante la recolección de la información financiera del nuevo cliente. Además de que los grupos finales que se forman tienen unas características que se acomodan mas a interpretaciones de perfiles de empresas reales y por lo tanto las interpretaciones tienen más coherencia.

Por lo tanto se quiere realizar un procedimiento adicional que sigue la misma estructura del procedimiento 2 donde se realiza primero la segmentación por las variables financieras y luego por las variables de los canales,considerando una simplificación de las variables, ya que se decide realizar una transformación o manipulación de variables las cuales permiten reducir el número de estas teniendo en cuenta la relación que existe entre los montos de dinero y número de transacciones realizados por cada uno de los clientes.

Procedimiento de segmentación 3

Antes de realizar el proceso de segmentación se procede a la creación de las variables asociadas a los canales que van a ser utilizadas.

Para las variables de los canales se tienen 4 tipos de variables, que se definen de la siguiente manera:

  • en_vm_canalX: valor del ticket promedio anual de entrada por el canal X

    • sal_vm_canalX: valor del ticket promedio anual de salida por el canal X

    • en_tx_canalX: cantidad de transacciones de entrada mensuales en promedio por el canal X

    • sal_tx_canalX: cantidad de transacciones de salida mensuales en promedio por el canal X

Se realiza el proceso de reducción de variables de los canales con los siguientes criterios:

  1. Primero se deben llevar todos los canales a una forma similar, es decir, las variables que son de tipo en_tx_canalX y sal_tx_canalX, estan en valores mensuales, por lo tanto se deben multiplicar por 12 para que esten en promedios anuales, así como lo están las variables en_vm_canalX y sal_vm_canalX.

  2. Se obtiene la cantidad de dinero de entrada promedio anual en cada empresa, para eso se multiplican las variables que son de tipo en_vm_canalX por en_tx_canalX.

  3. Se obtiene la cantidad de dinero de salida promedio anual en cada empresa, para eso se multiplican las variables que son de tipo sal_vm_canalX por sal_tx_canalX.

Por lo tanto, las variables resultantes indican el dinero promedio anual de cada uno de los clientes en los diferentes canales.

Codigo de la creación de las nuevas variables:

df <- read.csv("base_trabajo_segmentacion.csv", sep = ";", dec = '.', header = T) #Se lee de nuevo el conjunto de datos
df <- df[, -1]

montos_entrada <- df[,1:11] # Variables en_vm_canalX
transacciones_entrada <- df[,12:22] #  Variables en_tx_canalX
montos_salida <- df[,23:26] # Variables sal_vm_canalX
transacciones_salida <- df[,27:30] # Variables sal_tx_canalX


monto_promedio_anual_entrada <- montos_entrada*(transacciones_entrada*12)
monto_promedio_anual_salida <- montos_salida*(transacciones_salida*12)

#Creacion de nuevo conjunto de datos con variables reducidas
df <- cbind(monto_promedio_anual_entrada, monto_promedio_anual_salida, finan_no_scaled)

#Asignacion de nuevos nombres a variables creadas
colnames(df)[1:15] <- c("entrada_canal1","entrada_canal2","entrada_canal3","entrada_canal4",
"entrada_canal5","entrada_canal6","entrada_canal7","entrada_canal8",
"entrada_canal9","entrada_canal10","entrada_otros", "salida_canal5",
"salida_canal2","salida_canal8","salida_otros")
entrada_canal1 entrada_canal2 entrada_canal3 entrada_canal4 entrada_canal5 entrada_canal6 entrada_canal7 entrada_canal8 entrada_canal9 entrada_canal10 entrada_otros salida_canal5 salida_canal2 salida_canal8 salida_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
0 0 0 0 0 0 0 0 0 0 0 0 0.000000e+00 0 0 1 1 6 6 6 0.000 0.000 0 0 0 0 6 2 2 5 6
0 0 0 0 0 0 0 0 0 0 0 0 0.000000e+00 0 0 1 1 2 6 2 1.000 0.000 0 0 0 0 1 3 1 3 4
73521755371 7745007624 204886067 119447064008 12634037247 107777719 208577904975 0 0 0 0 12634037247 1.666626e+13 0 0 1 1 3 1 2 0.456 0.544 1 0 0 0 2 1 2 2 1
6816608354 16013853722 454114370 0 0 237646144 0 108000000 0 0 0 0 7.509247e+09 0 0 2 2 1 1 1 0.615 0.385 1 0 0 0 5 2 3 5 5
621887764335 118748488736 129467842777 9327129803 0 5113117511 0 95065402 178910331 0 0 0 0.000000e+00 0 398753737891 1 1 2 2 2 1.000 0.000 1 0 0 0 2 2 1 3 3
2993026709 4545628846 16185504 0 0 57425400 0 0 8246928 0 0 0 2.117460e+12 0 0 1 1 1 3 1 0.590 0.410 0 0 0 0 1 4 1 5 5

Análisis descriptivo de las nuevas variables asociadas a los canales:

Del gráfico anterior se observa que:

  • El canal 2 es el que en promedio maneja mayor cantidad de dinero de entrada y salida.

  • Los canales 1 y 2 son los que en promedio manejan mayor cantidad de dinero de entrada.

  • Los canales que manejan en promedio una cantidad intermedia de dinero de entrada son los canales 3, 5, 6, 8 y 9.

  • Los canales 7, 10 y otros son los que en promedio tienen menores ingresos de dinero.

  • Los canales 8 y otros de salida son los que en promedio tiene menor cantidad de dinero.

  • El canal 5 tanto en entrada como salida maneja una cantidad de dinero similar.

Ya que el procedimiento 3 es una modificación del procedimiento 2 en la parte de segmentación que se realizó con las variables de canales, entonces la segmentación que involucra las variables financieras sigue siendo exactamente igual.

Mediante la siguiente gráfica se presenta los resultados de la segmentación mediante las variables financieras.


Gráfico de los grupos en las variables financieras


De la gráfica anterior se muestra los grupos obtenidos con la segmentación en las variables financieras, gráficada solo en las variables financieras. Su análisis se puede observar en el procedimiento 2 conclusiones

Se crean subgrupos mediante las variables de los canales nuevas para cada grupo creado con las variables financieras

  • Agrupamiento por variables de canales para el grupo 1 de financieras:

  • Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar

dendrogram <- hclust(dist(grupo1_scaled[2:16], method = 'euclidean'), method = 'ward.D')

plot(dendrogram, xlab="", sub="", cex=0.9)

  • En un inicio, del gráfico anterior se concluyó considerar 3 grupos. Sin embargo, después de realizar los agrupamientos mediante K-means se observó que dos de los grupos presentaban un comportamiento medio muy similar que hacia difícil su diferenciación. Por este motivo se decidió considerar únicamente 2 agrupaciones.

Subagrupamientos mediante las variables asociadas a los canales usando k-means :

set.seed(932840)
kc1 <- kmeans(grupo1_scaled[2:16], 2 , nstart = 5, iter.max = 100)

clusplot(grupo1_scaled[,2:16], kc1$cluster, color = TRUE, 
         shade = FALSE, labels = 4, lines = 1,
         col.clus = c("#F54830", "#C23927"),
         col.p = sapply(kc1$cluster, get_color_grupo1),
         main = "Subgrupos del grupo 1 de financieras mediante K-means", 
         xlab = "Componente principal 1 canales",
         ylab = "Componente principal 2 canales",
         sub = "" )
grid()

Grupo Número de clientes
1 575
2 234

Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables de los canales:

finan1_canal <- data.frame(sub_grupos=kc1$cluster, grupo1_no_scaled)
finan1_canal$sub_grupos <- as.factor(finan1_canal$sub_grupos)
sub_grupos grupos entrada_canal1 entrada_canal2 entrada_canal3 entrada_canal4 entrada_canal5 entrada_canal6 entrada_canal7 entrada_canal8 entrada_canal9 entrada_canal10 entrada_otros salida_canal5 salida_canal2 salida_canal8 salida_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
4 1 1 6.816608e+09 1.601385e+10 454114370 0 0 237646144 0 108000000 0 0 0 0 7.509247e+09 0 0.0e+00 2 2 1 1 1 0.615 0.385 1 0 0 0 5 2 3 5 5
7 2 1 5.978402e+09 1.659766e+10 0 0 0 0 0 0 0 0 0 0 2.780847e+10 0 0.0e+00 1 1 1 4 1 1.000 0.000 0 0 0 0 2 4 1 6 6
8 2 1 0.000000e+00 0.000000e+00 0 0 0 0 0 0 0 0 0 0 0.000000e+00 0 0.0e+00 2 2 2 1 6 0.000 0.000 0 0 0 0 6 1 1 6 6
9 2 1 7.560792e+11 1.671833e+11 12464400 427769257250 0 0 0 0 391031850 0 0 0 0.000000e+00 0 0.0e+00 2 2 3 1 4 1.000 0.000 1 0 0 0 6 1 4 6 5
13 1 1 6.637634e+11 7.708352e+12 547474103 27084339545 73426022678 14952014444 0 12373550018 197220571 0 0 63342000000 6.075665e+12 13044000 0.0e+00 4 2 3 3 3 0.519 0.481 1 0 0 0 5 3 4 5 5
15 1 1 1.954518e+13 9.448526e+12 78496902169 0 538300959 108798237345 0 3528757423 565768278 0 0 507006570 1.771552e+13 0 1.8e+08 2 2 2 4 2 0.386 0.614 0 0 0 0 2 3 1 4 5


  • Media de los grupos en la escala original de los canales
media_finan1_canal <- aggregate(.~sub_grupos,data=finan1_canal, FUN=mean)
sub_grupos grupos entrada_canal1 entrada_canal2 entrada_canal3 entrada_canal4 entrada_canal5 entrada_canal6 entrada_canal7 entrada_canal8 entrada_canal9 entrada_canal10 entrada_otros salida_canal5 salida_canal2 salida_canal8 salida_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 1 4.862367e+14 3.210020e+12 2.460290e+13 1.556457e+13 667174200047 66909088090 36605851873 39194980925 50344153600 64751035 12768811623 690627633790 2.826766e+13 6523841 179418534 2.431304 1.852174 2.040000 3.024348 3.659130 0.5968470 0.3944661 0.5130435 0.0539130 0.0121513 0.0521965 4.766957 2.726957 2.233043 5.320000 5.353044
2 1 2.482506e+10 2.065795e+11 1.040781e+09 3.698292e+11 13045165725 139649336 2227154942 11389931 5616481 1538462 7260894843 12101294986 2.685547e+12 0 1580342 1.901709 1.602564 1.871795 2.752137 3.111111 0.6992308 0.2537821 0.2094017 0.0042735 0.0005598 0.0079872 4.521368 2.837607 2.222222 5.461538 5.354701


  • Media de los grupos en la escala de logaritmo natural en los canales
finan1_canal_log <- finan1_canal

finan1_canal_log[3:17] <- log(finan1_canal_log[3:17] + 1)


media_finan1_canal <- aggregate(.~sub_grupos,data= finan1_canal_log, FUN=mean)
sub_grupos grupos entrada_canal1 entrada_canal2 entrada_canal3 entrada_canal4 entrada_canal5 entrada_canal6 entrada_canal7 entrada_canal8 entrada_canal9 entrada_canal10 entrada_otros salida_canal5 salida_canal2 salida_canal8 salida_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 1 26.61566 26.64070 16.294361 7.735484 14.16846 21.102242 1.0112694 17.249732 17.005363 2.1598069 3.4576728 13.253201 23.61465 2.647167 1.0108119 2.431304 1.852174 2.040000 3.024348 3.659130 0.5968470 0.3944661 0.5130435 0.0539130 0.0121513 0.0521965 4.766957 2.726957 2.233043 5.320000 5.353044
2 1 14.92172 16.99768 3.025855 1.021924 5.06628 7.219199 0.5201569 1.852904 1.883247 0.0841949 0.2944962 4.754575 11.34441 0.000000 0.0843097 1.901709 1.602564 1.871795 2.752137 3.111111 0.6992308 0.2537821 0.2094017 0.0042735 0.0005598 0.0079872 4.521368 2.837607 2.222222 5.461538 5.354701


Análisis del valor medio de los grupos en cada variable


  • De la gráfica anterior, en general el grupo 1 presenta en promedio mayores entradas y salidas de dinero que el grupo 2, exceptuando en el canal 7 de entrada. Siendo la diferencia más amplia en los canales de entrada 1, 2, 3, 4, 5, 6, 8, 9 y en el canal de salida 2.

  • Ambos grupos tienen comportamientos y valores muy similares, dado que ambos provienen del grupo 1 formado por las variables financieras, por lo tanto estos dos grupos se diferencian en las variables de los canales, incluso, las pocas diferencias que se perciben en estas variables financieras, puede deberse a que el grupo 1 es el que tiende a manejar mayores montos de dinero a través de todos los canales, por lo que se percibe la relación que entre más dinero, mayores niveles de importaciones, exportaciones, cuentas por cobrar, pagar e inventario se van a realizar.


  • Agrupamiento por variables de canales para el grupo 2 de financieras:

  • Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar

dendrogram <- hclust(dist(grupo2_scaled[2:16], method = 'euclidean'), method = 'ward.D')

plot(dendrogram, xlab="", sub="", cex=0.9)

  • En un inicio, del gráfico anterior se concluyó considerar 3 grupos. Sin embargo, después de realizar los agrupamientos mediante K-means se observó que dos de los grupos presentaban un comportamiento medio muy similar que hacia difícil su diferenciación. Por este motivo se decidió considerar únicamente 2 agrupaciones.

Subagrupamientos mediante las variables asociadas a los canales usando k-means :

set.seed(93284)
kc2 <- kmeans(grupo2_scaled[2:16], 2, nstart = 5, iter.max = 100)

clusplot(grupo2_scaled[,2:16], kc2$cluster, color = TRUE, 
         shade = FALSE, labels = 4, lines = 1,
         col.clus = c("#800080", "#FF5CFF"),
         col.p = sapply(kc2$cluster, get_color_grupo2),
         main = "Subgrupos del grupo 2 de financieras mediante K-means", 
         xlab = "Componente principal 1 canales",
         ylab = "Componente principal 2 canales",
         sub = "" )
grid()

Grupo Número de clientes
1 515
2 144

Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables de los canales:

finan2_canal <- data.frame(sub_grupos=kc2$cluster, grupo2_no_scaled)
finan2_canal$sub_grupos <- as.factor(finan2_canal$sub_grupos)
sub_grupos grupos entrada_canal1 entrada_canal2 entrada_canal3 entrada_canal4 entrada_canal5 entrada_canal6 entrada_canal7 entrada_canal8 entrada_canal9 entrada_canal10 entrada_otros salida_canal5 salida_canal2 salida_canal8 salida_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 2 2 0.000000e+00 0.000000e+00 0.000000e+00 0 0 0 0 0.000000e+00 0 0 0.000000e+00 0 0.000000e+00 0 0 1 1 6 6 6 0.000 0.000 0 0 0.000 0.000 6 2 2 5 6
10 2 2 2.774517e+10 1.747165e+11 9.000000e+06 0 0 0 0 7.642200e+06 0 0 0.000000e+00 0 1.536331e+13 0 0 2 2 3 6 3 0.000 1.000 0 0 0.000 0.000 1 3 1 4 4
12 1 2 5.396520e+13 3.265569e+12 4.224027e+13 0 0 17705262466 300571449975 1.162602e+08 9173266590 0 0.000000e+00 0 6.757203e+13 0 0 2 2 6 4 4 0.062 0.938 1 0 0.000 0.000 1 1 1 2 2
18 1 2 7.464555e+10 2.662259e+11 6.347231e+08 0 15791400000 2164101053 0 4.295061e+07 80532392 0 1.458667e+07 15791400000 4.348279e+11 0 0 2 2 4 4 2 0.465 0.535 1 0 0.000 0.000 2 4 4 5 3
24 1 2 8.219519e+12 2.464553e+14 2.054973e+10 1186522 0 2265600000 0 8.967365e+12 2640000 0 8.049541e+15 0 0.000000e+00 0 0 2 2 6 6 3 0.767 0.233 1 0 0.050 0.950 1 2 2 2 2
26 1 2 3.995038e+12 1.344940e+13 1.777290e+10 280712726 602066844 767411089 0 3.076204e+08 1469717237 0 2.314862e+07 567360000 8.480561e+12 0 0 2 2 2 3 2 0.280 0.720 1 0 0.152 0.848 2 4 4 5 2


  • Media de los grupos en la escala original de los canales
media_finan2_canal <-  aggregate(.~sub_grupos,data=finan2_canal, FUN=mean)
sub_grupos grupos entrada_canal1 entrada_canal2 entrada_canal3 entrada_canal4 entrada_canal5 entrada_canal6 entrada_canal7 entrada_canal8 entrada_canal9 entrada_canal10 entrada_otros salida_canal5 salida_canal2 salida_canal8 salida_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 2 5.510982e+14 1.764424e+14 8.038065e+14 3.460362e+16 4.538915e+12 530824153875 1.038974e+13 391606476508 51402714582 53089972 1.459350e+15 4.583276e+12 2.213317e+15 136290278208 5939816929 2.458252 2.009709 4.988349 5.433010 4.916505 0.4238524 0.5742136 0.6970874 0.0990291 0.0796039 0.1495243 3.011651 2.710680 2.584466 4.341748 3.794175
2 2 2.293347e+11 2.375287e+12 8.813650e+09 3.083424e+12 4.436140e+10 173070828 1.743511e+10 69575126 2355741 0 1.585205e+11 4.436920e+10 4.111369e+13 0 0 2.131944 1.868056 5.208333 5.694444 4.479167 0.4927014 0.3892431 0.2916667 0.0000000 0.0064861 0.0143472 2.402778 3.069444 2.763889 4.416667 3.680556


  • Media de los grupos en la escala de logaritmo natural de los canales
finan2_canal_log <- finan2_canal

finan2_canal_log[3:17] <- log(finan2_canal_log[3:17] + 1)

media_finan2_canal <- aggregate(.~sub_grupos,data=finan2_canal_log, FUN=mean)
sub_grupos grupos entrada_canal1 entrada_canal2 entrada_canal3 entrada_canal4 entrada_canal5 entrada_canal6 entrada_canal7 entrada_canal8 entrada_canal9 entrada_canal10 entrada_otros salida_canal5 salida_canal2 salida_canal8 salida_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 2 29.30102 29.83030 19.222939 11.847929 18.880602 22.606128 4.389138 19.516420 18.758969 3.676791 8.5087482 17.501943 28.76458 4.643689 1.081215 2.458252 2.009709 4.988349 5.433010 4.916505 0.4238524 0.5742136 0.6970874 0.0990291 0.0796039 0.1495243 3.011651 2.710680 2.584466 4.341748 3.794175
2 2 12.83383 16.53001 3.582793 1.733572 2.693302 5.958623 0.660064 2.756379 1.654763 0.000000 0.6057181 2.987793 10.16682 0.000000 0.000000 2.131944 1.868056 5.208333 5.694444 4.479167 0.4927014 0.3892431 0.2916667 0.0000000 0.0064861 0.0143472 2.402778 3.069444 2.763889 4.416667 3.680556


Análisis del valor medio de los grupos en cada variable


  • De la gráfica anterior, en general el grupo 1 presenta en promedio mayores entradas y salidas de dinero que el grupo 2. Siendo las diferencias más amplia en los canales de entrada 1, 2, 3, 4, 5, 6, 8, 9 y en los canales de salida 5 y 2.

  • Ambos grupos tienen comportamientos y valores muy similares, dado que ambos provienen del grupo 2 formado por las variables financieras, por lo tanto estos dos grupos se diferencian en las variables de los canales, incluso, las pocas diferencias que se perciben en estas variables financieras, puede deberse a que el grupo 1 es el que tiende a tener mayores montos de dinero a través de todos los canales, por lo que se percibe la relación que entre más dinero, mayores importaciones, mayor nivel de inventario se tiene, más tiendas fisicas y más lentas las rotaciones de inventario pero más rápidas las rotaciones de cuentas por cobrar y pagar.


  • Agrupamiento por variables de canales para el grupo 3 de financieras:

  • Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar

dendrogram <- hclust(dist(grupo3_scaled[2:16], method = 'euclidean'), method = 'ward.D')

plot(dendrogram, xlab="", sub="", cex=0.9)

  • Del gráfico se concluye adecuado considerar dos grupos.

Subagrupamientos mediante las variables asociadas a los canales usando k-means :

set.seed(932840)
kc3 <- kmeans(grupo3_scaled[2:16], 2 , nstart = 5, iter.max = 100)

clusplot(grupo3_scaled[,2:16], kc3$cluster, color = TRUE, 
         shade = FALSE, labels = 4, lines = 1,
         col.clus = c("#7070FF", "#00007A"),
         col.p = sapply(kc3$cluster, get_color_grupo3),
         main = "Subgrupos del grupo 3 de financieras mediante K-means", 
         xlab = "Componente principal 1 canales",
         ylab = "Componente principal 2 canales",
         sub = "" )
grid()

Grupo Número de clientes
1 519
2 246

Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables de los canales:

finan3_canal <- data.frame(sub_grupos=kc3$cluster, grupo3_no_scaled)
finan3_canal$sub_grupos <- as.factor(finan3_canal$sub_grupos)
sub_grupos grupos entrada_canal1 entrada_canal2 entrada_canal3 entrada_canal4 entrada_canal5 entrada_canal6 entrada_canal7 entrada_canal8 entrada_canal9 entrada_canal10 entrada_otros salida_canal5 salida_canal2 salida_canal8 salida_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
2 2 3 0.000000e+00 0 0 0 0 0 0 0 0 0 0 0 0.000000e+00 0 0 1 1 2 6 2 1.000 0.000 0 0 0 0 1 3 1 3 4
3 1 3 7.352176e+10 7745007624 204886067 119447064008 12634037247 107777719 208577904975 0 0 0 0 12634037247 1.666626e+13 0 0 1 1 3 1 2 0.456 0.544 1 0 0 0 2 1 2 2 1
5 1 3 6.218878e+11 118748488736 129467842777 9327129803 0 5113117511 0 95065402 178910331 0 0 0 0.000000e+00 0 398753737891 1 1 2 2 2 1.000 0.000 1 0 0 0 2 2 1 3 3
6 1 3 2.993027e+09 4545628846 16185504 0 0 57425400 0 0 8246928 0 0 0 2.117460e+12 0 0 1 1 1 3 1 0.590 0.410 0 0 0 0 1 4 1 5 5
11 1 3 4.242316e+12 829688143534 7361176290 31313400008 75606435508 2525200000 0 6948924 29145531 138459600 0 199336757428 1.513276e+10 0 0 1 1 1 2 2 0.741 0.259 1 0 0 0 2 2 1 3 4
14 2 3 1.486786e+09 68395169098 14387184 0 54486666667 1008000 0 0 0 0 0 54486666667 0.000000e+00 0 0 2 2 2 3 2 0.623 0.377 0 0 0 0 2 3 1 4 4


  • Media de los grupos en la escala original de los canales
media_finan3_canal <- aggregate(.~sub_grupos,data=finan3_canal, FUN=mean)
sub_grupos grupos entrada_canal1 entrada_canal2 entrada_canal3 entrada_canal4 entrada_canal5 entrada_canal6 entrada_canal7 entrada_canal8 entrada_canal9 entrada_canal10 entrada_otros salida_canal5 salida_canal2 salida_canal8 salida_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 3 1.151623e+14 4.738241e+12 2.85260e+13 2.915453e+13 279394386106 72422558801 610877067466 105808222289 197241359614 21430997 158515432162 276357470683 6.657192e+13 906136326.43 949040633 1.477842 1.416185 2.088632 2.475915 2.082852 0.5049846 0.4930983 0.5183044 0.0520231 0.0126802 0.0412697 1.643545 1.703275 1.695568 2.697495 2.635838
2 3 3.021146e+10 1.039947e+11 4.15166e+12 6.742347e+12 7099487067 80509217 93225283561 8385959 2361414 0 6382386316 5628067900 5.487275e+12 17604.88 6819599 1.467480 1.410569 2.117886 2.252032 1.678862 0.5935732 0.3657846 0.1951220 0.0081301 0.0058333 0.0185569 1.451220 1.747967 1.902439 2.471545 2.288618


  • Media de los grupos en escala logaritmo natural de los canales
finan3_canal_log <- finan3_canal

finan3_canal_log[3:17] <- log(finan3_canal[3:17] + 1)

media_finan3_canal <- aggregate(.~sub_grupos,data=finan3_canal_log, FUN=mean)
sub_grupos grupos entrada_canal1 entrada_canal2 entrada_canal3 entrada_canal4 entrada_canal5 entrada_canal6 entrada_canal7 entrada_canal8 entrada_canal9 entrada_canal10 entrada_otros salida_canal5 salida_canal2 salida_canal8 salida_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 3 26.34767 26.41110 17.813120 9.090136 14.147334 20.21784 3.992543 15.817476 15.599222 1.900101 2.8964100 13.735090 24.88216 1.914471 0.9291604 1.477842 1.416185 2.088632 2.475915 2.082852 0.5049846 0.4930983 0.5183044 0.0520231 0.0126802 0.0412697 1.643545 1.703275 1.695568 2.697495 2.635838
2 3 14.65034 17.99466 4.875251 2.683001 4.375379 5.25211 1.026647 1.163172 1.606975 0.000000 0.8076422 4.532006 13.22815 0.062119 0.2327337 1.467480 1.410569 2.117886 2.252032 1.678862 0.5935732 0.3657846 0.1951220 0.0081301 0.0058333 0.0185569 1.451220 1.747967 1.902439 2.471545 2.288618


Análisis del valor medio de los grupos en cada variable


  • De la gráfica anterior, en general el grupo 1 presenta en promedio mayores entradas y salidas de dinero que el grupo 2. Siendo las diferencias más amplia en los canales de entrada 1, 2, 3, 4, 5, 6, 8, 9 y en los canales de salida 5 y 2.

  • Ambos grupos tienen comportamientos y valores muy similares, dado que ambos provienen del grupo 3 formado por las variables financieras, por lo tanto estos dos grupos se diferencian en las variables de los canales, incluso, las pocas diferencias que se perciben en estas variables financieras, puede deberse a que el grupo 1 es el que tiende a tener mayores montos de dinero a través de todos los canales, por lo que se percibe la relación que entre más dinero, mayores nivel en las cuentas por cobrar e inventarios se tiene, además de más tiendas fisicas, sus rotaciones de inventario y ciclos de negocios y financieros son más lentos.


Grupos finales

Dado que en los procedimientos anteriores se obtuvieron grupos y subgrupos, ahora llega el momento de crear los 6 grupos resultates, que consiste en la combinación de un grupo y subgrupo respectivamente:

Grupo 1: grupo 1 subgrupo 1 Grupo 2: grupo 1 subgrupo 2 Grupo 3: grupo 2 subgrupo 1 Grupo 4: grupo 2 subgrupo 2 Grupo 5: grupo 3 subgrupo 1 Grupo 6: grupo 3 subgrupo 2

Grupo1 <- finan1_canal[finan1_canal$sub_grupos==1,] #grupo 1 subgrupo 1
Grupo2 <- finan1_canal[finan1_canal$sub_grupos==2,] #grupo 1 subgrupo 2

Grupo3 <- finan2_canal[finan2_canal$sub_grupos==1,] #grupo 2 subgrupo 1
Grupo4 <- finan2_canal[finan2_canal$sub_grupos==2,] #grupo 2 subgrupo 2

Grupo5 <- finan3_canal[finan3_canal$sub_grupos==1,] #grupo 3 subgrupo 1
Grupo6 <- finan3_canal[finan3_canal$sub_grupos==2,] #grupo 3 subgrupo 2
Grupos sub_grupos grupos entrada_canal1 entrada_canal2 entrada_canal3 entrada_canal4 entrada_canal5 entrada_canal6 entrada_canal7 entrada_canal8 entrada_canal9 entrada_canal10 entrada_otros salida_canal5 salida_canal2 salida_canal8 salida_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
4 1 1 1 6.816608e+09 1.601385e+10 454114370 0 0 237646144 0 108000000 0 0 0 0 7.509247e+09 0 0.000e+00 2 2 1 1 1 0.615 0.385 1 0 0 0 5 2 3 5 5
13 1 1 1 6.637634e+11 7.708352e+12 547474103 27084339545 73426022678 14952014444 0 12373550018 197220571 0 0 63342000000 6.075665e+12 13044000 0.000e+00 4 2 3 3 3 0.519 0.481 1 0 0 0 5 3 4 5 5
15 1 1 1 1.954518e+13 9.448526e+12 78496902169 0 538300959 108798237345 0 3528757423 565768278 0 0 507006570 1.771552e+13 0 1.800e+08 2 2 2 4 2 0.386 0.614 0 0 0 0 2 3 1 4 5
16 1 1 1 8.327681e+08 5.462762e+10 6849104 0 1223337478 0 0 0 1585200 0 0 1223337478 2.190591e+11 9300000 3.429e+09 2 2 1 2 2 0.709 0.291 0 0 0 0 3 3 1 4 5
17 1 1 1 2.916286e+12 2.470397e+11 75421800 7068619658 0 27854989819 0 16017379 64128822 0 0 0 0.000000e+00 7869552 0.000e+00 2 2 4 3 3 1.000 0.000 1 0 0 0 5 3 4 5 3
20 1 1 1 2.237639e+10 4.058523e+10 29382229 0 906111382 121890000 0 0 0 0 0 906111382 1.510882e+12 0 0.000e+00 1 1 1 2 4 0.355 0.645 0 0 0 0 6 3 2 6 6


  • Media de los grupos en escala logaritmo natural para los canales
media_finan_canal <- aggregate(.~Grupos,data=Datos_finales_log, FUN=mean)
Grupos sub_grupos grupos entrada_canal1 entrada_canal2 entrada_canal3 entrada_canal4 entrada_canal5 entrada_canal6 entrada_canal7 entrada_canal8 entrada_canal9 entrada_canal10 entrada_otros salida_canal5 salida_canal2 salida_canal8 salida_otros impo_cv expo_vt cxp cxc totalinventory pagos_pj pagos_pn tiene_ventas_fisicas tiene_ventas_electronicas recaudos_pj recaudos_pn rotacion_inventarios rotacion_cxc rotacion_cxp ciclo_negocio ciclo_financiero
1 1 1 26.61566 26.64070 16.294361 7.735484 14.168457 21.102242 1.0112694 17.249732 17.005363 2.1598069 3.4576728 13.253201 23.61465 2.647167 1.0108119 2.431304 1.852174 2.040000 3.024348 3.659130 0.5968470 0.3944661 0.5130435 0.0539130 0.0121513 0.0521965 4.766957 2.726957 2.233043 5.320000 5.353044
2 2 1 14.92172 16.99768 3.025855 1.021924 5.066280 7.219199 0.5201569 1.852904 1.883247 0.0841949 0.2944962 4.754575 11.34441 0.000000 0.0843097 1.901709 1.602564 1.871795 2.752137 3.111111 0.6992308 0.2537821 0.2094017 0.0042735 0.0005598 0.0079872 4.521368 2.837607 2.222222 5.461538 5.354701
3 1 2 29.30102 29.83030 19.222939 11.847929 18.880602 22.606128 4.3891384 19.516420 18.758969 3.6767910 8.5087482 17.501943 28.76458 4.643689 1.0812154 2.458252 2.009709 4.988349 5.433010 4.916505 0.4238524 0.5742136 0.6970874 0.0990291 0.0796039 0.1495243 3.011651 2.710680 2.584466 4.341748 3.794175
4 2 2 12.83383 16.53001 3.582793 1.733572 2.693302 5.958623 0.6600640 2.756379 1.654763 0.0000000 0.6057181 2.987793 10.16682 0.000000 0.0000000 2.131944 1.868056 5.208333 5.694444 4.479167 0.4927014 0.3892431 0.2916667 0.0000000 0.0064861 0.0143472 2.402778 3.069444 2.763889 4.416667 3.680556
5 1 3 26.34767 26.41110 17.813120 9.090136 14.147334 20.217838 3.9925432 15.817476 15.599222 1.9001011 2.8964100 13.735090 24.88216 1.914471 0.9291604 1.477842 1.416185 2.088632 2.475915 2.082852 0.5049846 0.4930983 0.5183044 0.0520231 0.0126802 0.0412697 1.643545 1.703275 1.695568 2.697495 2.635838
6 2 3 14.65034 17.99466 4.875251 2.683001 4.375379 5.252110 1.0266473 1.163172 1.606975 0.0000000 0.8076422 4.532006 13.22815 0.062119 0.2327337 1.467480 1.410569 2.117886 2.252032 1.678862 0.5935732 0.3657846 0.1951220 0.0081301 0.0058333 0.0185569 1.451220 1.747967 1.902439 2.471545 2.288618


Análisis del valor medio de los grupos en cada variable


Variables de los canales

  • En general el grupo 1, 3 y 5 son los que manejan en promedio mayores montos de dinero en promedio anualmente, por otro lado el grupo 2, 4 y 6 son los que manejan menores montos de dinero en promedio anualmente.

En comparación con las segmentaciones hechas por los anteriores procedimientos esta es la mejor definida, ya que se esperaba que los grupos 1,3,5 fueron más similares entre si y estuvieran más arriba y que el grupo 2,4,6 fueron muy similares entre si y estuvieran más abajo, dado que esto es lo que se ha analizado que pasa en cada una de las subagrupaciones de las variables de los canales.

Variables financieras

  • El grupo 1, 3 y 4 es el que tiene mayor nivel promedio de importaciones y exportaciones, mientras que el grupo 5 y 6 son los que menos realizan importaciones y exportaciones; el grupo 3 y 4 tienen mayor nivel promedio de cuentas por pagar y cobrar y mayor inventario, el grupo 1 y 2 tienen un nivel promedio de cuentas por pagar y cobrar e inventario intermedio mientras que el grupo 5 y 6 tienen un nivel promedio de cuentas por pagar y cobrar e inventario bajos.

  • En general todos los grupos presentan mayor número promedio de ventas fisicas que electronicas, además el grupo 3 es el que presenta mayor promedio de pagos a personas naturales, mayor número promedio de ventas fisicas y electronicas y mayor número promedio de recaudos a personas juridicas y naturales. El grupo 1, 2 y 6 es el que realiza mayor proporción de pagos a personas juridicas, pero son los que realizan menor proporción de pagos a personas naturales. El grupo 2, 4, 6 tiene la menor cantidad de ventas fisicas y electronicas, además de los menores recaudos a personas juridicas y naturales.

  • El grupo 1 y 2, el grupo 3 y 4, el grupo 5 y 6 tiene comportamientos muy similares en las rotaciones de inventario, rotaciones de cuentas por cobrar y pagar y en los ciclos de negocio y financieros, en donde el grupo 5 y 6 es al que le toma menos tiempo promedio realizar estas rotaciones y ciclos, al grupo 1 y 2 le toma mayor tiempo promedio realizar las rotaciones de inventario y hacer los ciclos de negocio y financiero, por otro lado el grupo 4 es al que más tiempo promedio le toma realizar las rotaciones de cuenta por cobrar y pagar.

En general asi los grupos se parezcan entre si, estos se difieren en algo, ya sea en las variables financieras o en los canales.

Conclusión general de los grupos formados

  • Grupo 1: es de los que tiende a manejar mayores montos de dinero y mayor número de transacciones a través de los canales, además de que es uno de los grupos que mayores importaciones y exportaciones realiza, aunque igual el nivel de estas no es tan alto tiene buena cantidad de cuentas por cobrar, además de una gran cantidad de inventarios, que aunque no es la más alta, tiene un nivel promedio. Maneja un valor intermedio ventas fisicas en comparación con los demás grupos, se demora más rotando el inventario y realizando su ciclo de negocio y financiero, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas grandes, de productos, por ello manejan mucho inventario y se demoran mucho para rotarlo, además de que venden y compran productos al exterior.

  • Grupo 2: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, realizan pocas importaciones y exportaciones, tienen pocas cuentas por pagar y aunque tiene mas cuentas por cobrar, tampoco estas son altas, tiene un inventario de un nivel intermedio, es el grupo que tiene mayor porcentaje de pagos a personas juridicas que a personas naturales, además es uno de los grupos con menores ventas fisicas y electronicas, es decir las menores ventas en general, además de ser el grupo que más se demora rotando el inventario y realizando el su ciclo de negocio y financiero, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que quizas no estan tan desarrolladas y estan en un proceso de crecimiento, en donde sus ventas no son las mejores y no tiene tanto contacto a nivel internacional.

  • Grupo 3: es el que tiene mayores montos de dinero y mayor número de transacciones a través de los canales en comparación con el resto de los grupos, es uno de los grupos que mayores importaciones y exportaciones realiza, aunque igual el nivel de estas no es tan alto, tiene un nivel alto en la cuentas por pagar, cuentas por cobrar e inventario, además el grupo 3 es el que presenta mayor promedio de pagos a personas naturales, mayor número de ventas fisicas y electronicas y mayor número de recaudos a personas juridicas y naturales y en general tiene un nivel promedio en las rotaciones y ciclos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas grandes muy desarrolladas, que se manejan a nivel nacional e internacional, que parecen ser de productos dado que manejan el mayor nivel de inventario, además de tiener muchas ventas ya sean fisicas o electronicas y sus rotaciones de inventario y de cuentas al igual que sus ciclos no tienden a ser tan rapidos ni tan lentos.

  • Grupo 4: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, es uno de los grupos que mayores importaciones y exportaciones realiza, aunque igual el nivel de estas no es tan alto, maneja un nivel muy alto de cuenta por cobrar y pagar, también dispone de un nivel alto de inventario, su nivel de ventas es intermedio al igual que la rotación de inventario y ciclo de negocio y financiero y en comparación con los otros grupos es el que tiene las rotaciones de cuentas por cobrar y pagar más lenta, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que ofrecen un servicio o producto en donde su forma de pago no es inmediata, como por ejemplo empresas que realizan pedidos o encargos, empresas distribuidores, etc.

  • Grupo 5: es de los que tiende a manejar mayores montos de dinero y mayor número de transacciones a través de los canales, tiene un nivel bajo de importaciones y exportaciones y un nivel intermedio de cuentas por cobrar, cuentas por pagar e inventario, también tiene un alto porcentaje de pagos a personas juridicas y naturales, además un buen porcentaje de ventas fisicas y en general tiene rotaciones de inventario, rotaciones de cuentas y ciclos relativamente rápidos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que se encargan de distribuir productos nacionales, los cuales tienen un proceso de venta rápido, dado que el inventario no es grande ni pequeño pero tienden a realizar rotaciones en poco tiempo y por el hecho de manejar buen monto de dinero nos da idea de que puede ser una empresa grande o muy bien acreditada.

  • Grupo 6: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, tiene niveles bajos de importaciones, exportaciones, de cuentas por cobrar y pagar e inventario, tiene porcentajes altos de pagos a personas juridicas y naturales y sus rotaciones de inventario, de cuentas y ciclos son rápidos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que en general se espera que no sean grandes y tiendan a ofrecer servicios a nivel nacional.


Comentario adicional:

Los valores extremos encontrados inicialmente en los canales son los siguientes:

“825, 1416, 1462, 1668, 1773”

Los cuales pertenecen al grupo:

“5, 3, 3, 1, 3” respectivamente lo cual significa que todos quedan en los grupos que más dinero mueven y más tranzan por los canales, por lo tanto la segmentación es confiable.

Conclusiones

  • En conclusión, todos los procesos de segmentación arrojaron que se deben de considerar 6 grupos de clientes, estos grupos formados se pueden interpretar y están bien definidas las diferencias entre cada uno ellos, porque a pesar de que hayas cosas similares entre pares de grupos, en algo se diferencias ya sea mediante las variables financieras o el uso de los canales. Cada uno de los grupos tiene sus características particulares en la parte financiera, que es la que indica lo que necesita el cliente de la compañía, de cuáles son las características que hacen identificar cómo se comporta este en su propio entorno y como está estructurada, además que permite definir cada uno de los grupos en como usan los canales que se le ofrecen, con la idea de saber cuál se les puede ofrecer con más certeza y cuales definitivamente no son de su interés.

  • Se resalta la utilidad de los algoritmos de aprendizaje no supervisado, en este caso kmeans que permitió encontrar patrones y características de los clientes que para un humano serían imperceptibles a simple vista.

  • La transformación logarítmica jugo un gran papel ayudando a controlar los valores extremos para obtener mejores agrupaciones al aplicar kmeans y a la hora de visualizar los datos.

  • Durante el desarrollo del trabajo se tuvieron en cuenta otros caminos para llegar a los grupos:

    • El análisis de componentes principales para la reducción de variables antes de realizar el proceso de segmentación.

    • Se intentó modificar las variables, como el cálculo del porcentaje de uso para las variables asociadas a los canales.

    • Uso del algoritmo de segmentación agrupamiento jerárquico.

    • Segmentar aplicando la transformación logaritmo natural y sin aplicarla.

    • Además de tener en cuenta la base de datos completa y decidir realizar una división que agrupara los datos según la naturaleza de las variables (financieras y canales) para obtener mejores resultados.

realmente se pasó por muchas etapas, en este documento se presentan las que generaron mejores resultados e hicieron que los grupos tuvieran mayor sentido.


Que se puede mejorar

  • Se sugiere para futuros trabajos variar las técnicas de escalamiento de los datos por ejemplo min-max y probar otros algoritmos de agrupación y contrastar con los grupos encontrados con kmeans.

  • Sacar las variables que no aportaron mucho a la segmentación, ya que se comportan de manera similar en todos los grupos (ventas físicas, ventas electrónicas, recaudos personas jurídicas, recaudos personas naturales). Y excluir algunas variables en canales que estén fuertemente correlacionadas, es decir hacer una selección de variables basada en la correlación.

  • Dado que se caracterizo a cada uno de los grupos con un perfil puntual, se recomienda a la compañia ofrecerle sus servicios y beneficios en base a este tipo de perfiles, dado que todos tienen un uso similar de los canales pero unos con más frecuencia o mayores montos que otros, entonces mediante esto medir el grado de confiabilidad que se le va a brindar a cada uno de los clientes, además entender que financieramente cada uno tiene sus caracteristicas y por lo tanto aprender a identificar las necesidades que tienen en base a esto.

Referencias