En la actualidad se observa una tendencia en las empresas de adoptar un enfoque orientado hacia sus clientes, los comportamientos y necesidades de estos. Esto implica que la organización y todas las personas pertenecientes a ella deben responder a las necesidades de los diferentes clientes, logrando que la empresa responda en tiempo y en forma oportuna las exigencias del medio.
Aquellas empresas con un enfoque orientado hacia los clientes son más rentables, puesto que al conocer y satisfacer mejor las necesidades de los mismos desarrollan relaciones de largo plazo generando mayor lealtad y la posibilidad de futuras negociaciones.
Por ello, surge la necesidad de realizar un proceso de segmentación de clientes que permita a las empresas dividir a sus consumidores en categorías específicas, basadas en características que se extraen de su comportamiento como clientes y la información que pueden obtener de sus interacciones con la empresa; en este estudio en particular se está trabajando con información de clientes corporativos, es decir, una empresa cuyos clientes también son empresas.
El objetivo es crear grupos de empresas(clientes) para ayudar a la empresa principal, cuyo sector de desarrollo será la banca, con el fin de mejorar el trato a sus clientes además de los servicios y beneficios que les ofrece según sus condiciones, es decir, ayudar a la toma de decisiones para que todo el entorno corporativo funcione de una manera efectiva. Por otro lado, se considera de suma importancia efectuar una segmentación de clientes buscando detectar aquel segmento que genera mayor rentabilidad para el Banco. De este modo, se desarrolla una herramienta que colabore con la nueva percepción de la entidad y que permita migrar con mayor facilidad a un enfoque de gestión orientado hacia los clientes.
El objetivo es crear grupos que tengan sentido es decir interpretables para ser clasificados y caracterizados mediante la identificación de patrones de uso de productos y canales y su relación con los estados financieros y que permitan a la empresa tomar acción sobre esos grupos, como el ofrecimiento de sus servicios y entender más a fondo cómo se comportan en el entorno.
El presente trabajo se concentra en una segmentación de clientes, en este caso empresas, de las cuales se tiene información como el uso de canales de entrada y salida que posee el banco y sus características o estados financieros que permiten entender su estructura, es decir si de servicios, de productos, si es grande, pequeña, si se mueve a nivel nacional y/o internacional, como es el comportamiento de sus inventarios, de sus cuentas por cobrar y pagar y de los diferentes ciclos de negocios y financieros, etc. Esto permite no solo entender como se caracteriza el cliente sino además sus necesidades logrando así ofrecerle servicios que sean beneficiosos, tanto para él como para el banco.
Durante el desarrollo de este trabajo se buscaron diferentes caminos para realizar la segmentación de los clientes. En este documento se presentan las que generaron mejores resultados e hicieron que los grupos tuvieran mayor sentido, además de ello se verificó que todos los procesos fueran estadísticamente válidos.
Entender el entorno donde se desarrolla el trabajo, cual es su objetivo y saber que debido a que es un problema de aprendizaje no supervisado se debe intentar llegar a los resultados que intuitivamente sean más adecuados y coherentes.
Contextualizar la base de datos para lograr una interpretación correcta de cada variable, sus unidades y rangos.
Presentar las variables mediante tablas y gráficas permitiendo entender su comportamiento y estructura
Realizar un correcto análisis descriptivo buscando tener las condiciones óptimas como la aplicación de transformaciones y escalamiento de variables para ser utilizadas de manera correcta en los distintos métodos para el proceso de segmentación.
Idear diferentes caminos a seguir para realizar los agrupamientos mediante k-means.
De los caminos seguidos en el punto anterior, escoger el mejor con el fin de realizar comparaciones que sean de provecho.
Caracterizar los diferentes grupos.
Plantear posibles estrategias o dar recomendaciones al banco buscando mejorar el trabajo que desarrollan con sus diferentes grupos de clientes.
Dar conclusiones sobre el estudio.
El estudio se quiere contextualizar en un entorno o sector bancario, este tiene como clientes a empresas que utilizan sus diferentes servicios por medio de canales de entrada y de salida que tienen fines específicos para cada cliente, es decir, cada cliente puede utilizar diversos canales, con montos y número de transacciones diferente.
Por lo tanto, el objetivo de la entidad bancaria es comprender cómo pueden agruparse sus diferentes clientes según sus características financieras y según el uso que hacen de los canales con el fin de ofrecerles condiciones que se adapten más a sus hábitos. Además, se busca incentivar su participación, permitiendo beneficios por medio de los canales que son de su interés.
Es por esto que la entidad bancaria busca obtener un proceso de segmentación muy bien elaborado, que le permita tomar decisiones frente a sus clientes y contribuya al crecimiento de la organización. Así mismo, es importante entender a los clientes actuales, buscando entender a los nuevos clientes que puedan llegar ya que se les ofrecería los servicios que mejor se adapten a sus características.
Contextualización de variables
Variables de canales (¿Cómo te usa el cliente?)
en_vm_canalX: valor del ticket promedio de entrada por el canal X
sal_vm_canalX: valor del ticket promedio de salida por el canal X
en_tx_canalX: cantidad de transacciones de entrada mensuales en promedio por el canal X
sal_tx_canalX: cantidad de transacciones de salida mensuales en promedio por el canal X
Variables financieras (¿Qué necesita el cliente?)
impo_cv: Variable categorizada que hace referencia al porcentaje de insumos que cada empresa obtiene mediante importación.
expo_vt: Variable categorizada que hace referencia al porcentaje de producción que cada empresa tiene destinado para exportación.
cxp: Número de cuentas por pagar que tiene cada cliente (Deudas). Está categorizada en 6 niveles.
cxc: Número de cuentas por cobrar que tiene cada cliente (Adquisiciones). También puede hacer referencia a lo que el cliente ha vendido y todavía no ha sido pagado.
totalinventory: Valor de los inventarios de la empresa al 31 de Diciembre. Está categorizada en 6 niveles, si presta servicios son casi 0. También hace referencia a lo que está para la venta pero no se ha vendido.
pagos_pj: Porcentaje de los pagos que van hacia empresas. Se obtiene de dividir los pagos hechos a personas jurídicas sobre los pagos totales
pagos_pn: Porcentaje de los pagos que van hacia personas. Se obtiene de dividir los pagos hechos a personas naturales sobre los pagos totales
tiene_ventas_fisicas: la empresa tiene puntos de venta físicos (1:Si, 0:No)
tiene_ventas_electronicas: la empresa tiene ventas electrónicas (1:Si, 0:No)
recaudos_pj: Porcentaje de los recaudos que provienen de empresas. Se obtiene al dividir recaudos provenientes de personas jurídicas sobre los recaudos totales.
recaudos_pn: Porcentaje de los recaudos que provienen de personas. Se obtiene al dividir recaudos provenientes de personas naturales sobre los recaudos totales.
recaudo: todos los ingresos registrados en un tiempo estimado.
rotacion_inventarios: Índice del número de veces que se han renovado las existencias en días, es decir, a cantidad de días que le toma a la empresa realizar rotación de inventarios. Está categorizada con seis niveles, donde entre menor sea el nivel de esta variable, más rápido se venden el producto o servicio que la empresa ofrece.
rotacion_cxp: Hace referencia a la rotación de cuentas por pagar medida en días, esta es un índice que refleja la velocidad con que la empresa ha pagado las deudas contraídas con proveedores ,es decir, capacidad de saldar sus deudas. Está categorizada con 4 niveles.
rotacion_cxc: Hace referencia a la rotación de cuentas por cobrar medida en días, esta es un índice de la velocidad con la que una empresa cobra sus cuentas, es decir, capacidad de transformarlas en dinero efectivo. Está categorizada con 4 niveles.
ciclo_negocio: Es el ciclo de negocio medido en días, es decir, el índice del número de días que le toma a una empresa llevar a cabo todas sus operaciones de negocio. Está categorizada con 6 niveles.
ciclo_financiero: Es el ciclo financiero medido en días, es decir, el índice del número de días que le toma a una empresa llevar a cabo todas sus operaciones financieras. Entre más pequeño, más rápido recupera la empresa su inversión. Está categorizada con 6 niveles.
| en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000 | 0.000000 | 0.000000 | 0.00000 | 0.000000 | 0.00 | 0.00 | 0.0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000 | 0.00000 | 0 | 0.00000 | 1 | 1 | 6 | 6 | 6 | 0.000 | 0.000 | 0 | 0 | 0 | 0 | 6 | 2 | 2 | 5 | 6 |
| 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000 | 0.000000 | 0.000000 | 0.00000 | 0.000000 | 0.00 | 0.00 | 0.0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000 | 0.00000 | 0 | 0.00000 | 1 | 1 | 2 | 6 | 2 | 1.000 | 0.000 | 0 | 0 | 0 | 0 | 1 | 3 | 1 | 3 | 4 |
| 250927493 | 54160892 | 5122152 | 41852510 | 413614315 | 1663236 | 2106847525 | 0 | 0 | 0 | 0 | 24.416667 | 11.916667 | 3.333333 | 237.83333 | 2.545454 | 5.40 | 8.25 | 0.0 | 0 | 0 | 0 | 413614315 | 2265361194 | 0 | 0 | 2.545454 | 613.08333 | 0 | 0.00000 | 1 | 1 | 3 | 1 | 2 | 0.456 | 0.544 | 1 | 0 | 0 | 0 | 2 | 1 | 2 | 2 | 1 |
| 39402360 | 96468998 | 8226710 | 0 | 0 | 7072802 | 0 | 9000000 | 0 | 0 | 0 | 14.416667 | 13.833333 | 4.600000 | 0.00000 | 0.000000 | 2.80 | 0.00 | 1.0 | 0 | 0 | 0 | 0 | 60558440 | 0 | 0 | 0.000000 | 10.33333 | 0 | 0.00000 | 2 | 2 | 1 | 1 | 1 | 0.615 | 0.385 | 1 | 0 | 0 | 0 | 5 | 2 | 3 | 5 | 5 |
| 337432319 | 234217927 | 105344054 | 15755287 | 0 | 23671840 | 0 | 3600962 | 3727299 | 0 | 0 | 153.583333 | 42.250000 | 102.416667 | 49.33333 | 0.000000 | 18.00 | 0.00 | 2.2 | 4 | 0 | 0 | 0 | 0 | 0 | 622080714 | 0.000000 | 0.00000 | 0 | 53.41667 | 1 | 1 | 2 | 2 | 2 | 1.000 | 0.000 | 1 | 0 | 0 | 0 | 2 | 2 | 1 | 3 | 3 |
| 33629514 | 42883291 | 1348792 | 0 | 0 | 3828360 | 0 | 0 | 687244 | 0 | 0 | 7.416667 | 8.833333 | 1.000000 | 0.00000 | 0.000000 | 1.25 | 0.00 | 0.0 | 1 | 0 | 0 | 0 | 1960611436 | 0 | 0 | 0.000000 | 90.00000 | 0 | 0.00000 | 1 | 1 | 1 | 3 | 1 | 0.590 | 0.410 | 0 | 0 | 0 | 0 | 1 | 4 | 1 | 5 | 5 |
| Filas | Columnas |
|---|---|
| 2233 | 46 |
El conjunto de datos cuenta con 2233 registros, es decir, 2233 empresas que son clientes de la compañía en la que se va a realizar el estudio.
Hay 46 variables de las cuales, la primeras 30 reflejan el uso que cada uno de los clientes le da a los canales ofrecidos por la organización, estos se dividen en canales de entrada y de salida donde algunos miden montos de dinero y otros el número de transacciones realizadas en cada canal. Las 16 variables restantes tienen que ver con características financieras que permiten conocer algunas peculiaridades del perfil o estructura de la empresa(cliente).
Para las variables asociadas a los canales se realiza la transformación logaritmo natural para trabajar con escalas que permitan una mejor visualización y comprensión del comportamiento de estas, esta transformación es de mucha utilidad cuando se cuenta con valores extremos, que en este caso particular se presentan y han hecho menos viable la compresión de las diferentes variables, además de que esta transformación solo cambia la escala y permite que muchas interpretaciones se puedan seguir realizando como cuáles canales son los que manejan mayores o menores montos de dinero o mayor o menor número de transacciones, por lo tanto esta transformación da habilidad para acotar el rango de la variable en una cantidad más pequeña que la original. Este efecto reduce la sensibilidad de las estimaciones a las observaciones extremas, lo cual en este estudio ha sido de mucha utilidad y ha permitido realizar unas mejores agrupaciones.
Dado que se está trabajando con el algoritmo k-means el cual está basado en distancias, la escala de las diferencias variables influyen mucho en los resultados que se obtienen, lo que lleva a dar más peso a variables cuyos rangos son más grandes, por lo tanto se acudió a un procedimiento que se llama escalamiento o estandarización de variables, el cual permite trabajar sobre un mismo rango de valores en las diferentes variables ya que permite quitar las unidades de medidas de cada uno de las variables, permitiendo que estas se puedan comparar entre sí sin problema.
Canal_log <- log(Canal_no_scaled + 1)
Canal_log_scaled <- scale(log(Canal_no_scaled + 1), center = T, scale = T)| en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Min. : 0.00 | Min. : 0.0 | Min. : 0.00 | Min. : 0.0 | Min. : 0.0 | Min. : 0.000 | Min. : 0 | Min. : 0.000 | Min. : 0.000 | Min. : 0.0000 | Min. : 0.0 | Min. : 0.0 | Min. : 0.0 | Min. : 0.00 | Min. : 0.0000 | |
| 1st Qu.: 51.38 | 1st Qu.: 224.6 | 1st Qu.: 0.00 | 1st Qu.: 0.0 | 1st Qu.: 0.0 | 1st Qu.: 0.598 | 1st Qu.: 0 | 1st Qu.: 0.000 | 1st Qu.: 0.000 | 1st Qu.: 0.0000 | 1st Qu.: 0.0 | 1st Qu.: 0.0 | 1st Qu.: 11.4 | 1st Qu.: 0.00 | 1st Qu.: 0.0000 | |
| Median : 348.67 | Median : 961.2 | Median : 1.26 | Median : 0.0 | Median : 4.2 | Median : 9.021 | Median : 0 | Median : 1.909 | Median : 1.509 | Median : 0.0000 | Median : 0.0 | Median : 0.2 | Median : 660.8 | Median : 0.00 | Median : 0.0000 | |
| Mean : 1853.34 | Mean : 5073.0 | Mean : 198.00 | Mean : 436.7 | Mean : 2120.2 | Mean : 123.494 | Mean : 1066 | Mean : 28.877 | Mean : 12.474 | Mean : 0.9863 | Mean : 257.1 | Mean : 2115.9 | Mean : 5191.3 | Mean : 12.56 | Mean : 0.9051 | |
| 3rd Qu.: 1229.57 | 3rd Qu.: 3114.0 | 3rd Qu.: 8.26 | 3rd Qu.: 3.7 | 3rd Qu.: 300.0 | 3rd Qu.: 47.120 | 3rd Qu.: 0 | 3rd Qu.: 7.916 | 3rd Qu.: 7.012 | 3rd Qu.: 0.0000 | 3rd Qu.: 0.0 | 3rd Qu.: 300.6 | 3rd Qu.: 2473.2 | 3rd Qu.: 0.00 | 3rd Qu.: 0.0000 | |
| Max. :251092.00 | Max. :695285.0 | Max. :52076.54 | Max. :405096.0 | Max. :806965.0 | Max. :14523.637 | Max. :770542 | Max. :10038.466 | Max. :5408.477 | Max. :180.4752 | Max. :160039.0 | Max. :806965.0 | Max. :856183.0 | Max. :23931.43 | Max. :622.0807 |
| en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Min. : 0.00 | Min. : 0.000 | Min. : 0.0 | Min. : 0 | Min. : 0.000 | Min. : 0.000 | Min. : 0.000 | Min. : 0.000 | Min. : 0.000 | Min. : 0.0000 | Min. : 0 | Min. : 0.000 | Min. : 0.0 | Min. : 0.000 | Min. : 0.0000 | |
| 1st Qu.: 4.67 | 1st Qu.: 7.583 | 1st Qu.: 0.0 | 1st Qu.: 0 | 1st Qu.: 0.000 | 1st Qu.: 1.083 | 1st Qu.: 0.000 | 1st Qu.: 0.000 | 1st Qu.: 0.000 | 1st Qu.: 0.0000 | 1st Qu.: 0 | 1st Qu.: 0.000 | 1st Qu.: 1.0 | 1st Qu.: 0.000 | 1st Qu.: 0.0000 | |
| Median : 48.08 | Median : 38.250 | Median : 1.9 | Median : 0 | Median : 1.000 | Median : 3.889 | Median : 0.000 | Median : 1.333 | Median : 1.500 | Median : 0.0000 | Median : 0 | Median : 1.000 | Median : 122.7 | Median : 0.000 | Median : 0.0000 | |
| Mean : 622.49 | Mean : 122.008 | Mean : 863.6 | Mean : 2624 | Mean : 5.697 | Mean : 18.892 | Mean : 7.822 | Mean : 20.843 | Mean : 10.553 | Mean : 0.1591 | Mean : 670 | Mean : 5.702 | Mean : 763.9 | Mean : 2.472 | Mean : 0.9025 | |
| 3rd Qu.: 235.92 | 3rd Qu.: 122.833 | 3rd Qu.: 8.8 | 3rd Qu.: 6 | 3rd Qu.: 4.364 | 3rd Qu.: 16.000 | 3rd Qu.: 0.000 | 3rd Qu.: 3.833 | 3rd Qu.: 4.222 | 3rd Qu.: 0.0000 | 3rd Qu.: 0 | 3rd Qu.: 4.167 | 3rd Qu.: 561.3 | 3rd Qu.: 0.000 | 3rd Qu.: 0.0000 | |
| Max. :289252.33 | Max. :4638.833 | Max. :438619.6 | Max. :3510700 | Max. :519.167 | Max. :669.667 | Max. :2446.500 | Max. :5492.667 | Max. :1763.778 | Max. :11.8333 | Max. :466385 | Max. :516.500 | Max. :73057.6 | Max. :4586.000 | Max. :579.2121 |
Gráfico de la media en logaritmo natural de cada variable asociadas a los canales
plot(1:30, colMeans(Canal_log), type = 'b', xaxt = "n", xlab = '',
lwd = 2, ylab = 'Media', col="cyan4", main="Gráfico de la medias de los canales en logaritmo natural", pch=19)
axis(1, 1:30, names(df)[1:30], las = 2, cex.axis = 0.7)
grid()Análisis de los canales de entrada:
Los canales de entrada que manejan un monto promedio más alto de dinero son: canal1, canal2, canal6, canal8 y canal9.
Los canales de entrada que manejan un monto promedio más bajo de dinero son: canal4, canal7, canal10 y canalOtros.
Los canales de entrada que manejan en promedio un mayor número de transacciones son: canal1 y canal2
Los canales de entrada que manejan en promedio un número intermedio de transacciones son: canal3, canal4, canal5, canal6, canal8 y canal9.
Los canales de entrada que manejan en promedio un menor número de transacciones son: canal7, canal10 y CanalOtros.
En general, en los canales de entrada, el canal1 y el canal2 son los que manejan un mayor monto promedio de dinero y un mayor número de transacciones; por otro lado, el canal7 y el canal10 son los que manejan menor monto promedio de dinero y un menor número de transacciones. También se puede visualizar particularmente que a pesar de que el canal5 maneja un mayor monto promedio de dinero que el canal4, en el canal5 se presenta un menor número de transacciones que en el canal4.
Análisis de los canales de salida:
El canal de salida que maneja un monto promedio mayor de dinero es el canal2.
El canal de salida que maneja un monto promedio intermedio de dinero es el canal5.
Los canales de salida que manejan un monto promedio menor de dinero son el canal8 y canalOtros.
El canal de salida que maneja en promedio un mayor número de transacciones es el canal2.
Los canales de salida que manejan en promedio un menor número de transacciones son el canal5, canal8 y CanalOtros, aunque entre estos el canal5 es el que realiza un mayor número de transacciones.
En general en los canales de salida, el canal2 es el que maneja un mayor monto promedio de dinero, además un mayor número de transacciones; por otro lado el canal8 y canalOtros son los que manejan los menores montos promedio de dinero y menor números de transacciones.
library(corrplot)
corrplot(cor(Canal_no_scaled),
method="color",
type="upper", order='original',
addCoef.col = "black", # Add coefficient of correlation
tl.col="black", tl.srt=45, #Text label color and rotation
sig.level = 0.01, insig = "blank",
number.cex = 0.5,
# hide correlation coefficient on the principal diagonal
diag=FALSE
)El canal de entrada 3 parece estar positivamente correlacionado con el canal de entrada 9 y con el número de transacciones por el canal 3 y 9.
El canal de entrada 4 parece estar positivamente correlacionado con los canales de entrada 5 y 7, con el número de transacciones por el canal 4 y con el canal de salida 5.
Existe una fuerte correlación lineal positiva entre el canal de entrada 5 y el número de transacciones en el canal 4 y el canal 2 de salida. Además de una correlación de 1 con el canal 5 de salida.
Parece que el canal de entrada 6 no se encuentra linealmente correlacionado con los demás canales.
Existe una fuerte correlación lineal positiva entre el número de transacciones del canal 4 y el canal 2 de salida.
El canal de entrada 8 parece estar positivamente correlacionado con el canal 8 de salida.
El canal de entrada otros parece estar positivamente correlacionado con el número de transacciones del canal 1.
Existe una fuerte correlación lineal positiva entre el número de transacciones del canal 5 y el número de transacciones por el canal 2 de salida.
El canal 2 de salida parece estar positivamente correlacionado con el canal 2 de salida.
Análisis descriptivo de las variables financieras:
Gráficos de frecuencias relativas para las variables categoricas
Gráficos de histograma para las variables continuas
impo_cv: Más del 60% de los clientes tiene un nivel de importación entre 1 y 2.
expo_vt: Más del 50% de los clientes tiene un nivel del exportación de 2.
cxp: Más del 50% de los clientes tiene un número bajo de cuentas por pagar (1 y 2). También destaca que más del 15% de los clientes están en el nivel más alto de cuentas por pagar (6).
cxc: Más del 25% de los clientes se encuentran en el nivel más alto del número de cuentas por cobrar (6), sin embargo más del 55% de los clientes se encuentra en el nivel 1, 2 y 3 de cuentas por cobrar.
totalinventory: Casi un 25% de los clientes está en el nivel más alto del valor de inventario al 31 de diciembre, el grueso de los clientes se encuentra en el nivel 1, 2 y 3.
pagos_pj:
El 75% de los clientes tiene un porcentaje de pago a personas jurídicas que ronda entre el 31.6 y el 77.4 porciento.
También se puede observar que en promedio el porcentaje de pago a personas jurídicas está en el 53.9%.
Aproximadamente un 25% de los clientes de la empresa, tiene un porcentaje de pago a personas jurídicas que ronda entre el 78 y el 100 porciento.
pagos_pn:
El 75% de los clientes tiene un porcentaje de pago a personas naturales que ronda entre el 20 y el 66.5 porciento.
También se puede observar que en promedio el porcentaje de pago a personas naturales está en el 44%.
Aproximadamente un 25% de los clientes de la empresa, tiene un porcentaje de pago a personas naturales que ronda entre el 0 y el 19 porciento.
tiene_ventas_fisicas: El 52.4% de los clientes no tiene ventas físicas, mientras que el 47.5% sí.
tiene_ventas_electronicas: Aproximadamente el 95% de los clientes no tiene ventas electrónicas.
recaudos_pj: El 93.2% de los clientes de la empresa no tienen ingresos provenientes de personas jurídicas. Aproximadamente el 0.8% de los clientes tienen todos sus ingresos de personas jurídicas.
recaudos_pn: El 92.1% de los clientes de la empresa no tiene ingresos provenientes de personas naturales. Aproximadamente el 2% de los clientes tienen todos sus ingresos de personas naturales.
rotacion_inventarios: Un poco más del 20% de los clientes se encuentra en el nivel de rotación más lento de inventario en días (nivel 6). Aproximadamente el 48% de los clientes se encuentra en el nivel de rotación más rápido (nivel 1 y 2).
rotacion_cxc: Aproximadamente el 55% de los clientes tiene una velocidad alta (nivel 1 y 2) para cobrar sus cuentas.
rotacion_cxp: Aproximadamente el 65% de los clientes tiene una velocidad alta (nivel 1 y 2) para pagar sus cuentas.
ciclo_negocio: El 45% de los clientes tiene un ciclo de negocio lento, es decir en los niveles más altos (5 y 6). Aproximadamente el 23% de los clientes tiene un ciclo de negocio nivel 4, es decir medio-lento.
ciclo_financiero: El 45% de los clientes tiene un ciclo de financiero lento, es decir en los niveles más altos (5 y 6).
Se observa una relación inversamente proporcional entre las variables pagos_pj y pagos_pn, con una correlación de 0.88.
Se observa una buena relación lineal entre las variables rotacion_inventarios y ciclo_negocio, con un coeficiente de correlación de 0.77.
Se observa una relación positiva buena entre ciclo_negocio y ciclo_financiero, con un coeficiente de correlación del 0.77.
Se observa una relación moderada entre rotacion_inventarios y ciclo_financiero, con una correlación de 0.65.
Se observa una relación moderada entre ciclo_negocio y rotacion_cxc, con una correlación de 0.59.
Se observa una relación positiva grande entre impo_cv y expo_vt, con una correlación de 0.87.
Se observa una relación positiva moderada entre totalinventory y cxp, con una correlación de 0.58.
Se observa una relación positiva moderada entre totalinventory y cxc, con una correlación de 0.52.
Se observa una relación positiva moderada entre cxp y cxc, con una correlación de 0.68.
Ya que se tuvo una exploración de las diferentes variables de canales y financieras, se pudo comprender que el comportamiento de los clientes en este tipo de variables es muy particular, ya que las variables asociadas a los canales ayudan a entender mejor como usa el cliente la compañía y las variables financieras muestran que necesita el cliente de la compañía a partir de sus características. Por este motivo se considera que los procedimientos de segmentación de clientes se deben hacer de manera independiente entre las variables de los canales y las variables financieras, dado que se espera que salgan grupos muy diferentes realizando la segmentación mediante estos dos tipos de variables debido a que cada una estudia perspectivas muy diferentes del cliente. Se concilió entonces, realizar el proceso de segmentación por un tipo de variable y luego realizar subgrupos por el otro tipo de variable a partir de los grupos creados inicialmente.
Las variables de los canales son variables cuantitativas que en general tienen valores extremos, al ser utilizados en la segmentación pueden crear un gran impacto en los grupos resultantes, dado que el algoritmo que se usa “K-means” es muy sensible a observaciones extremas, por lo tanto para solucionar este problema se decide realizar una transformación logaritmo natural sobre las variables asociadas a los canales.
(¿Por qué realizar la transformación de logaritmo natural?)
Además de ello el algoritmo de segmentación K-means es muy sensible a las unidades de las diferentes variables dado que está basado en distancias, por lo tanto, así se aplique una transformación logaritmo natural, se deben escalar las variables para que todas puedan ser comparadas entre sí y los resultados sean estadísticamente válidos.
¿Por qué escalar las variables para realizar las agrupaciones?
Dado que en nuestra base de datos no existe una variable respuesta específica que se desee predecir, una forma relativamente rápida de detectar patrones y determinar características similares entre los clientes es la clasificación no supervisada o análisis de agrupamiento (clustering).
En este caso se utiliza el algoritmo de agrupación K-means, el cual consiste en que para un conjunto de datos de variables numéricas se repiten una serie de pasos hasta asignar cada observación a uno de k grupos donde la distancia a la media del grupo sea la más corta.
En este caso, se decide realizar una segmentación mediante las variables asociadas a los canales y en cada uno de los grupos que se obtengan a partir de esta se va a realizar una segmentación adicional (subgrupos) teniendo en cuenta las variables financieras, de tal manera que cada grupo final se caracterice por tener un comportamiento particular tanto en las variables de los canales como en las variables financieras.
A continuación se presenta el procedimiento desarrollado realizando una segmentación con todas las variables asociadas a los canales, primero se les aplica logaritmo natural y luego se escalan, posteriormente en cada uno de los grupos resultantes se realiza una subagrupación solo teniendo en cuenta las variables financieras:
library(ggdendro)
library(ggplot2)
require(factoextra)
dendrogram <- hclust(dist(Canal_log_scaled, method = 'euclidean'), method = 'ward.D')
plot(dendrogram, xlab="", sub="", cex=0.9)
rect.hclust(dendrogram, k=2, border="cyan4")require(cluster)
set.seed(93285)
Agru_canal<- kmeans(Canal_log_scaled, 2 , nstart = 5, iter.max = 100)
clusplot(Canal_log_scaled, Agru_canal$cluster, color = TRUE,
shade = FALSE, labels = 4, lines = 1,
col.clus = c("darkgreen", "darkblue"),
col.p = ifelse(Agru_canal$cluster == 2, "darkblue","darkgreen"),
main = "Grupos seleccionados de canales mediante K-means",
xlab = "Componente principal 1 canales",
ylab = "Componente principal 2 canales",
sub = "")
grid()En el gráfico anterior se puede observar una representación en dos dimensiones de los grupos encontrados por K-means.
grupos <- as.factor(Agru_canal$cluster) # Se extraen los grupos
# Se agrega a los canales la variable grupo
canal_group <- data.frame(grupos, Canal_no_scaled)| grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000 | 0.000000 | 0.000000 | 0.00000 | 0.000000 | 0.00 | 0.00 | 0.0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000 | 0.00000 | 0 | 0.00000 |
| 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000 | 0.000000 | 0.000000 | 0.00000 | 0.000000 | 0.00 | 0.00 | 0.0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000 | 0.00000 | 0 | 0.00000 |
| 1 | 250927493 | 54160892 | 5122152 | 41852510 | 413614315 | 1663236 | 2106847525 | 0 | 0 | 0 | 0 | 24.416667 | 11.916667 | 3.333333 | 237.83333 | 2.545454 | 5.40 | 8.25 | 0.0 | 0 | 0 | 0 | 413614315 | 2265361194 | 0 | 0 | 2.545454 | 613.08333 | 0 | 0.00000 |
| 2 | 39402360 | 96468998 | 8226710 | 0 | 0 | 7072802 | 0 | 9000000 | 0 | 0 | 0 | 14.416667 | 13.833333 | 4.600000 | 0.00000 | 0.000000 | 2.80 | 0.00 | 1.0 | 0 | 0 | 0 | 0 | 60558440 | 0 | 0 | 0.000000 | 10.33333 | 0 | 0.00000 |
| 1 | 337432319 | 234217927 | 105344054 | 15755287 | 0 | 23671840 | 0 | 3600962 | 3727299 | 0 | 0 | 153.583333 | 42.250000 | 102.416667 | 49.33333 | 0.000000 | 18.00 | 0.00 | 2.2 | 4 | 0 | 0 | 0 | 0 | 0 | 622080714 | 0.000000 | 0.00000 | 0 | 53.41667 |
| 2 | 33629514 | 42883291 | 1348792 | 0 | 0 | 3828360 | 0 | 0 | 687244 | 0 | 0 | 7.416667 | 8.833333 | 1.000000 | 0.00000 | 0.000000 | 1.25 | 0.00 | 0.0 | 1 | 0 | 0 | 0 | 1960611436 | 0 | 0 | 0.000000 | 90.00000 | 0 | 0.00000 |
| grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 3052845467 | 7729555004 | 341362868 | 739955168 | 3565396603 | 209593817 | 1818052483 | 49189977 | 21137779 | 1674443.75 | 446423983 | 1070.02973 | 199.51983 | 1467.68709 | 4438.3730 | 9.2530307 | 31.586029 | 12.753469 | 35.8568139 | 17.9665620 | 0.2710424 | 1160.916608 | 3571259229 | 8316097293 | 21876763.03 | 1507134.75 | 9.2788245 | 1205.3505 | 4.286158 | 1.4486338 |
| 2 | 239299231 | 1498440969 | 5102830 | 28758148 | 175670136 | 7638942 | 54804920 | 1544850 | 816903 | 60337.35 | 2402784 | 20.28635 | 17.70836 | 50.76329 | 181.7786 | 0.9116181 | 1.810945 | 1.186824 | 0.6407367 | 0.5766897 | 0.0084034 | 9.418356 | 157664225 | 986508168 | 17207.66 | 94969.53 | 0.8896961 | 169.8572 | 0.030042 | 0.1675477 |
| Grupo | Número de clientes |
|---|---|
| 1 | 1281 |
| 2 | 952 |
El grupo 1 cuenta con 1281 clientes y el grupo 2 con 952 clientes, en general el grupo 1 tiene a los clientes que tienden a manejar montos más altos de dinero y mayor número de transacciones por todos los canales en comparación con los del grupo 2.
En términos generales, se puede observar que el grupo 1 presenta en promedio un monto y un número mayor de transacciones.
Se puede notar una mayor dispersión del grupo 2 en los canales de entrada 3, 6, 8, y 9 y en el grupo1 en el canal otros.
En general en los canales de entrada asociados al número de transacciones el grupo 1 presenta una mayor dispersión, en parte debido a una mayor cantidad de valores extremos.
En los canales de salida, tanto para montos como para transacciones, el grupo 1 parece estar más disperso en el canal 5, mientras que el grupo 2 lo está en el canal 2, en el resto de canales el comportamiento es similar aunque el grupo 1 presenta más valores extremos.
df_scaled_group <- data.frame(grupos, Canal_log_scaled, finan_scaled) #conjunto de datos escalados
#Separacion de los grupos formados, variables escaladas
grupo1_scaled <- df_scaled_group[df_scaled_group$grupos==1,]
grupo2_scaled <- df_scaled_group[df_scaled_group$grupos==2,]
#conjunto de datos original mas la variable grupos
df_group <- data.frame(grupos,df)
#Separacion de los grupos formados, variables sin escalar
grupo1_no_scaled <- df_group[df_group$grupos==1,]
grupo2_no_scaled <- df_group[df_group$grupos==2,]
#Logaritmo natural en las variables de los canales
df_group_log <- df_group
df_group_log[, 2:31] <- log(df_group[, 2:31] + 1)
#Media de los grupos, canales escala-log natural
media_df_grupcanal <- aggregate(.~grupos,data=df_group_log, FUN=mean)Gráfico de los grupos en las variables de los canales
De la gráfica anterior, se puede ver que en general hay un comportamiento similar entre ambos grupos, sin embargo, el grupo 1 presenta un monto y un número mayor de transacciones promedio. Siendo la diferencia más amplia en los canales de entrada 3, 5, 6, 8, 9 y en los canales de salida 5 y 2.
El grupo 1 maneja montos de dinero y número de transacciones promedio más grandes en los canales, a su vez, se pueden observar valores promedios más grandes en las cuentas por pagar, cuentas por cobrar y en el total de inventario y aunque el número de importaciones y exportaciones promedio es mayor que la del grupo 2, la diferencia es muy pequeña, además el grupo 1 tiende a tener una mayor proporción de tiendas físicas. En las demás variables el comportamiento promedio es bastante similar.
Agrupamiento por variables financieras para el grupo 1 de canales:
Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar
dendrogram <- hclust(dist(grupo1_scaled[,32:47], method = 'euclidean'), method = 'ward.D')
plot(dendrogram, xlab="", sub="", cex=0.9)
rect.hclust(dendrogram, k=3, border="cyan4")Del dendograma anterior se concluye considerar 3 subgrupos.
set.seed(9325)
kc1 <- kmeans(grupo1_scaled[,32:47], 3 , nstart = 5, iter.max = 100)
clusplot(grupo1_scaled[,32:47], kc1$cluster, color = TRUE,
shade = FALSE, labels = 4, lines = 1,
col.clus = c("#46EB65", "#206B2E", "#B2F768"),
col.p = sapply(kc1$cluster, get_color_grupo1),
main = "Subgrupos del grupo 1 de canales mediante K-means",
xlab = "Componente principal 1 canales",
ylab = "Componente principal 2 canales",
sub = "")
grid()| Grupo | Número de clientes |
|---|---|
| 1 | 620 |
| 2 | 180 |
| 3 | 481 |
Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables financieras
canal1_finan <- data.frame(sub_grupos=kc1$cluster, grupo1_no_scaled)
canal1_finan$sub_grupos <- as.factor(canal1_finan$sub_grupos)| sub_grupos | grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 3 | 3 | 1 | 250927493 | 54160892 | 5122152 | 41852510 | 413614315 | 1663236 | 2106847525 | 0 | 0 | 0 | 0 | 24.41667 | 11.91667 | 3.333333 | 237.83333 | 2.545454 | 5.400000 | 8.25 | 0.00000 | 0.000000 | 0 | 0 | 413614315 | 2265361194 | 0 | 0 | 2.545454 | 613.083333 | 0 | 0.00000 | 1 | 1 | 3 | 1 | 2 | 0.456 | 0.544 | 1 | 0 | 0 | 0 | 2 | 1 | 2 | 2 | 1 |
| 5 | 3 | 1 | 337432319 | 234217927 | 105344054 | 15755287 | 0 | 23671840 | 0 | 3600962 | 3727299 | 0 | 0 | 153.58333 | 42.25000 | 102.416667 | 49.33333 | 0.000000 | 18.000000 | 0.00 | 2.20000 | 4.000000 | 0 | 0 | 0 | 0 | 0 | 622080714 | 0.000000 | 0.000000 | 0 | 53.41667 | 1 | 1 | 2 | 2 | 2 | 1.000 | 0.000 | 1 | 0 | 0 | 0 | 2 | 2 | 1 | 3 | 3 |
| 11 | 3 | 1 | 1595455311 | 819040616 | 19735057 | 43250553 | 370619782 | 25252000 | 0 | 579077 | 1571573 | 11538300 | 0 | 221.58333 | 84.41667 | 31.083333 | 60.33333 | 17.000000 | 8.333333 | 0.00 | 1.00000 | 1.545454 | 1 | 0 | 666678118 | 138832642 | 0 | 0 | 24.916667 | 9.083333 | 0 | 0.00000 | 1 | 1 | 1 | 2 | 2 | 0.741 | 0.259 | 1 | 0 | 0 | 0 | 2 | 2 | 1 | 3 | 4 |
| 12 | 3 | 1 | 4219657307 | 1766126975 | 2012687388 | 0 | 0 | 75341542 | 1077317025 | 5962060 | 34572613 | 0 | 0 | 1065.75000 | 154.08333 | 1748.916667 | 0.00000 | 0.000000 | 19.583333 | 23.25 | 1.62500 | 22.111111 | 0 | 0 | 0 | 3383677202 | 0 | 0 | 0.000000 | 1664.166667 | 0 | 0.00000 | 2 | 2 | 6 | 4 | 4 | 0.062 | 0.938 | 1 | 0 | 0 | 0 | 1 | 1 | 1 | 2 | 2 |
| 13 | 1 | 1 | 562511318 | 2580633323 | 7018899 | 71462637 | 884650876 | 59098871 | 0 | 30779975 | 6163143 | 0 | 0 | 98.33333 | 248.91667 | 6.500000 | 31.58333 | 6.916667 | 21.083333 | 0.00 | 33.50000 | 2.666667 | 0 | 0 | 879750000 | 1085327718 | 543500 | 0 | 6.000000 | 466.500000 | 2 | 0.00000 | 4 | 2 | 3 | 3 | 3 | 0.519 | 0.481 | 1 | 0 | 0 | 0 | 5 | 3 | 4 | 5 | 5 |
| 15 | 3 | 1 | 2245281836 | 3328117603 | 81091841 | 0 | 23609691 | 134484842 | 0 | 24676625 | 6843971 | 0 | 0 | 725.41667 | 236.58333 | 80.666667 | 0.00000 | 1.900000 | 67.416667 | 0.00 | 11.91667 | 6.888889 | 0 | 0 | 23472526 | 3771666763 | 0 | 15000000 | 1.800000 | 391.416667 | 0 | 1.00000 | 2 | 2 | 2 | 4 | 2 | 0.386 | 0.614 | 0 | 0 | 0 | 0 | 2 | 3 | 1 | 4 | 5 |
canal1_finan_log <- canal1_finan
canal1_finan_log[, 3:32] <- log(canal1_finan_log[, 3:32] + 1)
media_canal1_finan <- aggregate(.~sub_grupos,data=canal1_finan_log, FUN=mean)De la grafica presentada previamente se espera que los tres grupos tengan un comportamiento y valores promedios muy similares, dado que está siendo graficada en las variables asociados a los canales y estos sub grupos fueron hallados a partir del grupo 1 de las variables de los canales, por lo tanto se espera que estos tres grupos tengan sus diferencias en las variables financieras pero sean muy similares en los canales.
Los tres grupos toman valores promedios diferentes en las distintas variables financieras, lo que indica la diferencia esperada ellas.
El sub-grupo 1 del grupo 1 tiende a tener el mayor número promedio de importaciones, exportaciones, inventarios y además de ello es al que le toma más tiempo realizar las rotaciones de inventarios, rotaciones de cuenta por cobrar y pagar y realizar los ciclos de negocio y financieros. En los pagos y recaudos a personas jurídicas y naturales tiende a tener porcentajes bajos.
El sub-grupo 2 del grupo 1 en comparación a los otros grupos, tiende a tener un número promedio o intermedio de importaciones, exportaciones, inventarios, al igual que las rotaciones de inventarios, rotaciones de cuentas por cobrar y pagar y tiempos promedios en la realización de los ciclos de negocio y financiero, pero cabe aclarar que es el que tiene mayor número promedio de cuentas por cobrar y cuentas por pagar, pagos a personas jurídicas y naturales, recaudos a personas jurídicas y naturales, además que es el que cuenta con mayor número de tiendas físicas y electrónicas.
El sub-grupo 3 del grupo 1 es el que en general tiende a tener menores niveles promedios en todas las variables financieras, es decir es el que realiza menos importaciones, exportaciones, tiene menor número de cuentas por cobrar y por pagar, menores inventarios, le toma menos tiempo realizar las rotaciones de inventarios, rotaciones de cuenta por cobrar y pagar y realizar los ciclos de negocio y financieros. En los pagos y recaudos a personas jurídicas y naturales tiende a tener porcentajes bajos.
Agrupamiento por variables financieras para el grupo 2 de canales:
Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar
dendrogram <- hclust(dist(grupo2_scaled[, 32:47], method = 'euclidean'), method = 'ward.D')
plot(dendrogram, xlab="", sub="", cex=0.9)Del dendograma anterior se concluye considerar 3 subgrupos.
set.seed(9326)
kc2 <- kmeans(grupo2_scaled[, 32:47], 3, nstart = 5, iter.max = 100)
clusplot(grupo2_scaled[,32:47], kc2$cluster, color = TRUE,
shade = FALSE, labels = 4, lines = 1,
col.clus = c("#0688AC", "#0669AC", "#000080"),
col.p = sapply(kc2$cluster, get_color_grupo2),
main = "Subgrupos del grupo 2 de canales mediante K-means",
xlab = "Componente principal 1 canales",
ylab = "Componente principal 2 canales",
sub = "")
grid()| Grupo | Número de clientes |
|---|---|
| 1 | 314 |
| 2 | 274 |
| 3 | 364 |
Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables financieras
canal2_finan <- data.frame(sub_grupos=kc2$cluster, grupo2_no_scaled)
canal2_finan$sub_grupos <- as.factor(canal2_finan$sub_grupos)| sub_grupos | grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0e+00 | 0 | 0 | 0 | 0.000000 | 0.000000 | 0.0 | 0 | 0 | 0.00 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000 | 0 | 0 | 1 | 1 | 6 | 6 | 6 | 0.000 | 0.000 | 0 | 0 | 0 | 0 | 6 | 2 | 2 | 5 | 6 |
| 2 | 3 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0e+00 | 0 | 0 | 0 | 0.000000 | 0.000000 | 0.0 | 0 | 0 | 0.00 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000 | 0 | 0 | 1 | 1 | 2 | 6 | 2 | 1.000 | 0.000 | 0 | 0 | 0 | 0 | 1 | 3 | 1 | 3 | 4 |
| 4 | 1 | 2 | 39402360 | 96468998 | 8226710 | 0 | 0 | 7072802 | 0 | 9e+06 | 0 | 0 | 0 | 14.416667 | 13.833333 | 4.6 | 0 | 0 | 2.80 | 0 | 1 | 0 | 0 | 0 | 0 | 60558440 | 0 | 0 | 0 | 10.333333 | 0 | 0 | 2 | 2 | 1 | 1 | 1 | 0.615 | 0.385 | 1 | 0 | 0 | 0 | 5 | 2 | 3 | 5 | 5 |
| 6 | 1 | 2 | 33629514 | 42883291 | 1348792 | 0 | 0 | 3828360 | 0 | 0e+00 | 687244 | 0 | 0 | 7.416667 | 8.833333 | 1.0 | 0 | 0 | 1.25 | 0 | 0 | 1 | 0 | 0 | 0 | 1960611436 | 0 | 0 | 0 | 90.000000 | 0 | 0 | 1 | 1 | 1 | 3 | 1 | 0.590 | 0.410 | 0 | 0 | 0 | 0 | 1 | 4 | 1 | 5 | 5 |
| 7 | 1 | 2 | 373650131 | 1383138437 | 0 | 0 | 0 | 0 | 0 | 0e+00 | 0 | 0 | 0 | 1.333333 | 1.000000 | 0.0 | 0 | 0 | 0.00 | 0 | 0 | 0 | 0 | 0 | 0 | 604532004 | 0 | 0 | 0 | 3.833333 | 0 | 0 | 1 | 1 | 1 | 4 | 1 | 1.000 | 0.000 | 0 | 0 | 0 | 0 | 2 | 4 | 1 | 6 | 6 |
| 8 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0e+00 | 0 | 0 | 0 | 0.000000 | 0.000000 | 0.0 | 0 | 0 | 0.00 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000 | 0 | 0 | 2 | 2 | 2 | 1 | 6 | 0.000 | 0.000 | 0 | 0 | 0 | 0 | 6 | 1 | 1 | 6 | 6 |
canal2_finan_log <- canal2_finan
canal2_finan_log[, 3:32] <- log(canal2_finan_log[, 3:32] + 1)
media_canal2_finan <- aggregate(.~sub_grupos,data=canal2_finan_log, FUN=mean)De la gráfica presentada previamente se espera que los tres grupos tengan un comportamiento y valores promedios muy similares, dado que esta siendo graficada en las variables asociados a los canales y estos sub grupos fueron hallados a partir del grupo 2 de las variables de los canales, por lo tanto se espera que estos tres grupos tengan sus diferencias en las variables financieras pero muy similares en los canales.
Los tres grupos toman valores diferentes en las distintas variables financieras, lo que indica la diferencia esperada en estas variables.
El sub-grupo 1 del grupo 2 tiende a tener un número promedio intermedio de importaciones, pocas exportaciones, tiene la menor cantidad de cuentas por pagar, y una cantidad promedio de inventario, además es el grupo que le toma mayor tiempo realizar las rotaciones de inventarios, realizar los ciclos de negocio y financieros, pero para realizar las rotaciones de cuentas por cobrar y pagar si toma valores más intermedios.
El sub-grupo 2 del grupo 2 es el que realiza mayor número promedio de importaciones y exportaciones, el que más cuenta por pagar y cobrar tiene, además de mayor inventario, además el que le toma mayor tiempo de hacer las rotaciones de cuentas por cobrar y pagar, pero tiene un número intermedio de rotaciones de inventario, ciclo de negocio y financiero.
El sub-grupo 3 del grupo 2 es el que tiene menor número promedio de importaciones y exportaciones, el que menos cuentas por cobrar tiene, además de la menor cantidad de inventario, por otro lado también es el que le tarda menos tiempo realizar las rotaciones de inventario, de cuentas por cobrar y pagar, de realizar su ciclo de negocio y financiero.
En general, los tres grupos tienen un comportamiento muy similar en los pagos y recaudos a personas naturales y jurídicas y en las ventas físicas y electrónicas.
Grupos finales
Dado que en los procedimientos anteriores se obtuvieron grupos y subgrupos, ahora llega el momento de crear los 6 grupos resultates, que consiste en la combinación de un grupo y subgrupo respectivamente:
Grupo 1: grupo 1 subgrupo 1
Grupo 2: grupo 2 subgrupo 1
Grupo 3: grupo 1 subgrupo 2
Grupo 4: grupo 2 subgrupo 2
Grupo 5: grupo 1 subgrupo 3
Grupo 6: grupo 2 subgrupo 3
Grupo1 <- canal1_finan[canal1_finan$sub_grupos==1,] # grupo 1 subgrupo 1
Grupo2 <- canal2_finan[canal2_finan$sub_grupos==1,] # grupo 2 subgrupo 1
Grupo3 <- canal1_finan[canal1_finan$sub_grupos==2,] # grupo 1 subgrupo 2
Grupo4 <- canal2_finan[canal2_finan$sub_grupos==2,] # grupo 2 subgrupo 2
Grupo5 <- canal1_finan[canal1_finan$sub_grupos==3,] # grupo 1 subgrupo 3
Grupo6 <- canal2_finan[canal2_finan$sub_grupos==3,] # grupo 2 subgrupo 3| Grupos | sub_grupos | grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 13 | 1 | 1 | 1 | 562511318 | 2580633323 | 7018899 | 71462637 | 884650876 | 59098871 | 0 | 30779975 | 6163143 | 0 | 0.0 | 98.33333 | 248.91667 | 6.500000 | 31.58333 | 6.916667 | 21.083333 | 0 | 33.500000 | 2.666667 | 0 | 0.000000 | 879750000 | 1085327718 | 543500 | 0 | 6.000000 | 466.50000 | 2 | 0 | 4 | 2 | 3 | 3 | 3 | 0.519 | 0.481 | 1 | 0 | 0 | 0 | 5 | 3 | 4 | 5 | 5 |
| 17 | 1 | 1 | 1 | 725985979 | 198904738 | 2095050 | 7776259 | 0 | 66321404 | 0 | 1001086 | 2078249 | 0 | 0.0 | 334.75000 | 103.50000 | 3.000000 | 75.75000 | 0.000000 | 35.000000 | 0 | 1.333333 | 2.571429 | 0 | 0.000000 | 0 | 0 | 655796 | 0 | 0.000000 | 0.00000 | 1 | 0 | 2 | 2 | 4 | 3 | 3 | 1.000 | 0.000 | 1 | 0 | 0 | 0 | 5 | 3 | 4 | 5 | 3 |
| 18 | 1 | 1 | 1 | 139004747 | 511972974 | 6543537 | 0 | 131595000 | 23781330 | 0 | 2147531 | 3050469 | 0 | 729333.3 | 44.75000 | 43.33333 | 8.083333 | 0.00000 | 10.000000 | 7.583333 | 0 | 1.666667 | 2.200000 | 0 | 1.666667 | 131595000 | 380759976 | 0 | 0 | 10.000000 | 95.16667 | 0 | 0 | 2 | 2 | 4 | 4 | 2 | 0.465 | 0.535 | 1 | 0 | 0 | 0 | 2 | 4 | 4 | 5 | 3 |
| 23 | 1 | 1 | 1 | 547670088 | 780003007 | 103800 | 0 | 164250000 | 8628001 | 0 | 1444293 | 5310911 | 0 | 0.0 | 153.33333 | 32.83333 | 1.000000 | 0.00000 | 3.250000 | 7.333333 | 0 | 1.400000 | 3.000000 | 0 | 0.000000 | 164250000 | 338676699 | 0 | 0 | 3.250000 | 161.83333 | 0 | 0 | 4 | 3 | 2 | 2 | 2 | 0.545 | 0.455 | 0 | 0 | 0 | 0 | 3 | 2 | 1 | 4 | 5 |
| 29 | 1 | 1 | 1 | 4214600209 | 14652219803 | 0 | 0 | 0 | 35419087 | 0 | 1244861 | 22856725 | 0 | 0.0 | 180.50000 | 208.25000 | 0.000000 | 0.00000 | 0.000000 | 6.750000 | 0 | 1.285714 | 6.125000 | 0 | 0.000000 | 0 | 4969060033 | 0 | 0 | 0.000000 | 743.25000 | 0 | 0 | 3 | 3 | 6 | 6 | 6 | 0.556 | 0.444 | 0 | 0 | 0 | 0 | 2 | 2 | 2 | 3 | 3 |
| 32 | 1 | 1 | 1 | 483638884 | 5747664945 | 1922929 | 0 | 489273201 | 2280598 | 0 | 5633280 | 0 | 0 | 0.0 | 14.75000 | 37.00000 | 3.333333 | 0.00000 | 5.818182 | 2.083333 | 0 | 3.750000 | 0.000000 | 0 | 0.000000 | 489273201 | 4255561086 | 0 | 0 | 5.818182 | 2020.66667 | 0 | 0 | 1 | 1 | 4 | 6 | 5 | 0.242 | 0.758 | 0 | 0 | 0 | 0 | 2 | 4 | 1 | 5 | 5 |
| Grupos | sub_grupos | grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | 1 | 20.62671 | 21.36412 | 13.969176 | 7.031524 | 14.179269 | 17.380415 | 1.9188680 | 15.347292 | 14.784769 | 2.2450482 | 2.9910592 | 5.158614 | 4.609525 | 2.1463349 | 1.8958918 | 1.4183542 | 2.8214675 | 0.3289200 | 1.8287538 | 1.7223956 | 0.1263417 | 0.3398891 | 12.925479 | 19.38101 | 3.3362808 | 0.9223333 | 1.3266969 | 5.171773 | 0.2053072 | 0.1331201 | 2.691936 | 2.058064 | 3.509677 | 4.248387 | 4.551613 | 0.5344919 | 0.4655177 | 0.6274194 | 0.0548387 | 0.0000000 | 0.0000000 | 4.324193 | 2.820968 | 2.522581 | 5.114516 | 4.840323 |
| 2 | 1 | 2 | 14.92309 | 15.96927 | 5.439582 | 1.385795 | 5.502098 | 9.530262 | 0.3574920 | 5.230636 | 4.814679 | 0.1835013 | 0.4606027 | 1.766027 | 1.843709 | 0.4573135 | 0.4113954 | 0.3903970 | 0.7534147 | 0.0539455 | 0.3472239 | 0.3128787 | 0.0088299 | 0.0573331 | 5.292840 | 10.68194 | 0.1677837 | 0.1502157 | 0.3742760 | 2.151425 | 0.0095405 | 0.0245366 | 1.789809 | 1.487261 | 1.598726 | 2.296178 | 3.101911 | 0.6807261 | 0.2778949 | 0.2292994 | 0.0031847 | 0.0033217 | 0.0094172 | 4.910828 | 2.630573 | 2.098726 | 5.506369 | 5.519108 |
| 3 | 2 | 1 | 21.26435 | 21.98867 | 15.641965 | 10.194780 | 16.922857 | 17.044089 | 2.4782814 | 15.828441 | 15.445928 | 4.9482314 | 15.9361051 | 6.264393 | 4.935818 | 3.8750220 | 3.1303593 | 1.8047643 | 2.9863085 | 0.4414890 | 2.5563453 | 2.4552314 | 0.3266266 | 3.4759957 | 16.346957 | 20.02152 | 4.6139827 | 1.0880111 | 1.7329102 | 5.796234 | 0.3454697 | 0.1470273 | 2.161111 | 1.805556 | 3.811111 | 4.566667 | 4.144444 | 0.4180667 | 0.5708278 | 0.8000000 | 0.2222222 | 0.2993000 | 0.7007056 | 2.994444 | 2.511111 | 2.188889 | 4.144444 | 3.922222 |
| 4 | 2 | 2 | 12.91468 | 15.65103 | 3.882146 | 1.602786 | 3.660869 | 7.630762 | 0.3354473 | 4.047007 | 3.781144 | 0.0970900 | 0.4079981 | 1.714209 | 2.126816 | 0.3890634 | 0.3696535 | 0.2667819 | 0.6684314 | 0.0379376 | 0.2492797 | 0.2656895 | 0.0050595 | 0.1019710 | 3.685069 | 10.52793 | 0.0000000 | 0.0000000 | 0.2640769 | 2.389335 | 0.0000000 | 0.0000000 | 2.291971 | 1.905110 | 4.313869 | 5.208029 | 3.832117 | 0.5322518 | 0.3947555 | 0.3248175 | 0.0072993 | 0.0029416 | 0.0080073 | 2.671533 | 3.244525 | 2.784671 | 4.664234 | 3.912409 |
| 5 | 3 | 1 | 20.23728 | 20.82283 | 14.928898 | 7.951284 | 14.023858 | 16.737418 | 4.2352904 | 14.123707 | 13.993880 | 2.2844697 | 2.2296256 | 4.765049 | 4.247755 | 2.6590943 | 2.3829307 | 1.3490087 | 2.3685181 | 0.6990190 | 1.5190768 | 1.5318180 | 0.1210826 | 0.2882516 | 13.622001 | 19.57101 | 2.1915166 | 0.7273944 | 1.3416784 | 5.365092 | 0.1565833 | 0.1234573 | 1.536382 | 1.474012 | 2.613306 | 3.045738 | 2.659044 | 0.4533805 | 0.5466279 | 0.5883576 | 0.0644491 | 0.0000000 | 0.0000000 | 1.808732 | 1.792100 | 1.744283 | 2.898129 | 2.869023 |
| 6 | 3 | 2 | 14.50667 | 16.53760 | 6.419857 | 1.762271 | 4.776193 | 8.077886 | 0.8606253 | 4.300313 | 4.447364 | 0.0839637 | 0.6333574 | 1.837737 | 2.078010 | 0.6610193 | 0.5812790 | 0.3395345 | 0.6857621 | 0.1485779 | 0.2753460 | 0.3125649 | 0.0038085 | 0.1399942 | 4.578650 | 11.33980 | 0.2270761 | 0.3819650 | 0.3243986 | 2.677433 | 0.0194339 | 0.0584544 | 1.530220 | 1.447802 | 2.010989 | 2.118132 | 1.736264 | 0.6039780 | 0.3685577 | 0.2335165 | 0.0109890 | 0.0036841 | 0.0155467 | 1.489011 | 1.664835 | 1.818681 | 2.469780 | 2.346154 |
Variables de los canales
En general los grupos 1, 3 y 5 son los que manejan en promedio mayores montos de dinero y mayor número de transacciones, por lo tanto los grupos 2, 4 y 6 son los que manejan en promedio menores montos de dinero y menor número de transacciones.
El grupo 3 a pesar de tener un comportamiento de manejar mayores montos en promedio de dinero al igual que el grupo 1 y 5, este se destaca particularmente en el canal de entrada de otros, dado que toma valores muy altos, más que cualquiera de los otros grupos.
Variables financieras
Los grupos 1, 3 y 4 son los que realizan mayor número promedio de importaciones y exportaciones, tiene mayor número promedio de cuentas por pagar y cobrar y mayor inventario, por otro lado los grupos 2, 5 y 6 son los que realizan menor número promedio de importaciones y exportaciones, tienen menor número promedio de cuentas por pagar y cobrar y menor inventario, pero respecto al inventario el grupo 2 es el que tiene más en comparación con los grupos 5 y 6 a pesar de que es el que tiene menor número promedio de cuentas por pagar.
En general todos los grupos presentan mayor número promedio de ventas físicas que electrónicas, además el grupo 3 es el que presenta mayor promedio de pagos a personas naturales, mayor número promedio de ventas físicas y electrónicas y mayor número promedio de recaudos a personas jurídicas y naturales. El grupo 2 y 6 es el que realiza mayor proporción de pagos a personas jurídicas, pero son los que realizan menor proporción de pagos a personas naturales, tiene la menor cantidad de ventas físicas y electrónicas, además de los menores recaudos a personas jurídicas y naturales. Los grupos 1, 4 y 5 toman valores intermedios.
Los grupos 1 y 2, los grupos 3 y 4 y los grupo 5 y 6 tienen comportamientos muy similares en las rotaciones de inventario, de cuentas por cobrar y pagar y en los ciclos de negocio y financieros, en donde los grupos 5 y 6 son a los que les toma menos tiempo promedio realizar estas rotaciones y ciclos, al los grupos 1 y 2 les toma mayor tiempo promedio realizar las rotaciones de inventario y hacer los ciclos de negocio y financiero, por otro lado el grupo 4 es al que más tiempo promedio le toma realizar las rotaciones de cuentas por cobrar y pagar.
En general así los grupos se parezcan entre sí, estos se diferencian en algo, ya sea en las variables financieras o en los canales.
Grupo 1: es de los que tiende a manejar mayores montos de dinero y mayor número de transacciones a través de los canales, además de ser el grupo que mayores importaciones y exportaciones realiza, tiene buena cantidad de cuentas por cobrar y pagar,además de una gran cantidad de inventarios, maneja muchas ventas físicas, se demora más rotando el inventario y realizando su ciclo de negocio y financiero, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas grandes, de productos, por ello manejan mucho inventario y se demoran mucho para rotarlo, además de que venden y compran productos al exterior.
Grupo 2: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, realiza pocas importaciones y exportaciones, tiene pocas cuentas por pagar y aunque tiene más cuentas por cobrar, no se consideran altas, tiene un inventario de nivel intermedio, es el grupo que tiene mayor porcentaje de pagos a personas jurídicas que a personas naturales, además de menores ventas físicas y electrónicas, es decir las menores ventas en general, por otro lado es el grupo que más se demora rotando el inventario y realizando su ciclo de negocio y financiero, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que quizás no están tan desarrolladas y están en un proceso de crecimiento, donde sus ventas no son las mejores y no tiene tanto contacto a nivel internacional.
Grupo 3: es el que tiene mayores montos de dinero y mayor número de transacciones a través de los canales, no tiene un nivel alto de importaciones y exportaciones, tiene relativamente un nivel alto en la cuentas por pagar, cuentas por cobrar e inventario, además es el que presenta mayor promedio de pagos a personas naturales, mayor número de ventas físicas y electrónicas y mayor número de recaudos a personas jurídicas y naturales y en general tiene un nivel promedio en las rotaciones y ciclos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas grandes que se mueven más a nivel nacional, tienen muchas ventas ya sean físicas o electrónicas y sus rotaciones de inventario y de cuentas al igual que sus ciclos no tienden a ser tan rápidos ni tan lentos (ejemplo: almacenes de cadena)
Grupo 4: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, tiene un nivel medio de importaciones y exportaciones y un nivel muy alto de cuentas por cobrar y pagar, también dispone de un nivel alto de inventario, su nivel de ventas es intermedio al igual que la rotación de inventario y ciclo de negocio y financiero y en comparación con los otros grupos es el que tiene las rotaciones de cuentas por cobrar y pagar más lenta, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que ofrecen un servicio o producto donde la forma de pago no es inmediata, como por ejemplo empresas que realizan pedidos o encargos, empresas distribuidores, etc.
Grupo 5: es de los que tiende a manejar mayores montos de dinero y mayor número de transacciones a través de los canales, tiene un nivel bajo de importaciones y exportaciones y un nivel intermedio de cuentas por cobrar, cuentas por pagar e inventario, también tiene un alto porcentaje de pagos a personas juridicas y naturales, además un buen porcentaje de ventas físicas y en general tiene rotaciones de inventario, rotaciones de cuentas y ciclos relativamente rápidos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que se encargan de distribuir productos nacionales, los cuales tienen un proceso de venta rápido, dado que el inventario no es grande ni pequeño pero tienden a realizar rotaciones en poco tiempo y por el hecho de manejar buen monto de dinero da la idea de ser una empresa grande o muy bien acreditada.
Grupo 6: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, tiene niveles bajos de importaciones, exportaciones, de cuentas por cobrar y pagar e inventario, tiene porcentajes altos de pagos a personas jurídicas y naturales y sus rotaciones de inventario, de cuentas y ciclos son rápidos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que en general se espera que no sean grandes y tiendan a ofrecer servicios a nivel nacional.
Comentario adicional:
Los valores extremos encontrados inicialmente en los canales son los siguientes:
“825, 1416, 1462, 1668, 1773”
Los cuales pertenecen al grupo:
“5, 3, 3, 1, 3” respectivamente lo cual significa que todos quedan en los grupos que más dinero mueven y más tranzan por los canales, por lo tanto la segmentación es confiable.
En la segmentación (primero canales luego financieras) anterior se obtuvieron muy buenos resultados dado que se puede interpretar de manera acertada cada uno de los grupos formados, ahora se intenta realizar el proceso de segmentación con un procedimiento contrario (primero financieras luego canales) con el fin de observar si se obtienen grupos similares a los obtenidos hasta ahora, para mirar si hay consistencia con los análisis realizados y mirar si hay influencia alta de hacer los procedimientos en un orden específico.
A continuación se presenta el procedimiento desarrollado realizando una segmentación con todas las variables financieras, para ser ingresadas al algoritmo de segmentación siendo escaladas, posteriormente en cada uno de los grupos resultantes se realiza una subagrupación pero solo teniendo en cuenta las variables asociadas a los canales, a ellas se les aplica logaritmo natural y luego son escaladas:
library(ggdendro)
library(ggplot2)
require(factoextra)
dendrogram <- hclust(dist(finan_scaled, method = 'euclidean'), method = 'ward.D')
plot(dendrogram, xlab="", sub="", cex=0.9)
rect.hclust(dendrogram, k=3, border="cyan4")set.seed(93284)
Agru_finan <- kmeans(finan_scaled, 3 , nstart = 5, iter.max = 100)
clusplot(finan_scaled, Agru_finan$cluster, color = TRUE,
shade = FALSE, labels = 4, lines = 1,
col.clus = c("purple", "red", "blue"),
col.p = sapply(Agru_finan$cluster, get_color),
main = "Grupos seleccionados de financieras mediante K-means",
xlab = "Componente principal 1 canales",
ylab = "Componente principal 2 canales",
sub = "")En el gráfico anterior se puede observar una representación en dos dimensiones de los grupos encontrados por K-means.
| grupos | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 2 | 1 | 1 | 6 | 6 | 6 | 0.000 | 0.000 | 0 | 0 | 0 | 0 | 6 | 2 | 2 | 5 | 6 |
| 3 | 1 | 1 | 2 | 6 | 2 | 1.000 | 0.000 | 0 | 0 | 0 | 0 | 1 | 3 | 1 | 3 | 4 |
| 3 | 1 | 1 | 3 | 1 | 2 | 0.456 | 0.544 | 1 | 0 | 0 | 0 | 2 | 1 | 2 | 2 | 1 |
| 1 | 2 | 2 | 1 | 1 | 1 | 0.615 | 0.385 | 1 | 0 | 0 | 0 | 5 | 2 | 3 | 5 | 5 |
| 3 | 1 | 1 | 2 | 2 | 2 | 1.000 | 0.000 | 1 | 0 | 0 | 0 | 2 | 2 | 1 | 3 | 3 |
| 3 | 1 | 1 | 1 | 3 | 1 | 0.590 | 0.410 | 0 | 0 | 0 | 0 | 1 | 4 | 1 | 5 | 5 |
| grupos | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 2.278121 | 1.779975 | 1.991347 | 2.945612 | 3.500618 | 0.6264611 | 0.3537738 | 0.4252163 | 0.0395550 | 0.0087985 | 0.0394091 | 4.695921 | 2.758962 | 2.229913 | 5.360939 | 5.353523 |
| 2 | 2.386950 | 1.978756 | 5.036419 | 5.490137 | 4.820941 | 0.4388968 | 0.5337951 | 0.6084977 | 0.0773900 | 0.0636267 | 0.1199863 | 2.878604 | 2.789074 | 2.623672 | 4.358118 | 3.769347 |
| 3 | 1.474510 | 1.414379 | 2.098039 | 2.403922 | 1.952941 | 0.5334719 | 0.4521582 | 0.4143791 | 0.0379085 | 0.0104784 | 0.0339660 | 1.581699 | 1.717647 | 1.762091 | 2.624837 | 2.524183 |
| Grupo | Número de clientes |
|---|---|
| 1 | 809 |
| 2 | 659 |
| 3 | 765 |
El grupo 1 cuenta con 809 clientes y el grupo 2 con 659 clientes y el grupo 3 con 765 clientes.
Grupo 1
impo_cv: El mayor número de observaciones tienen niveles de importación bajos, es decir el número de observaciones va disminuyendo a medida que aumenta el nivel de importaciones por lo que se podría decir que la mayoría tiende a importar menos, pero comparada con los demás grupos es el grupo en el que más observaciones se pueden encontrar en niveles de importación altos, ya que el cambio entre niveles es más leve.
expo_vt: la mayor cantidad se concentra en el nivel 2 de exportaciones, continuando con el nivel 1, formando más de un 80% de observaciones en los dos primeros niveles es decir niveles de exportaciones bajos pero comparado con el grupo 3 hay mayor cantidad de exportaciones.
cxp: Se acumulan en los primeros niveles, es decir tienden a tener un número menor de cuentas por pagar.
cxc: Tiende a estar alrededor de todos los niveles, pero la mayoría se encuentra en los primeros niveles indicando que el número de cuentas por cobrar no es tan alto.
total inventory: Están alrededor de todos los niveles, pero la mayoría tienden a estar en los niveles 2 y 3 indicando que su inventario no es ni muy alto ni muy bajo.
pagos_pj: En promedio tiene más pagos a personas jurídicas que los grupos 2 y 3.
pagos_pn: En promedio el grupo 1 tiene menos pagos a personas naturales.
tiene_ventas_fisicas: Es más frecuente encontrar que no tiene ventas físicas aunque no es mucha la diferencia con las que sí tienen tiendas físicas.
tiene_ventas_electronicas: Es más frecuente encontrar que no tienen ventas electrónicas.
recaudos_pj: La variable presenta muchos ceros, por lo tanto no se logra observar diferencias en los diferentes grupos.
recaudos_pn: La variable presenta muchos ceros, por lo tanto no se logra observar diferencias en los diferentes grupos.
rotacion_inventarios: La mayoría se acumula en el último nivel indicando que tiene una rotación lenta de inventarios.
rotacion_cxc: Están alrededor de todos los niveles, aunque tiende a crecer la frecuencia a medida que aumentan los niveles, quedando mayor cantidad en los niveles más altos, lo que quiere decir que la rotación de las cuentas por cobrar es más bien lenta.
rotacion_cxp: Están alrededor de todos los niveles, aunque su mayor frecuencia se observa en el nivel uno, indicando que rotan un poco rápido sus cuentas por pagar.
ciclo_negocio: se acumulan en los últimos niveles indicando que se demoran más completando un ciclo de negocio.
Ciclo_financiero: se acumulan en los últimos niveles indicando que se demoran más completando un ciclo financiero.
Grupo 2
impo_cv: alrededor del 50% tiene un nivel de importación de 2 y el resto se encuentra alrededor de este, en general tiene un nivel de importación que no es alto.
expo_vt: más del 70% se concentra en el nivel 2 de exportaciones lo que quiere decir que no tienen niveles de exportaciones ni altos ni bajos.
cpx: Se acumulan en los últimos niveles, es decir tienden a tener un número de cuentas por pagar alto.
cxc: Tienden a acumularse en los últimos niveles indicando que el número de cuentas por cobrar es muy alto.
total inventory: La mayoria se acumula en el último nivel (6) indicando que a final de año tienen un inventario muy alto.
pagos_pj: El grupo 2 presenta menor cantidad de pagos a personas jurídicas.
pagos_pn: El grupo 2 presenta mayor cantidad de pagos a personas naturales.
tiene_ventas_fisicas: Es más frecuente encontrar que tienen ventas físicas aunque no es mucha la diferencia con las que no tienen tiendas físicas.
tiene_ventas_electronicas: Es más frecuente encontrar que no tienen ventas electrónicas.
recaudos_pj: La variable presenta muchos ceros, por lo tanto no se logra observar diferencias en los diferentes grupos.
recaudos_pn: La variable presenta muchos ceros, por lo tanto no se logra observar diferencias en los diferentes grupos.
rotacion_inventarios: Tiende a estar alrededor de todos los niveles indicando que las rotaciones son muy variantes, aunque se podría decir que la mayoría está en los primeros niveles indicando que hay una rotación más o menos rápida.
rotacion_cxc: Están alrededor de todos los niveles, aunque tiende a crecer la frecuencia a medida que aumentan los niveles, quedando mayor cantidad en los niveles más altos, lo que quiere decir que la rotación de las cuentas por cobrar es más bien lenta.
rotacion_cxp: Están alrededor de todos los niveles, aunque su mayor frecuencia se observa en el nivel cuatro, indicando que rotan un poco más lento sus cuentas por pagar.
ciclo_negocio: la mayoria se acumula en el nivel 4 indicando que el ciclo de negocio es lento pero no tanto
ciclo_financiero: la mayoria se acumula en el nivel 5 indicando que el ciclo financiero es lento pero no tanto como para llegar al nivel 6
Grupo 3
impo_cv: El mayor porcentaje tiene un nivel de importación muy bajo, y a medida que aumentan los niveles de importación se presentan menor número de observaciones (disminuye el numero de observaciones bruscamente).
expo_cv: Lo niveles de exportaciones son muy bajos ya que más del 95% se acumula en los dos primeros niveles y en especial en el primer nivel son aproximadamente 60% lo que implica que en este grupo no se tiende mucho a exportar.
cxp: Se acumulan en los primeros niveles, es decir tienden a tener un número de cuentas por pagar bajo(Similar al primer grupo).
cxc: Tiende a estar alrededor de todos los niveles, pero la mayoría se encuentra en los primeros niveles indicando que el número de cuentas por cobrar no es tan alto.
total inventory: Tienden a acumularse en los dos primeros niveles indicando que el inventario a final del año es bajo.
pagos_pj: El grupo 3 presenta una proporción intermedia de pagos a personas jurídicas.
pagos_pn: El grupo 3 presenta una proporción intermedia de pagos a personas naturales.
tiene_ventas_fisicas: Es más frecuente encontrar que no tienen ventas físicas aunque no es mucha la diferencia con las que sí tienen tiendas físicas.
tiene_ventas_electronicas: Es más frecuente encontrar que no tienen ventas electrónicas.
recaudos_pj: La variable presenta muchos ceros, por lo tanto no se logra observar diferencias en los diferentes grupos.
recaudos_pn: La variable presenta muchos ceros, por lo tanto no se logra observar diferencias en los diferentes grupos.
rotacion_inventarios: La mayoria tiende a acumularse en los primeros niveles indicando que hay una rotación de inventarios rápida.
rotacion_cxc: Tienden a acumularse en los primero niveles indicando que la rotación de cuentas por cobrar es muy rápida.
rotacion_cxp: Tienden a acumularse en los primero niveles indicando que la rotación de cuentas por pagar es muy rápida.
ciclo_negocio: la mayoria se acumula entre los niveles 2 y 3 indicando que el ciclo de negocio es rápido pero no mucho
ciclo_financiero: la mayoria se acumula entre los niveles 2 y 3 indicando que el ciclo financiero es rápido pero no mucho
Conclusión general:
El Grupo 3 es el que realiza menos importaciones y el grupo 1 y 2 los que más realizan importaciones.
El grupo 3 es el que realiza menos exportaciones y el grupo 2 el que más realiza.
El grupo 1 y 3 tienen un número de cuentas por pagar pequeño en cambio el grupo 2 tiene muchas cuentas por pagar.
El grupo 1 y 3 tiene un número de cuentas por cobrar bajo, en cambio el grupo 2 tiene un número de cuentas por cobrar muy alto.
El grupo 2 es el que más tiene inventario a final de año y el grupo 3 el que menos inventario tiene.
El grupo 1 y 3 tiene menos ventas físicas y por el contrario el grupo 2 cuenta con más ventas físicas.
En los tres grupos no es frecuente encontrar ventas electrónicas.
El grupo 1 tiende a rotar el inventario muy lento en cambio el grupo 3 tiende a rotar muy rápido.
Las cuentas por cobrar de los grupos 1 y 2 rotan muy lento en cambio en el grupo 3 rotan muy rápido.
El grupo 1 y 3 tiende a rotar rápidamente las cuentas por pagar aunque es más rápido el 3 que el 1 y el grupo 2 tiende a rotar las cuentas por pagar más lento.
El grupo 1 tiene un ciclo de negocio muy lento, luego le sigue el grupo 2 con uno levemente lento y por último el grupo 3 tiene un ciclo de negocio levemente rápido.
El grupo 1 tiene un ciclo financiero muy lento, luego le sigue el grupo 2 con uno levemente lento y por último el grupo 3 tiene un ciclo financiero levemente rápido.
Conclusión final:
El grupo 2 parece ser de productos y el grupo 3 parece ser de servicios y el grupo 1 tiene características similares a los otros dos grupos
Grupos de las variables escaladas
df_scaled_group <- data.frame(grupos, Canal_log_scaled, finan_scaled) #Conjunto de datos de los grupos y las variables escaladas
#Separacion de los grupos con las variables escaladas
grupo1_scaled <- df_scaled_group[df_scaled_group$grupos==1,]
grupo2_scaled <- df_scaled_group[df_scaled_group$grupos==2,]
grupo3_scaled <- df_scaled_group[df_scaled_group$grupos==3,]
#Conjunto de datos con grupos y variables no escaladas
df_group <- data.frame(grupos, Canal_log, finan_no_scaled)
#Separacion de los grupos con variables no escaladas
grupo1_no_scaled <- df_group[df_group$grupos==1,]
grupo2_no_scaled <- df_group[df_group$grupos==2,]
grupo3_no_scaled <- df_group[df_group$grupos==3,]
#Media de los grupos de las variables no escaladas y canales en escala log natural
media_df_grupfin <- aggregate(.~grupos,data=df_group, FUN=mean)| grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 17.64340 | 18.52646 | 9.777666 | 4.175163 | 9.554957 | 13.49980 | 0.6747598 | 10.345271 | 10.18603 | 1.314108 | 2.021565 | 3.409504 | 3.141016 | 1.267002 | 1.044307 | 0.8594768 | 1.737475 | 0.1113207 | 1.0343611 | 1.0089556 | 0.0767454 | 0.2355005 | 8.930449 | 14.80173 | 1.573095 | 0.5755578 | 0.8181244 | 3.486120 | 0.0929623 | 0.0803012 | 2.278121 | 1.779975 | 1.991347 | 2.945612 | 3.500618 | 0.6264611 | 0.3537738 | 0.4252163 | 0.0395550 | 0.0087985 | 0.0394091 | 4.695921 | 2.758962 | 2.229913 | 5.360939 | 5.353523 |
| 2 | 18.82753 | 20.37895 | 11.843369 | 6.709735 | 12.644235 | 14.61977 | 2.7609071 | 12.459907 | 11.77298 | 2.424380 | 5.063670 | 4.675295 | 4.301098 | 2.315227 | 2.040148 | 1.2942204 | 2.379026 | 0.4947268 | 1.6723377 | 1.5786483 | 0.1406999 | 1.0290435 | 11.815006 | 17.67717 | 3.017707 | 0.6515043 | 1.2202590 | 5.048073 | 0.2031544 | 0.0962737 | 2.386950 | 1.978756 | 5.036419 | 5.490137 | 4.820941 | 0.4388968 | 0.5337951 | 0.6084977 | 0.0773900 | 0.0636267 | 0.1199863 | 2.878604 | 2.789074 | 2.623672 | 4.358118 | 3.769347 |
| 3 | 17.22134 | 18.46311 | 10.524046 | 4.883034 | 9.136597 | 12.23844 | 2.3857225 | 9.011967 | 8.94859 | 1.092086 | 1.712370 | 3.231076 | 3.048477 | 1.630493 | 1.487391 | 0.8159162 | 1.466728 | 0.3724958 | 0.8671028 | 0.8821876 | 0.0602645 | 0.2657522 | 8.935816 | 15.39395 | 1.081265 | 0.5343800 | 0.8127722 | 3.906261 | 0.0859817 | 0.0901387 | 1.474510 | 1.414379 | 2.098039 | 2.403922 | 1.952941 | 0.5334719 | 0.4521582 | 0.4143791 | 0.0379085 | 0.0104784 | 0.0339660 | 1.581699 | 1.717647 | 1.762091 | 2.624837 | 2.524183 |
Generalmente se observan comportamientos o valores promedios distintos entre los tres grupos conformados con las variables financieras, lo cual era de esperarse dado que la segmentación fue realizada solo con estas variables.
El grupo 2 es el que tiende a tener mayores niveles medios de importaciones, exportaciones, cuentas por cobrar y pagar e inventario en comparación con los demás grupos.
El grupo 1 y 3 tienen un nivel medio de cuentas por pagar muy similar, pero el grupo 1 tiene mayores importaciones, exportaciones, cuenta por cobrar e inventario que el grupo 3.
El grupo 1 y el grupo 3 tienen mayores proporciones de pagos a personas juridicas que naturales, en cambio el grupo 2 mayores proporciones pagos a personas naturales que juridicas.
Todos los grupos disponen de más ventas fisicas que electronicas.
Todos los grupos tienden a tener más recaudos a personas naturales que a juridicas.
La rotación de inventario promedio es más rápida para el grupo 3, luego para el grupo 2 y por último la más lenta para el grupo 1.
La rotación promedio de cuentas por cobrar y pagar para el grupo 1 y 2 es muy similar, en cambio para el grupo 3 estas rotaciones son muy rápidas.
El ciclo de negocio y financiero promedio es más rápido para el grupo 3, luego para el grupo 2 y por último el más lento para el grupo 1.
Gráfico de los grupos en las variables de los canales
Agrupamiento por variables de canales para el grupo 1 de financieras:
Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar
dendrogram <- hclust(dist(grupo1_scaled[,2:31], method = 'euclidean'), method = 'ward.D')
plot(dendrogram, xlab="", sub="", cex=0.9)set.seed(932840)
kc1 <- kmeans(grupo1_scaled[,2:31], 2 , nstart = 5, iter.max = 100)
clusplot(grupo1_scaled[,2:31], kc1$cluster, color = TRUE,
shade = FALSE, labels = 4, lines = 1,
col.clus = c("#F54830", "#C23927"),
col.p = sapply(kc1$cluster, get_color_grupo1),
main = "Subgrupos del grupo 1 de financieras mediante K-means",
xlab = "Componente principal 1 canales",
ylab = "Componente principal 2 canales",
sub = "" )
grid()| Grupo | Número de clientes |
|---|---|
| 1 | 526 |
| 2 | 283 |
Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables de los canales:
finan1_canal <- data.frame(sub_grupos=kc1$cluster, grupo1_no_scaled)
finan1_canal$sub_grupos <- as.factor(finan1_canal$sub_grupos)| sub_grupos | grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 4 | 2 | 1 | 17.48934 | 18.38473 | 15.92290 | 0.00000 | 0.00000 | 15.77177 | 0 | 16.01274 | 0.00000 | 0 | 0 | 2.7354492 | 2.6968769 | 1.7227666 | 0.000000 | 0.000000 | 1.335001 | 0 | 0.6931472 | 0.000000 | 0 | 0 | 0.00000 | 17.91912 | 0.00000 | 0.00000 | 0.000000 | 2.427748 | 0.000000 | 0.0000000 | 2 | 2 | 1 | 1 | 1 | 0.615 | 0.385 | 1 | 0 | 0 | 0 | 5 | 2 | 3 | 5 | 5 |
| 7 | 2 | 1 | 19.73883 | 21.04762 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0 | 0.00000 | 0.00000 | 0 | 0 | 0.8472979 | 0.6931472 | 0.0000000 | 0.000000 | 0.000000 | 0.000000 | 0 | 0.0000000 | 0.000000 | 0 | 0 | 0.00000 | 20.21997 | 0.00000 | 0.00000 | 0.000000 | 1.575536 | 0.000000 | 0.0000000 | 1 | 1 | 1 | 4 | 1 | 1.000 | 0.000 | 0 | 0 | 0 | 0 | 2 | 4 | 1 | 6 | 6 |
| 8 | 2 | 1 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0 | 0.00000 | 0.00000 | 0 | 0 | 0.0000000 | 0.0000000 | 0.0000000 | 0.000000 | 0.000000 | 0.000000 | 0 | 0.0000000 | 0.000000 | 0 | 0 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.000000 | 0.000000 | 0.000000 | 0.0000000 | 2 | 2 | 2 | 1 | 6 | 0.000 | 0.000 | 0 | 0 | 0 | 0 | 6 | 1 | 1 | 6 | 6 |
| 9 | 2 | 1 | 19.60858 | 19.02453 | 13.85348 | 17.87817 | 0.00000 | 0.00000 | 0 | 0.00000 | 15.59464 | 0 | 0 | 5.2631219 | 4.3459676 | 0.6931472 | 6.420402 | 0.000000 | 0.000000 | 0 | 0.0000000 | 1.871802 | 0 | 0 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.000000 | 0.000000 | 0.000000 | 0.0000000 | 2 | 2 | 3 | 1 | 4 | 1.000 | 0.000 | 1 | 0 | 0 | 0 | 6 | 1 | 4 | 6 | 5 |
| 13 | 1 | 1 | 20.14792 | 21.67130 | 15.76412 | 18.08469 | 20.60070 | 17.89472 | 0 | 17.24237 | 15.63410 | 0 | 0 | 4.5984812 | 5.5211275 | 2.0149030 | 3.483801 | 2.068970 | 3.094823 | 0 | 3.5409593 | 1.299283 | 0 | 0 | 20.59515 | 20.80515 | 13.20579 | 0.00000 | 1.945910 | 6.147399 | 1.098612 | 0.0000000 | 4 | 2 | 3 | 3 | 3 | 0.519 | 0.481 | 1 | 0 | 0 | 0 | 5 | 3 | 4 | 5 | 5 |
| 15 | 1 | 1 | 21.53210 | 21.92567 | 18.21109 | 0.00000 | 16.97717 | 18.71696 | 0 | 17.02137 | 15.73888 | 0 | 0 | 6.5881238 | 5.4705184 | 4.4026459 | 0.000000 | 1.064711 | 4.225617 | 0 | 2.5585185 | 2.065455 | 0 | 0 | 16.97134 | 22.05078 | 0.00000 | 16.52356 | 1.029619 | 5.972324 | 0.000000 | 0.6931472 | 2 | 2 | 2 | 4 | 2 | 0.386 | 0.614 | 0 | 0 | 0 | 0 | 2 | 3 | 1 | 4 | 5 |
| sub_grupos | grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | 19.94031 | 20.48836 | 13.094312 | 5.8857911 | 11.985258 | 16.705749 | 0.8272024 | 14.444786 | 14.216166 | 1.9883975 | 2.9903560 | 4.535871 | 3.991818 | 1.7902761 | 1.4590362 | 1.1312590 | 2.3897684 | 0.1369564 | 1.4965272 | 1.4598729 | 0.1167184 | 0.3384375 | 11.116358 | 17.804977 | 2.419455 | 0.8561827 | 1.0788502 | 4.425699 | 0.1429781 | 0.1195126 | 2.494297 | 1.895437 | 2.081749 | 3.100760 | 3.684411 | 0.5933783 | 0.4028251 | 0.5361217 | 0.0589354 | 0.0132833 | 0.0570589 | 4.709125 | 2.754753 | 2.216730 | 5.28327 | 5.330799 |
| 2 | 1 | 13.37422 | 14.87997 | 3.613156 | 0.9956914 | 5.037862 | 7.541045 | 0.3914212 | 2.725678 | 2.695383 | 0.0608364 | 0.2209152 | 1.315973 | 1.559667 | 0.2944157 | 0.2734687 | 0.3543268 | 0.5250866 | 0.0636727 | 0.1753527 | 0.1708549 | 0.0024493 | 0.0441759 | 4.867592 | 9.219717 | 0.000000 | 0.0539722 | 0.3335243 | 1.739765 | 0.0000000 | 0.0074207 | 1.876325 | 1.565371 | 1.823322 | 2.657244 | 3.159011 | 0.6879505 | 0.2626042 | 0.2190813 | 0.0035336 | 0.0004629 | 0.0066042 | 4.671378 | 2.766784 | 2.254417 | 5.50530 | 5.395760 |
Agrupamiento por variables de canales para el grupo 2 de financieras:
Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar
dendrogram <- hclust(dist(grupo2_scaled[,2:31], method = 'euclidean'), method = 'ward.D')
plot(dendrogram, xlab="", sub="", cex=0.9)set.seed(93284)
kc2 <- kmeans(grupo2_scaled[,2:31], 2, nstart = 5, iter.max = 100)
clusplot(grupo2_scaled[,2:31], kc2$cluster, color = TRUE,
shade = FALSE, labels = 4, lines = 1,
col.clus = c("#FF5CFF", "#800080"),
col.p = sapply(kc2$cluster, get_color_grupo2),
main = "Subgrupos del grupo 2 de financieras mediante K-means",
xlab = "Componente principal 1 canales",
ylab = "Componente principal 2 canales",
sub = "" )
grid()| Grupo | Número de clientes |
|---|---|
| 1 | 308 |
| 2 | 351 |
Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables de los canales:
finan2_canal <- data.frame(sub_grupos=kc2$cluster, grupo2_no_scaled)
finan2_canal$sub_grupos <- as.factor(finan2_canal$sub_grupos)| sub_grupos | grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 2 | 2 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0 | 0.00000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.0000000 | 0.0000000 | 0 | 0.0000000 | 0.00000 | 0.00000 | 0 | 0 | 0.0000000 | 0.000000 | 0 | 0 | 1 | 1 | 6 | 6 | 6 | 0.000 | 0.000 | 0 | 0 | 0.000 | 0.000 | 6 | 2 | 2 | 5 | 6 |
| 10 | 2 | 2 | 19.00290 | 20.88248 | 12.83468 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 13.36429 | 0.00000 | 0 | 0.00000 | 2.633087 | 2.596498 | 1.098612 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.6931472 | 0.0000000 | 0 | 0.0000000 | 0.00000 | 20.69132 | 0 | 0 | 0.0000000 | 7.187531 | 0 | 0 | 2 | 2 | 3 | 6 | 3 | 0.000 | 1.000 | 0 | 0 | 0.000 | 0.000 | 1 | 3 | 1 | 4 | 4 |
| 12 | 1 | 2 | 22.16302 | 21.29205 | 21.42274 | 0.00000 | 0.00000 | 18.13754 | 20.79774 | 15.60093 | 17.35857 | 0 | 0.00000 | 6.972372 | 5.043963 | 7.467323 | 0.000000 | 0.000000 | 3.024482 | 3.188417 | 0.9650809 | 3.1403135 | 0 | 0.0000000 | 0.00000 | 21.94223 | 0 | 0 | 0.0000000 | 7.417681 | 0 | 0 | 2 | 2 | 6 | 4 | 4 | 0.062 | 0.938 | 1 | 0 | 0.000 | 0.000 | 1 | 1 | 1 | 2 | 2 |
| 18 | 2 | 2 | 18.75002 | 20.05378 | 15.69399 | 0.00000 | 18.69524 | 16.98441 | 0.00000 | 14.57983 | 14.93081 | 0 | 13.49989 | 3.823192 | 3.791737 | 2.206441 | 0.000000 | 2.397895 | 2.149822 | 0.000000 | 0.9808293 | 1.1631508 | 0 | 0.9808293 | 18.69524 | 19.75768 | 0 | 0 | 2.3978953 | 4.566083 | 0 | 0 | 2 | 2 | 4 | 4 | 2 | 0.465 | 0.535 | 1 | 0 | 0.000 | 0.000 | 2 | 4 | 4 | 5 | 3 |
| 24 | 1 | 2 | 22.47140 | 24.90816 | 17.46198 | 10.71319 | 0.00000 | 16.97676 | 0.00000 | 19.05138 | 12.30139 | 0 | 22.89075 | 4.789573 | 5.748331 | 3.821369 | 1.163151 | 0.000000 | 2.197225 | 0.000000 | 8.2885764 | 0.6931472 | 0 | 11.2487516 | 0.00000 | 0.00000 | 0 | 0 | 0.0000000 | 0.000000 | 0 | 0 | 2 | 2 | 6 | 6 | 3 | 0.767 | 0.233 | 1 | 0 | 0.050 | 0.950 | 1 | 2 | 2 | 2 | 2 |
| 26 | 1 | 2 | 19.47715 | 21.11866 | 16.39086 | 15.39240 | 16.63236 | 15.17027 | 0.00000 | 14.96967 | 15.35682 | 0 | 13.08625 | 7.054881 | 6.627711 | 4.734003 | 1.763589 | 1.386294 | 2.862201 | 0.000000 | 2.2064412 | 3.3040336 | 0 | 1.6094379 | 17.48928 | 21.11045 | 0 | 0 | 0.7884574 | 6.175521 | 0 | 0 | 2 | 2 | 2 | 3 | 2 | 0.280 | 0.720 | 1 | 0 | 0.152 | 0.848 | 2 | 4 | 4 | 5 | 2 |
| sub_grupos | grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 2 | 21.88501 | 22.53515 | 16.788726 | 11.686877 | 17.40060 | 18.13406 | 4.9962628 | 16.763842 | 16.333063 | 4.8509176 | 9.618123 | 6.626625 | 5.548397 | 3.9858344 | 3.7308871 | 1.9878102 | 3.604548 | 0.9084702 | 2.7838140 | 2.6496067 | 0.2807886 | 2.0151903 | 16.303515 | 21.09586 | 5.8218516 | 1.224807 | 1.8735611 | 6.394741 | 0.3939361 | 0.1667528 | 2.383117 | 1.980519 | 5.022727 | 5.496753 | 5.100649 | 0.3972565 | 0.6027500 | 0.8376623 | 0.1590909 | 0.1175682 | 0.2265909 | 2.983766 | 2.532468 | 2.425325 | 4.211039 | 3.824675 |
| 2 | 2 | 16.14461 | 18.48690 | 7.503854 | 2.342328 | 8.47056 | 11.53602 | 0.7993984 | 8.683235 | 7.771545 | 0.2951114 | 1.067171 | 2.963018 | 3.206602 | 0.8492807 | 0.5565361 | 0.6856002 | 1.303639 | 0.1316699 | 0.6970251 | 0.6388899 | 0.0177730 | 0.1637068 | 7.876371 | 14.67730 | 0.5570908 | 0.148435 | 0.6469911 | 3.866382 | 0.0357448 | 0.0344288 | 2.390313 | 1.977208 | 5.048433 | 5.484331 | 4.575499 | 0.4754359 | 0.4732877 | 0.4074074 | 0.0056980 | 0.0162934 | 0.0264416 | 2.786325 | 3.014245 | 2.797721 | 4.487179 | 3.720798 |
Agrupamiento por variables de canales para el grupo 3 de financieras:
Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar
dendrogram <- hclust(dist(grupo3_scaled[,2:31], method = 'euclidean'), method = 'ward.D')
plot(dendrogram, xlab="", sub="", cex=0.9)set.seed(932840)
kc3 <- kmeans(grupo3_scaled[,2:31], 2 , nstart = 5, iter.max = 100)
clusplot(grupo3_scaled[,2:31], kc3$cluster, color = TRUE,
shade = FALSE, labels = 4, lines = 1,
col.clus = c("#7070FF", "#00007A"),
col.p = sapply(kc3$cluster, get_color_grupo3),
main = "Subgrupos del grupo 3 de financieras mediante K-means",
xlab = "Componente principal 1 canales",
ylab = "Componente principal 2 canales",
sub = "" )
grid()| Grupo | Número de clientes |
|---|---|
| 1 | 480 |
| 2 | 285 |
Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables de los canales:
finan3_canal <- data.frame(sub_grupos=kc3$cluster, grupo3_no_scaled)
finan3_canal$sub_grupos <- as.factor(finan3_canal$sub_grupos)| sub_grupos | grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 2 | 2 | 3 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0 | 0.000000 | 0.000000 | 0.0000000 | 0.000000 | 0.000000 | 0.0000000 | 0.000000 | 0.0000000 | 0.0000000 | 0.0000000 | 0 | 0.00000 | 0.00000 | 0 | 0.00000 | 0.000000 | 0.000000 | 0 | 0.000000 | 1 | 1 | 2 | 6 | 2 | 1.000 | 0.000 | 0 | 0 | 0 | 0 | 1 | 3 | 1 | 3 | 4 |
| 3 | 1 | 3 | 19.34067 | 17.80747 | 15.44909 | 17.54966 | 19.84044 | 14.32428 | 21.46846 | 0.00000 | 0.00000 | 0.00000 | 0 | 3.235405 | 2.558518 | 1.4663371 | 5.475766 | 1.265666 | 1.8562980 | 2.224624 | 0.0000000 | 0.0000000 | 0.0000000 | 0 | 19.84044 | 21.54100 | 0 | 0.00000 | 1.265666 | 6.420131 | 0 | 0.000000 | 1 | 1 | 3 | 1 | 2 | 0.456 | 0.544 | 1 | 0 | 0 | 0 | 2 | 1 | 2 | 2 | 1 |
| 5 | 1 | 3 | 19.63688 | 19.27176 | 18.47274 | 16.57269 | 0.00000 | 16.97980 | 0.00000 | 15.09671 | 15.13119 | 0.00000 | 0 | 5.040733 | 3.766997 | 4.6387661 | 3.918668 | 0.000000 | 2.9444390 | 0.000000 | 1.1631508 | 1.6094379 | 0.0000000 | 0 | 0.00000 | 0.00000 | 0 | 20.24858 | 0.000000 | 0.000000 | 0 | 3.996671 | 1 | 1 | 2 | 2 | 2 | 1.000 | 0.000 | 1 | 0 | 0 | 0 | 2 | 2 | 1 | 3 | 3 |
| 6 | 2 | 3 | 17.33091 | 17.57399 | 14.11472 | 0.00000 | 0.00000 | 15.15795 | 0.00000 | 0.00000 | 13.44045 | 0.00000 | 0 | 2.130214 | 2.285778 | 0.6931472 | 0.000000 | 0.000000 | 0.8109302 | 0.000000 | 0.0000000 | 0.6931472 | 0.0000000 | 0 | 0.00000 | 21.39652 | 0 | 0.00000 | 0.000000 | 4.510859 | 0 | 0.000000 | 1 | 1 | 1 | 3 | 1 | 0.590 | 0.410 | 0 | 0 | 0 | 0 | 1 | 4 | 1 | 5 | 5 |
| 11 | 1 | 3 | 21.19043 | 20.52364 | 16.79791 | 17.58252 | 19.73069 | 17.04442 | 0.00000 | 13.26919 | 14.26759 | 16.26118 | 0 | 5.405302 | 4.447541 | 3.4683367 | 4.116324 | 2.890372 | 2.2335922 | 0.000000 | 0.6931472 | 0.9343092 | 0.6931472 | 0 | 20.31782 | 18.74878 | 0 | 0.00000 | 3.254886 | 2.310884 | 0 | 0.000000 | 1 | 1 | 1 | 2 | 2 | 0.741 | 0.259 | 1 | 0 | 0 | 0 | 2 | 2 | 1 | 3 | 4 |
| 14 | 2 | 3 | 17.89304 | 20.38422 | 13.99694 | 0.00000 | 20.33920 | 10.64545 | 0.00000 | 0.00000 | 0.00000 | 0.00000 | 0 | 1.131402 | 2.197225 | 0.6931472 | 0.000000 | 2.036882 | 1.0986123 | 0.000000 | 0.0000000 | 0.0000000 | 0.0000000 | 0 | 20.33920 | 0.00000 | 0 | 0.00000 | 2.036882 | 0.000000 | 0 | 0.000000 | 2 | 2 | 2 | 3 | 2 | 0.623 | 0.377 | 0 | 0 | 0 | 0 | 2 | 3 | 1 | 4 | 4 |
| sub_grupos | grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 3 | 19.80348 | 20.28556 | 13.997240 | 6.874063 | 12.17379 | 16.118987 | 3.4884278 | 13.037747 | 13.078793 | 1.740512 | 2.3850870 | 4.386671 | 3.864514 | 2.353932 | 2.0696589 | 1.1355145 | 2.0862199 | 0.5359909 | 1.3005837 | 1.3334082 | 0.0960465 | 0.3451224 | 11.815367 | 18.31579 | 1.6670524 | 0.7582309 | 1.1274070 | 4.814386 | 0.1326497 | 0.1320170 | 1.481250 | 1.420833 | 2.122917 | 2.512500 | 2.127083 | 0.4952771 | 0.5026500 | 0.5458333 | 0.0541667 | 0.0137104 | 0.0446229 | 1.627083 | 1.687500 | 1.693750 | 2.664583 | 2.604167 |
| 2 | 3 | 12.87247 | 15.39372 | 4.674458 | 1.529722 | 4.02132 | 5.702768 | 0.5285345 | 2.231706 | 1.992457 | 0.000000 | 0.5793734 | 1.284813 | 1.674099 | 0.412071 | 0.5067289 | 0.2776455 | 0.4233729 | 0.0971356 | 0.1370298 | 0.1222373 | 0.0000000 | 0.1320761 | 4.086044 | 10.47296 | 0.0946753 | 0.1573681 | 0.2828609 | 2.376789 | 0.0073829 | 0.0196068 | 1.463158 | 1.403509 | 2.056140 | 2.221053 | 1.659649 | 0.5978000 | 0.3671193 | 0.1929825 | 0.0105263 | 0.0050351 | 0.0160175 | 1.505263 | 1.768421 | 1.877193 | 2.557895 | 2.389474 |
Grupos finales
Dado que en los procedimientos anteriores se obtuvieron grupos y subgrupos, ahora llega el momento de crear los 6 grupos resultates, que consiste en la combinación de un grupo y subgrupo respectivamente:
Grupo 1: grupo 1 subgrupo 1 Grupo 2: grupo 1 subgrupo 2 Grupo 3: grupo 2 subgrupo 1 Grupo 4: grupo 2 subgrupo 2 Grupo 5: grupo 3 subgrupo 1 Grupo 6: grupo 3 subgrupo 2
Grupo1 <- finan1_canal[finan1_canal$sub_grupos==1,] #grupo 1 subgrupo 1
Grupo2 <- finan1_canal[finan1_canal$sub_grupos==2,] #grupo 1 subgrupo 2
Grupo3 <- finan2_canal[finan2_canal$sub_grupos==1,] #grupo 2 subgrupo 1
Grupo4 <- finan2_canal[finan2_canal$sub_grupos==2,] #grupo 2 subgrupo 2
Grupo5 <- finan3_canal[finan3_canal$sub_grupos==1,] #grupo 3 subgrupo 1
Grupo6 <- finan3_canal[finan3_canal$sub_grupos==2,] #grupo 3 subgrupo 2| Grupos | sub_grupos | grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 13 | 1 | 1 | 1 | 20.14792 | 21.67130 | 15.76412 | 18.08469 | 20.60070 | 17.89472 | 0 | 17.24237 | 15.63410 | 0.00000 | 0 | 4.598481 | 5.521128 | 2.0149030 | 3.483801 | 2.068970 | 3.094823 | 0 | 3.5409593 | 1.2992830 | 0.0000000 | 0 | 20.59515 | 20.80515 | 13.205787 | 0.00000 | 1.945910 | 6.147399 | 1.0986123 | 0.0000000 | 4 | 2 | 3 | 3 | 3 | 0.519 | 0.481 | 1 | 0 | 0 | 0 | 5 | 3 | 4 | 5 | 5 |
| 15 | 1 | 1 | 1 | 21.53210 | 21.92567 | 18.21109 | 0.00000 | 16.97717 | 18.71696 | 0 | 17.02137 | 15.73888 | 0.00000 | 0 | 6.588124 | 5.470518 | 4.4026459 | 0.000000 | 1.064711 | 4.225617 | 0 | 2.5585185 | 2.0654553 | 0.0000000 | 0 | 16.97134 | 22.05078 | 0.000000 | 16.52356 | 1.029619 | 5.972324 | 0.0000000 | 0.6931472 | 2 | 2 | 2 | 4 | 2 | 0.386 | 0.614 | 0 | 0 | 0 | 0 | 2 | 3 | 1 | 4 | 5 |
| 16 | 1 | 1 | 1 | 16.60844 | 19.52531 | 13.25472 | 0.00000 | 16.75046 | 0.00000 | 0 | 0.00000 | 11.79132 | 0.00000 | 0 | 1.658228 | 2.777783 | 0.6931472 | 0.000000 | 1.858899 | 0.000000 | 0 | 0.0000000 | 0.6931472 | 0.0000000 | 0 | 16.75046 | 19.14282 | 13.560620 | 16.35711 | 1.858899 | 4.496099 | 0.6931472 | 3.1570004 | 2 | 2 | 1 | 2 | 2 | 0.709 | 0.291 | 0 | 0 | 0 | 0 | 3 | 3 | 1 | 4 | 5 |
| 17 | 1 | 1 | 1 | 20.40304 | 19.10834 | 14.55509 | 15.86659 | 0.00000 | 18.01002 | 0 | 13.81660 | 14.54704 | 0.00000 | 0 | 5.816367 | 4.649187 | 1.3862944 | 4.340553 | 0.000000 | 3.583519 | 0 | 0.8472979 | 1.2729657 | 0.0000000 | 0 | 0.00000 | 0.00000 | 13.393607 | 0.00000 | 0.000000 | 0.000000 | 0.6931472 | 0.0000000 | 2 | 2 | 4 | 3 | 3 | 1.000 | 0.000 | 1 | 0 | 0 | 0 | 5 | 3 | 4 | 5 | 3 |
| 23 | 1 | 1 | 1 | 20.12118 | 20.47481 | 11.55023 | 0.00000 | 18.91690 | 15.97052 | 0 | 14.18313 | 15.48527 | 0.00000 | 0 | 5.039115 | 3.521447 | 0.6931472 | 0.000000 | 1.446919 | 2.120264 | 0 | 0.8754687 | 1.3862944 | 0.0000000 | 0 | 18.91690 | 19.64056 | 0.000000 | 0.00000 | 1.446919 | 5.092727 | 0.0000000 | 0.0000000 | 4 | 3 | 2 | 2 | 2 | 0.545 | 0.455 | 0 | 0 | 0 | 0 | 3 | 2 | 1 | 4 | 5 |
| 34 | 1 | 1 | 1 | 22.06128 | 22.06201 | 15.51189 | 16.92158 | 16.87478 | 19.80622 | 0 | 17.71955 | 18.20847 | 15.09422 | 0 | 7.320030 | 6.696417 | 1.9459101 | 2.268683 | 2.505526 | 5.526117 | 0 | 3.5624655 | 4.4710037 | 0.8472979 | 0 | 16.87478 | 20.64280 | 9.937454 | 0.00000 | 2.505526 | 5.066806 | 0.6931472 | 0.0000000 | 4 | 2 | 3 | 6 | 6 | 0.672 | 0.328 | 1 | 0 | 0 | 0 | 6 | 4 | 2 | 6 | 6 |
| Grupos | sub_grupos | grupos | en_vm_canal1 | en_vm_canal2 | en_vm_canal3 | en_vm_canal4 | en_vm_canal5 | en_vm_canal6 | en_vm_canal7 | en_vm_canal8 | en_vm_canal9 | en_vm_canal10 | en_vm_otros | en_tx_canal1 | en_tx_canal2 | en_tx_canal3 | en_tx_canal4 | en_tx_canal5 | en_tx_canal6 | en_tx_canal7 | en_tx_canal8 | en_tx_canal9 | en_tx_canal10 | en_tx_otros | sal_vm_canal5 | sal_vm_canal2 | sal_vm_canal8 | sal_vm_otros | sal_tx_canal5 | sal_tx_canal2 | sal_tx_canal8 | sal_tx_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | 1 | 19.94031 | 20.48836 | 13.094312 | 5.8857911 | 11.985258 | 16.705749 | 0.8272024 | 14.444786 | 14.216166 | 1.9883975 | 2.9903560 | 4.535871 | 3.991818 | 1.7902761 | 1.4590362 | 1.1312590 | 2.3897684 | 0.1369564 | 1.4965272 | 1.4598729 | 0.1167184 | 0.3384375 | 11.116358 | 17.804977 | 2.4194552 | 0.8561827 | 1.0788502 | 4.425699 | 0.1429781 | 0.1195126 | 2.494297 | 1.895437 | 2.081749 | 3.100760 | 3.684411 | 0.5933783 | 0.4028251 | 0.5361217 | 0.0589354 | 0.0132833 | 0.0570589 | 4.709125 | 2.754753 | 2.216730 | 5.283270 | 5.330799 |
| 2 | 2 | 1 | 13.37422 | 14.87997 | 3.613156 | 0.9956914 | 5.037862 | 7.541045 | 0.3914212 | 2.725678 | 2.695383 | 0.0608364 | 0.2209152 | 1.315973 | 1.559667 | 0.2944157 | 0.2734687 | 0.3543268 | 0.5250866 | 0.0636727 | 0.1753527 | 0.1708549 | 0.0024493 | 0.0441759 | 4.867592 | 9.219717 | 0.0000000 | 0.0539722 | 0.3335243 | 1.739765 | 0.0000000 | 0.0074207 | 1.876325 | 1.565371 | 1.823322 | 2.657244 | 3.159011 | 0.6879505 | 0.2626042 | 0.2190813 | 0.0035336 | 0.0004629 | 0.0066042 | 4.671378 | 2.766784 | 2.254417 | 5.505300 | 5.395760 |
| 3 | 1 | 2 | 21.88501 | 22.53515 | 16.788726 | 11.6868769 | 17.400598 | 18.134055 | 4.9962628 | 16.763842 | 16.333063 | 4.8509176 | 9.6181235 | 6.626625 | 5.548397 | 3.9858344 | 3.7308871 | 1.9878102 | 3.6045476 | 0.9084702 | 2.7838140 | 2.6496067 | 0.2807886 | 2.0151903 | 16.303515 | 21.095857 | 5.8218516 | 1.2248073 | 1.8735611 | 6.394741 | 0.3939361 | 0.1667528 | 2.383117 | 1.980519 | 5.022727 | 5.496753 | 5.100649 | 0.3972565 | 0.6027500 | 0.8376623 | 0.1590909 | 0.1175682 | 0.2265909 | 2.983766 | 2.532468 | 2.425325 | 4.211039 | 3.824675 |
| 4 | 2 | 2 | 16.14461 | 18.48690 | 7.503854 | 2.3423279 | 8.470560 | 11.536015 | 0.7993984 | 8.683235 | 7.771545 | 0.2951114 | 1.0671705 | 2.963018 | 3.206602 | 0.8492807 | 0.5565361 | 0.6856002 | 1.3036391 | 0.1316699 | 0.6970251 | 0.6388899 | 0.0177730 | 0.1637068 | 7.876371 | 14.677304 | 0.5570908 | 0.1484350 | 0.6469911 | 3.866382 | 0.0357448 | 0.0344288 | 2.390313 | 1.977208 | 5.048433 | 5.484331 | 4.575499 | 0.4754359 | 0.4732877 | 0.4074074 | 0.0056980 | 0.0162934 | 0.0264416 | 2.786325 | 3.014245 | 2.797721 | 4.487179 | 3.720798 |
| 5 | 1 | 3 | 19.80348 | 20.28556 | 13.997240 | 6.8740634 | 12.173792 | 16.118987 | 3.4884278 | 13.037747 | 13.078793 | 1.7405120 | 2.3850870 | 4.386671 | 3.864514 | 2.3539317 | 2.0696589 | 1.1355145 | 2.0862199 | 0.5359909 | 1.3005837 | 1.3334082 | 0.0960465 | 0.3451224 | 11.815367 | 18.315793 | 1.6670524 | 0.7582309 | 1.1274070 | 4.814386 | 0.1326497 | 0.1320170 | 1.481250 | 1.420833 | 2.122917 | 2.512500 | 2.127083 | 0.4952771 | 0.5026500 | 0.5458333 | 0.0541667 | 0.0137104 | 0.0446229 | 1.627083 | 1.687500 | 1.693750 | 2.664583 | 2.604167 |
| 6 | 2 | 3 | 12.87247 | 15.39372 | 4.674458 | 1.5297216 | 4.021320 | 5.702768 | 0.5285345 | 2.231706 | 1.992457 | 0.0000000 | 0.5793734 | 1.284813 | 1.674099 | 0.4120710 | 0.5067289 | 0.2776455 | 0.4233729 | 0.0971356 | 0.1370298 | 0.1222373 | 0.0000000 | 0.1320761 | 4.086044 | 10.472958 | 0.0946753 | 0.1573681 | 0.2828609 | 2.376789 | 0.0073829 | 0.0196068 | 1.463158 | 1.403509 | 2.056140 | 2.221053 | 1.659649 | 0.5978000 | 0.3671193 | 0.1929825 | 0.0105263 | 0.0050351 | 0.0160175 | 1.505263 | 1.768421 | 1.877193 | 2.557895 | 2.389474 |
Variables de los canales
En general el grupo 1, 3 y 5 son los que manejan en promedio mayores montos de dinero y mayor número de transacciones, por lo tanto el grupo 2, 4 y 6 son los que manejan en promedio menores montos de dinero y menor número de transacciones.
El grupo 3 a pesar de tener un comportamiento de manejar mayores montos en promedio de dinero al igual que el grupo 1 y 5, es el que toma mayores valores entre estos, además este se destaca particularmente en el canal de entrada de otros, dado que toma valores muy altos, más que cualquiera de los otros grupos.
Variables de los canales
El grupo 1, 3 y 4 es el que tiene mayor nivel promedio de importaciones y exportaciones, mientras que el grupo 5 y 6 son los que menos realizan importaciones y exportaciones; el grupo 3 y 4 tienen mayor nivel promedio de cuentas por pagar y cobrar y mayor inventario, el grupo 1 y 2 tienen un nivel promedio de cuentas por pagar y cobrar e inventario intermedio mientras que el grupo 5 y 6 tienen un nivel promedio de cuentas por pagar y cobrar e inventario bajos.
En general todos los grupos presentan mayor número promedio de ventas fisicas que electronicas, además el grupo 3 es el que presenta mayor promedio de pagos a personas naturales, mayor número promedio de ventas fisicas y electronicas y mayor número promedio de recaudos a personas juridicas y naturales. El grupo 1, 2 y 6 es el que realiza mayor proporción de pagos a personas juridicas, pero son los que realizan menor proporción de pagos a personas naturales. El grupo 2, 4, 6 tiene la menor cantidad de ventas fisicas y electronicas, además de los menores recaudos a personas juridicas y naturales.
El grupo 1 y 2, el grupo 3 y 4, el grupo 5 y 6 tiene comportamientos muy similares en las rotaciones de inventario, rotaciones de cuentas por cobrar y pagar y en los ciclos de negocio y financieros, en donde el grupo 5 y 6 es al que le toma menos tiempo promedio realizar estas rotaciones y ciclos, al grupo 1 y 2 le toma mayor tiempo promedio realizar las rotaciones de inventario y hacer los ciclos de negocio y financiero, por otro lado el grupo 4 es al que más tiempo promedio le toma realizar las rotaciones de cuenta por cobrar y pagar.
En general asi los grupos se parezcan entre si, estos se difieren en algo, ya sea en las variables financieras o en los canales.
Grupo 1: es de los que tiende a manejar mayores montos de dinero y mayor número de transacciones a través de los canales, además de que es uno de los grupos que mayores importaciones y exportaciones realiza, aunque igual el nivel de estas no es tan alto tiene buena cantidad de cuentas por cobrar, además de una gran cantidad de inventarios, que aunque no es la más alta, tiene un nivel promedio. Maneja un valor intermedio ventas fisicas en comparación con los demás grupos, se demora más rotando el inventario y realizando su ciclo de negocio y financiero, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas grandes, de productos, por ello manejan mucho inventario y se demoran mucho para rotarlo, además de que venden y compran productos al exterior.
Grupo 2: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, realizan pocas importaciones y exportaciones, tienen pocas cuentas por pagar y aunque tiene mas cuentas por cobrar, tampoco estas son altas, tiene un inventario de un nivel intermedio, es el grupo que tiene mayor porcentaje de pagos a personas juridicas que a personas naturales, además es uno de los grupos con menores ventas fisicas y electronicas, es decir las menores ventas en general, además de ser el grupo que más se demora rotando el inventario y realizando el su ciclo de negocio y financiero, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que quizas no estan tan desarrolladas y estan en un proceso de crecimiento, en donde sus ventas no son las mejores y no tiene tanto contacto a nivel internacional.
Grupo 3: es el que tiene mayores montos de dinero y mayor número de transacciones a través de los canales en comparación con el resto de los grupos, es uno de los grupos que mayores importaciones y exportaciones realiza, aunque igual el nivel de estas no es tan alto, tiene un nivel alto en la cuentas por pagar, cuentas por cobrar e inventario, además el grupo 3 es el que presenta mayor promedio de pagos a personas naturales, mayor número de ventas fisicas y electronicas y mayor número de recaudos a personas juridicas y naturales y en general tiene un nivel promedio en las rotaciones y ciclos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas grandes muy desarrolladas, que se manejan a nivel nacional e internacional, que parecen ser de productos dado que manejan el mayor nivel de inventario, además de tiener muchas ventas ya sean fisicas o electronicas y sus rotaciones de inventario y de cuentas al igual que sus ciclos no tienden a ser tan rapidos ni tan lentos.
Grupo 4: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, es uno de los grupos que mayores importaciones y exportaciones realiza, aunque igual el nivel de estas no es tan alto, maneja un nivel muy alto de cuenta por cobrar y pagar, también dispone de un nivel alto de inventario, su nivel de ventas es intermedio al igual que la rotación de inventario y ciclo de negocio y financiero y en comparación con los otros grupos es el que tiene las rotaciones de cuentas por cobrar y pagar más lenta, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que ofrecen un servicio o producto en donde su forma de pago no es inmediata, como por ejemplo empresas que realizan pedidos o encargos, empresas distribuidores, etc.
Grupo 5: es de los que tiende a manejar mayores montos de dinero y mayor número de transacciones a través de los canales, tiene un nivel bajo de importaciones y exportaciones y un nivel intermedio de cuentas por cobrar, cuentas por pagar e inventario, también tiene un alto porcentaje de pagos a personas juridicas y naturales, además un buen porcentaje de ventas fisicas y en general tiene rotaciones de inventario, rotaciones de cuentas y ciclos relativamente rápidos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que se encargan de distribuir productos nacionales, los cuales tienen un proceso de venta rápido, dado que el inventario no es grande ni pequeño pero tienden a realizar rotaciones en poco tiempo y por el hecho de manejar buen monto de dinero nos da idea de que puede ser una empresa grande o muy bien acreditada.
Grupo 6: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, tiene niveles bajos de importaciones, exportaciones, de cuentas por cobrar y pagar e inventario, tiene porcentajes altos de pagos a personas juridicas y naturales y sus rotaciones de inventario, de cuentas y ciclos son rápidos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que en general se espera que no sean grandes y tiendan a ofrecer servicios a nivel nacional.
Comentario adicional:
Los valores extremos encontrados inicialmente en los canales son los siguientes:
“825, 1416, 1462, 1668, 1773”
Los cuales pertenecen al grupo:
“5, 3, 3, 1, 3” respectivamente lo cual significa que todos quedan en los grupos que más dinero mueven y más tranzan por los canales, por lo tanto la segmentación es confiable.
Mediante los grupos obtenidos con este segundo procedimiento de segmentación se puede notar una consistencia o una alta relación con los grupos formados en el anterior procedimiento, dado que cada uno de los grupos sigue teniendo relativamente las mismas caracteristicas a tanto en los canales como en las variables financieras, lo que implica que realizar el procedimiento en un respectivo orden no cambia mucho los grupos formados, dado que estos estan muy bien definidos.
Cabe resaltar que los dos subgrupos de los canales hallados a partir de los grupos ya conformados con las variables financieras, tienen la caracteristica de que uno tiende a manejar mayores montos de dinero y número de transacciones que el otro y este fenomeno se percibe en cada una de las subagrupaciones realizadas, lo cual da idea del porque hay consistencia con el procedimiento 1 y procedimiento 2 de segmentación, en el cual el procedimiento 1 realiza primero la segmentación por las variables de los canales y claramente se resaltan dos grupos los cuales se diferencian por los montos de dinero que manejan y número de transacciones, por lo tanto a pesar de que se realice primero la agrupación por las variables financieras y los tres grupos tengan sus diferencias, en todos se conserva el comportamiento descrito en la primera segmentación para las variables de los canales.
A pesar de que existe una alta relación entre los dos procedimientos de segmentación realizados, mediante los análisis se concluye que estan mejor definidos los grupos realizados mediante el procedimiento 2 (primero financieras y luego canales), debido a que el orden lógico por el cual se caracterizaría un nuevo usuario (que no tiene información de uso de los canales de la empresa) sería mediante la recolección de la información financiera del nuevo cliente. Además de que los grupos finales que se forman tienen unas características que se acomodan mas a interpretaciones de perfiles de empresas reales y por lo tanto las interpretaciones tienen más coherencia.
Por lo tanto se quiere realizar un procedimiento adicional que sigue la misma estructura del procedimiento 2 donde se realiza primero la segmentación por las variables financieras y luego por las variables de los canales,considerando una simplificación de las variables, ya que se decide realizar una transformación o manipulación de variables las cuales permiten reducir el número de estas teniendo en cuenta la relación que existe entre los montos de dinero y número de transacciones realizados por cada uno de los clientes.
Antes de realizar el proceso de segmentación se procede a la creación de las variables asociadas a los canales que van a ser utilizadas.
Para las variables de los canales se tienen 4 tipos de variables, que se definen de la siguiente manera:
en_vm_canalX: valor del ticket promedio anual de entrada por el canal X
sal_vm_canalX: valor del ticket promedio anual de salida por el canal X
en_tx_canalX: cantidad de transacciones de entrada mensuales en promedio por el canal X
sal_tx_canalX: cantidad de transacciones de salida mensuales en promedio por el canal X
Se realiza el proceso de reducción de variables de los canales con los siguientes criterios:
Primero se deben llevar todos los canales a una forma similar, es decir, las variables que son de tipo en_tx_canalX y sal_tx_canalX, estan en valores mensuales, por lo tanto se deben multiplicar por 12 para que esten en promedios anuales, así como lo están las variables en_vm_canalX y sal_vm_canalX.
Se obtiene la cantidad de dinero de entrada promedio anual en cada empresa, para eso se multiplican las variables que son de tipo en_vm_canalX por en_tx_canalX.
Se obtiene la cantidad de dinero de salida promedio anual en cada empresa, para eso se multiplican las variables que son de tipo sal_vm_canalX por sal_tx_canalX.
Por lo tanto, las variables resultantes indican el dinero promedio anual de cada uno de los clientes en los diferentes canales.
Codigo de la creación de las nuevas variables:
df <- read.csv("base_trabajo_segmentacion.csv", sep = ";", dec = '.', header = T) #Se lee de nuevo el conjunto de datos
df <- df[, -1]
montos_entrada <- df[,1:11] # Variables en_vm_canalX
transacciones_entrada <- df[,12:22] # Variables en_tx_canalX
montos_salida <- df[,23:26] # Variables sal_vm_canalX
transacciones_salida <- df[,27:30] # Variables sal_tx_canalX
monto_promedio_anual_entrada <- montos_entrada*(transacciones_entrada*12)
monto_promedio_anual_salida <- montos_salida*(transacciones_salida*12)
#Creacion de nuevo conjunto de datos con variables reducidas
df <- cbind(monto_promedio_anual_entrada, monto_promedio_anual_salida, finan_no_scaled)
#Asignacion de nuevos nombres a variables creadas
colnames(df)[1:15] <- c("entrada_canal1","entrada_canal2","entrada_canal3","entrada_canal4",
"entrada_canal5","entrada_canal6","entrada_canal7","entrada_canal8",
"entrada_canal9","entrada_canal10","entrada_otros", "salida_canal5",
"salida_canal2","salida_canal8","salida_otros")| entrada_canal1 | entrada_canal2 | entrada_canal3 | entrada_canal4 | entrada_canal5 | entrada_canal6 | entrada_canal7 | entrada_canal8 | entrada_canal9 | entrada_canal10 | entrada_otros | salida_canal5 | salida_canal2 | salida_canal8 | salida_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000e+00 | 0 | 0 | 1 | 1 | 6 | 6 | 6 | 0.000 | 0.000 | 0 | 0 | 0 | 0 | 6 | 2 | 2 | 5 | 6 |
| 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000e+00 | 0 | 0 | 1 | 1 | 2 | 6 | 2 | 1.000 | 0.000 | 0 | 0 | 0 | 0 | 1 | 3 | 1 | 3 | 4 |
| 73521755371 | 7745007624 | 204886067 | 119447064008 | 12634037247 | 107777719 | 208577904975 | 0 | 0 | 0 | 0 | 12634037247 | 1.666626e+13 | 0 | 0 | 1 | 1 | 3 | 1 | 2 | 0.456 | 0.544 | 1 | 0 | 0 | 0 | 2 | 1 | 2 | 2 | 1 |
| 6816608354 | 16013853722 | 454114370 | 0 | 0 | 237646144 | 0 | 108000000 | 0 | 0 | 0 | 0 | 7.509247e+09 | 0 | 0 | 2 | 2 | 1 | 1 | 1 | 0.615 | 0.385 | 1 | 0 | 0 | 0 | 5 | 2 | 3 | 5 | 5 |
| 621887764335 | 118748488736 | 129467842777 | 9327129803 | 0 | 5113117511 | 0 | 95065402 | 178910331 | 0 | 0 | 0 | 0.000000e+00 | 0 | 398753737891 | 1 | 1 | 2 | 2 | 2 | 1.000 | 0.000 | 1 | 0 | 0 | 0 | 2 | 2 | 1 | 3 | 3 |
| 2993026709 | 4545628846 | 16185504 | 0 | 0 | 57425400 | 0 | 0 | 8246928 | 0 | 0 | 0 | 2.117460e+12 | 0 | 0 | 1 | 1 | 1 | 3 | 1 | 0.590 | 0.410 | 0 | 0 | 0 | 0 | 1 | 4 | 1 | 5 | 5 |
Del gráfico anterior se observa que:
El canal 2 es el que en promedio maneja mayor cantidad de dinero de entrada y salida.
Los canales 1 y 2 son los que en promedio manejan mayor cantidad de dinero de entrada.
Los canales que manejan en promedio una cantidad intermedia de dinero de entrada son los canales 3, 5, 6, 8 y 9.
Los canales 7, 10 y otros son los que en promedio tienen menores ingresos de dinero.
Los canales 8 y otros de salida son los que en promedio tiene menor cantidad de dinero.
El canal 5 tanto en entrada como salida maneja una cantidad de dinero similar.
Ya que el procedimiento 3 es una modificación del procedimiento 2 en la parte de segmentación que se realizó con las variables de canales, entonces la segmentación que involucra las variables financieras sigue siendo exactamente igual.
Mediante la siguiente gráfica se presenta los resultados de la segmentación mediante las variables financieras.
De la gráfica anterior se muestra los grupos obtenidos con la segmentación en las variables financieras, gráficada solo en las variables financieras. Su análisis se puede observar en el procedimiento 2 conclusiones
Agrupamiento por variables de canales para el grupo 1 de financieras:
Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar
dendrogram <- hclust(dist(grupo1_scaled[2:16], method = 'euclidean'), method = 'ward.D')
plot(dendrogram, xlab="", sub="", cex=0.9)set.seed(932840)
kc1 <- kmeans(grupo1_scaled[2:16], 2 , nstart = 5, iter.max = 100)
clusplot(grupo1_scaled[,2:16], kc1$cluster, color = TRUE,
shade = FALSE, labels = 4, lines = 1,
col.clus = c("#F54830", "#C23927"),
col.p = sapply(kc1$cluster, get_color_grupo1),
main = "Subgrupos del grupo 1 de financieras mediante K-means",
xlab = "Componente principal 1 canales",
ylab = "Componente principal 2 canales",
sub = "" )
grid()| Grupo | Número de clientes |
|---|---|
| 1 | 575 |
| 2 | 234 |
Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables de los canales:
finan1_canal <- data.frame(sub_grupos=kc1$cluster, grupo1_no_scaled)
finan1_canal$sub_grupos <- as.factor(finan1_canal$sub_grupos)| sub_grupos | grupos | entrada_canal1 | entrada_canal2 | entrada_canal3 | entrada_canal4 | entrada_canal5 | entrada_canal6 | entrada_canal7 | entrada_canal8 | entrada_canal9 | entrada_canal10 | entrada_otros | salida_canal5 | salida_canal2 | salida_canal8 | salida_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 4 | 1 | 1 | 6.816608e+09 | 1.601385e+10 | 454114370 | 0 | 0 | 237646144 | 0 | 108000000 | 0 | 0 | 0 | 0 | 7.509247e+09 | 0 | 0.0e+00 | 2 | 2 | 1 | 1 | 1 | 0.615 | 0.385 | 1 | 0 | 0 | 0 | 5 | 2 | 3 | 5 | 5 |
| 7 | 2 | 1 | 5.978402e+09 | 1.659766e+10 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 2.780847e+10 | 0 | 0.0e+00 | 1 | 1 | 1 | 4 | 1 | 1.000 | 0.000 | 0 | 0 | 0 | 0 | 2 | 4 | 1 | 6 | 6 |
| 8 | 2 | 1 | 0.000000e+00 | 0.000000e+00 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000e+00 | 0 | 0.0e+00 | 2 | 2 | 2 | 1 | 6 | 0.000 | 0.000 | 0 | 0 | 0 | 0 | 6 | 1 | 1 | 6 | 6 |
| 9 | 2 | 1 | 7.560792e+11 | 1.671833e+11 | 12464400 | 427769257250 | 0 | 0 | 0 | 0 | 391031850 | 0 | 0 | 0 | 0.000000e+00 | 0 | 0.0e+00 | 2 | 2 | 3 | 1 | 4 | 1.000 | 0.000 | 1 | 0 | 0 | 0 | 6 | 1 | 4 | 6 | 5 |
| 13 | 1 | 1 | 6.637634e+11 | 7.708352e+12 | 547474103 | 27084339545 | 73426022678 | 14952014444 | 0 | 12373550018 | 197220571 | 0 | 0 | 63342000000 | 6.075665e+12 | 13044000 | 0.0e+00 | 4 | 2 | 3 | 3 | 3 | 0.519 | 0.481 | 1 | 0 | 0 | 0 | 5 | 3 | 4 | 5 | 5 |
| 15 | 1 | 1 | 1.954518e+13 | 9.448526e+12 | 78496902169 | 0 | 538300959 | 108798237345 | 0 | 3528757423 | 565768278 | 0 | 0 | 507006570 | 1.771552e+13 | 0 | 1.8e+08 | 2 | 2 | 2 | 4 | 2 | 0.386 | 0.614 | 0 | 0 | 0 | 0 | 2 | 3 | 1 | 4 | 5 |
| sub_grupos | grupos | entrada_canal1 | entrada_canal2 | entrada_canal3 | entrada_canal4 | entrada_canal5 | entrada_canal6 | entrada_canal7 | entrada_canal8 | entrada_canal9 | entrada_canal10 | entrada_otros | salida_canal5 | salida_canal2 | salida_canal8 | salida_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | 4.862367e+14 | 3.210020e+12 | 2.460290e+13 | 1.556457e+13 | 667174200047 | 66909088090 | 36605851873 | 39194980925 | 50344153600 | 64751035 | 12768811623 | 690627633790 | 2.826766e+13 | 6523841 | 179418534 | 2.431304 | 1.852174 | 2.040000 | 3.024348 | 3.659130 | 0.5968470 | 0.3944661 | 0.5130435 | 0.0539130 | 0.0121513 | 0.0521965 | 4.766957 | 2.726957 | 2.233043 | 5.320000 | 5.353044 |
| 2 | 1 | 2.482506e+10 | 2.065795e+11 | 1.040781e+09 | 3.698292e+11 | 13045165725 | 139649336 | 2227154942 | 11389931 | 5616481 | 1538462 | 7260894843 | 12101294986 | 2.685547e+12 | 0 | 1580342 | 1.901709 | 1.602564 | 1.871795 | 2.752137 | 3.111111 | 0.6992308 | 0.2537821 | 0.2094017 | 0.0042735 | 0.0005598 | 0.0079872 | 4.521368 | 2.837607 | 2.222222 | 5.461538 | 5.354701 |
finan1_canal_log <- finan1_canal
finan1_canal_log[3:17] <- log(finan1_canal_log[3:17] + 1)
media_finan1_canal <- aggregate(.~sub_grupos,data= finan1_canal_log, FUN=mean)| sub_grupos | grupos | entrada_canal1 | entrada_canal2 | entrada_canal3 | entrada_canal4 | entrada_canal5 | entrada_canal6 | entrada_canal7 | entrada_canal8 | entrada_canal9 | entrada_canal10 | entrada_otros | salida_canal5 | salida_canal2 | salida_canal8 | salida_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | 26.61566 | 26.64070 | 16.294361 | 7.735484 | 14.16846 | 21.102242 | 1.0112694 | 17.249732 | 17.005363 | 2.1598069 | 3.4576728 | 13.253201 | 23.61465 | 2.647167 | 1.0108119 | 2.431304 | 1.852174 | 2.040000 | 3.024348 | 3.659130 | 0.5968470 | 0.3944661 | 0.5130435 | 0.0539130 | 0.0121513 | 0.0521965 | 4.766957 | 2.726957 | 2.233043 | 5.320000 | 5.353044 |
| 2 | 1 | 14.92172 | 16.99768 | 3.025855 | 1.021924 | 5.06628 | 7.219199 | 0.5201569 | 1.852904 | 1.883247 | 0.0841949 | 0.2944962 | 4.754575 | 11.34441 | 0.000000 | 0.0843097 | 1.901709 | 1.602564 | 1.871795 | 2.752137 | 3.111111 | 0.6992308 | 0.2537821 | 0.2094017 | 0.0042735 | 0.0005598 | 0.0079872 | 4.521368 | 2.837607 | 2.222222 | 5.461538 | 5.354701 |
Agrupamiento por variables de canales para el grupo 2 de financieras:
Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar
dendrogram <- hclust(dist(grupo2_scaled[2:16], method = 'euclidean'), method = 'ward.D')
plot(dendrogram, xlab="", sub="", cex=0.9)set.seed(93284)
kc2 <- kmeans(grupo2_scaled[2:16], 2, nstart = 5, iter.max = 100)
clusplot(grupo2_scaled[,2:16], kc2$cluster, color = TRUE,
shade = FALSE, labels = 4, lines = 1,
col.clus = c("#800080", "#FF5CFF"),
col.p = sapply(kc2$cluster, get_color_grupo2),
main = "Subgrupos del grupo 2 de financieras mediante K-means",
xlab = "Componente principal 1 canales",
ylab = "Componente principal 2 canales",
sub = "" )
grid()| Grupo | Número de clientes |
|---|---|
| 1 | 515 |
| 2 | 144 |
Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables de los canales:
finan2_canal <- data.frame(sub_grupos=kc2$cluster, grupo2_no_scaled)
finan2_canal$sub_grupos <- as.factor(finan2_canal$sub_grupos)| sub_grupos | grupos | entrada_canal1 | entrada_canal2 | entrada_canal3 | entrada_canal4 | entrada_canal5 | entrada_canal6 | entrada_canal7 | entrada_canal8 | entrada_canal9 | entrada_canal10 | entrada_otros | salida_canal5 | salida_canal2 | salida_canal8 | salida_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 2 | 2 | 0.000000e+00 | 0.000000e+00 | 0.000000e+00 | 0 | 0 | 0 | 0 | 0.000000e+00 | 0 | 0 | 0.000000e+00 | 0 | 0.000000e+00 | 0 | 0 | 1 | 1 | 6 | 6 | 6 | 0.000 | 0.000 | 0 | 0 | 0.000 | 0.000 | 6 | 2 | 2 | 5 | 6 |
| 10 | 2 | 2 | 2.774517e+10 | 1.747165e+11 | 9.000000e+06 | 0 | 0 | 0 | 0 | 7.642200e+06 | 0 | 0 | 0.000000e+00 | 0 | 1.536331e+13 | 0 | 0 | 2 | 2 | 3 | 6 | 3 | 0.000 | 1.000 | 0 | 0 | 0.000 | 0.000 | 1 | 3 | 1 | 4 | 4 |
| 12 | 1 | 2 | 5.396520e+13 | 3.265569e+12 | 4.224027e+13 | 0 | 0 | 17705262466 | 300571449975 | 1.162602e+08 | 9173266590 | 0 | 0.000000e+00 | 0 | 6.757203e+13 | 0 | 0 | 2 | 2 | 6 | 4 | 4 | 0.062 | 0.938 | 1 | 0 | 0.000 | 0.000 | 1 | 1 | 1 | 2 | 2 |
| 18 | 1 | 2 | 7.464555e+10 | 2.662259e+11 | 6.347231e+08 | 0 | 15791400000 | 2164101053 | 0 | 4.295061e+07 | 80532392 | 0 | 1.458667e+07 | 15791400000 | 4.348279e+11 | 0 | 0 | 2 | 2 | 4 | 4 | 2 | 0.465 | 0.535 | 1 | 0 | 0.000 | 0.000 | 2 | 4 | 4 | 5 | 3 |
| 24 | 1 | 2 | 8.219519e+12 | 2.464553e+14 | 2.054973e+10 | 1186522 | 0 | 2265600000 | 0 | 8.967365e+12 | 2640000 | 0 | 8.049541e+15 | 0 | 0.000000e+00 | 0 | 0 | 2 | 2 | 6 | 6 | 3 | 0.767 | 0.233 | 1 | 0 | 0.050 | 0.950 | 1 | 2 | 2 | 2 | 2 |
| 26 | 1 | 2 | 3.995038e+12 | 1.344940e+13 | 1.777290e+10 | 280712726 | 602066844 | 767411089 | 0 | 3.076204e+08 | 1469717237 | 0 | 2.314862e+07 | 567360000 | 8.480561e+12 | 0 | 0 | 2 | 2 | 2 | 3 | 2 | 0.280 | 0.720 | 1 | 0 | 0.152 | 0.848 | 2 | 4 | 4 | 5 | 2 |
| sub_grupos | grupos | entrada_canal1 | entrada_canal2 | entrada_canal3 | entrada_canal4 | entrada_canal5 | entrada_canal6 | entrada_canal7 | entrada_canal8 | entrada_canal9 | entrada_canal10 | entrada_otros | salida_canal5 | salida_canal2 | salida_canal8 | salida_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 2 | 5.510982e+14 | 1.764424e+14 | 8.038065e+14 | 3.460362e+16 | 4.538915e+12 | 530824153875 | 1.038974e+13 | 391606476508 | 51402714582 | 53089972 | 1.459350e+15 | 4.583276e+12 | 2.213317e+15 | 136290278208 | 5939816929 | 2.458252 | 2.009709 | 4.988349 | 5.433010 | 4.916505 | 0.4238524 | 0.5742136 | 0.6970874 | 0.0990291 | 0.0796039 | 0.1495243 | 3.011651 | 2.710680 | 2.584466 | 4.341748 | 3.794175 |
| 2 | 2 | 2.293347e+11 | 2.375287e+12 | 8.813650e+09 | 3.083424e+12 | 4.436140e+10 | 173070828 | 1.743511e+10 | 69575126 | 2355741 | 0 | 1.585205e+11 | 4.436920e+10 | 4.111369e+13 | 0 | 0 | 2.131944 | 1.868056 | 5.208333 | 5.694444 | 4.479167 | 0.4927014 | 0.3892431 | 0.2916667 | 0.0000000 | 0.0064861 | 0.0143472 | 2.402778 | 3.069444 | 2.763889 | 4.416667 | 3.680556 |
finan2_canal_log <- finan2_canal
finan2_canal_log[3:17] <- log(finan2_canal_log[3:17] + 1)
media_finan2_canal <- aggregate(.~sub_grupos,data=finan2_canal_log, FUN=mean)| sub_grupos | grupos | entrada_canal1 | entrada_canal2 | entrada_canal3 | entrada_canal4 | entrada_canal5 | entrada_canal6 | entrada_canal7 | entrada_canal8 | entrada_canal9 | entrada_canal10 | entrada_otros | salida_canal5 | salida_canal2 | salida_canal8 | salida_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 2 | 29.30102 | 29.83030 | 19.222939 | 11.847929 | 18.880602 | 22.606128 | 4.389138 | 19.516420 | 18.758969 | 3.676791 | 8.5087482 | 17.501943 | 28.76458 | 4.643689 | 1.081215 | 2.458252 | 2.009709 | 4.988349 | 5.433010 | 4.916505 | 0.4238524 | 0.5742136 | 0.6970874 | 0.0990291 | 0.0796039 | 0.1495243 | 3.011651 | 2.710680 | 2.584466 | 4.341748 | 3.794175 |
| 2 | 2 | 12.83383 | 16.53001 | 3.582793 | 1.733572 | 2.693302 | 5.958623 | 0.660064 | 2.756379 | 1.654763 | 0.000000 | 0.6057181 | 2.987793 | 10.16682 | 0.000000 | 0.000000 | 2.131944 | 1.868056 | 5.208333 | 5.694444 | 4.479167 | 0.4927014 | 0.3892431 | 0.2916667 | 0.0000000 | 0.0064861 | 0.0143472 | 2.402778 | 3.069444 | 2.763889 | 4.416667 | 3.680556 |
Agrupamiento por variables de canales para el grupo 3 de financieras:
Se utiliza agrupamiento jerárquico con la idea de conocer la cantidad de grupos que se deben considerar
dendrogram <- hclust(dist(grupo3_scaled[2:16], method = 'euclidean'), method = 'ward.D')
plot(dendrogram, xlab="", sub="", cex=0.9)set.seed(932840)
kc3 <- kmeans(grupo3_scaled[2:16], 2 , nstart = 5, iter.max = 100)
clusplot(grupo3_scaled[,2:16], kc3$cluster, color = TRUE,
shade = FALSE, labels = 4, lines = 1,
col.clus = c("#7070FF", "#00007A"),
col.p = sapply(kc3$cluster, get_color_grupo3),
main = "Subgrupos del grupo 3 de financieras mediante K-means",
xlab = "Componente principal 1 canales",
ylab = "Componente principal 2 canales",
sub = "" )
grid()| Grupo | Número de clientes |
|---|---|
| 1 | 519 |
| 2 | 246 |
Nuevamente se le agrega al conjunto de datos la variable que indica el sub-grupo a partir de la segmentación con K-means en las variables de los canales:
finan3_canal <- data.frame(sub_grupos=kc3$cluster, grupo3_no_scaled)
finan3_canal$sub_grupos <- as.factor(finan3_canal$sub_grupos)| sub_grupos | grupos | entrada_canal1 | entrada_canal2 | entrada_canal3 | entrada_canal4 | entrada_canal5 | entrada_canal6 | entrada_canal7 | entrada_canal8 | entrada_canal9 | entrada_canal10 | entrada_otros | salida_canal5 | salida_canal2 | salida_canal8 | salida_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 2 | 2 | 3 | 0.000000e+00 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000e+00 | 0 | 0 | 1 | 1 | 2 | 6 | 2 | 1.000 | 0.000 | 0 | 0 | 0 | 0 | 1 | 3 | 1 | 3 | 4 |
| 3 | 1 | 3 | 7.352176e+10 | 7745007624 | 204886067 | 119447064008 | 12634037247 | 107777719 | 208577904975 | 0 | 0 | 0 | 0 | 12634037247 | 1.666626e+13 | 0 | 0 | 1 | 1 | 3 | 1 | 2 | 0.456 | 0.544 | 1 | 0 | 0 | 0 | 2 | 1 | 2 | 2 | 1 |
| 5 | 1 | 3 | 6.218878e+11 | 118748488736 | 129467842777 | 9327129803 | 0 | 5113117511 | 0 | 95065402 | 178910331 | 0 | 0 | 0 | 0.000000e+00 | 0 | 398753737891 | 1 | 1 | 2 | 2 | 2 | 1.000 | 0.000 | 1 | 0 | 0 | 0 | 2 | 2 | 1 | 3 | 3 |
| 6 | 1 | 3 | 2.993027e+09 | 4545628846 | 16185504 | 0 | 0 | 57425400 | 0 | 0 | 8246928 | 0 | 0 | 0 | 2.117460e+12 | 0 | 0 | 1 | 1 | 1 | 3 | 1 | 0.590 | 0.410 | 0 | 0 | 0 | 0 | 1 | 4 | 1 | 5 | 5 |
| 11 | 1 | 3 | 4.242316e+12 | 829688143534 | 7361176290 | 31313400008 | 75606435508 | 2525200000 | 0 | 6948924 | 29145531 | 138459600 | 0 | 199336757428 | 1.513276e+10 | 0 | 0 | 1 | 1 | 1 | 2 | 2 | 0.741 | 0.259 | 1 | 0 | 0 | 0 | 2 | 2 | 1 | 3 | 4 |
| 14 | 2 | 3 | 1.486786e+09 | 68395169098 | 14387184 | 0 | 54486666667 | 1008000 | 0 | 0 | 0 | 0 | 0 | 54486666667 | 0.000000e+00 | 0 | 0 | 2 | 2 | 2 | 3 | 2 | 0.623 | 0.377 | 0 | 0 | 0 | 0 | 2 | 3 | 1 | 4 | 4 |
| sub_grupos | grupos | entrada_canal1 | entrada_canal2 | entrada_canal3 | entrada_canal4 | entrada_canal5 | entrada_canal6 | entrada_canal7 | entrada_canal8 | entrada_canal9 | entrada_canal10 | entrada_otros | salida_canal5 | salida_canal2 | salida_canal8 | salida_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 3 | 1.151623e+14 | 4.738241e+12 | 2.85260e+13 | 2.915453e+13 | 279394386106 | 72422558801 | 610877067466 | 105808222289 | 197241359614 | 21430997 | 158515432162 | 276357470683 | 6.657192e+13 | 906136326.43 | 949040633 | 1.477842 | 1.416185 | 2.088632 | 2.475915 | 2.082852 | 0.5049846 | 0.4930983 | 0.5183044 | 0.0520231 | 0.0126802 | 0.0412697 | 1.643545 | 1.703275 | 1.695568 | 2.697495 | 2.635838 |
| 2 | 3 | 3.021146e+10 | 1.039947e+11 | 4.15166e+12 | 6.742347e+12 | 7099487067 | 80509217 | 93225283561 | 8385959 | 2361414 | 0 | 6382386316 | 5628067900 | 5.487275e+12 | 17604.88 | 6819599 | 1.467480 | 1.410569 | 2.117886 | 2.252032 | 1.678862 | 0.5935732 | 0.3657846 | 0.1951220 | 0.0081301 | 0.0058333 | 0.0185569 | 1.451220 | 1.747967 | 1.902439 | 2.471545 | 2.288618 |
finan3_canal_log <- finan3_canal
finan3_canal_log[3:17] <- log(finan3_canal[3:17] + 1)
media_finan3_canal <- aggregate(.~sub_grupos,data=finan3_canal_log, FUN=mean)| sub_grupos | grupos | entrada_canal1 | entrada_canal2 | entrada_canal3 | entrada_canal4 | entrada_canal5 | entrada_canal6 | entrada_canal7 | entrada_canal8 | entrada_canal9 | entrada_canal10 | entrada_otros | salida_canal5 | salida_canal2 | salida_canal8 | salida_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 3 | 26.34767 | 26.41110 | 17.813120 | 9.090136 | 14.147334 | 20.21784 | 3.992543 | 15.817476 | 15.599222 | 1.900101 | 2.8964100 | 13.735090 | 24.88216 | 1.914471 | 0.9291604 | 1.477842 | 1.416185 | 2.088632 | 2.475915 | 2.082852 | 0.5049846 | 0.4930983 | 0.5183044 | 0.0520231 | 0.0126802 | 0.0412697 | 1.643545 | 1.703275 | 1.695568 | 2.697495 | 2.635838 |
| 2 | 3 | 14.65034 | 17.99466 | 4.875251 | 2.683001 | 4.375379 | 5.25211 | 1.026647 | 1.163172 | 1.606975 | 0.000000 | 0.8076422 | 4.532006 | 13.22815 | 0.062119 | 0.2327337 | 1.467480 | 1.410569 | 2.117886 | 2.252032 | 1.678862 | 0.5935732 | 0.3657846 | 0.1951220 | 0.0081301 | 0.0058333 | 0.0185569 | 1.451220 | 1.747967 | 1.902439 | 2.471545 | 2.288618 |
Grupos finales
Dado que en los procedimientos anteriores se obtuvieron grupos y subgrupos, ahora llega el momento de crear los 6 grupos resultates, que consiste en la combinación de un grupo y subgrupo respectivamente:
Grupo 1: grupo 1 subgrupo 1 Grupo 2: grupo 1 subgrupo 2 Grupo 3: grupo 2 subgrupo 1 Grupo 4: grupo 2 subgrupo 2 Grupo 5: grupo 3 subgrupo 1 Grupo 6: grupo 3 subgrupo 2
Grupo1 <- finan1_canal[finan1_canal$sub_grupos==1,] #grupo 1 subgrupo 1
Grupo2 <- finan1_canal[finan1_canal$sub_grupos==2,] #grupo 1 subgrupo 2
Grupo3 <- finan2_canal[finan2_canal$sub_grupos==1,] #grupo 2 subgrupo 1
Grupo4 <- finan2_canal[finan2_canal$sub_grupos==2,] #grupo 2 subgrupo 2
Grupo5 <- finan3_canal[finan3_canal$sub_grupos==1,] #grupo 3 subgrupo 1
Grupo6 <- finan3_canal[finan3_canal$sub_grupos==2,] #grupo 3 subgrupo 2| Grupos | sub_grupos | grupos | entrada_canal1 | entrada_canal2 | entrada_canal3 | entrada_canal4 | entrada_canal5 | entrada_canal6 | entrada_canal7 | entrada_canal8 | entrada_canal9 | entrada_canal10 | entrada_otros | salida_canal5 | salida_canal2 | salida_canal8 | salida_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 4 | 1 | 1 | 1 | 6.816608e+09 | 1.601385e+10 | 454114370 | 0 | 0 | 237646144 | 0 | 108000000 | 0 | 0 | 0 | 0 | 7.509247e+09 | 0 | 0.000e+00 | 2 | 2 | 1 | 1 | 1 | 0.615 | 0.385 | 1 | 0 | 0 | 0 | 5 | 2 | 3 | 5 | 5 |
| 13 | 1 | 1 | 1 | 6.637634e+11 | 7.708352e+12 | 547474103 | 27084339545 | 73426022678 | 14952014444 | 0 | 12373550018 | 197220571 | 0 | 0 | 63342000000 | 6.075665e+12 | 13044000 | 0.000e+00 | 4 | 2 | 3 | 3 | 3 | 0.519 | 0.481 | 1 | 0 | 0 | 0 | 5 | 3 | 4 | 5 | 5 |
| 15 | 1 | 1 | 1 | 1.954518e+13 | 9.448526e+12 | 78496902169 | 0 | 538300959 | 108798237345 | 0 | 3528757423 | 565768278 | 0 | 0 | 507006570 | 1.771552e+13 | 0 | 1.800e+08 | 2 | 2 | 2 | 4 | 2 | 0.386 | 0.614 | 0 | 0 | 0 | 0 | 2 | 3 | 1 | 4 | 5 |
| 16 | 1 | 1 | 1 | 8.327681e+08 | 5.462762e+10 | 6849104 | 0 | 1223337478 | 0 | 0 | 0 | 1585200 | 0 | 0 | 1223337478 | 2.190591e+11 | 9300000 | 3.429e+09 | 2 | 2 | 1 | 2 | 2 | 0.709 | 0.291 | 0 | 0 | 0 | 0 | 3 | 3 | 1 | 4 | 5 |
| 17 | 1 | 1 | 1 | 2.916286e+12 | 2.470397e+11 | 75421800 | 7068619658 | 0 | 27854989819 | 0 | 16017379 | 64128822 | 0 | 0 | 0 | 0.000000e+00 | 7869552 | 0.000e+00 | 2 | 2 | 4 | 3 | 3 | 1.000 | 0.000 | 1 | 0 | 0 | 0 | 5 | 3 | 4 | 5 | 3 |
| 20 | 1 | 1 | 1 | 2.237639e+10 | 4.058523e+10 | 29382229 | 0 | 906111382 | 121890000 | 0 | 0 | 0 | 0 | 0 | 906111382 | 1.510882e+12 | 0 | 0.000e+00 | 1 | 1 | 1 | 2 | 4 | 0.355 | 0.645 | 0 | 0 | 0 | 0 | 6 | 3 | 2 | 6 | 6 |
| Grupos | sub_grupos | grupos | entrada_canal1 | entrada_canal2 | entrada_canal3 | entrada_canal4 | entrada_canal5 | entrada_canal6 | entrada_canal7 | entrada_canal8 | entrada_canal9 | entrada_canal10 | entrada_otros | salida_canal5 | salida_canal2 | salida_canal8 | salida_otros | impo_cv | expo_vt | cxp | cxc | totalinventory | pagos_pj | pagos_pn | tiene_ventas_fisicas | tiene_ventas_electronicas | recaudos_pj | recaudos_pn | rotacion_inventarios | rotacion_cxc | rotacion_cxp | ciclo_negocio | ciclo_financiero |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | 1 | 26.61566 | 26.64070 | 16.294361 | 7.735484 | 14.168457 | 21.102242 | 1.0112694 | 17.249732 | 17.005363 | 2.1598069 | 3.4576728 | 13.253201 | 23.61465 | 2.647167 | 1.0108119 | 2.431304 | 1.852174 | 2.040000 | 3.024348 | 3.659130 | 0.5968470 | 0.3944661 | 0.5130435 | 0.0539130 | 0.0121513 | 0.0521965 | 4.766957 | 2.726957 | 2.233043 | 5.320000 | 5.353044 |
| 2 | 2 | 1 | 14.92172 | 16.99768 | 3.025855 | 1.021924 | 5.066280 | 7.219199 | 0.5201569 | 1.852904 | 1.883247 | 0.0841949 | 0.2944962 | 4.754575 | 11.34441 | 0.000000 | 0.0843097 | 1.901709 | 1.602564 | 1.871795 | 2.752137 | 3.111111 | 0.6992308 | 0.2537821 | 0.2094017 | 0.0042735 | 0.0005598 | 0.0079872 | 4.521368 | 2.837607 | 2.222222 | 5.461538 | 5.354701 |
| 3 | 1 | 2 | 29.30102 | 29.83030 | 19.222939 | 11.847929 | 18.880602 | 22.606128 | 4.3891384 | 19.516420 | 18.758969 | 3.6767910 | 8.5087482 | 17.501943 | 28.76458 | 4.643689 | 1.0812154 | 2.458252 | 2.009709 | 4.988349 | 5.433010 | 4.916505 | 0.4238524 | 0.5742136 | 0.6970874 | 0.0990291 | 0.0796039 | 0.1495243 | 3.011651 | 2.710680 | 2.584466 | 4.341748 | 3.794175 |
| 4 | 2 | 2 | 12.83383 | 16.53001 | 3.582793 | 1.733572 | 2.693302 | 5.958623 | 0.6600640 | 2.756379 | 1.654763 | 0.0000000 | 0.6057181 | 2.987793 | 10.16682 | 0.000000 | 0.0000000 | 2.131944 | 1.868056 | 5.208333 | 5.694444 | 4.479167 | 0.4927014 | 0.3892431 | 0.2916667 | 0.0000000 | 0.0064861 | 0.0143472 | 2.402778 | 3.069444 | 2.763889 | 4.416667 | 3.680556 |
| 5 | 1 | 3 | 26.34767 | 26.41110 | 17.813120 | 9.090136 | 14.147334 | 20.217838 | 3.9925432 | 15.817476 | 15.599222 | 1.9001011 | 2.8964100 | 13.735090 | 24.88216 | 1.914471 | 0.9291604 | 1.477842 | 1.416185 | 2.088632 | 2.475915 | 2.082852 | 0.5049846 | 0.4930983 | 0.5183044 | 0.0520231 | 0.0126802 | 0.0412697 | 1.643545 | 1.703275 | 1.695568 | 2.697495 | 2.635838 |
| 6 | 2 | 3 | 14.65034 | 17.99466 | 4.875251 | 2.683001 | 4.375379 | 5.252110 | 1.0266473 | 1.163172 | 1.606975 | 0.0000000 | 0.8076422 | 4.532006 | 13.22815 | 0.062119 | 0.2327337 | 1.467480 | 1.410569 | 2.117886 | 2.252032 | 1.678862 | 0.5935732 | 0.3657846 | 0.1951220 | 0.0081301 | 0.0058333 | 0.0185569 | 1.451220 | 1.747967 | 1.902439 | 2.471545 | 2.288618 |
Variables de los canales
En comparación con las segmentaciones hechas por los anteriores procedimientos esta es la mejor definida, ya que se esperaba que los grupos 1,3,5 fueron más similares entre si y estuvieran más arriba y que el grupo 2,4,6 fueron muy similares entre si y estuvieran más abajo, dado que esto es lo que se ha analizado que pasa en cada una de las subagrupaciones de las variables de los canales.
Variables financieras
El grupo 1, 3 y 4 es el que tiene mayor nivel promedio de importaciones y exportaciones, mientras que el grupo 5 y 6 son los que menos realizan importaciones y exportaciones; el grupo 3 y 4 tienen mayor nivel promedio de cuentas por pagar y cobrar y mayor inventario, el grupo 1 y 2 tienen un nivel promedio de cuentas por pagar y cobrar e inventario intermedio mientras que el grupo 5 y 6 tienen un nivel promedio de cuentas por pagar y cobrar e inventario bajos.
En general todos los grupos presentan mayor número promedio de ventas fisicas que electronicas, además el grupo 3 es el que presenta mayor promedio de pagos a personas naturales, mayor número promedio de ventas fisicas y electronicas y mayor número promedio de recaudos a personas juridicas y naturales. El grupo 1, 2 y 6 es el que realiza mayor proporción de pagos a personas juridicas, pero son los que realizan menor proporción de pagos a personas naturales. El grupo 2, 4, 6 tiene la menor cantidad de ventas fisicas y electronicas, además de los menores recaudos a personas juridicas y naturales.
El grupo 1 y 2, el grupo 3 y 4, el grupo 5 y 6 tiene comportamientos muy similares en las rotaciones de inventario, rotaciones de cuentas por cobrar y pagar y en los ciclos de negocio y financieros, en donde el grupo 5 y 6 es al que le toma menos tiempo promedio realizar estas rotaciones y ciclos, al grupo 1 y 2 le toma mayor tiempo promedio realizar las rotaciones de inventario y hacer los ciclos de negocio y financiero, por otro lado el grupo 4 es al que más tiempo promedio le toma realizar las rotaciones de cuenta por cobrar y pagar.
En general asi los grupos se parezcan entre si, estos se difieren en algo, ya sea en las variables financieras o en los canales.
Grupo 1: es de los que tiende a manejar mayores montos de dinero y mayor número de transacciones a través de los canales, además de que es uno de los grupos que mayores importaciones y exportaciones realiza, aunque igual el nivel de estas no es tan alto tiene buena cantidad de cuentas por cobrar, además de una gran cantidad de inventarios, que aunque no es la más alta, tiene un nivel promedio. Maneja un valor intermedio ventas fisicas en comparación con los demás grupos, se demora más rotando el inventario y realizando su ciclo de negocio y financiero, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas grandes, de productos, por ello manejan mucho inventario y se demoran mucho para rotarlo, además de que venden y compran productos al exterior.
Grupo 2: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, realizan pocas importaciones y exportaciones, tienen pocas cuentas por pagar y aunque tiene mas cuentas por cobrar, tampoco estas son altas, tiene un inventario de un nivel intermedio, es el grupo que tiene mayor porcentaje de pagos a personas juridicas que a personas naturales, además es uno de los grupos con menores ventas fisicas y electronicas, es decir las menores ventas en general, además de ser el grupo que más se demora rotando el inventario y realizando el su ciclo de negocio y financiero, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que quizas no estan tan desarrolladas y estan en un proceso de crecimiento, en donde sus ventas no son las mejores y no tiene tanto contacto a nivel internacional.
Grupo 3: es el que tiene mayores montos de dinero y mayor número de transacciones a través de los canales en comparación con el resto de los grupos, es uno de los grupos que mayores importaciones y exportaciones realiza, aunque igual el nivel de estas no es tan alto, tiene un nivel alto en la cuentas por pagar, cuentas por cobrar e inventario, además el grupo 3 es el que presenta mayor promedio de pagos a personas naturales, mayor número de ventas fisicas y electronicas y mayor número de recaudos a personas juridicas y naturales y en general tiene un nivel promedio en las rotaciones y ciclos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas grandes muy desarrolladas, que se manejan a nivel nacional e internacional, que parecen ser de productos dado que manejan el mayor nivel de inventario, además de tiener muchas ventas ya sean fisicas o electronicas y sus rotaciones de inventario y de cuentas al igual que sus ciclos no tienden a ser tan rapidos ni tan lentos.
Grupo 4: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, es uno de los grupos que mayores importaciones y exportaciones realiza, aunque igual el nivel de estas no es tan alto, maneja un nivel muy alto de cuenta por cobrar y pagar, también dispone de un nivel alto de inventario, su nivel de ventas es intermedio al igual que la rotación de inventario y ciclo de negocio y financiero y en comparación con los otros grupos es el que tiene las rotaciones de cuentas por cobrar y pagar más lenta, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que ofrecen un servicio o producto en donde su forma de pago no es inmediata, como por ejemplo empresas que realizan pedidos o encargos, empresas distribuidores, etc.
Grupo 5: es de los que tiende a manejar mayores montos de dinero y mayor número de transacciones a través de los canales, tiene un nivel bajo de importaciones y exportaciones y un nivel intermedio de cuentas por cobrar, cuentas por pagar e inventario, también tiene un alto porcentaje de pagos a personas juridicas y naturales, además un buen porcentaje de ventas fisicas y en general tiene rotaciones de inventario, rotaciones de cuentas y ciclos relativamente rápidos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que se encargan de distribuir productos nacionales, los cuales tienen un proceso de venta rápido, dado que el inventario no es grande ni pequeño pero tienden a realizar rotaciones en poco tiempo y por el hecho de manejar buen monto de dinero nos da idea de que puede ser una empresa grande o muy bien acreditada.
Grupo 6: es de los que tiende a manejar menores montos de dinero y menor número de transacciones a través de los canales, tiene niveles bajos de importaciones, exportaciones, de cuentas por cobrar y pagar e inventario, tiene porcentajes altos de pagos a personas juridicas y naturales y sus rotaciones de inventario, de cuentas y ciclos son rápidos, por lo tanto se piensa que los clientes que pertenecen a este grupo, son empresas que en general se espera que no sean grandes y tiendan a ofrecer servicios a nivel nacional.
Comentario adicional:
Los valores extremos encontrados inicialmente en los canales son los siguientes:
“825, 1416, 1462, 1668, 1773”
Los cuales pertenecen al grupo:
“5, 3, 3, 1, 3” respectivamente lo cual significa que todos quedan en los grupos que más dinero mueven y más tranzan por los canales, por lo tanto la segmentación es confiable.
En conclusión, todos los procesos de segmentación arrojaron que se deben de considerar 6 grupos de clientes, estos grupos formados se pueden interpretar y están bien definidas las diferencias entre cada uno ellos, porque a pesar de que hayas cosas similares entre pares de grupos, en algo se diferencias ya sea mediante las variables financieras o el uso de los canales. Cada uno de los grupos tiene sus características particulares en la parte financiera, que es la que indica lo que necesita el cliente de la compañía, de cuáles son las características que hacen identificar cómo se comporta este en su propio entorno y como está estructurada, además que permite definir cada uno de los grupos en como usan los canales que se le ofrecen, con la idea de saber cuál se les puede ofrecer con más certeza y cuales definitivamente no son de su interés.
Se resalta la utilidad de los algoritmos de aprendizaje no supervisado, en este caso kmeans que permitió encontrar patrones y características de los clientes que para un humano serían imperceptibles a simple vista.
La transformación logarítmica jugo un gran papel ayudando a controlar los valores extremos para obtener mejores agrupaciones al aplicar kmeans y a la hora de visualizar los datos.
Durante el desarrollo del trabajo se tuvieron en cuenta otros caminos para llegar a los grupos:
El análisis de componentes principales para la reducción de variables antes de realizar el proceso de segmentación.
Se intentó modificar las variables, como el cálculo del porcentaje de uso para las variables asociadas a los canales.
Uso del algoritmo de segmentación agrupamiento jerárquico.
Segmentar aplicando la transformación logaritmo natural y sin aplicarla.
Además de tener en cuenta la base de datos completa y decidir realizar una división que agrupara los datos según la naturaleza de las variables (financieras y canales) para obtener mejores resultados.
realmente se pasó por muchas etapas, en este documento se presentan las que generaron mejores resultados e hicieron que los grupos tuvieran mayor sentido.
Se sugiere para futuros trabajos variar las técnicas de escalamiento de los datos por ejemplo min-max y probar otros algoritmos de agrupación y contrastar con los grupos encontrados con kmeans.
Sacar las variables que no aportaron mucho a la segmentación, ya que se comportan de manera similar en todos los grupos (ventas físicas, ventas electrónicas, recaudos personas jurídicas, recaudos personas naturales). Y excluir algunas variables en canales que estén fuertemente correlacionadas, es decir hacer una selección de variables basada en la correlación.
Dado que se caracterizo a cada uno de los grupos con un perfil puntual, se recomienda a la compañia ofrecerle sus servicios y beneficios en base a este tipo de perfiles, dado que todos tienen un uso similar de los canales pero unos con más frecuencia o mayores montos que otros, entonces mediante esto medir el grado de confiabilidad que se le va a brindar a cada uno de los clientes, además entender que financieramente cada uno tiene sus caracteristicas y por lo tanto aprender a identificar las necesidades que tienen en base a esto.
En el siguiente link se encuentra el acceso al github donde están los notebooks de todos los procesos de segmentación de clientes desarrollados, incluso los que no se mencionan durante este informe:
Cuentas por cobrar - ¿Qué son las cuentas por cobrar? (n.d.). Debitoor.Es. Retrieved August 3, 2021, from https://debitoor.es/glosario/cuentas-por-cobrar
Glosario de contabilidad. (n.d.). Debitoor.Es. Retrieved August 3, 2021, from https://debitoor.es/glosario
Logaritmo natural. (2019, March 13). Economipedia.com. https://economipedia.com/definiciones/logaritmo-natural.html
Na, S., Xumin, L., & Yong, G. (2010). Research on k-means Clustering Algorithm: An Improved k-means Clustering Algorithm. 2010 Third International Symposium on Intelligent Information Technology and Security Informatics. https://doi.org/10.1109/iitsi.2010.74
Práctica 8. (n.d.). Ugr.Es. Retrieved August 3, 2021, from http://wpd.ugr.es/~bioestad/guia-spss/practica-8/
Ripley, B. D. (2001). The R project in statistical computing. MSOR Connections, 1(1).
Rotación de inventarios. (2020, April 29). Gerencie.com. https://www.gerencie.com/rotacion-de-inventarios.html