Arboles de Clasificación

Pamela Ruiz

24/11/2020

Campañas promocionales

Objetivo

Una compañía quiere entender cómo eficientar campañas promocionales, se cuenta con los resultados de las últimas 5 campañas.

Se busca analizar las caracteristicas del cliente y la relación cliente-tienda para ayudar a la compañia a mejorar el target de una campaña.

Una vista de nuestros datos

Muestra de datos
Year_Birth Education Marital_Status Income Kidhome Teenhome Recency MntWines
1 1957 Graduation Single 58138 0 0 58 635
2 1954 Graduation Single 46344 1 1 38 11
3 1965 Graduation Together 71613 0 0 26 426
4 1984 Graduation Together 26646 1 0 26 11
5 1981 PhD Married 58293 1 0 94 173
6 1967 Master Together 62513 0 1 16 520
Muestra de datos
MntFruits MntMeatProducts MntFishProducts MntSweetProducts MntGoldProds NumDealsPurchases NumWebPurchases
1 88 546 172 88 88 3 8
2 1 6 2 1 6 2 1
3 49 127 111 21 42 1 8
4 4 20 10 3 5 2 2
5 43 118 46 27 15 5 5
6 42 98 0 42 14 2 6
Muestra de datos
NumCatalogPurchases NumStorePurchases NumWebVisitsMonth AcceptedCmp3 AcceptedCmp4 AcceptedCmp5 AcceptedCmp1
1 10 4 7 0 0 0 0
2 1 2 5 0 0 0 0
3 2 10 4 0 0 0 0
4 0 4 6 0 0 0 0
5 3 6 5 0 0 0 0
6 4 10 6 0 0 0 0

Datos de entrenamiento y de prueba

Se tomaron las variables de la base de datos de mayor relevancia para el objetivo en cuestión.

Se escogieron el 20% de los datos para tomarlos como datos de prueba y se modela el arbol de clasificación con el 80% de los datos (2240 observaciones).

Arbol de clasificación

Los nodos obtenidos del modelo son los siguientes, con sus respectivas probabilidades.

## n= 1760 
## 
## node), split, n, loss, yval, (yprob)
##       * denotes terminal node
## 
##   1) root 1760 265 0 (0.84943182 0.15056818)  
##     2) AcceptedCmp5< 0.5 1631 194 0 (0.88105457 0.11894543)  
##       4) AcceptedCmp3< 0.5 1531 152 0 (0.90071848 0.09928152)  
##         8) Recency>=12.5 1313  97 0 (0.92612338 0.07387662) *
##         9) Recency< 12.5 218  55 0 (0.74770642 0.25229358)  
##          18) NumWebVisitsMonth< 7.5 178  35 0 (0.80337079 0.19662921)  
##            36) MntMeatProducts< 547.5 165  27 0 (0.83636364 0.16363636) *
##            37) MntMeatProducts>=547.5 13   5 1 (0.38461538 0.61538462) *
##          19) NumWebVisitsMonth>=7.5 40  20 0 (0.50000000 0.50000000)  
##            38) Marital_Status=Divorced,Married 19   5 0 (0.73684211 0.26315789) *
##            39) Marital_Status=Single,Together,Widow,YOLO 21   6 1 (0.28571429 0.71428571) *
##       5) AcceptedCmp3>=0.5 100  42 0 (0.58000000 0.42000000)  
##        10) Recency>=19.5 82  27 0 (0.67073171 0.32926829)  
##          20) MntSweetProducts< 0.5 21   0 0 (1.00000000 0.00000000) *
##          21) MntSweetProducts>=0.5 61  27 0 (0.55737705 0.44262295)  
##            42) NumCatalogPurchases< 7.5 53  20 0 (0.62264151 0.37735849)  
##              84) MntWines>=126 26   6 0 (0.76923077 0.23076923) *
##              85) MntWines< 126 27  13 1 (0.48148148 0.51851852)  
##               170) MntGoldProds< 25.5 13   4 0 (0.69230769 0.30769231) *
##               171) MntGoldProds>=25.5 14   4 1 (0.28571429 0.71428571) *
##            43) NumCatalogPurchases>=7.5 8   1 1 (0.12500000 0.87500000) *
##        11) Recency< 19.5 18   3 1 (0.16666667 0.83333333) *
##     3) AcceptedCmp5>=0.5 129  58 1 (0.44961240 0.55038760)  
##       6) AcceptedCmp1< 0.5 79  30 0 (0.62025316 0.37974684)  
##        12) Recency>=26.5 60  17 0 (0.71666667 0.28333333)  
##          24) Marital_Status=Married,Together 42   6 0 (0.85714286 0.14285714) *
##          25) Marital_Status=Divorced,Single,Widow 18   7 1 (0.38888889 0.61111111) *
##        13) Recency< 26.5 19   6 1 (0.31578947 0.68421053) *
##       7) AcceptedCmp1>=0.5 50   9 1 (0.18000000 0.82000000) *

Las personas que asistieron a la última campaña promocional tienen una gran probabilidad de asistir a la siguiete, más aún las personas que asistieron a la primera y a la última campaña tienen una probabilidad del 0.81 de asistir a la siguiente campaña.

Por otro lado las personas que solo asistieron a la última campaña sin haber asistido a la primera y su última compra se realizó a lo más hace 22 días tendrán un 0.74 de probabilidad de asistir a la siguiente campaña. De esta forma nuestro modelo clasifica bien el 74% de nuestros datos.

El arbol es el siguiente:

Predicción

Realizamos la predicción de los datos respecto a los datos que elegimos de prueba

##              0          1
## 1635 0.9261234 0.07387662
## 1466 0.9261234 0.07387662
## 1337 0.9261234 0.07387662
## 55   0.9261234 0.07387662
## 1388 0.8363636 0.16363636
## 457  0.9261234 0.07387662

Conclusiones

See identificaron las siguientes caracteristicas en personas que se clasificaron dentro del grupo deseado que asistirá a las campañas promocionales:

  • Las personas que asistieron a la última campaña (campaña 5)
  • Las personas que asistieron a la primer campaña (campaña 1)
  • Las personas que tienen menos de 22 dias de haber comprado en la compañia.
  • Las personas que no estan casadas o juntadas.
  • Las personas solteras que tienen mas de 22 días de la última compra y que han gastado menos de 55 en productos de pescado.

Por lo que se le podría recomendar a la compañia enfocarse a desarrollar publicidad que atraiga a las personas que con ciertas características tiene poca probabilidad de responder o sistir a la siguiente campaña promocional.

Por ejemplo:

  • Las personas que no asistieron a la última campaña, tampoco asistieron a la campaña 3 y realizaron una compra hace más de 18 días. Es de vital importancia identificar estos clientes para poder crear estrategias que los atraigan.

  • Las personas que no asistieron a la última campaña, tampoco asistieron a la campaña 3 y realizaron una compra hace menos de 18 días. Tampoco visita el sitio Web y gastan menos de 662 en productos de carne en los últimos 2 años.

Se les podría incentivar via correo electronico, teléfono o propaganda a visitar el sitio web asi como a asistir a las campañas promocionales intentando conocer sus gustos mediante un cuestionario para implementar acciones que atraigan a este sector.

Se recomienda buscar a las personas que cumplan estas carácterísticas para enfocarse en ellas.