I. Comprensión del negocio

a. Descripción y comprensión comercial de la entidad

Según nuestra misión de negocio, enfocada en brindar a los clientes una experiencia de compra fascinante, hemos puesto a su disposición Ripley.com, nuestra tienda virtual con ofertas de los mejores productos de los cinco continentes.

b. Determinación de los objetivos comerciales de la entidad

Somos una de las más grandes compañías del sector retail con presencia en Chile, Perú y Colombia. El objetivo de nuestro negocio es ofrecer moda a precios accesibles, accesorios y productos variados para el hogar.

c. Valoración de la situación actual de la entidad

La empresa se encuentra en un buen posicionamiento en el mercado frente a la competencia, con el fin de aplicar la mineria da datos podemos seguir mejorando en atencion al cliente y ofreciendo los productos que satisfagan las necesidades.

d. Determinación de los objetivos de minería de datos

Vamos a explorar los datos de la empresa “Ripley” con fines educativos y de aprendizaje.

ripley<-read.csv("https://raw.githubusercontent.com/VictorGuevaraP/Mineria-de-datos/master/MarkRipley.csv" , sep = ";")

head(ripley)
##   edad     trabajo est.civ  educacion mora balance vivienda prestamo
## 1   30 Desempleado  Casado   primaria   no    1787       no       no
## 2   33      Servis  Casado secundaria   no    4789       si       si
## 3   35   Ejecutivo Soltero   Superior   no    1350       si       no
## 4   30   Ejecutivo  Casado   Superior   no    1476       si       si
## 5   59      Obrero  Casado secundaria   no       0       si       no
## 6   35   Ejecutivo Soltero   Superior   no     747       no       no
##      contacto dia     mes duracion campana pdias previo  presultado
## 1     celular  19 Octubre       79       1    -1      0 desconocido
## 2     celular  11    Mayo      220       1   339      4     fracaso
## 3     celular  16   abril      185       1   330      1     fracaso
## 4 desconocido   3   Junio      199       4    -1      0 desconocido
## 5 desconocido   5    Mayo      226       1    -1      0 desconocido
## 6     celular  23 Febrero      141       2   176      3     fracaso
##   suscrito
## 1       no
## 2       no
## 3       no
## 4       no
## 5       no
## 6       no
str(ripley)
## 'data.frame':    4521 obs. of  17 variables:
##  $ edad      : int  30 33 35 30 59 35 36 39 41 43 ...
##  $ trabajo   : Factor w/ 12 levels "admin.","desconocido",..: 3 11 4 4 9 4 8 12 6 11 ...
##  $ est.civ   : Factor w/ 3 levels "Casado","Divorciado",..: 1 1 3 1 1 3 1 1 1 1 ...
##  $ educacion : Factor w/ 4 levels "desconocido",..: 2 3 4 4 3 4 4 3 4 2 ...
##  $ mora      : Factor w/ 2 levels "no","si": 1 1 1 1 1 1 1 1 1 1 ...
##  $ balance   : int  1787 4789 1350 1476 0 747 307 147 221 -88 ...
##  $ vivienda  : Factor w/ 2 levels "no","si": 1 2 2 2 2 1 2 2 2 2 ...
##  $ prestamo  : Factor w/ 2 levels "no","si": 1 2 1 2 1 1 1 1 1 2 ...
##  $ contacto  : Factor w/ 3 levels "celular","desconocido",..: 1 1 1 2 2 1 1 1 2 1 ...
##  $ dia       : int  19 11 16 3 5 23 14 6 14 17 ...
##  $ mes       : Factor w/ 12 levels "abril","Agosto",..: 11 9 1 7 9 5 9 9 9 1 ...
##  $ duracion  : int  79 220 185 199 226 141 341 151 57 313 ...
##  $ campana   : int  1 1 1 4 1 2 1 2 2 1 ...
##  $ pdias     : int  -1 339 330 -1 -1 176 330 -1 -1 147 ...
##  $ previo    : int  0 4 1 0 0 3 2 0 0 2 ...
##  $ presultado: Factor w/ 4 levels "desconocido",..: 1 3 3 1 1 3 4 1 1 3 ...
##  $ suscrito  : Factor w/ 2 levels "no","si": 1 1 1 1 1 1 1 1 1 1 ...
summary(ripley)
##       edad            trabajo          est.civ           educacion   
##  Min.   :19.00   Ejecutivo:969   Casado    :2797   desconocido: 187  
##  1st Qu.:33.00   Obrero   :946   Divorciado: 528   primaria   : 678  
##  Median :39.00   Tecnico  :768   Soltero   :1196   secundaria :2306  
##  Mean   :41.17   admin.   :478                     Superior   :1350  
##  3rd Qu.:49.00   Servis   :417                                       
##  Max.   :87.00   Retirado :230                                       
##                  (Other)  :713                                       
##  mora         balance      vivienda  prestamo         contacto   
##  no:4445   Min.   :-3313   no:1962   no:3830   celular    :2896  
##  si:  76   1st Qu.:   69   si:2559   si: 691   desconocido:1324  
##            Median :  444                       teléfono   : 301  
##            Mean   : 1423                                         
##            3rd Qu.: 1480                                         
##            Max.   :71188                                         
##                                                                  
##       dia               mes          duracion       campana      
##  Min.   : 1.00   Mayo     :1398   Min.   :   4   Min.   : 1.000  
##  1st Qu.: 9.00   Julio    : 706   1st Qu.: 104   1st Qu.: 1.000  
##  Median :16.00   Agosto   : 633   Median : 185   Median : 2.000  
##  Mean   :15.92   Junio    : 531   Mean   : 264   Mean   : 2.794  
##  3rd Qu.:21.00   Noviembre: 389   3rd Qu.: 329   3rd Qu.: 3.000  
##  Max.   :31.00   abril    : 293   Max.   :3025   Max.   :50.000  
##                  (Other)  : 571                                  
##      pdias            previo              presultado   suscrito 
##  Min.   : -1.00   Min.   : 0.0000   desconocido:3705   no:4000  
##  1st Qu.: -1.00   1st Qu.: 0.0000   éxito      : 129   si: 521  
##  Median : -1.00   Median : 0.0000   fracaso    : 490            
##  Mean   : 39.77   Mean   : 0.5426   otro       : 197            
##  3rd Qu.: -1.00   3rd Qu.: 0.0000                               
##  Max.   :871.00   Max.   :25.0000                               
## 

ANALISIS BIVARIADO Y MULTIVARIADO

plot(ripley$edad , ripley$prestamo, main = "Analisis1", xlab = "Edad", ylab = "Prestamo: 1=Si 2=No")

#En este grafico observamos la personas que tienen un prestamo y sus respectivas edades
plot(ripley$est.civ ,ripley$edad , main = "Analisis2", ylab = "Edad", xlab = "Estado Civil: 1=Casado 2=Divorciado 3=Soltero")

pairs(ripley$edad ~ ripley$balance)

plot(ripley)

cor(ripley$edad ,ripley$balance)
## [1] 0.08382014
library(corrplot)
## corrplot 0.84 loaded
data(iris)
corrplot(cor(iris[,1:3]),method= c("pie"))