I. Comprensión del negocio
a. Descripción y comprensión comercial de la entidad
Según nuestra misión de negocio, enfocada en brindar a los clientes una experiencia de compra fascinante, hemos puesto a su disposición Ripley.com, nuestra tienda virtual con ofertas de los mejores productos de los cinco continentes.
b. Determinación de los objetivos comerciales de la entidad
Somos una de las más grandes compañías del sector retail con presencia en Chile, Perú y Colombia. El objetivo de nuestro negocio es ofrecer moda a precios accesibles, accesorios y productos variados para el hogar.
c. Valoración de la situación actual de la entidad
La empresa se encuentra en un buen posicionamiento en el mercado frente a la competencia, con el fin de aplicar la mineria da datos podemos seguir mejorando en atencion al cliente y ofreciendo los productos que satisfagan las necesidades.
d. Determinación de los objetivos de minería de datos
Vamos a explorar los datos de la empresa “Ripley” con fines educativos y de aprendizaje.
ripley<-read.csv("https://raw.githubusercontent.com/VictorGuevaraP/Mineria-de-datos/master/MarkRipley.csv" , sep = ";")
head(ripley)
## edad trabajo est.civ educacion mora balance vivienda prestamo
## 1 30 Desempleado Casado primaria no 1787 no no
## 2 33 Servis Casado secundaria no 4789 si si
## 3 35 Ejecutivo Soltero Superior no 1350 si no
## 4 30 Ejecutivo Casado Superior no 1476 si si
## 5 59 Obrero Casado secundaria no 0 si no
## 6 35 Ejecutivo Soltero Superior no 747 no no
## contacto dia mes duracion campana pdias previo presultado
## 1 celular 19 Octubre 79 1 -1 0 desconocido
## 2 celular 11 Mayo 220 1 339 4 fracaso
## 3 celular 16 abril 185 1 330 1 fracaso
## 4 desconocido 3 Junio 199 4 -1 0 desconocido
## 5 desconocido 5 Mayo 226 1 -1 0 desconocido
## 6 celular 23 Febrero 141 2 176 3 fracaso
## suscrito
## 1 no
## 2 no
## 3 no
## 4 no
## 5 no
## 6 no
str(ripley)
## 'data.frame': 4521 obs. of 17 variables:
## $ edad : int 30 33 35 30 59 35 36 39 41 43 ...
## $ trabajo : Factor w/ 12 levels "admin.","desconocido",..: 3 11 4 4 9 4 8 12 6 11 ...
## $ est.civ : Factor w/ 3 levels "Casado","Divorciado",..: 1 1 3 1 1 3 1 1 1 1 ...
## $ educacion : Factor w/ 4 levels "desconocido",..: 2 3 4 4 3 4 4 3 4 2 ...
## $ mora : Factor w/ 2 levels "no","si": 1 1 1 1 1 1 1 1 1 1 ...
## $ balance : int 1787 4789 1350 1476 0 747 307 147 221 -88 ...
## $ vivienda : Factor w/ 2 levels "no","si": 1 2 2 2 2 1 2 2 2 2 ...
## $ prestamo : Factor w/ 2 levels "no","si": 1 2 1 2 1 1 1 1 1 2 ...
## $ contacto : Factor w/ 3 levels "celular","desconocido",..: 1 1 1 2 2 1 1 1 2 1 ...
## $ dia : int 19 11 16 3 5 23 14 6 14 17 ...
## $ mes : Factor w/ 12 levels "abril","Agosto",..: 11 9 1 7 9 5 9 9 9 1 ...
## $ duracion : int 79 220 185 199 226 141 341 151 57 313 ...
## $ campana : int 1 1 1 4 1 2 1 2 2 1 ...
## $ pdias : int -1 339 330 -1 -1 176 330 -1 -1 147 ...
## $ previo : int 0 4 1 0 0 3 2 0 0 2 ...
## $ presultado: Factor w/ 4 levels "desconocido",..: 1 3 3 1 1 3 4 1 1 3 ...
## $ suscrito : Factor w/ 2 levels "no","si": 1 1 1 1 1 1 1 1 1 1 ...
summary(ripley)
## edad trabajo est.civ educacion
## Min. :19.00 Ejecutivo:969 Casado :2797 desconocido: 187
## 1st Qu.:33.00 Obrero :946 Divorciado: 528 primaria : 678
## Median :39.00 Tecnico :768 Soltero :1196 secundaria :2306
## Mean :41.17 admin. :478 Superior :1350
## 3rd Qu.:49.00 Servis :417
## Max. :87.00 Retirado :230
## (Other) :713
## mora balance vivienda prestamo contacto
## no:4445 Min. :-3313 no:1962 no:3830 celular :2896
## si: 76 1st Qu.: 69 si:2559 si: 691 desconocido:1324
## Median : 444 teléfono : 301
## Mean : 1423
## 3rd Qu.: 1480
## Max. :71188
##
## dia mes duracion campana
## Min. : 1.00 Mayo :1398 Min. : 4 Min. : 1.000
## 1st Qu.: 9.00 Julio : 706 1st Qu.: 104 1st Qu.: 1.000
## Median :16.00 Agosto : 633 Median : 185 Median : 2.000
## Mean :15.92 Junio : 531 Mean : 264 Mean : 2.794
## 3rd Qu.:21.00 Noviembre: 389 3rd Qu.: 329 3rd Qu.: 3.000
## Max. :31.00 abril : 293 Max. :3025 Max. :50.000
## (Other) : 571
## pdias previo presultado suscrito
## Min. : -1.00 Min. : 0.0000 desconocido:3705 no:4000
## 1st Qu.: -1.00 1st Qu.: 0.0000 éxito : 129 si: 521
## Median : -1.00 Median : 0.0000 fracaso : 490
## Mean : 39.77 Mean : 0.5426 otro : 197
## 3rd Qu.: -1.00 3rd Qu.: 0.0000
## Max. :871.00 Max. :25.0000
##
ANALISIS BIVARIADO Y MULTIVARIADO
plot(ripley$edad , ripley$prestamo, main = "Analisis1", xlab = "Edad", ylab = "Prestamo: 1=Si 2=No")

#En este grafico observamos la personas que tienen un prestamo y sus respectivas edades
plot(ripley$est.civ ,ripley$edad , main = "Analisis2", ylab = "Edad", xlab = "Estado Civil: 1=Casado 2=Divorciado 3=Soltero")

pairs(ripley$edad ~ ripley$balance)

plot(ripley)

cor(ripley$edad ,ripley$balance)
## [1] 0.08382014
library(corrplot)
## corrplot 0.84 loaded
data(iris)
corrplot(cor(iris[,1:3]),method= c("pie"))
