
Herramienta “El Generador de
Valor de Datos”
Paso 1.Definir al area del negocio que buscamos impactar o
mejorar y su KPI
El departamento que buscamos impactar es el departamento de
seguridad nacional, ya que, el objetivo es identificar cuales son
los estados menos seguros Indicador clave de rendimiento:
Indice de ciminalidad
Paso 2. Seleccionar plantilla (-s) para crear valor a partir
de los datos de los clientes
Vision / Segmantacion / Personalizacion /
Contextualizacion
Paso 3. Generar ideas o conceptos especificos
Elaborar un modelo de clusters que nos permita identificar los estados
con mayor indice de criminalidad.
Paso 4. Reunir los datos requeridos
Indice de criminalidad por estado
Paso 5. Plan de ejecucion
El departamento de seguridad nacional elaborara estrategias para reducir
el indice de criminalidad. El plan de ejecucion consta de 3 fases: 1.
Implementar estrategia en estados mas seguros 2. Replicar estrategia en
estados similares. 3. Replicar a estados menos seguros.
Importar Base de Datos
#file.choose()
bd <- read.csv("/Users/anita3/Downloads/USArrests.csv")
summary(bd)
## X Murder Assault UrbanPop
## Length:50 Min. : 0.800 Min. : 45.0 Min. :32.00
## Class :character 1st Qu.: 4.075 1st Qu.:109.0 1st Qu.:54.50
## Mode :character Median : 7.250 Median :159.0 Median :66.00
## Mean : 7.788 Mean :170.8 Mean :65.54
## 3rd Qu.:11.250 3rd Qu.:249.0 3rd Qu.:77.75
## Max. :17.400 Max. :337.0 Max. :91.00
## Rape
## Min. : 7.30
## 1st Qu.:15.07
## Median :20.10
## Mean :21.23
## 3rd Qu.:26.18
## Max. :46.00
Agregar X como nombre de los renglones
bd1 <- bd
rownames(bd1) <- bd1$X
Eliminar la columna X
bd2 <- bd1
bd2 <- subset(bd2, select = -c (X))
boxplot(bd2)

boxplot(bd2$Rape)

Observaciones
Se determino que hay datos anormales en Rape (Fuera del limite
superior), pero no se eliminaran al ser muy cercanos a los datos
Normalizar variables
bd3 <- bd2
bd3 <- as.data.frame(scale(bd3))
K-mean Clustering
clusters<-kmeans(bd3,4)
asignacion<-cbind(bd3,Cluster=clusters$cluster)
head(asignacion,10)
## Murder Assault UrbanPop Rape Cluster
## Alabama 1.24256408 0.7828393 -0.5209066 -0.003416473 2
## Alaska 0.50786248 1.1068225 -1.2117642 2.484202941 2
## Arizona 0.07163341 1.4788032 0.9989801 1.042878388 2
## Arkansas 0.23234938 0.2308680 -1.0735927 -0.184916602 4
## California 0.27826823 1.2628144 1.7589234 2.067820292 2
## Colorado 0.02571456 0.3988593 0.8608085 1.864967207 2
## Connecticut -1.03041900 -0.7290821 0.7917228 -1.081740768 1
## Delaware -0.43347395 0.8068381 0.4462940 -0.579946294 1
## Florida 1.74767144 1.9707777 0.9989801 1.138966691 2
## Georgia 2.20685994 0.4828549 -0.3827351 0.487701523 2
Exportar csv
# write_csv(asignacion2, "datos_con_cluster.csv")
#install.packages("factoextra")
library(factoextra)
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
fviz_cluster(clusters, data=bd3,
palette=c("red","blue","black","darkgreen"),
ellipse.type="euclid",
star.plot=T,
repel=T,
ggtheme=theme())

Optimizar k
library("cluster")
set.seed(123)
optimizacion <- clusGap(bd3, FUN = kmeans, nstart = 25, K.max = 10, B = 50)
plot(optimizacion, xlab = "Numero de clusters k")

Conclusiones
Los clusters nos permiten identificar los estados con mayor indice de
criminalidad en base a asesinatos, robos, violaciones, entre otros. De
la misma manera, nos permite visualizar cuales son los estados con
similares indices de criminalidad.
LS0tCnRpdGxlOiAiVVNBcnJlc3QiCmF1dGhvcjogIkFuYSBQYXRyaWNpYSBBcG9udGUgLSBBMDEyODM5MjgiCmRhdGU6ICIyMDIyLTA5LTA3IgpvdXRwdXQ6IAogIGh0bWxfZG9jdW1lbnQ6CiAgICB0b2M6IHRydWUKICAgIHRvY19mbG9hdDogdHJ1ZQogICAgY29kZV9kb3dubG9hZDogdHJ1ZQotLS0KPGltZyBzcmM9ICIvVXNlcnMvYW5pdGEzL0Rvd25sb2Fkcy9yYWlhdmxfbWVuc3VhbF9wcm9kdWNjaW9uX2Nzdi9jb25qdW50b19kZV9kYXRvcy9hcnJlc3QgaW1nIHIuanBlZyI+CgojIyA8c3BhbiBzdHlsZT0iY29sb3I6ICM2RTdCOEIiPiAqKkhlcnJhbWllbnRhICJFbCBHZW5lcmFkb3IgZGUgVmFsb3IgZGUgRGF0b3MiKiogPC9zcGFuPgoKKipQYXNvIDEuRGVmaW5pciBhbCBhcmVhIGRlbCBuZWdvY2lvIHF1ZSBidXNjYW1vcyBpbXBhY3RhciBvIG1lam9yYXIgeSBzdSBLUEkqKiAgIApFbCBkZXBhcnRhbWVudG8gcXVlIGJ1c2NhbW9zIGltcGFjdGFyIGVzIGVsICpkZXBhcnRhbWVudG8gZGUgc2VndXJpZGFkIG5hY2lvbmFsKiwgeWEgcXVlLCBlbCBvYmpldGl2byBlcyBpZGVudGlmaWNhciBjdWFsZXMgc29uIGxvcyBlc3RhZG9zIG1lbm9zIHNlZ3Vyb3MKKkluZGljYWRvciBjbGF2ZSBkZSByZW5kaW1pZW50bzoqIEluZGljZSBkZSBjaW1pbmFsaWRhZAoKKipQYXNvIDIuIFNlbGVjY2lvbmFyIHBsYW50aWxsYSAoLXMpIHBhcmEgY3JlYXIgdmFsb3IgYSBwYXJ0aXIgZGUgbG9zIGRhdG9zIGRlIGxvcyBjbGllbnRlcyAqKiAgIApWaXNpb24gLyAqKlNlZ21hbnRhY2lvbioqIC8gUGVyc29uYWxpemFjaW9uIC8gQ29udGV4dHVhbGl6YWNpb24gIAoKKipQYXNvIDMuIEdlbmVyYXIgaWRlYXMgbyBjb25jZXB0b3MgZXNwZWNpZmljb3MqKiAgCkVsYWJvcmFyIHVuIG1vZGVsbyBkZSBjbHVzdGVycyBxdWUgbm9zIHBlcm1pdGEgaWRlbnRpZmljYXIgbG9zIGVzdGFkb3MgY29uIG1heW9yIGluZGljZSBkZSBjcmltaW5hbGlkYWQuCgoqKlBhc28gNC4gUmV1bmlyIGxvcyBkYXRvcyByZXF1ZXJpZG9zKiogIApJbmRpY2UgZGUgY3JpbWluYWxpZGFkIHBvciBlc3RhZG8KCioqUGFzbyA1LiBQbGFuIGRlIGVqZWN1Y2lvbioqICAgCkVsIGRlcGFydGFtZW50byBkZSBzZWd1cmlkYWQgbmFjaW9uYWwgZWxhYm9yYXJhIGVzdHJhdGVnaWFzIHBhcmEgcmVkdWNpciBlbCBpbmRpY2UgZGUgY3JpbWluYWxpZGFkLiBFbCBwbGFuIGRlIGVqZWN1Y2lvbiBjb25zdGEgZGUgMyBmYXNlczoKMS4gSW1wbGVtZW50YXIgZXN0cmF0ZWdpYSBlbiBlc3RhZG9zIG1hcyBzZWd1cm9zCjIuIFJlcGxpY2FyIGVzdHJhdGVnaWEgZW4gZXN0YWRvcyBzaW1pbGFyZXMuCjMuIFJlcGxpY2FyIGEgZXN0YWRvcyBtZW5vcyBzZWd1cm9zLgoKIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiAjNkU3QjhCIj4gSW1wb3J0YXIgQmFzZSBkZSBEYXRvcyA8L3NwYW4+CmBgYHtyfQojZmlsZS5jaG9vc2UoKQpiZCA8LSByZWFkLmNzdigiL1VzZXJzL2FuaXRhMy9Eb3dubG9hZHMvVVNBcnJlc3RzLmNzdiIpCnN1bW1hcnkoYmQpCmBgYAoKIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiAjNkU3QjhCIj4gQWdyZWdhciBYIGNvbW8gbm9tYnJlIGRlIGxvcyByZW5nbG9uZXMgPC9zcGFuPgpgYGB7cn0KYmQxIDwtIGJkCnJvd25hbWVzKGJkMSkgPC0gYmQxJFgKYGBgCgojIyA8c3BhbiBzdHlsZT0iY29sb3I6ICM2RTdCOEIiPiBFbGltaW5hciBsYSBjb2x1bW5hIFggPC9zcGFuPgpgYGB7cn0KYmQyIDwtIGJkMQpiZDIgPC0gc3Vic2V0KGJkMiwgc2VsZWN0ID0gLWMgKFgpKQoKYm94cGxvdChiZDIpCmJveHBsb3QoYmQyJFJhcGUpCmBgYAoKIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjogIzZFN0I4QiI+IE9ic2VydmFjaW9uZXMgPC9zcGFuPgpTZSBkZXRlcm1pbm8gcXVlIGhheSBkYXRvcyBhbm9ybWFsZXMgZW4gUmFwZSAoRnVlcmEgZGVsIGxpbWl0ZSBzdXBlcmlvciksIHBlcm8gbm8gc2UgZWxpbWluYXJhbiBhbCBzZXIgbXV5IGNlcmNhbm9zIGEgbG9zIGRhdG9zCgojIyA8c3BhbiBzdHlsZT0iY29sb3I6ICM2RTdCOEIiPiBOb3JtYWxpemFyIHZhcmlhYmxlcyA8L3NwYW4+CmBgYHtyfQpiZDMgPC0gYmQyCmJkMyA8LSBhcy5kYXRhLmZyYW1lKHNjYWxlKGJkMykpCmBgYAoKIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiAjNkU3QjhCIj4gSy1tZWFuIENsdXN0ZXJpbmcgPC9zcGFuPgpgYGB7cn0KY2x1c3RlcnM8LWttZWFucyhiZDMsNCkKCmFzaWduYWNpb248LWNiaW5kKGJkMyxDbHVzdGVyPWNsdXN0ZXJzJGNsdXN0ZXIpCmhlYWQoYXNpZ25hY2lvbiwxMCkKYGBgCgojIyA8c3BhbiBzdHlsZT0iY29sb3I6ICM2RTdCOEIiPiBFeHBvcnRhciBjc3YgPC9zcGFuPgpgYGB7cn0KIyB3cml0ZV9jc3YoYXNpZ25hY2lvbjIsICJkYXRvc19jb25fY2x1c3Rlci5jc3YiKQoKI2luc3RhbGwucGFja2FnZXMoImZhY3RvZXh0cmEiKQpsaWJyYXJ5KGZhY3RvZXh0cmEpCmZ2aXpfY2x1c3RlcihjbHVzdGVycywgZGF0YT1iZDMsCiAgICAgICAgICAgICBwYWxldHRlPWMoInJlZCIsImJsdWUiLCJibGFjayIsImRhcmtncmVlbiIpLAogICAgICAgICAgICAgZWxsaXBzZS50eXBlPSJldWNsaWQiLAogICAgICAgICAgICAgc3Rhci5wbG90PVQsCiAgICAgICAgICAgICByZXBlbD1ULAogICAgICAgICAgICAgZ2d0aGVtZT10aGVtZSgpKQpgYGAKCiMjIDxzcGFuIHN0eWxlPSJjb2xvcjogIzZFN0I4QiI+IE9wdGltaXphciBrIDwvc3Bhbj4KYGBge3J9CmxpYnJhcnkoImNsdXN0ZXIiKQpzZXQuc2VlZCgxMjMpCm9wdGltaXphY2lvbiA8LSBjbHVzR2FwKGJkMywgRlVOID0ga21lYW5zLCBuc3RhcnQgPSAyNSwgSy5tYXggPSAxMCwgQiA9IDUwKQpwbG90KG9wdGltaXphY2lvbiwgeGxhYiA9ICJOdW1lcm8gZGUgY2x1c3RlcnMgayIpCmBgYAoKIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiAjNkU3QjhCIj4gQ29uY2x1c2lvbmVzIDwvc3Bhbj4KCkxvcyBjbHVzdGVycyBub3MgcGVybWl0ZW4gaWRlbnRpZmljYXIgbG9zIGVzdGFkb3MgY29uIG1heW9yIGluZGljZSBkZSBjcmltaW5hbGlkYWQgZW4gYmFzZSBhIGFzZXNpbmF0b3MsIHJvYm9zLCB2aW9sYWNpb25lcywgZW50cmUgb3Ryb3MuIERlIGxhIG1pc21hIG1hbmVyYSwgbm9zIHBlcm1pdGUgdmlzdWFsaXphciBjdWFsZXMgc29uIGxvcyBlc3RhZG9zIGNvbiBzaW1pbGFyZXMgaW5kaWNlcyBkZSBjcmltaW5hbGlkYWQu