Herramienta “El Generador de Valor de Datos”

Paso 1.Definir al area del negocio que buscamos impactar o mejorar y su KPI
El departamento que buscamos impactar es el departamento de seguridad nacional, ya que, el objetivo es identificar cuales son los estados menos seguros Indicador clave de rendimiento: Indice de ciminalidad

Paso 2. Seleccionar plantilla (-s) para crear valor a partir de los datos de los clientes
Vision / Segmantacion / Personalizacion / Contextualizacion

Paso 3. Generar ideas o conceptos especificos
Elaborar un modelo de clusters que nos permita identificar los estados con mayor indice de criminalidad.

Paso 4. Reunir los datos requeridos
Indice de criminalidad por estado

Paso 5. Plan de ejecucion
El departamento de seguridad nacional elaborara estrategias para reducir el indice de criminalidad. El plan de ejecucion consta de 3 fases: 1. Implementar estrategia en estados mas seguros 2. Replicar estrategia en estados similares. 3. Replicar a estados menos seguros.

Importar Base de Datos

#file.choose()
bd <- read.csv("/Users/anita3/Downloads/USArrests.csv")
summary(bd)
##       X                 Murder          Assault         UrbanPop    
##  Length:50          Min.   : 0.800   Min.   : 45.0   Min.   :32.00  
##  Class :character   1st Qu.: 4.075   1st Qu.:109.0   1st Qu.:54.50  
##  Mode  :character   Median : 7.250   Median :159.0   Median :66.00  
##                     Mean   : 7.788   Mean   :170.8   Mean   :65.54  
##                     3rd Qu.:11.250   3rd Qu.:249.0   3rd Qu.:77.75  
##                     Max.   :17.400   Max.   :337.0   Max.   :91.00  
##       Rape      
##  Min.   : 7.30  
##  1st Qu.:15.07  
##  Median :20.10  
##  Mean   :21.23  
##  3rd Qu.:26.18  
##  Max.   :46.00

Agregar X como nombre de los renglones

bd1 <- bd
rownames(bd1) <- bd1$X

Eliminar la columna X

bd2 <- bd1
bd2 <- subset(bd2, select = -c (X))

boxplot(bd2)

boxplot(bd2$Rape)

Observaciones

Se determino que hay datos anormales en Rape (Fuera del limite superior), pero no se eliminaran al ser muy cercanos a los datos

Normalizar variables

bd3 <- bd2
bd3 <- as.data.frame(scale(bd3))

K-mean Clustering

clusters<-kmeans(bd3,4)

asignacion<-cbind(bd3,Cluster=clusters$cluster)
head(asignacion,10)
##                  Murder    Assault   UrbanPop         Rape Cluster
## Alabama      1.24256408  0.7828393 -0.5209066 -0.003416473       2
## Alaska       0.50786248  1.1068225 -1.2117642  2.484202941       2
## Arizona      0.07163341  1.4788032  0.9989801  1.042878388       2
## Arkansas     0.23234938  0.2308680 -1.0735927 -0.184916602       4
## California   0.27826823  1.2628144  1.7589234  2.067820292       2
## Colorado     0.02571456  0.3988593  0.8608085  1.864967207       2
## Connecticut -1.03041900 -0.7290821  0.7917228 -1.081740768       1
## Delaware    -0.43347395  0.8068381  0.4462940 -0.579946294       1
## Florida      1.74767144  1.9707777  0.9989801  1.138966691       2
## Georgia      2.20685994  0.4828549 -0.3827351  0.487701523       2

Exportar csv

# write_csv(asignacion2, "datos_con_cluster.csv")

#install.packages("factoextra")
library(factoextra)
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
fviz_cluster(clusters, data=bd3,
             palette=c("red","blue","black","darkgreen"),
             ellipse.type="euclid",
             star.plot=T,
             repel=T,
             ggtheme=theme())

Optimizar k

library("cluster")
set.seed(123)
optimizacion <- clusGap(bd3, FUN = kmeans, nstart = 25, K.max = 10, B = 50)
plot(optimizacion, xlab = "Numero de clusters k")

Conclusiones

Los clusters nos permiten identificar los estados con mayor indice de criminalidad en base a asesinatos, robos, violaciones, entre otros. De la misma manera, nos permite visualizar cuales son los estados con similares indices de criminalidad.

LS0tCnRpdGxlOiAiVVNBcnJlc3QiCmF1dGhvcjogIkFuYSBQYXRyaWNpYSBBcG9udGUgLSBBMDEyODM5MjgiCmRhdGU6ICIyMDIyLTA5LTA3IgpvdXRwdXQ6IAogIGh0bWxfZG9jdW1lbnQ6CiAgICB0b2M6IHRydWUKICAgIHRvY19mbG9hdDogdHJ1ZQogICAgY29kZV9kb3dubG9hZDogdHJ1ZQotLS0KPGltZyBzcmM9ICIvVXNlcnMvYW5pdGEzL0Rvd25sb2Fkcy9yYWlhdmxfbWVuc3VhbF9wcm9kdWNjaW9uX2Nzdi9jb25qdW50b19kZV9kYXRvcy9hcnJlc3QgaW1nIHIuanBlZyI+CgojIyA8c3BhbiBzdHlsZT0iY29sb3I6ICM2RTdCOEIiPiAqKkhlcnJhbWllbnRhICJFbCBHZW5lcmFkb3IgZGUgVmFsb3IgZGUgRGF0b3MiKiogPC9zcGFuPgoKKipQYXNvIDEuRGVmaW5pciBhbCBhcmVhIGRlbCBuZWdvY2lvIHF1ZSBidXNjYW1vcyBpbXBhY3RhciBvIG1lam9yYXIgeSBzdSBLUEkqKiAgIApFbCBkZXBhcnRhbWVudG8gcXVlIGJ1c2NhbW9zIGltcGFjdGFyIGVzIGVsICpkZXBhcnRhbWVudG8gZGUgc2VndXJpZGFkIG5hY2lvbmFsKiwgeWEgcXVlLCBlbCBvYmpldGl2byBlcyBpZGVudGlmaWNhciBjdWFsZXMgc29uIGxvcyBlc3RhZG9zIG1lbm9zIHNlZ3Vyb3MKKkluZGljYWRvciBjbGF2ZSBkZSByZW5kaW1pZW50bzoqIEluZGljZSBkZSBjaW1pbmFsaWRhZAoKKipQYXNvIDIuIFNlbGVjY2lvbmFyIHBsYW50aWxsYSAoLXMpIHBhcmEgY3JlYXIgdmFsb3IgYSBwYXJ0aXIgZGUgbG9zIGRhdG9zIGRlIGxvcyBjbGllbnRlcyAqKiAgIApWaXNpb24gLyAqKlNlZ21hbnRhY2lvbioqIC8gUGVyc29uYWxpemFjaW9uIC8gQ29udGV4dHVhbGl6YWNpb24gIAoKKipQYXNvIDMuIEdlbmVyYXIgaWRlYXMgbyBjb25jZXB0b3MgZXNwZWNpZmljb3MqKiAgCkVsYWJvcmFyIHVuIG1vZGVsbyBkZSBjbHVzdGVycyBxdWUgbm9zIHBlcm1pdGEgaWRlbnRpZmljYXIgbG9zIGVzdGFkb3MgY29uIG1heW9yIGluZGljZSBkZSBjcmltaW5hbGlkYWQuCgoqKlBhc28gNC4gUmV1bmlyIGxvcyBkYXRvcyByZXF1ZXJpZG9zKiogIApJbmRpY2UgZGUgY3JpbWluYWxpZGFkIHBvciBlc3RhZG8KCioqUGFzbyA1LiBQbGFuIGRlIGVqZWN1Y2lvbioqICAgCkVsIGRlcGFydGFtZW50byBkZSBzZWd1cmlkYWQgbmFjaW9uYWwgZWxhYm9yYXJhIGVzdHJhdGVnaWFzIHBhcmEgcmVkdWNpciBlbCBpbmRpY2UgZGUgY3JpbWluYWxpZGFkLiBFbCBwbGFuIGRlIGVqZWN1Y2lvbiBjb25zdGEgZGUgMyBmYXNlczoKMS4gSW1wbGVtZW50YXIgZXN0cmF0ZWdpYSBlbiBlc3RhZG9zIG1hcyBzZWd1cm9zCjIuIFJlcGxpY2FyIGVzdHJhdGVnaWEgZW4gZXN0YWRvcyBzaW1pbGFyZXMuCjMuIFJlcGxpY2FyIGEgZXN0YWRvcyBtZW5vcyBzZWd1cm9zLgoKIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiAjNkU3QjhCIj4gSW1wb3J0YXIgQmFzZSBkZSBEYXRvcyA8L3NwYW4+CmBgYHtyfQojZmlsZS5jaG9vc2UoKQpiZCA8LSByZWFkLmNzdigiL1VzZXJzL2FuaXRhMy9Eb3dubG9hZHMvVVNBcnJlc3RzLmNzdiIpCnN1bW1hcnkoYmQpCmBgYAoKIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiAjNkU3QjhCIj4gQWdyZWdhciBYIGNvbW8gbm9tYnJlIGRlIGxvcyByZW5nbG9uZXMgPC9zcGFuPgpgYGB7cn0KYmQxIDwtIGJkCnJvd25hbWVzKGJkMSkgPC0gYmQxJFgKYGBgCgojIyA8c3BhbiBzdHlsZT0iY29sb3I6ICM2RTdCOEIiPiBFbGltaW5hciBsYSBjb2x1bW5hIFggPC9zcGFuPgpgYGB7cn0KYmQyIDwtIGJkMQpiZDIgPC0gc3Vic2V0KGJkMiwgc2VsZWN0ID0gLWMgKFgpKQoKYm94cGxvdChiZDIpCmJveHBsb3QoYmQyJFJhcGUpCmBgYAoKIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjogIzZFN0I4QiI+IE9ic2VydmFjaW9uZXMgPC9zcGFuPgpTZSBkZXRlcm1pbm8gcXVlIGhheSBkYXRvcyBhbm9ybWFsZXMgZW4gUmFwZSAoRnVlcmEgZGVsIGxpbWl0ZSBzdXBlcmlvciksIHBlcm8gbm8gc2UgZWxpbWluYXJhbiBhbCBzZXIgbXV5IGNlcmNhbm9zIGEgbG9zIGRhdG9zCgojIyA8c3BhbiBzdHlsZT0iY29sb3I6ICM2RTdCOEIiPiBOb3JtYWxpemFyIHZhcmlhYmxlcyA8L3NwYW4+CmBgYHtyfQpiZDMgPC0gYmQyCmJkMyA8LSBhcy5kYXRhLmZyYW1lKHNjYWxlKGJkMykpCmBgYAoKIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiAjNkU3QjhCIj4gSy1tZWFuIENsdXN0ZXJpbmcgPC9zcGFuPgpgYGB7cn0KY2x1c3RlcnM8LWttZWFucyhiZDMsNCkKCmFzaWduYWNpb248LWNiaW5kKGJkMyxDbHVzdGVyPWNsdXN0ZXJzJGNsdXN0ZXIpCmhlYWQoYXNpZ25hY2lvbiwxMCkKYGBgCgojIyA8c3BhbiBzdHlsZT0iY29sb3I6ICM2RTdCOEIiPiBFeHBvcnRhciBjc3YgPC9zcGFuPgpgYGB7cn0KIyB3cml0ZV9jc3YoYXNpZ25hY2lvbjIsICJkYXRvc19jb25fY2x1c3Rlci5jc3YiKQoKI2luc3RhbGwucGFja2FnZXMoImZhY3RvZXh0cmEiKQpsaWJyYXJ5KGZhY3RvZXh0cmEpCmZ2aXpfY2x1c3RlcihjbHVzdGVycywgZGF0YT1iZDMsCiAgICAgICAgICAgICBwYWxldHRlPWMoInJlZCIsImJsdWUiLCJibGFjayIsImRhcmtncmVlbiIpLAogICAgICAgICAgICAgZWxsaXBzZS50eXBlPSJldWNsaWQiLAogICAgICAgICAgICAgc3Rhci5wbG90PVQsCiAgICAgICAgICAgICByZXBlbD1ULAogICAgICAgICAgICAgZ2d0aGVtZT10aGVtZSgpKQpgYGAKCiMjIDxzcGFuIHN0eWxlPSJjb2xvcjogIzZFN0I4QiI+IE9wdGltaXphciBrIDwvc3Bhbj4KYGBge3J9CmxpYnJhcnkoImNsdXN0ZXIiKQpzZXQuc2VlZCgxMjMpCm9wdGltaXphY2lvbiA8LSBjbHVzR2FwKGJkMywgRlVOID0ga21lYW5zLCBuc3RhcnQgPSAyNSwgSy5tYXggPSAxMCwgQiA9IDUwKQpwbG90KG9wdGltaXphY2lvbiwgeGxhYiA9ICJOdW1lcm8gZGUgY2x1c3RlcnMgayIpCmBgYAoKIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiAjNkU3QjhCIj4gQ29uY2x1c2lvbmVzIDwvc3Bhbj4KCkxvcyBjbHVzdGVycyBub3MgcGVybWl0ZW4gaWRlbnRpZmljYXIgbG9zIGVzdGFkb3MgY29uIG1heW9yIGluZGljZSBkZSBjcmltaW5hbGlkYWQgZW4gYmFzZSBhIGFzZXNpbmF0b3MsIHJvYm9zLCB2aW9sYWNpb25lcywgZW50cmUgb3Ryb3MuIERlIGxhIG1pc21hIG1hbmVyYSwgbm9zIHBlcm1pdGUgdmlzdWFsaXphciBjdWFsZXMgc29uIGxvcyBlc3RhZG9zIGNvbiBzaW1pbGFyZXMgaW5kaWNlcyBkZSBjcmltaW5hbGlkYWQu