“USA Arrests”

Herramienta “El generador de valor de datos”

Paso 1. definir el area del negocio que buscamos impactar o mejorar y su KPI
Mejorar la seguridad del pais reduciendo los arrestos en el pais.

Paso 2. Seleccionar la plantilla (-s) para crear valor a partir de los datos d e los clientes
Vision Vision |Segmentacion | presonalizacion | contextualizacion

Paso 3. generar ideas o conceptos especificos Aumentar la seguridad para disminuir los arrestos y mejorar la seguridad

Paso 4. reunir los datos requeridos
La cantidad de incidencias que hay a diario. Paso 5. plan de ejecucion.
Reforzar la seguridad y las patrullas en la calle

Importar la base de datos

data("USArrests")
summary(USArrests)

##      Murder          Assault         UrbanPop          Rape      
##  Min.   : 0.800   Min.   : 45.0   Min.   :32.00   Min.   : 7.30  
##  1st Qu.: 4.075   1st Qu.:109.0   1st Qu.:54.50   1st Qu.:15.07  
##  Median : 7.250   Median :159.0   Median :66.00   Median :20.10  
##  Mean   : 7.788   Mean   :170.8   Mean   :65.54   Mean   :21.23  
##  3rd Qu.:11.250   3rd Qu.:249.0   3rd Qu.:77.75   3rd Qu.:26.18  
##  Max.   :17.400   Max.   :337.0   Max.   :91.00   Max.   :46.00

Revisar presencia

boxplot(USArrests)

#Se determino que hay datos anormales en Rape (Fuera del limite superior), pero
#no se eliminaran al ser muy cercanos a los demas datos.

# K-means Cluster

Paso 1

bd1 <- USArrests
bd1 <- as.data.frame(scale(USArrests))

Paso 2

segmentos <- kmeans(bd1, 4)
segmentos

## K-means clustering with 4 clusters of sizes 16, 13, 8, 13
## 
## Cluster means:
##       Murder    Assault   UrbanPop        Rape
## 1 -0.4894375 -0.3826001  0.5758298 -0.26165379
## 2 -0.9615407 -1.1066010 -0.9301069 -0.96676331
## 3  1.4118898  0.8743346 -0.8145211  0.01927104
## 4  0.6950701  1.0394414  0.7226370  1.27693964
## 
## Clustering vector:
##        Alabama         Alaska        Arizona       Arkansas     California 
##              3              4              4              3              4 
##       Colorado    Connecticut       Delaware        Florida        Georgia 
##              4              1              1              4              3 
##         Hawaii          Idaho       Illinois        Indiana           Iowa 
##              1              2              4              1              2 
##         Kansas       Kentucky      Louisiana          Maine       Maryland 
##              1              2              3              2              4 
##  Massachusetts       Michigan      Minnesota    Mississippi       Missouri 
##              1              4              2              3              4 
##        Montana       Nebraska         Nevada  New Hampshire     New Jersey 
##              2              2              4              2              1 
##     New Mexico       New York North Carolina   North Dakota           Ohio 
##              4              4              3              2              1 
##       Oklahoma         Oregon   Pennsylvania   Rhode Island South Carolina 
##              1              1              1              1              3 
##   South Dakota      Tennessee          Texas           Utah        Vermont 
##              2              3              4              1              2 
##       Virginia     Washington  West Virginia      Wisconsin        Wyoming 
##              1              1              2              2              1 
## 
## Within cluster sum of squares by cluster:
## [1] 16.212213 11.952463  8.316061 19.922437
##  (between_SS / total_SS =  71.2 %)
## 
## Available components:
## 
## [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
## [6] "betweenss"    "size"         "iter"         "ifault"

asignacion<-cbind(USArrests, cluster = segmentos$cluster)
head(asignacion, 10)

##             Murder Assault UrbanPop Rape cluster
## Alabama       13.2     236       58 21.2       3
## Alaska        10.0     263       48 44.5       4
## Arizona        8.1     294       80 31.0       4
## Arkansas       8.8     190       50 19.5       3
## California     9.0     276       91 40.6       4
## Colorado       7.9     204       78 38.7       4
## Connecticut    3.3     110       77 11.1       1
## Delaware       5.9     238       72 15.8       1
## Florida       15.4     335       80 31.9       4
## Georgia       17.4     211       60 25.8       3

#Exportar csv
write.csv(asignacion, "USA_Arrest.csv")

Visualizar Segmentos

#install.packages("factoextra")
library(factoextra)

## Loading required package: ggplot2

## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa

fviz_cluster(segmentos, data = bd1,palette = c("red", "blue", "black", "darkgreen"), ellipse.type = "euclid", star.plot = T, repel = T, ggtheme = theme())

Optimizar K

#install.packages("cluster")
library(cluster)
set.seed(123)
optimizacion <- clusGap(bd1, FUN = kmeans, nstart = 25, K.max =10, B = 50)
plot(optimizacion, xlab = "Numero de clusters k")

Conclusion

Con este ejercicio se pueden obervar los diferentes clusters en los cuales se dividen las diferentes variables correspondientes a los arrestos en Estados Unidos. En los 4 clusters se puede ver como se dividen por las diferentes ciudades del pais. La herramiennta de K means cluster es de mucha utilidad ya que divide la informacion y datos en grupos similares en el cual ayuda a identificar informacion.

LS0tCnRpdGxlOiAgPHNwYW4gc3R5bGU9ImNvbG9yOnJlZCIgPiJVU0EgQXJyZXN0cyIKYXV0aG9yOiAiQW5kcmVhIFBhb2xhIFNvc2EgQTAwODI3MzU5IgpkYXRlOiAiMjAyMi0wOS0yMCIKb3V0cHV0OiAKICAgIGh0bWxfZG9jdW1lbnQ6CiAgICAgIHRvYzogdHJ1ZQogICAgICB0b2NfZmxvYXQ6IHRydWUKICAgICAgY29kZV9kb3dubG9hZDogdHJ1ZQoKLS0tCjxpbWcgc3JjPSIvVXNlcnMvYW5kcmVhcGFvbGFzb3NhL0Rlc2t0b3AvYXJyZXN0by5qcGVnIj4KCiMjIyMgSGVycmFtaWVudGEgIkVsIGdlbmVyYWRvciBkZSB2YWxvciBkZSBkYXRvcyIKKipQYXNvIDEuKio8c3BhbiBzdHlsZT0iQ29sb3I6Qmx1ZSI+IGRlZmluaXIgZWwgYXJlYSBkZWwgbmVnb2NpbyBxdWUgYnVzY2Ftb3MgaW1wYWN0YXIgbyBtZWpvcmFyIHkgc3UgS1BJICAKPHNwYW4gc3R5bGU9IkNvbG9yOkJsdWUiPiBNZWpvcmFyIGxhIHNlZ3VyaWRhZCAgZGVsIHBhaXMgcmVkdWNpZW5kbyAgbG9zIGFycmVzdG9zIGVuIGVsIHBhaXMuCgoqKlBhc28gMi4qKjxzcGFuIHN0eWxlPSJDb2xvcjpCbHVlIj4gU2VsZWNjaW9uYXIgbGEgcGxhbnRpbGxhICgtcykgcGFyYSBjcmVhciB2YWxvciBhIHBhcnRpciBkZSBsb3MgZGF0b3MgZCBlIGxvcyBjbGllbnRlcyAgCioqVmlzaW9uKiogVmlzaW9uIHxTZWdtZW50YWNpb24gfCBwcmVzb25hbGl6YWNpb24gfCBjb250ZXh0dWFsaXphY2lvbiAgCgoqKlBhc28gMy4qKiA8c3BhbiBzdHlsZT0iQ29sb3I6Qmx1ZSI+Z2VuZXJhciBpZGVhcyBvIGNvbmNlcHRvcyBlc3BlY2lmaWNvcyAKIEF1bWVudGFyIGxhIHNlZ3VyaWRhZCBwYXJhIGRpc21pbnVpciBsb3MgYXJyZXN0b3MgeSBtZWpvcmFyIGxhIHNlZ3VyaWRhZAoKKipQYXNvIDQuKio8c3BhbiBzdHlsZT0iQ29sb3I6Qmx1ZSI+IHJldW5pciBsb3MgZGF0b3MgcmVxdWVyaWRvcyAgCiBMYSBjYW50aWRhZCBkZSBpbmNpZGVuY2lhcyBxdWUgaGF5IGEgZGlhcmlvLgoqKlBhc28gNS4qKiA8c3BhbiBzdHlsZT0iQ29sb3I6Qmx1ZSI+IHBsYW4gZGUgZWplY3VjaW9uLiAgCiBSZWZvcnphciBsYSBzZWd1cmlkYWQgeSBsYXMgIHBhdHJ1bGxhcyBlbiBsYSBjYWxsZQoKIyMgSW1wb3J0YXIgbGEgYmFzZSBkZSBkYXRvcwoKYGBge3J9CmRhdGEoIlVTQXJyZXN0cyIpCnN1bW1hcnkoVVNBcnJlc3RzKQpgYGAKCiMjIFJldmlzYXIgcHJlc2VuY2lhIApgYGB7cn0KYm94cGxvdChVU0FycmVzdHMpCiNTZSBkZXRlcm1pbm8gcXVlIGhheSBkYXRvcyBhbm9ybWFsZXMgZW4gUmFwZSAoRnVlcmEgZGVsIGxpbWl0ZSBzdXBlcmlvciksIHBlcm8KI25vIHNlIGVsaW1pbmFyYW4gYWwgc2VyIG11eSBjZXJjYW5vcyBhIGxvcyBkZW1hcyBkYXRvcy4KCiMgSy1tZWFucyBDbHVzdGVyCmBgYAoKIyMgUGFzbyAxCmBgYHtyfQpiZDEgPC0gVVNBcnJlc3RzCmJkMSA8LSBhcy5kYXRhLmZyYW1lKHNjYWxlKFVTQXJyZXN0cykpCmBgYAoKIyMgUGFzbyAyCmBgYHtyfQpzZWdtZW50b3MgPC0ga21lYW5zKGJkMSwgNCkKc2VnbWVudG9zCgphc2lnbmFjaW9uPC1jYmluZChVU0FycmVzdHMsIGNsdXN0ZXIgPSBzZWdtZW50b3MkY2x1c3RlcikKaGVhZChhc2lnbmFjaW9uLCAxMCkKYGBgCgpgYGB7cn0KI0V4cG9ydGFyIGNzdgp3cml0ZS5jc3YoYXNpZ25hY2lvbiwgIlVTQV9BcnJlc3QuY3N2IikKYGBgCgojIyBWaXN1YWxpemFyIFNlZ21lbnRvcwpgYGB7cn0KI2luc3RhbGwucGFja2FnZXMoImZhY3RvZXh0cmEiKQpsaWJyYXJ5KGZhY3RvZXh0cmEpCmZ2aXpfY2x1c3RlcihzZWdtZW50b3MsIGRhdGEgPSBiZDEscGFsZXR0ZSA9IGMoInJlZCIsICJibHVlIiwgImJsYWNrIiwgImRhcmtncmVlbiIpLCBlbGxpcHNlLnR5cGUgPSAiZXVjbGlkIiwgc3Rhci5wbG90ID0gVCwgcmVwZWwgPSBULCBnZ3RoZW1lID0gdGhlbWUoKSkKYGBgCgojIyBPcHRpbWl6YXIgSwpgYGB7cn0KI2luc3RhbGwucGFja2FnZXMoImNsdXN0ZXIiKQpsaWJyYXJ5KGNsdXN0ZXIpCnNldC5zZWVkKDEyMykKb3B0aW1pemFjaW9uIDwtIGNsdXNHYXAoYmQxLCBGVU4gPSBrbWVhbnMsIG5zdGFydCA9IDI1LCBLLm1heCA9MTAsIEIgPSA1MCkKcGxvdChvcHRpbWl6YWNpb24sIHhsYWIgPSAiTnVtZXJvIGRlIGNsdXN0ZXJzIGsiKQpgYGAKCiMjIyBDb25jbHVzaW9uCkNvbiBlc3RlIGVqZXJjaWNpbyBzZSAgcHVlZGVuIG9iZXJ2YXIgbG9zIGRpZmVyZW50ZXMgIGNsdXN0ZXJzIGVuIGxvcyBjdWFsZXMgc2UgZGl2aWRlbiBsYXMgZGlmZXJlbnRlcyB2YXJpYWJsZXMgY29ycmVzcG9uZGllbnRlcyBhIGxvcyBhcnJlc3RvcyBlbiBFc3RhZG9zIFVuaWRvcy4gCkVuIGxvcyA0IGNsdXN0ZXJzICBzZSBwdWVkZSB2ZXIgY29tbyBzZSBkaXZpZGVuIHBvciBsYXMgZGlmZXJlbnRlcyBjaXVkYWRlcyBkZWwgcGFpcy4gTGEgaGVycmFtaWVubnRhIGRlIEsgbWVhbnMgY2x1c3RlciBlcyBkZSBtdWNoYSB1dGlsaWRhZCB5YSBxdWUgZGl2aWRlIGxhIGluZm9ybWFjaW9uIHkgZGF0b3MgZW4gZ3J1cG9zIHNpbWlsYXJlcyBlbiBlbCBjdWFsIGF5dWRhIGEgaWRlbnRpZmljYXIgaW5mb3JtYWNpb24uCgoKCg==