Arrestos USA

Importar base de datos y revisar datos

data("USArrests")
# summary(USArrests)

# Revisar presencia de datos anormales
boxplot(USArrests)

# Se determinó que hay datos anormales en Rape (Fuera del límite superior), pero
# no se eliminarán al ser muy cercanos a los demás datos.

Generador de valor de datos

Paso 1. Definir el área del negocio que buscamos impactar/ mejorar y su KPI.

Estamos buscando impactar y mejorar es el departamento de Seguridad en USA y el KPI será Arrestos.

Paso 2. Seleccionar plantilla(s) para crear valor a partir de los datos de los clientes.

Segmentación

Paso 3. Generar ideas o conceptos específicos.

# Estrategia de conocer donde hay mayor seguridad y en donde inseguirdad.

Paso 4. Reunir los datos específicos.

Base de datos con arrestos.

Paso 5. Plan de ejecución.

Estrategias para seguridad.

K-means clustering

# Paso 1. Normalizar variables
bd1 <- USArrests
bd1 <- as.data.frame(scale(USArrests))

# Paso 2. k-means Clustering
segmentos <- kmeans(bd1, 4)
segmentos

## K-means clustering with 4 clusters of sizes 13, 13, 16, 8
## 
## Cluster means:
##       Murder    Assault   UrbanPop        Rape
## 1 -0.9615407 -1.1066010 -0.9301069 -0.96676331
## 2  0.6950701  1.0394414  0.7226370  1.27693964
## 3 -0.4894375 -0.3826001  0.5758298 -0.26165379
## 4  1.4118898  0.8743346 -0.8145211  0.01927104
## 
## Clustering vector:
##        Alabama         Alaska        Arizona       Arkansas     California 
##              4              2              2              4              2 
##       Colorado    Connecticut       Delaware        Florida        Georgia 
##              2              3              3              2              4 
##         Hawaii          Idaho       Illinois        Indiana           Iowa 
##              3              1              2              3              1 
##         Kansas       Kentucky      Louisiana          Maine       Maryland 
##              3              1              4              1              2 
##  Massachusetts       Michigan      Minnesota    Mississippi       Missouri 
##              3              2              1              4              2 
##        Montana       Nebraska         Nevada  New Hampshire     New Jersey 
##              1              1              2              1              3 
##     New Mexico       New York North Carolina   North Dakota           Ohio 
##              2              2              4              1              3 
##       Oklahoma         Oregon   Pennsylvania   Rhode Island South Carolina 
##              3              3              3              3              4 
##   South Dakota      Tennessee          Texas           Utah        Vermont 
##              1              4              2              3              1 
##       Virginia     Washington  West Virginia      Wisconsin        Wyoming 
##              3              3              1              1              3 
## 
## Within cluster sum of squares by cluster:
## [1] 11.952463 19.922437 16.212213  8.316061
##  (between_SS / total_SS =  71.2 %)
## 
## Available components:
## 
## [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
## [6] "betweenss"    "size"         "iter"         "ifault"

asignacion <- cbind(USArrests, cluster = segmentos$cluster)
head(asignacion, 10)

##             Murder Assault UrbanPop Rape cluster
## Alabama       13.2     236       58 21.2       4
## Alaska        10.0     263       48 44.5       2
## Arizona        8.1     294       80 31.0       2
## Arkansas       8.8     190       50 19.5       4
## California     9.0     276       91 40.6       2
## Colorado       7.9     204       78 38.7       2
## Connecticut    3.3     110       77 11.1       3
## Delaware       5.9     238       72 15.8       3
## Florida       15.4     335       80 31.9       2
## Georgia       17.4     211       60 25.8       4

Exportar csv

write.csv(asignacion, "datos_con_cluster.csv")

Visualizar segmentos

# install.packages("factoextra")
library(factoextra)

## Loading required package: ggplot2

## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa

fviz_cluster(segmentos, data = bd1, 
             palette=c("red", "blue", "black", "darkgreen"),
             ellipse.type = "euclid",
             star.plot = T,
             repel = T,
             ggtheme = theme())

Optimizar k

# install.packages("cluster")
library(cluster)
library(data.table)
set.seed(123)
optimizacion <- clusGap (bd1, FUN = kmeans, nstart =25, K.max = 10, B = 50)
plot(optimizacion, xlab = "Numero de clusters k")

Conclusiones

Después de realizar el análisis y haber separado por Clusters, podemos ver que losl lugar más inseguros en USA son el cuadrante 2 y de ahi destaca California y el cuadrante 1 es donde podemos encontrar los lugares más seguros destacando a Missisipi con mayor seguridad. Lo que es necesario buscar estrategias como más vigilancia, centros de prevención, control de migrantes para poder diminuir la inseguridad.

LS0tCnRpdGxlOiA8c3BhbiBzdHlsZT0iY29sb3I6UmVkIj5BcnJlc3RvcyBVU0E8L3NwYW4+IAphdXRob3I6ICJLYXJsYSBHZW9yZ2luYSBNYXJ0w61uZXogR29uesOhbGV6IEEwMDgyNzUwMCIKZGF0ZTogIjIwMjItMDktMjIiCm91dHB1dDogCiAgaHRtbF9kb2N1bWVudDoKICAgIHRvYzogdHJ1ZQogICAgdG9jX2Zsb2F0OiB0cnVlCiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlCi0tLQoKPGltZyBzcmM9ICIvVXNlcnMvZ2VvcmdpbmFtYXJ0aW5lei9Eb2N1bWVudHMvVGVjL1NlzIFwdGltbyBTZW1lc3RyZS9BbmFsacyBdGljYSBwYXJhIG5lZ29jaW9zLCBkZSBsb3MgZGF0b3MgYSBkZWNpc2lvbmVzL3VzYSByZXN0LndlYnAiPgoKIyMgIDxzcGFuIHN0eWxlPSJjb2xvcjpEYXJrYmx1ZSI+SW1wb3J0YXIgYmFzZSBkZSBkYXRvcyB5IHJldmlzYXIgZGF0b3M8L3NwYW4+CmBgYHtyfQpkYXRhKCJVU0FycmVzdHMiKQojIHN1bW1hcnkoVVNBcnJlc3RzKQoKIyBSZXZpc2FyIHByZXNlbmNpYSBkZSBkYXRvcyBhbm9ybWFsZXMKYm94cGxvdChVU0FycmVzdHMpCgojIFNlIGRldGVybWluw7MgcXVlIGhheSBkYXRvcyBhbm9ybWFsZXMgZW4gUmFwZSAoRnVlcmEgZGVsIGzDrW1pdGUgc3VwZXJpb3IpLCBwZXJvCiMgbm8gc2UgZWxpbWluYXLDoW4gYWwgc2VyIG11eSBjZXJjYW5vcyBhIGxvcyBkZW3DoXMgZGF0b3MuCmBgYAoKIyMgPHNwYW4gc3R5bGU9ImNvbG9yOmRhcmtibHVlIj4qKkdlbmVyYWRvciBkZSB2YWxvciBkZSBkYXRvcyoqPC9zcGFuPiAgICAKCiMjIyA8c3BhbiBzdHlsZT0iY29sb3I6Ymx1ZSI+UGFzbyAxLiBEZWZpbmlyIGVsIMOhcmVhIGRlbCBuZWdvY2lvIHF1ZSBidXNjYW1vcyBpbXBhY3Rhci8gbWVqb3JhciB5IHN1IEtQSS48L3NwYW4+ICAgICAKIyMjIyMgRXN0YW1vcyBidXNjYW5kbyBpbXBhY3RhciB5IG1lam9yYXIgZXMgZWwgKipkZXBhcnRhbWVudG8gZGUgU2VndXJpZGFkIGVuIFVTQSoqIHkgZWwgKipLUEkgc2Vyw6EgQXJyZXN0b3MqKi4gIAoKIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjpibHVlIj5QYXNvIDIuIFNlbGVjY2lvbmFyIHBsYW50aWxsYShzKSBwYXJhIGNyZWFyIHZhbG9yIGEgcGFydGlyIGRlIGxvcyBkYXRvcyBkZSBsb3MgY2xpZW50ZXMuPC9zcGFuPiAgICAgCgojIyMjIyAqKlNlZ21lbnRhY2nDs24qKiAKCiMjIyA8c3BhbiBzdHlsZT0iY29sb3I6Ymx1ZSI+UGFzbyAzLiBHZW5lcmFyIGlkZWFzIG8gY29uY2VwdG9zIGVzcGVjw61maWNvcy48L3NwYW4+ICAgICAKIyMjIyAjIEVzdHJhdGVnaWEgZGUgY29ub2NlciBkb25kZSBoYXkgbWF5b3Igc2VndXJpZGFkIHkgZW4gZG9uZGUgaW5zZWd1aXJkYWQuCgojIyMgPHNwYW4gc3R5bGU9ImNvbG9yOmJsdWUiPlBhc28gNC4gUmV1bmlyIGxvcyBkYXRvcyBlc3BlY8OtZmljb3MuPC9zcGFuPiAgICAgCiMjIyMjIEJhc2UgZGUgZGF0b3MgY29uIGFycmVzdG9zLgoKIyMjIDxzcGFuIHN0eWxlPSJjb2xvcjpibHVlIj5QYXNvIDUuIFBsYW4gZGUgZWplY3VjacOzbi48L3NwYW4+ICAgCiMjIyMjIEVzdHJhdGVnaWFzIHBhcmEgc2VndXJpZGFkLgoKIyMgPHNwYW4gc3R5bGU9ImNvbG9yOkRhcmtibHVlIj5LLW1lYW5zIGNsdXN0ZXJpbmc8L3NwYW4+CmBgYHtyfQojIFBhc28gMS4gTm9ybWFsaXphciB2YXJpYWJsZXMKYmQxIDwtIFVTQXJyZXN0cwpiZDEgPC0gYXMuZGF0YS5mcmFtZShzY2FsZShVU0FycmVzdHMpKQoKIyBQYXNvIDIuIGstbWVhbnMgQ2x1c3RlcmluZwpzZWdtZW50b3MgPC0ga21lYW5zKGJkMSwgNCkKc2VnbWVudG9zCgphc2lnbmFjaW9uIDwtIGNiaW5kKFVTQXJyZXN0cywgY2x1c3RlciA9IHNlZ21lbnRvcyRjbHVzdGVyKQpoZWFkKGFzaWduYWNpb24sIDEwKQpgYGAKCiMjIDxzcGFuIHN0eWxlPSJjb2xvcjpEYXJrYmx1ZSI+RXhwb3J0YXIgY3N2PC9zcGFuPgpgYGB7cn0Kd3JpdGUuY3N2KGFzaWduYWNpb24sICJkYXRvc19jb25fY2x1c3Rlci5jc3YiKQpgYGAKCiMjIDxzcGFuIHN0eWxlPSJjb2xvcjpEYXJrYmx1ZSI+VmlzdWFsaXphciBzZWdtZW50b3M8L3NwYW4+CmBgYHtyfQojIGluc3RhbGwucGFja2FnZXMoImZhY3RvZXh0cmEiKQpsaWJyYXJ5KGZhY3RvZXh0cmEpCmZ2aXpfY2x1c3RlcihzZWdtZW50b3MsIGRhdGEgPSBiZDEsIAogICAgICAgICAgICAgcGFsZXR0ZT1jKCJyZWQiLCAiYmx1ZSIsICJibGFjayIsICJkYXJrZ3JlZW4iKSwKICAgICAgICAgICAgIGVsbGlwc2UudHlwZSA9ICJldWNsaWQiLAogICAgICAgICAgICAgc3Rhci5wbG90ID0gVCwKICAgICAgICAgICAgIHJlcGVsID0gVCwKICAgICAgICAgICAgIGdndGhlbWUgPSB0aGVtZSgpKQpgYGAKCiMjIDxzcGFuIHN0eWxlPSJjb2xvcjpEYXJrYmx1ZSI+T3B0aW1pemFyIGs8L3NwYW4+CmBgYHtyfQojIGluc3RhbGwucGFja2FnZXMoImNsdXN0ZXIiKQpsaWJyYXJ5KGNsdXN0ZXIpCmxpYnJhcnkoZGF0YS50YWJsZSkKc2V0LnNlZWQoMTIzKQpvcHRpbWl6YWNpb24gPC0gY2x1c0dhcCAoYmQxLCBGVU4gPSBrbWVhbnMsIG5zdGFydCA9MjUsIEsubWF4ID0gMTAsIEIgPSA1MCkKcGxvdChvcHRpbWl6YWNpb24sIHhsYWIgPSAiTnVtZXJvIGRlIGNsdXN0ZXJzIGsiKQpgYGAKCiMjIDxzcGFuIHN0eWxlPSJjb2xvcjpEYXJrYmx1ZSI+Q29uY2x1c2lvbmVzPC9zcGFuPgpEZXNwdcOpcyBkZSByZWFsaXphciBlbCBhbsOhbGlzaXMgeSBoYWJlciBzZXBhcmFkbyBwb3IgQ2x1c3RlcnMsIHBvZGVtb3MgdmVyIHF1ZSBsb3NsIGx1Z2FyIG3DoXMgKmluc2VndXJvcyogZW4gVVNBIHNvbiBlbCBjdWFkcmFudGUgMiB5IGRlIGFoaSBkZXN0YWNhICpDYWxpZm9ybmlhKiB5IGVsIGN1YWRyYW50ZSAxIGVzIGRvbmRlIHBvZGVtb3MgZW5jb250cmFyIGxvcyBsdWdhcmVzIG3DoXMgKnNlZ3Vyb3MqIGRlc3RhY2FuZG8gYSAqTWlzc2lzaXBpKiBjb24gbWF5b3Igc2VndXJpZGFkLiBMbyBxdWUgZXMgbmVjZXNhcmlvIGJ1c2NhciBlc3RyYXRlZ2lhcyBjb21vIG3DoXMgdmlnaWxhbmNpYSwgY2VudHJvcyBkZSBwcmV2ZW5jacOzbiwgY29udHJvbCBkZSBtaWdyYW50ZXMgcGFyYSBwb2RlciBkaW1pbnVpciBsYSBpbnNlZ3VyaWRhZC4=