
Importar base de datos
# file.choose()
bd <- read.csv("/Users/mayracampoyramos/Downloads/USArrests.csv")
summary(bd)
## X Murder Assault UrbanPop
## Length:50 Min. : 0.800 Min. : 45.0 Min. :32.00
## Class :character 1st Qu.: 4.075 1st Qu.:109.0 1st Qu.:54.50
## Mode :character Median : 7.250 Median :159.0 Median :66.00
## Mean : 7.788 Mean :170.8 Mean :65.54
## 3rd Qu.:11.250 3rd Qu.:249.0 3rd Qu.:77.75
## Max. :17.400 Max. :337.0 Max. :91.00
## Rape
## Min. : 7.30
## 1st Qu.:15.07
## Median :20.10
## Mean :21.23
## 3rd Qu.:26.18
## Max. :46.00
Herramienta “El Generador de Valor de Datos”
Paso 1. Definir el área del negocio que buscamos impactar o mejorar
y su KPI.
El departamento de dirección del gobierno de Estados Unidos para
generar una estrategia para bajar los niveles de inseguridad y
arrestos.
Paso 2. Segmentación
Paso 3. Generar ideas o conceptos específicos
Elaborar una segmentación donde se podrá visualizar los estados con
mayor número de arrestos.
Paso 4. Reunir los datos requeridos
Elaborar clusters con los estados en correlación de los
detenidos.
Paso 5. Plan de ejecución
Después de visualizar los estados con mayor número de detenidos
implementar más vigilancia para aumentar la seguridad y rebajar los
detenidos. Se recomienda iniciar con Texas.
Sistema asegurará la captura del Markdown en las bases de datos
estadística
Agregar X como nombre de los renglones
bd1 <- bd
rownames(bd1) <- bd1$X
Eliminar la columna X
bd2 <- bd1
bd2 <- subset(bd2, select = -c (X))
boxplot(bd2)

boxplot(bd2$Rape)

k-mean Clustering
clusters<- kmeans(bd2,4)
asignacion<-cbind(bd2,Cluster=clusters$cluster)
head(asignacion,10)
## Murder Assault UrbanPop Rape Cluster
## Alabama 13.2 236 58 21.2 1
## Alaska 10.0 263 48 44.5 1
## Arizona 8.1 294 80 31.0 1
## Arkansas 8.8 190 50 19.5 2
## California 9.0 276 91 40.6 1
## Colorado 7.9 204 78 38.7 2
## Connecticut 3.3 110 77 11.1 3
## Delaware 5.9 238 72 15.8 1
## Florida 15.4 335 80 31.9 1
## Georgia 17.4 211 60 25.8 2
clusters2<-kmeans(bd2,3)
asignacion2<-cbind(bd2,Cluster=clusters2$cluster)
head(asignacion2,10)
## Murder Assault UrbanPop Rape Cluster
## Alabama 13.2 236 58 21.2 1
## Alaska 10.0 263 48 44.5 1
## Arizona 8.1 294 80 31.0 1
## Arkansas 8.8 190 50 19.5 3
## California 9.0 276 91 40.6 1
## Colorado 7.9 204 78 38.7 3
## Connecticut 3.3 110 77 11.1 2
## Delaware 5.9 238 72 15.8 1
## Florida 15.4 335 80 31.9 1
## Georgia 17.4 211 60 25.8 3
# install.packages("factoextra")
library(factoextra)
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
fviz_cluster(clusters, data=bd2,
palette=c("red","blue","black","darkgreen"),
ellipse.type="euclid",
star.plot=T,
repel=T,
ggtheme=theme())

fviz_cluster(clusters2, data=bd2,
palette=c("red","blue","black","darkgreen"),
ellipse.type="euclid",
star.plot=T,
repel=T,
ggtheme=theme())

Conclusiones
K Means Clustering, conocido en español como segmentación de datos,
en R es un algoritmo no lineal que busca agrupar datos en función de la
similitud o grupos similares. Al generar la segmentación se vuelve un
clúster. En este ejercicio se podrá mostrar de una manera más gráfica la
posición de los estados concordando con los arrestos que se tienen
Empezando, primero se ingresó una base de datos de los arrestos de
Estados Unidos y el porqué fueron detenidos. Se elimina una columna
extra, “X”, para así continuar con la segmentación. Realizar los
clusters con las variables de tipo de arresto por violacion, asesinato,
asalto y pop urbano. Para generar los clusters, se debe instalar y
llamar el paquete “factoextra”. Se generaron 4 clusters donde se puede
visualizar qué estados tienen más arrestos, se puede visualizar que el
cluster rojo es el que cuenta con los estados con mas arrestados. Un
dato conseguido es que en Texas cuenta con el mayor numero de
detenidos.
LS0tCnRpdGxlOiA8c3BhbiBzdHlsZSA9ICJjb2xvcjpvcmFuZ2UiPiAiVVNBcnJlc3RzIgphdXRob3I6ICJNYXlyYSBDYW1wb3ktQTAwMjI2OTE0IgpkYXRlOiAiMjAyMi0wOS0xOSIKb3V0cHV0OiAKICBodG1sX2RvY3VtZW50OgogICAgdG9jOiB0cnVlCiAgICB0b2NfZmxvYXQ6IHRydWUKICAgIGNvZGVfZG93bmxvYWQ6IHRydWUKLS0tCgo8aW1nIHNyYz0gIi9Vc2Vycy9tYXlyYWNhbXBveXJhbW9zL0Rvd25sb2Fkcy9qYWlsLXN1aWNpZGUtbmV3c2Rlc2suanBnIj4KCiMjICpJbXBvcnRhciBiYXNlIGRlIGRhdG9zKgpgYGB7cn0KIyBmaWxlLmNob29zZSgpCmJkIDwtIHJlYWQuY3N2KCIvVXNlcnMvbWF5cmFjYW1wb3lyYW1vcy9Eb3dubG9hZHMvVVNBcnJlc3RzLmNzdiIpCnN1bW1hcnkoYmQpCmBgYAoKIyMgKkhlcnJhbWllbnRhICJFbCBHZW5lcmFkb3IgZGUgVmFsb3IgZGUgRGF0b3MiKgojIyMgUGFzbyAxLiBEZWZpbmlyIGVsIMOhcmVhIGRlbCBuZWdvY2lvIHF1ZSBidXNjYW1vcyBpbXBhY3RhciBvIG1lam9yYXIgeSBzdSBLUEkuIAojIyMjICBFbCBkZXBhcnRhbWVudG8gZGUgZGlyZWNjacOzbiBkZWwgZ29iaWVybm8gZGUgRXN0YWRvcyBVbmlkb3MgcGFyYSBnZW5lcmFyIHVuYSBlc3RyYXRlZ2lhIHBhcmEgYmFqYXIgbG9zIG5pdmVsZXMgZGUgaW5zZWd1cmlkYWQgeSBhcnJlc3Rvcy4KIyMjIFBhc28gMi4gKipTZWdtZW50YWNpw7NuKioKIyMjIFBhc28gMy4gR2VuZXJhciBpZGVhcyBvIGNvbmNlcHRvcyBlc3BlY8OtZmljb3MgCiMjIyMgRWxhYm9yYXIgdW5hIHNlZ21lbnRhY2nDs24gZG9uZGUgc2UgcG9kcsOhIHZpc3VhbGl6YXIgbG9zIGVzdGFkb3MgY29uIG1heW9yIG7Dum1lcm8gZGUgYXJyZXN0b3MuCiMjIyBQYXNvIDQuIFJldW5pciBsb3MgZGF0b3MgcmVxdWVyaWRvcwojIyMjIEVsYWJvcmFyIGNsdXN0ZXJzIGNvbiBsb3MgZXN0YWRvcyBlbiBjb3JyZWxhY2nDs24gZGUgbG9zIGRldGVuaWRvcy4KIyMjIFBhc28gNS4gUGxhbiBkZSBlamVjdWNpw7NuIAojIyMjIERlc3B1w6lzIGRlIHZpc3VhbGl6YXIgbG9zIGVzdGFkb3MgY29uIG1heW9yIG7Dum1lcm8gZGUgZGV0ZW5pZG9zIGltcGxlbWVudGFyIG3DoXMgdmlnaWxhbmNpYSBwYXJhIGF1bWVudGFyIGxhIHNlZ3VyaWRhZCB5IHJlYmFqYXIgbG9zIGRldGVuaWRvcy4gU2UgcmVjb21pZW5kYSBpbmljaWFyIGNvbiBUZXhhcy4gCiMjIyMgU2lzdGVtYSBhc2VndXJhcsOhIGxhIGNhcHR1cmEgZGVsIE1hcmtkb3duIGVuIGxhcyBiYXNlcyBkZSBkYXRvcyAKZXN0YWTDrXN0aWNhCgoKCiMjICpBZ3JlZ2FyIFggY29tbyBub21icmUgZGUgbG9zIHJlbmdsb25lcyoKYGBge3J9CmJkMSA8LSBiZApyb3duYW1lcyhiZDEpIDwtIGJkMSRYCmBgYAoKIyMgKkVsaW1pbmFyIGxhIGNvbHVtbmEgWCoKYGBge3J9CmJkMiA8LSBiZDEKYmQyIDwtIHN1YnNldChiZDIsIHNlbGVjdCA9IC1jIChYKSkKCmJveHBsb3QoYmQyKQpib3hwbG90KGJkMiRSYXBlKQpgYGAKCiMjICprLW1lYW4gQ2x1c3RlcmluZyoKYGBge3J9CiBjbHVzdGVyczwtIGttZWFucyhiZDIsNCkKCmFzaWduYWNpb248LWNiaW5kKGJkMixDbHVzdGVyPWNsdXN0ZXJzJGNsdXN0ZXIpCmhlYWQoYXNpZ25hY2lvbiwxMCkKCmNsdXN0ZXJzMjwta21lYW5zKGJkMiwzKQoKYXNpZ25hY2lvbjI8LWNiaW5kKGJkMixDbHVzdGVyPWNsdXN0ZXJzMiRjbHVzdGVyKQpoZWFkKGFzaWduYWNpb24yLDEwKQoKCiMgaW5zdGFsbC5wYWNrYWdlcygiZmFjdG9leHRyYSIpCmxpYnJhcnkoZmFjdG9leHRyYSkKZnZpel9jbHVzdGVyKGNsdXN0ZXJzLCBkYXRhPWJkMiwKICAgICAgICAgICAgIHBhbGV0dGU9YygicmVkIiwiYmx1ZSIsImJsYWNrIiwiZGFya2dyZWVuIiksCiAgICAgICAgICAgICBlbGxpcHNlLnR5cGU9ImV1Y2xpZCIsCiAgICAgICAgICAgICBzdGFyLnBsb3Q9VCwKICAgICAgICAgICAgIHJlcGVsPVQsCiAgICAgICAgICAgICBnZ3RoZW1lPXRoZW1lKCkpCgpmdml6X2NsdXN0ZXIoY2x1c3RlcnMyLCBkYXRhPWJkMiwKICAgICAgICAgICAgIHBhbGV0dGU9YygicmVkIiwiYmx1ZSIsImJsYWNrIiwiZGFya2dyZWVuIiksCiAgICAgICAgICAgICBlbGxpcHNlLnR5cGU9ImV1Y2xpZCIsCiAgICAgICAgICAgICBzdGFyLnBsb3Q9VCwKICAgICAgICAgICAgIHJlcGVsPVQsCiAgICAgICAgICAgICBnZ3RoZW1lPXRoZW1lKCkpCmBgYAoKIyMgKkNvbmNsdXNpb25lcyoKCksgTWVhbnMgQ2x1c3RlcmluZywgY29ub2NpZG8gZW4gZXNwYcOxb2wgY29tbyBzZWdtZW50YWNpw7NuIGRlIGRhdG9zLCBlbiBSIGVzIHVuIGFsZ29yaXRtbyBubyBsaW5lYWwgcXVlIGJ1c2NhIGFncnVwYXIgZGF0b3MgZW4gZnVuY2nDs24gZGUgbGEgc2ltaWxpdHVkIG8gZ3J1cG9zIHNpbWlsYXJlcy4gQWwgZ2VuZXJhciBsYSBzZWdtZW50YWNpw7NuIHNlIHZ1ZWx2ZSB1biBjbMO6c3Rlci4gRW4gZXN0ZSBlamVyY2ljaW8gc2UgcG9kcsOhIG1vc3RyYXIgZGUgdW5hIG1hbmVyYSBtw6FzIGdyw6FmaWNhIGxhIHBvc2ljacOzbiBkZSBsb3MgZXN0YWRvcyBjb25jb3JkYW5kbyBjb24gbG9zIGFycmVzdG9zIHF1ZSBzZSB0aWVuZW4KCkVtcGV6YW5kbywgcHJpbWVybyBzZSBpbmdyZXPDsyB1bmEgYmFzZSBkZSBkYXRvcyBkZSBsb3MgYXJyZXN0b3MgZGUgRXN0YWRvcyBVbmlkb3MgeSBlbCBwb3JxdcOpIGZ1ZXJvbiBkZXRlbmlkb3MuIFNlIGVsaW1pbmEgdW5hIGNvbHVtbmEgZXh0cmEsIOKAnFjigJ0sIHBhcmEgYXPDrSBjb250aW51YXIgY29uIGxhIHNlZ21lbnRhY2nDs24uIFJlYWxpemFyIGxvcyBjbHVzdGVycyBjb24gbGFzIHZhcmlhYmxlcyBkZSB0aXBvIGRlIGFycmVzdG8gcG9yIHZpb2xhY2lvbiwgYXNlc2luYXRvLCBhc2FsdG8geSBwb3AgdXJiYW5vLiBQYXJhIGdlbmVyYXIgbG9zIGNsdXN0ZXJzLCBzZSBkZWJlIGluc3RhbGFyIHkgbGxhbWFyIGVsIHBhcXVldGUg4oCcZmFjdG9leHRyYeKAnS4gU2UgZ2VuZXJhcm9uIDQgY2x1c3RlcnMgZG9uZGUgc2UgcHVlZGUgdmlzdWFsaXphciBxdcOpIGVzdGFkb3MgdGllbmVuIG3DoXMgYXJyZXN0b3MsIHNlIHB1ZWRlIHZpc3VhbGl6YXIgcXVlIGVsIGNsdXN0ZXIgcm9qbyBlcyBlbCBxdWUgY3VlbnRhIGNvbiBsb3MgZXN0YWRvcyBjb24gbWFzIGFycmVzdGFkb3MuIFVuIGRhdG8gY29uc2VndWlkbyBlcyBxdWUgZW4gVGV4YXMgY3VlbnRhIGNvbiBlbCBtYXlvciBudW1lcm8gZGUgZGV0ZW5pZG9zLiAKIAo=