Importar base de datos

# file.choose()
bd <- read.csv("/Users/mayracampoyramos/Downloads/USArrests.csv")
summary(bd)
##       X                 Murder          Assault         UrbanPop    
##  Length:50          Min.   : 0.800   Min.   : 45.0   Min.   :32.00  
##  Class :character   1st Qu.: 4.075   1st Qu.:109.0   1st Qu.:54.50  
##  Mode  :character   Median : 7.250   Median :159.0   Median :66.00  
##                     Mean   : 7.788   Mean   :170.8   Mean   :65.54  
##                     3rd Qu.:11.250   3rd Qu.:249.0   3rd Qu.:77.75  
##                     Max.   :17.400   Max.   :337.0   Max.   :91.00  
##       Rape      
##  Min.   : 7.30  
##  1st Qu.:15.07  
##  Median :20.10  
##  Mean   :21.23  
##  3rd Qu.:26.18  
##  Max.   :46.00

Herramienta “El Generador de Valor de Datos”

Paso 1. Definir el área del negocio que buscamos impactar o mejorar y su KPI.

El departamento de dirección del gobierno de Estados Unidos para generar una estrategia para bajar los niveles de inseguridad y arrestos.

Paso 2. Segmentación

Paso 3. Generar ideas o conceptos específicos

Elaborar una segmentación donde se podrá visualizar los estados con mayor número de arrestos.

Paso 4. Reunir los datos requeridos

Elaborar clusters con los estados en correlación de los detenidos.

Paso 5. Plan de ejecución

Después de visualizar los estados con mayor número de detenidos implementar más vigilancia para aumentar la seguridad y rebajar los detenidos. Se recomienda iniciar con Texas.

Sistema asegurará la captura del Markdown en las bases de datos

estadística

Agregar X como nombre de los renglones

bd1 <- bd
rownames(bd1) <- bd1$X

Eliminar la columna X

bd2 <- bd1
bd2 <- subset(bd2, select = -c (X))

boxplot(bd2)

boxplot(bd2$Rape)

k-mean Clustering

 clusters<- kmeans(bd2,4)

asignacion<-cbind(bd2,Cluster=clusters$cluster)
head(asignacion,10)
##             Murder Assault UrbanPop Rape Cluster
## Alabama       13.2     236       58 21.2       1
## Alaska        10.0     263       48 44.5       1
## Arizona        8.1     294       80 31.0       1
## Arkansas       8.8     190       50 19.5       2
## California     9.0     276       91 40.6       1
## Colorado       7.9     204       78 38.7       2
## Connecticut    3.3     110       77 11.1       3
## Delaware       5.9     238       72 15.8       1
## Florida       15.4     335       80 31.9       1
## Georgia       17.4     211       60 25.8       2
clusters2<-kmeans(bd2,3)

asignacion2<-cbind(bd2,Cluster=clusters2$cluster)
head(asignacion2,10)
##             Murder Assault UrbanPop Rape Cluster
## Alabama       13.2     236       58 21.2       1
## Alaska        10.0     263       48 44.5       1
## Arizona        8.1     294       80 31.0       1
## Arkansas       8.8     190       50 19.5       3
## California     9.0     276       91 40.6       1
## Colorado       7.9     204       78 38.7       3
## Connecticut    3.3     110       77 11.1       2
## Delaware       5.9     238       72 15.8       1
## Florida       15.4     335       80 31.9       1
## Georgia       17.4     211       60 25.8       3
# install.packages("factoextra")
library(factoextra)
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
fviz_cluster(clusters, data=bd2,
             palette=c("red","blue","black","darkgreen"),
             ellipse.type="euclid",
             star.plot=T,
             repel=T,
             ggtheme=theme())

fviz_cluster(clusters2, data=bd2,
             palette=c("red","blue","black","darkgreen"),
             ellipse.type="euclid",
             star.plot=T,
             repel=T,
             ggtheme=theme())

Conclusiones

K Means Clustering, conocido en español como segmentación de datos, en R es un algoritmo no lineal que busca agrupar datos en función de la similitud o grupos similares. Al generar la segmentación se vuelve un clúster. En este ejercicio se podrá mostrar de una manera más gráfica la posición de los estados concordando con los arrestos que se tienen

Empezando, primero se ingresó una base de datos de los arrestos de Estados Unidos y el porqué fueron detenidos. Se elimina una columna extra, “X”, para así continuar con la segmentación. Realizar los clusters con las variables de tipo de arresto por violacion, asesinato, asalto y pop urbano. Para generar los clusters, se debe instalar y llamar el paquete “factoextra”. Se generaron 4 clusters donde se puede visualizar qué estados tienen más arrestos, se puede visualizar que el cluster rojo es el que cuenta con los estados con mas arrestados. Un dato conseguido es que en Texas cuenta con el mayor numero de detenidos.

LS0tCnRpdGxlOiA8c3BhbiBzdHlsZSA9ICJjb2xvcjpvcmFuZ2UiPiAiVVNBcnJlc3RzIgphdXRob3I6ICJNYXlyYSBDYW1wb3ktQTAwMjI2OTE0IgpkYXRlOiAiMjAyMi0wOS0xOSIKb3V0cHV0OiAKICBodG1sX2RvY3VtZW50OgogICAgdG9jOiB0cnVlCiAgICB0b2NfZmxvYXQ6IHRydWUKICAgIGNvZGVfZG93bmxvYWQ6IHRydWUKLS0tCgo8aW1nIHNyYz0gIi9Vc2Vycy9tYXlyYWNhbXBveXJhbW9zL0Rvd25sb2Fkcy9qYWlsLXN1aWNpZGUtbmV3c2Rlc2suanBnIj4KCiMjICpJbXBvcnRhciBiYXNlIGRlIGRhdG9zKgpgYGB7cn0KIyBmaWxlLmNob29zZSgpCmJkIDwtIHJlYWQuY3N2KCIvVXNlcnMvbWF5cmFjYW1wb3lyYW1vcy9Eb3dubG9hZHMvVVNBcnJlc3RzLmNzdiIpCnN1bW1hcnkoYmQpCmBgYAoKIyMgKkhlcnJhbWllbnRhICJFbCBHZW5lcmFkb3IgZGUgVmFsb3IgZGUgRGF0b3MiKgojIyMgUGFzbyAxLiBEZWZpbmlyIGVsIMOhcmVhIGRlbCBuZWdvY2lvIHF1ZSBidXNjYW1vcyBpbXBhY3RhciBvIG1lam9yYXIgeSBzdSBLUEkuIAojIyMjICBFbCBkZXBhcnRhbWVudG8gZGUgZGlyZWNjacOzbiBkZWwgZ29iaWVybm8gZGUgRXN0YWRvcyBVbmlkb3MgcGFyYSBnZW5lcmFyIHVuYSBlc3RyYXRlZ2lhIHBhcmEgYmFqYXIgbG9zIG5pdmVsZXMgZGUgaW5zZWd1cmlkYWQgeSBhcnJlc3Rvcy4KIyMjIFBhc28gMi4gKipTZWdtZW50YWNpw7NuKioKIyMjIFBhc28gMy4gR2VuZXJhciBpZGVhcyBvIGNvbmNlcHRvcyBlc3BlY8OtZmljb3MgCiMjIyMgRWxhYm9yYXIgdW5hIHNlZ21lbnRhY2nDs24gZG9uZGUgc2UgcG9kcsOhIHZpc3VhbGl6YXIgbG9zIGVzdGFkb3MgY29uIG1heW9yIG7Dum1lcm8gZGUgYXJyZXN0b3MuCiMjIyBQYXNvIDQuIFJldW5pciBsb3MgZGF0b3MgcmVxdWVyaWRvcwojIyMjIEVsYWJvcmFyIGNsdXN0ZXJzIGNvbiBsb3MgZXN0YWRvcyBlbiBjb3JyZWxhY2nDs24gZGUgbG9zIGRldGVuaWRvcy4KIyMjIFBhc28gNS4gUGxhbiBkZSBlamVjdWNpw7NuIAojIyMjIERlc3B1w6lzIGRlIHZpc3VhbGl6YXIgbG9zIGVzdGFkb3MgY29uIG1heW9yIG7Dum1lcm8gZGUgZGV0ZW5pZG9zIGltcGxlbWVudGFyIG3DoXMgdmlnaWxhbmNpYSBwYXJhIGF1bWVudGFyIGxhIHNlZ3VyaWRhZCB5IHJlYmFqYXIgbG9zIGRldGVuaWRvcy4gU2UgcmVjb21pZW5kYSBpbmljaWFyIGNvbiBUZXhhcy4gCiMjIyMgU2lzdGVtYSBhc2VndXJhcsOhIGxhIGNhcHR1cmEgZGVsIE1hcmtkb3duIGVuIGxhcyBiYXNlcyBkZSBkYXRvcyAKZXN0YWTDrXN0aWNhCgoKCiMjICpBZ3JlZ2FyIFggY29tbyBub21icmUgZGUgbG9zIHJlbmdsb25lcyoKYGBge3J9CmJkMSA8LSBiZApyb3duYW1lcyhiZDEpIDwtIGJkMSRYCmBgYAoKIyMgKkVsaW1pbmFyIGxhIGNvbHVtbmEgWCoKYGBge3J9CmJkMiA8LSBiZDEKYmQyIDwtIHN1YnNldChiZDIsIHNlbGVjdCA9IC1jIChYKSkKCmJveHBsb3QoYmQyKQpib3hwbG90KGJkMiRSYXBlKQpgYGAKCiMjICprLW1lYW4gQ2x1c3RlcmluZyoKYGBge3J9CiBjbHVzdGVyczwtIGttZWFucyhiZDIsNCkKCmFzaWduYWNpb248LWNiaW5kKGJkMixDbHVzdGVyPWNsdXN0ZXJzJGNsdXN0ZXIpCmhlYWQoYXNpZ25hY2lvbiwxMCkKCmNsdXN0ZXJzMjwta21lYW5zKGJkMiwzKQoKYXNpZ25hY2lvbjI8LWNiaW5kKGJkMixDbHVzdGVyPWNsdXN0ZXJzMiRjbHVzdGVyKQpoZWFkKGFzaWduYWNpb24yLDEwKQoKCiMgaW5zdGFsbC5wYWNrYWdlcygiZmFjdG9leHRyYSIpCmxpYnJhcnkoZmFjdG9leHRyYSkKZnZpel9jbHVzdGVyKGNsdXN0ZXJzLCBkYXRhPWJkMiwKICAgICAgICAgICAgIHBhbGV0dGU9YygicmVkIiwiYmx1ZSIsImJsYWNrIiwiZGFya2dyZWVuIiksCiAgICAgICAgICAgICBlbGxpcHNlLnR5cGU9ImV1Y2xpZCIsCiAgICAgICAgICAgICBzdGFyLnBsb3Q9VCwKICAgICAgICAgICAgIHJlcGVsPVQsCiAgICAgICAgICAgICBnZ3RoZW1lPXRoZW1lKCkpCgpmdml6X2NsdXN0ZXIoY2x1c3RlcnMyLCBkYXRhPWJkMiwKICAgICAgICAgICAgIHBhbGV0dGU9YygicmVkIiwiYmx1ZSIsImJsYWNrIiwiZGFya2dyZWVuIiksCiAgICAgICAgICAgICBlbGxpcHNlLnR5cGU9ImV1Y2xpZCIsCiAgICAgICAgICAgICBzdGFyLnBsb3Q9VCwKICAgICAgICAgICAgIHJlcGVsPVQsCiAgICAgICAgICAgICBnZ3RoZW1lPXRoZW1lKCkpCmBgYAoKIyMgKkNvbmNsdXNpb25lcyoKCksgTWVhbnMgQ2x1c3RlcmluZywgY29ub2NpZG8gZW4gZXNwYcOxb2wgY29tbyBzZWdtZW50YWNpw7NuIGRlIGRhdG9zLCBlbiBSIGVzIHVuIGFsZ29yaXRtbyBubyBsaW5lYWwgcXVlIGJ1c2NhIGFncnVwYXIgZGF0b3MgZW4gZnVuY2nDs24gZGUgbGEgc2ltaWxpdHVkIG8gZ3J1cG9zIHNpbWlsYXJlcy4gQWwgZ2VuZXJhciBsYSBzZWdtZW50YWNpw7NuIHNlIHZ1ZWx2ZSB1biBjbMO6c3Rlci4gRW4gZXN0ZSBlamVyY2ljaW8gc2UgcG9kcsOhIG1vc3RyYXIgZGUgdW5hIG1hbmVyYSBtw6FzIGdyw6FmaWNhIGxhIHBvc2ljacOzbiBkZSBsb3MgZXN0YWRvcyBjb25jb3JkYW5kbyBjb24gbG9zIGFycmVzdG9zIHF1ZSBzZSB0aWVuZW4KCkVtcGV6YW5kbywgcHJpbWVybyBzZSBpbmdyZXPDsyB1bmEgYmFzZSBkZSBkYXRvcyBkZSBsb3MgYXJyZXN0b3MgZGUgRXN0YWRvcyBVbmlkb3MgeSBlbCBwb3JxdcOpIGZ1ZXJvbiBkZXRlbmlkb3MuIFNlIGVsaW1pbmEgdW5hIGNvbHVtbmEgZXh0cmEsIOKAnFjigJ0sIHBhcmEgYXPDrSBjb250aW51YXIgY29uIGxhIHNlZ21lbnRhY2nDs24uIFJlYWxpemFyIGxvcyBjbHVzdGVycyBjb24gbGFzIHZhcmlhYmxlcyBkZSB0aXBvIGRlIGFycmVzdG8gcG9yIHZpb2xhY2lvbiwgYXNlc2luYXRvLCBhc2FsdG8geSBwb3AgdXJiYW5vLiBQYXJhIGdlbmVyYXIgbG9zIGNsdXN0ZXJzLCBzZSBkZWJlIGluc3RhbGFyIHkgbGxhbWFyIGVsIHBhcXVldGUg4oCcZmFjdG9leHRyYeKAnS4gU2UgZ2VuZXJhcm9uIDQgY2x1c3RlcnMgZG9uZGUgc2UgcHVlZGUgdmlzdWFsaXphciBxdcOpIGVzdGFkb3MgdGllbmVuIG3DoXMgYXJyZXN0b3MsIHNlIHB1ZWRlIHZpc3VhbGl6YXIgcXVlIGVsIGNsdXN0ZXIgcm9qbyBlcyBlbCBxdWUgY3VlbnRhIGNvbiBsb3MgZXN0YWRvcyBjb24gbWFzIGFycmVzdGFkb3MuIFVuIGRhdG8gY29uc2VndWlkbyBlcyBxdWUgZW4gVGV4YXMgY3VlbnRhIGNvbiBlbCBtYXlvciBudW1lcm8gZGUgZGV0ZW5pZG9zLiAKIAo=