datos<- read.csv("C:/Users/leonc/Documents/Consultoria Estadistica/tendencias google.csv",sep=",",row.names=1,header=TRUE)
library(factoextra)
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(kableExtra)
attach(datos)
head(datos)
## Feminicidios Igualdad.de.género Violencia.sexual Machismo
## Hidalgo 24 37 14 24
## Guerrero 18 40 22 20
## Veracruz 22 41 18 16
## Puebla 27 31 12 25
## Campeche 24 42 5 29
## Durango 13 38 21 28
Análisis Descriptivo
D <- boxplot(datos, xlab="Palabras clave ", ylab="Porcentaje de búsqueda", border = "black",col = palette("Pastel 2"), outpch = 20,
outbg = "green",
whiskcol = "blue",
whisklty = 2,
lty = 1)
Gráfico de codos para observar el numero de clusters posibles
grafico <- fviz_nbclust(x = datos, FUNcluster = kmeans, method = "wss")
grafico +
labs(title = NULL, x="Numero de conglomerados K", y="Total dentro de la suma del cuadrado")
Aplicar un algoritmo para agrupamiento jerárquico con el método completo
hccompleto <-hclust(dist(datos), method="complete")
hccompleto
##
## Call:
## hclust(d = dist(datos), method = "complete")
##
## Cluster method : complete
## Distance : euclidean
## Number of objects: 32
Dendograma para visualizar la agrupación de las entiendades federativas de México
plot(hccompleto,main="", xlab="Entidades federativas",ylab="Distacias entre los puntos", sub="",cex=.9)
rect.hclust(hccompleto, k=5, border=3)
Visualización de clústers
violenciaclus<-cutree(hccompleto, k=4)
violenciaclus
## Hidalgo Guerrero Veracruz
## 1 1 1
## Puebla Campeche Durango
## 2 1 3
## Colima Morelos Aguascalientes
## 1 2 1
## Zacatecas Coahuila de Zaragoza Estado de Mexico
## 1 3 2
## Chiapas Queretaro Tabasco
## 3 2 3
## Oaxaca Baja California Sur Tlaxcala
## 2 4 2
## Guanajuato Chihuahua Michoacan
## 3 2 2
## Tamaulipas San Luis Potosi Nayarit
## 1 2 2
## Ciudad de Mexico Sonora Jalisco
## 2 1 2
## Yucatan Sinaloa Quintana Roo
## 2 3 2
## Nuevo Leon Baja California
## 2 2
fviz_cluster(list(data = datos, cluster=violenciaclus))+
labs(title ="") +
theme_bw()
4 clústers óptimos explicando un 77.4% de la varianza
Links
https://sites.google.com/view/violencia-mujer-consultoria/inicio?authuser=0