- Librerias
library(pacman)
p_load(rmdformats, readr, readxl, ggplot2, plotly, DT, xfun, gridExtra, leaflet, GGally, psych, corrplot, cluster)
- Importamos datos
setwd("~/Aplicada")
library(readxl)
Atlas_Api <- read_excel("Atlas.Api.xlsx")
View(Atlas_Api)
library(ggplot2)
library(DT)
Introduccion
A continuacion se va a presentar un analisis comparativo de la proudccion de miel existente en 3 estados de la republica mexicana que son: Yucatan Jalisco Quintana Roo
datatable(Atlas_Api)
Grafica de datos
ggplot(Atlas_Api, aes(YEAR, Produccion) ) + geom_point(aes(col=Estado), size=4)
En este gráfico se pueden obersevar que la produccón de miel no es similar y se puede diferenciar cada estado productor, con la excepción del año 2017 en el cual la produccion de miel de Yucatan disminuyó, tenido valores similares de producción entre Jalisco y Quintana Roo.
set.seed(101)
Atlas_ApiCluster <- kmeans(Atlas_Api[,2], center=3, nstart = 20 )
Atlas_ApiCluster
## K-means clustering with 3 clusters of sizes 14, 17, 20
##
## Cluster means:
## Produccion
## 1 9485.879
## 2 2698.033
## 3 5860.918
##
## Clustering vector:
## [1] 1 1 3 1 1 1 1 1 1 1 1 1 1 3 3 1 1 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 2 2 2 2
## [39] 2 2 2 2 2 2 2 2 2 2 2 2 2
##
## Within cluster sum of squares by cluster:
## [1] 19545446 4938183 10719279
## (between_SS / total_SS = 91.0 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
Comparando los clusters con los datos originiales
table(Atlas_ApiCluster$cluster, Atlas_Api$Estado)
##
## JALISCO QUINTANA ROO YUCATAN
## 1 0 0 14
## 2 0 17 0
## 3 17 0 3
Grafica de clusters.
library(cluster)
clusplot(Atlas_Api, Atlas_ApiCluster$cluster, color=T, shade = T, lines=0 )
Este gráfico representa la similutud de produccón que hay entre Quitana Roo y Jalisco, siendo Yucatan las mas facil de diferenciar.
tot.withinss <- vector(mode="character", length=10)
for (i in 1:10){
Atlas_ApiCluster <- kmeans(Atlas_Api[,2], center=i, nstart=20)
tot.withinss[i] <- Atlas_ApiCluster$tot.withinss
}
vamos a visualizar el resultado
plot(1:10, tot.withinss, type = "b", pch=19)
Conclusión
La apicultura es de suma importancia en el pais, ya que, las abejas son las encargadas de polinizar las flores, es deci, que estas son las que ayudan a llevar a cabo su reproducción.
En los estados estudiados se miró una constante producción de miel. El analisis llevado a cabo fuede clustering con K-Means eso se basó en encontrar patrones o grupos dentro de un conjunto de observaciones, para saber si tienen o no una similitud, lo que ayuda a saber si es facil diferenciarlos.