AE5UC2_16

Jesús Murillo

16/11/2021

Librerias

library(pacman)
p_load(rmdformats, readr, readxl, ggplot2, plotly, DT, xfun, gridExtra, leaflet, GGally, psych, corrplot, cluster)

Importamos datos

setwd("~/Aplicada")
library(readxl)
Atlas_Api <- read_excel("Atlas.Api.xlsx")
View(Atlas_Api)
library(ggplot2)
library(DT)

Introduccion

A continuacion se va a presentar un analisis comparativo de la proudccion de miel existente en 3 estados de la republica mexicana que son: Yucatan Jalisco Quintana Roo

datatable(Atlas_Api)

Grafica de datos

ggplot(Atlas_Api, aes(YEAR, Produccion) ) + geom_point(aes(col=Estado), size=4)

En este gráfico se pueden obersevar que la produccón de miel no es similar y se puede diferenciar cada estado productor, con la excepción del año 2017 en el cual la produccion de miel de Yucatan disminuyó, tenido valores similares de producción entre Jalisco y Quintana Roo.

set.seed(101)
Atlas_ApiCluster <- kmeans(Atlas_Api[,2], center=3, nstart = 20    )
Atlas_ApiCluster

## K-means clustering with 3 clusters of sizes 14, 17, 20
## 
## Cluster means:
##   Produccion
## 1   9485.879
## 2   2698.033
## 3   5860.918
## 
## Clustering vector:
##  [1] 1 1 3 1 1 1 1 1 1 1 1 1 1 3 3 1 1 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 2 2 2 2
## [39] 2 2 2 2 2 2 2 2 2 2 2 2 2
## 
## Within cluster sum of squares by cluster:
## [1] 19545446  4938183 10719279
##  (between_SS / total_SS =  91.0 %)
## 
## Available components:
## 
## [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
## [6] "betweenss"    "size"         "iter"         "ifault"

Comparando los clusters con los datos originiales

table(Atlas_ApiCluster$cluster, Atlas_Api$Estado)

##    
##     JALISCO QUINTANA ROO YUCATAN
##   1       0            0      14
##   2       0           17       0
##   3      17            0       3

Grafica de clusters.

library(cluster)
clusplot(Atlas_Api, Atlas_ApiCluster$cluster, color=T, shade = T, lines=0 )

Este gráfico representa la similutud de produccón que hay entre Quitana Roo y Jalisco, siendo Yucatan las mas facil de diferenciar.

tot.withinss <- vector(mode="character", length=10)
for (i in 1:10){
  Atlas_ApiCluster <- kmeans(Atlas_Api[,2], center=i, nstart=20)
  tot.withinss[i] <- Atlas_ApiCluster$tot.withinss
}

vamos a visualizar el resultado

plot(1:10, tot.withinss, type = "b", pch=19)

Conclusión

La apicultura es de suma importancia en el pais, ya que, las abejas son las encargadas de polinizar las flores, es deci, que estas son las que ayudan a llevar a cabo su reproducción.

En los estados estudiados se miró una constante producción de miel. El analisis llevado a cabo fuede clustering con K-Means eso se basó en encontrar patrones o grupos dentro de un conjunto de observaciones, para saber si tienen o no una similitud, lo que ayuda a saber si es facil diferenciarlos.