Análisis de las colmenas en México, un vistazo a la apicultura en nuestro país

Para esto usaremos datos del número de colmenas por año, según datos oficiales de la FAO STAT, obtenidos del atlas de abejas: https://atlasnacionaldelasabejasmx.github.io/atlas/cap5.html

Importar datos

setwd("~/Estadisticas 1")
library(readr)
BeehivesMX <- read_csv("BeehivesMX.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   yearc = col_double(),
##   Colmenas = col_double()
## )

Conociendo los datos

head(BeehivesMX) #Para conocer los primeros registros
## # A tibble: 6 x 2
##   yearc Colmenas
##   <dbl>    <dbl>
## 1  1961  1985000
## 2  1962  2000000
## 3  1963  1300000
## 4  1964  1100000
## 5  1965   920934
## 6  1966   966980

Medidas de tendencia central:

Media

mean(BeehivesMX$Colmenas) #Media (promedio) del número de colmenas por año en México
## [1] 1917477

Mediana

median(BeehivesMX$Colmenas) #mediana, valor que se encuentra justo en medio (si ordenamos los datos de menor a mayor)
## [1] 1926522

¿Cómo sabemos esto? - Ordenando los datos de menor a mayor

sort(BeehivesMX$Colmenas)
##  [1]  920934  966980 1015329 1100000 1185581 1300000 1580060 1618000 1665700
## [10] 1715948 1727234 1732112 1741040 1745078 1747033 1774757 1783854 1791111
## [19] 1797478 1821000 1842130 1847667 1853807 1859350 1862372 1875731 1876000
## [28] 1898239 1919938 1933105 1944573 1981162 1985000 1996000 2000000 2017931
## [37] 2037000 2053761 2059012 2080060 2088315 2107618 2114489 2119400 2142300
## [46] 2172107 2209339 2254800 2292428 2293733 2330948 2380600 2384500 2422729
## [55] 2493400 2532200 2532200 2690500

Moda

La moda es el valor que más se repite en un conjunto de datos, en R no existe una manera directa de calcular la moda, así que usaremos una biblioteca

library(modeest)
mlv(BeehivesMX$Colmenas, method = "mfv")  #Most Frequent value = valor más frecuente
## [1] 2532200

Rango o amplitud

maximo <- max(BeehivesMX$Colmenas) #valor más grande
maximo
## [1] 2690500
minimo <- min(BeehivesMX$Colmenas) #valor más chico
minimo
## [1] 920934
rango <- (maximo-minimo) #amplitud
rango
## [1] 1769566

Cuartiles y resumen de tendencia central

summary(BeehivesMX$Colmenas)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  920934 1753964 1926522 1917477 2118172 2690500

Gráfico de caja y bigote

boxplot(BeehivesMX$Colmenas)

Rango intercuartil

# IQR (Inter Quartil Range) = Q3-Q1
RIC = IQR(BeehivesMX$Colmenas)
RIC
## [1] 364208.2
# Límite superior (Maximun)
Q3 <- 2118172
limitesuperior <- (Q3+1.5*RIC)
limitesuperior
## [1] 2664484
#Límite Inferior (Mínimo)
Q1 <- 1753964
limiteinferior <- (Q1+1.5*RIC)
limiteinferior
## [1] 2300276