Para esto usaremos datos del número de colmenas por año, según datos oficiales de la FAO STAT, obtenidos del atlas de abejas: https://atlasnacionaldelasabejasmx.github.io/atlas/cap5.html
setwd("~/Estadisticas 1")
library(readr)
BeehivesMX <- read_csv("BeehivesMX.csv")
##
## -- Column specification --------------------------------------------------------
## cols(
## yearc = col_double(),
## Colmenas = col_double()
## )
head(BeehivesMX) #Para conocer los primeros registros
## # A tibble: 6 x 2
## yearc Colmenas
## <dbl> <dbl>
## 1 1961 1985000
## 2 1962 2000000
## 3 1963 1300000
## 4 1964 1100000
## 5 1965 920934
## 6 1966 966980
mean(BeehivesMX$Colmenas) #Media (promedio) del número de colmenas por año en México
## [1] 1917477
median(BeehivesMX$Colmenas) #mediana, valor que se encuentra justo en medio (si ordenamos los datos de menor a mayor)
## [1] 1926522
¿Cómo sabemos esto? - Ordenando los datos de menor a mayor
sort(BeehivesMX$Colmenas)
## [1] 920934 966980 1015329 1100000 1185581 1300000 1580060 1618000 1665700
## [10] 1715948 1727234 1732112 1741040 1745078 1747033 1774757 1783854 1791111
## [19] 1797478 1821000 1842130 1847667 1853807 1859350 1862372 1875731 1876000
## [28] 1898239 1919938 1933105 1944573 1981162 1985000 1996000 2000000 2017931
## [37] 2037000 2053761 2059012 2080060 2088315 2107618 2114489 2119400 2142300
## [46] 2172107 2209339 2254800 2292428 2293733 2330948 2380600 2384500 2422729
## [55] 2493400 2532200 2532200 2690500
La moda es el valor que más se repite en un conjunto de datos, en R no existe una manera directa de calcular la moda, así que usaremos una biblioteca
library(modeest)
mlv(BeehivesMX$Colmenas, method = "mfv") #Most Frequent value = valor más frecuente
## [1] 2532200
maximo <- max(BeehivesMX$Colmenas) #valor más grande
maximo
## [1] 2690500
minimo <- min(BeehivesMX$Colmenas) #valor más chico
minimo
## [1] 920934
rango <- (maximo-minimo) #amplitud
rango
## [1] 1769566
summary(BeehivesMX$Colmenas)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 920934 1753964 1926522 1917477 2118172 2690500
boxplot(BeehivesMX$Colmenas)
# IQR (Inter Quartil Range) = Q3-Q1
RIC = IQR(BeehivesMX$Colmenas)
RIC
## [1] 364208.2
# Límite superior (Maximun)
Q3 <- 2118172
limitesuperior <- (Q3+1.5*RIC)
limitesuperior
## [1] 2664484
#Límite Inferior (Mínimo)
Q1 <- 1753964
limiteinferior <- (Q1+1.5*RIC)
limiteinferior
## [1] 2300276