En el presente analisis veremos los datos de la produccion de miel en toneladas en el estado de Sonora
setwd("~/esta")
library(readr)
ProdMielSon <- read_csv("sonora.csv")
##
## -- Column specification --------------------------------------------------------
## cols(
## YEAR = col_double(),
## PROMIEL = col_double()
## )
head(ProdMielSon) #Para conocer los primeros registros
## # A tibble: 6 x 2
## YEAR PROMIEL
## <dbl> <dbl>
## 1 2003 542
## 2 2004 452
## 3 2005 743
## 4 2006 378
## 5 2007 369
## 6 2008 387
mean(ProdMielSon$PROMIEL) #Media (promedio)
## [1] 467.1891
median(ProdMielSon$PROMIEL) #mediana, valor que se encuentra justo en medio (si ordenamos los datos de menor a mayor)
## [1] 452
¿Cómo sabemos esto? - Ordenando los datos de menor a mayor
sort(ProdMielSon$PROMIEL)
## [1] 250.000 340.000 369.000 377.000 378.000 387.000 410.000 432.000 452.000
## [10] 516.000 526.000 528.214 540.000 542.000 569.000 583.000 743.000
La moda es el valor que más se repite en un conjunto de datos, en R no existe una manera directa de calcular la moda, así que usaremos una biblioteca
library(modeest)
mlv(ProdMielSon$PROMIEL, method = "mfv") #Most Frequent value = valor más frecuente
## [1] 250.000 340.000 369.000 377.000 378.000 387.000 410.000 432.000 452.000
## [10] 516.000 526.000 528.214 540.000 542.000 569.000 583.000 743.000
Maximo <- max(ProdMielSon$PROMIEL) #Valor mas grande
Maximo
## [1] 743
Minimo <- min(ProdMielSon$PROMIEL) #Valor mas chico
Minimo
## [1] 250
Rango <- (Maximo-Minimo) #Amplitud de rango
Rango
## [1] 493
summary(ProdMielSon$PROMIEL)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 250.0 378.0 452.0 467.2 540.0 743.0
boxplot(ProdMielSon$PROMIEL)
Q3 <- 540
Q1 <- 378
RIC <- (Q3-Q1)
#Limite superior (Maximo)
Limitesuperior <- (Q3+1.5*RIC)
Limitesuperior
## [1] 783
#Limite inferior (Minimo)
Limiteinferior <- (Q1+1.5*RIC)
Limiteinferior
## [1] 621