Estadistica descriptiva de la productividad de miel anual en toneladas en el estado de Sonora

Importa datos

setwd("~/Estadistica") #Directorio de trabajo 
library(readr)
sonora <- read_csv("sonora.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   YEAR = col_double(),
##   PROMIEL = col_double()
## )
head(sonora)
## # A tibble: 6 x 2
##    YEAR PROMIEL
##   <dbl>   <dbl>
## 1  2003     542
## 2  2004     452
## 3  2005     743
## 4  2006     378
## 5  2007     369
## 6  2008     387

Segun datos oficiales de la FAO STAT, obtenidos del atlas de abejas:

https://atlasnacionaldelasabejasmx.github.io/atlas/cap5.html

medidas de tendencia central

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los dato

media

La medida de tendencia central más conocida y utilizada es la media aritmética o promedio aritmético. Se representa por la letra griega µ

productividad <-(sonora$PROMIEL) #dentro de esta variable estan guardados los datos de la productividad de miel en toneladas
media <- mean(productividad)
media
## [1] 385.6596

mediana

Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la mediana.

mediana <- median(productividad)
mediana 
## [1] 432

ordenar datos de menor a mayor usando el mando sort

sort(productividad)
##  [1]  25.000  34.000  41.000  54.000 369.000 377.000 378.000 387.000 432.000
## [10] 452.000 516.000 526.000 528.214 542.000 569.000 583.000 743.000

moda

Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la mediana

library(modeest)
## Warning: package 'modeest' was built under R version 4.0.4
mlv(productividad, method ="mfv")
##  [1]  25.000  34.000  41.000  54.000 369.000 377.000 378.000 387.000 432.000
## [10] 452.000 516.000 526.000 528.214 542.000 569.000 583.000 743.000
#Most Frequent Value = valor mas frecuente 

rango o amplitud

maximo <-max(productividad)
minimo <-min(productividad)
rango <-(maximo-minimo)
rango
## [1] 718

cuartiles

summary(productividad)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    25.0   369.0   432.0   385.7   528.2   743.0

Rango de intercuartil

RIC <- IQR(productividad)
RIC
## [1] 159.214
# Limite superior
Q3 <- 540.0
limitesuperior <- (Q3+1.5*RIC)
limitesuperior
## [1] 778.821
# Limite inferior

Q1 <- 378.0
limiteinferior <- (Q1-1.5*RIC)
limiteinferior
## [1] 139.179

grafico de caja y bogote

boxplot(productividad)

Analisis de frecuencia

library(fdth)
## Warning: package 'fdth' was built under R version 4.0.4
## 
## Attaching package: 'fdth'
## The following object is masked from 'package:modeest':
## 
##     mfv
## The following objects are masked from 'package:stats':
## 
##     sd, var

Poligonos e histograma

hist(productividad)