MEDIDAS DE TENDENCIA CENTRAL

Son medidas que describen l o los datos que tienden hacia el centro del conjunto de datos Son los siguientes:

En este caso el elevado hace referencia al límite superior y la raya al piso hace referencia a límite inferior. En frac el primer número es el numerador y el segundo es el denominados

La fórmula de la mediana es:

Ejemplo con la base de datos diamante

Encontrar las medidas de tendencia central para la variable precio de la base de datos Diamantes que se encuentra en el paquete datos

library(datos)
media_a <- mean(diamantes$precio)
mediana_a <- median(diamantes$precio)

# Para hallar la moda se carga modeest

library(modeest)
moda_a <- mlv1(diamantes$precio)
df <- data.frame(media_a, mediana_a,moda_a)
df
##   media_a mediana_a moda_a
## 1  3932.8      2401    605

MEDIDAS DE VARIABILIDAD

  1. Rango
  2. Varianza
  3. Desviación Estándae
  4. Coeficiente de variación

Ejemplos de Medidas de Variabilidad

rango_diam <- max(diamantes$precio) - min(diamantes$precio)
cat ("El rango del precio de los diamantes es:",rango_diam)
## El rango del precio de los diamantes es: 18497
var_diam <- var(diamantes$precio)
cat ("La varianza del precio de los diamantes es:",var_diam)
## La varianza del precio de los diamantes es: 15915629
des_diam <- sd(diamantes$precio)
des_diam2 <- sqrt(var_diam)
des_diam2
## [1] 3989.44
cat ("La desviación estándar del precio de los diamantes es:", des_diam) 
## La desviación estándar del precio de los diamantes es: 3989.44
coefic_diam <- (sd(diamantes$precio) / mean(diamantes$precio)) * 100
cat ("El coeficiente de variación del precio de los diamantes es:", coefic_diam) 
## El coeficiente de variación del precio de los diamantes es: 101.4402

MEDIDAS DE POSICIÓN

Nos indican un porcentaje de infirmación que se encuentran antes y después de dicha medida. Las medidas de posición que más se usan son:

\[P_k = Q\!\left(\frac{(n+1)*k} {100} \right), \quad k = 1, 2, \dots, 99\] Ejemplo de medidas de posición Encontral todos los cuartiles y el percentil 30, 80 y 90

Percentiles <- quantile(diamantes$precio, probs = c(0.25,0.3,0.5,0.75, 0.8,0.9), type = 6)
Percentiles
##     25%     30%     50%     75%     80%     90% 
##  950.00 1087.00 2401.00 5324.75 6301.80 9821.00

MEDIDAS DE FORMA

Ejemplo Medidas de Forma

library(descriptr)
Asimetria_diam <- ds_skewness(diamantes$precio, x = NULL)
cat ("El coeficiente de asimetría del precio de los diamantes es:",Asimetria_diam)
## El coeficiente de asimetría del precio de los diamantes es: 1.618395
Curt_diam <- ds_kurtosis(diamantes$precio, x = NULL)
cat ("El coeficiente de Curtosis del precio de los diamantes es:",Curt_diam)
## El coeficiente de Curtosis del precio de los diamantes es: 2.177696

##RESUMEN

Todas las medidas para el análisis cuantitativo se pueden resumir de la siguiente forma:

resumen_precio.diamantes <- ds_tidy_stats(diamantes,precio)
resumen_precio.diamantes
## # A tibble: 1 × 16
##   vars     min   max  mean t_mean median  mode range  variance stdev  skew
##   <chr>  <int> <int> <dbl>  <dbl>  <dbl> <dbl> <int>     <dbl> <dbl> <dbl>
## 1 precio   326 18823 3933.  3471.   2401   605 18497 15915629. 3989.  1.62
## # ℹ 5 more variables: kurtosis <dbl>, coeff_var <dbl>, q1 <dbl>, q3 <dbl>,
## #   iqrange <dbl>
library(knitr)
kable(resumen_precio.diamantes)
vars min max mean t_mean median mode range variance stdev skew kurtosis coeff_var q1 q3 iqrange
precio 326 18823 3932.8 3470.837 2401 605 18497 15915629 3989.44 1.618395 2.177696 101.4402 950 5324.25 4374.25