Son medidas que describen l o los datos que tienden hacia el centro del conjunto de datos Son los siguientes:
Promedio aritmético, el cual se simboliza así \(x̄\) y es la suma de todos los datos dividida entre el número de datos.
La fórmula del promedio es: \[\bar{x} = \frac{1}{n} * \sum_{i=1} ^ {n}x_i\]
En este caso el elevado hace referencia al límite superior y la raya al piso hace referencia a límite inferior. En frac el primer número es el numerador y el segundo es el denominados
La fórmula de la mediana es:
Si \(n\) es impar: \[\tilde{x} = x_{\left(\frac{n+1}{2}\right)}\]
Si \(n\) es par:\[\tilde{x} = \frac{x_{\left(\frac{n}{2}\right)} + x_{\left(\frac{n}{2} + 1\right)}}{2}\]
Ejemplo con la base de datos diamante
Encontrar las medidas de tendencia central para la variable precio de la base de datos Diamantes que se encuentra en el paquete datos
library(datos)
media_a <- mean(diamantes$precio)
mediana_a <- median(diamantes$precio)
# Para hallar la moda se carga modeest
library(modeest)
moda_a <- mlv1(diamantes$precio)
df <- data.frame(media_a, mediana_a,moda_a)
df
## media_a mediana_a moda_a
## 1 3932.8 2401 605
Ejemplos de Medidas de Variabilidad
rango_diam <- max(diamantes$precio) - min(diamantes$precio)
cat ("El rango del precio de los diamantes es:",rango_diam)
## El rango del precio de los diamantes es: 18497
var_diam <- var(diamantes$precio)
cat ("La varianza del precio de los diamantes es:",var_diam)
## La varianza del precio de los diamantes es: 15915629
des_diam <- sd(diamantes$precio)
des_diam2 <- sqrt(var_diam)
des_diam2
## [1] 3989.44
cat ("La desviación estándar del precio de los diamantes es:", des_diam)
## La desviación estándar del precio de los diamantes es: 3989.44
coefic_diam <- (sd(diamantes$precio) / mean(diamantes$precio)) * 100
cat ("El coeficiente de variación del precio de los diamantes es:", coefic_diam)
## El coeficiente de variación del precio de los diamantes es: 101.4402
Nos indican un porcentaje de infirmación que se encuentran antes y después de dicha medida. Las medidas de posición que más se usan son:
Cuantiles
Cuartiles: Dividen un conjunto de datos en cuatro partes iguales que son,
Percentiles: Dividen el conjurto ordenado de datos en 100 partes \(P_k\) es el valor en el conjunto ordenado que tiene hacia atrás \(k\%\) de la información:
\[P_k = Q\!\left(\frac{(n+1)*k} {100} \right), \quad k = 1, 2, \dots, 99\] Ejemplo de medidas de posición Encontral todos los cuartiles y el percentil 30, 80 y 90
Percentiles <- quantile(diamantes$precio, probs = c(0.25,0.3,0.5,0.75, 0.8,0.9), type = 6)
Percentiles
## 25% 30% 50% 75% 80% 90%
## 950.00 1087.00 2401.00 5324.75 6301.80 9821.00
Asimetría: Es la medida que indica la simetría de la distribución de una variable respecto a la media aritmética, sin necesidad de hacer la representación gráfica. Los coeficientes de asimetría indican si hay el mismo número de elementos a izquierda y derecha de la media.
Curtosis: Es una medida de forma que mide cuán apuntada o achatada está una curva o distribución. Este coeficiente indica la cantidad de datos que hay cercanos a la media, de manera que a mayor grado de curtosis, más escarpada (o apuntada) será la forma de la curva.
Ejemplo Medidas de Forma
library(descriptr)
Asimetria_diam <- ds_skewness(diamantes$precio, x = NULL)
cat ("El coeficiente de asimetría del precio de los diamantes es:",Asimetria_diam)
## El coeficiente de asimetría del precio de los diamantes es: 1.618395
Curt_diam <- ds_kurtosis(diamantes$precio, x = NULL)
cat ("El coeficiente de Curtosis del precio de los diamantes es:",Curt_diam)
## El coeficiente de Curtosis del precio de los diamantes es: 2.177696
##RESUMEN
Todas las medidas para el análisis cuantitativo se pueden resumir de la siguiente forma:
resumen_precio.diamantes <- ds_tidy_stats(diamantes,precio)
resumen_precio.diamantes
## # A tibble: 1 × 16
## vars min max mean t_mean median mode range variance stdev skew
## <chr> <int> <int> <dbl> <dbl> <dbl> <dbl> <int> <dbl> <dbl> <dbl>
## 1 precio 326 18823 3933. 3471. 2401 605 18497 15915629. 3989. 1.62
## # ℹ 5 more variables: kurtosis <dbl>, coeff_var <dbl>, q1 <dbl>, q3 <dbl>,
## # iqrange <dbl>
library(knitr)
kable(resumen_precio.diamantes)
vars | min | max | mean | t_mean | median | mode | range | variance | stdev | skew | kurtosis | coeff_var | q1 | q3 | iqrange |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
precio | 326 | 18823 | 3932.8 | 3470.837 | 2401 | 605 | 18497 | 15915629 | 3989.44 | 1.618395 | 2.177696 | 101.4402 | 950 | 5324.25 | 4374.25 |