Con los siguientes datos obtener las medidas de tendencia central y dispersión que se solicitan (con R por favor).

La siguiente distribución de una muestra de resultados en un examen de selección.1

cal <- c(61, 58, 56, 53, 52, 51, 50, 48, 47, 46, 44, 43, 42, 41, 40, 38, 37, 
    34, 33)
f <- c(1, 1, 1, 2, 1, 4, 2, 2, 6, 6, 4, 5, 2, 4, 2, 1, 3, 1, 2)

datos <- data.frame(cal, f)

knitr::kable(datos, col.names = c("Calificación", "f"))
Calificación f
61 1
58 1
56 1
53 2
52 1
51 4
50 2
48 2
47 6
46 6
44 4
43 5
42 2
41 4
40 2
38 1
37 3
34 1
33 2
  1. ¿Cuál es el valor de la media aritmética?
mean(rep(cal, f))
[1] 45.18
  1. ¿Cuál es la moda?
library(modeest)
mfv(rep(cal, f))
[1] 46 47
  1. ¿Cuál es el valor de la mediana?
median(rep(cal, f))
[1] 46
  1. ¿Cuáles son los cuartiles de esta distribución?
quantile(rep(cal, f), probs = c(0.25, 0.5, 0.75))
  25%   50%   75% 
41.25 46.00 48.00 
# o
summary(rep(cal, f))
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  33.00   41.25   46.00   45.18   48.00   61.00 
  1. Calcula el percentil para cada calificación de la distribución.
ecdf(rep(cal, f))(rep(cal, f))
 [1] 1.00 0.98 0.96 0.94 0.94 0.90 0.88 0.88 0.88 0.88 0.80 0.80 0.76 0.76
[15] 0.72 0.72 0.72 0.72 0.72 0.72 0.60 0.60 0.60 0.60 0.60 0.60 0.48 0.48
[29] 0.48 0.48 0.40 0.40 0.40 0.40 0.40 0.30 0.30 0.26 0.26 0.26 0.26 0.18
[43] 0.18 0.14 0.12 0.12 0.12 0.06 0.04 0.04
  1. ¿Cuál es la desviación estándar?
sd(rep(cal, f))
[1] 6.009143
  1. ¿Cuál es el rango?
# Valor mínimo y máximo
range(rep(cal, f))
[1] 33 61
# rango
diff(range(rep(cal, f)))
[1] 28
  1. ¿Cuál es la varianza?
var(rep(cal, f))
[1] 36.1098
  1. ¿Cuál es la desviación absoluta de la mediana?
mad(rep(cal, f))
[1] 5.9304
  1. ¿Cuál es el coeficiente de variación?
library(raster)
cv(rep(cal, f))
[1] 13.30045

Pregunta extra

  1. ¿Qué diferencia hay entre la desviación estándar y el error estándar?
# La desviación estándar es cómo se se dispersan los datos #de una muestra
# (o población) con respecto de la media
set.seed(123)
plot(density(rbinom(100, 1, 0.59)), main = "Distribución binomial", col = "blue", 
    lty = 2)

# El error estándar es cómo se dispersan los datos de una #distribución
# conformada por el estadístico de muchas #muestras (distribución muestral)
x <- numeric()
for (i in 1:10000) {
    x[i] <- mean(rbinom(100, 1, 0.59))
}
plot(density(x), col = "red", lty = 2)


  1. Para capturar los datos quizá les interese revisar la función read.clipboard() del paquete psych.