1. Как выглядят котики

Основы описательной статистики

library(ggplot2)

# Распределение
рост_котиков <- c(20, 20, 23, 23, 23, 25, 25)

get_mode <- function(vector)  # Расчёт моды распределения
{
   unique_values <- unique(vector)
   unique_values[which.max(tabulate(match(vector, unique_values)))]
}

ggplot(
    data = data.frame(
        position = seq(1, length(рост_котиков)), 
        size = рост_котиков
    ), 
    mapping = aes(x = position, y = 1)
) + 
    geom_point(aes(size = size), color = '#28975B', show.legend = FALSE) +
    scale_size(range = c(10, 25)) +
    theme_void()

Рост котиков: 20, 20, 23, 23, 23, 25, 25

Меры центральной тенденции

  • Минимум: 20
  • Максимум: 25
  • Медиана: 23
  • Мода, mode: 23
  • Среднее значение, mean: 22.7142857

Выбросы

рост_диковинных_котиков <- c(5, 5, 5, 50)

lower_bound <- quantile(рост_диковинных_котиков, probs = 0.05)
upper_bound <- quantile(рост_диковинных_котиков, probs = 0.95)

ggplot(
    data.frame(
        position = seq(1, length(рост_диковинных_котиков)), 
        size = рост_диковинных_котиков,
        is_outlier = (рост_диковинных_котиков < lower_bound) | 
                     (рост_диковинных_котиков > upper_bound)
    ),
    aes(position, 1)
) + 
    geom_point(aes(size = size, col = !is_outlier), show.legend = FALSE) +
    scale_size(range = c(10, 50)) +
    scale_color_brewer(palette = 'Set1') +
    theme_void()

Рост диковинных котиков: 5, 5, 5, 50

  • Нижняя граница нормы, 5%: 5
  • Верхняя граница нормы, 95%: 43.25
  • Усечённое среднее, truncated mean: 5

Меры изменчивости

Рост котиков: 20, 20, 23, 23, 23, 25, 25

  • Размах, range: 5
  • Межквартильный размах, interquantile range: 2.5
  • Дисперсия: 4.2380952
  • Среднеквадратическое отклонение: 2.0586635

3. Чем отличаются котики от пёсиков

Меры различий для несвязанных выборок