1. Как выглядят котики
Основы описательной статистики
library(ggplot2)
# Распределение
рост_котиков <- c(20, 20, 23, 23, 23, 25, 25)
get_mode <- function(vector) # Расчёт моды распределения
{
unique_values <- unique(vector)
unique_values[which.max(tabulate(match(vector, unique_values)))]
}
ggplot(
data = data.frame(
position = seq(1, length(рост_котиков)),
size = рост_котиков
),
mapping = aes(x = position, y = 1)
) +
geom_point(aes(size = size), color = '#28975B', show.legend = FALSE) +
scale_size(range = c(10, 25)) +
theme_void()Рост котиков: 20, 20, 23, 23, 23, 25, 25
Меры центральной тенденции
- Минимум: 20
- Максимум: 25
- Медиана: 23
- Мода, mode: 23
- Среднее значение, mean: 22.7142857
Выбросы
рост_диковинных_котиков <- c(5, 5, 5, 50)
lower_bound <- quantile(рост_диковинных_котиков, probs = 0.05)
upper_bound <- quantile(рост_диковинных_котиков, probs = 0.95)
ggplot(
data.frame(
position = seq(1, length(рост_диковинных_котиков)),
size = рост_диковинных_котиков,
is_outlier = (рост_диковинных_котиков < lower_bound) |
(рост_диковинных_котиков > upper_bound)
),
aes(position, 1)
) +
geom_point(aes(size = size, col = !is_outlier), show.legend = FALSE) +
scale_size(range = c(10, 50)) +
scale_color_brewer(palette = 'Set1') +
theme_void() Рост диковинных котиков: 5, 5, 5, 50
- Нижняя граница нормы, 5%: 5
- Верхняя граница нормы, 95%: 43.25
- Усечённое среднее, truncated mean: 5
Меры изменчивости
Рост котиков: 20, 20, 23, 23, 23, 25, 25
- Размах, range: 5
- Межквартильный размах, interquantile range: 2.5
- Дисперсия: 4.2380952
- Среднеквадратическое отклонение: 2.0586635
…
3. Чем отличаются котики от пёсиков
Меры различий для несвязанных выборок