Для каждого из числовых признаков (Sepal.Length, Sepal.Width, Petal.Length, Petal.Width) вычислите:
среднее (mean),
медиану (median),
стандартное отклонение (sd),
межквартильный размах (IQR).
Представьте результаты в виде таблицы (например, с помощью sapply() или dplyr::summarise()).
Задание B. Анализ по группам
Для каждого вида (Species) вычислите среднюю длину и ширину лепестков (Petal.Length, Petal.Width).
Сравните значения между тремя группами и сделайте краткий вывод.
Задание C. Визуализация
Постройте boxplot для Petal.Length по видам (Species).
Задание D. Распределение и форма
Для признака Sepal.Length постройте гистограмму и вычислите асимметрию и эксцесс.
Контрольные вопросы
Чем отличается среднее от медианы по устойчивости к выбросам?
Что показывает стандартное отклонение?
Как вычисляется межквартильный размах и что он отражает?
Что значит положительная асимметрия?
Как интерпретировать эксцесс меньше 3?
3. Шаблон для самостоятельного заполнения
Ниже приведён шаблон для самостоятельной работы. Заполните пропуски своими вычислениями и визуализациями.
# --- Подготовка --- library(dplyr) library(ggplot2) library(moments) data("iris")# --- A. Базовые статистики ---# TODO: вычислите mean, median, sd, IQR для каждого числового признака# --- B. Анализ по видам ---# TODO: сгруппировать по Species и рассчитать средние значения# --- C. Boxplot ---# TODO: визуализировать длину лепестков по видам# --- D. Распределение ---# TODO: построить гистограмму и вычислить skewness / kurtosis