Вывод: 1. Оба параметра показывают одинаковую последовательность - setosa < versicolor < virginica. 2. Более длинные лепестки также имеют большую ширину, что указывает на пропорциональный рост.
4. Задание C — Визуализация
Постройте boxplot для Petal.Length по видам (Species).
Добавьте подписи и цвета.
ggplot(iris, aes(x = Species, y = Petal.Length, fill = Species)) +geom_boxplot(alpha =0.7) +facet_wrap(~ Species, scales ="free") +labs(title ="Длина лепестков по видам",x ="Вид ириса",y ="Длина лепестка (см)") +theme_minimal() +theme(legend.position ="none")
5. Задание D — Распределение и форма
Для признака Sepal.Length постройте гистограмму.
Вычислите асимметрию и эксцесс (skewness(), kurtosis()).
Интерпретируйте результаты — является ли распределение близким к нормальному?
ggplot(iris, aes(x = Sepal.Length)) +geom_histogram(bins =15, fill ="purple", color ="lightpink") +labs(title ="Длина чашелистиков", x ="Длина чашелистика (см)", y ="Частота") +theme_minimal()
skewness(iris$Sepal.Length)
[1] 0.3117531
kurtosis(iris$Sepal.Length)
[1] 2.426432
Интерпретация: Слабый перекос вправо - 0.311, близко к нулю. Распределение 2.394 - “плоское”, так как меньше 3.
6. Контрольные вопросы
Чем отличается среднее от медианы с точки зрения устойчивости к выбросам?
Что показывает стандартное отклонение?
Как вычисляется межквартильный размах и что он отражает?
Что значит положительная асимметрия?
Как интерпретировать эксцесс меньше 3?
7. Дополнительно (по желанию)
Рассчитайте все показатели (mean, median, sd, IQR, skewness, kurtosis) для каждой группы Species.
Визуализируйте результаты с помощью ggplot2 (например, bar chart по видам).