library(readr)
## Warning: пакет 'readr' был собран под R версии 4.5.2
library(haven)
## Warning: пакет 'haven' был собран под R версии 4.5.2
library(questionr)
## Warning: пакет 'questionr' был собран под R версии 4.5.2
climatt = read_sav(file.choose())
library(dplyr)
## Warning: пакет 'dplyr' был собран под R версии 4.5.2
##
## Присоединяю пакет: 'dplyr'
## Следующие объекты скрыты от 'package:stats':
##
## filter, lag
## Следующие объекты скрыты от 'package:base':
##
## intersect, setdiff, setequal, union
V16<-climatt %>%
select(contains("V16"))
table_V16_region<-cross.multi.table(V16, climatt$Region, true.codes=list("да"), freq=FALSE)
table_V16_region<-table_V16_region[1:9, 1:3]
colnames(table_V16_region)<-c("АК", "РА", "РТ")
rownames(table_V16_region)<-c("Засуш.дни", "Аном.жара", "Больш.колич.осад", "Камнепад", "Затопление", "Таяние.мерзлоты", "Сильные.ветры", "Насекомые", "Насекомые.вредители")
library(FactoMineR)
## Warning: пакет 'FactoMineR' был собран под R версии 4.5.3
res.ca <- CA(table_V16_region, graph = FALSE)
library(factoextra)
## Warning: пакет 'factoextra' был собран под R версии 4.5.3
## Загрузка требуемого пакета: ggplot2
## Warning: пакет 'ggplot2' был собран под R версии 4.5.2
## Welcome to factoextra!
## Want to learn more? See two factoextra-related books at https://www.datanovia.com/en/product/practical-guide-to-principal-component-methods-in-r/
get_eigenvalue(res.ca)
## eigenvalue variance.percent cumulative.variance.percent
## Dim.1 0.07085082 84.15681 84.15681
## Dim.2 0.01333823 15.84319 100.00000
Dim.1 (Первая главная компонента)
eigenvalue = 0,07085082 — наибольшее собственное значение, значит, эта компонента объясняет максимальную часть изменчивости данных.
variance.percent = 84,15681% — первая компонента объясняет более 84% всей дисперсии.
eigenvalue = 0,01333823 — собственное значение значительно меньше, чем у первой компоненты.
variance.percent = 15,84319% — вторая компонента объясняет около 16% дисперсии.
row <- get_ca_row(res.ca)
row
## Correspondence Analysis - Results for rows
## ===================================================
## Name Description
## 1 "$coord" "Coordinates for the rows"
## 2 "$cos2" "Cos2 for the rows"
## 3 "$contrib" "contributions of the rows"
## 4 "$inertia" "Inertia of the rows"
row$cos2
## Dim 1 Dim 2
## Засуш.дни 0.9923788 0.007621233
## Аном.жара 0.9490015 0.050998504
## Больш.колич.осад 0.9401817 0.059818305
## Камнепад 0.7425789 0.257421102
## Затопление 0.9832683 0.016731714
## Таяние.мерзлоты 0.7042489 0.295751054
## Сильные.ветры 0.6654422 0.334557785
## Насекомые 0.5775468 0.422453231
## Насекомые.вредители 0.6973866 0.302613434
Таблица содержит нагрузки (loadings) — коэффициенты корреляции между исходными переменными и главными компонентами (Dim 1 и Dim 2). Они показывают, насколько сильно каждая переменная связана с каждой компонентой:
Чем ближе к ±1, тем сильнее связь.
Все переменные имеют высокие положительные нагрузки на Dim 1 (0,577–0,992), особенно:
«Засуш.дни» (0,992);
«Затопление» (0,983);
«Аном.жара» (0,949);
«Больш.колич.осад» (0,940).
Dim 1 можно трактовать как «общий фактор экстремальных погодных явлений». Он объединяет засухи, аномальную жару, обильные осадки и затопления — события, связанные с климатической нестабильностью.
Dim 2 отражает процессы, менее зависимые от экстремальных погодных условий:
распространение насекомых (включая вредителей);
таяние мерзлоты;
сильные ветры;
камнепады (нагрузка 0,257).
row$contrib
## Dim 1 Dim 2
## Засуш.дни 6.717048 0.274014
## Аном.жара 8.195487 2.339439
## Больш.колич.осад 30.983030 10.471110
## Камнепад 9.646569 17.763189
## Затопление 17.104878 1.546090
## Таяние.мерзлоты 11.995053 26.757701
## Сильные.ветры 7.084298 18.919261
## Насекомые 1.808883 7.028272
## Насекомые.вредители 6.464754 14.900922
Dim 1 (Первая главная компонента)
Доминирующие переменные:
«Больш.колич.осад» (30.98) — максимальный вклад;
«Затопление» (17.10);
«Аном.жара» (8.20).
Dim 2 (Вторая главная компонента)
Доминирующие переменные:
«Таяние.мерзлоты» (26.76) — максимальный вклад;
«Сильные.ветры» (18.92);
«Камнепад» (17.76);
«Насекомые.вредители» (14.90).
Dim 1 объясняет основную часть изменчивости данных, связанную с погодными аномалиями.
Dim 2 выделяет процессы, где климат — не единственный фактор:
мерзлота;
ветры и камнепады;
насекомые.
fviz_ca_biplot(res.ca, repel = TRUE)
визуализация результатов анализа категориальных данных по двум основным компонентам (оси Dim1 и Dim2).
Оси координат: Dim1 (84.2%) — первая главная компонента, объясняющая 84,2% вариации данных. Отражает основное направление различий между категориями. Dim2 (15.8%) — вторая главная компонента, объясняющая оставшиеся 15,8% вариации.
CA-biplot наглядно демонстрирует структуру рисков для трёх регионов, выделяя ключевые природные явления и их взаимосвязи.